个性化阅读
专注于IT技术分析

使用Tableau进行数据可视化

本文概述

我们作为数据分析师的目标是以各种方式安排我们的数据见解, 使每个看到它们的人都能够理解其含义以及如何清楚地采取行动。

Tableau是当今行业中广泛使用的数据分析和可视化工具。许多企业甚至认为它对于与数据科学相关的工作必不可少。 Tableau的易用性来自它具有拖放界面的事实。此功能有助于非常轻松, 快速地执行诸如排序, 比较和分析之类的任务。 Tableau还与多种资源兼容, 包括Excel, SQL Server和基于云的数据存储库, 这使其成为数据科学家的绝佳选择。

本教程将涵盖以下主题:

1. Tableau简介

  • 总览
  • 安装

2.入门

  • 工作区板
  • 连接到数据源
  • 创建一个视图
  • 完善视图

3.强调结果

  • 向视图添加过滤器
  • 向视图添加颜色
  • 主要发现

4.地图视图

  • 建立地图检视
  • 深入细节
  • 确定重点

5.仪表板

  • 创建仪表板
  • 增加互动性

6.故事

  • 建立故事
  • 结论

7. Tableau与R, Python和SQL Server的集成

  • 表和R
  • 表格和Python
  • Tableau和SQL Server

8.保存工作

总览

Tableau Software是一家总部位于华盛顿州西雅图的软件公司, 主要生产针对商业智能的交互式数据可视化产品。 Tableau于1997年至2002年在斯坦福大学计算机科学系成立(维基百科)

tableau提供的主要产品是:

使用Tableau进行数据可视化1

Tableau Desktop, Tableau Public和Tableau Online均提供数据可视化创建和选择, 具体取决于工作类型

使用Tableau进行数据可视化2

在本教程中, 我们将使用Tableau Desktop。参考源的链接在这里。

安装

根据产品的选择, 将软件下载到计算机上。接受许可协议后, 你可以通过单击Tableau图标来验证安装。如果出现以下屏幕, 则表示一切正常。

使用Tableau进行数据可视化3

在本节中, 我们将学习Tableau中的一些基本操作以习惯其界面。

工作区板

Tableau工作区是工作表, 菜单栏, 工具栏, 标记卡, 架子和许多其他元素的集合, 我们将在以后的部分中学习这些元素。工作表可以是工作表, 仪表板或故事。下图突出显示了工作区的主要组成部分。但是, 一旦我们处理了实际数据, 将会更加熟悉。

使用Tableau进行数据可视化4

资料来源:Tableau.com

连接到数据源

要开始使用Tableau, 我们需要将Tableau连接到数据源。 Tableau与许多数据源兼容。 Tableau支持的数据源显示在打开屏幕的左侧。一些常用的数据源是excel, 文本文件, 关系数据库甚至服务器上。也可以连接到云数据库源, 例如Google Analytics(分析), Amazon Redshift等。

Tableau Desktop的启动屏幕显示了一个也可以连接的可用数据源。它也取决于Tableau的版本, 因为付费版本提供了更多的可能性。在屏幕的左侧, 有一个”连接”窗格, 突出显示了可用的源。首先列出文件类型, 然后列出常见服务器类型或最近连接的服务器。你可以在”打开”选项卡下打开以前创建的工作簿。 Tableau Desktop还在”示例工作簿”下提供了一些示例工作簿。

动手

使用Tableau进行数据可视化5

连接到Sample-Superstore数据集

我们将使用预装Tableau的示例数据集名称Superstore数据集。但是, 我们将从此处下载文件, 以便我们可以连接到Excel数据源。数据是超级市场的​​数据。它包含有关产品, 销售, 利润等的信息。我们作为数据分析师的目的是分析数据并找到这家虚构公司的关键改进领域。

步骤

  1. 从计算机将数据导入tableau工作区。
  2. 在工作表标签下, 将显示三张工作表, 分别是订单, 人员和退货。但是, 我们将仅关注订单数据。双击”订单表”, 它会像电子表格一样打开。
  3. 我们观察到前三行数据看起来有些不同, 并且格式不理想。在这里, 我们使用了数据解释器, 该数据解释器也位于工作表标签下。通过单击它, 可以得到格式正确的表格。

动手

使用Tableau进行数据可视化6

创建一个视图

我们将从生成一个简单的图表开始。在本节中, 我们将了解我们的数据, 并开始提出有关数据的问题以获取见解。在本节中, 我们将遇到一些重要的术语。

尺寸

措施

聚合

维度是定性数据, 例如名称或日期。默认情况下, Tableau会将包含定性或分类信息的数据自动分类为维, 例如, 任何具有文本或日期值的字段。这些字段通常显示为数据行的列标题, 例如”客户名称”或”订单日期”, 并且还定义了视图中显示的粒度级别。

度量是定量数值数据。默认情况下, Tableau会将包含此类数据的任何字段视为度量, 例如销售交易或利润。可以基于给定维度(例如, 按区域(维度)划分的总销售额(度量))汇总被分类为度量的数据。

汇总是将行级数据汇总到较高的类别, 例如销售额之和或总利润。

Tableau会自动对”度量和维”中的字段进行排序。但是, 对于任何异常, 也可以手动进行更改。

步骤

转到工作表。单击tableau工作区左下角的选项卡Sheet 1。

使用Tableau进行数据可视化7

一次, 你就在工作表中, 从”数据”窗格下的”维”中, 将”订购日期”拖到”列”架子上。将”订单日期”拖到列架子后, 将在数据集中为每年的订单创建一列。每列下方都有一个” Abc”指示符, 表示可以在此处拖动文本, 数字或文本数据。另一方面, 如果我们将”销售”拉到此处, 则会创建一个交叉表, 其中将显示每年的总销售额。

同样, 从”度量”选项卡中, 将”销售”字段拖到”行”架子上。

Tableau将汇总的销售额作为总和填充图表。将显示按订单日期每年的总销售总额。 Tableau始终为包含时间字段的视图填充折线图, 在此示例中为”订购日期”。

动手

使用Tableau进行数据可视化8

上面的折线图传达了什么?好吧, 这表明销售看起来很有希望, 并且随着时间的推移似乎在增长。这是一个宝贵的见解, 但是对于促成销售增长的产品却很少说。让我们进一步研究以获得更多见解。

完善视图

让我们更深入地研究, 并尝试找出有关哪些产品带来更多销售的更多见解。让我们从添加产品类别开始, 以不同的方式查看销售总额。

步骤

类别位于”维度”窗格下。将其拖到列架子上, 并将其放置在YEAR(订购日期)旁边。类别应放置在年份的右侧。这样, 视图立即从一条线变为条形图类型。该图表按年份显示了每种产品的总体销售额。

学到更多

若要查看有关视图中每个数据点(即标记)的信息, 将鼠标悬停在其中一个栏上以显示工具提示。工具提示会显示该类别的总销售额。这是2016年办公用品类别的工具提示:

使用Tableau进行数据可视化9

要将标签添加到视图, 请单击工具栏上的”显示标记标签”。

使用Tableau进行数据可视化10

条形图可以水平显示, 也可以垂直显示。单击工具栏上的Swap。

使用Tableau进行数据可视化11

2.上面的视图很好地显示了按类别划分的销售额, 即家具, 办公用品和技术。我们还可以推断, 除2016年以外, 家具的销售增长速度快于办公用品的销售。因此, 将销售工作重点放在家具而不是办公用品上是明智的。但是家具是一个很大的类别, 由许多不同的物品组成。我们如何确定哪种家具对最大销售有贡献?

为了帮助我们回答这个问题, 我们决定按子类别查看产品, 以查看哪些产品是最畅销的产品。假设家具类别;我们只想查看有关书架, 椅子, 家具和桌子的详细信息。我们将双击或将”子类别”维度拖到”列”架子。

子类别是另一个离散字段。它进一步剖析类别, 并为按类别和年份细分的每个子类别显示一个条形图。但是, 从视觉上来说, 这是大量的数据。在下一部分中, 我们将学习滤镜, 颜色和其他使视图更易理解的方法。

动手

使用Tableau进行数据可视化12

在本节中, 我们将尝试着重于特定结果。滤镜和颜色是使我们更加关注我们感兴趣的细节的方法。

向视图添加过滤器

过滤器可用于在视图中包括或排除值。在这里, 我们尝试向工作表中添加两个简单的过滤器, 以使查看特定年份的子类别的产品销售更为容易。

步骤

在”数据”窗格中的”维”下, 右键单击”订购日期”, 然后选择”显示过滤器。对于子->类别也重复”字段。

使用Tableau进行数据可视化13

过滤器是卡片的类型, 可以通过简单的拖放在工作表中移动

向视图添加颜色

颜色可以帮助视觉识别图案。

步骤

在”数据”窗格中的”度量”下, 将”利润”拖到”标记”卡上的”颜色”上。

使用Tableau进行数据可视化14

可以看出, 书柜, 桌子甚至机器都会造成负利润, 即损失。强大的见解。

动手

使用Tableau进行数据可视化15

主要发现

让我们仔细看一下过滤器, 以了解更多关于无利可图的产品的信息。

步骤

  1. 在视图中, 在子类别过滤卡中, 取消选中除书架, 桌子和机器以外的所有框。这揭示了一个有趣的事实。虽然几年来, 书柜和机器实际上是盈利的。但是, 2016年, 机器变得无利可图。
  2. 在”子类别”过滤卡中选择”全部”以再次显示所有子类别。
  3. 从”维度”中, 将”区域”拖动到”行”架子, 并将其放置在”总和(销售)”选项卡的左侧。我们注意到, 南方的机器报告的总体负利润比你其他地区的更高。
  4. 现在让我们为工作表命名。在工作区的左下方, 双击” Sheet 1″, 然后键入”按产品和地区划分的销售额”。
  5. 为了保留视图, Tableau允许我们复制工作表, 以便我们可以从上次中断的地方继续工作。
  6. 在工作簿中, 右键单击”按产品和地区划分的销售额”表, 然后选择”重复”, 然后将重复的表重命名为”南方销售”。
  7. 在新工作表的”维度”中, 将”区域”拖动到”过滤器”架子上, 以将其添加为视图中的过滤器。
  8. 在”筛选器区域”对话框中, 清除”南”以外的所有复选框, 然后单击”确定”。现在我们可以专注于南方的销售和利润。我们发现机器销售在2014年和2016年再次出现负利润。我们将在下一部分对此进行调查
  9. 最后, 不要忘记通过选择”文件”>”另存为”来保存结果。让我们将工作簿命名为”区域销售和利润”。

动手

使用Tableau进行数据可视化16

创建地图视图

当我们查看地理数据(“区域”字段)时, 地图视图很有用。在当前示例中, Tableau自动识别”国家”, “州”, “城市”和”邮政编码”字段包含地理信息。

步骤

  1. 创建一个新的工作表。
  2. 将”数据”窗格下的”州和国家/地区”添加到”标记”卡上的”详细信息”。我们获得了地图视图。
  3. 将”区域”拖到”过滤器”架子上, 然后向下过滤到”仅南”。现在, 地图视图仅放大到南部区域, 并且标记代表每个州。
  4. 将”销售”度量拖到”标记”卡上的”颜色”选项卡上。我们获得一个填充的地图, 其中的颜色显示了每个州的销售范围。
  5. 我们可以通过单击”标记”卡上的”颜色”并选择”编辑颜色”来更改颜色方案。我们可以尝试使用可用的调色板。
  6. 我们发现佛罗里达州在销售方面表现最好。如果我们将鼠标悬停在佛罗里达州上, 它的总销售额为89, 474美元, 而南卡罗来纳州的销售额仅为8, 482美元。现在让我们按利润衡量绩效, 因为利润是比单独销售更好的指标。
  7. 将利润拖动到标记卡上的颜色。现在, 我们看到田纳西州, 北卡罗莱纳州和佛罗里达州出现了负利润, 尽管看起来他们在销售方面表现不错。将工作表重命名为”利润图”

动手

使用Tableau进行数据可视化17

深入细节

地图使我们能够广泛地可视化数据。在最后一步中, 我们发现田纳西州, 北卡罗来纳州和佛罗里达州的利润为负。在本节中, 让我们绘制一个条形图以探究产生负利润的原因。

步骤

复制利润图工作表, 并将其命名为负利润条形图。

单击负利润条形图工作表上的向我显示。 “向我展示”介绍了在工作表中提到的项目之间可以绘制图形的方式。从”显示我”中选择水平条选项, 视图立即从垂直条变为水平。

通过简单地单击并在其上方拖动光标, 我们可以一次选择多个条。我们只想关注田纳西州, 北卡罗来纳州和佛罗里达州这三个州。因此, 我们将只选择与它们相关的条形图。

学到更多

创建层次结构

当我们希望对相似的字段进行分组时, 层次结构会派上用场, 以便我们可以在可视化的各个级别之间快速下钻。

在”数据”窗格中, 将一个字段拖放到另一个字段的上方, 或者右键单击该字段并选择

将任何其他字段拖到层次结构中。通过简单地将字段拖动到新位置, 也可以在层次结构中对字段进行重新排序。在当前目我们将创建以下层次结构:位置, 订单和产品。

使用Tableau进行数据可视化18

在”行架子”上, 单击”州”字段上的加号图标, 以向下钻取到”城市”级别。

  1. 那是很多数据。我们可以使用N-Filter过滤并显示效果最差的广告。为此, 将”城市”从”数据”窗格拖到”过滤器”架子。单击”按字段”, 然后单击”顶部”下拉列表, 然后选择”底部”以显示效果最差的广告。在文本框中键入5, 以显示数据集中表现最差的5位。

现在我们看到杰克逊维尔和佛罗里达州迈阿密;北卡罗来纳州伯灵顿;田纳西州的诺克斯维尔和孟菲斯则是利润最差的城市。视图中还有一个标记-北卡罗来纳州杰克逊维尔-不属于此处, 因为它具有可盈利的销售。这意味着我们应用的过滤器存在问题。我们将借助Tableau操作顺序。

在”过滤器”功能区上, 右键单击”包含”(国家/地区)集, 然后选择”添加到上下文”。我们发现现在Concord(北卡罗莱纳州)出现在视野中, 而Miami(佛罗里达)则消失了。现在这很有意义。

但是杰克逊维尔(北卡罗来纳州)仍然存在, 这是不正确的。在”行”架子上, 单击”城市”选项卡上的加号图标以向下钻取到”邮政编码”级别。用鼠标右键单击北卡罗来纳州杰克逊维尔的邮政编码28540, 然后选择”排除”以手动排除杰克逊维尔。

拖动行架子的邮政编码。这是最终观点。

使用Tableau进行数据可视化19

动手

使用Tableau进行数据可视化20

主要发现

现在让我们仅关注亏损产品, 即产品, 并确定销售此类产品的地点。

步骤

  1. 将”子类别”拖动到”行”以进一步展开。
  2. 同样, 将”利润”拖动到”标记”卡上的”颜色”上。这使我们能够迅速发现利润为负的产品。
  3. 右键单击”订购日期”, 然后选择”显示过滤器”。机器, 表和活页夹的性能似乎很差。那我们该怎么办呢?一种解决方案是停止在杰克逊维尔, 康科德, 伯灵顿, 诺克斯维尔和孟菲斯销售这些产品?让我们验证我们的决定是否正确。
  4. 让我们回到o先前创建的”利润图”工作表标签。
  5. 现在, 单击”子类别”字段以选择”显示过滤器”选项。
  6. 将利润从度量下拖动到标签标记卡上。
  7. 再次单击”订购日期”, 然后选择”显示过滤器”。从过滤器中, 让我们清除那些我们认为会带来负利润的项目。因此, 分别取消选中Binders, Machine和Tables前面的框。现在, 我们只剩下获利实体。这表明诸如绑定器, 机器和表格之类的实体实际上在某些领域造成了损失, 我们的发现是正确的。

动手

使用Tableau进行数据可视化21

仪表板是多个视图的集合, 使一个视图可以同时比较各种数据。

创建仪表板

步骤

  1. 单击新建仪表板按钮。
  2. 将南部的销售拖到空的仪表板
  3. 将Profit Map拖动到仪表板, 并将其放在South视图的Sales顶部。两种视图都可以立即看到。为了能够以一种可以让其他人理解的方式呈现数据, 我们可以根据自己的喜好安排仪表板。
  4. 在仪表板视图中的”南方销售”工作表上, 在”区域”下单击并清除”显示标题”。对所有其他标题重复相同的过程。这有助于仅强调需要的内容, 并隐藏不太重要的信息。
  5. 在利润图上, 也隐藏标题, 并对”南方销售”图执行相同的步骤。
  6. 我们可以看到右侧已经重复了子类别过滤卡和订购日期。让我们通过简单地将它们淘汰掉来摆脱多余的东西。最后, 单击”订购日期的年份”。出现一个下拉箭头, 然后选择”单一值(滑块)”选项。现在, 让魔术展现出来。通过在滑块上选择不同的年份进行试验, “销售”也会相应地变化。
  7. 将SUM(Profit)过滤器拖到”南方销售”下方的仪表板底部, 以获取更好的视图。

动手

使用Tableau进行数据可视化22

增加互动性

为了使仪表盘更具交互性, 例如查看哪些子类别在哪些状态下是有利可图的, 需要进行一些更改。

步骤

  1. 让我们从利润图开始。单击地图后, 将在右上角显示”用作过滤器”图标。点击它。如果我们选择任何地图, 则与该州相对应的Sales将在Sales-South地图中突出显示。
  2. 对于订购日期日期, 请单击下拉选项, 然后转到”应用于工作表”>”选定的工作表”。打开一个对话框。选择全部选项, 然后单击确定。此选项有什么作用?它将筛选器应用于具有相同数据源的所有工作表。
  3. 探索和实验。在下面的可视化图中, 我们可以过滤”南方销售”地图以查看仅在北卡罗来纳州销售的产品。然后, 我们可以轻松地每年探索利润。
  4. 将仪表板重命名为”区域销售和利润”。

动手

使用Tableau进行数据可视化23

因此, 在北卡罗来纳州销售机器并没有给公司带来任何利润。

仪表板是一个很酷的功能, 但是tableau还可以通过演示的形式以故事的形式展示我们的结果, 我们将在本节中讨论这些故事。

建立故事

步骤

  1. 单击新故事按钮。
  2. 在左侧的”故事”窗格中, 将”南方销售”工作表(先前创建)拖到视图上。
  3. 在工作表上方的灰色框中编辑文本。这是标题。将其命名为”按年销售和利润”。
  4. 故事很具体。在这里, 我们将讲一个有关在北卡罗来纳州出售机器的故事。在”故事”窗格中, 单击”复制”以复制第一个标题, 或者甚至可以创建一个新的标题。
  5. 在子类别中, 过滤器仅选择计算机。这有助于按年份衡量机器的销售和利润。
  6. 将标题重新命名为”按年出售”和”机器”。

动手

使用Tableau进行数据可视化24

结论

显然, 北卡罗来纳州的机器正在导致利润损失。但是, 不能从整体上看利润和销售额来证明这一点。为此, 我们需要区域性利润。

步骤

  1. 在”故事”窗格中, 选择”空白”。将已创建的仪表板”区域销售和利润”拖动到画布上。
  2. 将其标题为南部地区表现不佳的商品。
  3. 选择”复制”以使用”区域利润”仪表板创建另一个故事点。在条形图上选择北卡罗莱纳州, 因为我们有兴趣展示更多有关它的信息。
  4. 选择所有年份。
  5. 为了清楚起见, 请添加标题, 例如NC中的利润:2013-2016。
  6. 选择任何年份(例如2014)。添加标题, 例如NC中的利润:2014, 然后单击”重复”选项卡。在其余所有年份重复相同的步骤。
  7. 单击演示模式, 然后展开故事。

动手

使用Tableau进行数据可视化25

现在我们有了一个想法, 什么产品何时被引入北卡罗来纳州市场, 以及它们的性能如何。我们不仅找到了解决负利润的方法, 而且还成功地用数据支持了它。这是Tableau中Story的优势。

除了Tableau提供的各种可视化优点外, 它还具有惊人的开箱即用连接功能。 Tableau可以轻松地与Python和R等语言集成, 甚至可以与SQL等DBMS集成。这提供了更多的功能优势, 并且对于习惯于使用Python或R的数据科学家来说非常方便。他们可以直接在Tableau中导入R和Python脚本, 并利用其可视化效果, 这些可视化效果远远优于这些语言。 。而且, Tableau的可视化功能易于使用且非常直观, 从而为数据科学家节省了大量时间。

在本节中, 我们将看到如何将Tableau与这些外部源连接以及这些连接的优点。

Tableau和R

R是一种流行的统计语言, 用于执行复杂的预测分析, 例如线性和非线性建模, 统计测试, 时间序列分析, 分类, 聚类等(Tableau 8.1和R)将Tableau与R结合使用具有以下优点:

  • 通过使tableau的用户可以访问复杂的R库来利用tableau的统计功能, 以便从数据中获得更好, 更深入的见解。
  • Tableaus增强的数据浏览选项以及连接到多个源的功能对于R用户而言非常方便。
  • 此外, 它还使Tableau用户可以从R语言的实用性中受益, 而不必实际知道该语言。

Tableau如何与R集成?

通过创建新的计算字段来动态调用R引擎并将值传递给R, 可以在Tableau中使用R函数和模型。然后将这些结果返回给Tableau以用于可视化目的。

使用R设置Tableau Desktop

  • 下载并安装Rserve。

你将需要下载并安装Tableserve Rserve软件包以连接和利用R脚本功能。在R控制台中, 输入以下命令:

install.packages("Rserve")
library(Rserve)
Rserve() / Rserve(args = ‘ — no-save’)

将Tableau连接到R服务器

成功安装Rserve后, 打开Tableau Desktop, 然后执行以下步骤。

转到”帮助”>”设置和首选项”, 然后选择”管理外部服务连接”。

使用Tableau进行数据可视化26

输入服务器名称” Localhost”(或” 127.0.0.1″)和端口” 6311″。

点击”测试连接”按钮。你应该看到成功的消息提示。单击确定关闭。

使用Tableau进行数据可视化27

开始在Tableau中使用R脚本

成功完成上述步骤后, 我们将能够在Tableau Desktop中创建利用SCRIPT_ *函数进行R函数调用的新计算字段。

让我们开始工作, 看看如何在R中使用tableau功能。我们将使用内置的Sample Superstore数据集通过R脚本和Tableau的拖放功能来计算利润。然后, 我们将比较两个结果。

步骤

打开Tableau工作簿, 然后连接到示例超级存储数据。

连接到Rserve。将tableau桌面连接到Rserve后, 它可以通过计算的字段调用R引擎。

现在, 我们将创建一个名为”预期利润”的计算字段。

R可使用四个功能, 并且所有功能均以单词脚本开头。这些功能是:

  • SCRIPT_REAL:返回实数作为结果
  • SCRIPT_STR:返回字符串
  • SCRIPT_INT:返回整数
  • SCRIPT_BOOL:返回布尔值
  • 对于此示例, 我们将使用SCRIPT_REAL函数。我们将在Tableau中创建一个简单的线性回归。

打开计算字段, 然后插入以下脚本。

SCRIPT_REAL("fit <- lm(.arg1 ~ .arg2 +  .arg3 + .arg4)
fit$fitted
", SUM([Profit]), AVG([Sales]), AVG([Quantity]), AVG([Discount]))

上面的脚本与R中的线性回归模型有关。该模型将有一个因变量(arg1)和三个自变量(arg2, arg3, arg4)。这些参数只是占位符, 当脚本传递回R时, 这些参数也将被它们所对应的tableau列替换。 5.输入与每个变量相对应的表格字段。这里的因变量是利润, 因此我们将SUM(Profit)放在首位, 因为它对应于参数1。同样, 对于其他三个参数, 我们将分别使用平均单价, 平均订单数量和平均折扣。

现在, 所有这些输入都将被拉入模型以确定预期的利润水平。现在, 我们准备在Tableau可视化文件中使用此计算。将类别拖到行上, 然后将利润拖到列上。现在将Expected Profit拖到列上。

现在, 我们可以分析模型以查看R中计算的预期利润与实际利润的比较。我们可以通过将客户群拉到颜色上来继续进行进一步分析, 现在, 我们已经创建了一个堆积的条形图, 还可以利用有序日期按年份或按季度划分数据。

动手

使用Tableau进行数据可视化28

有人可能会想, 如果不使用R就可以在Tableau中完成上述所有计算。那么, 为什么我们要经历在Tableau中下载和配置Rserve并编写脚本的过程? R是一种强大的语言, 因为它具有强大的预测能力, 可以轻松利用包含著名算法的广泛使用的库。想象一下, 通过调用一个简单的R脚本, 然后将其合并到Tableau的可视化中, 对Tableau中的业务进行预测将是多么美好。

Tableau和Python

Python是一种广泛使用的通用编程语言。 Python提供了大量库来执行统计分析, 预测建模或机器学习。将Tableau与Python连接是进行预测分析的最佳方法之一。 Tabpy是一个为执行相同操作而开发的软件包。为了使Tableau能够利用Python的功能, 可以将其连接到TabPy服务器以即时执行Python代码并以可视化形式显示结果。

Tableau如何与Python集成?

当我们将TabPy与Tableau一起使用时, 我们可以在Python中定义计算字段, 从而直接从我们的可视化中利用大量机器学习库的功能。

使用Python设置Tableau Desktop

下载并安装Tabpy。

在Tableau工作簿中运行Python代码需要Python服务器来执行它。 TabPy框架可以完成工作。通过以下链接从Github下载TabPy。或者, 你可以按照以下步骤操作:

conda install -c anaconda tabpy-server

然后cd到包含下载的Tabpy服务器的目录并运行。

python setp.py

将Tableau与TabPy连接

下一步是将Tableau与TabPy连接。可以通过转到帮助>设置和性能>管理外部服务连接来完成此操作:

使用Tableau进行数据可视化29

测试连接。如果一切顺利, 则系统将显示”成功连接”提示。

开始在Tableau中使用Python脚本

Tableau中的Python集成是一个非常有用的功能。以情感分析问题为例。这是机器学习社区中的常见问题, 可以通过各种机器学习算法来完成。但是, 通过结合使用tableau和Python, 可以在几行Python代码中实现相同的功能。然后可以在Tableau中可视化结果以获取更多见解。让我们看一个示例(通过TabPy利用Tableau中的Python功能)

Tabpy情绪分析

我们将使用可从此处下载的移动评论数据集。

步骤如下:

将数据集导入Tableau Desktop

连接到Tabpy。将Tableau桌面连接到Tabpy后, 它可以通过计算出的字段调用Python引擎。

现在, 我们将创建一个称为Sentiment的计算字段, 如下所示:`SCRIPT_REAL(” from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer vs = [] Analyzer = SentimentIntensityAnalyzer()for i in range(0, len(_arg1)):a = analyzer.polarity_scores( _arg1 [i])[‘compound’] vs.append(a)return vs”, ATTR([Reviews]))`我们在这里使用VADER情绪分析工具。它是一个基于词典和规则的情感分析工具, 专门针对社交媒体中表达的情感进行了调整。要使用此工具, 你需要首先安装它。请在他们的github页面上阅读更多内容。

现在, 将”评论”拖到行上, 将”情感”拖到”文本和颜色标记”卡上, 看看魔术正在发生。我们毫不费力地完成了对评论的情感分析。此外, 它也非常容易可视化结果。正面评论以绿色递增顺序, 负面评论以红色递增。

使用Tableau进行数据可视化30

上面的示例清楚地显示了Tableau与Python集成带来的强大功能。通过我们掌握情感得分, 我们可以与它一起深入研究细节。例如, 作为企业主, 我可以过滤负面评价并考虑其原因。我还可以过滤正面评价, 以了解使消费者满意的产品。

Tableau和SQL Server

我们的Microsoft SQL Server数据中有一个隐藏的价值, 它隐藏在标准报表和复杂的商业智能工具下。通过使任何人都可以对SQL Server数据进行复杂的可视化分析, Tableau可以提供无处不在的洞察力。我们可以将Tableau连接到SQL Server live服务器以进行针对特定平台的优化查询, 也可以将数据直接引入Tableau的分析引擎中以减轻数据库负担。

Tableau为SQL Server提供了优化的实时连接器, 以便我们可以在直接使用数据的同时创建图表, 报表和仪表板。在进行分析时, Tableau可以识别SQL Server中使用的任何架构, 因此我们不必操纵数据。

让我们来看一个示例, 该示例描述如何将SQL Server数据库连接到Tableau Desktop, 然后使用它来创建可视化。

步骤如下:

  1. 登录到SQL Server
  2. 打开Tableau Desktop, 然后在”服务器”下, 连接到MS SQL。
  3. 将服务器名称粘贴到打开的对话框中, 然后单击”确定”。这会将Tableau连接到SQL Server。选择选择的数据库。在此示例中, 我们选择salesDB。然后, 我们也可以从TABLES列表中进行选择, 例如Sales Log。该表将导入到Tableau环境中。现在, 我们可以选择将全部数据或其中的一部分提取到新的工作表中。我们甚至可以指定要提取的行数。
  4. 在新工作表中, 我们从MS SQL中提取了数据, 从这里我们可以像处理其他Tableau Worksheet一样使用它。

动手:

使用Tableau进行数据可视化31

这是我们可以轻松地将SQL Server连接到Tableau并将数据直接提取到其中的方法。通过Tableau, 用户可以通过单击切换连接, 以将内存中查询应用于更大的数据集。

Tableau桌面

要在本地保存Tableau工作簿, 请选择”文件”>”保存”。在另存为对话框中指定工作簿文件名。 Tableau默认情况下以扩展名.twb保存文件。

公众委员会

使用Tableau Public, 所有视图和数据都会公开, 互联网上的任何人都可以访问它。选择服务器> Tableau Public>保存到Tableau Public, 然后输入凭据。

Tableau服务器

如果数据是机密的, 并且需要与整个团队共享故事, Tableau Server会派上用场。要将故事发布到Tableau Server, 请选择”选择服务器”>”发布工作簿”, 或在工具栏上单击”共享”。但是请确保先创建一个帐户。


这就是我们需要在T​​ableau中创建良好的可视化效果所需要的全部内容, 尽管在每个阶段进行的修改可能要比我们在此处进行的修改多得多。因此, 通过实验和实践, Tableau变得更加熟悉, 并将释放出惊人的功能来帮助我们分析和呈现数据。如有任何疑问或疑问, 请在下面评论, 并祝你视觉化。

赞(0)
未经允许不得转载:srcmini » 使用Tableau进行数据可视化

评论 抢沙发

评论前必须登录!