个性化阅读
专注于IT技术分析

使用Power BI进行数据可视化

本文概述

我们作为数据分析师的目标是以各种方式安排我们的数据见解, 使每个看到它们的人都能够理解其含义并据此采取行动。

Power BI是Microsoft提供的基于云的业务分析服务, 可让任何人以更快的速度和效率可视化和分析数据。它是用于连接和分析各种数据的功能强大且灵活的工具。许多企业甚至认为它对于与数据科学相关的工作必不可少。 Power BI的易用性来自它具有拖放界面的事实。此功能有助于轻松, 快速地执行诸如排序, 比较和分析之类的任务。 Power BI还与多种来源兼容, 包括Excel, SQL Server和基于云的数据存储库, 这使其成为数据科学家的绝佳选择。

本教程将涵盖以下主题:

  • Power BI概述
  • 使用Power BI的优势
  • PowerBI桌面
  • 入门
  • 转换资料
  • 报告制作
  • 建立仪表板
  • Power BI与R&Python的集成
  • 保存和发布
  • 总结

1. PowerBI概述

总览

Power BI使你能够在本地以及在云中分析和探索数据。 Power BI提供了在同事和组织之间轻松, 安全地协作和共享自定义仪表板和交互式报告的功能。

使用Power BI进行数据可视化

资源

Power BI的组件

Power BI由各种组件组成, 这些组件可以在市场上单独购买, 也可以单独使用。

使用Power BI进行数据可视化

内容来源

选择使用哪个组件主要取决于项目或团队。但是, 我们将使用Power BI桌面, 因为这是主要用于业务报告生成和桌面创建的组件。另外, 所有其他工作通常从Power BI桌面开始, 在该桌面上创建报告。


2.使用Power BI的优势

Power BI具有某些优势, 使其优于现有的分析工具:

  • 提供基于云以及桌面的界面。
  • 提供诸如数据仓库, 数据发现和交互式仪表板之类的功能。
  • 能够加载自定义可视化文件, 以及
  • 在整个组织中轻松扩展。

3. Power BI桌面

Power BI是一个免费的应用程序, 可以下载并安装在系统上。它可以连接到多个数据源。通常, 分析工作在Power BI Desktop中开始, 在该处创建报告。然后将报告发布到Power BI服务, 从那里可以将其共享到Power BI Mobile应用程序, 以便人们甚至可以在移动设备上查看报告。

使用Power BI进行数据可视化

来源:https://docs.microsoft.com/zh-cn/learn/modules/get-started-with-power-bi/2-using-power-bi

安装

Power BI仅在Windows计算机上运行。 Mac用户可以在Azure中启动Windows VM并将Power BI加载到其中, 或使用Turbo.net, Turbo.net可以将Power BI直接从云流传输到Mac。

Power BI可以通过两种方式使用:

  • 作为Microsoft商店中的应用程序, 只需登录即可开始使用。这是该工具的在线版本。
  • 在本地下载软件, 然后安装。确保阅读所有安装说明。

根据产品的选择, 将软件下载到计算机上。接受许可协议后, 通过单击Power BI图标/应用程序验证安装。如果出现以下屏幕, 则表示一切正常。

使用Power BI进行数据可视化

4.入门

现在让我们对使用Power BI Desktop有所了解。在本节中, 我们将对其进行一些探索以使其习惯于它的界面。

Power BI工作区

下图突出显示了Power BI工作区的主要组成部分。

使用Power BI进行数据可视化

基本观点

  • 报告视图:这是创建仪表板的主视图。
  • 数据视图:数据视图提供了整个数据的预览。
使用Power BI进行数据可视化
  • 关系视图:关系视图显示各种对象之间的关系。
使用Power BI进行数据可视化

连接到数据源

Power BI可以连接到多个数据源。 “获取数据”图标显示所有可能的可用选项, 可从中将数据导入Power BI。

使用Power BI进行数据可视化

让我们看一些最常用的数据源:

  • Excel数据

让我们连接到Excel数据源。该工作簿包含一些虚假的财务数据。从这里下载文件。 Power BI Desktop将加载工作簿并读取其内容, 并使用”导航器”窗口向你显示文件中的数据。

使用Power BI进行数据可视化

加载后, 可以在”字段”窗格中查看数据。

使用Power BI进行数据可视化
  • 网页

你也可以使用网络上的数据。这是一个数据集, 显示了美国退休的最佳和最差状态。

链接:http://www.bankrate.com/finance/retirement/best-places-retire-how-state-ranks.aspx

只需选择” Web”作为”获取数据”中的选项, 然后输入URL的名称。

使用Power BI进行数据可视化

也尝试使用其他数据源。


5.转换数据

数据加载后, 在”字段”选项卡下将可见。在这里, 我们可以借助查询编辑器修改数据集。查询编辑器可用于修改数据集, 而不考虑其数据源。我们可以在查询编辑器中进行诸如重命名数据集, 删除单个或多个列等操作。单击主页功能区上的”编辑查询”按钮可以访问查询编辑器。

创建一个自定义列

使用与上面相同的财务数据, 让我们调整数据以满足需求。让我们创建一个名为”新制造价格”的自定义列, 该列等于:

([manufacturing Price])*3
使用Power BI进行数据可视化

更改列数据类型

列的数据类型也可以轻松更改。 “已售单位”列的浮点数据类型可以调整为整数。

使用Power BI进行数据可视化

移除列

卸下色谱柱也很容易。只需选择要选择的列, 然后选择”删除列”选项, 如下图所示。让我们摆脱”折扣”列, 因为它没有为我们的数据集增加任何价值。

使用Power BI进行数据可视化

同样, 还有许多其他功能可以执行, 例如删除和添加行, 转置, 旋转和拆分, 这些功能可以通过查询编辑器轻松实现。请注意, 你要转换数据的所有步骤也会显示在”查询设置”面板中。

使用Power BI进行数据可视化

6.报告

报告是可以在一个或多个页面上创建的可视化的集合。这些可视化通常相互关联。

使用Power BI进行数据可视化

7.仪表板

仪表板是多个视图的集合, 使一个视图可以同时比较各种数据。报告可以包含多个页面, 而仪表板是一个页面界面。

创建仪表板

一旦完成所有操作的数据集准备就绪, 就可以继续进行仪表板创建过程。 Power BI仪表板(也称为画布)在一个页面上包含许多可视化内容, 有助于讲述一个故事。这些称为磁贴的可视化文件从报告固定到仪表板。

现在, 让我们尝试了解使用超级市场数据集可以获得哪些见解:

  • 国家销售
使用Power BI进行数据可视化
  • 分部销售额和利润
使用Power BI进行数据可视化
  • 月销售额和利润
使用Power BI进行数据可视化
  • 按产品销售
使用Power BI进行数据可视化
  • 折扣带利润
使用Power BI进行数据可视化

创建的仪表板是交互式的, 这意味着一个磁贴中的更改会影响另一个。

使用Power BI进行数据可视化

8. Power BI与R&Python的集成

除了Power BI提供的各种可视化优势外, 它还具有惊人的即开即用连接功能。 Power BI可以轻松地与Python, R等语言集成, 甚至可以与SQL等DBMS集成。这在功能方面提供了更多优势, 对于习惯于使用Python或R的数据科学家来说非常方便。他们可以将R和Python脚本直接导入工作区中, 并利用其可视化效果, 而可视化效果远胜于此。这些语言。

在本节中, 我们将学习如何在R中使用Python和R脚本。要了解有关SQL与Power BI集成的信息, 这里有一篇详细的文章:

  • 带有Power BI的SQL

Power BI和R

R是一种流行的统计语言, 用于执行复杂的分析和预测分析, 例如线性和非线性建模, 统计测试, 时间序列分析, 分类, 聚类等。将Power BI与R结合使用可使用户访问丰富的, 不断扩展的统计分析和数据挖掘库的收集, 以帮助他们从数据中获得更深刻的见解。

先决条件

确保在本地系统上安装并正在运行以下产品:

  • [R
  • 像R Studio这样的单独的R集成开发环境(IDE)。

同样重要的是要注意:

  • 仅导入数据帧
  • 任何运行30分钟以上的R脚本都会自动超时。

确认系统上已安装R和R studio。启动Power BI并转到”选项和设置->选项”

使用Power BI进行数据可视化

在选项下, 转到R脚本选项卡, 并确保你可以看到正确的R版本。

使用Power BI进行数据可视化

在Power BI中使用R脚本

在Power BI中使用R脚本是有关此主题的绝佳资源。以下是来自同一来源的概述。

  1. 用于导入数据的R脚本

有时候, 你可能不想导入整个数据集, 而只是其中一部分。你可以编写R脚本, 以仅从整个数据集中选择要加载到Power BI中的特定列或行。

对于此演示, 我们将使用CRAN发行版中包含的众所周知的Iris数据集。

使用Power BI进行数据可视化

数据集也可以从文件中导入。这是一个示例, 显示了如何使用以下脚本将CSV文件加载到工作区中。从这里下载文件。

iris_csv <- read.csv(file="C:/Users/Parul/Desktop/Iris", header=TRUE, sep=", ")
使用Power BI进行数据可视化

仅使用R脚本导入数据并没有什么用。实际用途是在导入时可以操纵数据的时间。以下脚本使用dplyr R软件包中提供的summary和group_by函数对数据进行分组和聚合, 然后再进行导入:

启动R Studio并安装以下软件包:

install.packages("dplyr")  
install.packages("data.table")  
install.packages("ggplot2")

现在, 使用以下R脚本导入虹膜数据。我们将获得一个名为iris_mean的新数据集, 其中包含四个度量值的平均值, 并根据”种类”列中的值进行了分组(来源:Power BI简介)。

library(dplyr)

iris_mean <- summarize(group_by(iris, Species), slength = mean(Sepal.Length), swidth = mean(Sepal.Width), plength = mean(Petal.Length), pwidth = mean(Petal.Width))
使用Power BI进行数据可视化

2.用于转换数据的R脚本

当我们要处理已经导入到工作空间中的数据时, R脚本会派上用场。假设我们要在导入全部数据后应用摘要和分组依据功能。这可以通过在查询编辑器中运行R脚本来实现, 如下所示:

使用Power BI进行数据可视化

3.用于创建可视化效果的R脚本

借助R脚本, 你可以在Power BI中创建可视化。只需键入脚本并加载必要的库, 即可获得类似于任何R IDE中的可视化效果。让我们完成以下步骤:

  • 将虹膜数据集导入到工作区中。
  • 在可视化选项卡中单击” R脚本可视”, 占位符R可视图像出现在画布上, 脚本编辑器位于底部。
  • 选择要包含在脚本中的字段。我们选择PetalLengthCm, PetalWidthCm和Species。所选字段显示在”值”选项卡下, 而预填充的R脚本显示在R编辑器中。
  • 该脚本使用选定的列创建一个名为dataset的数据框。现在, 你可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入ggplot库并创建散点图。
      library(ggplot2)  
      ggplot(data=dataset, aes(x=PetalWidthCm, y=PetalLengthCm)) +  
        geom_point(aes(color=Species), size=2) +  
        ggtitle("Petal Widths and Lengths") +  
        labs(x="Petal Width", y="Petal Length") +  
        theme_bw() +  
        theme(title=element_text(size=15, color="blue3"))
使用Power BI进行数据可视化

PowerBI和Python

Python是一种广泛使用的通用编程语言, 并且大量Python库可用于使用机器学习算法执行统计分析和预测建模。

微软最近使在PowerBI中集成Python脚本成为可能, 该脚本可在Power BI中运行Python脚本并获得Python视觉效果。让我们看看执行此操作所需的步骤。但在此之前, 有一些先决条件:

  • 确保Python已在本地系统上启动并运行。
  • 还应加载所有必需的软件包和库, 例如pandas, matplotlib等。
  • 当前, 仅支持熊猫数据框。
  • 任何运行30分钟以上的Python脚本都会自动超时。
  • 必须先启用Python, 然后才能使用它。启动Power BI并转到”选项和设置->选项”
使用Power BI进行数据可视化

在”选项”下, 转到”预览功能”标签并启用” Python支持”。

使用Power BI进行数据可视化

重新启动Power BI, 你将在可视化以及”转换”选项卡中都获得Python图标。

使用Power BI进行数据可视化
使用Power BI进行数据可视化

在Power BI中有多种运行Python脚本的方法。

  1. 专门运行Python脚本

脚步:

  • 要运行Python脚本, 请选择”获取数据”>”更多”>”其他”>” Python脚本”, 如下所示。
使用Power BI进行数据可视化

现在, 只需将你的Python脚本粘贴到打开的窗口中即可。选择确定以运行脚本, 然后将生成的数据集导入Power BI Desktop工作区。

使用Power BI进行数据可视化

2.使用Python创建可视化

  • 将数据集导入工作空间。使用相同的财务数据集, 该数据集与假设公司的财务信息有关。
  • 单击可视化选项卡中的” Python视觉效果”, 占位符Python视觉图像出现在画布上, 而Python脚本编辑器位于底部。
  • 选择要包含在脚本中的字段。我们选择”销售和利润”。所选字段出现在”值”选项卡下, 脚本也出现在Python脚本编辑器中。
  • 该脚本使用选定的列创建一个名为dataset的熊猫数据框。你现在可以在此处编写脚本或在现有脚本中进行更改。让我们粘贴以下代码, 该代码导入matplotlib并创建一个绘图。 导入matplotlib.pyplot作为plt数据集.plot()plt.title(“销售与利润”)plt.show()
  • 运行脚本, 可视化效果出现在画布上。可视化效果与在任何Python IDLE中一样。
使用Power BI进行数据可视化
  • 接下来, 让我们创建一个相关图。除了前面的字段之外, 选择”折扣”, “销售总额”和”售出的单位”, 然后用以下新脚本替换脚本: 导入matplotlib.pyplot作为plt plt.matshow(dataset.corr(‘pearson’))plt.show()
使用Power BI进行数据可视化

我们还可以导入其他库。让我们导入Seaborn库, 但要确保它已安装在系统上。该数据集称为”提示”数据集, 通常会预先加载seaborn。从此处下载数据集并将其加载到工作空间中。然后将下面的代码粘贴到脚本编辑器中, 你将获得最原始的图。

import matplotlib.pyplot as plt  
import seaborn as sns  
sns.set(style="darkgrid")

sns.relplot(x="total_bill", y="tip", data=dataset)  
sns.relplot(x="total_bill", y="tip", hue="smoker", data=dataset);  
sns.relplot(x="total_bill", y="tip", hue="smoker", col="time", data=dataset);

plt.show()
使用Power BI进行数据可视化

具有所有Python可视化效果的仪表板最终将像这样显示。

使用Power BI进行数据可视化

Python资讯主页


9.保存和发布

保存和导出文件

你可以将文件另存为Power BI模板。可视化效果也可以导出为PDF文件。

出版

数据仅在可以在人员或组织之间共享时才有用。也可以通过将生成的仪表板或报告发布到Power BI服务来共享它们。然后, 我们可以使用Power BI Apps来查看仪表板/报表或与之交互。

使用Power BI进行数据可视化

10.结论

这就是我们在PowerBI中创建良好的可视化所需的全部知识, 尽管在每个阶段进行的修改可能要比我们在这里做的要多得多。因此, 通过实验和实践, Power BI变得更加熟悉, 并将释放出惊人的功能来帮助我们分析和呈现数据。


参考文献:

  • https://docs.microsoft.com/en-us/power-bi/desktop-what-is-desktop
赞(0)
未经允许不得转载:srcmini » 使用Power BI进行数据可视化

评论 抢沙发

评论前必须登录!