个性化阅读
专注于IT技术分析

人工智能

Python统计中的68-95-99.7规则-srcmini

Python统计中的68-95-99.7规则

半瓶木阅读(975)评论(0)赞(0)

经验法则(也称为68-95-99.7规则或者三西格玛规则)指出正态分布, 我们有以下观察结果: 68%的观测值在平均值附近的1个标准偏差之间: 95%的观测值位于平均值附近的两个标准偏差之间: 99.7%的观测值在平均值附近的3个标准差之间...

Pyspark:使用Apache MLlib的线性回归-srcmini

Pyspark:使用Apache MLlib的线性回归

半瓶木阅读(789)评论(0)赞(0)

问题陈述:为运输公司建立一个预测模型, 以找到一艘船需要多少船员的估计。 数据集包含159个具有9个特征的实例。 数据集描述如下: 让我们建立线性回归模型, 预测机组人员 附加数据集:cruise_ship_info 输出: 输出: 输出:...

Python使用模板匹配检测文档字段

半瓶木阅读(803)评论(0)赞(0)

模板匹配是一种图像处理技术, 用于查找大图像的小部分/模板的位置。此技术广泛用于对象检测项目, 例如产品质量, 车辆跟踪, 机器人等。 在本文中, 我们将学习如何使用模板匹配来检测文档图像中的相关字段。 解: 以上任务可以通过模板匹配来实现...

Python使用Pandas.iloc[]提取行示例

半瓶木阅读(755)评论(0)赞(0)

Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的Python软件包具有奇妙的生态系统。Pandas是这些软件包之一, 使导入和分析数据更加容易。 Pandas提供了一种独特的方法来从数据框中检索行。Dataframe.i...

Python-适用于Pandas的Bamboolib详细指南

半瓶木阅读(1516)评论(0)赞(0)

如果你是数据科学爱好者或数据科学家, 你会知道Pandas是必不可少的库, 可让你执行数据整理, 在构建机器学习模型之前, 你可以在其中读取数据, 预处理数据, 处理丢失的数据等。 Pandas确实确实可以使很多工作变得非常容易并且非常强大...

Python使用Bokeh进行数据可视化

半瓶木阅读(596)评论(0)赞(0)

Bokeh是Python中的数据可视化库, 可提供高性能的交互式图表和绘图。Bokeh输出可以通过笔记本, html和服务器等各种介质获得。可以将bokeh图嵌入Django和flask应用程序中。 Bokeh为用户提供了两个可视化界面: ...

Python电影推荐系统的实现-srcmini

Python电影推荐系统的实现

半瓶木阅读(1212)评论(0)赞(0)

推荐系统是一种根据用户的选择来预测或过滤偏好的系统。推荐系统广泛用于电影, 音乐, 新闻, 书籍, 研究文章, 搜索查询, 社交标签和产品等各个领域。 推荐系统以两种方式中的任何一种生成建议列表: 协同过滤:协作过滤方法会根据用户的过去行为...

Python如何以及在哪里应用特征缩放?-srcmini

Python如何以及在哪里应用特征缩放?

半瓶木阅读(730)评论(0)赞(0)

功能缩放或标准化 :这是数据预处理的步骤, 适用于数据的自变量或特征。从根本上说, 它有助于标准化特定范围内的数据。有时, 它也有助于加快算法的计算速度。 使用的包: import: 后端中使用的公式 标准化将值替换为其Z分数。 主要是适合...

Python NLTK的词法化用法示例

半瓶木阅读(623)评论(0)赞(0)

词法化是将单词的不同变形形式组合在一起的过程, 因此可以将它们作为单个项目进行分析。词法化与词干相似, 但它为单词带来了上下文。因此, 它将具有相似含义的单词链接到一个单词。 文本预处理包括两者抽干以及合法化。很多时候, 人们发现这两个术语...

Python使用TextBlob进行词法化示例

半瓶木阅读(535)评论(0)赞(0)

词法化是将单词的不同变形形式组合在一起的过程, 因此可以将它们作为单个项目进行分析。词法化与词干相似, 但它为单词带来了上下文。因此, 它将具有相似含义的单词链接到一个单词。 文本预处理包括两者抽干以及合法化。很多时候, 人们发现这两个术语...