个性化阅读
专注于IT技术分析

标签:数据科学

第3页
人工智能

8个有用的Shell数据科学命令

半瓶木阅读(909)评论(0)赞(0)

本文概述 快速笔记 用wc计数 用cat连接文件 用sed修改文件 子集大文件 使用uniq查找重复项 选择带有剪切的列 循环播放 变量 总结 在许多情况下, 你需要快速分析, 修改和处理数量和大小较大的文件。但是, 文件通常是基于文本的逗...

Python

Scikit-Learn教程:棒球分析(2)

半瓶木阅读(901)评论(0)赞(0)

在本教程的第一部分中, 重点是根据球队的统计数据和该季节的其他变量, 确定该联盟赢得MLB球队的比赛次数。 在该项目的第二部分中, 你将测试Scikit-Learn(sklearn)的逻辑回归模型和随机森林模型, 以根据球员的职业统计数据和...

NLP的歌词分析和R的机器学习-srcmini
R编程

NLP的歌词分析和R的机器学习

半瓶木阅读(1722)评论(0)赞(0)

本文概述 介绍 数据 数据调理 描述性统计 文字挖掘 总结 这是一个由三部分组成的系列教程的一部分, 在该系列教程中, 你将使用R来执行传奇艺术家Prince的音乐歌词案例研究中的各种分析任务。这三个教程涵盖以下内容: 第一部分:文本挖掘和...

R编程

使用R和PhantomJS进行Web爬取

半瓶木阅读(1389)评论(0)赞(0)

本文概述 内容 加载必要的软件包 用R爬取JavaScript生成的数据 总结 当你需要进行网页抓取时, 通常可以使用Hadley Wickham的rvest软件包。该软件包提供了易于使用的开箱即用的解决方案, 以获取生成网页的html代码...

Scikit-Learn教程:棒球分析(1)-srcmini
Python

Scikit-Learn教程:棒球分析(1)

半瓶木阅读(1140)评论(0)赞(0)

本文概述 第1部分:预测美国职业棒球大联盟每个赛季的获胜次数 体育分析和Scikit学习 Python编程语言是数据科学和预测分析的理想选择, 因为它配备了多个软件包, 可满足你大多数数据分析的需求。对于Python中的机器学习, Scik...

人工智能

使用Scikit-Learn检测虚假新闻

半瓶木阅读(1030)评论(0)赞(0)

本文概述 数据探索 提取训练数据 构建矢量化器分类器 检测所谓的”假新闻”绝非易事。首先, 要定义什么是假新闻-鉴于假新闻现在已成为政治声明。如果可以找到定义或就其达成共识, 则必须收集并正确标记真实和虚假新闻(希望...

R教程中的算法交易-srcmini
R编程

R教程中的算法交易

半瓶木阅读(926)评论(0)赞(0)

本文概述 内容 背景 设置工作区 数据采集 检查库存数据 简单的交易策略:趋势追踪 总结 在本教程中,您将进行web抓取,点击金融API并使用htmlwidget制作一个交互式时间序列图表来执行一个简单的算法交易策略。 在本文中, 我将展示...

Python

Python中的推荐系统:入门教程

半瓶木阅读(945)评论(0)赞(0)

本文概述 简单推荐 Python中基于内容的推荐器 使用Python进行协同过滤 总结 推荐系统是当今数据科学最流行的应用之一。它们用于预测用户对某项商品的”评价”或”偏好”。几乎每家大型科技...