个性化阅读
专注于IT技术分析

R编程教程

本文概述

R编程教程

R Programming Tutorial是为初学者和专业人士设计的。我们的教程提供了数据分析和可视化的所有基本和高级概念。

R是一个软件环境, 用于分析统计信息和图形表示。 R允许我们使用函数进行模块化编程。

我们的R教程包括R的所有主题, 例如介绍, 功能, 安装, rstudio ide, 变量, 数据类型, 运算符, if语句, 向量, 数据处理, 图形, 统计建模等。该编程语言基于R两位作者的首字母(Robert Gentleman和Ross Ihaka)。

什么是R编程

” R是一种解释性的计算机编程语言, 由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建。” R开发核心团队目前正在开发R。它也是一个用于分析统计信息, 图形表示, 报告和数据建模的软件环境。 R是S编程语言的实现, 结合了词法作用域语义。

R不仅允许我们进行分支和循环, 而且允许使用函数进行模块化编程。 R允许与用C, C ++ 、. Net, Python和FORTRAN语言编写的过程集成, 以提高效率。

在当今时代, R是研究人员, 数据分析师, 统计人员和市场营销人员用于检索, 清理, 分析, 可视化和呈现数据的最重要工具之一。

R编程

R编程的历史

R的历史可以追溯到20到30年前。 R由Ross lhaka和Robert Gentleman在新西兰奥克兰大学开发, R开发核心团队目前正在开发它。该编程语言名称取自两个开发人员的名称。 1992年考虑了第一个项目。1995年发布了初始版本, 2000年发布了稳定的beta版本。

R编程

下表显示了R语言的发布日期, 版本和说明:

Version-Release Date Description
0.49 1997-04-23 第一次发布R的源代码, 并启动了CRAN(综合R存档网络)。
0.60 1997-12-05 R正式获得GNU许可证。
0.65.1 1999-10-07 update.packages和install.packages都包括在内。
1.0 2000-02-29 发布了第一个可投入生产的版本。
1.4 2001-12-19 提供了适用于Mac OS的第一个版本。
2.0 2004-10-04 Mac OS的第一个版本已发布。
2.1 2005-04-18 添加对UTF-8编码, 国际化, 本地化等的支持。
2.11 2010-04-22 添加对Windows 64位系统的支持。
2.13 2011-04-14 添加了将代码快速转换为字节码的功能。
2.14 2011-10-31 添加了一些新软件包。
2.15 2012-03-30 改进了长向量的序列化速度。
3.0 2013-04-03 在64位系统上支持更大的数值。
3.4 2017-04-21 默认情况下, 实时编译(JIT)是启用的。
3.5 2018-04-23 添加了新功能, 例如紧凑的整数序列内部表示, 序列化格式等。

R编程的特点

R是一种特定于领域的编程语言, 旨在进行数据分析。它具有一些独特的功能, 使其功能非常强大。可以说, 最重要的是向量的表示法。这些向量使我们可以在单个命令中对一组值执行复杂的操作。 R编程具有以下功能:

  1. 它是一种简单有效的编程语言, 已经得到了很好的开发。
  2. 它是数据分析软件。
  3. 它是一种精心设计, 简单而有效的语言, 具有用户定义的, 循环的, 有条件的和各种I / O功能的概念。
  4. 它具有用于数据分析的一致且集成的工具集。
  5. 对于数组, 列表和向量的不同类型的计算, R包含一组运算符。
  6. 它提供有效的数据处理和存储功能。
  7. 它是一个开源, 功能强大且高度可扩展的软件。
  8. 它提供了高度可扩展的图形技术。
  9. 它允许我们使用向量执行多个计算。
  10. R是一种解释性语言。

为什么要使用R编程?

市场上有几种工具可以执行数据分析。学习新语言是需要时间的。数据科学家可以使用两种出色的工具, 即R和Python。在开始学习数据科学时, 我们可能没有时间去学习它们。学习统计建模和算法比学习编程语言更为重要。编程语言用于计算和传达我们的发现。

数据科学中的重要任务是我们处理数据的方式:清理, 特征工程, 特征选择和导入。这应该是我们的主要重点。数据科学家的工作是了解数据, 对其进行操作并提供最佳方法。对于机器学习, 可以使用R. Keras和TensorFlow实施最佳算法, 从而使我们能够创建高端机器学习技术。 R具有执行Xgboost的程序包。 Xgboost是Kaggle竞争的最佳算法之一。

R与其他语言进行通信, 并可能调用Python, Java, C ++。 R也可以访问大数据世界。我们可以将R与其他数据库连接, 例如Spark或Hadoop。

简而言之, R是研究和探索数据的好工具。精细的分析(例如聚类, 相关性和数据约简)是使用R完成的。

R和Python之间的比较

数据科学负责识别, 提取和表示来自数据源的有意义的信息。 R, Python, SAS, SQL, Tableau, MATLAB等是用于数据科学的最有用的工具。 R和Python是最常用的。但是, 仍然会在R和Python这两者中选择更好或最合适的一种变得令人困惑。

比较指标 R Python
Overview ” R是一种解释型计算机编程语言, 由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建。” R开发核心团队目前正在开发R。R也是一个软件环境, 用于分析统计信息, 图形表示, 报告和数据建模。 Python是用于通用编程的解释性高级编程语言。 Guido Van Rossum创建了它, 并于1991年首次发布。Python具有非常简单, 简洁的代码语法。它强调了代码的可读性, 并且在Python中调试也很简单。
数据科学专业 R软件包具有先进的技术, 这些技术对于统计工作非常有用。许多有用的R包都提供了CRAN文本视图。这些软件包涵盖了从心理学到遗传学再到金融学的所有内容。 对于查找数据集中的异常值, R和Python都同样好。但是对于开发允许人们上传数据集并发现异常值的Web服务, Python更好。
Functionalities 对于数据分析, R具有内置功能 大多数数据分析功能不是内置的。它们可以通过Numpy和Pandas等软件包获得
应用的关键领域 数据可视化是分析的关键方面。 R包(例如ggplot2, ggvis, lattice等)使数据可视化更加容易。 Python更适合深度学习, 因为Caffe, Keras, OpenNN等Python包允许以非常简单的方式开发深度神经网络。
包装的可用性 有数百种软件包和方法可以完成必要的数据科学任务。 Python几乎没有主要的软件包, 例如viz, Sccikit learning和Pandas, 它们分别用于机器学习的数据分析。

R的应用

实时有几个应用程序可用。一些受欢迎的应用程序如下:

  • 脸书
  • 谷歌
  • 推特
  • HRDAG
  • 阳光基金会
  • RealClimate
  • 我爱
  • XBOX ONE
  • NUMBER
  • 美国食品药品管理局

先决条件

R编程用于统计信息和数据表示。因此要求我们要掌握数学中的统计理论知识。理解用于数据表示的不同类型的图最重要的是, 我们应该具有任何编程的先验知识。

听众

本教程对于有兴趣了解如何实施数据分析项目的知识的学生很有帮助。本教程涵盖了R的所有基础知识以及如何使用R进行数据分析。

问题

我们向你保证, 此R编程教程不会有任何问题。但是, 如果有任何错误, 请在联系表格中发布问题。


赞(0)
未经允许不得转载:srcmini » R编程教程

评论 抢沙发

评论前必须登录!