个性化阅读
专注于IT技术分析

R编程面试题和答案精华都在这里了

R面试问题

下面列出了R面试常见问题和解答。

1)什么是R?

R是由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建的一种解释型计算机编程语言。它是一种用于分析统计信息, 图形表示, 报告和数据建模的软件环境。 S编程语言的一种, 与词法作用域语义相结合。


2)区分向量, 列表, 矩阵和数据帧。

向量是一系列基本类型相同的数据元素。向量中的成员称为组件。

包含不同类型的元素(例如数字, 字符串, 向量或其中的另一个列表)的R对象称为List。

用于绑定具有相同长度的向量的二维数据结构, 称为矩阵。矩阵包含相同类型的元素。

数据框是矩阵的通用形式。它是列表和矩阵的组合。在数据框中, 不同的数据列包含不同的数据类型。


3)给出用于数据插补的那些软件包的名称。

以下是用于数据插补的软件包

  1. 老鼠
  2. 美联储小姐
  3. Mi
  4. Hmisc
  5. 阿米莉亚
  6. 归咎于

4)解释R中的initialize()函数?

此函数用于在声明对象时初始化私有数据成员。


5)我们如何找到一列相对于另一列的均值?

在虹膜数据集中, 有五列, 即Sepal.Length, Sepal.Width, Petal.Length, Petal.Width和Species。我们将使用镶嵌套件中的mean()函数计算出不同种类鸢尾花的Sepal-Length平均值。

mean(iris$Sepal.Length~iris$Species)

6)什么是随机游走模型?

随机游走是非平稳过程的最简单示例。随机游走没有指定的均值或方差, 对时间的依赖性很强, 并且其变化或增量是白噪声。模拟R中的随机游走:

arima.sim(model = list(order = c(0, 1, 0)), n = 40)-> rw ts.plot(rw)


7)什么是白噪声模型?

它是基本的时间序列模型, 是平稳过程的简单示例。白噪声模型具有固定的恒定平均值, 固定的恒定方差, 并且随时间没有相关性。我们可以通过以下方式模拟白噪声模型:

arima.sim(model = list(order = c(0, 0, 0)), n = 50)-> wn


8)给出R的任何五个特征。

  1. 简单有效的编程语言。
  2. 它是一个数据分析软件。
  3. 它提供了有效的存储功能和数据处理。
  4. 它提供了高度可扩展的图形技术。
  5. 这是一种解释性语言。

9)R和Python在功能方面有区别吗?

对于数据分析, R具有内置功能, 但是在Python中, 数据分析功能不是内置的。它们可通过Pandas和Numpy之类的软件包获得。


10)R的应用是什么?

实时提供各种应用程序。这些应用程序如下:

  1. 脸书
  2. 谷歌
  3. 推特
  4. HRDAG
  5. 我爱

11)解释RStudio。

RStudio是一个集成的开发环境, 使我们可以更轻松地与R进行交互。 RStudio与标准RGui相似, 但是它被认为更加用户友好。该IDE具有各种下拉菜单, 带有多个选项卡的窗口以及许多自定义过程。第一次打开RStudio时, 我们将看到三个Windows。默认情况下, 第四个窗口是隐藏的。


12)R的优缺点是什么?

优点

  1. 开源的
  2. 数据整理
  3. 整套包装
  4. 平台无关
  5. 机器学习操作

缺点

  1. 起源薄弱
  2. 数据处理
  3. 基本安全
  4. 复杂的语言
  5. 速度较慢

13)R和Hadoop集成的目的是什么?

  1. 用于执行Hadoop来执行R代码。
  2. 用于使用R访问存储在Hadoop中的数据。

14)给出Hadoop集成方法的名称。

  1. R Hadoop
  2. Hadoop流
  3. 瑞普
  4. ORCH

15)表达式all(NA == NA)的输出是什么?

[1]不适用


16)R中的b / w sample()和subset()有什么区别?

sample()方法用于从数据集中选择大小为n的随机样本, 而子集方法用于选择变量和观察值。


17)为什么我们使用命令-install.packages(file.choose(), repos = NULL)?

该命令用于通过浏览并选择文件从本地目录安装R软件包。


18)发出命令以创建直方图并从R工作区中删除向量?

hist()和rm()函数用作创建直方图并从R工作区中删除向量的命令。


19)区分黑白” %%”和”%/%”。

” %%”提示第一个矢量除以第二矢量, “%/%”给出第一矢量除以第二矢量的商。


20)为什么我们在R中使用apply()函数?

这用于对数组中的每个元素应用相同的功能。例如, 找到每一行中的行均值。


21)区分library()和require()函数。

如果无法加载所需的软件包, 则当在函数内部使用required()函数时, library()函数会给出错误消息并显示, 并在未找到特定软件包时抛出警告消息。


22)R中的t-test()是什么?

t-test()函数用于确定两组的均值是否相等。


23)R中with()和by()函数的用途是什么?

with()函数将表达式应用于数据集, 而by()函数将函数应用于每个级别的因子。


24)区分黑白匹配。

lapply用于以列表形式显示输出, 而sapply用于以向量或数据帧的形式显示输出。


25)解释aggregate()函数。

Aggregate()函数用于在R中聚合数据。有两种方法, 一种是通过使用一个或多个BY变量折叠数据, 另一种是在列表中应包含By变量的Aggregation()函数。


26)解释doBy软件包?

该软件包用于使用函数和模型公式定义所需的表。


27)解释table()函数的用法。

此功能用于在R中创建频率表。


28)解释fitdistr()函数吗?

此函数用于提供单变量分布的最大似然拟合, 并在MASS程序包下定义。


29)什么是GGobi和iPlot?

GGobi是一个开源程序, 用于可视化以探索高维类型化数据, 而iPlots是一个软件包, 提供条形图, 镶嵌图, 箱形图, 平行图, 直方图和散点图。


30)解释格子包装。

晶格封装旨在通过提供更好的默认值来改进基本R图形, 并具有轻松显示多元关系的能力。


31)解释anova()函数。

anova()函数用于比较嵌套模型。


32)解释cv.lm()和stepAIC()函数。

cv.lm()函数在用于k折验证的DAAG包下定义, 而stepAIC()函数在MASS包下定义, 该MASS包在精确AIC下执行逐步模型选择。


33)解释jumps()函数。

jumps()函数用于执行所有子集回归, 并在jumps程序包下定义。


34)解释relaimpo和强大的软件包。

该软件包用于衡量模型中每个预测变量的相对重要性, 而健壮软件包则提供了包括回归分析在内的健壮方法库。


35)给出MANOVA的完整形式及其用途。

MANOVA代表方差多元分析, 用于同时测试多个因变量。


36)解释mashapiro.test()和barlett.test()。

此函数在mvnormtest软件包中定义, 并产生Shapiro-wilk检验以多元正态性。 barlett.test()用于提供方差相等的参数k样本检验。


37)解释预测包的使用。

预测软件包提供了用于自动选择指数模型和ARIMA模型的功能。


38)区分qda()和lda()函数。

qda()函数可打印二次判别函数, 而lda()函数可基于居中变量输出判别函数。


39)解释auto.arima()和principal()函数。

auto.arima()函数可处理季节性和非季节性的ARIMA模型, 并且principal()函数可用于旋转和提取主成分。


40)解释FactoMineR。

FactoMineR是一个包含定性和定量变量的软件包。这些软件包中还包括观测值和补充变量。


41)SEM和CFA的完整形式是什么?

CFA代表确认因子分析, 而SEM代表结构方程模型。


42)定义cluster.stats()和pvclust()function()。

在fpc软件包中定义了cluster.stats()函数, 该函数提供了一种使用不同的验证标准比较两个集群解决方案相似性的方法, 而在pvclust软件包中定义了pvclust()函数, 该函数为分层聚类提供了p值。


43)定义MATLAB和party包。

该软件包包括包装函数和变量, 用于复制Matlab函数调用。


44)解释S3和S4系统。

在oops中, S3用于重载任何功能。这样我们就可以使用不同的名称来调用函数, 这取决于输入参数的类型或参数的数量, 而S4是oops最重要的特性。但是, 这是一个限制, 因为它很难调试。 S4有一个可选的参考类。


45)给出可视化程序包的名称。

R中包含以下可视化软件包:

  1. 密谋
  2. ggplot2
  3. 整理量
  4. 地貌
  5. googleVis
  6. 闪亮的

46)解释卡方检验

卡方检验用于分析由两个分类变量组成的频率表(即列联表)。卡方检验评估两个变量的类别之间是否存在显着关系。


47)解释随机森林。

随机森林也称为决策树森林。它是流行的基于决策树的集成模型之一。这些模型的准确性高于其他决策树。该算法可用于分类和回归应用。


48)解释时间序列分析。

在规则的时间间隔内测量的任何度量标准都会创建一个时间序列。由于工业上的必要性和相关性, 时间序列分析在商业上很重要, 尤其是在预测(需求, 供应和销售等)方面。每个数据点都与一个时间戳相关联的一系列数据点称为时间序列。


49)解释R中的饼形图。

R编程语言具有几个用于创建图表的图形库。饼图以不同颜色的圆形切片的形式表示值。


50)解释直方图。

直方图是一种条形图, 它显示与一组值范围进行比较的值的数量的频率。直方图用于分布, 而条形图用于比较不同实体。在直方图中, 每个条形表示给定范围内存在的值的数量的高度。


工作/人力资源面试问题
JavaScript面试问题
Java OOP面试问题
JSP面试问题
休眠面试问题
SQL面试题
Android面试题
MySQL面试问题

面试技巧

公司面试问题与程序

Java基础面试问题

Servlet面试问题

春季面试问题

PL / SQL面试问题

Oracle面试问题

jQuery面试问题

赞(0) 打赏
未经允许不得转载:srcmini » R编程面试题和答案精华都在这里了
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

觉得文章有用就打赏一下文章作者

微信扫一扫打赏