个性化阅读
专注于IT技术分析

R编程中的数据结构介绍

点击下载

数据结构对于理解非常重要。数据结构是我们将在R中日常处理的对象。对于初学者来说, 处理对象转换是最常见的绝望根源。我们可以说R中的所有东西都是对象。

R具有许多数据结构, 其中包括:

R编程数据结构
  1. 原子向量
  2. list
  3. Array
  4. 矩阵
  5. 数据框
  6. 因素

向量

向量是R中的基本数据结构, 或者可以说向量是最基本的R数据对象。原子向量有六种类型, 例如逻辑, 整数, 字符, 双精度和原始。 “向量是元素的集合, 最常见的是模式字符, 整数, 逻辑或数字”向量可以是以下两种类型之一:

  1. 原子向量
  2. 清单

list

在R中, 列表是容器。与原子向量不同, 列表不限于单一模式。列表包含多种数据类型。该列表也称为通用向量, 因为列表的元素可以是任何类型的R对象。 “列表是向量的一种特殊类型, 其中每个元素可以是不同的类型。”

我们可以借助list()或as.list()创建一个列表。我们可以使用vector()创建所需长度的空列表。

数组

还有另一种类型的数据对象, 可以在两个以上的维度(称为数组)中存储数据。 “数组是具有连续内存分配的相似数据类型的集合。”假设, 如果我们创建一个尺寸为(2, 3, 4)的数组, 那么它将创建两个两行三列的四个矩形矩阵。

在R中, 借助于array()函数创建一个数组。此函数将向量作为输入, 并使用dim参数中的值创建一个数组。

矩阵

矩阵是R对象, 其中元素以二维矩形布局排列。在矩阵中, 包含相同原子类型的元素。为了进行数学计算, 可以使用包含数字元素的矩阵。借助R中的matrix()函数创建一个矩阵。

句法

创建矩阵的基本语法如下:

matrix(data, no_row, no_col, by_row, dim_name)

数据框

数据框是二维数组状结构, 或者我们可以说它是一个表, 其中每一列包含一个变量的值, 而行包含每一列的值的集合。

数据帧具有以下特征:

  1. 列名将为非空。
  2. 行名将是唯一的。
  3. 数据框存储数字, 因子或字符类型数据。
  4. 每列将包含相同数量的数据项。

因素

因子也是数据对象, 用于对数据进行分类并将其存储为级别。因子可以存储字符串和整数。列具有有限数量的唯一值, 因此因子在列中非常有用。它在用于统计建模的数据分析中非常有用。

通过将向量作为输入参数, 借助factor()函数创建因子。


赞(0)
未经允许不得转载:srcmini » R编程中的数据结构介绍

评论 抢沙发

评论前必须登录!