《R语言实战》之 创建数据集(第二章,各种数据结构)
数据集 2.1数据集概念 概念:通常是由数据构成的矩形数据 不同行业对数据集的行和列叫法不同 行业人 行 列 统计学家 观测(observation) 变量(variable) 数据库分析师 记录(record) 字段(field) 数据挖掘和机器学习研究中 示例(example) 属性(attribute) 可处理的数据类型(模式):数值型、字符型、逻辑型、复数型、原生型(字节) 存储数据的结构:标量、向量、数据、数据框和列表 实例的标识符:rownames(行名);实例的类别型:因子(factors) 2.2数据结构 这节讲了几个数据结构,向量、矩阵、数组、数据框,前三种分别是一维、二维、大于二维的,它们共同点是一个数据结构中,仅能用一种数据的模式,而数据框则可以多种模式。 一些定义 对象:可复制给变量的任何事物,包括常量、数据结构、函数、图形 模式:描述对象如何存储和某各类 数据框:存储数据的一种结构(列表示变量,行表示观测),一个数据框 可存储不同类型的变量 (如数值型、字符型) 2.2.1 向量(一维数据,数值型、字符型、逻辑型) a<- c(1,2,3) #数值型 b<-c("one","two","three")#字符型 c<-c(TRUE,TURE,FALSE) #逻辑型 注意: 1.字符型的向量,元素要加“ ”或者' ',数值型和逻辑型不需要。 2.同一向量