SAS数据清洗之字符和数字处理
SAS数据清洗: 由于SAS数据集之间的关系一般不会用到,只是在proc sql中有所涉及,至今尚未运用过用于数据分析,所以在这里只讲单个数据集的处理。 在proc sql中我们可以看到:在定义数据集时涉及到字段名,字段属性,字段标签这三个最常用。我们在数据清洗时涉及到的数据集字段的处理,主要也就是围绕着字段名、字段属性和字段标签来进行处理。(对数据集结构的处理也就是对字段的增删改) 修改数据集名称和标签(label) 增加字段很简单,只需要在data步新建一个变量,对变量进行赋值即可。 删除变量可以使用drop和keep二者二选一。 下面谈一下最复杂的修改字段: 修改字段名最简单复杂的方法可以利用增加字段和删除字段二者结合。然后就是用sas中的rename关键字进行处理,格式为rename=(原字段名=新字段名)。 修改字段的标签:(定义label attrib label 变量名=label名) 修改使用modify 数据集名;label 变量名=label名。其中modify可以用于修改rename format和label。 修改sas的数据类型。 在sas中只有两种数据类型:数值型和字符型。日期在sas中存储形式是数值型,只是在显示时使用日期的format显示。 所以主要就是涉及到数值型和字符型之间的转换 数值转换为字符: data; x=2557898; y=put(x