对dataframe中的某一列进行独热编码(One-Hot Encoding)

老子叫甜甜 提交于 2020-01-25 03:15:53

该列中包含了标签中的所有类别:

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(sparse = False)
result = enc.fit_transform(data[[41]])    #41指的是列标为41的那一列数据

该列中包含了标签中的所有类别的一部分:

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(sparse = False)
enc.fit([[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]])
result = enc.transform(data[[41]])    #注意这个函数少了fit前缀

#enc = OneHotEncoder(sparse = False)
#enc.fit([[0], [1]])
#result = enc.transform(data['6A'])
#print(result.shape)

s=pd.get_dummies(data['6A'],sparse=True)
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!