机器学习练习--读取本地CSV

旧巷老猫 提交于 2019-12-05 09:52:48

自己随便准备了一些名人的出生日期和职业,将职业分成体育、军事、表演、文学、政治、艺术、社会经济七个大类,CSV表大概如下:

代码:

import matplotlib.pyplot as plt 
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split 
from sklearn.neighbors import KNeighborsClassifier
import os
import mglearn  

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

os.chdir("D:\PyProjects\MyProject\dataset")
dataset = pd.read_csv('test.csv', header=0, index_col=0)
data_pandas = pd.DataFrame(dataset)
display(data_pandas)

M = dataset.iloc[ : , 1].values
D = dataset.iloc[ : , 2].values

mglearn.discrete_scatter(M, D, dataset.iloc[ : , 3].values) 
plt.legend(["体育", "军事", "表演", "文学", "政治", "艺术", "社会经济"], loc=4, bbox_to_anchor=(1.2, 0)) 
plt.xlabel("Month") 
plt.ylabel("Date") 

得到如下结果:

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!