12.20学习笔记-数据可视化小练习

痴心易碎 提交于 2019-12-20 20:52:32

pandas库的应用

主要用于处理一些数据
以读取csv文件为例

from matplotlib import pyplot as plt
import pandas as pd
x=pd.read_csv('/Users/蔡洪浩/Desktop/countries.csv')
#y=x[10]
y=x.country=='China'
#print(y) bool值类型
#z=x[y] 如果y是真则输出z,也就是把国家为China的全部输出
#print(z)
z=x[2:10]#利用切片的知识可以把2到10的所有信息输出
print(z)

再用上画图各种胡搞

from matplotlib import pyplot as plt
import pandas as pd

x=pd.read_csv('/Users/蔡洪浩/Desktop/countries.csv')
#y=x[10]
china_data=x.country=='China'
china=x[china_data]
US_data=x.country=='United States'
US=x[US_data]
#上面分别把两个国家的数据存起来


#print(y)
#z=x[y]
#print(z)
#print(x.year[2:10])

plt.plot(china.year,china.population/10**8,label='china')
#这里10**8就是避免y轴出现科学计数法,下同
plt.plot(US.year,US.population/10**8,label='US')
#plt.plot(china.year,china.population/china.population.iloc[0],label='china')
#plt.plot(US.year,US.population/US.population.iloc[0],label='US')
#这种除以自己第一年的人数就是反应的增长率的问题
#iloc函数就是调出某一行的数据
plt.legend()

#print(z)
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!