自如网杭州市租房数据分析(2)
自如网杭州市租房数据分析 经过 数据爬取 和 数据清洗 后,终于到了数据分析的部分。具体从探索型数据分析和验证型数据分析两部分进行。探索型数据分析是主要为了了解属性的分布、属性之间的相关性,验证型数据分析则用来预测租金价格。 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline sns.set_style("darkgrid") #绘图风格 sns.set_context("talk") plt.rcParams['font.sans-serif']=['SimHei'] 1.探索型数据分析 (1)首先看一下数值型属性的统计情况 rent_data=pd.read_csv('rent_data_clean.csv',encoding='gbk') rent_data.describe() 房间价格分布图 plt.hist(rent_data['price'],bins=20,edgecolor='w',color='lightskyblue') 房间面积分布图 plt.hist(rent_data['size'],bins=27,edgecolor='w',color='orange')