数据分析 - 链家网爬取深圳租房
基于之前另外一篇博客爬取的链家网深圳租房信息的数据分析 背景和目标 没去过深圳、没有自己租过房。但是大四及其之后想到深圳工作租房。 深圳的房价一直是每个刚去找工作的人的热门话题,所以什么样的房子才是我所青睐的。 通过对深圳租房数据进行分析,为我后续到深圳想要租房的方便作参考 指标设计 针对先前爬取的宽表继续修改 本身不喜欢和不认识的人合租,所以剔除点出租类型是“合租”,保留“整租” 地址的考虑只在区范围考虑,更详细的地址暂不做考虑 房子朝向还不懂,不做考虑 增加一列房子的房间数量 增加一列房子每平放的月租 增加一列房子每个人的月租 增加一列是否公寓 增加一列是否近地铁 district1 size toward zone price room avg_price_size avg_price_room tag is_dep close_subway 区 大小 朝向 格局 价格 房间数 每平米月租 每人月租 标签 公寓 近地铁 数据分析 房源分析 出租房源主要在深圳的西部,判断西部的待出租房源多,相对可供的选择也多 房租分析 区域房租分布 深圳个人房租高的地方主要集中在科技园附近,大多数互联网公司附近。 基本上房租高的地方,每个人需要承当的房租也高 南山区和龙岗区的每人月租均价趋势和总月租的趋势有所差别,说明南山区多人合租的较多而龙岗区独自租房的较多 南山区、福田区