
站长统计
深圳链家⼩区数据分析
数据的收集和整理,会占⽤数据分析⼤部分的时间。
——沃兹基硕德
之前的爬⾍获得深圳⼩区信息4785条,与链家⼀致,骄傲!
数据量不多,但还是选择⽤mongodb练⼿。
⼯具:jupyter notebook,mongodb,highchart
准备⼯作
新⼿上路,数据是要被随便造的,安全起见,先复制⼀份原始数据。
进⼊mongo shell 复制数据
Paste_Image.png
把mongo⽬录加⼊环境变量
Paste_Image.png
再执⾏mongo命令就没问题了
Paste_Image.png
show dbs 显⽰所有database
数据在lianjia中,
Paste_Image.png show tables 显⽰所有collection,
Paste_Image.png 需要复制sz_xiaoqu 数据,先新建⼀个collection,显⽰ok就新建成功了,
Paste_Image.png 将sz_xiaoqu数据复制到新建的collection,显⽰复制4785条数据,复制成功。
Paste_Image.png 然后就可以开始可劲造了~
开始折腾
4775
去除所有错误⼩区后,有效⼩区总数4775
2146156,⼤概就是深圳所有商品房总数量了。
所有⼩区房屋加总数2146156,⼤概就是深圳所有商品房总数量了。
所有⼩区房屋加总数
各⾏政区⼩区分布
各⾏政区⼩区分布图
各⾏政区⼩区分布
⼩区数量明显的关内三区领先。
各⾏政区房屋分布
各⾏政区房屋分布图
各⾏政区房屋分布饼图没想到龙岗房⼦很多啊,⼩区也不多,那⾥的⼩区应该都很⼤~
450
⼩区房屋数平均值
⼩区房屋数平均值450
各⾏政区⼤于平均值的⼩区
各⾏政区⼤于平均值的⼩区
230450
14275,max 230450
⼩区均价min 14275,max
⼩区均价min
均价分布直⽅图
均价分布直⽅图各⾏政区⼩区均价
各⾏政区⼩区均价房价最⾼的还是⼤南⼭。
前1000均价⼤区-⼩区数量
更多推荐
数据,政区,深圳,复制,房屋,数量
发布评论