
2020年第6期经济与社会发展
基于大数据的二手房价格空间分布
及影响因素分析
—以南宁市为例
李青香,周小玲,毛蒋兴,蒋丽娟
[摘要]房价作为一项重要的经济指标,一定程度上能反映城市的经济发展状况。文章利用G IS空间分析、空间自相关分析、kriging插值和特征价格模型等分析方法,对南宁市中心城区二手房价格的空间分布及其影响因素进行了分析。研究发现,南宁市二手房价格在空间上形成了由朝阳广场、南湖商圈 和东盟商务区组成的高价集聚中心以及五象新区热点集聚区;二手房价格与到地铁站的直线距离、到公交站的直线距离、到公园的直线距离、到小学的直线距离、到大型超市的直线距离、到银行网点的直线距离、房龄呈负相关,到商业中心的直线距离、最近地铁站是否为换乘站、到三甲医院的直线距离、到中学的直线距离、停车位、容积率、绿化率、是否有对口学校呈正相关。
[关键词]二手房价格;空间分布;影响因素;南宁市
[作者简介]李青香,南宁师范大学地理科学与规划学院硕士研究生;周小玲,南宁师范大学地理科学与规划学院硕士研究生;毛蒋兴,南宁师范大学地理科学与规划学院教授,理学博士;蒋丽娟,南宁师 范大学地理科学与规划学院硕士研究生,广西南宁530001
[中图分类号]F299.23 [文献标识码]A[文章编号]1672-2728(2020)06-0031-08
―、问题的提出
用地越来越紧缺,住宅供需成为城市发展亟须解决的一大问题。二手房数量占城市住宅总量的比重较高,并且大多数二手房占据城市配套成熟的优越位置,因此成为城市居民解决刚性需求的重要选择。城市是一个复杂的系统,二手房作为城市的“细胞”,其价格受许多要素影响,不同城市的二手房价格在空间分布上有所不同。通过研究 二手房价格空间分布及影响因素,对房地产健康发展具有重要的意义。目前,国内外相关研究取得了一定的成果。国外学者主要运用Hedonic Price Model(特征价格模型,简称HPM)、Kriging 等分析方法对二手房的空间分布进行研究,并利 用定标符号、竞租曲线、等值线和三维效果图等对二手房价格空间分异进行分析1u21|3]。部分学者通过特征价格模型(HPM)探讨多变量对二手房价格的影响,发现与中央商务区的距离、交通便利度、人口结构等对二手房价格产生重要影响吒近年来,国内学者利用Kriging插值分析方法,对国内多 个城市的二手房价格空间结构进行了分析,并通 过建立回归模型分析了区位因子、交通因子、政策 因子等对二手房价格的带动作用尽管国内
外相关研究已经取得了丰富的成果,但大部分学者的研究多利用传统的分析方法,基于大数据的分析方法比较少见。
鉴于二手房数据具有庞大、动态的特征,以
[基金项目】南宁师范大学八桂学者创新团队开放基金课题“城乡转型发展与土地利用”(60202394801)
31
传统手段获取的数据往往存在一定程度的缺失和滞后,故获取实时的二手房数据是研究的关键。大数据的快速发展,有效弥补了通过传统手段获取数据的不足,因其数据量多、实时动态、容 易获取等特点,为分析二手房价格空间分布提供了可靠的保障。基于大数据研究方法,本文利用爬虫技术爬取二手房数据和PO I数据,识别南宁市二手房价格空间分布情况,探讨其影响因素,实时掌握南宁市二手房价格发展情况,为南宁市 二手房市场健康发展出谋划策。
二、研究范围与方法
(―)研究范围
南宁市地处我国西南经济圈和东南亚经济圈的结合部,发展定位为面向东盟开放合作的区域性国际大
都市、“一带一路”有机衔接的重要门户枢纽城市、北部湾城市群与粤港澳大湾区融合发展的核心城市、具有浓郁壮乡特色和亚热带风情的生态宜居城市。近年来,南宁市吸引了大量的就业人口,房价成为市民的热议话题。本文主要 研究南宁市二手房价格空间分布及其受轨道交通等因素的影响,考虑到现正常运营的三条轨道线路均分布在中心城区内,因此遵循研究区的完整性、合理性和连续性的原则,以河流、山体、高 速公路作为边界阻断因素,本文确定了以南宁外环高速、南宁绕城高速和广昆高速围合形成的905.7平方公里的封闭区域作为研究范围。
(二)研究方法
本文的二手房信息点数据均由笔者在2020 年1月份利用Python爬虫工具进行爬取,经过清 洗无效数据,总共获取了 74101条二手房数据,涵盖了详细地址、停车位、单价、容积率和地理坐标等信息。通过对比二手房研究的分析方法,最终 选择较为成熟的空间自相关分析、Kriging插值分析和特征价格模型(HPM)分析等分析方法。
1.空间自相关分析。空间自相关是指在同一个区域内一些要素之间潜在的相互依赖性,利用全局空间自相关和局域空间自相关来揭示商品住宅价格在空间上的分布特征||01。全局空间自相32关中的Global Moran's I主要用来检验南宁中心城区内二手房价格在邻近地区内是否存在正相关、负相关或不存在空间相关,从整体上反映二手房价格高低空间关联程度的特征,Global Moran's I计算公式如下:
n n n n
A l X X(X, ~X)X X(X i ~X )(X J ~X )
/-»=17 =1_______________________- »=17 ^1______________________________________ x i w tj(x-7)2s2i !>y.
i = i y = i i = i> = l
其中^表示研究区内样本总数,是空间 权重,'和\分别是区域i和区域的变量观测值,s2是观测值的方差,孑是观测值的均值。采用z 值对Global Moran's I进行检验,z>0且统计显著,则表明二手房价格在空间上具有明显的正向相关效应。全局空间自相关只能说明样本在空间上的整体分布情况,样本存在全局正相关,但局部仍可能存在随机分布的情况,这时可通过局域空间自相关中的热点分析(Getis-Ord G〇将其划分为热点集聚区、冷点集聚区和异类集聚区。
2.空间插值分析。本文利用普通Kriging插值 法对已知二手房价格样本进行加权线性组合来预测未知点的值,其预测值为:
/V
2*(*〇)=X^iz(*i)
i = 1
其中,2* u。)是预测值;2 (&)在产u=i,…,/V)位置的观测值;A,是在产位置的观测值的权重;yv是用于预测未知采样点的数量。a,.u=i,-, /V)可以通过下式计算:
T n r.2--r./v i
A,r,〇
12\ 111I IN1a2^20
y n\ y N i t n n1A'y s q
1 2… 1 0<P1
3.特征价格模型。特征价格模型(H P M)本 质上是通过多元回归分析方法,分离得出不同因素对二手房价格的影响,二手房属性特征分为区位特征(l)、邻里特征(y v)和建筑特征(//),由此 特征价格模型可以简化为:
在现实中,特征价格模型主要有对数函数模型、线性函数模型和半对数函数模型。对数函数模型为InP
^+SoJn^+q线性函数模型为P=c+ 2a^,+e;半对数函数模型为In尸q+Sa^+e。式中,P是二手房价格,C是常数,〇_是第i个属性特征的估计参数值是二手房第;种属性特征,s是 随机误差。55556元/m2呈现的是非线性急剧增长,说明价位在10000元/m2~20000元/m2二手房的市场需求最大,更符合多数市民的价格定位(表1)。
表1南宁市二手房价格特征(2020年1月)
类型
数量
(个)
最小值
(元/m2)
最大值
(元/m2)
平均值
(兀/m2)
方差(元/
m2)
标准差
(元/m2)—■手房7410125715555612059201754814492
三、南宁市二手房价格空间分布特征
(一)价格跨度大,数量与价格整体呈非线性增长
南宁市中心城区二手房价格最高值是最低值的21.6倍,不同价位的二手房数量呈现不同的增长趋势。二手房样本中价格最低的是位于西乡塘区的北湖建材城美装公寓(2571元/m2),价格最高 的是位于良庆区的江山御景(55556元/m2),最低值 和最高值之间相差了 52985元/m2,体现了南宁市中心城区不同地域和不同类型的二手房在价格上存在明显差异。二手房数量与价格的统计学多项式拟合函数为y=
2£ -1O x3-1£-05*2+0.4648:*+ 4746.6,其中拟合优度(/?2)达到0.9529。从趋势线 来看,价位在2571元/m2~10000元/m2呈现的是非 线性急剧增长,价位在10000元/m2~20000元/m2呈现的是线性平缓增长,价位在20000元/m2~
(二)价格由中心向外逐渐降低,区域变化显著
南宁市中心城区二手房形成了由朝阳广场、南湖商圈和东盟商务区组成的高价集聚中心,不 同区域价格回落程度不一(图1)。朝阳广场作为南宁市传统商业中心,配套设施和商业已经进人成熟阶段,因此房价稳定且处在高价状态。东盟 商务区自2004年以来发展迅猛,华润中心、天健 商务大厦及部分政府部门的人驻,最早开通的地铁1号线穿越而过,以及与南宁东站、琅东客运站近在咫尺,使其成为了南宁市竞争力最强的城市核心区,二手房供不应求且价格居高不下。五 象新区是南宁市近年的重点开发区域,其二手房价格高于其他区域,并且价格稳中趋升。南宁市 中心城区西部集聚了南宁80%的大中专院校,其 二手房价格等值线分布均勻,在空间上具有连续性,尚未形成明显的集聚中心。
图1南宁市二手房价格K r i g i n g插值和等值线情况(2020年1月>
33
(三)价格存在空间正相关,各等级呈空间分异
运用全局空间自相关分析方法可得出南宁市中心城区二手房价格出现空间集聚效应,核 密度分析结果显示,各价格等级呈现不同的集聚中心。二手房全局MoranS I指数为0.381811,在P<0.1的显著性约束下通过检验,表明二手房价格存在正相关性。热点分析结果显示,在 99%的置信度下冷点(价格低值)分布于西乡塘区东南部、兴宁区西南部、江南区东北部和良庆区西北部;在99%的置信度下热点(价格高值)分布于青秀区西部(东盟商务区)和良庆区北部(五象新区)。将二手房价格分为矣8800元/m2、8800 元/m2~15000 元/m2、>15000 元/m2三个等级,根据各价格等级的核密度分析结果可知,价格矣8800元/m2的二手房呈现以南宁经开区和北湖北为双中心的空间布局,价格在8800元/m2〜15000元/m2的二手房呈现以南宁经开区、北湖、东盟商务区、龙岗新区为多中心的空间布局,价格>15000元/m2的二手房呈现以东盟商务区为单中心的空间布局,三个不同价格等级的二手房空间上有部分重合的现象,但总体上各等级的空间分布差异较大(图2、图3、图4、图5)〇
图2南宁市二手房价格热点分析结果(2020年1月>
34图3南宁市二手房单价矣8800元/m2核密度分析结果(2020年1月
>
图4南宁市二手房单价8800元/n f~15000元/r t f核密度分析结果(2020年1月)图5南宁市二手房单价>15000元/n f核密度分析结果(2020年1月)
四、南宁市二手房价格的影响因素
(一)H P M变置的确定及O L S回归结果
二手房的特征变量主要分为区位特征、邻 里特征、建筑特征。随着我国经济社会的快速发展,轨道交通的作用愈发突出,南宁轨道交通1号线东段于2016年6月丨8日开通试运营(2016年12月28日全线开通试运营),南宁市成为我国第一个开通地铁的首府城市,目前1、2、3号线处于正常运营阶段。南宁城市轨道交通的建设给市民生活带来了巨大的影响,“地铁 房”的热度一直居高不下。为探究轨道交通对房价的实际影响,本文根据南宁市中心城区的实际情况,选取15个特征变量因子,以期能从交通可达性、公共服务设施、社会经济发展、建筑自身条件等多方位剖析二手房价格的影响因素(表 2)。
35
更多推荐
二手房,价格,空间,南宁市,特征
发布评论