量化北京二手房单位面积均价与房屋面积,卧室数,厅数,楼层数,房屋所在区,周边有无地铁或学校之间的影响关系,并且定量给出方程用以确定具体的数量关系。
关键词
量化分析;异方差分析;残差分析在
绘制房间数,厅数箱线图之前,我们有必要对其数量进行调整,由于房间数大于五间的聊聊无几,同时厅数大于2间的也不多,所以将房间数大于五间,厅数大于2间的分别划分为一类,显然这样做既不会过多的干扰结果的可靠性,也将大大较少分析负担。
分析如下:
1.二手房平米均价与卧室数关系
在卧室数改变时,很明显的发现0间卧室的房子均价最低,且随着卧室数量的上升,价格逐渐上升。当卧室数为5间及以上,价格波动明显增大,均价增高,说明大户型房屋的调价空间更大,价格更加参差。但要特别注意,当卧室数量上升时,每类房子的最高价格下降,从一定程度上说明卧室少的房子有部分可能有特殊用途导致价格上升,这可能就是异常点的来源。
2.二手房平米均价与厅数关系
随着厅数的不断增加,价格波动先增加后来减少,最高价格逐渐减少,平均价格基本稳定。零厅的房子价格高,很可能时因为这种房子地段极好所以价格高。
3.二手房平米均价与楼层关系
地下室最为便宜,而且价格相对于其他楼层价格波动最为不明显,剩下的low,middle与high价格波动程度,最高价,中位价格基本相当。
4.二手房平米均价与城区关系
西城区靠近北京中心房价最高,这里同时也有许多高档住宅,所以价格波动也是最大。海淀区,东城区紧随其后,两者价格差不多,朝阳区,石景山区,丰台区价格较低,且尤其是丰台区和石景山区房屋价格波动同时也表现的较为缓和。
5.二手房平米均价与有无地铁,有无学校的关系
有学校与地铁的房屋明显比没有这些设施的房屋价格贵,尤其是学校,有的房屋周边有学校价格甚至比没有学校的类似房屋高接近两倍,这也就侧面符合北京天价学区房的事实。有地铁的房子虽然增价幅度没有那么大,但是价格也表现出了明显的上升。这也就说明了房价与周边是否有学校,地铁也有关系。
综上所述,影响房屋平米均价的内部因素有面积、卧室数、厅数,影响房屋价格的外部因素有地区、楼层、有无地铁、有无学校。下面我将建模探究这些与房价之间的定量关系。
结论及建议
1.结论
此次通过对16795组北京二手房数据的研究,得出北京二手房单位面积价格与内在因素(面积,卧室数,厅数),外在因素(楼层数,地区,周边有无学校,周边有无地铁)的线性相关。根据数次检验,分析,最终用相对“合理”的16001组数据进行方程拟合,基本符合多元线性拟合的基本假设,尤其是异方差消除最为出色,较为合理地解决了开篇提出的两个问题。
2.建议
在北京有想了解二手房价格的可以借鉴的使用本篇论文所拟合出的方程,其方程所确定的价格有着一定的指导作用。但是两种情况下慎用:①所估计房价与本篇论文写作时间差距过大。北京房价变化太过于剧烈,涨势明显,如果时间相差不远,推荐使用2倍的当年通货膨胀率进行终值计算。②所估计房产比较“特别”,比方说黄金地段的一室一厅,贵宾区的房子(原因:计算时,上述数据我认为大多它们构成异常值,离群值去除,所以模型没有办法表现出这些值的特点)。
未来研究方向
我未来的研究方向主要是三个方面:
1.寻找其他可能影响房价的因素,比方说地区综合交通情况,地区环境状况,地区文化氛围状况,以及找出指标来专门刻画那些贵宾专用的房间,使其不会成为异常值,或者离群点被剔除出去;
2.改善拟合方法,这次拟合我主要的目的就是消除异方差,但是忽略了其他因素,比方说偏度,峰度,寻找更加合理的连结函数,找出更精确的刻画拟合“合理性”的方法;
3.这也是本次模型建立最失误的地方,我没有充分运用老师所提供的数据。未来我进行研究时结合经纬度,小区名字,小区规模进行分析,得出适合更加广泛,尽可能精准的模型。
参考文献:
[1]王华丽.多元线性回归实例分析[J].科技资讯,2014,(29):22.
[2]费宇.郭民之等著.多元统计分析[M].中国人民大学出版社.