当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年15期

基于随机森林的深圳二手房价格预测与分析
李函谕,魏嘉银,卢友军
(贵州民族大学 数据科学与信息工程学院,贵州 贵阳 550025)

摘  要:针对深圳市二手房市场房价预测问题,结合相关的八个特征变量,利用随机森林模型训练房价预测模型。在研究过程中为使得模型准确率与泛化能力更高,使用交叉验证与网格搜索法,绘制学习曲线寻找最优参数,最后完成二手房价格预测模型的构建,预测精度达 82.22%。结合相关政策,得出近年来深圳市二手房地产均价虽仍会上涨但总体较为稳定、且涨幅较小,以及近十年小户型的房源增量减少的主要结论。


关键词:网络爬虫;随机森林;深圳二手房价;网格搜索



DOI:10.19850/j.cnki.2096-4706.2021.15.026


基金项目:贵州省教育厅青年科技人才成 长项目(黔教合 KY 字〔2017〕137);贵州省 科技计划项目(黔科合基础〔2018〕1082,黔科 合基础〔2019〕1159)


中图分类号:TP311                                        文献标识码:A                                             文章编号:2096-4706(2021)15-0100-05


Prediction and Analysis of the Price of Second-hand House in Shenzhen Based on Random Forest

LI Hanyu, WEI Jiayin, LU Youjun

(School of Data Science and Information Engineering, Guizhou Minzu University, Guiyang 550025, China)

Abstract: Aiming at the problem of house price prediction in Shenzhen second-hand house market, combined with eight relevant characteristic variables, the house price prediction model is trained by using random forest model. During the course of research, to improve the accuracy and generalization ability of the model, the cross validation and grid search method are used to draw the learning curve and find the optimal parameters, the construction of the second-hand house price prediction model is completed finally, and the prediction accuracy reaches 82.22%. Combined with relevant policies, it is concluded that although the average price of second-hand real estate in Shenzhen will still rise in recent years, it is generally relatively stable with a small increase, and the increase of house supply of small houses has decreased in recent ten years.

Keywords: web crawler; random forest; Shenzhen second-hand house price; grid search


参考文献:

[1] 张智鹏,郑大庆 . 影响区域房价的客观因素挖掘分析[J]. 计算机应用与软件,2019,36(11):32-38+85.

[2] 高玉明,张仁津 . 基于遗传算法和 BP 神经网络的房价预测分析 [J]. 计算机工程,2014,40(4):187-191.

[3] 董倩,孙娜娜,李伟 . 基于网络搜索数据的房地产价格预测 [J]. 统计研究,2014,31(10):81-88.

[4] 刘馨,张卫军,石泉,等 . 基于数据挖掘与清洗的高炉操作参数优化 [J]. 东北大学学报(自然科学版),2020,41(8): 1153-1160.

[5] ANTIPOV E A,POVSKAYA E B. Mass appraisal of residential apartments:An application of Random forest for valuation and a CART-based approach for model diagnostics [J].Expert Systems with Applications,2012,39(2):1772-1778.

[6] 顾桐,许国良,李万林,等 . 基于集成 LightGBM 和贝叶斯优化策略的房价智能评估模型 [J]. 计算机应用,2020,40(9): 2762-2767.

[7] 百度百科 . 深圳市行政区划 [EB/OL].[2021-04-23]. https://baike.baidu.com/item/%E6%B7%B1%E5%9C%B3%E5% B8%82%E8%A1%8C%E6%94%BF%E5%8C%BA%E5%88%92/186551 14?fr=aladdin.

[8] 深圳市规划和国土资源委员会 . 深圳市安居型商品房定价实施细则 [EB/OL].(2017-12-17).http://www.sz.gov.cn/ slhwz/zcfg/content/post_9177804.html.

[9] 深圳市司法局 . 深圳市房地产市场监管办法(修订征求意 见稿)[EB/OL].(2020-10-22).http://sf.sz.gov.cn/hdjlpt/ yjzj/answer/7097#feedback.

[10] 陈兴蜀,常天祐,王海舟,等 . 基于微博数据的“新冠肺炎疫情”舆情演化时空分析 [J]. 四川大学学报(自然科学版), 2020,57(2):409-416.

[11] 张望舒,马立平 . 城市二手房价格评估方法研究——基于 Lasso-GM-RF 组合模型对北京市二手房价格的分析 [J]. 价格 理论与实践,2020(9):172-175+180.

[12] CHEN L J,YAO X J,LIU Y L,et al. Measuring Impacts of Urban Environmental Elements on Housing Prices Based on Multisource Data-A Case Study of Shanghai,China [J/OL].ISPRS International Journal of Geo-Information,2020,9(106):1-23.


作者简介:李函谕(1996 -),男,苗族,贵州贵阳人,硕士研究生在读,研究方向:统计建模与分析、大数据处理与分析; 魏嘉银(1986 -),男,汉族,福建三明人,副教授,硕导,博士, 研究方向:算法设计与分析、大数据处理与分析;卢友军(1985 -), 男,汉族,贵州遵义人,硕导,博士,研究方向:复杂网络。