当前位置>主页 > 期刊在线 > 信息化应用 >

信息化应用22年5期

基于网络搜索数据与随机森林模型的市场研究 ——以温州市商品住宅市场为例
张大力¹,林大川²,郑一帆²
(1. 浙江安防职业技术学院,浙江 温州 325024;2. 浙江大学 生命科学学院,浙江 杭州 310027)

摘  要:以温州市房地产市场为研究对象,基于 2011 年 1 月至 2020 年 12 月间相关关键字的百度指数搜索数据和温州新建商品房销售价格,通过文本提取获取初始关键字,并二次拓展关键词库,后续使用相关时差分析筛选先行且具有相关性的关键字,再利用随机森林递归消除筛选出关键字,并根据筛选出的关键字建立随机森林模型,分析并预测,预测误差率在 2.989%。


关键词:网络爬虫;随机森林;温州房地产;网络搜索



DOI:10.19850/j.cnki.2096-4706.2022.05.035


中图分类号:TP311                                               文献标识码:A                            文章编号:2096-4706(2022)05-0134-04


Market Research Based on Web Search Data and Random Forest Model

—Take Wenzhou Commercial Housing Market as an Example

ZHANG Dali 1, LIN Dachuan2, ZHENG Yifan2

(1.Zhejiang college of Security Technology, Wenzhou 325024, China; 2.College of Life Sciences, Zhejiang University, Hangzhou 310027, China)

Abstract: This paper takes the real estate market in Wenzhou as the research object, based on the Baidu index search data of relevant keywords from January 2011 to December 2020 and the sales price of new commercial houses in Wenzhou, and obtains the initial keywords through text extraction, and expands the key thesaurus twice. It uses the relevant time difference to analyze and screen the first and relevant keywords, and uses the recursive elimination of random forest to screen the keywords, and establishes the random forest model according to the selected keywords for analysis and prediction. The prediction error rate is 2.989%.

Keywords: Web crawker; random forest; Wenzhou real estate; Web search


参考文献:

[1] 刘颖,吕本富,彭赓 . 网络搜索对股票市场的预测能力:理论分析与实证检验 [J]. 经济管理,2011,33(1):172-180.

[2] 任乐,崔东佳 . 基于网络搜索数据的国内旅游客流量预测研究——以北京市国内旅游客流量为例 [J]. 经济问题探索,2014(4):67-73.

[3] BERACHA E,WINTOKI M B. Forecasting Residential Real Estate Price Changes from Online Search Activity [J].Journal of Real Estate Research,2013,35(3):283-312.

[4] VAN DIJK D W,FRANCKE M K. Internet Search Behavior,Liquidity and Prices in the Housing Market [J].Real Estate Economics,2018,46(2):368-403.

[5] 董倩,孙娜娜,李伟 . 基于网络搜索数据的房地产价格预测 [J]. 统计研究,2014,31(10):81-88.

[6] 唐一丁 . 网络搜索数据在预测房地产价格指数中的应用研究 [D]. 长春:吉林大学,2016:57.

[7] 卢小溪 . 基于网络搜索的商品房成交量预测效果研究 [D].北京:首都经济贸易大学,2019.

[8] 褚桂健 . 基于网络搜索数据与随机森林模型的房地产价格指数预测研究 [D]. 重庆:重庆交通大学,2018.


作者简介:张大力(1995.02—),男,汉族,浙江温州人,助教,硕士研究生,研究方向:大数据技术与应用、金融大数据;林大川(2000.12—)男,汉族,浙江温州人,本科在读,研究方向:生物信息;郑一帆(2000.11—),男,汉族,浙江杭州人,本科在读,研究方向:信息资源管理。