摘 要:随机森林是一种灵活且易于使用的机器学习算法,因为它很简易,既可用于分类也能用于回归任务。在医学、生物信息、环境预测检测等领域有着广泛的应用。为此,本文介绍了随机森林原理及其相关性质,以及它的改进情况及应用,并讨论了以后的改进趋势和方向。
关键词:随机森林;决策树;集成学习;机器学习
中图分类号:TP311.13;TP181 文献标识码:A 文章编号:2096-4706(2019)20-0028-03
A Survey of Improved Random Forest Algorithms
SUN Mingzhe,BI Yaojia,SUN Chi
(Qingdao University of Science and Technology,Information Science and Technology Academy,Qingdao 266016,China)
Abstract:Random forest is a flexible and easy-to-use machine learning algorithm,because it is very simple and can be used for both classification and regression tasks. It has been widely used in the fields of medicine,bioinformatics,environmental prediction and detection. In this paper,the principle of random forest and its related properties,its improvement and application are introduced,and the future improvement trend and direction are discussed.
Keywords:random forest;decision tree;integrated learning;machine learning
参考文献:
[1] CHEN X-W,LIU M. Prediction of protein-protein interactions using random decision forest framework [J].Bioinformatics,2005,21(24):4394-4400.
[2] Smith A,Sterba-Boatwright B,Mott J. Novel application of a statistical technique,Random Forests,in a bacterial source tracking study [J].Water Research,2010,44(14):4067-4076.
[3] 程玉胜,邹欢. 基于随机森林的RFM 模型对银行信用风险的评估 [J]. 安庆师范大学学报(自然科学版),2018,24(3):34-37.
[4] 叶雷. 机器学习算法在医疗数据分析中的应用 [D]. 武汉:华中师范大学,2017.
[5] 卢睿,李林瑛. 基于随机森林的犯罪预测模型 [J]. 中国刑警学院学报,2019(3):108-112.
[6] 黄衍,查伟雄. 随机森林与支持向量机分类性能比较 [J].软件,2012,33(6):107-110.
[7] 谢晓龙,叶笑冬,董亚明. 梯度提升随机森林模型及其在日前出清电价预测中的应用 [J]. 计算机应用与软件,2018,35(9):327-333.
[8] 邢江宽,王海鸥,罗坤,等. 预测生物质热解动力学参数的随机森林模型 [J]. 浙江大学学报(工学版),2019,53(3):605-612.
[9] 魏正韬. 基于非平衡数据的随机森林算法研究 [D]. 西安:西安电子科技大学,2017.
[10] 孙悦,袁健. 基于Spark 的改进随机森林算法 [J]. 电子科技,2019,32(4):60-63+67.
[11] 邹永潘,王儒敬,李伟. 随机森林算法在小麦育种辅助评价中的应用 [J]. 计算机系统应用,2017,26(12):181-185.
[12] 刘永垚,第宝锋,詹宇, 等.Constantine A.Stamatopoulos.基于随机森林模型的泥石流易发性评价——以汶川地震重灾区为例 [J]. 山地学报,2018,36(5):765-773.
[13] 李欢,熊梦莹,聂斌,等. 融合因子分析的随机森林研究 [J/OL]. 计算机工程与应用:1-10.[2019-07-27].http://kns.cnki.net/kcms/detail/11.2127.TP.20190121.1757.009.html.
[14] 王凯,王菊香,邢志娜,等. 基于改进特征选择RF 算法的红外光谱建模方法 [J]. 计算机应用研究,2018,35(10):3000-3002.
作者简介:孙明喆(1997-),男,汉族,山东寿光人,本科,研究方向:信息工程。