当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年7期

基于随机森林的光谱分类模型研究
袁正熙
(华南师范大学,广东 广州 510631)

摘  要:文章第一节介绍集成算法原理;第二节系统理论地说明了 Bagging 算法;第三节介绍随机森林算法;第四节介绍实验内容以及程序模块,利用 Python 实现光谱数据的分类并评估结果,然后实行调参,得到最优的参数搭配;第五节对优化模型进行测试,与原模型比较准确率、查准率、召回率、F-score 值等指标,发现优化后的结果优良;第六节总结随机森林算法的优缺点。


关键词:集成学习;Bagging;随机森林



DOI:10.19850/j.cnki.2096-4706.2021.07.021


中图分类号:TP273.4                                    文献标识码:A                                    文章编号:2096-4706(2021)07-0081-04


Study on Spectral Classification Model Based on Random Forest

YUAN Zhengxi

(South China Normal University,Guangzhou 510631,China)

Abstract:In this paper,the first section introduces the principle of the ensemble algorithm;in the second section,the Bagging algorithm is explained systematically and theoretically;the third section introduces the random forest algorithm;the fourth section introduces the experimental content and program modules,Python is used to classify the spectral data and evaluate the results,and then adjust the parameters to obtain the optimal parameter matching;the fifth section tests the optimized model and compares the indexes of the accuracy,precision,recall and F-score value with the original model. It is found that the optimized result is excellent;the sixth section summarizes the advantages and disadvantages of random forest algorithm.

Keywords:ensemble learning;Bagging;random forest


参考文献:

[1] 周志华 . 机器学习 [M]. 北京:清华大学出版社,2016.

[2] 方匡南,吴见彬,朱建平,等 . 随机森林方法研究综述 [J]. 统计与信息论坛,2011,26(3):32-38.

[3] 董乐红,耿国华,高原 .Boosting 算法综述 [J]. 计算机应 用与软件,2006,23(8):27-29.

[4] 胡永德 . 海量光谱数据降维方法的研究与应用 [D]. 济南: 山东大学,2021.

[5] BREIMAN L. Random forests [J].Machine Learning, 2001,45(1):5-32.

[6] 周惠慧 . 恒星天文光谱数据分类方法探究 [J]. 信息与电脑 (理论版),2021,33(7):84-86.

[7] 刘曼云,赵正旭,王威,等 .LAMOST 恒星光谱数据分析 [J]. 信息技术与信息化,2019(11):193-197.


作者简介:袁正熙(2000—),男,汉族,广东东莞人,本科 在读,研究方向:应用统计。