摘 要:教学资源数据样本中,数据量大,且维度也逐渐增大,样本类别间存在层次结构,且不同类节点具有共有与固有属性的特点,导致其特征选择的难度较大,针对教学数据的特征选择方法无法充分利用类别的层次结构信息。为实现分层分类教学中层次结构数据的高效管理,降低特征选择的失败率,提出了一种基于标签关联性的分层分类共有与固有特征选择新方法。实验表明,特征选择失败率可始终控制在 10% 以内,该方法可行、高效。
关键词:标签关联性;特征选择;固有特征;分层分类;共有特征;分类识别
DOI:10.19850/j.cnki.2096-4706.2022.22.005
基金项目:广东省高职教育教学改革研究与实践项目(GDJG2021175);2023 年广东省科技创新战略专项资金(“攀登计划”专项资金)(pdjh2023b0928);广东省高职院校省级高水平专业群移动互联应用技术专业群建设项目(GSPZYQ2020069)
中图分类号:TP18 文献标识码:A 文章编号:2096-4706(2022)22-0022-05
A Method of Common and Inherent Features Selection of Hierarchical Classification Based on Label Relevance
LIAO Daqiang
(Guangdong Nanhua Vocational College of Industry and Commerce, Guangzhou 510507, China)
Abstract: In the teaching resource data samples, the amount of data is large, and the dimensions are gradually increasing. There are hierarchical structures among sample categories, and different kinds of nodes have the characteristics of common and inherent attributes, which lead to the difficulty of feature selection. The feature selection method for teaching data cannot make full use of the hierarchical structure information of categories. In order to realize the efficient management of hierarchical structure data in hierarchical classification teaching and reduce the failure rate of feature selection, a new method of common and inherent feature selection of hierarchical classification based on label relevance is proposed. The experiment shows that the failure rate of feature selection can always be controlled within 10%, and this method is feasible and efficient.
Keywords: label relevance; feature selection; inherent characteristics; hierarchical classification; common feature; classification identification
参考文献:
[1] 彭志洪 . 电子书包在初中物理分层教学中的应用研究 [J].电化教育研究,2019,40(4):106-111.
[2] 熊昌镇,车满强,葛金鹏 . 自适应特征选择的分层卷积视觉跟踪 [J]. 光子学报,2019,48(3):172-179.
[3] 徐宝鼎,秦玉华,杨宁,等 . 特征分层结合改进粒子群算法的近红外光谱特征选择方法研究 [J]. 光谱学与光谱分析,2019,39(3):717-722.
[4] 许召召,申德荣,聂铁铮,等 . 融合信息增益比和遗传算法的混合式特征选择算法 [J]. 软件学报,2022,33(3):1128-1140.
[5] 樊鑫,陈红梅 . 基于差别矩阵和 mRMR 的分步优化特征选择算法 [J]. 计算机科学,2020,47(1):87-95.
[6] 谢娟英,吴肇中 . 基于可辨识矩阵的完全自适应 2D 特征选择算法 [J]. 软件学报,2022,33(4):1338-1353.
[7] 谢玲,陈文婷,曹瀚文,等 . 基于综合集成研讨厅的半监督客户关键特征选择模型研究 [J]. 管理评论,2020,32(7):236-245.
[8] 周婉莹,马盈仓,续秋霞,等 . 最大熵和 ?_(2,0)范数约束的无监督特征选择算法 [J]. 计算机工程与应用,2020,56(11):51-59.
[9] 李敏,章国豪,陈梓樑,等 . 基于差分进化的多目标粒子群特征选择算法 [J]. 计算机应用研究,2020,37(1):76-79+111.
[10] 程玉胜,宋帆,王一宾,等 . 基于专家特征的条件互信息多标记特征选择算法 [J]. 计算机应用,2020,40(2):503-509.
[11] 胡均毅,李金龙 . 基于情感评分的分层文本表示情感分类方法 [J]. 计算机工程,2020,46(3):46-52+59.
[12] 徐逸舟,林晓,陆黎明 . 基于分层式 CNN 的长文本情感分类模型 [J]. 计算机工程与设计,2022,43(4):1121-1126.
[13] 李国旗,王萍,吴婉姗,等 . 供需平衡视角下城市轨道交通分层与分类方法 [J]. 长安大学学报(自然科学版),2020,40(5):87-96.
[14] 张翀,何春辉,鲍翊平,等 . 军事指挥体系态势产品分层分类体系模型 [J]. 火力与指挥控制,2021,46(10):96-102.
[15] 张鑫,李占山 . 自然进化策略的特征选择算法研究 [J].软件学报,2020,31(12):3733-3752.
作者简介:廖大强(1984—),男,汉族,广东梅州人,硕士,副教授、高级实验师,主要从事职业技术教育研究。