当前位置>主页 > 期刊在线 > 信息技术 >

信息技术2019年17期

电力基建施工问题文本分类研究
谢志炜¹,冯鸿怀²,许锐埼³,李慧夫³
(1. 广州供电局有限公司,广东 广州 510620;2. 广州穗能通综合能源有限公司,广东 广州 510620;3. 广东工业大学 自动化学院,广东 广州 510006)

摘  要:针对实际电力基建施工问题数据集庞大,导致运监管理难度较大的问题,本文提出一种基于朴素贝叶斯分类器的电力基建施工问题文本分类方法,实现对施工问题的自动分类工作。首先整理收集施工问题数据集,然后将施工问题短文本进行中文分词,构建特征向量空间,最后采用朴素贝叶斯分类器对施工问题文本进行分类,并通过实例分析证明了本文所用方法的有效性与优越性。


关键词:施工问题;中文分词;朴素贝叶斯;文本分类



中图分类号:TP391;O212.8         文献标识码:A         文章编号:2096-4706(2019)17-0017-03


Text Classification Research on Power Infrastructure Construction Problems

XIE Zhiwei1,FENG Honghuai2,XU Ruiqi3,LI Huifu3

(1.Guangzhou Power Supply Bureau Co.,Ltd.,Guangzhou 510620,China;2.Guangzhou Suinengtong Integrated Energy Co.,Ltd.,Guangzhou 510620,China;3. Guangdong University of Technology,School of Automation,Guangzhou 510006,China)

Abstract:Aiming at the huge dataset of actual power infrastructure construction problems,it is difficult to manage the operation and supervision. This paper proposes a text classification method based on Naive Bayesian classifier for power infrastructure construction,which realizes the automatic classification of construction problems. Firstly,collect the construction problem data set,and then use the Chinese text segmentation of the short text of the construction problem to construct the feature vector space. Finally,the Naive Bayes classifier is used to classify the text of the construction problem. The validity and superiority of the method used in this paper are proved by an example analysis.

Keywords:construction problems;Chinese word segmentation;Naive Bayes;text classification


基金项目:本文系广东省科技计划项目:计及风电的电网短期负荷预测系统关键技术研究(项目编号:2016A010104016)资助。


参考文献:

[1] 韦锡芝. 电力基建工程管理中常见问题及改进措施 [J]. 技术与市场,2016,23(2):98+100.

[2] 曹武明. 当前电力建设工程施工安全管理问题分析与应对措施 [J]. 时代经贸,2009(11):101.

[3] 施萱轩,姜红红,梁浩,等. 文本挖掘技术研究及其在电力行业的应用 [J]. 机电信息,2017(30):42-45+47.

[4] 吴刚勇,张千斌,吴恒超,等. 基于自然语言处理技术的电力客户投诉工单文本挖掘分析 [J]. 电力大数据,2018,21(10):68-73.

[5] 刘梓权,王慧芳,曹靖,等. 基于卷积神经网络的电力设备缺陷文本分类模型研究 [J]. 电网技术,2018,42(2):644-651.

[6] 庄晟. 基于朴素贝叶斯的电力变压器故障诊断 [D]. 上海:上海交通大学,2015.

[7] 岳全中,朱永利. 基于朴素贝叶斯分类器的电流互感器状态评估 [C]// 中国高等学校电力系统及其自动化专业第二十四届学术年会论文集. 北京:中国农业大学,2008:208-211.

[8] 雍明超,吕侠,周钟,等. 基于朴素贝叶斯算法的电力变压器故障诊断方法研究 [J]. 电气应用,2017,36(14):32-35.

[9] 田炳伟,高钏. 基于贝叶斯分类器的电力变压器设备故障诊断研究 [J]. 电子设计工程,2017,25(15):54-57+61.

[10] 梁浩波. 基于文本挖掘的用电客户诉求智能聚类研究 [J].广东电力,2016,29(8):45-50+66.


作者简介:

谢志炜(1984-),男,汉族,广东广州人,工程师,硕士,研究方向:配电网工程管理、配电网工程造价管理、配电网规划;

冯鸿怀(1981-),男,汉族,广东恩平人,信息系统项目管理师,研究方向:电力行业信息化、大数据分析;

通讯作者:

许锐埼(1995-),男,汉族,广东潮阳人,硕士研究生,研究方向:电力数据挖掘分析;

李慧夫(1994-),男,汉族,湖北咸宁人,硕士研究生,研究方向:电力数据挖掘分析。