当前位置>主页 > 期刊在线 > 信息技术 >

信息技术2019年7期

文本表示模型在文本挖掘中的应用
骆梅柳
(江苏财会职业学院 信息系,江苏 连云港 222061)

摘  要:文本表示是自然语言处理中的基础任务,以向量空间模型的文本表示模型在文本挖掘、信息检索领域得到了广泛的应用,本文列举现有的文本表示模型,通过对比,归纳总结每个文本表示模型的特点,文本表示的好坏会在很大程度上影响到整个文本分类任务的性能,深入了解文本表示模型,为后继文本分类打好基础。


关键词:文本表示;文本挖掘;向量空间



中图分类号:TP391.1        文献标识码:A        文章编号:2096-4706(2019)07-0024-02


Application of Text Representation Model in Text Mining

LUO Meiliu

(Department of Information,Jiangsu Vocational College of Finance and Accounting,Lianyungang 222061,China)

Abstract:Text representation is the basic task in natural language processing. The text representation model of vector space model has been widely used in text mining and information retrieval. This paper lists the existing text representation models,and summarizes each text representation through comparison. The characteristics of the model,the quality of the text representation can greatly affect the performance of the entire text classification task,and a deep understanding of the text representation model to lay a good foundation for subsequent text classification.

Keywords:text representation;text mining;vector space


参考文献:

[1] 廖涛,刘宗田,王先传. 基于事件的文本表示方法研究 [J].计算机科学,2012,39(12):188-191.

[2] 廖涛. 面向事件的文本表示及其应用研究 [D]. 上海:上海大学,2014.

[3] 刘小荣. 基于聚类分析的图模型文本分类 [D]. 内蒙古:内蒙古师范大学,2011.

[4] 李纲,毛进. 文本图表示模型及其在文本挖掘中的应用 [J].情报学报,2013,32(12):1257-1264.


作者简介:骆梅柳(1982-),女,汉族,江苏连云港人,讲 师,研究方向:大数据技术、复杂网络。