当前位置>主页 > 期刊在线 > 信息技术 >

信息技术2018年10期

新闻自动分类和推荐系统研究与实现
管涛涛,宋万里,张锐捷
(南京晓庄学院,江苏 南京 211171)

摘  要:新闻系统如果不能有效的进行新闻分类和个性化推荐,势必会影响到用户的使用效率和使用兴趣。本文通过自然语言处理技术、文本分类技术、协同过滤算法等技术构建新闻自动分类和推荐系统,对发布的新闻内容进行分词处理以及分类训练,从而自动判断新闻的所属类别,如果用户对系统反馈的分类结果不满意,还可以手动的进行修改分类,以便后期不定时的对属性进行更新。再通过协同过滤算法计算出用户间的相似度,进一步计算出与被推荐用户相似度较高的用户,将该用户浏览过但被推荐用户未曾浏览的新闻推荐给用户进行查看。本文是以复旦大学李荣陆用于文本分类研究所使用的新闻语料库为基础,通过此库来进行文本分类准确性的测试。测试结果表明,本系统能够很好的服务于新闻用户,体现出新闻系统的个性化。


关键词:推荐算法;自动分类;协同过滤



中图分类号:TP393.09         文献标识码:A         文章编号:2096-4706(2018)10-0009-03


Study and Implementation of News Classification and Recommendation System
GUAN Taotao,SONG Wanli,ZHANG Ruijie
(Nanjing Xiaozhuang University,Nanjing 211171,China)

Abstract:If the news system can not effectively classify and personalize the news recommendation,it will inevitably affectthe user's use efficiency and interest. This paper constructs a news automatic classification and recommendation system by using naturallanguage processing technology,text classification technology,collaborative filtering algorithm and so on. It can automatically judge thecategory of the news,if the user is not satisfied with the classification results of the system feedback. Manually modify the classificationso that the attributes can be updated indefinite. The similarity between users is calculated by the collaborative filtering algorithm,and theusers with higher similarity are further calculated,and the user is viewed by the user who has not been browsed by the recommended user.This paper is based on the news corpus used by Li Ronglu of Fudan University in the Institute of Text Classification to test the accuracy oftext classification. The test results show that the system can serve the news users well,reflecting the personalization of the news system.

Keywords:recommended algorithm;automatic classification;collaborative filtering


参考文献:

[1] 马鹏飞. 一种个性化新闻推荐系统的设计与实现 [D]. 北京:北京邮电大学,2016.

[2] 姜天策. 基于用户兴趣的新闻个性化推荐系统的设计与实现 [D]. 长春:吉林大学,2009.

[3] 万小强. 短信自动分类系统的研究与实现 [D]. 上海:东华大学,2017.

[4] 刘佳. 基于互信息特征选择算法的文本自动分类研究 [D].淮南:安徽理工大学,2015.

[5] 闫超. 基于SVM 的中文文本自动分类系统的研究与实现 [D]. 太原:太原理工大学2010.

[6] 于黎冰. 从“今日头条”看个性化新闻推荐系统的优劣 [J].传媒,2016(19):44-45.

[7] 张敏. 个性化新闻推荐系统的设计与实现 [D]. 北京:北京交通大学,2017.

[8] 彭菲菲. 钱旭. 基于用户关注度的个性化新闻推荐系统 [J]. 计算机应用研究,2012,29(3):1005-1007.

[9] 熊李媛. 个性化新闻推荐系统的研究与设计 [D]. 重庆:重庆理工大学,2017.

[10] 刘金亮. 基于主题模型的个性化新闻推荐系统的研究与实现 [D]. 北京:北京邮电大学,2013.

[11] 王平. 基于协同过滤算法的新闻的个性化推送系统的设计与实现 [D]. 长沙:湖南大学,2016.

[12] 马鹏飞. 一种个性化新闻推荐系统的设计与实现 [D]. 北京:北京邮电大学.2016.

[13] 姜天策. 基于用户兴趣的新闻个性化推荐系统的设计与实现 [D]. 长春:吉林大学,2009.


作者简介:

管涛涛(1995-),男,安徽合肥人,学士,研究方向:智能教育技术、计算机软件。

宋万里(1981-),男,辽宁法库人,副教授,研究方向:智能教育技术、数据挖掘。