当前位置>主页 > 期刊在线 > 信息化应用 >

信息化应用22年7期

基于文本挖掘的互联网企业岗位对比研究
袁莉
(北京邮电大学,北京 100876)

摘  要:2022 年,高校毕业生人数首次突破 1 000 万人,求职人数呈逐年递增的趋势,另一方面,疫情当下就业市场需求缩紧,互联网企业掀起裁员浪潮。文章通过网络爬虫获取近 17 000 条互联网企业招聘数据,运用 K-means 进行文本聚类,分别得出职位描述、职位要求等六个维度的数据,对比分析互联网企业的人才需求特点,解答入局互联网适宜选择什么岗位、不同岗位对求职者的要求有何区别、校招要求和社招要求有哪些不同这三个重要问题,为求职者高质量就业提供决策指导。


关键词:文本挖掘;K-means 聚类;职位要求;高质量就业



DOI:10.19850/j.cnki.2096-4706.2022.07.027


中图分类号:TP391                                         文献标识码:A                                     文章编号:2096-4706(2022)07-0112-05


Comparative Study of Internet Enterprise Jobs Based on Text Mining

YUAN Li

(Beijing University of Posts and Telecommunications, Beijing 100876, China)

Abstract: In 2022, the number of college graduates will exceed 10 million for the first time, and the number of job seekers shows an increasing trend year by year. On the other hand, demand in the job market is tightening at the moment of the epidemic, and the Internet enterprises set off a wave of layoffs. This paper uses web crawlers to obtain nearly 17 000 recruitment data of Internet enterprises, uses K-means to cluster text, obtains six dimensions of data such as job description and job requirements, compares and analyzes the characteristics of talent demand of Internet enterprises, and answers three important questions: what jobs are suitable for entering the Internet, what are the requirements of different jobs for job seekers, and what are the differences between school recruitment requirements and social recruitment requirements, which provides decision-making basis for high-quality employment of job seekers.

Keywords: text mining; K-means clustering; job requirement; high-quality employment


参考文献:

[1] 李涛,孙煖,邬志辉 .2021 年疫情背景下中国高校应届毕业生就业状况有何变化?——一项基于 2021 年和 2020 年全国调查数据的实证研究 [J]. 华东师范大学学报(教育科学版),2022,40(2):100-113.

[2] 张云涛,陈晨.后疫情时代大学生就业挑战与应对之策——以法学专业为例 [J]. 教育与职业,2021(16):110-112.

[3] 恒姗姗 . 后疫情时代高校毕业生“慢就业”现象分析及对策建议 [J]. 国际公关,2021(8):58-60.

[4] 王伟 . 就业市场对金融科技人才的需求——基于 2448 条招聘广告的文本分析 [J]. 财会月刊,2021(18):110-115.

[5] 刘崇瑞,王洪杰,王聪,等 . 就业市场对网络安全人才的需求分析——基于企业招聘广告的内容分析 [J]. 科技管理研究,2020,40(3):182-187.

[6] 石凤贵.基于TF-IDF中文文本分类实现 [J].现代计算机,2020(6):51-54+75.

[7] 王根生,黄学坚 . 基于 Word2vec 和改进型 TF-IDF 的卷积神经网络文本分类模型 [J]. 小型微型计算机系统,2019,40(5):1120-1126.


作者简介:袁莉(1997—),女,汉族,安徽六安人,硕士研究生在读,研究方向:信息管理与信息系统。