摘 要:针对大数据背景下数据的海量性、异构性、多样性等特点,对大数据专业开设的“数据采集与搜索”课程产 生了非常大的影响。因此该课程不管是教学内容还是教学方法都需要紧紧跟随大数据时代特性进行更新和调整。文章对这两方面进行了教学探索,提出了需要增加和强化 Flume 数据采集框架、Kafka 消息队列、Easticsearch 数据搜索引擎以及Python 爬虫技术等教学内容,同时也进一步探讨了实践式教学、反馈式教学、个性化教学等教学方式,以能够适应大数据专业的教学需求。
关键词:数据采集;Flume;Kafka;Elasticsearch;Python 爬虫;教学方法
DOI:10.19850/j.cnki.2096-4706.2021.05.034
中图分类号:TP311;G434 文献标识码:A 文章编号:2096-4706(2021)05-0138-03
Teaching Exploration of “Data Acquisition and Search” Course for Big Data Major
JIANG Liang,TANG Zijun
(Hunan College of Information,Changsha 410200,China)
Abstract:In view of the characteristics of data mass,heterogeneity and diversity under the background of big data,it has a great influence on the course of “Data Acquisition and Search” offered by big data specialty. Therefore,both the teaching content and teaching methods of the course need to be updated and adjusted closely with the characteristics of the era of big data. The article has carried on the teaching exploration to these two aspects,proposes the need to increase and strengthen Flume data acquisition framework,Kafka message queue,Easticsearch data search engine,Python crawler technology and other teaching content,and further discusses practical teaching,feedback teaching,personalized teaching and other teaching methods,in order to meet the teaching needs of big data major.
Keywords:data acquisition;Flume;Kafka;Elasticsearch;Python crawler;teaching method
参考文献:
[1] 姜晓兵 . 基于大数据思维的经济管理类专业应用统计课程 教学探索 [J]. 高教学刊 .2020(12):94-97
[2] 胡夕 .Apache Kafka 实战 [M]. 北京:电子工业出版社, 2018.
[3] 冯霞 . 基高职院校大数据方向数据库课程体系及教学 模式的改革与探索 [J]. 电脑知识与技术 .2021,17(9):101- 102+112.
[4] 王勇,张跃 .Kafka 与 HBase 在健康监测大数据平台中的 应用研究 [J]. 软件导刊 .2021,20(4):188-193
[5] 马智勤,廖雪花,邓威,等 . 基于分布式 ElasticSearch 相似内容比对算法研究 [J]. 计算机与数字工程 .2020,48(12): 2843-2849.
作者简介:蒋亮(1988—),男,汉族,湖南邵阳人,助教, 硕士研究生,研究方向:数据挖掘、人工智能、大数据技术、机器 视觉等;唐紫珺(1993—),女,汉族,湖南永州人,助教,硕士 研究生,研究方向:生物信息学算法,大数据分析。