当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年12期

基于网络爬虫技术的大数据采集系统设计
阎泽群
(中国长江三峡集团有限公司 中国三峡出版传媒公司,北京 100038)

摘  要:在电力企业运营大数据环境中,企业财务数据在公司审计工作中发挥着重要作用。财务数据是企业进行有效财务审计的基础,因此,确保企业财务数据的完整性、有效性和准确性,是财务管理工作的关键。文章基于企业财务审计工作的特点,利用网络爬虫技术,提出了企业大数据采集系统的设计方案。该系统的设计从数据获取角度出发,从互联网中获取有效数据,完成数据整合清洗,帮助企业在审计工作中及时发现漏洞,防止出现财务风险等问题。


关键词:财务审计;大数据;爬虫技术;数据采集



DOI:10.19850/j.cnki.2096-4706.2021.12.022


中图分类号:TP311                                      文献标识码:A                                       文章编号:2096-4706(2021)12-0083-04


Design of Big Data Acquisition System Based on Web Crawler Technology

YAN Zequn

(China Three Gorges Publishing Media Company, China Three Gorges Corporation, Beijing 100038, China)

Abstract: In the big data environment of power enterprise operation, enterprise financial data plays an important role in company audit. Financial data is the basis for enterprises realizing effective financial audit. Therefore, ensuring the integrity, effectiveness and accuracy of enterprise financial data is the key to financial management. Based on the characteristics of enterprise financial audit, this paper puts forward the design scheme of enterprise big data acquisition system by using web crawler technology. From the perspective of data acquisition, the system is designed to obtain effective data from the internet, completes data integration and cleaning, helps enterprises find loopholes in time in audit work, and prevents financial risks and other problems.

Keywords: financial audit; big data; crawler technology; data acquisition


参考文献:

[1] 肖新凤,张绛丽,邓祖民 . 基于 Python 的爬虫技术的网 站设计与实现 [J]. 现代信息科技,2020,4(14):73-75+78.

[2] 赵北庚 . 基于 Flask 与爬虫技术的可视化深度学习数据标 注系统 [J]. 电子制作,2020(20):36-37.

[3] 钟机灵 . 基于 Python 网络爬虫技术的数据采集系统研究 [J]. 信息通信,2020(4):96-98.

[4] 张泽吾 . 大数据法律保护模式的比较分析——以全国首例 利用网络爬虫技术非法获取计算机信息系统数据案为例 [J]. 法制与 经济,2020(3):5-6.

[5] 宋小满,黄鑫,王怀相 . 基于 ASP.NET 网络爬虫技术的公 路货运价格数据采集方法研究 [J]. 铁道货运,2018,36(12):54-58.

[6] 刘贵平,刘娜,段红义 . 基于聚焦网络爬虫技术的人才招 聘数据采集 [J]. 电脑编程技巧与维护,2018(5):69-70+75.

[7] 卞伟玮,王永超,崔立真,等 . 基于网络爬虫技术的健康 医疗大数据采集整理系统 [J]. 山东大学学报(医学版),2017,55 (6):47-55.

[8] 张明杰 . 基于网络爬虫技术的舆情数据采集系统设计与实 现 [J]. 现代计算机(专业版),2015(18):72-75.


作者简介:阎泽群(1989—),女,汉族,山东淄博人,助理 专业师Ⅱ级,硕士研究生,研究方向:多媒体应用系统类交互式界 面设计与实施。