摘 要:信息技术的发展使我们进入了大数据时代,海量、异构的大数据挖掘给我们提出了新的挑战。但是,发展大数据并不应该以“更大、更多、更快”为终极目标,而应该走成本合理、惠及大众、公正法治的发展道路。也就是说我们不应完全否认抽样估计的作用,相反的,树立传统的抽样理念并合理应用抽样技术才是大数据挖掘的精髓。
关键词:大数据挖掘;抽样数据;抽样估计
中图分类号:TP311.13 文献标识码:A 文章编号:2096-4706(2019)21-0076-03
Application of Sampling Estimation in Big Data Mining
LIU Yixuan
(Inner Mongolia Electronic Information Vocational Technical College,Hohhot 010070,China)
Abstract:The development of information technology has brought us into the era of big data. Massive and heterogeneous data mining has brought us new challenges. However,the ultimate goal of big data development should not be “bigger,more and faster”,but should take the development path of reasonable cost,benefit the public and just rule of law. That is to say,we should not totally deny the role of sampling estimation. On the contrary,the essence of big data mining is to establish the traditional sampling concept and apply sampling technology reasonably.
Keywords:big data mining;sampling data;sampling estimation
参考文献:
[1] 李金昌. 关于统计数据的几点认识 [J]. 统计研究,2017,34(11):3-14.
[2] 周英,卓金武,卞月青. 大数据挖掘系统方法与实例分析 [M]. 北京:机械工业出版社2016.
[3] 高扬. 数据科学家养成手册 [M]. 北京:电子工业出版社,2017.
[4] 欧阳秋梅,吴超. 从大数据和小数据中挖掘安全规律的方法比较 [J]. 中国安全科学学报,2016,26(7):1-6.
[5] 李毅,米子川. 大数据挖掘的均匀抽样设计及数值分析 [J].统计与信息论坛,2015,30(4):3-6.
[6] 城市数据团. 数据不说谎:大数据之下的世界 [M]. 北京:清华大学出版社,2017.
[7] 黎敏讷. 分布式数据分层抽样技术及其在目标检测领域的应用研究 [D]. 长沙:国防科学技术大学,2017.
作者简介:刘逸萱(1981-),女,汉族,内蒙古呼和浩特人,就职于电子商务学院,讲师,硕士,研究方向:应用统计。