摘 要:随着地理数据量的不断增大,传统的空间数据库已经无法满足实际应用的需要。为此,该文围绕矢量数据的Top-K 频繁关键字问题,设计了一个分布式空间数据库系统。主要内容为分布式矢量数据存储模型设计,基于Hilbert 排列码的矢量数据划分策略,分布式空间数据的索引结构以及索引算法设计。
关键词:分布式数据库;矢量数据;关键字查询
中图分类号:TP393.04 文献标识码:A 文章编号:2096-4706(2019)19-0007-05
Distributed Spatial Top-K Frequent Keyword Query System
YAO Yuan,XIAO Rui
(Harbin Institute of Technology,Harbin 150001,China)
Abstract:With the increasing amount of geographic data,the traditional spatial database has been unable to meet the needs of practical application. For this reason,this paper designs a distributed spatial database system around Top-K frequent keyword of vector data. The main contents are the design of distributed vector data storage model,vector data partition strategy based on Hilbert permutation code,index structure of distributed spatial data and index algorithm design.
Keywords:distributed database;vector data;keyword query
参考文献:
[1] 王金宝. 云计算系统中索引与查询处理技术研究 [D]. 哈尔滨:哈尔滨工业大学,2013.
[2] AHMED P,HASAN M,KASHYAP A,et al. EfficientComputation of Top-k Frequent Terms over Spatio-temporal Ranges [C]//Acm International Conference on Management of Data.New York,USA:ACM,2017.
[3] 李雷,李晓东,刘欣阳. 分布式网络中的一种高效top-k求解方法研究 [J]. 计算机工程与应用,2010,46(18):89-92.
[4] 余利峰. 面向分布式空间数据库的矢量数据存储与查询处理关键技术研究 [D]. 杭州:浙江大学,2018.
作者简介:姚远(1998.06-),男,汉族,黑龙江大庆人,就读于计算机学院,本科在读,主要研究方向:大数据科学。