摘 要:医疗卫生信息对于人们了解、获取医疗资源十分重要,其准确性和实时性则尤其重要。为了方便准确而快速地检索到医疗卫生信息,需要建设一个和医疗卫生信息相关的专题搜索网站。针对上述情况,首先设计基于主题的网络爬虫功能,然后采用MS SQL Server 2008 作为数据存储、Visual Studio.NET2010 作为开发工具实现专题搜索网站及其网络爬虫的设计。经过实际测试与运行表明,该系统能够满足基本的医疗信息专题搜索的要求。
中图分类号:TP311.1 文献标识码:A 文章编号:2096-4706(2019)10-0023-03
Research and Design of Web Crawler for Medical Information
FENG Sidu,YANG Jianye,HAN Xu
(School of Medicine Information of Xuzhou Medical College,Xuzhou 221004,China)
Abstract:The medical and health information is very important for people to understand and obtain medical resources,and its accuracy and real-time are particularly important. In order to retrieve medical and health information quickly and conveniently,a special search website related to medical and health information is needed. In view of the above situation,a search website with its web crawler of subject topic were designed,and then using MS SQL Server 2008 as DBMS and Visual Studio.NET 2010 as development tools develop these. Test and operation showed that the system meets the requirements of basic medical information subject search.
Keywords:search engine;web crawler;medical and health information;special subject website
[1] 唐志,王成良. 遗传算法在主题Web 信息采集中的应用研究 [J]. 计算机科学,2006(7):71-74.
[2] 王继成,萧嵘,孙正兴,等.Web 信息检索研究进展 [J].计算机研究与发展,2001(2):187-193.
[3] 左楠. 个性化搜索引擎的设计与实现 [D]. 石家庄:河北科技大学,2013.
[4] 张博,蔡皖东. 面向主题的网络蜘蛛技术研究及系统实现[J]. 微电子学与计算机,2009,26(5):52-55.
[5] 印鉴,陈忆群,张钢. 搜索引擎技术研究与发展 [J]. 计算机工程,2005(14):54-56+104.
[6] 刘金红,陆余良. 主题网络爬虫研究综述 [J]. 计算机应用图3 网页的数据库索引(部分数据)研究,2007(10):26-29+47.
[7] 周立柱,林玲. 聚焦爬虫技术研究综述 [J]. 计算机应用,2005(9):1965-1969.
[8] 王彦博,樊营,高潜. 大数据时代网络爬虫技术在商业银行中的应用 [J]. 银行家,2016(6):114-116.
[9] 张晶,肖智斌,容会,等. 改进型遗传算法在网络蜘蛛上的应用 [J]. 山东大学学报(理学版),2015,50(5):1-6.
[10] 罗刚,王振东. 自己动手写网络爬虫 [M]. 北京:清华大学出版社,2010.