基于网络爬虫技术的健康医疗大数据采集整理系统

来源 :山东大学学报(医学版) | 被引量 : 0次 | 上传用户:IceMilo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的快速、准确地获得公共卫生服务系统的医疗数据,并进行数据整理,为建立人群健康风险评估模型提供数据基础。方法运用聚焦网络爬虫技术,设计算法并编程,在自动记录和修正URL异常、原始数据存档、保持登录方式3个方面进行算法改进。将设计好的爬虫应用于爬取已获得授权网站的医疗数据,通过医学数据库系统,对数据进行解析、整理与导出。结果获得多个公共卫生服务基地数据,为当地政府部门提供数据分析报告,利用整理分析的数据完成多项健康风险评估模型建立。结论基于网络爬虫技术建立的数据采集整理系统,可以解决获取及整理网络许可数据的难题,将此技术应用于医药卫生领域,可使现有丰富的医学数据资源得以充分利用并提高利用效率。
其他文献
随着经济的发展和社会的进步,为人类提供的系统越来越庞大、越来越复杂,这些庞大而复杂的系统能否在规定的条件下、规定的时间内完成规定的功能与其具备的可靠性水平密切相关。
美国在相对很短的时期内有了自己不同于欧洲先民的有美国特色的文化本系,原因是多方面的。这其中,北美大陆有自己独特的自然环境,对文化的形成与发展产生了重要的影响;而另一方面
研究背景非酒精性脂肪性肝病(Non-alcoholic fatty liver disease,NAFLD)是一种以肝细胞脂肪变性和肝内脂肪蓄积为病理特征,但无过量饮酒史的临床综合征。包括非酒精性单纯性
从云南森林害虫中采集到多种自然罹病虫体,经分离鉴定,发现6种昆虫病毒,即西昌杂毛虫 NPV、昆明小毛虫 NPV,栎毒蛾 NPVC,南华松叶蜂NPV,油杉吉松叶蜂 GV,铆扇舟蛾 GV。
成人高等教育对我国基础教育教师职后发展做出了巨大的贡献,但在转型背景下面临着培养出来的人才不能迎合社会需求,发展方向不明等问题。基于核心素养的课程文化自觉,不仅能
记述了中国臭蚁属昆虫5种,其中描述1新种。研究了在中国记载的种和变种,提出4个新异名,提供了种的测量、描述、插图和分布,编制了工蚁分种检索表。模式标本保存于西南林学院森保系昆
随着经济全球化趋势的不断发展,我国经济正在融入国际经济大家庭.物流产业作为国民经济中一个新兴的服务部门,正在全球范围内迅速发展.对于我国企业来说,这种趋势既蕴藏着机
本文通过对昆明地区云南松林内旱季小气候要素(气温、地温、最高温度、最低温度、相对湿度、风速和土壤含水率)与林内五种可燃物(枯枝落叶、腐殖质、活地被物、下木和林冠枝
随着科技的飞速进步,人们跨地区的社会交往日趋频繁,社会经济的不断发展更为国际间与区域间的商务往来奠定了强大的物质基础,城市商务酒店便孕育而生。近年来,诸多国际知名品
基于热力学和材料力学,分析了在盐冻循环、钢筋锈蚀与弯曲荷载协同作用下钢筋混凝土梁试样内部的热应力和机械应力分布及其损伤演变的规律,导出了钢筋混凝土在循环变温过程中