【摘 要】
:
本文介绍了网上医药科研信息的抓取方法。为了高效地抓取网页内容,本系统采用带偏好的宽度优先遍历算法,将待访问的网址存放于高效的内存数据库Ber Keley DB中,用正则表达式抽取指定内容,用Java提供的PDFBox技术识别电子文件内容。以详实的代码深入浅出的介绍了实现过程,结果表明,本系统能有效方便地应用于医药科研信息的采集。
论文部分内容阅读
本文介绍了网上医药科研信息的抓取方法。为了高效地抓取网页内容,本系统采用带偏好的宽度优先遍历算法,将待访问的网址存放于高效的内存数据库Ber Keley DB中,用正则表达式抽取指定内容,用Java提供的PDFBox技术识别电子文件内容。以详实的代码深入浅出的介绍了实现过程,结果表明,本系统能有效方便地应用于医药科研信息的采集。
其他文献
为了提高计算机软件运行的安全性,本文从信息安全环境角度出发,对计算机软件的开发与实践展开深入探究。本文根据当前计算机软件运行存在的问题,分析了信息加密技术、量子加密技术的作用,选取动态密码技术,构建了一套高安全性的网上支付系统,主要用于智能手机与计算机之间的支付与接收。实践证明,本文构建地系统具有较高的安全性,支持长期安全运行。
针孔相机,这个词语不知道对大家陌生吗?我们先科普下啥叫针孔相机,其简单的工作原理是啥?来我们一起看下介绍:针孔照相机,也称照相暗箱,为照相机的原型,基本部分包括:(1)一个
信息隐藏是将秘密信息嵌入进另一载体里的过程。可逆信息隐藏则是在秘密信息提取之后仍然能够无失真的恢复原始载体的技术。本文提出了一种利用预测误差扩展的可逆信息隐藏算法。首先讲图像根据复杂度分块,然后将秘密信息按照复杂度由高到低的顺序嵌入。同时使用Arnold变换加密秘密信息,因此可以提供更高的安全性。
目的 检测肌肉细胞特异性泛素蛋白连接酶(E3)在癌性恶液质(CC)小鼠骨骼肌中的表达,探讨其在CC肌萎缩中作用机制.方法 将16只BALB/C小鼠随机分荷瘤组和对照组,用鼠结肠癌26细胞株(c26)接种小鼠,建立CC模型.监测小鼠营养状况、腓肠肌重量,实时定量聚合酶链反应(PCR)、Western blot和免疫组织化学法测定Atrogin-1、MuRF1基因在腓肠肌中的表达.结果 荷瘤组小鼠存在
例1男 ,53岁 ,因上腹饱胀不适18年 ,加重1月就诊。胃镜检查发现十二指肠球部可见许多芝麻大小的隆起。活检组织学检查为胃窦腺 ,HP染色阴性。诊断十二指肠球部异位胃粘膜(胃窦腺)。例2男
iBag的设计立足于日常生活中的背包负重问题,针对青少年背负过度的问题,兼容安全、时尚等因素开发出了一款有益脊柱健康,可有效保障人身安全的智能背包。
【摘 要】线损指电网经营企业在电能传输过程中所发生的全部电能损耗,是电力网综合电能损耗的统称,包括自然线损(电网在电能传送过程中不可避免的电能损耗)和管理线损(偷、漏、差错等造成的误差)。本文首先分析了电力系统中线损存在的原因,由此引出应该运用计量自动化线损管理系统,然后又深入探讨了计量自动化线损管理系统的工作原理及其功能。 【关键词】电力系统 计量自动化 线损管理 线损的统计与分析是线损管理
目的 构建含前强啡肽(PDP)基因的重组35型腺病毒载体(Ad5/F35).方法 以pUC57-PDP重组质粒为模板扩增PDP基因,将回收的聚合酶链反应(PCR)产物片段克隆入pDC316载体,获得重组质粒pDC316-PDP.骨架质粒pBHG-fiberS/35和穿梭质粒pDC316-PDP共转染293细胞,同源重组产生Ad5/F35-PDP.经PCR鉴定目的 基因的表达.结果 PCR表明Ad5