【摘 要】
:
为在海量数据中快速定位所需信息,解决因数据结构化、半结构化差异造成的检索困难,该文提出了一种基于Lucene的全文检索架构。根据分布式并行计算的设计原理,将检索任务分发
【机 构】
:
南京理工大学计算机科学与工程学院,南京信息技术研究院计算技术研究所
【基金项目】
:
国家自然科学基金(61272419);江苏省未来网络前瞻性研究项目(BY2013095-3-02);江苏省产学研前瞻性项目(BY2014089;BY2013039;BY2013037);连云港国际合作项目(CH1304)
论文部分内容阅读
为在海量数据中快速定位所需信息,解决因数据结构化、半结构化差异造成的检索困难,该文提出了一种基于Lucene的全文检索架构。根据分布式并行计算的设计原理,将检索任务分发给每个子节点服务器并行完成检索工作,最终由根节点服务器汇总结果。子节点服务器也采用了并行化的设计理念。验证性实验显示该文基于Lucene的全文检索架构与传统全文检索架构相比检索耗时降低55%以上。
其他文献
提出了一种快速而有效的超宽带太赫兹圆锥介质棒天线的设计方法,并给出了天线尺寸的设计公式。应用几何光学理论分析天线中波的传输,并应用工作模设计天线。天线内的工作模为基
近年来,云南省中药产业专利申请量持续增加,产业创新能力有所提高;部分重点发展的药用植物医药专利申请优势明显,但还存在着专利申请总量少、新药研发少、技术转化能力不强等问题
<正>笔者自2010年临床实习观察,采用龙胆泻肝汤治疗带状疱疹27例,取得满意疗效,现报道如下。一般资料27例门诊就诊病人,其中年龄最大者82岁,最小者24岁,平均53岁;病程长短不
横纹肌溶解症是他汀类药物最严重的不良反应,可诱发急性肾功能衰竭及多脏功能衰竭,严重者可导致死亡。近期收治1例阿托伐他汀致横纹肌溶解症,在常规治疗基础上,结合中药芍药
互联网时代,自媒体的营销传播模式受到了极大青睐。微信营销成为了一种新型的商业模式,并越来越广泛地被人们接受。由于微信营销还处于发展初期,也存在一些弊端和不足。
在实体法与程序法趋于完善的今天,法律规制与社会现实仍存在着不可避免而又无法忽视的矛盾。就涉仿真枪而言,在目前是需要司法机关和法学学者花费心思去解决的现实问题。法条
<正> 芍药甘草汤系《伤寒论》太阳篇为误汗伤及阴血所致“脚挛急不伸”而设的复阴之方。方中芍药酸苦,甘草甘平,二药合用,酸肝化阴,既具柔肝益脾养血之功,又有缓急舒挛止痛之
建筑设备监控系统从原3C(Computer计算机、Communication通信、Control控制)到新3C(Centralization监控集中、Concentration数据集合、Compositive应用集成)的变化历程,凝聚
<正>Sensorex生产的S420系列pH/ORP探头可以直接替换现有的游泳池、工业、市政以及饮用水中的Strantrol?pH与ORP探头。该系列采用经久耐用的CPVC材料制造而成,具有显著的耐化
针对小电流接地系统发生单相接地故障时,故障识别可靠性低,灵敏度差等问题,提出一种差动式拓扑结构,研究其故障选线的原理及方法.该方法通过引入补偿支路,实现补偿支路前后零