主题提取及其关键算法研究

来源 :第二届全国Web信息系统及其应用会议(WISA2005) | 被引量 : 0次 | 上传用户:bostangul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前搜索引擎存在着信息过载及主题漂移的问题.主题提取是寻找与用户查询相匹配的高质量文档的过程,可以有效地解决上述问题,它也是目前Web检索领域的热点问题之一.本文通过综合利用网页的各种有用特征如页面文档内容、文档结构信息、锚文本以及链接信息等来改善Web检索的查准率,从而满足用户对高质量文档的需求.实验证明这种方法有助于改善主题提取的质量,提高用户信息检索的效率.
其他文献
本文对宝钢4号高炉EIC自动化控制系统的系统集成技术进行了介绍。宝钢分公司4号高炉EIC综合自动化控制系统通过表示集成、控制集成、环境集成和数据集成等系统集成技术,有效地解决了前后工序计算机系统间、上下层计算机系统间、主工艺控制系统和独立子系统间及各专业应用系统间的系统集成难点,使这个新上的系统成功地无缝融入到宝钢企业的CIMS系统的多层架构和全厂钢铁生产的生产链的全流程中。
09CuPTiRE耐大气腐蚀钢中合金元素的存在状态对钢板组织和性能有着重要的影响,尤其是对钢板的强度和低温冲击韧性影响更大.通过透射电子显微镜和扫描电子显微镜,对09CuPTiRE耐大气腐蚀钢板中析出物的形貌、大小、分布特征及形成机理进行了分析研究.结果表明,该钢板的析出物主要是钛化物,析出顺序为:TiN,TiS,Ti4C2S2,AlN;铜主要以固溶方式存在且在晶界处有少量偏聚;冶炼时不同的脱氧方
为了满足用户对薄板带钢尺寸精度和力学性能的日益严格的要求,迫切需要应用计算机数值模拟技术来模拟薄板带钢的连轧过程、预测最终产品的力学性能、获得优化的热轧工艺参数.文章研究了薄板连轧精轧过程中的变形、热交换和精轧过程中的组织演变,以及加工后板材的组织与力学性能之间的对应关系等内容.对薄板多道次热精轧过程宏观层次的有限元模拟、微观层次的组织预报、亚观层次的MonteCarlo模拟方法等进行了深入研究.
2001年以来,6号高炉每次更换风口均有液态铅从风口砖缝流出,此期间高炉还伴生炉底砖衬上涨和风口上翘现象.针对铅在高炉内的渗透行为,笔者进行了系统地研究,做了实验室条件下K,Na,Zn,Pb对未使用新复合棕刚玉砖的模拟渗透试验,以及对高炉风口组合砖样的电镜扫描分析,提出了新的渗透机理:认为铅很难通过砖衬的原始气孔进行渗透,主要是通过高炉内各种缝隙进行渗透,特别是炉壳与砖衬的间隙进行渗透.高炉炉役末
本文提出了一种基于动态分枝法的NativeXML文档存储机制.该机制利用XML数据内部逻辑关联树型结构,通过动态分枝算法拆分出子树,按照一定的页面分配策略和元素数据映像机制对包括异构和混排非结构化在内的XML数据进行保真存储,并采用动态合成法进行文档恢复,支持数据共享、多种索引策略和多种复杂路径表达式的高性能查询.
介绍了OWL-S的概念、服务本体及其3个组成部分.并分析了OWL-S和WSDL之间的关系,讨论了使用OWL-S后的Web服务体系结构.
随着Web应用迅速发展,Web攻击成为网络攻击的一个主要方面.入侵检测系统对Web攻击的检测能力也成为入侵检测系统能力测试中的一个重要方面.当前的测试方法中,主要采用搜集实际的攻击工具来进行入侵检测系统的测试,该方法受搜集能力的限制,相应测试平台复杂,并且测试中攻击的速度也无法满足目前网络带宽的需要.针对当前Web攻击测试中的不足,以攻击特征为基础构造攻击报文,以分层构造的方式对攻击进行变形,设计
电子政务应在统一的技术和管理框架下发展,实现模块化、标准化、通用化,以空间信息和GIS技术为基础和手段,通过GIS整合电子政务条线业务数据,通过GIS与OA、MIS、DSS的应用集成整合政府业务流程、整合政府应用管理系统,并以GIS为可视化交互界面,实现电子政务系统的日常办公、统计分析与决策.并遵循层次结构,从网络通信层、数据资源层、应用支撑层、应用服务层以及标准与安全支撑环境五个方面构建IGS应
知识管理在许多领域中起着举足轻重的作用,但现有知识管理存在各种缺点.语义网的出现,为改善知识管理系统提供了一个机会.本文对基于语义网的知识管理体系结构做出探讨、研究,并以On-To-knowledge(OTK)工具集为例,说明语义网技术在知识管理中的运用,最后,在其基础上提出一些改进方向.
本体相似性计算是语义查询、语义映射等语义网应用的基础.本文讨论了基于树状层次本体概念图和基于知网的"概念-义原"结构的两类本体相似度计算方法,并通过实例进行了验证和分析.