【摘 要】
:
针对Web社区的真实性和有效性的自动评估的关键技术开展研究,在社区发现技术的基础之上,结合了信息检索技术以及语义信息,深入研究了社区主题词提取的方法。根据网页的DOM信
【机 构】
:
中国人民大学信息学院 北京 100872
【出 处】
:
全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会
论文部分内容阅读
针对Web社区的真实性和有效性的自动评估的关键技术开展研究,在社区发现技术的基础之上,结合了信息检索技术以及语义信息,深入研究了社区主题词提取的方法。根据网页的DOM信息对页面进行处理与过滤,去除导航块、广告块;然后提取网页内的文本信息,取其词根,进行词频统计;接着根据TD*IPF公式,对网页集里的多个页面的主题词进行提取;最后还利用WordNet词典进行对词间语义关系的相关扩展.根据实验结果的分析表明,算法是可行的和有效的.
其他文献
SOA源于早期的基于构件的分布式计算方式,目前已经被多数企业广泛认可.在SOA的实施过程中,对于系统设计者来讲,服务的设计是一个非常重要的问题。文章在研究SOA理论的基础上,
探讨了大规模Deep Web数据自动化集成框架,指出实现该框架的难点所在,然后针对电子商务领域的一些中小规模的数据集成需求,提出了一种改进的集成方案并分析了其合理性。
在网格资源调度算法的研究中,正确估计某个任务在某个资源上的执行时间是个很重要的课题。网格环境中的资源充满着不确定性,一方面其硬件配置情况各异,CPU利用率、网络的负载
为了使移动OLAP系统能够访问异构教据源并提供给移动用户一个统一的视图,本文给出了一个具体的OLAP系统SwiftOLAP的实现框架并对其中基于语义对象的语义层进行了详细设计.语
本文在领域问题求解工作流管理的基拙上,提出了一种基于多Agent的复合模型求解工作流协同控制结构,分析了工作流协同器和基于MAS的协同工作环境。最后,以复合模型协作求解的工作
为了提高诊断系统的效率和准确性,使农民用户可以使用诊断系统对植物病虫害进行快速诊断,把本体引入到植物病虫害诊断系统中。本体是组织领城知识的知识系统,时领城知识提供了清
在信息集成以及知识共享领城,为了解决本体之间存在的异构性问题,本文针对元素级的本体映封提出了一种优化的映射方法。此方法基于语义字典WordNet,通过计算最短语义距离(Shorte
传统的基于UDDI的Web服务发现仅提供基于关键字的搜索方式,缺乏语义推理的支持,因此采用一种基于OWL-S/UDDI的语义Web发现机制,在传统的UDDI之外建立一个用于将Web服务的语义
黄秋生一直是香港电影圈一个特殊的存在,不论形象还是性格。他是香港长大的混血儿,从小的偶像却是毛泽东:他显得霸气个性十足,却坦诚自己“最随波逐流”:他对电影几乎来者不拒,却大声批评别人的“烂片”;他认真学过戏剧理论,却鲜有代表作品;他对社会怪相大声嘲讽,却很能接受社会和圈子的规矩。 “闹翻”2013年香港金像奖 当曾志伟宣布2013年第32届香港电影金像奖,最佳男主角颁奖嘉宾是黄秋生和叶德娴,现
本文对HITS算法及其改进算法进行分析.针对HITS算法及其改进算法的不足,提出一种新颖的计算语义相似度的方法——利用WordNet计算文本的语义相似度,并将其引入链接权重矩阵中