Web主题信息采集中信息主题的识别

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:syhrgl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要介绍了我们设计的Web主题信息采集系统的一项核心工作--Web信息主题的识别,主题识别算法从构造专业性较强的主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别.
其他文献
当今世界正处在“全球化”发展的重要阶段,各国经济全面发展,跨国合作、交流也日益增多,在经济合作不断加强的同时,国家与国家之间的文化也正在相互磨合、交融。随着我国对外
自21世纪10年代中期,“中国制造”在玩具、轮胎、牙膏等行业出现了危机事件,它便成为西方媒体中“危险品”的代名词。国外媒体肆意渲染“中国制造”存在严重质量问题,引发了
随着现代社会的发展及各国在政治、经济、科技、贸易、商业、文化等领域的交流日益增强,法律翻译也变得越来越重要。每个人的活动都必须在法律的框架内,那么任何一项涉外的活
人文社科翻译在整个翻译研究与实践领域扮演了重要的角色,随着中国当代翻译事业的发展,人文社科翻译的影响与作用也日益增大。人文社科翻译的选题是偶然性的,还是体现着一定