基于规范文本的特征词提取技术研究

来源 :科技创新与生产力 | 被引量 : 0次 | 上传用户:woaixuyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本特征词提取是一种提炼文本重要信息的实用技术,同时也为文本聚类、自动分类、信息抽取等相关课题提供了技术支持。在规范文本上,利用文本篇章结构的特征,以此为基础设计了一个特征词的加权函数,综合考虑了词频、词长和位置因子,并对比分析了各种位置因子对系统的贡献度。
其他文献
陶岔枢纽是南水北调中线工程的渠首和取水枢纽,为满足调水需要,必须将已建初期工程加高扩建。加高扩建枢纽建筑物的布置自左至右为左岸非溢流坝段、进水闸坝段、连接坝段、预留
12月11日,AIPPI中国分会版权热点论坛(2016年度)在北京隆重举行。百余名国内各界版权相关从业人士齐聚一堂,就版权领域热点、难点问题展开研讨。据悉,这是AIPPI中国分会版权专
嘉陵江为长江主要支流之一,与长江交汇于重庆市市区,是影响重庆市的洪水的主要来源之一.重庆市市区及嘉陵江下游河段防洪工程措施,除两岸和城区护岸工程及局部地段的防洪堤(
增强责任感和紧迫感,争做产业结构调整和经济发展方式转变的推动者。2010年太原市围绕三大基地和八大功能区的建设,大力开展以促进结构调整、成果惠及民生和创新能力建设三大
"非公益必要不干扰原则"注意到消费者利益的重要性,但在一定程度上模糊了"公益"的界限,并且对消费者利益保护的构建设有清晰的界定。本文从消费者利益保护角度出发,论述了网络经