基于统计的中文关键短语自动抽取

来源 :江南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:emeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有效性。用各种方法过滤非法词串,综合短语位置和统计特征对候选短语进行权重计算,并依据关键短语分布规律选择关键短语。另外,通过分析关键短语分布特点为Ⅳ元短语在过滤、按比例选择方面提供了依据。获得了比较好的实验结果:TOP5精确率21.80%,召回率28.27%,F-measure25%;TOP10精确率17.10%,召回率44.50%,F-measure30.80%。
其他文献
R-蕴涵算子与半群的模糊理想相结合引入半群的R-模糊理想的定义,得到了当R(x,y)对变量x递减时,两个半群的R-模糊理想的交仍是半群的R-模糊理想,当R(xy,)对变量x递增时,两个半群的
针对目前驾校普遍存在的使用假指纹打卡作弊的行为,设计了一种新型的双重识别防作弊系统。该系统采用指纹识别与实时人脸认证相结合的技术进行身份验证,并可通过GSM网络向学员发出防作弊的警示信息。系统以三星S3C6410为核心处理器,基于嵌入式Linux开发环境,使用Qt进行界面(UI)设计。在实验室的人脸数据库上经过多次模拟测试,结果表明该系统稳定可靠,准确度较高,对驾校学习中的指纹造假作弊行为具有很好
“观点”栏目开设以来,来自民族工作第一线的各级干部职工,针对基层民族工作的实际,纷纷来稿,探讨当前民族工作问题,交流民族工作经验,这些来自实际工作中的第一手资料和观点,对我们从宏观上研究把握民族工作十分珍贵,为此,从本期开始,本刊除了继续刊登摘编专家的观点外,还将定期刊登摘编这类来自基层一线的工作文章。欢迎各位继续支持我们把这个栏目办好。  中共中央总书记胡锦涛同志在西柏坡考察时指出:“越是改革开
毛泽东与李达都是中国共产党第一次代表大会的代表。作为大会的主要组织者和主持者的李达与湖南党小组代表毛泽东在会上由相识到相知,并在以后的革命岁月中,逐步形成了互相信赖
给出AOR迭代与Jacobi迭代在广义相容次(q,p-q)矩阵下,(p,q)=(2,1)情形的迭代矩阵之间的一个等式。
去年2月24日,王连芳同志与世长辞,广大回族干部、群众处在哀痛中,我深深地产生了"重于泰山"之感.王老离开我们已经一年,回首与他相处的往事,他的敦敦教诲犹在耳边响起.
期刊
论述了确定Imax方向的最简便方法,即它的方向由Iyz的正负唯一确定.
1911年10月10日,革命党人在武昌首义成功,随即建立湖北军政府。消息传出,全国为之振奋,各省纷纷宣布脱离清政府的统治。十一月三日夜,贵州自治学社与新军宣布起义。面对全国风起云
研究了加法幂等除半环上一类特殊的上三角矩阵的广义逆。利用数学归纳法,给出此类特殊的上三角矩阵的元素间的关系。在此基础上,证明了此类特殊的上三角矩阵类中每一个矩阵都
提出一种新的自动校正方法,利用单片机把辐射和接触两种方法统一起来,通过接触测温法提供一个校正参数,并把此校正参数自动存入测温仪内,在进行辐射测温过程中,利用此校正参数,可以