【摘 要】
:
为了从中文组块中提取出核心词,结合组块核心词识别的3个有效因素,包括词语相似度信息、位置信息和词性信息,提出了一种基于TextRank的无监督的组块核心词提取方法.该方法分
【机 构】
:
昆明理工大学信息工程与自动化学院 昆明650500
论文部分内容阅读
为了从中文组块中提取出核心词,结合组块核心词识别的3个有效因素,包括词语相似度信息、位置信息和词性信息,提出了一种基于TextRank的无监督的组块核心词提取方法.该方法分别给3个有效因素分配权值,从而改进TextRank关键词提取方法;然后递归地计算图中的概率转移矩阵,并且求出组块中每个词对应的重要度的值;最后把最高的重要度值对应的词语作为最终的核心词.在宾州中文树库(CTB8.0)中采集的8 126个组块数据上进行了人工标记和实验.在实验中,对传统经典算法和所提方法进行了比较,结果表明同时考虑3个有效因素的方法稳定性好,总体识别率最高.所提方法对组块核心词的提取效果好,验证了模型的有效性.
其他文献
随着城轨列车的快速发展,列车自动驾驶模式(ATO)逐步取代人工驾驶模式.城轨列车在ATO模式下的停车精度直接决定了列车能否安全、可靠、准时运行.通过对列车停车阶段进行分析,
目的是从经颅超声刺激实验中记录到的复杂大鼠后腿收缩张力信号中自动检测由刺激诱发的响应信号.该算法先是应用小波变换的多分辨特征实现慢收缩和快收缩张力信号的分离和消
通过对比在现场可编程逻辑门阵列(FPGA)实现传输控制协议(TCP)和用户数据报协议(UDP)的优缺点,针对UDP传输过程中容易出现故障的现象提出了一种网络故障的排除方法.将TCP的网
摄像机作为工业机器人的眼睛,相机的标定技术成为机器视觉的重要前提.在分析摄像机成像原理和标定原理的基础上,建立摄像机成像模型,使用基于MATLAB标定和基于视觉软件HALCON
传统基于射频识别的LANDMARC室内定位算法容易受到待测目标位置变化影响,存在定位精度不高、系统稳定性差的问题。为此提出自适应递归校正的LANDMARC室内定位优化算法。该算法通过根据目标标签的位置自适应选取k个相邻参考标签对目标标签位置进行定位,并对定位结果进行递归校正的方式对传统LANDMARC室内定位算法进行优化,以提高系统定位精度,增强系统稳定性。实验结果表明,与传统的LANDMARC室
针对5G毫米波通信基站和终端研发、产线测试需求,设计一款可应用于“无线移动通信产业链多个环节的研发、生产、设计优化专用仪表”的OFDM调制模块.采用改进的自适应大带宽调
针对云平台图书数据“大集成”下的信息迷航性,为实现投其所好的个性化推送服务,将云计算环境下图书资源的聚合为框架支撑,首先,基于读者阅读浏览行为建构读者兴趣度模型,并
作为天地一体化信息网络的重要组成部分,低轨卫星通信系统由于视角广、视点高,具有良好的连通性和覆盖性,越来越受到人们的关注.卫星网络技术的发展,对商业经济、国防建设以
关系抽取是指从文本中识别实体并抽取出实体之间的语义关系.它作为信息抽取的基本组成之一,在知识图谱、关系推理、知识问答等自然语言处理领域有着广泛的应用.卷积神经网络
为了提高手机读取试纸的便携型和普适性,一种新型的智能手机读取试纸的方法被提出.该方法最初是被设计用来读取胶体金免疫层析试纸的,但是经过实验验证,该方法在尿常规试纸上