短中文分词算法优化研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:snake840321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对中文分词进行研究是自然语言处理的重要步骤,结合字典对短中文进行正逆向分词,在此基础上得到多组分词结果,利用基于统计的方法和基于规则的方法进一步优化算法,根据用户使用频度和网络搜索热度以及词语间的固定搭配规则对多组分词进行排序,并通过实例验证发现该方法具有较好分词效果。
其他文献
虽然固定尺度变化分解窗口的目标分割算法分割效果好,但时间效率不高。针对这一缺陷,提出一种依据查询窗口和被查询子窗口的纹理特征距离信息,分等级尺度变化分解窗口的算法思想。在当前循环层中,如果查询窗口和被查询子窗口的纹理特征距离比设定的阈值λ越大,分解窗口在下一次循环中减小的尺度d就越大,反之则越小。经实验验证,该算法能有效提高基于纹理特征匹配的目标分割算法效率,在分割精度上基本保持不变。
大坞尖钨矿床位于扬子陆块南缘与华夏古陆块的接合部位,是皖南地区典型的层控矽卡岩型矿床,近年来该地区钨多金属矿的勘探方面取得很大的突破。本次工作新发现了赋存在南沱组
自从FPGA问世以来,FPGA布局研究一直是设计自动化研究领域的热点,传统FPGA布局一般要求芯片连线总长最短、芯片面积最小。随着IC工艺技术的飞速发展,可布性研究越来越受到关
通过研究区域地层、区域构造、区域岩浆岩和矿体地质特征,对金山金矿的地质特征进行归纳和总结。对成矿物质来源及流体演化,构造与成矿关系进行了探讨,总结出金矿矿床成因。
9月28日下午,校党委书记邓弘,党委副书记、副校长黄辉玲,总督学程样国等深入思想政治理论课教学一线,听取思政部教师柯海莲讲授的《思想道德修养与法律基础》课程。宣传部、
20世纪50年代后期中国就确定了大力发展原子能事业的方针,1983年提出了《核能发展技术政策要点》,1991年中国首座浙江海盐秦山核电站并网发电。截至2020年6月,中国建成的核电
针对目前许多家庭的需求,深入分析无线通信的通信机制,比较各类通信方式的特点。系统采用WiFi无线网络组建智能家居监控系统,利用本地遥控器或远程智能手机对室内空调、窗户