基于介词向量的英语真词错误检查算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:bbaiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于Winnow算法的基础上引入混淆词和介词搭配的方法.首先通过混淆集获得训练集,对训练集进行预处理后利用文本特征提取方法获得特征词集,然后对特征词集进行Winnow训练得到带有权重的特征词集并把出现在混淆词后的介词提取出来生成介词向量,最后从测试集提取特征并进行结合Winnow算法和混淆词与介词搭配方法的测试得到真词错误检查的结果.混淆词与介词搭配方法的加入使得某些混淆词的正确率、召回率以及F1测度提高了10%~20%,有的甚至提高到了100%.
其他文献
搜索结果的可靠性是影响广大网民使用搜索引擎的一项重要指标.在开源OPIC算法的基础上,提出了TS算法,该算法通过基于索引属性的改进,加入网页的创建时间和网页深度两个属性,
聚类分析是数据挖掘的重要任务之一,而具有易早熟与收敛速度慢等缺陷的传统生物地理优化算法(Biogeography-Based Optimization,BBO)很难满足具有NP(Non-deterministic Polyn
针对我国光伏电站工程设计过程中如何提高阵列单元设计效率的实际问题, 研究了通过开发计算机软件来解决这一问题的方法, 并详细论述了该软件的设计与实现过程。通过对光伏发
为了提高网络流量的预测精度,克服小波神经网络收敛速度慢、易陷入局部最优的缺点,提出一种遗传算法优化小波神经网络的网络流量预测模型.首先计算延迟时间和嵌入维数,构建小
针对当前人工擦除黑板的方式,提出了一种新的智能擦除方式.系统以黑板擦为控制对象,以交互式界面为终端,利用嵌入式技术和步进电机控制技术实现对黑板图像的采集、黑板坐标的
微博作为一种实时的信息传播和分享的社交网络平台,对人们日常生活的影响越来越大.在微博中,用户可以通过关注关系,添加自己感兴趣的好友,扩大自己的交际圈.但如何推荐高质量
为解决坐、卧状态下老人突发失能检测失效问题,设计了基于视觉传感器的老人突发失能检测算法.使用包围盒选择性更新策略实现对老人静止状态下的检测.采用视频图像网格化处理将监控范围划分成多个子区域.统计老人进入不同子区域的次数和时间,并建立区域驻留时间高斯模型实现老人突发失能检测.实验表明,本文算法具有运行平稳,实时性好,无监控死角等特点,可有效检测独居老人坐、卧状态下的突发失能.
参数曲线曲面的参数化直接决定了其代数性质,如正则性,而在计算机辅助几何设计中,自交现象却是一类不能直接应用的非正则性问题.管状曲面作为一类重要的几何造型,主要研究管
同步技术是提高移动数据库系统性能的一项关键技术.依托完井移动平台,结合完井业务数据,提出一种基于操作日志的移动数据同步处理模型,重点分析了该模型中的日志序列的生成以
针对嵌入式数据库SQLite3没有完整的安全访问控制的问题,本文基于RBAC模型,结合SQLite3数据库内核源码,设计了多级角色,分析了其访问控制的实现方法与步骤,详细设计并实现了S