【摘 要】
:
拼音输入法是人们日常生活中最常用的软件之一,用户输入一串字母序列,输入法引擎根据已经训练好的模型或者基于规则预测出用户期望输入的汉字串,准确高效的拼音输入法对于提高人们的生活、学习、工作效率具有重要意义。深度学习领域的发展直接掀起了人工智能的第三波热潮,目前已经在NLP领域取得了突破性的进展。以研发出更加智能、准确、高效的拼音输入法为目标,将神经网络语言模型应用在拼音输入法解码模块上。首先,拼音到
论文部分内容阅读
拼音输入法是人们日常生活中最常用的软件之一,用户输入一串字母序列,输入法引擎根据已经训练好的模型或者基于规则预测出用户期望输入的汉字串,准确高效的拼音输入法对于提高人们的生活、学习、工作效率具有重要意义。深度学习领域的发展直接掀起了人工智能的第三波热潮,目前已经在NLP领域取得了突破性的进展。以研发出更加智能、准确、高效的拼音输入法为目标,将神经网络语言模型应用在拼音输入法解码模块上。首先,拼音到汉字的转换过程可以看成一个序列标注的问题,利用隐马尔可夫模型完成拼音到汉字的解码,即对每个音节标注上对应的汉字。为了克服隐马尔可夫模型在语言建模上的缺陷,继而将语言模型引入至拼音汉字解码模块,即利用语言模型对隐马尔可夫解码出来的若干汉字候选项进行重新评估,做重新算分(Rescore)处理。根据以上思想,HMM+N-gram,HMM+RNN,HMM+LSTM,HMM+BERT音字转换模型被训练出来。基于已经训练好的模型,最后对拼音输入法做了设计、实现以及测试。拼音输入法实现中,音节切分采用动态规划的切分方式,词典生成使用熵的概念,通过自由度、凝固度等指标来衡量一个词的合理程度,挖掘了近15万个2-4的词语。通过规则匹配获得Top N个单字、词语候选项,采用HMM解码加神经网络语言模型算分方式获取Top N个整句候选项。最终实现的拼音输入法具备单字输入、词语输入、整句输入、联想输入以及动态调频的功能。拼音输入法使用训练的语言模型在长整句的音字转化上卓有成效,充分证明了神经网络语言模型的优越性。
其他文献
移动操作机器人由移动平台和操作臂组合而成,这样的配置使其既具有大范围的移动能力又具有灵活的操作能力,被广泛应用于众多领域。然而,两者的结合也带来自由度冗余、高动态作业交互和动态稳定等问题,极大地增加了该类机器人运动规划和控制的难度。现有的移动机器人规划方法大多将移动平台和操作臂进行独立规划,无法同时满足机器人作业效率与移动稳定性要求,也无法适应动态变化的外部环境,极大地限制了移动操作机器人能力的发
黄铁矿是自然界常见的一种硫化矿物,通常利用浮选法回收。浮选体系中药剂与矿物作用之前,药剂间会产生复杂的交互作用。已有的研究主要从单一或同类药剂的角度,按照先加调整剂后加捕收剂等的分步加药顺序研究药剂间的交互作用,与实际生产中常见的调整剂、捕收剂和起泡剂等同步加药的现状不匹配,导致药剂参数的制订缺乏充分的理论支撑,致使选矿回收率不理想。论文以黄铁矿浮选过程中活化剂硫酸铜和捕收剂丁基黄药为研究对象。通
随着基因芯片技术的发展,基因表达数据得到研究人员越来越多的关注。通过合理的分析基因表达数据,提取出有用的关键信息,利用正确的预测结果,将为疾病的治疗带来有效的指导性建议。然而,基因表达数据普遍存在维度高以及样本较少的特点。随着维度的增高,容易造成“维度灾难”的问题,极大降低了现有的数据挖掘和机器学习等算法的计算效率与准确率,为分类学习带来了一定的挑战。针对基因表达数据的分类任务,本文探究如何从存在
贵州矿区浅埋煤层上地表多为峰丛地貌,从而形成了峰丛地貌下浅埋煤层开采的特点,在开采的过程中覆岩破断及裂隙演化规律与平原、冲沟矿区有所差别,给矿井生产以及周围居民造成了一定的安全隐患。为了深入了解其差异,本文采用理论计算、相似模拟、数值模拟相结合的研究方法,系统地研究了普洒煤矿11013工作面推进通过山体时引起的上覆岩层运动及裂隙演化的一个过程,以及对导水裂隙带高度的预测。通过构建弹性薄板模型对煤层
在当前,企业面对日益增长的人力成本,制造业转型升级加快的宏观背景下,机械臂应用在各行各业中,根据应用环境的不同,机械臂所使用的末端执行器千差万别。本文设计了一款能够通过自动控制技术操作数控机床面板的多指机械手。通过对机械手的机械结构、运动学模型、动力学模型、指尖最小抓持力和按键最小接触力以及控制系统的研究,本文完成的主要成果如下:首先,根据操作数控机床控制面板的操作对象,确定机械手的尺寸参数以及负
机器人抓取技术是机器人学的主要研究方向之一。当前成熟的机器人抓取技术大多只适应于场景布局固定的结构化环境。在面对物体特征繁多、位姿随意的非结构化场景时,抓取困难且实时性差。为了改善非结构化环境中机器人抓取的效率和精度,本文对机器人抓取的关键性技术进行研究,包括目标分类与定位技术、最优抓取点检测技术和视觉感知系统标定技术。具体内容如下:(1)为了解决目前区域建议检测模型耗时较多的问题,提出将YOLO
增减材复合加工制造,是一种将增材制造和减材制造合二为一的复合加工制造方法,克服了一般增材制造出现的尺寸精度低、产品机械性能差等缺陷。它用途广泛,既可以是“从无到有”的产品生成,生成出比3D打印质量更好的产品,也可以用于修复零件,在原有的破损零件上进行增减材加工,修补破损零件,降低维修成本。然而,市面上的CAD/CAM软件无法针对本文研究的大刚度、高柔性、广包络范围的柔性增减材复合加工机床进行工艺规
近年来,我国互联网领域发展迅猛,许多企业在这一领域都进行了一定的战略部署和技术布局。在“互联网+”时代,生鲜农产品也搭上互联网的时代快车,各大公司争先希望在这一领域深耕有所成效,同时政府部门在农村的可持续发展道路上有相对优惠的政策支持,解决了相当一部分生鲜农产品销售问题。但生鲜产品有其特殊的保鲜和存储需求,从农民收成环节到最后配送到客户手里中间还需尽可能的优化对应环节,尽量减少中间多余环节成为了生
随着社会科技的不断发展,电子制造设备已在人们的日常生活中随处可见。印刷电路板组装(Printed Circuit Board Assembly,PCBA)技术在现今的制造业中已变得十分常见,其主要流程是电子元件在印刷电路板上的贴装过程。表面贴装技术(Surface Mounted Technology,SMT)则是如今的元件贴装生产中应用最广泛的一种技术。但现有的PCBA生产线往往在生产调度和对生
推荐算法的需求非常之早,在机器学习还没有完全流行的时候便已经出现。尤其是到了如今互联网高速发展的时期,网络中充斥着大量的无用信息,造成的严重信息过载使得对推荐系统的需求越发明显。推荐系统将用户的需求与信息对接,即使得用户可以快速找到有价值的信息,也使得信息可以被合理的推送到需要它的客户面前,降低双方的成本。常见的推荐算法往往需要充足的信息才能拥有较好的推荐效果,因此当面临数据稀疏而无法达到精确计算