基于互信息特征提取的食品安全信息新词识别

来源 :黑龙江八一农垦大学学报 | 被引量 : 0次 | 上传用户:michaelhocn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新词识别是食品安全信息处理中的一个难点,新词是造成分词错误的重要原因。利用互信息提取新词特征并采用BP神经网络过滤垃圾词串以识别新词,以提高食品安全文本分词准确率。首先在互信息新词识别基础上,得到候选新词的多个统计量特征。然后对候选字串是否成词进行人工标记。最后将统计量特征和人工标记的新词作为训练样本,建立BP神经网络新词识别模型。在食品安全信息文本数据上进行实验,该方法可以取得新词识别准确率(0.806)。结果表明基于互信息特征提取的BP神经网络新词识别模型可以很好地识别新词,降低词语误判,对于食品安全
其他文献
支气管哮喘(以下简称哮喘)作为呼吸科常见疾病,在哮喘急性发作期,采用中西医结合治疗往往疗效显著,且不良反应少。而通过实验室指标量化哮喘辨证,对于哮喘辨证治疗准确性及疗
开展现场侦检是化工火灾火情侦查的重要内容,是指战员作战安全的重要保障。文章分析了当下消防救援队伍在进行火场侦检中存在的问题,提出了通过加强经费投入、成立专业队伍、
为了解五大连池碧泊沉积物中细菌多样性同环境因子的关系,对碧泊沉积物中理化参数进行测定,高通量测序分析方法对碧泊沉积物中细菌多样性进行解析,再通过冗余分析方法(RDA)解
为调查黑龙江省水稻主产区大米中的重金属镉元素含量,2018年在查哈阳、五常、方正、响水、建三江五个地区抽样110份,采用电感耦合等离子质谱仪(ICP-MS)进行检测,并采用Monte
在新冠病毒肺炎疫情大发生、大流行的冲击下,世界大变局正以前所未有的速度推进。在以国内大循环为主体,国内国际双循环相互促进的新经济发展模式下,我国畜牧业特别是养猪业
党的十六大在政治体制改革的部署中,提出要深化干部人事制度改革,建立充满活力的用人机制。为此,要以扩大民主为基本方向,建立健全干部选拔任用机制;以关心爱护干部和保证选
为探究2-异丁胺基-5,8-二甲氧基-1,4-萘醌(MPAD)与老化动物皮肤损伤愈合之间的关系,阐明MPAD对真皮成纤维细胞衰老的影响。试验采用129/SvJ小鼠制作皮肤创伤模型,通过病理组
本实验钢渣为原料,通过负载CeO2制备了碱激发钢渣复合凝胶材料,对原钢渣和碱激发钢渣进行了X衍射图谱对比,发现碱激发钢渣中的非凝胶相衍射峰减弱或消失,通过测量对相同浓度