词特征相关论文
从结构复杂多样的电子病历文本中提取出疾病表征词,是电子病历文本研究与应用的关键环节。LDA模型可以实现对文本信息的有效提取,但......
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者......
十多年来,短信服务在世界各国电信市场中得到巨大的发展。而手机短信发送量的增长伴随而来的就是日趋泛滥的垃圾短信。词特征数量......
社交媒体平台上存在着大量用户发表的和分享的多模态数据,其中文本数据作为众多形式信息中广泛存在的数据载体,是实现用户主题建模......
事件抽取是信息抽取的主要任务之一,而触发词抽取是事件抽取的重要子任务.事件要素与事件触发词之间存在关联信息,现有的事件触发......
本文介绍了一种SVM和基于转换的错误驱动学习相结合的生物实体识别方法。该方法首先通过抽取较为丰富的特征集合如单词特征、词性......
针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向......
在本文中,我们尝试将HNC领域作为文本特征,结合现有的分类技术,探索一条文本分类的新方法。本文对这一方法作了详细说明,并给出了试验......
词类之间的转换有时会出现两类词特征共存的现象,即在保存原词类一些特征的同时,又获得了另一词类的特征,只不过是其兑现的方式不......
比喻造词法是一种非常重要的修辞造词法,“它是着重于事物之间相似性的关系,借彼喻此,以他物状此物,形象地反映所指称的客观对象的......
基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme......
基于机器学习的文本分类中,维吾尔文传统分词方法表现出非常明显的不足和局限性.该文使用另外一种维吾尔文自动分词方法dme-TS.dme......
针对生物文献库中人工标注样本数量缺乏的问题,提出一种半监督类型的基于联合训练的方法。在样本预处理的基础上,基于词特征的机器......
文本是社交媒体用户的重要信息之一,从文本中获取用户的词特征是实现用户主题建模、兴趣挖掘及个性化推荐等任务的基础。然而社交......