词特征相关论文
从结构复杂多样的电子病历文本中提取出疾病表征词,是电子病历文本研究与应用的关键环节。LDA模型可以实现对文本信息的有效提取,但......
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者......
十多年来,短信服务在世界各国电信市场中得到巨大的发展。而手机短信发送量的增长伴随而来的就是日趋泛滥的垃圾短信。词特征数量......
社交媒体平台上存在着大量用户发表的和分享的多模态数据,其中文本数据作为众多形式信息中广泛存在的数据载体,是实现用户主题建模......
事件抽取是信息抽取的主要任务之一,而触发词抽取是事件抽取的重要子任务.事件要素与事件触发词之间存在关联信息,现有的事件触发......
1.建设了一个大规模中文数据集,包含55类,71674篇文本。基于多项式贝叶斯分类器中,比较了汉字Unigram和Bigram特征在文本分类中的......
针对生物文献库中人工标注样本数量缺乏的问题,提出一种半监督类型的基于联合训练的方法。在样本预处理的基础上,基于词特征的机器......
文本是社交媒体用户的重要信息之一,从文本中获取用户的词特征是实现用户主题建模、兴趣挖掘及个性化推荐等任务的基础。然而社交......