上下文熵相关论文
中文信息处理中词表是一项非常重要的基础资料。未知词提取尝试自动从文本中提取出词表中缺少的未知词。随着以微博为代表的社交网......
为提高新词提取的准确率,根据新词在时间上的性质引入时间频率函数值特征,提出自动阈值获取算法。针对高处理效率特性,基于Spark平......
新词发现在自然语言处理领域具有重要意义,在微博内容上的新词发现比在一般语料上更难.文中提出引入词关联性信息的迭代上下文熵算......