基于词嵌入扩充的口语对话文本领域分类

来源 :新疆大学学报(自然科学版) | 被引量 : 1次 | 上传用户:missyouangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,将短文本转化为长文本,使主题模型LDA更加有效地估计口语对话文本的隐含主题;2)采用无监督的概率生成模型
其他文献
根据多智能体系统的重要特性和面向高层次抽象的方法,给出了一种扩展BD I智能体行为模型,重点描述了每个智能体的行为以及多智能体通信和协调机制。最后通过实例说明模型的有效性和实用性。
通常情况下,低渗透裂缝油藏具有微裂缝发育、脆性大、储集层岩石密度大、渗透率低、峰度低、压力低等特点,加大了井区的开发难度.针对目前低渗透油藏的采收率相关技术进行了
提出了一类带有时滞的非自治的ohen-Grossberg神经网络模型.通过利用构造合适的lyapunov泛函的方法和运用不等式的技巧,得到了该模型的周期解存在性和稳定性的充分条件.并通
通过实施自愈控制能够有效提高配电网的供电可靠性.对可靠性进行评估能够为自愈控制策略的制定提供决策依据.分析了网络结构、电源分布、开关状态和负荷分布对配电网可靠性的影