基于词嵌入扩充的口语对话文本领域分类 - 开源共享论文下载平台 - 信丰网

基于词嵌入扩充的口语对话文本领域分类

来源 :新疆大学学报(自然科学版) | 被引量 : 1次 | 上传用户：missyouangle

【摘要】

：

针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,

【作者】

：

杨萌萌黄浩

【机构】

：

新疆大学信息科学与工程学院

【出处】

：

新疆大学学报(自然科学版)

【发表日期】

：

2016年06期

【关键词】

：

口语对话系统口语理解潜在狄利克雷分布主题模型文本扩充 spoken dialogue system Spoken Language Understand

【基金项目】

：

国家自然科学基金（61365005,60965002）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,将短文本转化为长文本,使主题模型LDA更加有效地估计口语对话文本的隐含主题;2)采用无监督的概率生成模型

其他文献

一种面向Agent的分布监控系统行为建模和设计方法

根据多智能体系统的重要特性和面向高层次抽象的方法,给出了一种扩展BD I智能体行为模型,重点描述了每个智能体的行为以及多智能体通信和协调机制。最后通过实例说明模型的有效性和实用性。

期刊

智能体多智能体系统行为模型

低渗透裂缝油藏生产曲线特征及提高采收率技术研究

通常情况下,低渗透裂缝油藏具有微裂缝发育、脆性大、储集层岩石密度大、渗透率低、峰度低、压力低等特点,加大了井区的开发难度.针对目前低渗透油藏的采收率相关技术进行了

期刊

低渗透裂缝油藏生产曲线特征润湿性平面渗流常采收率

一类带有时滞的非自治Cohen-Grossberg神经网络周期解的存在性和全局指数稳定性

提出了一类带有时滞的非自治的ohen-Grossberg神经网络模型.通过利用构造合适的lyapunov泛函的方法和运用不等式的技巧,得到了该模型的周期解存在性和稳定性的充分条件.并通

期刊

COHEN-GROSSBERG神经网络周期解时滞全局指数稳定有界性Cohen-Grossberg Neural networks Periodic s

配电网可靠性的多模型评估指标

通过实施自愈控制能够有效提高配电网的供电可靠性．对可靠性进行评估能够为自愈控制策略的制定提供决策依据．分析了网络结构、电源分布、开关状态和负荷分布对配电网可靠性的影

期刊

配电网可靠性多模型评估指标urban power grid reliability Multi-Model technology assessment

其他学术论文