个性化文本生成及其在推荐与对话中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:huaweibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据及人工智能技术的发展对人们的生活方式影响深远。各种人工智能相关应用通过与用户的交互掌握其需求,提供相应的服务博得用户的满意。作为人机交互的重要形式,自然语言处理的意义不言而喻。而文本生成作为其中的经典问题也日渐成为学术界的热门研究领域。文本生成拥有广泛的应用场景,比如机器翻译、线上聊天机器人、电子商务系统及创意广告当中,文本生成技术都不可或缺。文本生成问题中一个值得关注的现象是:用户对于文本的喜好往往因人而异。相关研究表明,用户的性格对该用户对于文本的接受程度有很大的影响。例如在广告推荐中,有些用户表现出易受社交影响的特点,则“其他用户也尝试过”类型的广告更切中他/她的喜好。因此生成个性化的文本可使文本更具信服力,有助于提升用户满意度与信任度,并最终促成购买行为,其意义不言而喻。作为一个新兴课题,个性化文本生成包含以下三个研究问题:1)研究场景问题。什么样的研究任务中有条件及需求进行个性化文本生成;2)信息选取问题。哪些种类的个性化信息对相应任务有益,可以应用到文本生成中来;3)信息整合与用户建模问题。本文在包含推荐与对话的三个传统或新兴的研究场景中研究个性化文本生成,根据各场景不同特性充分利用已有的用户个性化信息并结合到文本生成模块中,从简单的用户标签到复杂的用户信息建模,逐步实现文本生成的个性化目标:(1)在单轮短文本对话任务中,系统需要根据用户给出的上文生成合适的回复。我们考虑利用对话文本中蕴含的情感信息进行个性化文本回复生成。本文通过真实数据分析展示情感信息在短文本对话中的作用,并根据分析所得的结论设计生成模型模仿人与人之间的对话。我们提出了分步学习及联合学习模型,同时考虑预测回复中的合适情感以及生成包含情感的回复这两个研究问题。模型通过结合注意力机制,可以在给定上文时预测适合出现在回复中的各种情感并使生成的文本包含这些情感。实验表明模型可以生成情感合适的高质量的短文本回复,产生的文本高度个性化且具有多样性。(2)可解释推荐是推荐系统领域新兴的研究热点。系统在向用户推荐商品的同时产生文本作为推荐理由,这有助于用户更好地理解系统,提升系统的可信度与满意度。具体的,我们研究如何结合用户历史评论信息,在进行推荐的同时生成个性化的解释文本。现有工作普遍缺乏对推荐准确性与可解释性之间深层次联系的探索,无法同时对二者进行优化。故本文提出了基于互注意力机制的多任务学习模型,将个性化文本生成任务与推荐任务紧密关联起来。基于认知科学的相关知识,我们采用编码器-选择器-解码器的多任务模型架构,结合分层的基于互注意力机制的选择器,使得模型能够表征用户-商品间的深度交互,并引入多指针网络高效地建模两任务之间的交叉知识传递。最终本文在真实数据集上验证了模型对推荐准确性和可解释性的提升作用,且能够生成个性化的文本作为推荐解释。(3)可解释推荐系统能够在推荐商品的同时生成对应的文本解释。研究表明,生成的文本不仅能帮助用户理解推荐系统,更是连接用户与推荐系统的桥梁,引导用户向系统提供反馈。因此我们进一步提出可解释对话式推荐任务:推荐系统持续给出解释文本帮助用户理解模型,驱使用户提供反馈并吸收到模型中,迭代地提升推荐准确性以及解释质量。本文设计了增量的多任务学习模型进行可解释对话式推荐,利用共同优化的多个目标函数发挥推荐结果预测、解释生成以及用户反馈整合三个模块间的相互促进作用。通过建模“概念词”实现推荐与解释任务间的信息传递,并驱使用户对概念词的好恶进行反馈,将之整合到原模型中实现更新。本文引入多视角用户反馈整合模块实现模型的高效更新,第一个视角关注局部的用户反馈是否被满足,第二个视角关注整体模型的推荐效果是否提升。真实数据集上的模拟实验验证了模型能够高效地整合用户反馈显著且稳定地提升推荐及解释效果,并保证对用户反馈的及时响应。综上,本文通过研究个性化文本生成的多个现实应用场景,展示了如何针对具体的场景与个性化信息充分且高效地建模用户个性,并与文本生成相结合,发挥出个性化文本生成在场景中的重要优势与作用,具有相当的实际意义与价值。
其他文献
中国人名拼写都有一个规则规范问题,然而在我国大多数学术期刊中人名拼写很混乱。大学是培养高级人才的地方,除了要对学生进行专业教育、思想品德教育外,还要进行基本的学术
<正> 应英国英中协会邀请,以司法部基层工作指导司司长王珏为团长,由司法部政治部、计财司、基层工作司、外事司、全国人大法工委、国务院机关事务管理局、天津市司法局、浙
鲁迅长孙申请注册鲁迅酒遭驳回    鲁迅先生的长孙周令飞于2001年向国家工商总局商标局提出申请,欲将“鲁迅”注册为酒类商标,遭到驳回后又提出复审请求。不久前,周令飞
实验能力核心包括观察实验现象的能力、操作器材与使用设备的能力、处理和分析实验数据的能力、实验设计与创新的能力.如何考查这些核心实验能力,每年高考、中考试题都有实验
当前中国农村最迫切的改革是,进一步深化农村土地、产权、户籍、金融以及集体经营体制、公共服务体制、社会管理体制等的改革,将农民从农村户籍中解放出来,将土地从农村集体
较全面系统地论述了铝合金挤压在线淬火的基本原理与实现在线淬火的工艺条件,并列出了部分常用铝合金的挤压在线淬火工艺参数。锭坯的质量与均匀化处理,挤压前锭坯的预热条件
期刊
<正> 根据中央关于加强"两所一庭"建设的精神和我部《关于创建规范化司法所工作的意见》要求,以及最近召开的全国司法所建设工作会议精神,司法所要全面推进组织、队伍、业务
土地利用/覆盖变化是全球变化中的重要组成部分,城市化进程将导致大规模的土地利用/覆盖变化.文中首先分别对1999年、2006年、2010年的CBERS和HJ-1B数据进行几何校正、拼接裁
众所周知,英语在我国被越来越多的年轻人所熟悉,特别是中国加入世贸组织后,大学的师生掌握好英语是重要和必要的。如若不然,我们就会在教学中失败,甚至在将来我们无法理解日