【摘 要】
:
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于
【机 构】
:
大连理工大学计算机科学与技术学院信息检索实验室,伊犁师范学院电子与信息工程学院
【基金项目】
:
国家自然科学基金(61632011,61572102,61562080,61602079)资助
论文部分内容阅读
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着
其他文献
由于介质损耗角正切值(tgδ)是反映电容型绝缘设备的重要参数,实际测量计算时很容易因误差而淹没真实值的问题,提出了基于小波变换和Labview相融合的绝缘设备在线监测方法,利用小
天波超视距雷达(OTHR)的目标分类识别方法与常规雷达有着很大的区别;由于目标对不同频率的入射波所返回的信号不同,可直接用合理配置在几个频率点上的RCS数据进行目标分类识别;
为解决城市公交路线网络优化问题,给出了一种基于禁忌搜索方法的公交路线网络优化算法;设计了公交路线网络优化问题的数学模型,给出了两阶段禁忌搜索算法的框架及路线合并、路线
针对当前以太网控制器体积大、接口电路复杂和实现难度大等问题,文章采用体积小、功能强大的CP2200作为以太网的通信接口控制芯片;以温度/压力监测系统为背景平台,介绍CP2200的功
通过分析现有车载导航系统存在的主要问题,提出了基于Web Service的“中心服务式”车辆导航服务系统的整体架构;在此基础上,讨论了服务器端数据和服务管理机制等车辆网络导航系
符号执行作为一种基本的程序分析技术,已被广泛应用于软件测试领域。研究表明,即使在现有的查询优化技术的支持下,约束求解也仍然是符号执行中最耗时的部分。猜测符号执行的
针对公交公司需要解决的典型问题公交车辆的优化调度,提出了一种遗传算法与牛顿算法相结合的智能优化算法;并用该混合算法对调度模型进行优化;首先在兼顾公交公司与乘客双方
介绍了一种基于蓝牙技术的智能家居网关中数据采集处理系统的实现方案,该系统以ARM—Linux嵌入式系统为开发平台;首先讨论了USB蓝牙驱动在ARM9(S3C2410)上的实现和蓝牙协议栈Blue
在LXI自动测试系统中,通过计算机控制程序的调用,波形发生器能够根据测试对象的不同,输出多种形式的激励信号;进而,测试系统软件对控制程序的通用性、可维护性及可移植性也提出了更高要求;由此,在测试软件的开发中,采用了模块化技术,不同仪器的控制程序得以并行开发,同时也方便了同一仪器接口间的互换;以上所述在使用图形化编程语言LabVIEW,实现Agilent 33220A程序化控制的过程中得到了验证;此
结合TF-IDF算法思想,提出了特征频率、森林频率以及伪梯度提升决策树,解决了梯度提升决策树随着迭代次数的增加,错误数据被边缘化的问题。在伪梯度提升决策树中,所有决策树分