【摘 要】
:
人们日常在使用互联网时会留下海量的数据信息。面对纷繁复杂的数据世界,如何有效地利用碎片化信息,为用户提供更加专业的个性化服务是当前研究的一个热点趋势。用户画像技术是利用用户在网络上留下的数字信息进行建模分析,深度挖掘其中隐藏的有价值的信息,实现对用户特征的提取和标签的预测,从而建立全面、立体的用户形象。用户画像技术现已广泛应用于商圈分析、智能推荐、精准营销等多种场景中。传统的用户画像构建方法多存在
论文部分内容阅读
人们日常在使用互联网时会留下海量的数据信息。面对纷繁复杂的数据世界,如何有效地利用碎片化信息,为用户提供更加专业的个性化服务是当前研究的一个热点趋势。用户画像技术是利用用户在网络上留下的数字信息进行建模分析,深度挖掘其中隐藏的有价值的信息,实现对用户特征的提取和标签的预测,从而建立全面、立体的用户形象。用户画像技术现已广泛应用于商圈分析、智能推荐、精准营销等多种场景中。传统的用户画像构建方法多存在提取的特征质量较差、模型准确率较低、泛化性不佳等缺陷。针对以上问题,本文提出了一种基于Stacking双层学习框架和预训练模型ZEN的用户画像构建方法,利用多模型融合技术预测用户多维属性标签。本文主要研究内容如下:在用户画像特征选择阶段,针对用户在使用搜索引擎时留下的短文本数据,从不同角度提取特征信息。首先选用传统特征选择算法TFIDF,它仅依靠词频统计忽略了特征在不同类别间的分布差异,存在特征提取不准确的问题。对此,本文在其逆特征频率和类别频率上加以改进,提出TWCF算法,用以抽取用户的常用词特征。其次将PV-DBOW模型训练的特征表示与降噪自编码器训练的特征表示相结合,提出DBOW-DAE特征模型,在降低文本噪声的同时能有效保留用户查询词中的语义信息,提高特征的表示质量。从实验结果分析来看,改进后的特征模型在预测用户属性标签任务上的准确性更高。在用户画像模型构建阶段,利用模型融合策略,融合Stacking学习法和预训练模型ZEN,提出一种融合模型S-ZEN。该模型可结合各学习器之间的优点,综合学习用户各属性间的关联信息。实验结果通过评价指标准确率表明,相较于各种单模型,融合模型在预测用户多维属性标签的任务上有更好的准确性和泛化性。
其他文献
黄花菜是一种营养成分含量较高的食品原料,且富含多种功能性成分,未来具有良好的开发应用价值及商业价值。简要介绍了黄花菜的食用价值,总结了山西农业大学在黄花菜功能性产品研发方面研究进展。
在全球化、信息技术、金融创新和产业整合的背景下,我国大多数企业会通过海外并购的方式来走向国际市场,促进发展。但企业进行海外并购的同时会伴随着财务风险。文章选取腾讯公司并购芬兰Supercell公司作为海外并购分析的研究案例,通过SWOT分析法和Z值模型综合分析法来分析并购的财务风险,结果表明并购存在的财务风险有:估值过高、融资和现金支付风险较大、财务整合风险过高。根据发生的财务风险提出:科学估值、
<正>黄河孕育了灿烂的黄河文化,黄河沿岸保留了丰富多样的文化遗产。河南省内的黄河文化遗产种类丰富、数量众多,为我们研究黄河文化和中原文明提供了宝贵的历史文化资源。通过梳理河南省黄河文化遗产资源,概括黄河文化遗产保护工作的经验,分析黄河文化遗产保护利用方面存在的问题,提出建立评估体系、完善体制机制、统筹系统性工程、创新传播渠道、创新非遗人才培养模式、创新黄河文化遗产转化方式等具体的建议,为传承与弘扬
介绍了采用阶跃函数模拟桥梁断面时域气动自激力的方法并对模拟的精度进行了研究。提出了采用现代遗传优化算法进行阶跃函数参数识别的方法。在模拟桥梁断面时域自激力的过程中,首先建立了颤振导数与阶跃函数各参数之间的等量关系,然后基于MATLAB平台实现了遗传优化算法并识别了阶跃函数的各个参数,最后根据参数值与上述等量关系反算得到颤振导数的拟合值,并通过对比颤振导数的拟合值与试验值来评估模拟的精度。数值算例表
在经济与科技迅猛发展的社会背景下,人们对油气资源的需求量正呈现不断上升的趋势,极大推动了油气储运工程的发展。现阶段,自动化技术的不断推行,使油气储运受到了社会各界的广泛关注与支持,同时也为该领域提供了新的发展方向。由此可见,油气储运领域的发展面临的既是机遇,也是挑战。但是,从目前自动化技术的应用现状来看,在实际应用过程中仍然存在诸多问题,尚未得到有效解决,极大制约了油气储运工程的进一步发展,对此相
<正>目前,我国制造业仍处于“工业2.0”的后期阶段,质量基础相对薄弱、资源利用效率偏低、劳动力成本提高。中国制造业企业普遍面临招工难、人力成本高等难题,这些都倒逼制造业转型升级。而智能制造能够替代人力劳动甚至外延人的能力,提高生产效率,是未来制造业的重要发展趋势。就船舶行业而言,
近年来科创型企业的发展前景良好,但融资难题并未得到有效解决,尤其是中小型企业的处境愈发艰难,将债权与股权相结合的投贷联动模式,为解决科技类企业融资约束问题提供了思路,本文首先对科技类企业的融资现状和投贷联动模式进行了分析,在此基础上着重阐述了其存在的问题,并针对性地提出了对策建议。
GX53型灯具是一种单色温产品,色温分别为3 000 K、4 000 K、6 500 K,考虑到产品功能多元化、成本最优化,计划将3款产品功能集成为1款。为此需要增加1个调色温的拨码开关,但该产品需要灌导热胶,导热胶流动性好,容易流入拨码开关,造成拨码开关无法拨动而失效。为防止导热胶进入,在原结构件上增加PC硬性阻隔层,在不增加额外零件的基础上,解决拨码开关的密封阻隔问题。结构件一次性注塑成型,不
延海压铸有限公司是一家小型铸造公司,近年来受铸造行业竞争日益激烈的影响,利润空间逐渐被压缩。公司管理者意识到对成本进行控制的必要性与迫切性,但由于公司现行的成本管理制度不适用于公司以客户需求为导向的订单式生产模式,导致成本控制的效率低下。基于此,通过在延海压铸有限公司建立目标成本管理制度,对现有的成本管理方法进行改进,以达到帮助公司提高成本控制水平的目的。文章以延海压铸有限公司作为研究对象。首先,