基于LDA主题模型的在线评论聚类研究

被引量 : 0次 | 上传用户:jkdjzzg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今网络消费越来越流行,网络在线评论也变得更加重要,看似简单寻常的句子中实则包含了大量的信息,隐藏着重要的商业价值.本文主要对酒店在线评论数据进行挖掘,这样可以帮助商家更好地了解消费者的想法,从而改善服务,增强自身的竞争力.从实用性和高效性的角度来看,聚类因为不需要数据标签,所以是在线评论挖掘中最合适的方法.聚类的方法多种多样,适用场景也各不相同,本文首先探究了在各种条件下都表现良好的聚类方法,结果发现经过James-Stein估计量改进的Kmeans聚类具有最佳的效果.然后,使用中文分词、停用词过
其他文献
随着经济全球化程度的不断加深,各行各业的竞争愈演愈烈。越来越多的企业开始关注客户,将“以客户为本,为客户服务”作为企业的生存之道。商业银行也逐渐把发展零售业务作为竞争的主战场,将获得和维系优质客户作为银行发展的重要保证。但竞争的加剧、互联网的冲击和第三方支付平台的挑战还是让银行损失了不少客户。有研究表明,客户流失率降低会给银行带来利润增长,而且发展一个新客户成本远高于挽留一个老客户,但成功率却低于
学位
首次公开募股(IPO,Initial Public Offering)抑价现象普遍存在于国内外证券市场,而我国科创板市场IPO平均抑价水平高达159%左右,显著高于国内60%左右的股票市场。据此,基于相关理论基础,结合我国科创板发展实践,探讨科创板市场IPO抑价的影响因素,对于缓解我国科创板IPO高抑价率问题、促进科创板市场健康稳定发展具有重要的现实意义。本文基于国内外IPO抑价问题的多角度研究和
学位
贷款业务是金融机构的支柱性业务,保障贷款业务的安全性和提高信用贷款业务的风险预测能力非常重要。因此,评估个人信贷的违约风险有着非常大的理论和现实意义。为了弱化传统信用评估体系的弊端影响,降低不良贷款率和规避信贷风险,基于人工智能算法的风险预测模型应用而生。常用的信贷风险研究算法是Logistic回归及其改进算法。此类方法存在的问题是每个特征之间彼此独立,会忽略特征交叉产生的影响。其他相关研究尝试使
学位
本文基于利率市场化改革这一背景,主要阐述了利率管制的放开以及非利息收入业务的发展对商业银行净息差产生的影响。一是利率市场化对净息差的影响主要表现为价格竞争机制和风险承担机制。在利率市场化初期,商业银行以存贷款基准利率为标尺,自主确定存贷款利率,商业银行的盈利空间得以拓宽,使得净息差水平上升;随着利率市场化的持续推进,商业银行间的竞争加剧,为了维持客户群体的稳定性,商业银行通过高息揽储、低息放贷的方
学位
在《人民日报》抗“疫”期间刊登的众多公益广告中,多次出现身体意象、建筑意象、道具意象、自然环境意象、人文意象等元素,对这些广告元素从符号学相关理论中抽丝剥茧进行研究。以符号修辞与解码为主线,通过逐一或组合分析平面广告,意图找到意象蕴含着的广告主体独特思想和情感。本文首先梳理了平媒公益广告的符号学原理、主体间性美学思想、以及媒介批评理论范式在平面广告中的应用,以受众体验方式为中心,分析《人民日报》疫
学位
当前我国经济下行压力增大,充满不确定性,作为金融市场的主导力量,商业银行被要求加大对实体经济的信贷投放力度,这给银行经营带来了更多的不确定性,风险随之增加。在强监管的压力下虽然没有出现较为严重的系统性风险,但区域性金融风险仍时有发生。基于安全性的经营原则,商业银行管理层通常会采取一些盈余管理手段来降低银行风险承担水平,但是这些盈余管理手段误导监管部门和投资者对银行经营状况的判断,使监管部门无法及时
学位
随着国内工业的发展,其对环境的破坏日益严重。为了解决这个问题,实现经济环保发展,十八大提出绿色发展,在经济发展过程中将环境问题放在重要位置。关于绿色发展中的资金需求问题,国家出台了绿色信贷政策,要求商业银行在贷款发放中将资金是否流向环保行业作为一个重要标准。银行开展绿色信贷业务是否会对银行绩效产生影响引起了学术界的研究。本文从银行绿色信贷视角,探究绿色信贷对银行绩效的影响和绿色声誉对两者之间关系的
学位
目的:观察木贼蜂房汤内服外用联合阿达帕林凝胶治疗风热蕴结型扁平疣的临床疗效。方法:将符合纳入标准的60名风热蕴结型扁平疣患者,随机分为对照组和治疗组,各30例,在口服甘露聚糖肽胶囊、外涂阿达帕林凝胶的基础上,治疗组联合木贼蜂房汤口服并外敷,对照组木贼蜂房汤仅口服,分别于治疗前后评估两组患者的皮损数目、大小、颜色消退程度及有无同形反应等方面的症状评分,并于治疗后统计两组患者痊愈率、总有效率及无效率。
学位
近年来,随着经济的飞速发展,信用消费环境的成熟,信用卡发行量与交易量都在不断增加,信用卡欺诈问题也随之而来。因此,对于信用卡欺诈的预测与防范问题亟待解决,这是现在信用卡业务的主要工作,同时也是银行风险控制的关注点之一。随着大数据研究的深入发展,数据经常会涉及到不平衡问题,使数据呈现不平衡状态,因此分析不平衡数据问题是现代统计学的关键问题之一。本文的研究目的是对数据集中的信用卡欺诈模型寻找合适的分类
学位
信用卡消费便捷,因此受到了广大用户的欢迎。与此同时,信用卡欺诈行为也在全球范围内增加,给金融机构造成了巨大的损失。目前信用卡欺诈识别的方法很多,但是基本上都没有深入挖掘用户的行为特征。本文通过深层次挖掘异常特征提高了现有模型的预测精度。异常特征的挖掘采用特征工程方法,进行了变量衍生和特征选择。变量的衍生分为两个步骤:首先,使用RFM模型分别以Cardnum,Merchnum,Cardnum-Mer
学位