基于交易行为的客户分类与股票分类关联性研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:buffisher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国证券市场近年来蓬勃发展,成立了越来越多的证券公司,个人参与证券投资的热情度也日益高涨,投资市场对个人投资的限制逐渐放开,最典型的政策就是个人不限在一家证券公司开立账户与交易。在此背景下,证券公司如何在市场化竞争中抢占先机,吸引更多的客户成为了各大证券公司的研究课题。如果客户登录证券公司平台,平台能够根据客户的偏好实时推荐其感兴趣的股票,使客户不会错过合适的投资机会,自然会有越来越多的客户在此平台开户并交易。目前,证券公司获取客户风险偏好的渠道基本都是通过客户主观填写的风险测评,但是大部分客户并未认真评估风险测评内容,导致风险测评结果与其实际风险偏好有一定差异。另一方面,截止2020年6月1日为止,证券市场上有3889支股票,客户关注的往往是不同类型的股票中的龙头企业,不会关注每一只股票。结合证券公司实际的营销需求、客户风险测评准确性不高、股票数量繁多等三大因素,本文提出了基于客户的真实交易行为对客户分类、基于股票的特征属性对股票分类、基于客户的真实交易行为分析客户集群与股票集群的关联性,从而能够将研究结果推广到实际的股票推荐场景中,增加证券平台的用户量,提高用户黏性。在基于客户实际交易行为对客户分类的研究中,本文研究了相关的研究算法,最后结合原始数据以及实用场景,最终使用了BIRCH.K-mediods模型,提出使用年度换手率、年度持仓率、年度止盈率、年度止损率、年度持股时长、年度资金流动率、年度委托交易成功率、年度委托失败偏差率这8个指标对客户分类。由于样本集数据量较大,因此,BIRCH.K-mediods模型分为两阶段聚类,第一阶段利用BIRCH模型对数据进行去除稀疏值的压缩,以对数据进行微聚类,第二阶段,对第一阶段的聚类结果使用K-mediods模型再次聚类,得到宏聚类结果,使用K-mediods模型可以避免选择的聚类中心与实际的样本数据有偏差。基于此模型,根据1220个客户一年内的交易流水数据将其分为8大类集群,实验结果验证了此模型聚类效果尚可。在股票分类研究中,本文结合原始数据以及各类研究算法,提取了每个股票四大方面,27个特征数据,四大方面为:证券基本情况、财务指标、日线情况、外部因素,27个特征包括市场代码、利润总额、涨跌幅、所属板块涨幅等,选取股票每日涨跌幅作为时序数据。由于股票的特征维度较大,为了提取出真正有用的维度,本文提出基于Auto-encoder.K-means++模型对股票分类,第一阶段的目的在于降维,选择Auto-encoder模型,第二阶段基于降维后的数据选取K-means++模型分类,降维可以避免分类结果不佳是由于初始聚类中心选择不恰当造成。基于此模型,对3889个股票243个交易日的数据训练并将3889个股票分为20类,实验结果表明,股票分类结果基本上达到了高内聚、低耦合的效果。最后,本文对客户分类与股票分类的关联性进行了研究,相关研究中,这两个分类关联性研究不多,但是有很多值得借鉴的推荐算法,基于相关研究,本文基于客户交易行为数据提出了一个评分卡模型,在此模型中设置了两个变量,一个为客户群内购买股票群股票的占比,其权重基于TF-IDF算法设计了一个计算公式求得,此权重的核心思想为一个客户群购买某一股票集群股票比例较高而整个客户群购买这一股票集群股票比例较低,则权重越大;另一个变量基于K-邻近值算法设计求得,其中心思想是先计算客户群内每一个客户距离集群中心客户的距离,再计算该客户购买某一股票群股票交易行为占其全部交易行为的占比,两者相乘后加总,求得总值后除以客户群客户总数,即可得到客户群购买某一股票群股票的平均交易行为占比,此变量的权重与第一个权重互补为1。根据此评分卡模型,可得到每一个客户群与每一个股票群的关联性分数。基于此关联性分数,设计了一个推荐方案,给客户推荐其所在客户集群关联性分数排名前三的股票集群中10只股票,将推荐结果与客户实际的交易行为作对比分析,覆盖率较高。
其他文献
近些年来,尤其是2016年谷歌的Alpha Go与韩国李世石的人机围棋比赛,使得深度学习、神经网络等等技术被越来越多的人所熟识。而在图像识别、音视频识别处理、自动驾驶等领域,得益于众多学者不断的研究与探索,深度学习的发展取得了巨大的进步。目前,已有众多研究人员将深度学习、神经网络等技术运用到金融时序数据的预测中,如预测股价涨跌、期货收益等等。这是因为随着全球经济的迅猛成长,经济全球化也是未来发展的
学位
全球范围来看,橡胶期货的交易基本上汇聚在三个交易所,其中新加坡占据了举足轻重的地位,该领域上海也领先于东京。其中天然橡胶品种,上海取得了一些优势,在全球同类合约中排名首位,对上海国际金融中心建设起到了一定的促进作用。在天然橡胶期货市场逐渐成长的过程中,金融监管部门(包括上海期货交易所)、橡胶期货相关金融企业、橡胶产业上下游企业、个人投资者等市场主体也逐渐壮大。我国作为全世界最大的发展中国家,网民规
学位
多因子选股作为量化投资研究领域的经典模型,在海内外各类投资机构均受到广泛研究和实践应用。在国内,自2010年沪深300股指期货上线以来,以多因子选股为代表的阿尔法对冲策略也逐渐走入了公众的视野。20世纪90年代,前瑞银华宝证券全球首席策略分析师Edward Kerschner提出事件驱动投资策略后,该策略已经发展成与行业配置并驾齐驱的策略研究和资产配置方法。事件驱动研究的本质仍然是对市场参与者内心
学位
在国内外证券投资行业的不断发展进步中,量化投资在国内市场逐渐萌发。虽然国内量化投资行业发展起步较晚,但是借助国外成熟市场的先前经验与发展成熟的技术工具,有助于中国的研究者迅速跳过量化投资初期的摸索阶段,可以直接运用经过国外市场验证的、较为成熟的投资策略,逐渐发掘出与中国资本市场相匹配的量化投资策略。在计算机技术的发展进步中,人工智能、机器学习等新技术的应用也提高了量化投资模型的表现效果。中国量化投
学位
作为我国资本市场对外开放的重要举措之一,内地市场与港交所的互联互通政策的正式施行有效减少了境外资金的交易成本,带来了北向资金流入,目前北向资金已经成为国内股票市场不可小视的重要力量之一。另一方面,互联互通政策在促进我国资本市场健康发展、深入推进与国际市场的接轨同时,也加剧了国际金融风险。境外机构资金往往作为成熟机构投资者的代表,应该是属于资本市场最理性的人,他们更应该关注公司的基本面信息,即交易行
学位
随着中国经济的增长,人们的物质生活正在得到不断地改善,信息数字化已经渗透到人们生活中的方方面面。随着汽车金融贷款市场的不断发展,人们的购车能力得到了极大的提高。汽车消费金融贷款也逐渐成为了人们购车的得力助手,汽车金融贷款蓬勃发展的同时,对汽车金融业务系统也提出了新的要求和较大的挑战。在需求端,人们的需求日新月异、层出不穷,汽车金融贷款提供方必须能够快速应对变化才能在竞争激烈的市场中占有一席之地。现
学位
随着中国汽车消费增长趋于稳定,汽车行业在新的环境下面临了比以往更为严峻的考验,因此企业需要通过各种方式来优化原材料采购成本,以实现企业利润最大化。而多源采购策略作为改善企业利润的一种重要方式,所带来的有关如何合理地选择供应商并分配订单的问题,企业和学术界一直都在不断的研究和探索中。本文的研究目的是通过数学规划模型和实际案例,研究汽车零部件企业在多源采购环境下的供应商选择与订单分配优化问题。本文首先
学位
随着世界经济和社会的高速发展,投资的渠道越来越丰富,证券、基金、债券等新兴投资工具在世界各国大规模流行,为抢占投资先机,人们不断寻找更多挖掘投资市场一线消息的渠道。金融在线社区的兴起能够很好的满足人们迫切的需求,它将投资爱好者聚集在一起,提供网民交流、分享的平台。但是与此同时,在线金融社区也容易成为监管洼地,网民发帖门槛过低,网络舆情经过层层发酵,可能会偏离事实,向消极的方向发展,不利于社会稳定。
学位
现有的许多学术研究透过将“股权融资渠道”与许多理论相结合对资产价格波动与实体经济之间的影响机制研究一直是学术的研究热点,而投资者情绪是否还能够通过其他途径影响企业的融资决策或改变融资约束,始终也是许多研究关注重点。市场情绪变化与公司股权融资成本和融资时机之间的作用机制随着学术对“市场择时理论”的应用,也不断经相关研究数据所实证,但在投资者情绪与公司银行贷款之间的作用机理,却还尚未有更多的关注与研究
学位
在智能制造背景下和全球化的过程中以及大规模定制环境下,制造行业面临的环境更为严峻,产品多样化、迭代速度加快等,使得制造企业承担着更多的风险与挑战。客户需求通常难以预测,而库存却居高不下,同时避免订单短缺和产品呆滞等也变得尤为重要。多级供应链库存变化会沿着供应链依次逐级放大,产生“牛鞭效应”,更是增加了维持库存控制的难度,使供应链库存总成本增大。延迟策略通过重新设计产品或流程使满足客户个性化需求的产
学位