基于机器学习算法的在线公益众筹平台项目预测模型研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jacklong1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网金融蓬勃发展,其便利性和快捷性对人们的生活产生了深远的影响。它不仅是对线下业务的补充,而且还对在线业务进行了很多创新。众筹模式就是其中之一,它使用互联网为特定项目筹集资金,从而改变了以前的投资和筹资模式,并广泛用于创新项目的筹资中。像众筹网和轻松筹这样的在线公益众筹平台允许特定的项目通过大量的人有针对性的捐款来获得资金。在众筹项目发布前或发布后对项目能否成功进行预测,有助于提高众筹项目的成功率,降低不必要的人力成本。而公益众筹项目成功的关键是招募和捐赠者的持续参与。目前公益项目捐赠者流失率超过70%,在线公益众筹平台以及传统的线下非营利组织面临的一个重大挑战是捐赠者保留问题。增加捐赠者保留率将对在线筹款活动的效果产生重大影响,捐赠者保留率提高10%,获得的捐赠就会增加200%。因此,本文以一家线上教育募资机构Donors Choose(DC.org)为例,运用机器学习技术构建有效的项目成功性预测模型和捐赠者保留预测模型,主要的研究工作有:第一,从多个维度提取收集的DC.org数据集数据变量,其中包括项目、学校、老师、捐赠者、捐赠信息等数据,对数据进行进一步处理,通过特征工程提取用于构建模型的数据。第二,针对经典的机器学习算法(逻辑回归、决策树)和集成学习算法(GBDT、XGBoost、Light GBM)以及基于Stacking融合模型,分别构建公益众筹项目成功性分类预测模型,并采用混淆矩阵评估指标对结果进行对比分析。第三,从构建的公益众筹项目成功性分类预测模型中选择出最适合DC.org平台的分类预测模型,将其应用到捐赠者保留预测问题上,构建捐赠者保留预测分类模型,并在不同特征组合集上输出AUC值进行比较分析。本文基于DC.org数百万捐赠者捐赠的大规模数据,构建了基于不同机器学习模型的项目成功性预测模型,为在线众筹平台成功性预测提供了方法,并通过模型融合的方法进一步提升了模型性能;探讨了影响捐献者保留率的各种因素,识别了不同的捐献者群体,并量化了他们对后续捐献的回报倾向,通过Stacking融合模型建立了有较好准确性的捐赠者保留预测模型,从而帮助在线众筹平台更好地把控捐赠者流失原因,使项目更容易成功地筹到更多资金。
其他文献
十九届五中全会提出以推动高质量发展为主题,在经济高质量发展的大背景下,城镇化高质量发展是解决新时代社会主要矛盾的关键路径。中国在加速推动城镇化进程中,还存在着诸多质量问题,如城镇化速度和规模扩张过快、土地城镇化快于人口城镇化、发展质量与效率低下、城乡融合发展不足、环境污染等。因此,新时代城镇化需要由规模扩张型阶段转型到质量提升型阶段。城镇化高质量发展不仅是中国经济进入高质量发展阶段的必然要求,也是
学位
随着物联网的蓬勃发展以及智能终端的快速普及,生物特征身份识别技术已经被广泛应用于公安、司法、金融等领域,尤其是社会生活领域(比如智能家居)。相较于动态口令、静态密码和智能卡等传统身份认证方式,生物特征由于其不可复制、不可撤销等特点,能够更加便携有效地实现身份认证,并且在智慧家庭服务中得到了很好的应用,比如门禁系统的虹膜识别、智能音箱的声纹识别、智能监控的人脸识别等等。然而,生物特征身份识别技术在为
学位
物联网实时感知环境、收集数据,帮助人们做出更优的决策,在交通、医疗、工业等领域发挥着重要的作用.随着用户与智能设备交互产生的数据量不断增多,物联网应用安全问题也不断涌现.车联网作为一种构建智能交通系统的物联网应用,也同样存在诸多通信安全问题.认证与密钥协商协议是保证物联网数据通信安全的重要手段.为了满足物联网不同的通信模型和安全需求,需要构建特定的认证协议.本文主要针对轻量级、三因素和多服务器等需
学位
进入21世纪,日益严重的自然资源短缺和环境污染问题使政府和社会各界越来越重视循环经济的发展。再制造作为实现经济循环发展的有效途径之一,逐渐受到了重视,其不仅能有效地利用废旧产品的剩余价值、节约成本,而且有助于减少碳排放量、保护环境。如苹果、华为以及IBM等公司积极回收废旧产品以再制造。但是再制造产品的销售模式不尽相同,一部分制造商采取外包模式,另一部分采取授权模式,目前暂不清楚现实中为什么制造商对
学位
近年来,无人机在国家战略安全和国计民生方面发挥着越来越重要的作用,特别在战略侦查、通信中继、物流配送等方面,已经得到规模化应用。无人机的控制方式也随着技术的发展,由传统单一化、机械化,逐步向多样化、智能化演变。语音识别作为一种重要的人机交互技术,能够与无人机操作有机结合,从而大幅降低其操作的复杂度、简化指令生成步骤、隐藏控制细节、提高执行效率。目前主流的无人机语音识别与控制系统高度依赖深度神经网络
学位
随着电子商务的发展,淘宝、拼多多、创客云商等传统和新兴电商平台也在迅速发展,与此同时,三人商城电商平台是新出现的一种基于通证经济和会员制的社群电商平台,它试图通过会员制和通证经济模式,扩大消费者基础并获得更高的利润。在此平台的商业模式背景下,本文主要的研究问题是该平台应该如何制定会员费用和通证分红规则以吸引消费者并使平台利润最大。本文的主要研究内容和成果包括:本文使用文献研究法,对与通证经济、网络
学位
随着我国经济由高速发展向高质量发展转变,企业技术创新能力的重要性愈发凸显。资本市场是社会经济资源配置的重要场所,是技术创新的重要供给侧之一,与企业技术创新能力的提升息息相关。因此2018年习近平总书记提出设立科创板并实施注册制,这是资本市场里程碑式的事件。2019年7月22日科创板正式在上交所落地。已经运行十年的创业板和科创板在服务对象上有所重合,而且科创板还具有很多创业板没有的优势。在借鉴科创板
学位
目前,随着互联网技术和社会经济的发展,很多企业面临着外部环境竞争大、内部管理混乱和资金链断裂等各种问题,由于受到各种影响因素的制约,使得企业出现了严重的财务风险,不但危及企业自身的生存与发展,也给投资者、债权人以及众多利益相关者带来重大损失。因此,建立一个适用于我国企业的财务风险预警模型具有重要的现实意义,以期通过预警模型及时地发现问题,提出有效措施,降低财务风险,让企业健康的、持续的发展。本研究
学位
随着我国航天事业和卫星产业的飞速发展,自然灾害预警、地理空间信息监测、人口流动分析等需求不断增长。诸多因素共同导致我国卫星网络和卫星产业进一步发展,催生出了天地一体化信息网络。因此,天地一体化信息网络的建设已经成为当前全球科技和产业发展的研究热点和重点。然而,由于天地一体化信息网络的卫星节点暴露、星地/星间链路开放、通信时延方差大、星载设备资源受限、低轨卫星网络拓扑结构高度动态变化和星际链路快速频
学位
证券的投资组合选择问题作为现代金融理论和实践的一个重要研究内容,受到学术界和金融投资实务界的广泛关注和探索。无论是经典的Markowitz均值-方差模型,或是后续发展出的一系列“均值-风险”模型,又或是最小方差模型、等权重模型、效用函数最大化模型等,这些投资组合选择模型经过学者们的深入探索都在逐渐趋于成熟,但在实际投资运用中,仍然会面临样本内表现不一致、样本外表现较差的情况。因此,在前人研究成果的
学位