【摘 要】
:
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率(Term FrequencyInverse Document Frequency,TF-IDF)与基于Transformer的双向编码表征(Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术.采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT"两段式"检索过滤模型深入挖掘文本信
【基金项目】
:
对外经济贸易大学惠园优秀青年学者项目"基于大数据背景下的我国宏观经济监测、预测及预警研究"(18YQ04);
论文部分内容阅读
本文创新地将半监督交互式关键词提取算法词频-逆向文件频率(Term FrequencyInverse Document Frequency,TF-IDF)与基于Transformer的双向编码表征(Bidirectional Encoder Representation from Transformers,BERT)模型相结合,设计出一种扩展CPI预测种子关键词的文本挖掘技术.采用交互式TF-IDF算法,对原始CPI预测种子关键词汇广度上进行扩展,在此基础上通过BERT"两段式"检索过滤模型深入挖掘文本信息并匹配关键词,实现CPI预测关键词深度上的扩展,从而构建了CPI预测的关键词库.在此基础上,本文进一步对文本挖掘技术特征扩展前后的关键词建立预测模型进行对比分析.研究表明,相比于传统的关键词提取算法,交互式TF-IDF算法不仅无需借助语料库,而且还允许种子词的输入.同时,BERT模型通过迁移学习的方式对基础模型进行微调,学习特定领域知识,在CPI预测问题中很好地实现了语言表征、语义拓展与人机交互.相对于传统文本挖掘技术,本文设计的文本挖掘技术具有较强的泛化表征能力,在84个CPI预测关键种子词的基础上,扩充后的关键词对CPI具有更高的预测准确度和更充分的解释性.本文针对CPI预测问题设计的文本挖掘技术,也为建立其他宏观经济指标关键词词库提供新的研究思路与参考价值.
其他文献
本文在三部门经济框架下拓展了Harris和Todaro(1970)关于劳动力流动及其经济与社会影响的H-T模型,对养老保险可携带性影响农村劳动力流动的收入增长效应和贫富调节机制开展了理论及实证研究.结果显示:经济发展水平和产业层级在地区之间的梯度分化与城乡之间高达1.9~2.6倍的收入差距,是农村劳动力向城镇流动以及在不同城镇之间跨区流动的根本原因.养老保险可携带性是通过改变流动成本和流动收益影响农村劳动力的流动效率和流动方向,具有显著的收入增长效应和贫富调节作用.提高养老保险可携带性在2000—2019
作为重大突发公共卫生事件,传染病疫情风险是一个值得关注的前沿新论题.本文从一个较新的网络拓扑视角,以新冠肺炎疫情为例,构建了一个由病毒感染人群流动形成的城市间疫情关联网络,并探讨了城市在疫情关联网络中的位置对其疫情风险的影响.研究发现,城市之间的传染病疫情呈现出紧密的网络关联性;疫情的风险程度与城市在疫情关联网络中的位置密切相关,处在网络重要位置的城市与其他城市关联度较高,从而面临更大的疫情风险,这一点在针对城市群和交通枢纽聚集性感染风险研究中尤为突出.拓展分析表明,城市网络中心度具有疫情扩散风险放大效应
一rn香港大屿山,21世纪初新增添了一处绝美的风景:心经简林.从昂坪的宝莲禅寺一路往海边走,可见由38条高大木柱组成的户外木刻群,将饶宗颐先生的汉简心经书法作品,镌刻在来自
本文以2011—2019年我国医药制造业上市企业为样本,考察了高管团队风险偏好、失败再创新行为与再创新绩效间的关系.研究表明,高管团队风险偏好正向影响失败后技术开发阶段再创新绩效,但负向影响失败后成果转化阶段再创新绩效.失败后全新创新在高管团队风险偏好与失败后两阶段再创新绩效间皆存在中介作用,而失败后追加创新未见中介作用.同时,高管团队风险偏好对失败后两阶段再创新绩效的影响较对成功后两阶段再创新绩效更显著,且失败后全新创新较成功后全新创新的中介作用更显著.本文旨在为企业构建合理的高管团队、改善其失败再创新
冷战后,中国国际关系研究领域出现了一种流行观点,即英美之间的霸权转移是以和平方式进行的。对这一观念的重新考察表明,“英美霸权和平转移论”赖以存在的前提和史实都不无争议,且其传播带有意识形态色彩。首先,将和平视为没有战争的状态,可能是一定历史时期、地域和文化等背景下的社会意识,已经遭到越来越多的质疑。其次,即使以消极和平观作为判断依据,英美之间没有直接战争,并不等同于英美霸权转移过程中没有发生战争。最后,对“英美霸权和平转移论”源头和传播背景的追溯表明,其理论带有明显的美国中心论和文化霸权等意识形态色彩,隐
航空运输是中美经贸活动、文化交流的桥梁和纽带,为中美乃至世界经济的发展做出了重要贡献。航权是开展航空运输的权利基础,是主权的体现和延伸,是基于主权基础上的权利交换。新冠肺炎疫情下确保国家安全是主权国家的首要责任和义务,一国有权对授予他国承运人的航权予以限制。新冠肺炎疫情导致履约的基础完全丧失。中国对美国航权的限制,并未剥夺美国承运人公平竞争的机会。竞争对抗将成为今后一个时期中美关系的主基调,航权必将是中美间持续关注的议题。应高度重视法律在处理对外事务中的作用,积极运用法律维护自身权益。摒弃“内外有别”的管
尽管国内价值链战略被视为助推中国产业发展的重要途径,但受制于忽略异质性的不足,已有研究很难进行企业层面的系统分析.有鉴于此,本文通过汲取增加值贸易与微观计量的双重优势,整合2002年、2007年、2010年、2012年省(区、市)间投入产出数据、工业企业数据与海关数据的海量信息,构建了一个可以连接新新贸易理论与国内价值链的分析框架.结果显示:我国制造业的国内价值链嵌入度大幅提升,但是提升背后隐藏着偏好加工制造、排斥服务投入的倾向;进一步考虑贸易类型、区域空间与所有制差异,也未改变国内价值链嵌入度的上述倾向
在现行农村土地制度下,土地经营权流转能否在增加农民收入的同时缩小收入差距是必须回答的现实问题.本文使用全国25省(自治区、直辖市) 180个村的固定观察点数据,从收入增长和收入差距两个层面,分析了土地经营权流转对农村居民收入分配的影响效应.回归结果表明,土地经营权流转(包括土地转入和土地转出)在平均意义上显著促进了农户人均收入水平的提升.条件分位数处理效应模型的估计结果表明,土地经营权流转对农户人均收入的影响效应随收入分位点的提高而上升,这说明土地经营权流转在一定程度上扩大了农民内部的收入差距.进一步使用
门限因子模型设定载荷具有阈值型区制转换结构,可以同时刻画高维时间序列的共变性和区制转换特征.针对高维门限因子模型,本文基于自适应组LASSO技术给出了一种一致模型选择过程.这一模型选择过程将因子个数设定、门限效应推断纳入统一的分析框架,不仅解决了模型选择的一致性问题,还同时实现了模型选择误差的统一控制,这对于高维门限因子模型而言是非常重要的.理论研究和随机模拟结论表明本文给出的一致模型选择过程具有良好的大样本性质和有限样本表现.最后,本文将门限因子模型应用于我国金融市场分析,实证结果进一步验证了本文理论的
印太地区已成为大国博弈的重要区域,深刻影响着世界秩序的未来走向。作为曾经的域外霸权国,英国的“印太政策”体现出内在的承继性与代表性。通过梳理和考察英国对外政策的历史演变,发现英国尽管在整体上从属和联动于美国的全球战略,但其“印太政策”具有自身的路径依赖与政策目标。具体而言,英国依托帝国历史遗产,通过提升与局势稳定英联邦成员的合作水平,同时加大对欠发达英联邦成员的援助力度,强化与印太地区英联邦国家的历史纽带。与此同时,英国持续强化印太地区的军事存在,发挥印度洋领地的战略支点作用,加强与南太岛国互动,以提升在