基于文本分析的公众号内容运营辅助系统设计与实现

来源 :中山大学 | 被引量 : 1次 | 上传用户:zhuzubiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着内容运营行业的迅速崛起和微信公众平台的日趋普及,公众号不仅仅是传统媒介和新兴自媒体的舆论阵地,更发展为几乎所有企事业单位以及政府部门的营销和宣传窗口。于是,为广大公众号运营工作者服务的第三方平台应运而生。但由于微信生态圈相对封闭、选题构思工作的主观性强等原因,大多数现有平台的服务只停留于基础数据的采集和统计,却没有解决内容运营工作中整合资源低效、选题构思困难等核心问题。针对以上问题,本文利用文本分析技术,设计并实现了一个公众号内容运营辅助系统,主要提供了构思推荐和素材管理等功能,提高了运营工作的效率和质量。本系统主要包含数据采集、数据处理和系统管理三个模块。数据采集模块使用实时采集、定时采集等方法,对浏览记录、热门渠道和公众号等多种渠道的数据进行采集,扩大了选题的来源范围。数据处理模块采用文本聚类和启发词抽取相结合的方法,对不同来源的数据进行分析和处理。为了帮助运营人员选题构思,本文提出“启发词”的概念,并基于关键词抽取和新词发现等算法,设计出启发词抽取方法。文本聚类和启发词抽取两种技术相结合,可以得到不同维度的启发词,以辅助运营人员寻找新颖的写作切入点。系统管理模块通过整合数据处理结果并控制系统逻辑流程,为选题推荐等功能提供Web后台服务。本系统针对数据类型多样化的特点,基于MongoDB和Elasticsearch实现了系统的数据存储方案,充分发挥了前者的高效查询和后者的实时搜索等优势,有效地支撑了数据的采集和处理过程。本文设计并完成了特征选择、特征维数、特征模型和启发词抽取等多组对比实验,实验结果验证了本系统采用的文本分析方法的有效性。线上实践与用户反馈证明,本系统能够达到协助用户整合素材和选题构思的目的,具有较高的实用价值。目前,本系统稳定运行于某新媒体数据挖掘公司的线上项目中,表现良好。
其他文献
当数据时代方兴未艾、物化时代迅速崛起时,“工具人”屡屡被提及,工具人现象也无可避免地投影到体制内。无论是“被工具人”还是自甘沦陷,不管职位高低,体制内的似乎总能在以下类型中对号入座。  忠犬型  指哪儿打哪儿  样本:兰州市委原副秘书长金晋哲是典型的“忠犬型”下属。跟随“老领导”虞海燕从国企酒钢到党政机关,从地方到省城。为了“尽忠”,他对虞海燕言听计从。虞海燕在担任兰州市委书记期间整合成立了一个督
<正>数学解题,解法往往千变万化.也就是说,一道试题,也许存在许多种不同的解法.这些解法究竟都是怎么想到的呢?也许是经验,也许是感觉,也许是运气.笔者认为,经验需要实践来积
以平面比奥固结理论为基础,考虑土的粘滞性,采用粘弹塑性本构模型,系统地介绍利用有限元处理堆载预压加固软基路堤的数值方法。通过对工程实例的数值计算,分析固结和流变对。地基
为有效防治夏玉米苗期二点委夜蛾的为害,通过人工接虫方法研究了其幼虫虫口密度(x)与玉米缺苗率(y)的关系,采用人工去苗模拟为害方法研究了玉米缺苗率(y)与产量损失(z)的关系
当前,网络意见领袖的话语权越来越大,在大学生中的影响力与日俱增。高职院校网络意见领袖的能力构成主要包括较强的政治鉴别力、敏锐的热点洞察力、深刻的信息整合力、出色的