基于Flask的汽车新闻生成系统的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:zzjqwerty6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在新闻写作领域,人工生产新闻内容一直存在着效率瓶颈。一篇新闻的产生,需要编辑从收集数据开始到编写结束全程参与。在这个过程中,面临的问题主要是产量低下并且新闻的准确性难以保证。随着人工智能技术的发展,新闻写作领域开始使用机器辅助编辑生产文章内容。目前行业内,机器新闻写作的尝试仍局限于体育,财经和突发性事件等领域。国内没有公司涉足汽车领域的机器新闻写作,这使得汽车领域的机器新闻写作有着很高的实现价值。本篇论文在这样的背景下讨论如何为汽车新闻编辑定制一个帮助编辑提高写作效率的系统。艾耕科技公司为老司机汽车网的汽车新闻编辑设计实现一个汽车新闻生成系统。本系统收集汽车领域的相关新闻素材,通过调用建好的文章模板的方式,对相关新闻素材进行整理拼接,生成一篇基础新闻来供编辑修改和完善。本系统利用人工智能技术提供很多智能化功能帮助编辑写作,如文字和图片等内容的自动推荐功能。后台将编辑对于文章修改的内容记录下来发送给运营人员,再由运营人员负责优化对应的生产基础新闻的机器模板。本系统通过人工智能的辅助形成了一种从文章模板自动生成到编辑优化的编辑生产新模式,改变了以往编辑全部手动撰写新闻的工作方式。汽车新闻生成系统主要使用Flask作为框架,实现服务端的业务逻辑,利用Hive数据工具,为新闻数据的存储更新提供支持。数据层使用Flask扩展包SQLAlchemy数据库工具,提供与My SQL数据库的交互。Flask支持开发直接安装的python库,可降低与其他部门对接的成本,并且可大幅提升整体系统的响应速度。汽车新闻生成系统成功地将汽车编辑的生产效率提高四倍,由以前的两个小时到现在平均半个小时生产一篇文章。目前本系统已经发展到可以覆盖汽车新闻品类中的一半新闻主题,显著提高汽车新闻的质量和汽车新闻编辑的写作效率。
其他文献
图像作为一种重要的信息传递载体,在其生命周期过程中会受到各种因素的影响,从而引入噪声。噪声图像丢失了一部分信息,不仅阻碍了人对图像信息的获取,而且也对各种图像任务的准确率,例如图像分割、目标检测等产生直接的影响。因此进行图像去噪研究是一项非常重要的任务。经典图像去噪算法是一种基于数学方式的优化方法,其去噪过程是一个数学优化过程。如果图像分辨率很高,去噪处理需要花费很长的时间。因此经典图像去噪算法很
学位
近年来,随着中国经济的快速发展,国内银行市场不断扩张,相应支撑银行各种业务的信息系统也不断增多。作为特殊领域的银行应用系统,有着极为严格的监管要求,需要对应用系统服务器状态、数据业务状态等实施细粒度实时监控。然而,现有银行监控系统监控场景单一,监控后的告警信息缺乏有效管理,加上异构数据比例越来越大,无法挖掘大量数据的隐藏价值。此外,新的业务场景在产生大量数据的同时,还要求对这些数据进行高效处理,给
学位
近些年来,深度学习技术备受瞩目,在计算机视觉、自然语言处理等各个计算机技术领域大放异彩,取得了超越传统方法的效果。图像的重建与生成是计算机视觉领域重要的研究方向之一。图像重建(Image Reconstruction)旨在通过低层次稀疏的语义信息,通过各种手段去还原获得原始的高层次丰富的图像信息。无论在艺术领域的AI辅助绘图,工业设计领域的原型快速批量生成,还是在刑侦领域的嫌疑人肖像重建,图像重建
学位
随着华泰证券公司IT工作平台的模块数量日益增加,为了实现IT资源的高可用性,降低数据中心的运维成本,公司已经基本初步实现了“虚拟化数字中心”的建设。而传统的基于后台的虚拟化服务器管理方式,随着服务器数量的逐渐增加,管理员的工作强度也会相应增加。所以本文提出了面向华泰证券公司运维人员使用的服务器部署推荐系统,运维人员在系统中对公司机房内的服务器进行上架和下架,通过对于数据库中服务器信息的即时维护,使
学位
近些年来,随着软件规模的不断增长,加之软件需求的多样性、数字环境的复杂性、一致性、易变性和不可见性等因素的影响,软件的开发效率和质量仍无法满足软件产业发展的客观需要。因此,软件技术不断更新,其中用户需求的复用颇受关注。需求工程是软件开发过程中最早的阶段,用户需求的复用可以节约需求分析的时间,还可以帮助快速定位到其它可复用的软件资产。为了方便用户需求的复用,需要将非正式的、非结构化的用户需求转写为结
学位
随着信息产业的发展,软件产品的规模逐渐增大,企业中软件系统的回归测试成本也在迅速增加。许多企业面临测试时间长、效率低的问题。如何能够提高测试过程的效率和准确率是回归测试中一个重要的问题。为了解决这一问题,研究人员提出了测试用例优先级(TCP,Test Case Prioritization)技术,通过对测试用例进行排序,使代码缺陷尽早的被发现,缩短从测试人员发现故障到开发人员进行修复的时间。目前企
学位
随着对知识图谱的研究不断深入,以事件为核心进行知识组织表示的方式逐渐被提出。已有的知识库通常关注“实体”以及“实体间的关系”,而忽视“事件间的逻辑”。但是,在真实场景的应用中,事理逻辑是一种极具价值的认知知识,对于这种知识的挖掘将使得人们对自身行为和社会发展变化规律的认识更加深刻。事理图谱就是以“事件”为核心而提出的新型知识存储形式,本质上它同样是一种知识的结构化表示方式,但由于其对事件的演化,通
学位
社交化客户关系管理(Social Customer Relationship Management,SCRM)是在技术平台、商业规则、工作流程和社会特征支持下的一种企业哲学和商业策略,旨在使客户与企业协同联动,以便在可信、透明的商业环境中实现互惠互利的价值共赢。这是企业对客户话语权的积极响应。随着互联网的高速发展和Web2.0时代的到来,客户关系管理正在由以客户为中心的CRM逐步向以社交化媒体为中
学位
构建于传统企业级数据仓库之上的应用系统大都采用SQL结构化查询语言来访问数据,并广泛使用PL/SQL(Procedural Language/SQL,过程化SQL语言)来实现复杂业务逻辑。在大数据时代,基于传统关系型数据库或大规模并行处理架构建设的数据仓库已无法满足企业对于海量数据的处理需求,企业亟需将传统数仓应用平滑迁移至大数据平台。但是大部分现有大数据平台的数仓解决方案对于SQL语言的支持力度
学位
现代软件的开发大部分都采用敏捷开发模式,软件迭代周期大大缩短,每天都要进行持续集成,继而发布新的版本。每次的软件发布都有一系列需要遵循的过程,包括源代码获取、代码扫描、单元测试、代码构建、测试环境部署、接口测试、灰度部署等步骤。如果人工来完成这些步骤,不仅费时费力而且容易出现错误,开发效率也随之降低。在这样的背景下通过建设持续交付流水线平台,可以基于代码变更全自动化地完成测试、构建、部署等一系列行
学位