【摘 要】
:
新闻系统如果不能有效的进行新闻分类和个性化推荐,势必会影响到用户的使用效率和使用兴趣。本文通过自然语言处理技术、文本分类技术、协同过滤算法等技术构建新闻自动分类
【基金项目】
:
江苏省基础教育资源网络化工程技术中心开放项目(项目编号:BM2013123);江苏省大学生创新创业训练计划项目(项目编号:201711460008Y)
论文部分内容阅读
新闻系统如果不能有效的进行新闻分类和个性化推荐,势必会影响到用户的使用效率和使用兴趣。本文通过自然语言处理技术、文本分类技术、协同过滤算法等技术构建新闻自动分类和推荐系统,对发布的新闻内容进行分词处理以及分类训练,从而自动判断新闻的所属类别,如果用户对系统反馈的分类结果不满意,还可以手动的进行修改分类,以便后期不定时的对属性进行更新。再通过协同过滤算法计算出用户间的相似度,进一步计算出与被推荐用户相似度较高的用户,将该用户浏览过但被推荐用户未曾浏览的新闻推荐给用户进行查看。本文是以复旦大学李荣陆用于文本分类研究所使用的新闻语料库为基础,通过此库来进行文本分类准确性的测试。测试结果表明,本系统能够很好的服务于新闻用户,体现出新闻系统的个性化。
其他文献
首先分析了传统多媒体课件系统存在的弊端,并从本质上比较了C/S和B/S这两种体系结构的优劣,在此基础上设计并实现了基于B/S体系结构的多媒体课件系统。最后,用JSP技术实现该
非热门微博谣言的影响力在微博社区迈向低活跃度特征和结构扁平化后逐渐凸显,对社会稳定和大众心理带来的负面效应逐渐增大。以非热门微博谣言的概念界定和产生过程为出发点,
以齿轮箱集中润滑系统和变浆轴承集中润滑系统为例对海上风力发电机组集中润滑系统进行设计分析,并对选型计算以及润滑油脂选择进行了研究说明。海上风力发电机组采用集中润
随着信息技术的飞速发展,企业内部IT支撑网络规模不断扩张。以内蒙古移动为例,现已建成覆盖全区的业务支撑、网管支撑及管理支撑三大IT支撑网络。但各支撑域网络独立规划、建
<正>好的纪录片就是曲折的故事,让"小意思"生发出"大意义"。早在2007年我就看过一本书,名字就叫《舌尖上的中国》,书里介绍了中国的各类美食,看上去心驰神往,特别是书名,一看
青岛客运段现有职工3798人,其中女职工1665名(劳务工821人),占全段职工总数44%。段女职委针对段内女职工多,年龄跨度大、分布广泛的特点,充分调动女职工的工作热情和积极性,发挥女职
<正>关于温胆汤,历来有很多疑问:其一是方名,为什么把这个方子命名为"温胆汤"?其二是用途,本方原为"胆虚寒"证而设,今人主要用来治疗痰证,古今用途为何如此悬殊?其三是古人所
采用分光光度法测定婴幼儿奶粉中左旋肉碱的含量。通过对婴幼儿奶粉中左旋肉碱的测定进行不确定度的评估,表达出了合成标准不确定度和扩展不确定度,为评价左旋肉碱测定结果的
对大豆油中相对密度进行不确定度的评定,建立不确定度评定程序和方法。依据GB/T5526—1985《植物油脂检验比重测定法》建立数学模型,进行不确定度的计算并合成不确定度。找出
随着基因测序成本的降低和生物信息学数据分析的日趋完善,特别是结合目标区域捕获技术,高通量测序技术已逐步走向了临床应用,尤其是在孟德尔遗传病的致病基因检测中应用日趋