论文部分内容阅读
【摘要】“今日头条”属于聚合类新闻客户端的主要代表之一,“今日头条”更新的众多聚合类信息产生使“把关”模式遇到考验,传统的“把关”模式已经不能适应聚合类新闻客户端未来的发展趋势,聚合类新闻客户端饱受考验。本文重点运用个案分析法,通过对“今日头条”这个聚合类新闻客户端的代表之作展开探讨,结合相关资料,探索聚合类新闻客户端的信息审核。
【关键词】今日头条;信息审核;聚合类新闻客户端;
中图分类号:TN94 文献标识码:A DOI:10.12246/j.issn.1673-0348.2021.09.056
1. 聚合类新闻客户端信息审核流程
1.1. 聚合类新闻客户端的内容生产
聚合类客户端的资讯通过传统媒体进入平台当中更新信息内容与自媒体形成的内容两部分所组成聚合类新闻客户端各样的信息资源,其内容来源重点包括三方面:UGC(通过用户输出信息)、PGC(专业内容输出)和爬虫技术获得。
针对“今日头条”展开分析,现阶段,今日头条不单单涵盖了传统的社交网站、论坛、新闻用户网站以及传统媒体网站等广泛的内容,同时还涵盖了专业媒体,其头条号数量突破了120万个,每天都能够为用户提供广泛的新颖内容。
作为内容分发平台,头条扩展了自己的内容资源,丰富了自己的内容形式,基于核心技术的优势构建了内容产品矩阵,并在新时代为用户提供了多种内容和信息形式需求。此外,随着信息服务业态的更新,头条将继续连接和重组其自己的内容产品平台。这有效地减少了用户在不同平台之间切换的时间成本,并使平台保持更新。
1.2. 聚合类新闻客户端的信息审核——以今日头条为例
在审核机制方面,今日头条要求非常高,图文信息的审核方式即是人工+机器,而视频内容都是通过人工模式。现阶段,每天今日头条更新的内容达到了50万条。在人工审核方面,今日头条的团队人数突破了6000余人,其涵盖了评论审核、视频审核、图文审核等,不单单包括六千人专业审核团队,今日头条还确立了打击算法模型,专门应对低谷低质内容,其识别的模式包括技术识别与人工审核。在内容安全维护上,“今日头条”实施了多层复检的审核流程,即机器算法与人工编辑。系统算法根据风险内容甄别技术(低俗模型,谩骂模型以及鉴黄模型)以及泛低质内容甄别技术(假新闻、内容质量差、标题党、题文不符、黑稿等)对平台内容展开广泛初审核,被判断成劣质内容再次展开复审,还没通过第三次审核的内容会直接抛弃淘汰。
1.3. 聚合类新闻客户端的内容推广与反馈
今日头条属于中国聚合类新闻客户端发展的先锋,其成果饱受人们重视,并且备受用户重视,了解问题最广泛的也是解决用户需求方面。今日头条在相应地解决受众阅读需求量,同样也重视反馈信息。在运用环节当中,用户碰到的相关建议或者问题时,都能够依靠平台提交,这同样也是bug意见征集与反馈的渠道之一。
用户的点赞、转发、评论以及阅读行为的运用行为都是通过数据的模式被标记,并且展开概括与总结。平台根据厚数据与大数据发展成用户画像,根据机器算法逻辑,进一步开发用户喜欢的领域,展开具体的偏好分类,同时按照各个归纳标签展开内容分布。最初算法程序所记载的内容并不多,然而伴随着应用的群体变多,标记信息也在不断健全,可以说是机器比用户还了解用户,通过数据的标记,算法新闻产出才能够往更好的方向前进。
2. 大数据算法下信息审核模式的问题
2.1. 产生“过滤气泡”形成“信息茧房”
算法通过数据抓取而形成用户画像,基于用户画像为用户推荐相关内容,因此在数据的引导之下,算法不断给用户提供带有自己偏好的内容,而一定程度上阻止了其他内容被发现。在这种环境之下,诞生了“过滤气泡”。大数据时代各平台利用算法通过抓取预测用户爱好,大量向用户推送同质化的信息,在满足用户兴趣的同时,使得用户在不知不觉间被自己的兴趣所束缚,生活在了算法推荐造就的“过滤气泡”当中。
用户在聚合类新闻客户端筛选内容时,绝非是针对所有内容都一一接收,他们会根据个人本身的需求和意愿对内容进行挑选,在信息接收过程有对相关内容所侧重或者产生不同的见解,通过过滤自己不认同或者有悖于自己喜好的信息,使相关的思维方式、本来的价值体系以及所获得的信息得以统一,杜绝不和谐感形成。随着长时间的积累,用户通过选择性注意,大量接收同质化的信息使得个人信息面变得狭窄,选择性接触和选择性注意会强化自身已有观点,大量同质化信息的接为自己搭建起一个信息的“茧房”。大量同质化信息聚合而成的“信息茧房”会加剧个人意识偏见,在交流沟通中形成甚至加固话语壁垒。
2.2. 人工智能建模不完善与“把关人”标准不统一
在聚合类新闻客户端里面的系统算法运用风险内容甄別技术,设计无数个图片样本集的鉴黄模型,仍然存在漏洞,模型还需要不断被完善。
虽然,国家网信办制订了许多相关规章条例,其目的在于监管与控制网络环境,同时新闻传媒行业逐渐地被社会泛娱乐化所渗透,大部分的聚合新闻平台都是由于客户喜欢,追逐娱乐化,导致信息环境低俗化以及低质化。并且,因为在算法新闻生产当中中,聚合类新闻客户端内容尽管是按照网信办以及内部指令的要求去开展的,其推荐的前提下是按照用户的身份特征与喜好,针对部分的推荐,审核人员的要求都是有差异的,然而只要是遵守法律的内容都会由于用户需求而被广泛推荐。普通的审核人员由于没有专业新闻素养,导致受众接收信息更加繁杂,进而导致网络环境更加恶劣,最明显的体现是标题党大量运用,导致虚假新闻广泛进入到市场当中,泛娱乐化现象十分严重。 2.3. 相关法律并不完善且责任追究困难
虽然,自媒体平台企业“今日头条”在算法技术的加持下融入了人工审核与人工编辑,然而这一平台还是有诸多泛娱乐的现象。在2018年,“今日头条”由于存在假广告以及内容侵权现象而被起诉上法庭,同时国信办还专门与今日头条旗下的娱乐类APP火山小视频进行了约谈。2017年至今,今日头条与其所管辖的产品由于内容低劣、广告虚假、侵权盗权等,同时其也被权威媒体与国家部门专门点评与整顿,次数达到了20多次,这些媒体包括央视新闻、人民日报等。
多次出现这样的问题说明相关法律并不完善,而且聚合类新闻客户端的内容生产很大一部分是用户内容生产,当在平台出现低俗内容时,追究到个人责任存在困难。
3. 大数据算法下信息审核模式的完善
3.1. 解决数据失衡与打破“信息茧房”
一款产品怎样才可以更精准地把握用户的偏好程度,能够用最短的时间了解用户的口味变化,在用户都未察觉的情况下,推荐其所喜欢的事物。所以,提高用户新动作的百分比,减少老动作的百分比,把两者间存在的信息更新时间差减少,能够更好地降低数据偏差的弊端。这中间所包括的是广泛对于大数据运用的标准,同时对于公司实验平台提出更严格的标准。
用户的使用行为是促使产生“信息茧房”的因素中非常重要的部分,为了减少“信息茧房”带来的不利影响,有必要提高用户的媒介素养。媒介素养对很多方面的能力都有要求,包括用户选择信息以及对媒介和渠道的认知等。互联网的出现和发展开拓了我们接触新资讯的通道,也为更多传播者提供了传播信息的平台。因此,用户提高媒介素养最重要的是树立打破“信息茧房”的意识,积极拓展信息资源渠道。
目前,大多数聚合类新闻客户端所采用的是算法推荐原理,首先是将用户的信息与行为来进行从而建立“用户画像”,其次是运用协同过滤技术,即根据分析用户群体间的相似性来推荐内容。为新闻客户端设置“用户画像”将使推荐内容更加准确,但协同过滤技术将在某种程度上缓解算法的过滤行为并提供可能满足用户需求的内容,同时将之推荐至主页。然而,部分用户十分被动地获得同类信息的内容。他们想接受他们感兴趣但不了解的某些主题,或者客户可以从其他角度打断并推送一些新主题或新内容。大多数用户希望通过聚合类新闻客户端来拓宽视野并获得各种信息内容。
在对聚合类新闻客户端的的发展未来作出分析,针对今日头条为例,能够更好地强化对协同过滤法技术的探讨与运用。客户端要求不断完善其“用户画像”技术,进而通过更加细化的标签精准地推荐信息;同时,客户还要求重视过滤算法技术的关键性,并需要进行更多的研究。通过相互补充并弥补彼此的缺点,这两种技术可以在某种程度上减少“信息茧房”的影响,并拓宽用户的内容范围。
3.2. 加强用户审核入网并设置多重“把关人”
多重“把关人”也就是多重的审核机制,从用户入网时就设立审核机制,比如:用户实名制和人脸认证。假设用户注册账号时,要求依靠登录身份信息同时展开人脸认证。并且在注册账号时,与用户签订协议,当账号出现问题时,用户需要负相关责任,且不得把账号对外出租或者转借。现在网上出现很多贩卖个人身份信息以及账号的事情。终归来说,就是审查不严格。
首先,在用户申请账号入网时进行身份认证以及信息审核,通过之后将进入到第二层审核即为人工智能,当用户在平台发布内容时,将运用人工智能进行算法审核。用户发布的内容通过算法审核后将进入第三层审核即为人工审核,人工审核由平台人工审核和用户所组成的审核团。
3.3. 区块链技术的应用与法律制度的完善
许多网络“键盘侠”之所以有恃无恐的发布着不良信息的重要的原因之一就是无法追究责任,网络虽非法外之地,但是治理起来困难重重,经过原作者发布然后再经过各方转发之后,其在网络上造成的传播范围之广,影响之深是无法想象的。虽然用户实名制已经逐渐完善,但是目前的追查难度依然很大,在面对许多不良信息或不良视频时依然无法做到追根溯源,即使追查到了源头,但这中间的传播者也无迹可寻。
那么如果我们把区块链技术应用到用户与媒体中去,这样一来对不法分子追根溯源就方便的多。区块链技术通过P2P模式展开数据搜索与上传,用户或者别的一方都能够融入系统展开自动化搜索,从而能够更好地了解到对方记录,数字加密必须要强化,不仅方便同时不易造假,极大地提高了信用的可信度,这样一来不仅能够找到信息的发布者,转发这种不法信息的人也是一目了然,更重要的是区块链技术可以让用户也成为监督者。新媒体技术造就了“人人皆媒”的时代,希望区块链技术造就一个“人人皆是把关人”的时代。一个完整的信息审核机制绝不仅仅是“人工审核+技术识别”这么简单,“拦截”只是其中一步,更重要的是用技术手段追溯发布者,排查传播者,给予这些人法律的严惩,以达到杀一儆百的目的。法律法规要健全,改进追查违法者的技术,技术识别与人工审核协作,共同构建成为一个完整的信息审核机制。
4. 结语
针对聚合类新闻客户端,人们的个性化信息的偏好的强烈感会不断增加,尽管提高了
聚合新闻平台的用户吸引性,然而也会产生问题,用户信息面將会越来越少,所以耗费在这一类客户上无价值阅读时间必然会增长。所以在此前提下,认识算法新闻生产的审核机制,持续思考合理高效率的审核方式就变得更加关键,在用户得到所需信息的过程当中,使公共网络信息环境更加优质。因此,针对聚合类客户端算法把关的不良信息展开整顿,用户、政府以及平台三者都要紧密配合,业内针对算法的持续研究在以后未来算法新闻形成与“人与机器共生”的分析当中尤为关键。
参考文献:
[1]耿伟茜.今日头条的内容运营策略研究[D].河北大学,2018
[2]李佳音.基于个性化推荐系统新闻客户端的“信息茧房”效应研究——以“今日头条”为例[D].中央民族大学,2017.
[3]杨舒涵.算法新闻生产中的把关机制研究[D].山东师范大学,2019
【关键词】今日头条;信息审核;聚合类新闻客户端;
中图分类号:TN94 文献标识码:A DOI:10.12246/j.issn.1673-0348.2021.09.056
1. 聚合类新闻客户端信息审核流程
1.1. 聚合类新闻客户端的内容生产
聚合类客户端的资讯通过传统媒体进入平台当中更新信息内容与自媒体形成的内容两部分所组成聚合类新闻客户端各样的信息资源,其内容来源重点包括三方面:UGC(通过用户输出信息)、PGC(专业内容输出)和爬虫技术获得。
针对“今日头条”展开分析,现阶段,今日头条不单单涵盖了传统的社交网站、论坛、新闻用户网站以及传统媒体网站等广泛的内容,同时还涵盖了专业媒体,其头条号数量突破了120万个,每天都能够为用户提供广泛的新颖内容。
作为内容分发平台,头条扩展了自己的内容资源,丰富了自己的内容形式,基于核心技术的优势构建了内容产品矩阵,并在新时代为用户提供了多种内容和信息形式需求。此外,随着信息服务业态的更新,头条将继续连接和重组其自己的内容产品平台。这有效地减少了用户在不同平台之间切换的时间成本,并使平台保持更新。
1.2. 聚合类新闻客户端的信息审核——以今日头条为例
在审核机制方面,今日头条要求非常高,图文信息的审核方式即是人工+机器,而视频内容都是通过人工模式。现阶段,每天今日头条更新的内容达到了50万条。在人工审核方面,今日头条的团队人数突破了6000余人,其涵盖了评论审核、视频审核、图文审核等,不单单包括六千人专业审核团队,今日头条还确立了打击算法模型,专门应对低谷低质内容,其识别的模式包括技术识别与人工审核。在内容安全维护上,“今日头条”实施了多层复检的审核流程,即机器算法与人工编辑。系统算法根据风险内容甄别技术(低俗模型,谩骂模型以及鉴黄模型)以及泛低质内容甄别技术(假新闻、内容质量差、标题党、题文不符、黑稿等)对平台内容展开广泛初审核,被判断成劣质内容再次展开复审,还没通过第三次审核的内容会直接抛弃淘汰。
1.3. 聚合类新闻客户端的内容推广与反馈
今日头条属于中国聚合类新闻客户端发展的先锋,其成果饱受人们重视,并且备受用户重视,了解问题最广泛的也是解决用户需求方面。今日头条在相应地解决受众阅读需求量,同样也重视反馈信息。在运用环节当中,用户碰到的相关建议或者问题时,都能够依靠平台提交,这同样也是bug意见征集与反馈的渠道之一。
用户的点赞、转发、评论以及阅读行为的运用行为都是通过数据的模式被标记,并且展开概括与总结。平台根据厚数据与大数据发展成用户画像,根据机器算法逻辑,进一步开发用户喜欢的领域,展开具体的偏好分类,同时按照各个归纳标签展开内容分布。最初算法程序所记载的内容并不多,然而伴随着应用的群体变多,标记信息也在不断健全,可以说是机器比用户还了解用户,通过数据的标记,算法新闻产出才能够往更好的方向前进。
2. 大数据算法下信息审核模式的问题
2.1. 产生“过滤气泡”形成“信息茧房”
算法通过数据抓取而形成用户画像,基于用户画像为用户推荐相关内容,因此在数据的引导之下,算法不断给用户提供带有自己偏好的内容,而一定程度上阻止了其他内容被发现。在这种环境之下,诞生了“过滤气泡”。大数据时代各平台利用算法通过抓取预测用户爱好,大量向用户推送同质化的信息,在满足用户兴趣的同时,使得用户在不知不觉间被自己的兴趣所束缚,生活在了算法推荐造就的“过滤气泡”当中。
用户在聚合类新闻客户端筛选内容时,绝非是针对所有内容都一一接收,他们会根据个人本身的需求和意愿对内容进行挑选,在信息接收过程有对相关内容所侧重或者产生不同的见解,通过过滤自己不认同或者有悖于自己喜好的信息,使相关的思维方式、本来的价值体系以及所获得的信息得以统一,杜绝不和谐感形成。随着长时间的积累,用户通过选择性注意,大量接收同质化的信息使得个人信息面变得狭窄,选择性接触和选择性注意会强化自身已有观点,大量同质化信息的接为自己搭建起一个信息的“茧房”。大量同质化信息聚合而成的“信息茧房”会加剧个人意识偏见,在交流沟通中形成甚至加固话语壁垒。
2.2. 人工智能建模不完善与“把关人”标准不统一
在聚合类新闻客户端里面的系统算法运用风险内容甄別技术,设计无数个图片样本集的鉴黄模型,仍然存在漏洞,模型还需要不断被完善。
虽然,国家网信办制订了许多相关规章条例,其目的在于监管与控制网络环境,同时新闻传媒行业逐渐地被社会泛娱乐化所渗透,大部分的聚合新闻平台都是由于客户喜欢,追逐娱乐化,导致信息环境低俗化以及低质化。并且,因为在算法新闻生产当中中,聚合类新闻客户端内容尽管是按照网信办以及内部指令的要求去开展的,其推荐的前提下是按照用户的身份特征与喜好,针对部分的推荐,审核人员的要求都是有差异的,然而只要是遵守法律的内容都会由于用户需求而被广泛推荐。普通的审核人员由于没有专业新闻素养,导致受众接收信息更加繁杂,进而导致网络环境更加恶劣,最明显的体现是标题党大量运用,导致虚假新闻广泛进入到市场当中,泛娱乐化现象十分严重。 2.3. 相关法律并不完善且责任追究困难
虽然,自媒体平台企业“今日头条”在算法技术的加持下融入了人工审核与人工编辑,然而这一平台还是有诸多泛娱乐的现象。在2018年,“今日头条”由于存在假广告以及内容侵权现象而被起诉上法庭,同时国信办还专门与今日头条旗下的娱乐类APP火山小视频进行了约谈。2017年至今,今日头条与其所管辖的产品由于内容低劣、广告虚假、侵权盗权等,同时其也被权威媒体与国家部门专门点评与整顿,次数达到了20多次,这些媒体包括央视新闻、人民日报等。
多次出现这样的问题说明相关法律并不完善,而且聚合类新闻客户端的内容生产很大一部分是用户内容生产,当在平台出现低俗内容时,追究到个人责任存在困难。
3. 大数据算法下信息审核模式的完善
3.1. 解决数据失衡与打破“信息茧房”
一款产品怎样才可以更精准地把握用户的偏好程度,能够用最短的时间了解用户的口味变化,在用户都未察觉的情况下,推荐其所喜欢的事物。所以,提高用户新动作的百分比,减少老动作的百分比,把两者间存在的信息更新时间差减少,能够更好地降低数据偏差的弊端。这中间所包括的是广泛对于大数据运用的标准,同时对于公司实验平台提出更严格的标准。
用户的使用行为是促使产生“信息茧房”的因素中非常重要的部分,为了减少“信息茧房”带来的不利影响,有必要提高用户的媒介素养。媒介素养对很多方面的能力都有要求,包括用户选择信息以及对媒介和渠道的认知等。互联网的出现和发展开拓了我们接触新资讯的通道,也为更多传播者提供了传播信息的平台。因此,用户提高媒介素养最重要的是树立打破“信息茧房”的意识,积极拓展信息资源渠道。
目前,大多数聚合类新闻客户端所采用的是算法推荐原理,首先是将用户的信息与行为来进行从而建立“用户画像”,其次是运用协同过滤技术,即根据分析用户群体间的相似性来推荐内容。为新闻客户端设置“用户画像”将使推荐内容更加准确,但协同过滤技术将在某种程度上缓解算法的过滤行为并提供可能满足用户需求的内容,同时将之推荐至主页。然而,部分用户十分被动地获得同类信息的内容。他们想接受他们感兴趣但不了解的某些主题,或者客户可以从其他角度打断并推送一些新主题或新内容。大多数用户希望通过聚合类新闻客户端来拓宽视野并获得各种信息内容。
在对聚合类新闻客户端的的发展未来作出分析,针对今日头条为例,能够更好地强化对协同过滤法技术的探讨与运用。客户端要求不断完善其“用户画像”技术,进而通过更加细化的标签精准地推荐信息;同时,客户还要求重视过滤算法技术的关键性,并需要进行更多的研究。通过相互补充并弥补彼此的缺点,这两种技术可以在某种程度上减少“信息茧房”的影响,并拓宽用户的内容范围。
3.2. 加强用户审核入网并设置多重“把关人”
多重“把关人”也就是多重的审核机制,从用户入网时就设立审核机制,比如:用户实名制和人脸认证。假设用户注册账号时,要求依靠登录身份信息同时展开人脸认证。并且在注册账号时,与用户签订协议,当账号出现问题时,用户需要负相关责任,且不得把账号对外出租或者转借。现在网上出现很多贩卖个人身份信息以及账号的事情。终归来说,就是审查不严格。
首先,在用户申请账号入网时进行身份认证以及信息审核,通过之后将进入到第二层审核即为人工智能,当用户在平台发布内容时,将运用人工智能进行算法审核。用户发布的内容通过算法审核后将进入第三层审核即为人工审核,人工审核由平台人工审核和用户所组成的审核团。
3.3. 区块链技术的应用与法律制度的完善
许多网络“键盘侠”之所以有恃无恐的发布着不良信息的重要的原因之一就是无法追究责任,网络虽非法外之地,但是治理起来困难重重,经过原作者发布然后再经过各方转发之后,其在网络上造成的传播范围之广,影响之深是无法想象的。虽然用户实名制已经逐渐完善,但是目前的追查难度依然很大,在面对许多不良信息或不良视频时依然无法做到追根溯源,即使追查到了源头,但这中间的传播者也无迹可寻。
那么如果我们把区块链技术应用到用户与媒体中去,这样一来对不法分子追根溯源就方便的多。区块链技术通过P2P模式展开数据搜索与上传,用户或者别的一方都能够融入系统展开自动化搜索,从而能够更好地了解到对方记录,数字加密必须要强化,不仅方便同时不易造假,极大地提高了信用的可信度,这样一来不仅能够找到信息的发布者,转发这种不法信息的人也是一目了然,更重要的是区块链技术可以让用户也成为监督者。新媒体技术造就了“人人皆媒”的时代,希望区块链技术造就一个“人人皆是把关人”的时代。一个完整的信息审核机制绝不仅仅是“人工审核+技术识别”这么简单,“拦截”只是其中一步,更重要的是用技术手段追溯发布者,排查传播者,给予这些人法律的严惩,以达到杀一儆百的目的。法律法规要健全,改进追查违法者的技术,技术识别与人工审核协作,共同构建成为一个完整的信息审核机制。
4. 结语
针对聚合类新闻客户端,人们的个性化信息的偏好的强烈感会不断增加,尽管提高了
聚合新闻平台的用户吸引性,然而也会产生问题,用户信息面將会越来越少,所以耗费在这一类客户上无价值阅读时间必然会增长。所以在此前提下,认识算法新闻生产的审核机制,持续思考合理高效率的审核方式就变得更加关键,在用户得到所需信息的过程当中,使公共网络信息环境更加优质。因此,针对聚合类客户端算法把关的不良信息展开整顿,用户、政府以及平台三者都要紧密配合,业内针对算法的持续研究在以后未来算法新闻形成与“人与机器共生”的分析当中尤为关键。
参考文献:
[1]耿伟茜.今日头条的内容运营策略研究[D].河北大学,2018
[2]李佳音.基于个性化推荐系统新闻客户端的“信息茧房”效应研究——以“今日头条”为例[D].中央民族大学,2017.
[3]杨舒涵.算法新闻生产中的把关机制研究[D].山东师范大学,2019