论文部分内容阅读
摘 要 随着移动互联网的发展,算法分发、个性化推荐等新技术应运而生,媒体出现智能化趋向,智媒时代到来。以“今日头条”为代表的个性化新闻推荐系统的流行,将其背后的算法推荐及应用推到了舆论的風口浪尖上。
关键词 算法;今日头条;个性化
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2019)05-0026-02
根据中国互联网络信息中心(CNNIC)发布的第42次《中国互联网络发展状况统计报告》,截至2018年6月30日,我国网民规模已达8.02亿,互联网普及率为57.7%,其中手机网民规模达7.88亿,网民通过手机接入互联网的比例高达98.3%[1]。企鹅智库2018年10月发布的2018新媒体趋势报告显示,在中国互联网资讯消费者中,平均每天用于资讯的消费时间,人均达到了76.8分钟,73.7%的用户每天超过30分钟,而手机资讯类App成为网民获取资讯的第一途径[2]。
由此看来,人们对资讯的需求越来越多,而智能手机在资讯终端占据了绝对优势,进而催生了一大批资讯类App。
1 今日头条算法推荐的幕后运作
“你关心的才是头条”,今日头条自2012年创建以来就打出这样的广告语,可见其对用户体验的重视程度。比起内容生产者,今日头条更倾向于用数据分析的领先者来定位自己,其个性化新闻推荐系统应用引起了社会的广泛关注。
1.1 基于内容的推荐算法
根据用户过去喜欢的内容,为目标用户推荐相类似的内容。其原理是平台记录跟踪用户的浏览历史以及社交记录,对用户信息标签化,分析出用户的社会属性、兴趣爱好图谱,推测出用户的信息全貌[3]。新闻推荐就是基于内容的推荐算法的典型。
该推荐算法是今日头条常用算法之一,在用户注册登录后,系统就会根据用户手机位置、使用时间、关注的人、喜欢的内容等信息建立一个用户画像,并为用户贴上数多个标签,然后再结合用户曾在今日头条平台上浏览、点赞、评论过的信息,来推荐给用户类似信息以获得更高的点击率。
1.2 协同过滤的推荐算法
其运作是通过计算用户的信息兴趣相似度,自动寻找与“目标用户”具有相同或相似爱好的“比邻用户”,并将“比邻用户”所喜好的内容反过来推荐给“目标用户”。从一定意义上说,协同过滤不仅是一种算法,而且是用户获取信息的一种新途径。今日头条平台的核心理念就是协同过滤推荐,其背后的依据是用户喜欢那些具有相似兴趣用户喜欢过的商品。
当然,协同过滤的实现也是需要一定条件的,首先是每个人与人际关系网中的其他个体有类似的喜好行为、习惯倾向;其次则是人们越来越倾向于在网络中对信息进行分享、评价;最后是强大的数据处理和分析技术。只有这样,平台才能为用户提供更加个性化的资讯。
2 算法推荐下的今日头条存在的暗流
2.1 用户隐私泄露,陷入信息茧房
2015年1月,张一鸣在极客公园创新大会上发表演讲,指出今日头条后台系统收集的数据大概分为三个特征被其学习:动作特征(包括点击、停留、滑动、评论、分享)、环境特征(包括GPS定位、是在Wi-Fi环境还是4G环境、是否为节假日等)和社交特征(微博、微信的关注关系,历史上发的微博)[4]。
其后台所引用的动作特征、环境特征和社交特征或多或少的都包含着用户的隐私,然而它们引用这些信息并未征求过用户的意见,虽然在后台收取用户信息的是系统,收集的结果是抽象的数据,但当用户的喜好兴趣都以数据记录下来时,难道不是对用户隐私的侵犯吗?
除了隐私泄露外,还会给用户造成信息茧房。今日头条平台推送用户可能感兴趣的东西,看起来是极具人性化的方法,在信息过载的今天为人类找到了一条捷径,但是人是有惰性的,在主动搜索其他资讯和平台推荐资讯中,用户会毫不犹豫的倾向后者,这样势必会造成用户信息选择面的收窄,形成信息“孤岛”效应。
此外,算法推荐下的内容还会使用户对某一事件形成与事实不符的刻板印象。比如用户浏览了一条“高铁霸座”的新闻,然后平台可能会推荐给用户一些类似“剧院霸座”“飞机拖鞋”等一类的资讯,或者一些有关这些资讯的评论,长而久之,该用户可能就会形成当今社会人们素质低下,不遵守规则,但与事实不符的刻板印象。
2.2 平台内容粗制滥造,侵权行为时有发生
算法推荐过程中会抓取一定数量的关键词,有些作者为获得高推荐量,不择手段的蹭热点,找流量,对内容进行二次加工非二次创新,易造成标题党大行其道,抄袭之风盛之又盛,内容粗制滥造、良莠不齐等问题,在传播过程中易造成侵权现象,弱化对基本价值的守望和主流价值的引导。
“我们不生产新闻,我们只是新闻的搬运工。”今日头条的新闻搬运也带来了一系列的版权问题。2018年今日头条卷入了一系列的旋涡:先是年初与百度和腾讯的口水战,然后是被央视曝光刊登“二跳”违规广告,后又因内容低俗被约谈和下架产品,旗下“内涵段子”更是被责令永久关停。6月以来,又卷入了包括凤凰网、爱奇艺等多件版权纠纷案
件中。
“虽然时下资讯内容丰富,但优质的资讯在用户看来仍是稀缺的,有13.7%的用户表示很难看到,另有一半用户认为比较稀缺,看到的较少。”企鹅智库2018年10月发布的信息显示[2]。由此看见,部分资讯类App的内容质量还是令人担忧的。
2.3 网络群体极化,社会黏度降低
在算法个性化推荐下,用户习惯接受自己偏爱的讯息,与兴趣相合的人聚谈,而聚集又会反过来强化这种意见或态度,经过长时间的累积,容易形成趋同的风格。而各群体之间,会造成语言隔阂、交流障碍甚至认知困难。当个体、群体之间缺乏黏性时,无疑将极大的弱化群体功能,产生负面影响。 社会黏性是由经验、知识和任务的分享而来的,人们需要有一些共同的关心和记忆,需要构建起具有黏性的共同聯盟[5]。群际的隔膜,使群体间缺乏黏性,离散成单一的力量,这会造成分歧加剧。随着移动互联网时代的到来和智能手机的普及,人与人之间的直接接触交流逐渐减少,而网络上信息选择的高度自由使用户很容易形成群己之分,使个体减少社会经验分享,脱离社会发展的轨道。
算法推荐机制将内容分发给用户时,缺乏对内容理性的判断和主流价值的引导,而传统媒体建构的主流价值观、坚守的新闻理想也随之破灭。今日头条作为个性化新闻推荐的典范,仅依靠算法和技术,以用户的行为偏好为衡量标准,缺少对内容的把关和引导,易使用户呈现出以自我为中心的较少考虑社会伦理道德的行为,与社会主流价值观背道而驰。
3 算法推荐下的平台出路
3.1 做好“内容的搬运工”
不管是平台自己生产的原创产品,还是“他山之石”,今日头条作为一个平台,应当对用户接收的内容产品质量负责。因此平台应做到净化环境,提高平台的内容质量,与知名原创作者签约,加强与相关媒体机构的合作,解决版权问题。
同时,在内容监管方面也可以增加一些人工编辑,把控内容质量。编辑作为对算法推荐技术的补充,可以为用户提供一些他们兴趣之外却仍需要了解的内容,如具有重大影响的新闻事件,真正有价值的真新闻等。
3.2 当好“数据分析的领先者”
如今的算法大多还停留在初级阶段,作为以算法见长的平台应着力完善算法,努力实现数字化、智能化,使算法尽量完整准确地对人们信息需求的重点和全貌进行画像,更好的了解用户。完善后的算法不应是只推送用户偏爱的内容,还要适量的渗透一些社会主流价值的内容,帮助用户打破信息茧房,使用户对社会有一个较为全面的认知,以免与社会脱节。
参考文献
[1]CNNIC发布第42次《中国互联网络发展状况统计报告》[EB/OL].(2018-01-31).http://www.cac.gov.cn/2018-01/31/c_1122346138.htm.
[2]中国新媒体趋势报告2018:通向媒体新星球的未来地图[EB/OL].(2017-11-20).0http://tech.qq.com/a/20171120/025254.htm#p=12.
[3]赵双阁,岳梦怡.新闻的“量化转型”:算法推荐对媒介伦理的挑战与应对[J].当代传播,2018(4):52-56.
[4]张一鸣:机器学习能带来更有趣的世界吗?[EB/OL].(2015-01-17).https://chuansongme.com/n/1094314.
[5]李良荣.网络与新媒体概论[M].北京:高等教育出版社,2014:73.
关键词 算法;今日头条;个性化
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2019)05-0026-02
根据中国互联网络信息中心(CNNIC)发布的第42次《中国互联网络发展状况统计报告》,截至2018年6月30日,我国网民规模已达8.02亿,互联网普及率为57.7%,其中手机网民规模达7.88亿,网民通过手机接入互联网的比例高达98.3%[1]。企鹅智库2018年10月发布的2018新媒体趋势报告显示,在中国互联网资讯消费者中,平均每天用于资讯的消费时间,人均达到了76.8分钟,73.7%的用户每天超过30分钟,而手机资讯类App成为网民获取资讯的第一途径[2]。
由此看来,人们对资讯的需求越来越多,而智能手机在资讯终端占据了绝对优势,进而催生了一大批资讯类App。
1 今日头条算法推荐的幕后运作
“你关心的才是头条”,今日头条自2012年创建以来就打出这样的广告语,可见其对用户体验的重视程度。比起内容生产者,今日头条更倾向于用数据分析的领先者来定位自己,其个性化新闻推荐系统应用引起了社会的广泛关注。
1.1 基于内容的推荐算法
根据用户过去喜欢的内容,为目标用户推荐相类似的内容。其原理是平台记录跟踪用户的浏览历史以及社交记录,对用户信息标签化,分析出用户的社会属性、兴趣爱好图谱,推测出用户的信息全貌[3]。新闻推荐就是基于内容的推荐算法的典型。
该推荐算法是今日头条常用算法之一,在用户注册登录后,系统就会根据用户手机位置、使用时间、关注的人、喜欢的内容等信息建立一个用户画像,并为用户贴上数多个标签,然后再结合用户曾在今日头条平台上浏览、点赞、评论过的信息,来推荐给用户类似信息以获得更高的点击率。
1.2 协同过滤的推荐算法
其运作是通过计算用户的信息兴趣相似度,自动寻找与“目标用户”具有相同或相似爱好的“比邻用户”,并将“比邻用户”所喜好的内容反过来推荐给“目标用户”。从一定意义上说,协同过滤不仅是一种算法,而且是用户获取信息的一种新途径。今日头条平台的核心理念就是协同过滤推荐,其背后的依据是用户喜欢那些具有相似兴趣用户喜欢过的商品。
当然,协同过滤的实现也是需要一定条件的,首先是每个人与人际关系网中的其他个体有类似的喜好行为、习惯倾向;其次则是人们越来越倾向于在网络中对信息进行分享、评价;最后是强大的数据处理和分析技术。只有这样,平台才能为用户提供更加个性化的资讯。
2 算法推荐下的今日头条存在的暗流
2.1 用户隐私泄露,陷入信息茧房
2015年1月,张一鸣在极客公园创新大会上发表演讲,指出今日头条后台系统收集的数据大概分为三个特征被其学习:动作特征(包括点击、停留、滑动、评论、分享)、环境特征(包括GPS定位、是在Wi-Fi环境还是4G环境、是否为节假日等)和社交特征(微博、微信的关注关系,历史上发的微博)[4]。
其后台所引用的动作特征、环境特征和社交特征或多或少的都包含着用户的隐私,然而它们引用这些信息并未征求过用户的意见,虽然在后台收取用户信息的是系统,收集的结果是抽象的数据,但当用户的喜好兴趣都以数据记录下来时,难道不是对用户隐私的侵犯吗?
除了隐私泄露外,还会给用户造成信息茧房。今日头条平台推送用户可能感兴趣的东西,看起来是极具人性化的方法,在信息过载的今天为人类找到了一条捷径,但是人是有惰性的,在主动搜索其他资讯和平台推荐资讯中,用户会毫不犹豫的倾向后者,这样势必会造成用户信息选择面的收窄,形成信息“孤岛”效应。
此外,算法推荐下的内容还会使用户对某一事件形成与事实不符的刻板印象。比如用户浏览了一条“高铁霸座”的新闻,然后平台可能会推荐给用户一些类似“剧院霸座”“飞机拖鞋”等一类的资讯,或者一些有关这些资讯的评论,长而久之,该用户可能就会形成当今社会人们素质低下,不遵守规则,但与事实不符的刻板印象。
2.2 平台内容粗制滥造,侵权行为时有发生
算法推荐过程中会抓取一定数量的关键词,有些作者为获得高推荐量,不择手段的蹭热点,找流量,对内容进行二次加工非二次创新,易造成标题党大行其道,抄袭之风盛之又盛,内容粗制滥造、良莠不齐等问题,在传播过程中易造成侵权现象,弱化对基本价值的守望和主流价值的引导。
“我们不生产新闻,我们只是新闻的搬运工。”今日头条的新闻搬运也带来了一系列的版权问题。2018年今日头条卷入了一系列的旋涡:先是年初与百度和腾讯的口水战,然后是被央视曝光刊登“二跳”违规广告,后又因内容低俗被约谈和下架产品,旗下“内涵段子”更是被责令永久关停。6月以来,又卷入了包括凤凰网、爱奇艺等多件版权纠纷案
件中。
“虽然时下资讯内容丰富,但优质的资讯在用户看来仍是稀缺的,有13.7%的用户表示很难看到,另有一半用户认为比较稀缺,看到的较少。”企鹅智库2018年10月发布的信息显示[2]。由此看见,部分资讯类App的内容质量还是令人担忧的。
2.3 网络群体极化,社会黏度降低
在算法个性化推荐下,用户习惯接受自己偏爱的讯息,与兴趣相合的人聚谈,而聚集又会反过来强化这种意见或态度,经过长时间的累积,容易形成趋同的风格。而各群体之间,会造成语言隔阂、交流障碍甚至认知困难。当个体、群体之间缺乏黏性时,无疑将极大的弱化群体功能,产生负面影响。 社会黏性是由经验、知识和任务的分享而来的,人们需要有一些共同的关心和记忆,需要构建起具有黏性的共同聯盟[5]。群际的隔膜,使群体间缺乏黏性,离散成单一的力量,这会造成分歧加剧。随着移动互联网时代的到来和智能手机的普及,人与人之间的直接接触交流逐渐减少,而网络上信息选择的高度自由使用户很容易形成群己之分,使个体减少社会经验分享,脱离社会发展的轨道。
算法推荐机制将内容分发给用户时,缺乏对内容理性的判断和主流价值的引导,而传统媒体建构的主流价值观、坚守的新闻理想也随之破灭。今日头条作为个性化新闻推荐的典范,仅依靠算法和技术,以用户的行为偏好为衡量标准,缺少对内容的把关和引导,易使用户呈现出以自我为中心的较少考虑社会伦理道德的行为,与社会主流价值观背道而驰。
3 算法推荐下的平台出路
3.1 做好“内容的搬运工”
不管是平台自己生产的原创产品,还是“他山之石”,今日头条作为一个平台,应当对用户接收的内容产品质量负责。因此平台应做到净化环境,提高平台的内容质量,与知名原创作者签约,加强与相关媒体机构的合作,解决版权问题。
同时,在内容监管方面也可以增加一些人工编辑,把控内容质量。编辑作为对算法推荐技术的补充,可以为用户提供一些他们兴趣之外却仍需要了解的内容,如具有重大影响的新闻事件,真正有价值的真新闻等。
3.2 当好“数据分析的领先者”
如今的算法大多还停留在初级阶段,作为以算法见长的平台应着力完善算法,努力实现数字化、智能化,使算法尽量完整准确地对人们信息需求的重点和全貌进行画像,更好的了解用户。完善后的算法不应是只推送用户偏爱的内容,还要适量的渗透一些社会主流价值的内容,帮助用户打破信息茧房,使用户对社会有一个较为全面的认知,以免与社会脱节。
参考文献
[1]CNNIC发布第42次《中国互联网络发展状况统计报告》[EB/OL].(2018-01-31).http://www.cac.gov.cn/2018-01/31/c_1122346138.htm.
[2]中国新媒体趋势报告2018:通向媒体新星球的未来地图[EB/OL].(2017-11-20).0http://tech.qq.com/a/20171120/025254.htm#p=12.
[3]赵双阁,岳梦怡.新闻的“量化转型”:算法推荐对媒介伦理的挑战与应对[J].当代传播,2018(4):52-56.
[4]张一鸣:机器学习能带来更有趣的世界吗?[EB/OL].(2015-01-17).https://chuansongme.com/n/1094314.
[5]李良荣.网络与新媒体概论[M].北京:高等教育出版社,2014:73.