论文部分内容阅读
摘 要 大数据时代对于算法分發的运用已经十分普遍,对用户来说算法分发对于个性化偏好的精准预测,提高了获取有效信息的效率。但同时也不可避免地存在着诸如易引发社会隔阂,加深偏见,泄露信息等各种问题。在普通用户面临着被算法操纵而带来一系列不利影响的情况下,及时对算法的不足之处做出预判有助于在利用算法技术为人类提供便利之时,有效规避可能带来的风险。
关键词 个性化推荐;算法偏见;人文主义;价值观
大数据时代信息冗杂,算法应运而生,“数据+算法”的推荐模式被广泛应用于多元化场景,为什么淘宝界面的猜你喜欢每次都能猜中,网易云首页的每日推荐刚好就是你爱听的风格,而抖音短视频一刷就停不下来,算法的每次行动必能一击即中。人类已经进入了一个算法比你更懂自己的时代,你自己都不清楚的穿衣风格算法却能给出最准确的搭配方式,所谓的个性化在庞大的数据面前,是否只是一个样本?在互联网时代对于算法的依赖是一种便利还是机器的变相控制?
1 算法分发的机制及效应
算法最初指解决问题的方法,后来在不同领域的借用中演变为一种复杂的社会技术系统,再后来因为算法决策服务被人们熟知。算法分发以大数据运算为依托,涉及人工智能、知识发现、互联网信息检索、数据库以及数据挖掘和分析等技术。算法能在掌握用户的社会属性、兴趣爱好、短期行为等个人信息的前提下进行相关性分析,完成对用户的多角度描述性标签属性即用户画像,从而实现精准的信息推荐。运用到电商领域,算法就像是用户过去的消费动态与未来的消费行为之间的预测者,以用户在互联网留下的各种数据为线索保障预测行为的圆满完成。
以电商平台淘宝为例,2019年天猫“双十一”狂欢节最终成交总额达到2684亿元,其中的营销策略离不开以算法为依托的智能推荐。淘宝网对于数据和算法的应用开始于2011年的“母婴档案”项目,这是淘宝为了满足年轻妈妈的需求而利用算法进行的第一次尝试。2013年左右,随着平台上商品品类的不断增加,用户进行选购的时间成本不断上升,为了打破用户对淘宝低价爆款的固有印象,避免在新型竞争者不断涌出的激烈竞争中受到钳制,淘宝做了一次至关重要的尝试——在聚划算上测试个性化推荐的效果,聚划算的商品成交额在淘宝推出个性化推荐后很快上升了一倍①。此举改变了以往以同一套算法应对所有用户的“千人一面”局面。目前淘宝平台的推荐逻辑还在不断扩展,它的诉求不仅仅是“千人千面”,力争从用户生活的方方面面洞悉需求,达到“千人万面”。从搜索一只马克杯开始,艺术玻璃器皿、复古乡村书橱置物架等相关家居推荐将会慢慢出现在你的淘宝首页,从推荐物品到推荐服务,再到推荐场景,算法分发的野心已经开始为你设定根据数据总结得出的优质生活方式。
2 基于算法个性化推荐的隐性忧患
2.1 “画地为牢”与共识缺乏
基于算法技术的个性化推荐能够帮助用户从海量的信息中打捞对他们来说最有价值的内容,在用户感叹某个软件推送的内容或商品正巧符合自己兴趣的同时,也是把自己封在了算法精确界定出的圈子里。久而久之必然会难以接受圈子之外的新鲜事物。重复接受同样的思想或观点使得固化思维产生,人们的某些观点和立场进一步固化导致个人视野的窄化和个人立场的极端化。算法先通过例如身份、经济状况等信息把个体划分到不同的层级,再系统地为不同层级分发不同内容和质量的信息,当用户把享用算法“量身定做”的信息当成习惯,原本就有所区分的层级之间的沟壑只会越来越宽,当处在同一个社会环境中的个体都带着算法智能分发的有色眼镜看待问题,彼此的分歧越大则社会聚合力越小。然而,在这样一个用数据说话的时代,数据分析得出的结论往往是多数人眼中的真相,在各种主体都在努力地寻求用数据分析和算法的力量来制造契合自己需要的信息环境与意见格局时,那些曾经被互联网交互打破的高墙又重新筑起来了。科技进步不仅让社会中的人与人连接,还让整合的社会状态分裂,当数据和算法成为权力博弈的武器,我们期待的“共同视角”或“共识”的形成必将面临更大的阻力[1]。
2.2 来自机器的念念不忘
智能推荐一边为用户带来便利,一边收集、处理、控制着用户的个人信息,人类在互联网上的一切活动都会留下记录着个人的特征、位置、状态的数据痕迹,它会以一种隐秘的方式向算法透漏你的偏好,并为后台数据库精准地为你打上标签提供素材。在此情况下不得不时刻警惕数据收集、数据利用、数据泄露等隐私风险,完整的数字化记忆将人囚禁在透明的时空监狱中,即使“删除权”与“更正权”正在帮我们行使被遗忘的权利,个体也将面临比过去更多的隐私风险。少注册几个应用程序,不允许该网页访问你的设备或许是人们自认为的可以减少风险的方法,但在算法通过若干点赞就可以判断用户的兴趣,传感器可以随时随地捕捉关于人的任何数据的大数据时代,记忆仍会是常态[1]。
2.3 人文主义与数据主义的较量
我们从什么时候开始相信算法基于数据做出的判断比人们坐在桌前开会讨论出的结果更值得信赖,在智能扶贫项目中,弱势公民的真实需求变成了数字,这份曾经属于社会工作者的工作现在由机器来执行。这是一个福利国家的人文要素逐渐被稀释的过程,福利受济者的命运将由算法宣判。算法似乎是无所不能的,它在以上帝视角洞悉着一切,对于数据的处理平等而理性,甚至分不清在庞大的数据库中,人究竟是鲜活的生命还是一串待处理的数字。
此外,算法还继承了技术人员的初始偏见,并随着数据的积累不断放大,比如算法倾向于向黑人推送查询犯罪记录的广告以及女性在浏览网页时很难看到高管培训的广告。如果我们坚信的算法,是在种族和阶级的现有扭曲中孕育而生,那么它只会让的不同阶级间的鸿沟更大更深[2]。
不过,在人性自身达不到完美时也不必对数据过分苛责,人文主义与数据主义的较量不过是人们期望看到的自己与现实人性之间的博弈,数据在本质上是人类观察世界的表征形式,不过是对人类行为的归纳与整理,人类文化是存在偏见的,作为与人类社会同构的大数据,也必然包含着根深蒂固的偏见。而大数据算法仅仅是把这种歧视文化归纳出来而已[3]。由此看来,算法符合我们固有的成见并不稀奇,在我们承认人性的阴暗面时也该想到机器也会有学坏的一天。 3 总结与建议
應该承认,机器在帮助我们提高各种各样的机械能力的方面,较人类更胜一筹。在未来,算法仍然会应用到更多的领域,利用相关性分析帮我们预测更远的未来。但是,今天之所以还会不断地探讨算法分发带来的种种忧患,是因为即便是发现了机械的算法分发会引发影响到用户个体、传媒行业乃至整个网络文化与社会文化的一系列问题,我们仍然相信人类的力量会在算法和人类共栖共生的关系中占据上风,问题不会凭空消失但局面仍然可以通过种种举措来缓和。
3.1 确定人在内容分发中的主导地位
在这样一个算法无处不在,算法推送的争议无处不在的世界,处理人与信息的基本关系,是解决各种问题的前提。今天我们在比较的是人文主义和数据主义,其实也是在对算法对于内容分发的主导权产生质疑。其一,人的心理和行为具有复杂性,并非每一次的消费行为都具备缜密的逻辑,人们在某些情景下做出的选择很有可能是连自己也无法解释的“无意识”“不确定”的,并非单一的标准可以衡量。其二,信息的价值观是由人赋予的,人工可以介入到分发模式的各个环节对畸形的思维模式进行调整,人工的介入并非贴标签般的简化处理,而应该是一套完备的经过检测的系统化操作流程②。在价值判断上,人的社会阅历和思考能力能对问题进行多维度考量,胜过了机器的程式化解决模式,由人来主导内容分发,对算法来说也是一种精简和优化的过程。
3.2 提高从业者素质
当我们在担心使用算法带来的后果时其实也是在警惕算法这项技术的不成熟,但与其因为恐惧算法而减少使用,不如从根源上提高算法分发的效用。使一套机器语言适应所有人的心理需要,并同时满足社会效益的最大化可行性不高,毕竟算法是由一群技术人员而非心理学家设计的,今天用于处理几百万个样本数据的程序可能已经附着了技术人员的个人价值观,尽管算法被应用前已经经过了多次检验,但未来算法的编制仍然需要在经验与程式化、感性与精准之间寻找平衡。未来的内容从业者,既需要掌握一定的数据采集、分析与加工的能力,也需要足够的人文的视野与素养,擅长数据与算法的技术人员与具有人文情怀的内容生产者的协作,也会成为常态[4]。
3.3 加强信息伦理规范的约束
算法发展到今天,对于用户来说还是完全封闭的,用户在选择算法的同时将自己的私人信息无偿交给技术后台,换来的却有可能的是以利益为目标的误导和欺骗。用户无法看到源代码,也就不明白其中的具体规则[5]。这种不透明性导致用户完全处于被动接受算法推荐结果的状态,一旦算法设计者在其中装入某种不公正因素,这将扰乱公正的市场秩序,消费者的利益也会因此遭到侵蚀。但是对于大多数商家来说,算法程序可能涉及商业机密,广泛公开有失商业道德。因此,政府有必要通过完善相关法律,成立监察机构来还算法以清白,惩治无良平台对于算法的利用。
注释
①孙然:“搜索和推荐”算法工程师 一个大有前途的职业,https://www.ynhouse.com/news/view-203740.html,2018.10/2020.2。
②喻国明,曲慧:《“信息茧房”的误读与算法推送的必要——兼论内容分发中社会伦理困境的解决之道》,新疆师范大学学报(哲学社会科学版),https://doi.org/10.14100/j.cnki.65-1039/g4.20190826.001。
参考文献
[1]彭兰.假象、算法囚徒与权力让渡 数据与算法时代的新风险[J].西北师大学报,2018,55(5):20-29.
[2]沈律君.如果AI和算法无罪,那么谁在杀死穷人?[EB/OL].http://www.sohu.com/a/352140479_563941,2019.11/2020.2.
[3]张玉宏,秦志光,肖乐.大数据算法的歧视本质[J].自然辩证法研究,2017(5):81-86.
[4]彭兰.增强与克制:智媒时代的新生产力[J].湖南师范大学社会科学学报,2019(4):132-142.
[5]何顺民.网购平台个性化推荐算法的伦理困境及规制 以移动电商淘宝为例[J].城市学刊,2019,40(3):1-6.
关键词 个性化推荐;算法偏见;人文主义;价值观
大数据时代信息冗杂,算法应运而生,“数据+算法”的推荐模式被广泛应用于多元化场景,为什么淘宝界面的猜你喜欢每次都能猜中,网易云首页的每日推荐刚好就是你爱听的风格,而抖音短视频一刷就停不下来,算法的每次行动必能一击即中。人类已经进入了一个算法比你更懂自己的时代,你自己都不清楚的穿衣风格算法却能给出最准确的搭配方式,所谓的个性化在庞大的数据面前,是否只是一个样本?在互联网时代对于算法的依赖是一种便利还是机器的变相控制?
1 算法分发的机制及效应
算法最初指解决问题的方法,后来在不同领域的借用中演变为一种复杂的社会技术系统,再后来因为算法决策服务被人们熟知。算法分发以大数据运算为依托,涉及人工智能、知识发现、互联网信息检索、数据库以及数据挖掘和分析等技术。算法能在掌握用户的社会属性、兴趣爱好、短期行为等个人信息的前提下进行相关性分析,完成对用户的多角度描述性标签属性即用户画像,从而实现精准的信息推荐。运用到电商领域,算法就像是用户过去的消费动态与未来的消费行为之间的预测者,以用户在互联网留下的各种数据为线索保障预测行为的圆满完成。
以电商平台淘宝为例,2019年天猫“双十一”狂欢节最终成交总额达到2684亿元,其中的营销策略离不开以算法为依托的智能推荐。淘宝网对于数据和算法的应用开始于2011年的“母婴档案”项目,这是淘宝为了满足年轻妈妈的需求而利用算法进行的第一次尝试。2013年左右,随着平台上商品品类的不断增加,用户进行选购的时间成本不断上升,为了打破用户对淘宝低价爆款的固有印象,避免在新型竞争者不断涌出的激烈竞争中受到钳制,淘宝做了一次至关重要的尝试——在聚划算上测试个性化推荐的效果,聚划算的商品成交额在淘宝推出个性化推荐后很快上升了一倍①。此举改变了以往以同一套算法应对所有用户的“千人一面”局面。目前淘宝平台的推荐逻辑还在不断扩展,它的诉求不仅仅是“千人千面”,力争从用户生活的方方面面洞悉需求,达到“千人万面”。从搜索一只马克杯开始,艺术玻璃器皿、复古乡村书橱置物架等相关家居推荐将会慢慢出现在你的淘宝首页,从推荐物品到推荐服务,再到推荐场景,算法分发的野心已经开始为你设定根据数据总结得出的优质生活方式。
2 基于算法个性化推荐的隐性忧患
2.1 “画地为牢”与共识缺乏
基于算法技术的个性化推荐能够帮助用户从海量的信息中打捞对他们来说最有价值的内容,在用户感叹某个软件推送的内容或商品正巧符合自己兴趣的同时,也是把自己封在了算法精确界定出的圈子里。久而久之必然会难以接受圈子之外的新鲜事物。重复接受同样的思想或观点使得固化思维产生,人们的某些观点和立场进一步固化导致个人视野的窄化和个人立场的极端化。算法先通过例如身份、经济状况等信息把个体划分到不同的层级,再系统地为不同层级分发不同内容和质量的信息,当用户把享用算法“量身定做”的信息当成习惯,原本就有所区分的层级之间的沟壑只会越来越宽,当处在同一个社会环境中的个体都带着算法智能分发的有色眼镜看待问题,彼此的分歧越大则社会聚合力越小。然而,在这样一个用数据说话的时代,数据分析得出的结论往往是多数人眼中的真相,在各种主体都在努力地寻求用数据分析和算法的力量来制造契合自己需要的信息环境与意见格局时,那些曾经被互联网交互打破的高墙又重新筑起来了。科技进步不仅让社会中的人与人连接,还让整合的社会状态分裂,当数据和算法成为权力博弈的武器,我们期待的“共同视角”或“共识”的形成必将面临更大的阻力[1]。
2.2 来自机器的念念不忘
智能推荐一边为用户带来便利,一边收集、处理、控制着用户的个人信息,人类在互联网上的一切活动都会留下记录着个人的特征、位置、状态的数据痕迹,它会以一种隐秘的方式向算法透漏你的偏好,并为后台数据库精准地为你打上标签提供素材。在此情况下不得不时刻警惕数据收集、数据利用、数据泄露等隐私风险,完整的数字化记忆将人囚禁在透明的时空监狱中,即使“删除权”与“更正权”正在帮我们行使被遗忘的权利,个体也将面临比过去更多的隐私风险。少注册几个应用程序,不允许该网页访问你的设备或许是人们自认为的可以减少风险的方法,但在算法通过若干点赞就可以判断用户的兴趣,传感器可以随时随地捕捉关于人的任何数据的大数据时代,记忆仍会是常态[1]。
2.3 人文主义与数据主义的较量
我们从什么时候开始相信算法基于数据做出的判断比人们坐在桌前开会讨论出的结果更值得信赖,在智能扶贫项目中,弱势公民的真实需求变成了数字,这份曾经属于社会工作者的工作现在由机器来执行。这是一个福利国家的人文要素逐渐被稀释的过程,福利受济者的命运将由算法宣判。算法似乎是无所不能的,它在以上帝视角洞悉着一切,对于数据的处理平等而理性,甚至分不清在庞大的数据库中,人究竟是鲜活的生命还是一串待处理的数字。
此外,算法还继承了技术人员的初始偏见,并随着数据的积累不断放大,比如算法倾向于向黑人推送查询犯罪记录的广告以及女性在浏览网页时很难看到高管培训的广告。如果我们坚信的算法,是在种族和阶级的现有扭曲中孕育而生,那么它只会让的不同阶级间的鸿沟更大更深[2]。
不过,在人性自身达不到完美时也不必对数据过分苛责,人文主义与数据主义的较量不过是人们期望看到的自己与现实人性之间的博弈,数据在本质上是人类观察世界的表征形式,不过是对人类行为的归纳与整理,人类文化是存在偏见的,作为与人类社会同构的大数据,也必然包含着根深蒂固的偏见。而大数据算法仅仅是把这种歧视文化归纳出来而已[3]。由此看来,算法符合我们固有的成见并不稀奇,在我们承认人性的阴暗面时也该想到机器也会有学坏的一天。 3 总结与建议
應该承认,机器在帮助我们提高各种各样的机械能力的方面,较人类更胜一筹。在未来,算法仍然会应用到更多的领域,利用相关性分析帮我们预测更远的未来。但是,今天之所以还会不断地探讨算法分发带来的种种忧患,是因为即便是发现了机械的算法分发会引发影响到用户个体、传媒行业乃至整个网络文化与社会文化的一系列问题,我们仍然相信人类的力量会在算法和人类共栖共生的关系中占据上风,问题不会凭空消失但局面仍然可以通过种种举措来缓和。
3.1 确定人在内容分发中的主导地位
在这样一个算法无处不在,算法推送的争议无处不在的世界,处理人与信息的基本关系,是解决各种问题的前提。今天我们在比较的是人文主义和数据主义,其实也是在对算法对于内容分发的主导权产生质疑。其一,人的心理和行为具有复杂性,并非每一次的消费行为都具备缜密的逻辑,人们在某些情景下做出的选择很有可能是连自己也无法解释的“无意识”“不确定”的,并非单一的标准可以衡量。其二,信息的价值观是由人赋予的,人工可以介入到分发模式的各个环节对畸形的思维模式进行调整,人工的介入并非贴标签般的简化处理,而应该是一套完备的经过检测的系统化操作流程②。在价值判断上,人的社会阅历和思考能力能对问题进行多维度考量,胜过了机器的程式化解决模式,由人来主导内容分发,对算法来说也是一种精简和优化的过程。
3.2 提高从业者素质
当我们在担心使用算法带来的后果时其实也是在警惕算法这项技术的不成熟,但与其因为恐惧算法而减少使用,不如从根源上提高算法分发的效用。使一套机器语言适应所有人的心理需要,并同时满足社会效益的最大化可行性不高,毕竟算法是由一群技术人员而非心理学家设计的,今天用于处理几百万个样本数据的程序可能已经附着了技术人员的个人价值观,尽管算法被应用前已经经过了多次检验,但未来算法的编制仍然需要在经验与程式化、感性与精准之间寻找平衡。未来的内容从业者,既需要掌握一定的数据采集、分析与加工的能力,也需要足够的人文的视野与素养,擅长数据与算法的技术人员与具有人文情怀的内容生产者的协作,也会成为常态[4]。
3.3 加强信息伦理规范的约束
算法发展到今天,对于用户来说还是完全封闭的,用户在选择算法的同时将自己的私人信息无偿交给技术后台,换来的却有可能的是以利益为目标的误导和欺骗。用户无法看到源代码,也就不明白其中的具体规则[5]。这种不透明性导致用户完全处于被动接受算法推荐结果的状态,一旦算法设计者在其中装入某种不公正因素,这将扰乱公正的市场秩序,消费者的利益也会因此遭到侵蚀。但是对于大多数商家来说,算法程序可能涉及商业机密,广泛公开有失商业道德。因此,政府有必要通过完善相关法律,成立监察机构来还算法以清白,惩治无良平台对于算法的利用。
注释
①孙然:“搜索和推荐”算法工程师 一个大有前途的职业,https://www.ynhouse.com/news/view-203740.html,2018.10/2020.2。
②喻国明,曲慧:《“信息茧房”的误读与算法推送的必要——兼论内容分发中社会伦理困境的解决之道》,新疆师范大学学报(哲学社会科学版),https://doi.org/10.14100/j.cnki.65-1039/g4.20190826.001。
参考文献
[1]彭兰.假象、算法囚徒与权力让渡 数据与算法时代的新风险[J].西北师大学报,2018,55(5):20-29.
[2]沈律君.如果AI和算法无罪,那么谁在杀死穷人?[EB/OL].http://www.sohu.com/a/352140479_563941,2019.11/2020.2.
[3]张玉宏,秦志光,肖乐.大数据算法的歧视本质[J].自然辩证法研究,2017(5):81-86.
[4]彭兰.增强与克制:智媒时代的新生产力[J].湖南师范大学社会科学学报,2019(4):132-142.
[5]何顺民.网购平台个性化推荐算法的伦理困境及规制 以移动电商淘宝为例[J].城市学刊,2019,40(3):1-6.