This page looks best with JavaScript enabled

计算社会科学中伦理问题探究

 ·  ✏️ About  6459 words  ·  ☕ 13 mins read · 👀... views

本文为信息科学技术概论课程论文,写于2020年12月7日。

摘要

本文主要探究一门新兴交叉学科——计算社会科学(Computational Social Science)的伦理问题。本文从计算社会科学的历史和发展趋势中提出对其学科伦理问题探究的紧迫性与必要性;随后以具有争议性的学科研究实例引入,综合计算社会科学在“数据”方面的本质特性,提出其学科研究范式,以及由此决定的学科伦理问题框架。随后,本文考察了当前学界对于计算社会科学研究中伦理原则的意见。最后,综合以上研究和探讨,针对伦理问题,本文从不同方面提出了一些促进计算社会科学克服伦理问题发展的具体措施。

关键词:计算社会科学;伦理学;大数据;社交媒体

Abstract

This article mainly explores the ethical issues of a new interdisciplinary–Computational Social Science. This article proposes the urgency and necessity of exploring the ethical issues of its subject from the history and development trend of computational social science; then it introduces controversial subject research examples, integrating the essential characteristics of computational social science in “data”, to purpose subject’s research paradigm and the framework of subject ethics issues determined thereby. Subsequently, this article examines the current academic communities’ opinions on ethical principles. Finally, based on the above research and discussion, this article proposes some specific measures to promote the development of computational social science,overcoming ethical problems from different aspects.

Keywords: Computer Social Science; ethics; Big Data; social media

计算社会科学(Computational Social Science, CSS)是一门新兴的交叉学科。目前学界认为,计算社会科学可以看作计算科学作为一种通用方法向社会科学的传导,其核心问题是如何使用计算方法对人类产生的数据信息进行分析,进而解释和预测人类社会问题的过程与结果。1

近些年,计算社会科学在信息时代的春风中,得到了迅速的发展。在谷歌图书关键词排序中,“计算社会科学”(英文)在英文图书中的出现频率在2010年之后呈现指数型增长(见图1)2;而在中国知网上,所有计算社会科学相关的中文期刊论文中,近1/3都发表在近两年间。

图 1 Google Books Ngram Viewer 中“计算社会科学”条目的出现趋势2

img

然而,计算社会科学的快速发展也使许多其学科内部的矛盾凸显,其中最核心的就是研究中的伦理问题。计算社会科学在社会中遭受了广泛的质疑。各购物平台利用大数据分析用户,从而进行“大数据杀熟”3;“魏则西事件”中,百度作为掌握用户大量搜索数据的公司,利用这些数据进行“莆田系医院”广告的精准推送。

正如上文提出和下文要讨论的那样,计算社会科学的学科本质属性,再加上计算社会科学的飞速发展,使许多伦理方面的讨论出现。而在不少学者对于计算社会科学的研究中,对于伦理问题的探讨却不够充分,甚至根本没有注意到在它们的存在。45这驱使我们探究计算社会科学中伦理的边界。

1 研究背景简介

从塔斯基吉梅毒实验开始,经过近几十年的发展,科学研究的基本伦理原则先后在《贝尔蒙报告》、《门罗报告》、《美国联邦受试者保护通则》中得到充分展示,有研究者概括出四条基本原则:尊重原则、有利化原则、公正原则、对法律和公共利益的尊重原则。6

无论在计算机科学中还是在社会科学中,关于伦理的讨论并非刚刚出现,但两者的伦理观有一定的区别。计算机科学由于其理论性较强,对于伦理问题的考虑较为少见。社会科学则因其与人类相关的实践性成分更多,对伦理问题的考虑一般更加充分;许多研究都需要经过专门的“伦理委员会”的讨论。

作为计算机科学和社会科学的交叉学科,计算社会科学兼具理论性和实践性两种特性,十分可能对现实世界中的人造成影响,因此伦理是必须要考虑的问题。然而,两种学科伦理观的碰撞导致学术群体对于某些伦理问题的看法存在较大的争议。对由计算机科学转入计算社会科学的学者,其由实验可行性的思考转入对可能施加于数百万人的实验的过程会更加直接;而不像使用数据方法的传统社会科学家那样,在实验之前对伦理问题作出周密论证。7

2 计算社会科学焦点研究实例

为了研究计算社会科学的伦理问题,本节将从一个曾引起了很大争议的研究实例谈起。

2012年,脸谱网(facebook.com)利用其社交平台进行了一项社会心理学研究,并在2014年将其成果发表。在一周的时间中,平台在没有取得用户”同意”的情况下,使用算法操纵了689,003名用户的时间线,筛选了情感因素,使一部分人暴露在更多的正面情绪内容下,另一部分暴露在更多的负面情绪内容下。通过分析用户在一周中发表内容的情绪关键词使用情况,平台得出一个社会心理学的结论:人即使是在没有意识到的情况下暴露在某种情绪的环境中,也会给人的情绪带来相同方向的影响。8

这个实验在网络上引起了广泛的争论。《纽约时报》、《卫报》、《福布斯》等报纸和杂志都发表了文章来评论该次事件。脸谱网官方说明,由于用户均在注册时同意了“隐私条款”,其中允许脸谱网利用用户的数据进行“研究(research)”。但有网络评论认为,脸谱网的行为虽然不违法,但对于用户进行心理实验“超越了伦理问题的红线(cross the line)”,因为其没有获得用户的“知情同意”(informed consent)。9

通过上面的例子,也通过某些学者的研究,我们发现不同的研究者之间、研究者与公众之间,对于计算社会科学的研究的伦理红线都有较为不同的认识。因此,厘清计算社会科学中的伦理原则和伦理边界就显得至关重要。

3 计算社会科学范式:构建独特伦理框架

无论是相比于计算机相关学科还是社会科学相关学科,计算社会科学都可以算是一门“全新”的学科。直至2009年,15位科学家共同在《科学》期刊上发文,才标志着当前计算社会科学的学科范式初步建立。10本节将对这个范式作出一些基本的阐释,并试图从此范式得出计算社会科学的一些基本伦理原则。

正如本文在最开始,以及15位科学家所指出的:计算社会科学的目的是通过分析和研究人类产生的信息数据,对人类社会进行解释和预测。10这可以体现出计算社会科学具有的“计算”和“社会”的两面性,而这样的两面性共同构建了计算社会科学的学科范式。

3.1 信息与互联网时代:“数据”的内在矛盾

相比机械工业时代,信息时代的一个显著特点是人们在社会生活中所产生的许多“信息”都会以“无损”的数字存储形式保留下来,成为所谓“数据”。而伴随着互联网、社交媒体用户急剧攀升,人们的互联网行为越发频繁,产生的数据也就是海量的。如此规模的数据(常被称为大数据)被认为是计算社会科学能够进行的基础和推动力。10然而,互联网的这些人类行为数据作为计算社会科学发展的元动力,其产生和存在的形式就具有许多矛盾,这些矛盾直接决定了计算社会科学的范式以及其内在的伦理问题。以下是“数据”内在矛盾的几个主要方面:

数据所有权的矛盾。首先,互联网的数据产生于服务使用者的行为,然而却保存在服务提供平台或公司处,这模糊了这些数据的所有权。服务提供的平台或公司对于这些数据拥有多少所有权,能够在多大程度上使用和公开这些数据,这是学界和社会各界都没有达成共识的问题。11这也就是上文脸谱网的研究实例产生如此大的争议的原因。其次,互联网的出现导致“公共”和“私人”数据界限的模糊。例如,用户在微信“朋友圈”之类小规模社交圈发表的消息的隐私权和公开程度的处理也引起社会和学界争议。12而且,有学者认为公开数据和私人数据两者的区别已经消失。因为在一定程度上,虽然经过了“匿名化”,甚至加入了随机的扰动,但足够多的公开数据完全可以追溯出更加私人的数据。611其实,上文所述的数据所有权的矛盾一定程度上正是互联网中用户的隐蔽性、匿名性与社会科学研究中数据公开性之间的矛盾的体现。

数据目的性的矛盾。其具体表现为数据生成时的少目的性与数据利用时的强目的性的矛盾。在信息时代,人们产生的信息与数据并不为某一特定的原因和过程生成,其原因可能不存在或十分驳杂。但在传统社会学研究中,数据的获取和生成带有强目的性,传统社会学对数据的研究也具有强目的性。然而,在计算社会科学的研究中,其研究主体的强目的性与研究客体的弱目的性的交错,可能导致数据的所有者因为自己的语境被过分或错误解读而感到不适。6

数据来源的矛盾。目前计算社会科学的研究对象主要都是采用社交平台的“公开”数据,或从私人企业合作中获得的数据,但这些数据能多大程度上代表被研究者的整体是有待商榷的。对这些数据进行系统性的筛选基本上是不可能的,这是与传统社会科学有针对性的获取数据的最大的区别。网民不能代表人民,在某种数据平台上的人也不能代表所有网民,系统性的误差是很可能出现并且不被意识到的。由这样“坏数据”,我们做出的结论也就很可能会出现误差,从而导致给现实中的人类造成伤害。

3.2 数据之上:社会性的综合

上面的讨论仅限于计算社会科学研究客体,也就是“数据”层面;如果以上面的“数据”视角考察计算社会科学科学研究的主体“人类社会”时,伦理问题就纷纷出现。

在大数据的研究范式中,少数群体很可能被忽视。大数据研究重视理论对实践上的“准确度”,但是忽略了社会个体的差异的内在秉性。比如对随机个体的预测准确度是95%的某种算法与一个对于占90%的多数群体预测准确率100%和10%的少数群体预测正确率50%的算法,两者在总体数据层面表现出来可能几乎没有差别,但是对于少数群体来说却是巨大的偏见。13结果的歧视性可能由数据的不客观性、方法不客观带来。数据集的规模虽然可以很大,但数据集本身就是由之前人类可能存在的偏见生成,因此机器学习等训练出来的模型也就可能会带有偏见的色彩;研究者也不可能完全客观,因而设计的研究方法(比如对数据的处理方式)也就会原发性地带有歧视性。14

计算社会科学并非单纯对社会信息的计算方法研究。计算社会科学学科范式中有鲜明的社会科学学科范式内容。13正如第二节中提到的,计算社会科学在本质上还是一门以人类为研究主体的科学(human subjects research),需要考虑到对于人们现实的生活的影响。相比于其他计算科学如人工智能围棋等,通过计算得到的模型具有可以直接施加于现实的人的能力。

总结来说,计算社会科学是对计算科学研究范式的延伸,对传统社会学研究范式的重构,带来了全新的伦理学问题。而有学者认为,计算社会科学研究中伦理制约的根本性原因在于“计算技术“带来了对被试者不断增强的控制力,超越了道德规范和法律修订来约束的速度。15仍以脸谱网的研究为例,在该项研究中,研究者轻而易举地操纵了数百万人的生活。

4 关于计算社会科学伦理原则

基于《贝尔蒙报告》、《门罗报告》和《通则》中指出的科学伦理原则,再综合以上对于计算社会科学学科“数据”本质矛盾的探讨,下面本文提出和讨论一些适用于计算社会科学学科的伦理原则:

第一,保证被实验者的“自主权”。计算社会科学的实验应该更多的观察现象而非操纵行为,应该更多的是解释而非再生成信息,从而减少对被实验者的影响。由此“自主权”衍生出的“知情同意”则具有较大的争议。许多学者在进行实验的过程中并没有获得被试者的知情同意。9事实上有学者认为,在大数据语境下,因为需要征求的被试者过多,几乎不可能获得所有被实验者的知情同意。而且,知情同意可能会增加客体受到伤害的风险,并瓦解实验的科学性。11因此现在学界认为,在信息可以公开获取的情况下,无需知情同意即可进行试验。

第二,保证被实验者的隐私权、匿名权。在公开实验结果、分享实验数据时,应该充分考虑被实验者的隐私和匿名,对敏感信息进行处理,并对数据可获取性进行一定的限制,例如仅对可验证身份的研究者开放信息的共享。

第三,保证被实验者不受到伤害(do no harm)。值得注意的是,在计算社会科学中,不同于以往的社会科学,借助于社交媒体的广泛传播性,实验可能对被试者造成更多的困扰,比如网络暴力、社交媒体上的“社会性死亡”等等。11

5 计算社会科学与伦理的和解

针对以上的伦理原则,本节将从不同方面提出使计算科学研究减少被伦理问题困扰,从而健康发展的具体方法:

明确学科范式。首先,在研究者由其他领域进入计算社会科学领域时,应加强关于伦理原则的宣传和教育,促进学者团体对学科伦理原则的坚持。除此之外,应该加强对于伦理的连续而非二分性的认识。许多现代伦理问题并非一棒子打死的“行”或“不行”,而是“更为合适”与“更不合适”的区别。其次,完善数据使用与共享机制。根据伦理的非二分性以及计算社会科学的新兴性导致的不确定性,当遇到隐私隐私,研究者和审查者都不应该明确的反对或者支持,而是在平衡风险和效益下进行决策,选择合适的数据使用的限度和分享的范围。6

对于监管者,加强对于伦理问题的监管。在计算社会科学设置专门“伦理委员会”,对所有相关的研究进行预先的伦理审查(Pre-study review),从源头层面防止有害于伦理道德研究进入实施。

对于研究者,有以下两个方面:

  1. 加强合作与交流。通过社区合作,利用社区的同行监督功能,进一步明晰计算社会科学的伦理边界,并对研究在发表前加以预先审核,防止超越伦理界限的研究出现和不良社会影响的产生。促进使不同领域的研究者充分交流,使交叉学科继续融合,继续构建计算社会科学的学科范式,推进不同伦理观念的融合。

  2. 强调具体问题具体分析的方法。比较有代表性的是尼森鲍姆提出的“情景完整性”(situational ethics)的伦理判断方针,强调根据三个要素判定信息是否能够流通:角色(主体、发送者、接受者)、属性(数据类型)和传输原则(数据流通限制)。在讨论某种数据传播和应用是否侵犯了隐私权时,需从这三方面进行考虑,而不是简单地认为数据应当完全共享或者共享即侵权。14计算社会科学作为新兴学科,必然要面对各种不确定性,此时其能够为计算社会科学还没有积累充分经验时提供可行的伦理分析方法。

6 结语

在大数据、人工智能等手段日益繁荣的当下,计算社会科学有光明的前途,可期待的研究领域十分广泛。然而正如之前提到的那样,由于拥有社会科学的背景,计算社会科学的理论研究与实践密不可分,而伦理在有关人的实践科学中地位重要。计算社会科学发展道路的曲折程度的大小,将很大程度上取决于研究者能否克服面前的伦理问题。这些伦理问题,本质上源自对社会科学范式的继承和计算学科范式决定的研究方法中对于充满矛盾的人类“数据”的广泛应用和。

因此,通过认识人类“数据”的本质矛盾,从而处理好研究着、公众与作为研究对象的人类“数据”之间的关系,计算社会科学中的伦理问题才能得到妥善的解决的前提。由于计算社会科学的新兴性,许多伦理问题并不能预先预料到伦理在计算社会科学的发展中应该起到框架性的指导作用,而非约束性的限制作用。11

本文从对计算社会科学本质的思考提出计算社会科学应该遵循的原则,希望能够为计算社会科学研究的框架的形成做出一些贡献。

参考文献

后记

这门课拿了3.6,就离谱…


  1. EDELMANN A, WOLFF T, MONTAGNE D, et al. Computational Social Science and Sociology[J]. Annual Review of Sociology, 2020, 46. ↩︎

  2. Google Inc. Google Books Ngram Viewer [Z/OL]. (2020-11-29) [2020-11-29]. http://t.cn/A6GdeqIe↩︎

  3. 央视网. 从“大数据杀熟”透视中国企业商业伦理的缺失[N/OL].(2018-03-29) [2020-11-29]. http://t.cn/RnE91oW↩︎

  4. 朱萌,龚为纲. 计算社会科学:一种新研究范式[N]. 中国社会科学报,2020-11-18(005). ↩︎

  5. 韩军徽,张钺,李正风.计算社会科学——缘起、变革与挑战[J].清华社会科学,2019,1(02):117-132. HAN J H, ZHANG Y, LI Z F. Computational Social Science: Origin, Revolution and Challenges[J]. Tsinghua Journal of Social Sciences, 2019,1(02):117-132 (in Chinese) ↩︎

  6. 萨尔加尼克 M J, 赵红梅, 赵婷 计算社会学[M]. 北京: 中信出版集团, 2019. SALGANIK M J. ZHAO H M, ZHAO T. Bit by bit: social research in the digital age[M]. Beijing: CITIC Press, 2019. (In Chinese) ↩︎

  7. KASHMIR H. Facebook manipulated 689,003 users’ emotions for science [OL]. (2014-06-28) [2020-12-02]. http://t.cn/A6GFxFBD ↩︎

  8. Verma I M. Editorial expression of concern: Experimental evidence of massive-scale emotional contagion through social networks[J]. Proceedings of the National Academy of Sciences of the United States of America,2014,111(29). ↩︎

  9. VINDU G. Emotions in News Feed experiment, stirring outcry [OL]. (2014-06-29) [2020-12-02]. http://t.cn/A6GF6JTF ↩︎

  10. LAZER D, PENTLAND A, ADAMIC L, et al. SOCIAL SCIENCE: Computational Social Science[J]. Science (American Association for the Advancement of Science), 2009, 323(5915): 721-723. ↩︎

  11. HENNELL K, LIMMER M, PIACENTINI M. Ethical Dilemmas Using Social Media in Qualitative Social Research: A Case Study of Online Participant Observation[J]. Sociological Research Online, 2019, 25(3): 473–489. ↩︎

  12. 江旻哲.对微信朋友圈构成“公共场所”之分析[J].法制博览,2017(11):242. ↩︎

  13. WALLACH H. Computational Social Science not equal Computer Science plus Social Data[J]. Communications of the ACM,2018,61(3):42-44. ↩︎

  14. 凌昀,李伦.计算社会科学研究:范式转换与伦理问题[J].江汉论坛,2020(09):26-31. ↩︎

  15. 王泽南. 从传统社会学到计算社会学的方法论探析[D].哈尔滨工业大学,2020. WANG Z N. Research on methodology from traditional society to computational Sociology[D]. Harbin Institute of Technology. 2020. (in Chinese) ↩︎


cqqqwq
WRITTEN BY
cqqqwq
A student in Software Engineering.


Comments