MISQ专栏
MISQ专栏

专家还是大众:谁会产生更多的偏见

日期:2022-12-02    来源:CNAIS “MISQ China Impact”团队    作者:Greenstein Shane & Feng Zhu   编辑:夏宇,香港大学商学院创新与信息管理系,2019级博士生   点击:

一些已有的研究证明,普通大众产生的决策可能比专家的决策更准确,从而减少了人们对大众智慧的准确性的怀疑。但是除了准确度,由普通大众产生的知识的信息质量的其它维度,却鲜为人知。例如,群众组织产生的知识比专家产生的知识有更多还是更少的偏见?如果在这个维度上两者存在差异,那么让这种差异减小的关键因素可以是什么呢?

今天为大家介绍的MISQ文章——由Greenstein Shane和Feng Zhu合著的“Do Experts or Crowd-based Models Produce More Bias? Evidence from Encyclopedia Britannica and Wikipedia”. 该文章用实证方法比较了针对同一个话题下的大英百科全书(Encyclopedia Britannica)的专家和维基百科(Wikipedia)上的大众用户产生的知识在极端性(slant)和偏见(bias)方面的差异,并研究了减小这种差异的关键因素。

图1


01 研究背景和研究问题

维基百科是全球最大的在线百科全书,依靠数以千万计的志愿者群众来生成其内容。大英百科全书是最流行的离线英语百科全书,其内容依靠专家获取的材料、并在编辑和专家协商后产生最终内容,享有“严肃信息的权威存储库”的美誉。面对存在争议的话题,维基百则通过分散决策权给贡献者来解决争议,而大英百科全书的编辑与专家会协商解决争议,并控制的文章长度。不同于以往研究考察群众产生的知识的准确度,本文探讨了大众产生的知识和专家产生的知识存在的极端性和偏见的差异程度。


02理论和假设

研究这一问题存在两个困难。第一,因为无法准确识别“真相”,研究者很难量化偏见。第二,一些主题本质上比其他主题更容易存在意见倾斜或偏见。本文通过开发匹配的配对文章样本来克服这两个挑战。具体而言,这些文章同时出现在两个来源中,并且涵盖了美国政治中相同或几乎相同的主题。基于匹配的文章,作者提出以下假设。

H1:对给定主题、存在争议的知识(contested knowledge),大众产生的知识比专家产生的知识包含更多偏差。

作者提出四点理由支持这一假设。第一,从数量上来说,在线社区中群众数量众多,多样性更大,因此他们创造的知识产生偏见的程度更大。换句话说,减少知识贡献者的数量能够减少内容中的偏见。第二,由于在线社区中没有统一的解决争议的规范和程序,群众虽然很想保持客观和公众,但是他们对什么是公正的内容的评估可能不同。因此,在不同的合作者群体之间就中立内容达成共识的困难,可能会使许多偏见仍然嵌入他们产生的知识和内容中。第三,贡献者的构成也可能形成偏见。尽管任何人都可以贡献他们的知识,但实际情况是相对较少的贡献者提供了主要的知识和内容,因此也促进了偏见的产生。第四,由于社区群众的选择性偏差,他们更加趋向于选择寻求与他们的信念一致的信息或解释模棱两可的信息,以增强他们的信念。基于这个原因,随着时间的推移,在线社区的知识的多样性也就会降低。也就是说,如果具有特定倾向的在线社区只吸引具有相似意识形态的知识贡献者,与来自基于专家的模型的知识相比,这些组织产生的知识会表现出强烈的意识形态偏见。

H2:当大众生成的内容收到更多的修改时,其偏差与专家产生的知识相比会更小。

作者提出以下理由支持这一假设。修改过程在大众产生知识的过程中发挥着很重要的作用,而且其作用和在专家产生知识的过程不同。专家在产生知识的过程中,和其他编辑协商并修改内容,这一过程发生在公开发表之前。在线社区中,修改发生频繁,因此具有不同观点的大众群体不断输入新的内容。随着时间的推移,这样的修改过程能够使得在线知识变得越来越中立。 其次,如果在线知识和内容一开始的编辑者都是对这些问题有兴趣的大众,他们热衷于创建新知识和修改新的知识,这样后期的、比较中立的用户修改之后,知识内容也更有可能从具有不同观点的群体中获得输入、从而减少偏见。另外,在线社区中存在“Linus's law”的信念(是指“给定足够大的 Beta 测试人员和合作开发人员基础,几乎每个问题都会很快得到特征化,并且修复对某人来说是显而易见的”)。这种信念促进了修订过程抵消自我选择和群体认知的负面影响,并因此减少内容偏见的趋势。


03 研究方法与发现

作者开发了一个匹配的样本,来比较在两个来源(Encyclopedia Britannica和Wikipedia)中同时出现和涵盖相同主题的配对文章。首先,作者检查了关于广泛的美国政治主题的维基百科文章样本,包括所有包含关键字“共和党”或“民主党”的维基百科文章。通过Greenstein 和 Zhu (2016) 开发的程序来删除涉及美国以外的事件的文章,最终获得 70,668 篇关注美国政治的文章的样本。然后,作者将维基百科文章列表与 大英百科全书在线版中的120,000 多篇文章进行比较,并确定 3,918 对匹配文章。作者手动检查并确认了匹配文章主题的相似性。最后,作者采用 Gentzkow 和 Shapiro (2010) 的方法测量这些文章的极端性和偏见。

作者比较了维基百科文章和大英百科全书的文章的极端性和偏见的差异程度。首先,维基百科的文章似乎比大英百科全书的文章更偏向民主党, 而且维基百科的文章往往比大英百科全书的文章更有偏见。尽管这两个来源中的文章都倾向于民主党的观点,但维基百科的文章具有更大程度的极端性和偏见。例如,针对“政府(Government)”这一话题,维基百科文章中的偏向民主党的程度值为0.14, 显著高于大英百科全书文章偏向民主党的程度值0.05。其次,作者发现,以字数衡量,维基百科的文章比大英百科全书匹配的文章更长。值得一提的是,如图2所示,作者发现不同主题目录下的文章呈现的极端性的差异程度不同。最后,作者将极端性和文章长度的偏差标准化,发现在每个单词的基础上,维基百科的文章比大英百科全书的文章更偏左且偏见更小。 这些结果表明,极端性和偏见的差异可能与文章的长度有关,因此在回归分析中控制文章长度并关注平均效果很重要。另外,统计结果表明我们样本中平均每篇文章被修订1,924次,最多被修订44,880次,而最少只被修订过一次。其中,平均修订次数为 1,924的文章,不能够显著减少文章中的偏见。只有得到足够修订次数足够多,它们的极端性和偏见显著降低。

46D49

图2 (Reference: Greenstein & Zhu, 2018, p950,Table 1)

作者匹配的方法,从两个来源中分别选择涵盖美国政治中相同或几乎相同主题的成对文章,以控制不同主题的文章存在的不可观察因素。 基于此样本,作者通过回归方法比较维基百科和大英百科全书的文章的极端性和偏见的差异。 回归结果与上述的统计结果相似,即维基百科的文章比大英百科全书的文章更偏向民主党、偏见更多。然而,当作者通过文章的长度来标准化对极端性和偏见的度量,结果显示整体上维基百科的文章比大英百科全书的文章更接近中立。 从单词层面上看,维基百科文章比大英百科全书文章的偏见更少。

作者接下来检查维基百科文章的修订过程如何改变文章的偏见。在回归模型中,因变量是维基百科文章的偏见程度,同时控制了对应的大英百科全书的文章的偏见程度。模型中加入几个与维基百科修订过程相关的解释变量,包括维基百科文章修改的数量、修改过该文章的人数和每个人修改的次数。结果显示,获得更多修订的维基百科文章往往更加中立。作者进行了几次稳健性检查,得到了相似的结果。


04 结论与启示

总结而言,该论文通过比较基于大众智慧的知识和基于专家智慧的知识中的极端性和偏见,证实了前者内容的中立程度低于后者。同时,实证分析发现当基于大众智慧的文章被大幅修改时,基于大众智慧的知识不会导致比专家产生的知识具有更大的偏见。


参考文献: Greenstein, S., and Zhu, F. (2018). Do Experts or Crowd-based Models Produce More Bias? Evidence from Encyclopædia Britannica and Wikipedia. Mis Quarterly, 42(3), pp.945-959.

https://doi.org/10.25300/MISQ/2018/14084

文章链接:https://misq.umn.edu/do-experts-or-crowd-based-models-produce-more-bias-evidence-from-encyclopedia-britannica-and-wikipedia.html


文章中提及的其他参考文献:

Gentzkow, M., and Shapiro, J. M. (2010). What Drives Media Bias? Evidence from U.S. Daily Newspapers. Econometrica, 78(1), pp. 35-71.

Greenstein, S., and Zhu, F. (2016). Open Content, Linus’ Law, and Neutral Point of View. Information Systems Research, 27(3), pp. 618-635.


作者信息:

1C564

Shane M. Greenstein

Position: Martin Marshall Professor Of Business Administration & Co-chair of the HBS Digital Initiative

Site: https://www.hbs.edu/faculty/Pages/profile.aspx?facId=718917

Email: sgreenstein@hbs.edu

Research interests: strategy, regulation, history, marketing, information systems, and organization design.

26254

Feng Zhu

Position: Professor of Business Administration at the Harvard Business School

Site: https://www.hbs.edu/faculty/Pages/profile.aspx?facId=14938  

Email: fzhu@hbs.edu

Research interests: platform strategy, digital transformation, and innovation.