人们在网购浏览商品时,总会接触到商品的评分信息,有些是推荐系统给出的“猜您喜欢”、“您可能会对这件商品打5分”等推荐标签,另一些则是其他用户在购买商品后给出的评分。这两种个性化和非个性化的评分在帮助用户了解商品质量的同时,也在无形中扭曲了用户自身对商品的偏好评分。而偏好影响的程度究竟有多大?两种评分信息一起显示,又是否会合并产生更大的偏差呢?
本次介绍的文章《Effects of Personalized Recommendations versus Aggregate Ratings on Post-Consumption Preference Responses》就将通过实验室实验,探究上述两种评分信息对人们打分偏好的影响,为消费者、平台和系统设计者在现实应用中提供启示。
01 背景介绍
电商情景下的商品评分是在消费前向用户展示的,这样虽然能够帮助用户了解更多商品信息,却会影响用户的偏好和决策,造成消费后打分的偏差(Bias)。小小的偏差在用户和系统的反馈循环中不断被放大,将使得系统的推荐不准确、用户对系统失去信心,产生恶劣的影响。研究评分信息对于用户的作用机制和影响程度就尤为重要。
作者将常见的商品评分信息分为两类:一类是推荐系统基于用户自身的购买记录及其他用户和商品的偏好和信息预测出的,称为个性化推荐评分(Personalized Recommendation Ratings),例如“您可能会对这件商品打5分”;另一类是根据其他用户对商品的评分得到的,最常见的方式就是取评分的平均值,称为综合用户评分(Aggregate User Ratings)。
来自MIS Quarterly, Vol. 46 No.1 / March 2022 P.642
以往研究已经验证了二者分别都会造成用户的评分偏差,但由于它们对用户传达了不同的信息,潜在的影响机制不同,当二者同时展现在用户面前,情况就变得复杂。对此,作者提出了两方面的研究问题:
1.在影响程度方面,哪种评分的影响相对更大?
2.当二者同时展示,它们的影响是叠加的还是抵消的?是个性化评分占主导,还是推荐评分占主导?
02 理论解释与假设提出
无论是个性化推荐还是综合评分,购买前商品评分的展示都会使用户购买体验后的打分产生偏差,这一现象已经被许多学者探究分析。尽管导致了相同的体验后偏差,但两种商品评分是通过不同的机制影响消费者心理的。
个性化推荐评分将与商品和用户自身相关的碎片化信息综合起来展示给用户,影响用户的认知和决策过程,这一影响将一直持续到用户购买并体验商品之后。同时,个性化推荐评分是完全在个体层面的,即使是考虑了社交关系特征的推荐系统也没有显式地为目标用户提供他人的偏好。与之相反,综合用户评分则完全没有个人的元素,而是将群体的共同信息整合,通过社会比较,让用户“学习”到他人的偏好。作者认为他人的影响在用户自己体验过商品之后更容易被消除,由此提出:
假设1:相比综合用户评分,个性化推荐评分对用户体验后打分造成的偏差将更大,即用户打分将更大程度地被“拉近”个性化推荐评分。
在现实中,两种类型的商品评分往往会同时出现,这种情况下,作者也同样可以进行推测:
假设2:当两种商品评分同时展示时,个性化推荐评分对用户体验后打分有更大的影响。
除了相对大小之外,作者也关心两种评分的合并影响。由于二者的潜在作用机制不同,作者认为它们只有简单叠加的作用,并不会交互增强影响,即:
假设3:当两种商品评分同时展示时,个性化推荐评分和综合用户评分的影响是二者单独影响程度的叠加。
03 研究分析
本文通过实验室实验尝试验证所提出的假设。考虑到体验型特性和实验时间的可行性,实验选取笑话作为消费的商品。被试先在不提供任何评分信息的情况下,阅读50个笑话并进行五星标准的评分。接下来,同样一批被试继续阅读另外45篇提供推荐评分的笑话,并根据评分的展示类型将被试分为四组:只显示综合评分、只显示个性化评分和二者都显示,其中二者都显示的类别中为了消除显示顺序的影响,便再随机分成了综合评分先展示和个性化评分先展示的两组。展示的评分则是根据均值不同的两个均匀分布随机生成,分为高评分和低评分两种。
收集到被试的评分数据后,作者对四组被试的评分做了成对t检验,结果如下图。发现不管评分种类如何,显示高分与显示低分的被试打分都有明显的差距。而从横向的比较来看,两种评分并没有对高(或低)评分组产生明显的影响。这一结果与后续的回归分析都无法支持假设1。
图片来自MIS Quarterly, Vol. 46 No.1 / March 2022 P.634
对于假设2,作者同样做了t检验和回归分析,结果表明个性化评分的系数显著大于综合评分的系数,假设2得到支持。
来自MIS Quarterly, Vol. 46 No.1 / March 2022 P.637
最后作者将同时展示两种评分和只展示一种评分的情况比较,观察回归的主效应和两种评分交互项的系数,但发现它们都不显著,即两种评分之间没有交互作用,假设3不被支持。
来自MIS Quarterly, Vol. 46 No.1 / March 2022 P.638
04 总结与启示
本文对两种商品评分的研究发现,展示商品评分确实会使消费者在体验后的打分产生显著偏差,而个性化评分和综合评分的关系是互补的,二者并没有叠加或相互增强的作用。当它们同时展示,个性化评分的影响力会远强于聚合评价的影响力。
弄清这两种常见商品评分之间的关系,有很大的现实意义。电商商家和消费者都会更好地意识到商品评分对偏好的扭曲作用,避免可能的负面影响。而平台和系统设计者也需要重视商品评分的展示形式,以及受扭曲的用户打分对推荐系统的危害,进而努力营造更好的在线购物环境。
参考文献:Adomavicius, G., Bockstedt, J., Curley, S., & Zhang, J. (2022). Effects of Personalized Recommendations versus Aggregate Ratings on Post-Consumption Preference Responses. MIS Quarterly, 46(1): 627-644.
https://doi.org/10.25300/MISQ/2022/16301
文章链接:https://misq.umn.edu/effects-of-personalized-recommendations-versus-aggregate-ratings-on-post-consumption-preference-responses.html
作者信息:
Gediminas Adomavicius
Position: Professor, Carlson School of Management, University of Minnesota
Site: https://carlsonschool.umn.edu/faculty/gediminas-adomavicius
E-mail: gedas@umn.edu
Research Interest: Electronic Market Mechanisms, Data Mining and Knowledge Discovery, Personalization Technologies and Recommender Systems
Jesse C. Bockstedt
Position: Professor, Goizueta Business School, Emory University
Site: https://goizueta.emory.edu/faculty/profiles/jesse-bockstedt
E-mail: bockstedt@emory.edu
Research Interest: Behavioral Economics, Online Consumer Behavior, Electronic Commerce
Shawn P. Curley
Position: Professor, Carlson School of Management, University of Minnesota
Site: https://carlsonschool.umn.edu/faculty/shawn-curley
E-mail: curley@umn.edu
Research Interest: Decision-making, Forecasting, Problem-solving
Jingjing Zhang
Position: Associate Professor, Kelly School of Business, Indiana University
Site:https://kelley.iu.edu/faculty-research/faculty directory/profile.html?id=JJZHANG
E-mail: jjzhang@indiana.edu
Research Interest: Personalization and Recommender Systems, Business Intelligence, Knowledge Discovery and Data Mining