人工智能驱动的数字主播在在线零售中的应用

时间: 2026-03-27 14:26:23   阅读:


  2026年3月24日上午9:00,中国营销工程与创新研究中心(以下简称“MEI”)2025-2026年第二学期第4次研讨会(以下简称“Seminar”)在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。

  本次Seminar由李端阳研读文章《Artificial Intelligence-Powered Digital Streamers in Online Retail: Empirical Insights and Design Strategies from Experiments》。

截屏2026-03-27 14.25.13.png

  一、 研究背景

  随着人工智能、虚拟现实和生成式AI等技术的快速发展,AI驱动的数字主播正在重塑在线零售中的直播电商模式。这类数字主播不仅能够以拟人化的外观和交互方式与消费者实时互动,还具备全天候在线、低成本、可规模化等优势,逐渐成为品牌营销的重要工具。

  尽管数字主播在技术上日益成熟,应用前景广阔(预计到2025年中国市场规模将达到2697.1亿元,年增长率高达127.89%),但其实际的经济价值和销售效果尚不明确。现有研究多聚焦于消费者对数字主播的接受度、体验价值和购买意愿,缺乏对其实际销售表现的实证评估,尤其是与真人主播相比的效果差异,以及如何通过设计优化提升其表现。

  为填补上述研究空白,本文提出两个核心研究问题:

  数字主播相较于无直播情境,对产品销售额的经济影响如何?即:数字主播是否真的能带来销售增长?其表现是否可与真人主播媲美?

  

  在拟人化设计中,形式真实感与行为真实感分别如何影响数字主播的销售效果?具体包括:外观、语音、互动功能(如实时问答、抽奖)等设计策略对销售的影响机制与效果差异。

  二、 概念发展

  社会反应理论

  社会反应理论认为,当人们与模仿人类特征的技术交互时,会自然而然地将这种技术视为社会行动者。因此,在与拟人化数字代理交互时,他们会运用人际交互中使用的相同社会规范,从而产生相应的社会反应和行为(Nass and Moon 2000, Pelau et al. 2021)。这些社会行为源于拟人化线索的激活,如人类般的外观、语音和对话风格,这些线索唤起了社会存在感(Short et al. 1976, p. 16)。培养对数字代理的信任、情感和社会反应方面发挥着关键作用。社会存在感为“在交互中他人的显著程度”。不同的拟人化线索会引发不同水平的社会存在感(Schuetzler et al. 2020)。例如,与沟通线索相比,视觉和基于身份的拟人化线索对社会存在感的影响可能有限,因为后者能创造更强的与真人相处的感觉(Go and Sundar 2019)。

  

  三、假设推导

  形式真实感

  形式真实感指数字代理的视觉外观与人类的相似程度。它包括空间表现(二维与三维)、人口统计学属性(如年龄、性别和种族)以及动态身体特征,包括面部表情和身体动作(Blascovich et al. 2002, Miao et al. 2022)。

  在观众习惯于真人主播的直播情境中,数字主播的形式真实感可能是模仿真人主播人际吸引力的关键因素。与静态虚拟代理不同,数字主播需要在视觉上复制真人主持的活力和表现力,以培养社会存在感——用户感知到的与他人相伴的感觉(Short et al. 1976)。鉴于数字主播通常嵌入在视觉丰富、互动性强的环境中,增强形式真实感可能在建立消费者信任和提高产品销售方面发挥关键作用。这使得观众更愿意接受数字主播的产品推荐,从而增加购买的可能性,最终推动更高的产品销售。提出假设:

  H1:增强数字主播的形式真实感将提高直播情境下的产品销售

  行为真实感

  行为真实感指数字代理模仿人类行为的程度,包括语言沟通(如语音和语言风格)和交互能力(如回答问题、发起对话)(Bailenson et al. 2008)。在直播中,行为真实感尤其具有影响力,因为它能实现动态、情境特定的交互,模拟人类般的响应性。提出假设:

  H2:增强数字主播的行为真实感将正向影响产品销售,且人机交互的效果将超过语言沟通。

  

  形式真实感与行为真实感的比较

  虽然形式真实感和行为真实感都有助于数字代理的有效性,但行为真实感对消费者行为的影响往往更为显著。根据社会反应理论,行为线索(如语音语调、对话风格和交互能力)相比于静态视觉特征,能唤起更强的社会存在感,使其在推动参与和购买决策方面更具影响力(Go and Sundar 2019, Pelau et al. 2021)。

  此外,高形式真实感若缺乏相应的行为真实感,可能导致消费者期望落空,引发负面消费者感知(Miao et al. 2022)。例如,一个视觉逼真的数字主播若未能动态互动,可能被视为生硬或尴尬,从而降低其有效性。相反,具有强大行为真实感(如交互能力和自然沟通)的数字主播,即使视觉设计较为简单,也能实现显著的消费者参与。提出假设:

  H3:数字主播的行为真实感对产品销售的正向影响强于形式真实感。

  三、 研究方法

图片1.png

  论文包含两项研究:

  研究1评估当前低真实感设计的数字主播相对于“无直播”的销售效果;

  研究2测试多种拟人化设计策略(形态真实感与行为真实感)对销售的影响,并与人类主播对比。

  研究1:

  研究目的:评估当前低真实感设计下数字主播的经济价值。具体而言,本研究旨在确定:与无直播相比,采用数字主播是否能够提升产品销售额,从而回应研究问题一(RQ1)。

  研究数据:与一家知名的运动服饰零售商合作,该零售商通过其在天猫(Tmall.com) 的官方店铺主要销售运动相关产品(如鞋、T恤和包袋)。天猫于2016年推出了其直播平台——淘宝直播,使零售商能够将直播环节整合到其在线店铺中。

  研究收集了该时尚零售商从2021年3月1日至8月17日的每日在线交易数据。总计,我们拥有数字主播于2021年5月18日推出前的11周和推出后的13周数据。在此数据收集期间,该零售商共有925款产品在线销售,其中442款产品进行了直播。

  实证模型:

  采用广义合成控制法来识别数字主播以及人类主播对产品销售的影响。在控制了产品特征(即价格和折扣)后,我们根据销售额将处理组中的产品与合成对照组进行匹配。这有助于我们解决最重要的内生性问题(即,产品是如何被选择进行直播或不直播,以及采用哪种类型的主播)。设定的广义合成控制法模型如下:

图片2.png

  其中结果Yit表示第t天产品i的销售额。Dit是一个二元处理指标,若第t天产品i在直播中售出则取值为1,否则为0。 δit 表示第t天每个产品i的异质性处理效应,其中 δit 为平均处理效应。xi′t是关于产品特征(即价格和折扣)的观测协变量向量。 λ ′i是未知因子载荷,ft是未观测共同因子向量。具体而言, λ ′ift涵盖多种未观测异质性,包括产品(即吸收所有跨时间不变的横截面差异)和时间(即吸收所有产品间的共同跨期变化)固定效应、产品特定线性或二次时间趋势以及自回归成分。最后, εit 是第t天产品i的误差项。

  研究结果:结果表明,采用当前低真实感设计的数字主播与无直播相比,对产品销售没有显著影响(β=−1.571,p>0.1β=−1.571,p>0.1)。

  与无直播的情况相比,采用当前低真实感设计的数字主播在提升产品销售额方面没有效果,而人类主播在促进产品销售方面显示出显著优势。

  研究2:

  研究目的:通过分析形态真实度(视觉呈现)与行为真实度(语言交互及人机互动)的优化效果,验证数字主播能否实现与真人主播相当的销售业绩。通过在受控实验环境中测试多项设计要素,研究2旨在提炼直播场景中优化数字主播的最优策略,同时充分发挥其低成本运营和低风险优势。

  研究设计:与一家在天猫上新成立的在线食品杂货零售商合作,该零售商销售食品、饮料和日用品。该零售商最近采用了数字主播进行直播,但仍不确定哪些设计特征能最大程度地提升销售效果。借此机会,我们实施了一项随机实地实验,包含七个实验条件,每个条件代表一种独特的设计特征组合。

  与控制组相比,处理组1-5仅改变相应的特征,同时保持其他特征与控制组相同。具体来说,五个处理组包括特定设计特征的增强:

图片3.png

  实验连续进行了七周,从2023年7月10日开始到2023年8月27日结束。为了控制时间效应,我们每晚只在8点到10点(典型的直播高峰时段)进行一场直播(Huang et al. 2014),且每晚只呈现一个实验条件。该零售商共有18款待售产品,全部纳入实验。

图片4.png

  研究结果:

  1. 无模型证据:通过方差分析模型对两个因变量(销售数量与销售收入)进行估计,结果显示实验条件间存在显著差异(销售数量:F(6,875)=6.740,p<0.001;销售收入:F(6,875)=7.850,p<0.001)。

  2. 主效应:通过回归分析量化数字流媒体平台不同设计特征对产品销量的影响。采用包含产品固定效应的普通最小二乘法估计,回归模型如下所示,其中当前数字流媒体平台设计(对照组)作为基准线:

图片5.png

  与其他设计特征相比,在数字主播中引入增强型实时问答功能对销售业绩的提升最为显著(产品销量增长25%,销售收入增长86%)。此外,采用真人主播的处理组6持续展现出最优的销售表现。

  仅T5(具备增强型实时问答功能的数字主播)在直播销售表现上仍与人类主播(T6)具有可比性。该结果表明,将实时问答功能整合到当前低真实感设计的数字主播中,可使其达到与人类主播相当的性能水平。此外,与对照组相比,调整数字主播的外貌特征(T1)和语音特征(T3)以及引入抽奖机制(T4)均显著提升了直播产品销量和创收能力。其中,增强型实时问答功能是最有效的设计策略,抽奖机制的引入位列第二,分别带动销量增长17%和创收增长近70%。

  这些发现表明,通过人机交互实现的行为真实化策略具有最佳效果。值得注意的是,仅调整语音特征即可使销量增长17%,创收增长65%。对数字主播外貌特征进行调整后,产品销量增长了11%,同时销售额也提升了39%。

图片6.png

  3. 机制探索

  为深入探究形式与行为现实主义对产品销售影响的潜在机制,我们对录制的直播视频进行了详细分析,以更好地理解驱动该现象的行为过程。

  为检验假设2采用聊天框中的实时评论数量作为指标,用以衡量消费者对主播作为社交实体的认知程度及其在直播期间的互动意愿,从而作为消费者社交反应的替代指标。我们收集了实地实验49天内的直播视频,并从每场直播的聊天框中提取实时评论数据。通过计算每场直播的实时评论总量作为因变量,重新估算方程(2)。表8所示结果与主分析结论一致:外形逼真度(ß1 =0.565,p<0.001)及行为真实度特征(包括语音表现 ß3 =0.881,p<0.001、抽奖环节 ß4 =1.072,p<0.001、强化问答环节 ß5 =1.969,p<0.001)均能显著提升时事评论数量。

  此外,行为现实主义的效果显著强于形式现实主义。研究结果表明,这两种设计策略都能显著提升消费者与主播实时互动的可能性。这种互动增强现象反映了设计策略带来的显著社会响应效应(Tsai等,2021)。

  一、 研究启示

  学术界对数字主播在直播电商中的作用效果仍知之甚少。通过研究1,首次对数字主播所带来的经济价值进行了全面的实证分析,并将其与没有直播功能的销售情况进行了比较。 研究2则通过随机对照实验,量化分析了各种设计要素(如外观真实度、行为表现的真实度等)对提升数字主播销售业绩的作用。我们从三个维度来进行评估:  外观形象;言语表达能力;人机交互效果。

  经过对五种设计要素的评估后发现:引入实时问答功能后,销售额提升了25%;而与现有的数字主播设计相比,销售额更是提高了86%。

  由此可见,与单纯注重外观真实度相比,提升数字主播的行为表现真实度能显著提升直播电商的销售额和营收。

  1.未来研究方向

  进一步探究数字主播对不同消费者群体的心理感受和态度的影响。  研究高级别的互动能力如何影响最终效果,比如用户满意度以及用户的长期忠诚度。

  2.  管理意义

  拟人化的视觉设计有助于提升消费者的购买意愿;此外,模仿人类的言语表达方式也能有效促进销售。这种设计还能实现与观众的互动,让观众有更强的社交体验,从而建立起信任感。比如,通过抽奖或赠送礼品等互动方式,可以大大提高观众的参与度,让他们感受到归属感和兴奋感。

  至此,本次Seminar文章研读完毕。

  之后,老师与同学们提出了建议和疑问。至此,本学期第4次Seminar圆满结束。

  文字 /李可欣

  排版 /李可欣

  审核/赵文青