时间: 2026-06-25 16:53:08 阅读:次
2026年6月23日上午9:00,中国营销工程与创新研究中心 (以下简称“MEI”) 2025-2026年第二学期第17次研讨会 (以下简称“Seminar”) 在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。
本次Seminar由张宇瑄读文章《Frontiers: ChatGPT Referrals to E-Commerce Websites: How Do LLMs Compare Against Traditional Channels?》

一、研究引入
Ø 自 2024 年 8 月起,ChatGPT 开始在用户表达购物意图时提供电商外链,形成了 organic LLM traffic(oLLM)。文章关注它与自然搜索、付费搜索、直接访问、邮件、联盟营销、付费社交等传统渠道相比,商业表现如何。
Ø 作者使用 973 个电商网站的 Google Analytics 一方数据,覆盖 12 个月、超过 5 万笔 oLLM 交易和 1.64 亿笔传统渠道交易。主要分析财务指标转化率 CR、平均订单价值AOV、每次访问收入RPS,以及参与度指标跳出率 BR、访问时长 SD、页面浏览数PV。

二、研究数据、指标与模型
1. 描述性研究
文章比较了 oLLM 与传统渠道的表现,用真实电商网站的一方数据做大规模描述性实证分析。样本覆盖973 个电商网站、12 个月数据、约 200 亿美元年收入、超过 5 万笔 oLLM 交易和 1.64 亿笔传统渠道交易。通过 Grips Intelligence 提供的企业 Google Analytics 账户直接访问数据,作者能追踪每位消费者进入电商网站的渠道及其后续购买行为。
研究采用回归分析方法,从财务指标(转化率 CR、平均订单价值 AOV、每次访问收入 RPS)和用户参与度指标(跳出率 BR、访问时长 SD、页面浏览数 PV)两个维度,对比了oLLM 与传统渠道的表现。同时,针对不同的数据处理方案、网站样本、LLM平台以及时间范围,验证了该模型的稳健性。还探讨了不同网站(在产品类别复杂度及消费者LLM熟练程度方面不同)的差异性影响。
出现了两个规律。首先,oLLM 所表现出的转化率和每次访问收入高于付费社交媒体,但低于其他所有传统渠道。 产品的复杂程度在其中起到了调节作用:在复杂的产品品类中,oLLM 带来的财务回报和流量份额表现更为强劲;这表明在面对简单产品时,消费者感知到的 LLM 实用性相对有限。在用户参与度指标方面,oLLM 展现出相对较好的跳出率,但单次访问时长和页面浏览量较低。其次,时间序列分析显示,其转化率呈现上升趋势。 然而,由于平均订单价值的下滑抵消了部分增长,导致每次访问收入随时间推移仅实现了温和的增长。跨网站的对比分析表明,这一模式与“消费者使用 LLM 的熟练度不断提升”这一底层机制是一致的。

1. 数据
数据集是来自 Google Analytics 的973 个网站的第一方电子商务数据。主分析使用 6 个月数据,同时通过每周数据聚合来应对观测值稀疏的问题。稳健性检验使用 3 个月和 12 个月窗口以及不同聚合周期(每日/每月)对所有分析结果进行了复现验证。
oLLM 当前规模非常小。上线一年后,oLLM 只占总流量不到 0.2%,大约是 Google 自然搜索流量的1/200。在所有 LLM 来源中,ChatGPT 占比超过 90%,远高于 Perplexity、Gemini、Copilot、DeepSeek、Grok 等,因此主分析主要聚焦 ChatGPT 推荐流量,其他 LLM 平台只在稳健性检验中纳入。
3.指标
指标分为两类。第一类是财务指标:转化率 CR、平均订单价值 AOV、每次访问收入 RPS。CR 衡量访问是否转化为交易;AOV 衡量每笔订单金额;RPS 同时结合购买概率和购买金额,更接近广告或渠道价值评估。第二类是互动指标:跳出率 BR、访问时长 SD、页面浏览数 PV。BR 反映用户进入网站后是否很快离开,SD 和 PV 反映用户在网站内的浏览深度。

模型
oLLM 数据很稀疏:在周/网站/设备层面,很多 ChatGPT 来源访问很少,甚至中位数oLLM 观测没有任何交易。因此简单比较均值会误导。作者对 CR 和 BR 使用quasibinomial 模型(拟二项模型),因为它们是比例型变量,而且存在过度离散;对 AOV、RPS、SD、PV 使用加权线性模型,以降低聚合效应导致的异方差性和杠杆率上限问题。
其中,αc 为渠道固定效应,γi 为网站固定效应,δd 为设备固定效应,μm 为月份固定效应。线性模型设定采用了相同的固定效应结构,但对因变量使用的是水平值(Levels)而非对数几率(Log-odds)进行建模。

三、研究结果
1.回归结果
回归结果表展示了包含渠道固定效应的回归估计值 αc 用于衡量各传统渠道与oLLM(参考类别)之间的差异。我们以粗体标出p<0.05且支持oLLM的系数。

财务表现:付费社交广告效果显著逊色,转化概率低53%(系数:-0.760);而自然搜索和联盟营销的表现分别比其高出13%(系数:0.121)和86%(系数:0.621)。 AOV 指标:置信区间较宽;其中联盟营销与付费社交广告的差距最大,高出24.7美元。RPS指标:置信区间较窄;付费社交广告表现优于自然搜索和联盟营销,但明显低于其他渠道。
用户参与度指标:品牌响应率方面,付费社交广告优于自然搜索和付费搜索;电子邮件广告的BR值比付费社交广告高20%,而自然搜索则低13%。页面浏览量方面,付费社交广告高于所有其他渠道;标准差显示付费社交广告远超其他渠道,且与联盟营销及直邮渠道相当。

稳健性
主要模型采用周度数据聚合方式,未设置最低观测阈值,涵盖973个网站,仅以ChatGPT作为唯一大语言模型渠道进行分析,时间跨度达六个月。我们针对所有这些设定条件检验了研究结果的稳健性。

图表展示了所有分析模型中客户转化率(CR)渠道固定效应的结果。核心结论具有显著稳健性:除付费社交渠道外,有机长尾营销(oLLM)的CR值均低于所有传统渠道。与自然搜索相比,这种差异在五个分析模型中已无统计学意义(月度数据汇总、至少100次用户会话、oLLM流量前25%区间、包含移动应用的oLLM数据以及三个月时间窗口),并在一个模型(至少1000次用户会话)中呈现不显著的效应符号反转。效应量呈现系统性差异:前25%收入占比的子集始终显示出更大的差距,而至少1000次会话的分析模型则产生较小效应;但整体趋势保持一致。 AOV 、每秒展示次数(RPS)及用户参与度指标均表现出类似的稳健性。


oLLM 结局的时间动态变化
基于时间趋势的回归分析:我们构建了与主要模型设定一致但包含趋势变量的回归模型。趋势变量的设定对预测结果影响显著,因此我们检验了四种方案:线性趋势模型、中心化(线性)模型、Gompertz模型(非对称S型曲线)以及 Sig_x0002_moid 模型(带有严格上限的逻辑回归模型)。
财务指标预测:图示显示传统渠道的转化率增长缓慢,而oLLM的增长幅度相对更为显著。三种模型均一致预测:oLLM的转化率将在12个月内接近自然搜索水平但尚未达到同等水平;线性时间模型则因概率值采用logit转换而呈现指数级增长趋势。
图示显示oLLM AOV 呈现显著下降趋势,这与CR的积极发展形成反差,并引发疑问:CR的改善是否仅是AOV降低所致?对于RPS而言,我们发现oLLM逐渐生成更具价值的会话。与CR预测结果类似,线性模型对oLLM效果更为乐观;而其他三种模型则一致预测oLLM在12个月内无法与次优渠道(自然搜索)实现融合。

3.跨网站的oLLM结果
复杂度差异:我们通过三种大语言模型(Claude、Gemini、ChatGPT)分类的网站类别来衡量产品复杂度。重工业与工程、商业及消费者服务、汽车、法律与政府、金融以及就业与职业被归类为高复杂度类别,而参考材料、新闻与媒体、成人内容、体育以及艺术与娱乐则归类为低复杂度类别。高复杂度类别的网站平均其oLLM流量占比高出4.6倍。在所有三项财务指标中,高复杂度网站的oLLM表现均更为优异:当产品复杂度较高时,oLLM转化率(CR)超越付费社交渠道、推荐渠道、电子邮件渠道、自然搜索渠道及直接渠道;与其他渠道的 AOV 差距缩小;每秒访问量(RPS)则更接近自然搜索和付费搜索水平。
LLM熟练度:两个网站层面的指标:访客中“技术爱好者”的占比(源自谷歌亲和力细分数据)以及平均访客年龄。处于技术爱好者前四分之一的网站,其oLLM流量占比是后四分之一网站的3.8倍;同样,访客年龄较轻的网站其oLLM流量占比高出5.5倍,这进一步验证了我们的熟练度指标有效性。转化率(CR):当LLM熟练度较高时,oLLM与传统渠道之间的差距显著缩小;在两项分析中,oLLM的转化率甚至超过了自然搜索。 AOV :较高的熟练度对应更大的 AOV 差距,表明oLLM产生的订单价值低于传统渠道。RPS:在 high_x0002_technophile 类网站中,oLLM在付费搜索和自然搜索中的表现均优于其他渠道;而在 younger_x0002_visitor 类网站中,其相对于直接广告、联盟广告及其他渠道的排名表现更优。这些趋势表明:随着 AOV 下降,转化率上升的同时,RPS仅呈现适度提升。

一、研究启示
1.研究发现
l 该研究分析了来自973家电子商务网站的12个月交易数据(涵盖超过5万笔由人工智能驱动的购买行为),发现在线学习型用户(OLLM)已发展成为具有商业价值的重要流量来源。
l OLLM的转化率(CR)和每秒转化数(RPS)虽优于付费社交媒体渠道,但仍低于传统渠道。
l OLLM用户的转化率较低,但页面浏览量(PV)和单次消费金额(SD)也更低,表明这些用户购买意愿更强且购物路径更为直接。
l 在高复杂度产品类别中,OLLM的表现显著优于低复杂度品类,其RPS接近自然搜索水平。
l 从时间趋势来看,OLLM转化率在首年持续上升,而 AOV 则下降,呈现出“转化率高但每次购买支出低”的特征。因此,OLLM驱动的RPS预计将持续提升,但幅度有限,短期内难以超越自然搜索。
l 随着消费者熟练掌握人工智能购物功能,“高转化率与低平均订单价值”的模式将愈发明显。
2.研究启示
l 对零售商而言,当前大语言模型(oLLM)在高复杂度产品类别中创造的价值最大——这类场景下消费者需要进行详尽比价并获得决策支持。在此背景下,oLLM推荐功能兼具较强的转化率(CR)和点击率(RPS),成为有机搜索与付费搜索的有力补充。
l 对于大语言模型平台来说,oLLM在低复杂度品类中的表现较弱,这正是其与传统渠道存在差距的关键因素。为解决这一局限,平台正推出智能购物助手和即时结账等功能。因此,基于平台的购物助手(如ChatGPT Shopping)很可能与亚马逊Rufus等内置于零售商平台的智能助手形成直接竞争。
l 在广告领域,大语言模型平台引入赞助广告位或将重塑其在数字渠道生态系统中的角色。虽然付费推荐能降低购买门槛、简化购物流程,但也可能削弱用户对AI生成推荐的信任度,从而动摇oLLM作为客观购物顾问的地位。
3.未来方向
l 本研究属于描述性研究而非因果研究,这意味着观察到的关联关系可能受到混杂因素的影响,例如不同渠道用户群体及使用场景的差异。
l 预测趋势基于前12个月的数据,但大型语言模型平台、零售商策略及消费者行为都在快速演变;未来的新购物功能、界面设计调整或广告推广等发展都可能显著改变这些趋势轨迹。
l 产品复杂度与消费者熟练度的评估指标是在网站层面而非个体层面构建的,这限制了我们识别驱动观测模式背后的行为机制的能力。
l 本研究采用最后点击归因方法,可能低估了在线大型语言模型在整个客户旅程中的作用。未来采用多触点归因模型或对照实验的研究将有助于更全面地理解在线大型语言模型在购买漏斗中的角色。
至此,本次Seminar文章研读完毕。
之后,由刘雨璐、彭沁缘、裴珈悦分享研究进展,老师与同学们提出了建议,并明确了进一步的研究计划。
至此,本学期第17次Seminar圆满结束。
文字 / 李云芝
排版 / 李云芝
审核 / 赵文青
![]()