时间: 2026-01-09 13:45:04 阅读:次
2025年12月30日下午18:00,中国营销工程与创新研究中心 (以下简称“MEI”) 2025-2026年第一学期第15次研讨会 (以下简称“Seminar”) 在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。
本次Seminar由黄嘉慧研读文章《Driving Music Demand in the Age of Streaming: Understanding the Heterogeneity in Curated Playlist Effectiveness》。

一、研究背景
Aguiar 和 Waldfogel(2021 年)通过研究流行歌曲(那些位列 Spotify 排名前 200 的歌曲)被列入 Spotify 上六大热门歌单中的某一个所带来的经济影响,提供了初步证据,证明了歌单的重要性。
然而,他们的研究主要集中在那些已经取得成功的歌曲以及规模最大的歌单上,并没有探讨不同歌单或不同歌曲在效果上的差异性。因此,他们并没有解答这样一个问题:艺术家及其音乐唱片公司应该如何最好地利用各种类型的歌单——是通过自己来挑选歌曲并创建歌单,还是通过针对不同的歌单来推广歌曲。
本文的目的是衡量歌单在激发人们对特定歌曲的音乐需求方面的效果是否存在差异。通过分析歌单的设计特点如何导致这些效果之间的差异,我们的研究为艺术家及其唱片公司提供了新的思路,帮助他们通过优化歌单来提升流媒体收入。
因此,我们提出了两个重要的研究问题——这些问题在学术文献中尚未被探讨,但对于艺术家及其唱片公司这样的实际利益相关者而言却十分重要:
(1)在歌单中收录某首歌曲,
会在多大程度上影响该歌曲在大范围歌曲及歌单中的受欢迎程度?
这种影响在上榜时是否存在,
又会在下架后持续多久?
(2)歌单的设计特点又是如何导致这些影响出现差异的?
二、文献综述
(1)以往研究
以往关于音乐流媒体服务的研究(见表 1)主要探讨了流媒体服务如何促进音乐消费的多样化(Datta,Knox 和 Bronnenberg,2018 年),新冠疫情相关限制措施如何影响各国的音乐消费情况(Sim 等人,2022 年),以及新的官方音乐视频频道与用户生成内容的出现如何影响流媒体需求(Kretschmer 和 Peukert,2020 年;Wlömert 等人,2023 年)。
Pachali 和 Datta(2025 年)则研究了某首歌曲被纳入某个歌单,以及该歌单在应用程序中的位置如何影响该歌单的关注者数量。
据我们所知,目前只有一篇研究将歌单视为影响流媒体需求的核心因素。Aguiar 和 Waldfogel(2021 年)评估了歌曲被纳入歌单这一因素对歌曲需求的影响,他们的研究对象是 Spotify 上排名前六的歌单以及 Top 200 榜单中表现较为成功的歌曲。
(2)研究 Gap
虽然这些研究为流媒体平台日益增长的影响力提供了宝贵的见解,但它们并未揭示那些导致歌单呈现多样性以及产生各种后续影响的各种因素。因此,这些研究并没有从音乐艺术家及其唱片公司的角度出发——这些机构正是希望利用歌单营销来提升自己歌曲的播放量。
为填补这一研究空白,我们首先认为:歌单是艺术家及其唱片公司用来帮助用户欣赏和发现新歌曲的重要工具。
当一首歌曲被列入某个歌单后,该歌单的订阅者便可以在歌单存续期间聆听这首歌曲,从而导致歌曲的播放量增加——我们将这种现象称为“上榜效应”。
用户聆听这首歌曲,可能会发现它并喜欢上它,进而将其加入自己的个人歌单中;即使这首歌曲后来被从歌单中移除,用户仍可能会继续聆听它——我们将这种现象称为“延续效应”。
我们利用歌单的设计特点(例如歌单的受欢迎程度、歌曲之前的曝光程度,以及歌曲与歌单之间的匹配程度)来解释这些效应之间的差异。
三、概念框架
1.焦点歌单的曝光度(Exposure through focal playlist)
这一类特征考察了歌单本身带来的曝光潜力。
歌单流行度(Playlist Popularity):这是解释异质性最重要的因素。拥有更多关注者(followers)的歌单会带来显著更高的播放量提升,而关注者较少的歌单提升微乎其微。
歌曲位置(Song Position):位于歌单前 10 位的歌曲,其入榜效应和下榜后的延续效应都明显强于排名靠后的歌曲,这表明屏幕位置对曝光有重要影响。
歌单长度(Playlist Length):歌单包含的歌曲数量越多(即歌单越长),单首歌曲获得的曝光机会被稀释,导致下榜后的延续效应减弱。
2.其他渠道的曝光与支持(Exposure and support elsewhere)
这一类特征考察了歌曲在进入该歌单之前的背景情况。
焦点歌曲先前的歌单曝光(Prior playlist exposure of focal song):这是一个反向指标。此前曝光度较低(较少出现在其他歌单上)的歌曲,不仅在入榜期间获得的相对提升更高,而且在下榜后更有可能被用户“发现”并持续收听。
发行商类型(Content Distributor):相比于主要唱片公司(Major label),独立唱片公司(Independent label)发行的歌曲从歌单中获益更多。这是因为独立艺人通常缺乏传统营销资源,歌单对其带来的边际效应更大。
3.歌单消费体验的流畅性(Fluency of playlist consumption experience)
这一类特征关注歌曲与歌单整体风格的契合度。研究发现,契合度对“上榜效应”和“延续效应”具有截然不同的影响(双重作用)。
基于共现的契合度(Co-listing-based fit):指该歌曲过去是否经常与歌单中的其他歌曲一起出现。高共现契合度能够提升听歌的流畅性,从而增强入榜效应;但低共现契合度(即意料之外的组合)更能促进用户发现新歌,从而增强下榜后的延续效应。
基于属性的契合度(Attribute-based fit):指歌曲的音频特征(如节奏、风格)与歌单中其他歌曲的相似度。与上述逻辑类似,高属性契合度有利于当前的收听体验,但会削弱长期的发现效应。
其他歌曲的先前曝光(Prior playlist exposure of other songs):如果歌单中的其他歌曲知名度较高,会增加听众的熟悉感和流畅性,从而对焦点歌曲产生积极的溢出效应。
4.歌单策展方式(Playlist curation: how, who, and how long)
这一类特征涉及歌单是谁制作的、基于什么逻辑制作的。
策展基础(Curation base):相比于基于内容(Content-based,如流派、歌手)的歌单,基于场景(Context-based,如跑步、学习)的歌单能带来更强的入榜和延续效应。这是因为场景化歌单通常伴随着更长的收听时间和重复的收听习惯。
策展人身份(Playlist curator):我们可以将其分为三类:艺术家的唱片公司、流媒体平台、第三方策划者。
时间衰减(Time decay):文章还分析了效应随时间推移的衰减情况,即入榜 / 下榜天数越长,效应越弱。
四、研究概览
五、数据及实证分析
1.歌单样本(Playlist Sample)
本研究的分析聚焦于公开的、由人工策展的歌单(不包括算法自动生成的歌单)。
为确保样本具有代表性,研究按照歌单关注者数量对歌单进行排序,并选取累计覆盖全部歌单关注者数量 90% 的歌单,最终得到包含 134,137 个歌单的样本。
该样本覆盖范围广泛,既包括拥有数百万关注者的大型歌单(如 Today’s Top Hits、RapCaviar),也包括规模较小的细分小众歌单。
2.实证策略
基于歌单数据,本文通过追踪歌曲被加入和移出歌单的过程来构建准实验。核心处理事件包括:(1)歌曲 i 在 t₀ 日被加入某一歌单;(2)该歌曲在之后的某一时点 t₁ 被从同一歌单中移除(平均间隔约为 88 天)。
3.准实验构建(Quasi-Experiment Construction)
为识别焦点歌单上榜 / 下榜的因果效应,分析聚焦于较窄的时间窗口:即上榜日期(t₀)前后各 6 天,以及下榜日期(t₁)前后各 6 天。
在样本筛选过程中,研究采用了严格的准实验识别标准:
第一,歌曲在 t₀ 前后 6 天的窗口期内只能被列入一个歌单。
第二,歌曲在 t₁ 前后 6 天的窗口期内只能从同一个歌单中被移除。
第三,为控制其他小规模歌单变动可能带来的干扰,仅保留在窗口期内其他歌单关注者变动总量不超过焦点歌单关注者数量 10% 的准实验事件。
在上述筛选条件下,最终获得了 200,455 个可用于分析的准实验事件。
4.歌曲与艺人覆盖范围(Song and Artist Coverage)
这些准实验事件共涉及 152,576 首不同的处理组歌曲,来自 82,348 位不同艺人。
歌曲覆盖 24 个不同音乐流派,既包括新发行作品,也包括较早发布的歌曲,艺人类型从全球超级明星到新兴或不知名艺人不等。
相关准实验涉及的歌单总数为 23,721 个不同歌单。
5.控制组歌曲选择(Control Song Selection)
针对每一个在 t₀ 时点发生的上榜准实验,研究都会为处理组歌曲精确匹配一首控制组歌曲。
控制组候选歌曲池包含 1,156,706 首潜在歌曲,这些歌曲至少在某一歌单中存在一年以上,并且至少经历过一次上榜或下榜。
控制组歌曲需满足以下条件:在处理窗口期内未发生任何上榜或下榜事件;与处理组歌曲不属于同一艺人;在 t₀ 时点未与处理组歌曲在其他歌单中共同出现。
6.匹配方法(Matching)
在满足基本条件的候选控制歌曲中,研究首先基于歌曲发行时间、流派以及歌单关注者分位数匹配出 100 首潜在控制歌曲。
随后,从这 100 首候选歌曲中,基于以下两个维度最小化欧几里得距离,选取最优的单一匹配歌曲:
(a)处理前播放量水平(t₀−6 至 t₀−1 日);
(b)处理前播放量的相对变化趋势(t₀−6 至 t₀−1 日),以确保处理前趋势平行。
为进一步增强处理前的趋势可比性,研究剔除了处理前播放量均方根误差(RMSE)最高的 1% 准实验事件。
在下榜事件(t₁)中,研究采用同样的匹配流程,但候选控制歌曲需在 t₁ 时点满足相应条件,即在歌曲被移出歌单时仍具备作为控制组的资格。

7.分析数据结构(Data Structure for Analysis)
对于每一个准实验 e,研究将处理组与控制组歌曲在两个时间窗口内的每日播放数据进行堆叠:上榜窗口(t−6 至 t+6,剔除 t−1、t₀、t+1)以及下榜窗口(t−6 至 t+6,剔除 t−1、t₁、t+1)。
因此,每一个准实验共包含 40个观测值(2首歌曲× 每个窗口10 天×2 个窗口)。
将 200,455个准实验事件进行堆叠后,最终分析样本包含8,018,200条观测记录。
8.双重差分模型(Difference-in-Differences, DiD)
核心变量包括:
Treatedᵢₑ×DuringListingₑt:当处理组歌曲处于上榜期间(t+2至t+6,以及 t−6至t−2)时,该交互项取值为1,其系数β₁ 用于衡量上榜效应(ATT)。
Treatedᵢₑ×AfterListingₑt:当处理组歌曲处于下榜之后(t+2 至 t+6)时,该交互项取值为1,其系数β₂用于衡量延续效应(ATT)。
ln(OtherPlaylistFollowersᵢt):控制变量,用于衡量歌曲在其他歌单中的关注者数量。
固定效应包括:
歌曲–准实验–窗口固定效应(γᵢₑw),用于控制处理组与控制组歌曲在特定准实验窗口内的所有时间不变差异;
准实验–日期固定效应(μₑt),用于控制在同一准实验、同一天影响两首歌曲的共同外部冲击(如季节性或平台层面事件)。
9.总体歌单效果(Overall Playlist Effectiveness)
研究结果显示,上榜效应的估计系数为β = 0.077,延续效应的估计系数为 β₂= 0.012。在包含交互项的更完整模型M2 中,上榜效应为β₁= 0.082,延续效应为β₂= 0.039。
这些系数均为对数乘数,意味着歌曲在上榜期间的播放量提升为 (exp(0.082) − 1)×100% = 8.5%,而在下榜之后的播放量仍提升4.0%(即 (exp(0.039) −1) × 100%。
进一步将β₂除以 (β₁+β₂)可得,约有32% 的上榜效应在歌曲被移出歌单后仍然持续存在,这一结果表明歌单在促进音乐发现方面发挥了重要作用。
10.歌单效果异质性
(1). 焦点歌单的曝光度
歌单流行度(Playlist popularity):以上榜时歌单关注者数量的对数形式进行衡量。
歌曲位置(Song position):虚拟变量,表示歌曲是否位于歌单前 10 首。
歌单长度(Playlist length):以歌单中歌曲总数的对数形式进行衡量。
(2). 其他渠道的曝光与支持
焦点歌曲先前的歌单曝光(Prior playlist exposure of the focal song):以上榜前该歌曲平均歌单关注者数量的对数进行衡量。
内容发行商(Content distributor):虚拟变量,若歌曲由主流唱片公司发行则取值为 1,由独立唱片公司发行则取值为 0。
同歌单中其他歌曲的先前曝光(Prior playlist exposure of other songs):以上榜前同一歌单中其他歌曲的歌单关注者总数的对数进行衡量。
(3). 歌单消费体验的流畅性
基于属性的契合度(Attribute-based fit):基于 Spotify 提供的九项音频特征(如情绪值、舞动性等),计算焦点歌曲与同歌单歌曲之间的平均两两相似度,具体计算方式为 1 / (1 + 欧几里得距离)。
基于共现的契合度(Co-listing-based fit):基于歌曲在历史歌单中的共同出现情况,计算焦点歌曲与同歌单歌曲之间的平均标准化点互信息(NPMI)。
(4). 歌单策展方式:方式、主体与持续时间(Playlist curation: how, who, and how long)
策展基础(Curation base):虚拟变量,表示歌单是基于场景(如 “workout”,取值为 0)还是基于内容(如 “rock classics”,取值为 1),该分类由大型语言模型(GPT-4o)完成。
平台策展(Platform curation):虚拟变量,若歌单由 Spotify 官方策展则取值为 1,否则为 0。
第三方策展(Third-party curation):虚拟变量,若歌单由第三方策展者制作则取值为 1,唱片公司策展歌单作为基准组。
自上榜 / 下榜以来的天数(Days since listing / delisting):以上榜或下榜后的天数对数形式进行衡量,以刻画时间衰减效应。
11.歌单效果异质性(扩展 DiD 模型)
为研究上榜效应的异质性,本文对堆叠双重差分模型进行了扩展。表 3 中的模型 M2 报告了方程(3)的估计结果。图 6 通过绘制不同特征分位数(如最低 20%、次低 20% 等)下的上榜效应与延续效应,直观展示了效应大小的变化。
(1)。效应计算方法说明
以歌单流行度(最高分位)为例,研究将该特征的取值设定为最高五分位的平均值,同时将其他变量固定在其均值水平,并将虚拟变量设定为基准类别。由此计算得到的歌单效应(对数乘数)为:
βₘ = β₁ + θₘ × Nₘ,Q5
其中,β₁(= 0.082,见表 3)为歌单上榜对需求的直接效应估计值;θₘ 为歌单流行度对上榜效应的调节效应估计值(= 0.039,见表 3);Nₘ,Q5 为最高五分位中歌单关注者数量的平均值(经均值中心化后的对数值,为 2.929)。
因此,对数乘数为 0.082 + 0.039 × 2.929 = 0.196。将该值转换为百分比变化,可得 100% × (e^0.196 − 1) = 21.6%,对应图 6 左上角中第五分位(Q5)的结果。

12.稳健性检验
(1).样本构成的敏感性分析
研究通过多种样本限制重新估计模型,以检验结果是否对数据筛选标准敏感。结果显示,不同设定下的估计结果与主模型高度一致。
首先,在“噪音控制”方面,主模型允许歌曲在窗口期内出现在其他歌单中,只要这些歌单的关注者数量不超过焦点歌单的 10%。稳健性检验中将该阈值分别收紧至 5% 和 0%,上榜效应和延续效应系数保持稳定。
其次,将原本排除的上榜 / 下榜相邻过渡日纳入模型后,估计结果并未发生实质变化。
再次,为避免频繁上榜的热门歌曲影响结果,研究进一步将样本限制为:仅保留歌曲首次在某一歌单上榜的事件、仅保留歌曲首次在任何歌单上榜的事件,以及仅保留一生中只上榜一次的歌曲,结果依然稳健。
此外,研究还采用加权最小二乘法(Weighted Least Squares)对第三方小型歌单的样本不足问题进行修正,估计结果同样保持一致。
(2).长期动态与衰减效应
研究进一步分析了歌单效应的长期持续性。结果显示,上榜效应在上榜后 90 天仍保留约 84%,延续效应在下榜后 90 天仍保留约 42%。
同时,研究将下榜后的观察窗口从原本的 6 天延长至 13 天、20 天和 27 天。尽管样本规模随窗口延长而减少,但即使在 27 天后,延续效应仍然显著为正,且异质性结果在不同窗口设定下保持高度一致。
二、总结
一、总体讨论
歌单的平均上榜效应为播放量提升 8.5%,对应的歌单弹性约为 1.77。这一结果表明,与传统广告形式相比,歌单是一种极其有效的营销工具。
本文首次系统性地研究了歌单效果中存在的大规模异质性。以往研究(如 Aguiar 和 Waldfogel,2021)在研究范围上存在明显局限,仅关注规模最大的六个歌单以及排名前列的热门歌曲,因而无法分析歌单效果的异质性。
本文在此基础上进行了重要拓展,研究发现歌单效果在多个维度上呈现出强烈且具有规律性的差异,并可根据研究结果将这些差异归纳为三类:
第一,曝光效应(Exposure effect):关注者数量较少的歌单所带来的曝光有限,因此其上榜效应和延续效应显著较低。相较而言,知名度较低的歌曲以及来自独立唱片公司的歌曲,从歌单收录中获得的相对提升更大,尤其是在下榜之后。
第二,消费体验的流畅性(Fluency of consumption experience):当歌单中其他歌曲具有较高的先前曝光度、歌单由平台官方策展、以及歌曲之间具有较高的共现契合度或属性契合度时,用户的收听体验更加流畅,从而增强上榜期间的播放量提升。然而,这些相同特征也可能抑制用户发现新音乐,从而削弱延续效应。
第三,重复性的共同消费场景(Recurring co-consumption experiences):基于场景策展的歌单(如跑步、学习)由于伴随着重复性的消费情境,其上榜效应和延续效应均强于基于内容策展的歌单。
二、管理启示
歌单是一种强有力的营销工具。歌曲被纳入歌单后,其音乐需求显著提升,平均上榜效应为 8.5%,下榜后的延续效应仍高达 4.0%。这使得歌单在基于访问的消费模式中成为推动流媒体收入的高效渠道。
优先考虑歌单流行度:影响最大的因素是歌单的关注者数量。被收录到高关注者歌单中的歌曲,其播放量提升幅度显著更高(最高可达 21.6%)。唱片公司应优先争取进入关注者基数大的歌单。
重点推广低先前曝光歌曲:在其他歌单中曝光程度较低的歌曲,从歌单收录中获益更多,其上榜效应和延续效应均更强。这表明歌单对推广新歌或知名度较低的作品尤为重要。
优化歌曲位置与歌单设计:
将歌曲安排在歌单前 10 位可显著增强效果;
尽管歌单长度不会影响上榜效应,但较长的歌单可能会削弱延续效应;
与知名度较高的歌曲共同出现,有助于提升焦点歌曲的表现。
理解“契合度”的双重作用:
较高的属性契合度和共现契合度能够通过提升收听流畅性来增强即时播放,但尤其是较高的共现契合度,可能会由于缺乏新颖性而削弱延续效应。
策略性选择策展类型:
基于场景的歌单通常比基于内容的歌单效果更强,这可能源于重复性的收听情境;
平台策展歌单带来最强的上榜效应,而唱片公司策展歌单则更有利于产生延续效应;
独立唱片公司发行的歌曲相比主流唱片公司从歌单中获益更多,因为歌单在一定程度上弥补了其传统营销资源的不足。
整体而言,约有 22% 的总收入影响发生在歌曲下榜之后。
三、未来研究方向
未来研究可进一步探讨用户与策展者行为,例如分析不同用户在使用歌单时的差异,以及将歌单策展者视为拥有大量忠实关注者的影响者进行研究。
此外,未来研究还可考察歌单流行度所具有的信号效应。一方面,高关注者数量意味着更高曝光;但另一方面,它也可能向消费者传递“主流化”的信号,从而劝退那些偏好独特品味的用户。类似地,歌曲在歌单中的靠前位置也可能被解读为一种受欢迎程度的信号。
最后,尽管本文基于 Spotify 数据进行分析,但其经济机制与认知机制同样适用于 Apple Music 或 Deezer 等其他平台,因为这些平台在人工或算法策展、海量曲库以及按播放量付费等核心机制上具有高度一致性。
至此,本次Seminar文章研读完毕。
之后,由贺光耀、赵文青、刘雨璐分享研究进展,老师与同学们提出了建议,并明确了进一步的研究计划。
至此,本学期第15次Seminar圆满结束。
文字 / 赵文青
排版 / 赵文青
审核 / 左翎