时间: 2026-05-22 12:38:43 阅读:次
2026年5月21日14:00,中国营销工程与创新研究中心 (以下简称“MEI”) 2025-2026年第二学期第12次研讨会 (以下简称“Seminar”) 在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。
本次Seminar由李端阳研读文章《Novelty in Content Creation: Experimental Results Using Deep Learning》。

一、研究内容
社交网络平台依赖用户生成内容来吸引和留住用户,因此平台不仅关心用户是否继续创作内容,也关心用户后续创作的内容是否足够新颖和多样。传统媒体可以直接控制内容生产,但社交平台通常只能通过首页推荐、精选内容、热门榜单、徽章或奖项认可等方式,间接引导创作者的行为。
既有研究已经证明,平台给予的注意力与认可通常会提升用户参与度和内容创作数量。然而,一个更重要但尚未解决的问题是:这些平台奖励机制是否会改变创作者后续作品的“性质”?创作者在获得首页推荐和奖项认可后,是会继续复制已经被认可的成功风格,还是会更愿意冒险并创作与过去不同的内容?本文正是围绕这一问题展开研究。
研究问题:
平台给予创作者的关注和认可,究竟会让创作者后续内容更相似,还是更具新颖性?
二、文献综述
(1)外在动机理论
Ø 内容创作不仅来自兴趣,也来自外部回报。Lerner and Tirole(2002)
Ø 外在动机分为两类:职业提升激励和自我满足激励。前者指创作者希望通过作品展示自己的能力和专业水平;后者指创作者希望获得同行认可、声誉和自我满足。
(2)自我决定理论
Ø 用于解释创作者在获得外部认可后,内在动机(如艺术探索)被激活,从而提升内容新颖性。
(3) 新颖性分类理论(Carmel et al. 2012)
将新颖性分为两类:自我新颖性(与创作者自身历史作品比较); 共时新颖性(与平台同侪作品比较)。
(4)动机挤出理论
动机挤出理论认为,当外部奖励被引入或强化时,可能会削弱个体原本的内在动机。Frey and Jegen(2001)与 Gneezy et al.(2011)说明,外在动机的提升可能降低内在动机的作用,使创作者不再创作自己真正感兴趣的内容。
(5)外在动机满足机制
外在动机的作用可能是边际递减的。当创作者已经获得较多关注和认可后,新的平台认可会进一步满足其外在认可需求。此时,创作者不再需要持续复制已被证明成功的作品来争取认可,反而可以转向内在兴趣,尝试更有风险、更不同的创作方向。
三、实验概览及结论
虽然既有研究已经关注奖项认可与内容新颖性之间的关系,但仍存在三个关键缺口。第一,已有实验多集中于文本社区,例如 Reddit,较少考察图像艺术这类高度复杂、非结构化且创作门槛更高的内容。第二,已有关于高声望奖项的研究多依赖观察数据,例如格莱美奖研究,因果识别存在困难,难以判断后续内容变化究竟来自获奖本身,还是来自未获奖者的反应。第三,既有研究较少关注平台级可见性机制,例如首页精选、星标和关注者通知,如何影响已经具备一定声誉的头部创作者。
Gap:现有研究尚未在真实大型社交平台中,利用随机实地实验,考察平台级高声望认可是否会改变优质图像创作者后续内容的新颖性。

本文使用迁移学习方法,将复杂图像转化为可量化的内容特征。作者以在 ImageNet 上预训练的 Inception-v3 模型为基础,首先预测每张图像在七个艺术维度上的得分,包括抽象性、商业意图、创造性、复杂性、情感性、喜好度和照片写实性。随后,作者结合 Inception-v3 与 Word2Vec 型,将人工标注的关键词压缩为 300 维语义向量,并据此预测图像关键词标签。最后,作者进一步使用 Google Cloud Vision API 生成额外关键词,用于稳健性检验。通过这一方法,本文能够从视觉维度和语义关键词两个层面衡量图像之间的相似性与新颖性。

一、数据及实证分析
(1)实验设计与图像测量
本文采用 Behance 功能队列进行了一项随机实地实验。
从 8,921 个候选项目中,作者们选择了由独特用户拥有的 658 个项目,并随机分配到两个组:
治疗组:329 个项目;
对照组:329 个项目 Ø 在 2.5 个月的实验期间,治疗组项目被随机在主页上展示。
对照组项目在实验期间及随后的 3 个月观察期内均未出现。这种设计为治疗组创作者提供了额外的平台级关注和认可。
(2)图像测量
为了衡量图像新颖性,作者首先使用 MTurk 手动标记了 875 张图像。
每张图像由五位工作者进行评分,他们提供了关键词标签并对图像在七个维度上进行了评估:抽象性;商业目的;复杂性;真实感;创造性;情感性;可爱度。所使用的评分采用 1 到 7 的等级体系。
(3)迁移学习流程
作者使用了在 ImageNet 上预训练的 Inception-v3 模型。
该模型保留了从 ImageNet 学习到的通用视觉识别能力,并进行了微调以捕捉 Behance 特有的艺术属性。
该模型用于预测:七项艺术维度的得分; 与图像相关的关键词标签。
对于关键词预测,作者将 Inception-v3 与 Word2Vec 结合使用,将人工标注的关键词压缩为 300 维的语义向量。
最后,作者使用 Google Vision API 生成了一组额外的关键词标签作为稳健性检查。
(4)维度测量
本文将七种图像尺寸的预测视为一个多类别分类问题进行研究。对于每一个维度方面,该模型需要预测图像在 1 到 7 的范围内概率分布。作者使用在 ImageNet 上预训练的 Inception-v3 模型来提取图像特征。输入图像通过模型处理后生成一个 2048 维的特征向量,然后将其输入到最终的 Softmax 层以输出七个评级等级的概率。最终得分是通过对 1 到 7 分的预测概率进行加权平均而得到的。
该模型使用交叉熵损失函数:

同时,为了保留 1 和 7 分之间的顺序关系,作者没有使用常规的硬标签,而是使用了软标签。软标签根据候选评级和实际评级之间的距离分配权重:

这种方法的优点是,该模型不仅知道预测是否正确,而且还能区分“接近错误”和“严重错误”。例如,当实际评级为 3 时,预测对 2 的惩罚小于预测对 1 或 7 的惩罚。
这篇文章还需要为每张图片预测关键词,例如,一张奶昔图片可能与“奶油、奶昔、不健康”等词汇相关联。由于人工标注中存在约 8500 个不同的关键词,关键词的维度过高,无法直接使用常规的分类模型进行训练。
因此,作者使用 Inception-v3 + Word2Vec 来预测关键词。
1. 使用 Word2Vec 把所有关键词转换为词向量。
2. 对每张图像的所有关键词向量求平均值,从而得到一个 300 维的关键词语义向量。
3. 使用 Inception-v3 算法为每张图像提取 2048 维的视觉特征向量。
4. 利用 2048 维的图像特征来预测 300 维的关键词语义向量。
5. 根据所预测的语义向量,确定与该图像最相关的 20 个关键词作为预测关键词。
6. 最后,作者还利用谷歌云视觉 API 生成了另一组用于稳健性测试的关键字。

其中,N 表示训练图像的数量,m = 2048 表示 Inception-v3 输出的图像特征维度,λ 是用于防止模型过拟合的正则化惩罚项。
(5)模型性能比较
作者将迁移学习的 Inception-v3 模型与三个基准模型进行了比较:简单卷积神经网络模型、朴素模型和随机模型。这个结果表明,Inception-v3 在七个图像维度上的总体准确率和命中率均高于简单卷积神经网络(CNN)的训练结果,这表明迁移学习比直接从少量样本训练简单的 CNN 更有效。
比较模型:简单 CNN:一个没有迁移学习的两层卷积神经网络。朴素模型:直接使用训练集中最常见的分数作为预测值。随机模型:从 1 到 7 中随机选择一个评分作为预测值。
评估指标:
准确率:预测分数与实际分数越接近,准确率就越高。
命中率:如果预测评分与实际评分的差异不超过 1 分,则视为命中。
均方误差(MSE):误差的平方平均值,值越低,预测越准确。
结果解释:表 2 显示,Inception-v3 的表现优于简单 CNN、朴素模型和随机模型。这表明 ImageNet 预训练模型已经学习到了通用的视觉特征,因此即使在本文中只有少量的手工标注数据的情况下,它仍然能够很好地识别 Behance 艺术图像的特征。

(6)关键词分析

朴素模型:对所有图像词使用平均值作为嵌入向量 ·随机模型:选择一个随机值,并观察数据中最大和最小向量值之间的变化。
与非性实验图像相比,性实验图像更抽象、商业化程度更低、更复杂、更具创意、更富情感、更不真实,并且对更多关键词标签的接受度更高(双尾 t 检验,所有 p<.05),这反映了策展人在识别典范作品时的品味。本研究使用 DID 模型进行分析,该模型的优势在于通过在用户层面考虑预处理变化来减少噪声,并能准确解释用户何时基于奖励日期进行处理。

艺术家在获奖前后创作的内容有显著差异。

内容创作者在经过处理后,会表现出更多新颖或不同的内容。
谷歌云视觉 API 中的预训练模型的输出结果与使用 Word2Vec 的迁移学习方法一致。处理组中的用户在接收处理后,创建的图像差异显著,每项平均重叠词汇减少 7.2 个。这意味着重叠词汇的比例下降了 11.4 个百分点。

与先前创建的内容进行比较
自身的新颖性:相对于用户之前的内容所创造的新颖性
同一时期的新颖性:相对于用户群体中的其他成员而言。结果表明,奖励认可的处理过程不会显著影响同一时期的新颖性,并且与对照组用户所创建的后续内容与所有用户内容之间的距离相比,经过处理的用户所创建的内容与所有用户内容之间的距离没有显著差异。

与用户以往的作品相比,这种认可(处理过程)会增强作品的自我独特性,并且用户在实验后的创作内容与实验前创作的内容相比会有显著的不同。获得认可和关注会促使用户在未来创作出更具创新性的内容,但这并不能证明其对新颖性的影响相较于其他创作者所分享的内容而言有多大差异。
一、讨论
当一个网站决定如何分配有限的用户注意力时,奖励、关注和认可能否激发顶尖创作者的更大创造力是一个关键问题。本研究发现,在获得平台奖励后,创作者随后会创作出与受奖励作品以及之前作品不同的内容。观察到的这种效果是由最受欢迎的创作者的创造力提升所驱动的,这与外部满足机制是一致的。这一结果在多个内容相似性的衡量指标中都是一致的,包括低维结构化嵌入、中维非结构化表示以及用于图像标注的预训练工具。(1)局限性
随着底层算法的不断发展,仍需适时进行调整或改进。或许,随着算法变得愈发复杂以及计算能力的不断提升,对简洁性的需求本身也会减弱。
(2)未来方向
研究不同创作者因奖项而产生的不同影响(基于他们的过往获奖记录和人口统计特征)——但受限于本研究的数据条件
(3)对公司的建议
对顶尖内容创作者的认可是否只会促使他们创作与被认可的作品相似且重复的内容呢?我们发现事实并非如此,那些未获得奖励的用户实际上创作出了更多单调的内容。内容。未来还需要进行相关研究,以确定社交网络管理者如何才能最有效地分配注意力。
至此,本次Seminar文章研读完毕。
之后,由彭沁缘分享AI相关研究方法、理论或行业应用,老师与同学们提出了建议,并明确了进一步的研究计划。
至此,本学期第12次Seminar圆满结束。
文字 / 赵文青
排版 / 赵文青
审核 / 赵文青