当文字与视觉相遇:内容编排如何促进营销人员生成的内容在社交媒体上的互动

时间: 2025-09-24 08:52:42   阅读:


  2025年9月20日上午9:30,中国营销工程与创新研究中心 (以下简称“MEI”) 2025-2026年第一学期第3次研讨会 (以下简称“Seminar”) 在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。

  本次Seminar由彭沁缘研读文章When Words Meet Visuals:How Content Composition Drives Social Media Engagement for Marketer-Generated Content

微信图片_20250921111533_13_321.png

  一、研究概述

  今天,在营销媒体和传播的生产中,特别是在数字和社交媒体环境中,平衡文本和图片的挑战依然存在。平台、广告位和设备为内容提供了固定的空间参数,所以放大和强调一个元素必然会使另一个元素退居次要地位。目前学界对图文互动如何影响消费者参与度的量化机制仍不甚明了。

  尽管学界早有共识:视觉导向广告在吸引消费者注意力方面确实“更胜一筹”,但在实际操作中,营销人员与内容创作者仍需精心把握图文搭配的黄金比例,才能让广告效果最大化。

  二、理论基础

  1.MGC中文字与图片的平衡

  MGC(企业生成内容)——即品牌通过自有渠道发布的社交媒体传播内容——是提升消费者品牌参与度的关键工具,在现代营销漏斗与整合营销传播中扮演着核心角色(Goh、Heng和Lin 2013;Lu、Dinner和Grewal 2023;Meire等 2019)。

  UGC(用户生成内容)与MGC在社交媒体中功能迥异,因此即使内容完全相同,由消费者发布与由营销者发布也会引发不同反应(Goh等 2013)。作为官方品牌传播形式,MGC被设计为兼具信息性、说服性与互动性。

  在设计MGC时,营销者面临文本信息量与图片吸引力的内在权衡:文本对于传递复杂概念与精细技术信息(如产品规格、统计数据)至关重要,能促进理性说服;相反,图像内容在捕捉注意力、降低认知处理难度及增强记忆效果方面更具优势(Edell和Staelin 1983;MacInnis和Price 1987;详见Wyer等 2008年文献综述)。

  而既往研究大多以"是否存在"的二元视角分别考察文本与图片的作用:通过实验范式比较纯文本、纯图片及图文结合内容,以剖析消费者处理此类内容的认知与视觉机制;结合计算机视觉与文本分析工具对海量UGC内容样本进行分析,这类研究重点关注更多数量、更高质量或更相关的图像如何提升用户参与度(Li and Xie 2020;Ceylan et al. 2024)。

  仅有少数研究直接探究了文本或图片的几何尺寸(即表面积)对消费者注意力的影响(例如,Pieters与Wedel,2004;Pieters等人,2007):Pieters和Wedel(2004)的研究表明,在平面广告中,图片元素更能吸引基础注意力(即“图片优势效应”),而增大文本元素的表面积能够通过转移元素间的关注焦点来提升对广告的注意力。然而,Pieters 等人(2007)的研究揭示,文本尺寸对视觉注意力的确切影响取决于其内容。

  2.文本-图像比

  我们使用文本-图像比(TIR)来实现图像中文本和图像内容之间的相对平衡;分配给文本的表面积占图像总面积的比例。这一定义基于先前的行为研究(例如,Kwan等人2017年;Pieters和Wedel 2004年;Pieters等人2007年),并将后图像视为格式塔视觉实体。具体来说,我们将图片定义为包含图像中所有非文本内容的集合,使文本和图片内在地相互依赖。

  3.概念框架

  研究主要分析旨在检验文本-图片比例(TIR)对社交媒体参与度的主要影响。先前视觉研究(Pieters和Wedel,2004;Li和Xie,2020)中确立的“图片优势效应”逻辑表明,过度强调文本(即TIR较高)可能会降低参与度。

  为检验这种效应是否会因视觉和内容情境的不同而有所差异,我们考虑了四类调节变量:文本的空间布局(居中程度)、文本的信息价值(文本熵、文本情感倾向)、图片的信息价值(视觉熵、社交内容)以及内容一致性(文本-图片一致性)。每一类调节变量都反映了一个常见的设计考量因素:文本插入的位置、应包含的信息内容以及文本的呈现方式。

图片1.png

  4.调节变量

  (1)调节变量1:文本的空间布局

  文本居中程度:眼动追踪研究表明,消费者在浏览广告时,其最初的视觉聚焦点通常位于广告的中心(Rayner等人,2001)。此外,消费者通常会更为频繁且更长时间地注视广告中心的内容(详见Wedel和Pieters 2017年的综述)。因此,叠加文本的居中程度会影响其视觉显著性(相对于图片内容而言),并进而影响文本内容所获得的关注度和信息处理程度。假定帖子中的文本内容包含引人入胜的信息,我们预期,若叠加文本置于帖子图片的中心位置,帖子将取得更好的传播效果。

  (2)调节变量2:文本的信息价值

  文本熵:文本越大,可读性越强,认知处理起来也越容易。因此,当叠加的文本包含更多信息内容,尤其是与营销相关的有用信息时,通过放大文本(即更高的文本图像比例,TIR)来突出文本,应能提升受众的参与度。事实上,Pieters等人(2007年)发现,在特色广告中,价格和促销内容等营销组合信息的表面尺寸对消费者的注意力和参与度有着巨大影响。

  文本情感:营销内容通常包含带有情感的文字,这类文字能够提升社交媒体上的参与度,尤其是当文本能激发强烈的积极情绪时(Berger和Milkman,2012年)。尽管内容的情感倾向并不一定意味着信息量更大,但情感性文字能够放大、赋予图片信息语境,甚至塑造图片所传达的信息(Wyer等人,2008年),从而改变其信息价值。带有图片内容的帖子往往得益于支持性的情感性文字。放大这类文字可能会提升受众的理解力和参与度。

  (3)调节变量3:图片的信息价值

  视觉熵:我们预期,当帖子图片中的图像内容传达更多信息时,文本图像比例(TIR)的效果会受到负向调节。当图片包含的信息量较大时,对文本的需求相对较低,因为文本可能会引入冗余信息。此外,较高的TIR(即更强调文本)可能会加剧文本与图像内容之间的注意力竞争。因此,在信息丰富的图像信息帖子中添加更具吸引力的文本,可能会分散注意力,降低其效果。

  社交内容:包含人物(及其面部)的图像内容为基于社会认知的劝说策略提供了机会。例如,营销人员可能会聘请知名或看起来值得信赖的代言人来提供社会证明(Cialdini和Goldstein,2004年);微笑的演员的图片或视频可以传递积极的社会信号(Yin、Jia和Zheng,2021年)。包含更多社交内容的帖子可能也更少依赖语言推理或基于文本的信息。

  (4)调节变量4:内容一致性

  图文一致性:一种可能性是文本与图片信息内容之间的高度一致性有助于强化预期传达的信息,并提升信息处理的流畅性,进而促进态度形成和提升参与度(Edell和Staelin,1983年;Ceylan等人,2024年)。另一种可能性则是高度一致性会提供冗余信息,从而降低吸引力,并减少受众的认知处理(Houston、Childers和Heckler,1987年)。

  三、研究数据与处理

  1.数据来源

  我们从Facebook上的100个官方品牌账户和Instagram上的95个官方品牌账户中收集了两个大型的有机帖子现场数据集(NFacebook= 25,466, NInstagram = 27,498),涵盖9个主要产品类别的69个品牌。

  为了确定覆盖品牌和产品,我们采用《福布斯》品牌排行榜等公开排名来选择各产品类别中的知名品牌。随后,我们从每个账户中收集了最近的500篇有机帖子;Instagram上的帖子是在2021年7月之前收集的;Facebook上的帖子是在2022.3年8月之前收集的。

  我们排除了不活跃账号(其可比性可能存疑),即自创建以来总发帖量少于50篇的账号。同时排除了数据收集日期前10天内发布的帖子。

  最后,我们关注的是包含覆盖文本的帖子(72%的Facebook和62%的Instagram帖子),由此得到主要分析的最终样本量:Facebook平台17,914篇帖子,Instagram平台16,696篇帖子。

  2.变量提取

  研究主要使用Google Vision AI和Google Natural Language AI分别处理非结构化的图像与文本数据。

  采用CLIP等专业工具(OpenAI开发的神经网络算法,可预测图像最匹配的文本描述)来量化文本与视觉内容之间的契合度。

  3.经验模型

  研究采用了混杂和聚类鲁棒因果森林(CCR-CF),这是一种在广义随机森林(GRF)框架下基于机器学习的因果推理方法(Athey, Tibshirani, and Wager 2019)。作为GRF的扩展,CCR-CF能够有效应对观测混淆变量和聚类数据问题。

  CCR-CF模型由结果变量Y(本研究中的点赞与评论数量),处理变量W(文本-图像比率;TIR)和一组协变量X(即特征变量,包括感兴趣的调节变量M和控制变量)组成。它们之间的关系建模如下(Athey et al. 2019):

图片2.png

  模型旨在估计θ(x),即图文比例(TIR)的条件平均处理效应(CATE),亦即在不同调节变量水平下TIR的平均处理效应。

  4.研究结果

  (1)TIR对参与度的主要影响

  从点赞和评论来看,TIR对社交媒体参与度有显著的负面影响。总体而言,这一效应与先前的研究一致,证明了营销传播中的“图片优势”(Pieters and Wedel 2004; Li and Xie 2020)。

  (2)异质性和跨调节水平的增量变化

  在Facebook和Instagram平台上,当文本内容更居中、包含信息更丰富、唤起更积极情感或与图像内容更契合时,图文比例(TIR)产生的负面影响会逐渐减弱。

  5.稳健性检验

  (1)替代模型

  首先,我们建立了不考虑聚类效应的混淆稳健因果森林模型。结果表明,其分析结果与CCR-CF模型(混淆与聚类稳健因果森林)基本一致。

  我们采用因果森林(CIVF)模型。具体来说,我们使用其他平台(Instagram或Facebook)上对等页面的历史TIR作为焦点页面当前TIR的工具变量(IV)。

  我们构建了IV如下:首先,我们基于各种特征评估页面相似度,在焦点页面和同一类别中的所有其他页面之间创建相似度评分。然后,我们确定了其他平台上最相似的三个页面,称为对等页面。最后,我们计算了来自这些对等页面的历史帖子的平均TIR,使用这个历史平均值作为焦点页面当前TIR的IV。

  (2)纳入无叠加文本的帖子

  研究采用无条件样本(包含有叠加文本和无叠加文本的帖子)重复相同分析。

  (3)排除低于特定阈值的TIR帖子

  研究通过排除图文比例低于1%或5%的帖子数据进行稳健性检验。

  (4)图文平衡与营销组合信息——图文平衡的替代度量方法

  们使用营销组合信息(即产品、价格、促销和渠道)的数量作为文本信息价值的替代性操作化测量。

  (5)文本-图像平衡的替代性测量

  在稳健性检验中:将TIR替换为文本尺寸(文本覆盖面积),同时将图像尺寸(图像内容覆盖面积)作为控制变量;另采用两种不同子样本重新运行主模型:第一种选择文本尺寸相近但图像尺寸不同的帖子,第二种选择图像尺寸相近但文本尺寸不同的帖子。

  (6)对物体和标志的尺寸与位置进行控制

  我们通过将图片中物体和标志的尺寸及其居中程度作为控制变量,进行了稳健性检验。

  (7)文本情感倾向的替代度量方法

  我们采用了谷歌AI提供的另一种情感分析方法,该方法通过捕捉文本中情感的强度(无论积极或消极)来度量情感的“强度值”,其取值范围为0到正无穷。

  (8)产品与品牌类型

  我们通过分别对产品与服务、享乐型品牌与功利型品牌进行独立分析,探究了其可能存在的异质性效应。

  四、研究启示

  1.研究贡献

  先前关于社交媒体内容设计与消费者参与度的研究,主要聚焦于视觉美学要素(如色彩、明度、清晰度)或孤立内容元素的影响。尽管图文并茂的内容在企业生成内容(MGC)、用户生成内容(UGC)及其他媒介中普遍存在,但关于二者如何共同影响消费者参与度与反应的研究仍相对匮乏。既有文献多关注消费者处理文本信息与图像信息的差异机制,本研究则创新性地通过连续变量量化图文平衡度对消费者参与度的影响。

  本研究专注于MGC的研究视角进一步区分了与采用计算机视觉工具关联社交媒体视觉属性与消费者反应的其他研究——这些研究主要考察用户生成内容(如Dzyabura等2022;Hartmann等2021;Li与Xie 2020;Liu等2020)。本研究也区别于既往针对MGC的文本内容研究(如Goh等2013;Lee等2018),后者主要独立于视觉属性考察文本内容如何影响参与度。

  2.局限性和未来研究

  我们记录的影响是否延伸到较小的品牌,专业影响者和消费者(即用户生成的内容)是一个悬而未决的问题。

  未来的研究可以考虑文字-图片平衡如何影响社交媒体参与的其他指标,以及其他下游结果变量。

  未来的研究还可以探索我们效应的其他调节因子和异质性来源。

  至此,本次Seminar文章研读完毕。

  之后,由谢晓东、廖佐江、左翎、卫广宇分享研究进展,由赵文青分享AI相关研究方法、理论或行业应用,老师与同学们提出了建议,并明确了进一步的研究计划。

  至此,本学期第3次Seminar圆满结束。

  文字 / 裴珈悦

  排版 / 裴珈悦

  审核 / 左翎