脱颖而出又不失融洽:社交媒体传播中文字叠加的视觉设计

时间: 2025-11-08 09:29:56   阅读:


  2025年10月24日下午14:00,中国营销工程与创新研究中心(以下简称“MEI”)2025-2026年第一学期第7次研讨会(以下简称“Seminar”)在MEI如期举行,参与本次研讨会的有黄敏学老师及MEI各位成员。

  本次Seminar由鲁欣雨研读文章《Standing Out While Fitting In: Visual Design of Text Overlays in Social Media Communication》。

图片1.png

  一、研究背景

  社交媒体视觉内容爆炸(据估算用户日均上传 20 亿张图片),用户存在 “快速滑动浏览” 行为,企业需在不破坏用户视觉体验的前提下,通过设计让内容脱颖而出。文本叠加(text overlays TO,指图片中除品牌 logo 外的刻意嵌入文字)是常用策略,但现有实践存在矛盾:

  Instagram 的 A/B 测试显示无 TO 图片表现优于有 TO 图片;

  Facebook 建议 TO 占比不超过图片的 20%,而 Twitter 则推荐使用 TO; 缺乏理论与实证支撑的 “TO - 图片” 组合设计指南。

  为了帮助社交媒体管理者就如何展示其产品或品牌做出战略决策(例如,静态展示与产品使用场景展示、使用多大字号的文本以及文本在图像中的位置),我们研究了三个基本的、能产生显著性的特征对消费者反应的影响,这三个特征分别是:

  图像动态性(Image Dynamism):指图像描绘动作、运动或移动的程度,能吸引注意力(Cian、Krishna & Elder, 2014;Hubbard, 1995);

  TO大小:TO在图像中所占的面积百分比;

  TO中心性:TO在图像中的位置(从周边到中心)(Pieters & Wedel, 2007)

  一、理论背景

  1.社交媒体参与度的驱动因素

  在社交媒体场景中,“用户参与度” 指用户与企业生成内容的互动,涵盖两大维度:行为维度方面,具体互动动作,如点赞、评论、转发、点击;认知维度方面,用户参与意愿,如 “是否愿意点赞 / 分享品牌内容”。 参与度的测量需结合平台特性(如 Twitter 用转发量,Instagram 用赞评总和),且需区分内容的三大构成元素 —— 图片(视觉元素)、标题(图片外文本)、TO(图片内文本),三者对参与度的影响机制存在本质差异。

  视觉与文本因素均可以影响参与度。关于视觉因素,已有研究证实,视觉遮挡(Sevilla & Meyer, 2020)、主色占比(Li & Xie, 2020)、图片复杂度(Overgoor et al., 2022)、人类出现(Hartmann et al., 2021)等会影响参与度,但此类研究多控制文本因素(如标题),未关注 “图片内 TO” 的作用;关于文本因素,标题的效价(Schweidel & Moe, 2014)、唤醒度(Kanuri et al., 2018)、可读性(Pancer et al., 2019)等会影响参与度,且部分研究关注 “标题与图片的语义匹配度”(Li & Xie, 2020),但标题与 TO 存在关键差异—— 标题位于图片外,不参与图片的视觉构成,而 TO 叠加于图片内,需从 “视觉感知与风格协同” 角度分析其效果,现有研究对此存在空白。

  

  2.视觉显著性的作用机制

  视觉显著性指视觉元素(如图片、文本)吸引注意力的能力,其核心来源包括:图片动态程度与 TO 的视觉特征。图片动态程度指图片传递的动作或运动感(即使静态图片也可通过元素布局唤起动态感知),动态元素因符合人类 “检测运动” 的进化本能,具有更强的注意力吸引力(Cian et al., 2014),如动态警示标识能更早引起驾驶员注意(Cian et al., 2015);TO 的视觉特征指 TO 的大小(占图片面积百分比,Pieters & Wedel, 2004)与中心性(位置从边缘到中心,Sample et al., 2020)—— 在印刷广告中,文字越大、位置越居中,注意力吸引力越强,但这一结论是否适用于社交媒体场景尚未验证。

  在传统场景中,Pieters & Wedel(2004, 2007)的印刷广告研究证实,显著性元素(如大尺寸图片、文字)能提升注意力,但社交媒体与印刷广告存在本质差异 —— 用户在社交媒体中浏览时间更短(平均几秒),且图片与 TO 共享视觉空间,若两者均为高显著性(如动态图片 + 大尺寸中心 TO),会形成 “注意力竞争”,增加用户处理成本;根据 Rosenholtz & Jin(2005)的显著性模型,人类视觉系统优先关注 “异常元素”(如对比色、运动元素),但过度叠加高显著性元素会导致 “视觉杂乱”(如元素拥挤、相互遮挡),反而降低内容的注意力吸引力。因此,社交媒体图文组合需 “平衡显著性分配”,避免多个焦点竞争。

  3.视觉吸引力的影响路径

  视觉吸引力指用户对视觉元素排列的 “美学舒适度” 与 “形式完整性” 感知,其形成依赖两大原则:元素协同性与无视觉杂乱。元素协同性指有效排列的视觉元素(如大小、位置适配)会让用户产生 “直觉上的舒适感”(Locher et al., 1999);无视觉杂乱指过多或无序的元素会导致 “视觉拥挤”(Balas et al., 2009)、“信息遮挡”(Chun & Wolfe, 2005),破坏吸引力。

  视觉吸引力对参与度的中介作用有前注意阶段的关键作用与多模态传播的成本逻辑。用户浏览社交媒体时,会先通过 “前注意阶段” 快速形成对内容视觉结构的整体印象(Affonso & Janiszewski, 2023)—— 若该印象符合 “美学舒适感”,用户才会进一步产生认知层面的参与意愿(如思考是否点赞)。若印象杂乱,则直接跳过;当图片与 TO 的功能重叠(均为高显著性、均吸引注意力)时,会增加用户的信息处理成本(Moffett et al., 2021),导致视觉吸引力下降,进而降低参与度。反之,若两者显著性平衡(如动态图片 + 边缘小 TO),则能提升吸引力,促进参与度。

  4.视觉显著性、视觉美学、视觉杂乱理论

  视觉显著性理论源于对人类视觉注意力分配机制的研究,强调视觉元素根据物理特征(如大小、颜色、对比度、运动)在有限注意力资源中竞争优先处理权(Pieters & Wedel, 2004)。该理论的核心观点是:① 注意力自动捕获:某些视觉特征(如运动、高对比度)能"自下而上"地吸引注意力,无需主观意图(Treisman & Gelade, 1980)。 ② 处理层次性:视觉系统优先处理显著性高的元素,然后才是次要元素(Chun & Wolfe, 2005)。 ③ 资源竞争:在复杂视觉场景中,元素间相互竞争注意力资源,导致某些元素被忽略(Pieters & Wedel, 2007)。

  视觉美学理论强调审美反应在消费者信息处理中的核心作用,认为美观的视觉设计能激发积极情感、促进深度处理并增强行为参与(Patrick & Hagtvedt, 2011)。该理论的核心要素包括:① 直觉美感:人们在毫秒级时间内形成美学判断,基于视觉元素的秩序、平衡和和谐(Locher, Stappers, & Overbeeke, 1999)。 ② 秩序与复杂性平衡:理想的美感来源于适度复杂性和良好结构的结合(Berlyne, 1974)。 ③ 积极情感转移:对设计的积极审美体验会转移到对内容的态度和品牌评价上(Hagtvedt & Patrick, 2008)。

  视觉杂乱理论描述了当视觉场景中包含过多竞争性元素时,信息处理效率下降的现象(Pieters, Wedel & Zhang, 2007)。核心要素包括:① 元素间干扰:相近或重叠元素在视觉处理中相互干扰,导致识别能力下降(Balas, Nakano & Rosenholtz, 2009)。 ② 处理负荷:过多显著元素增加认知负荷,延长处理时间(Breitmeyer, 2007)。 ③ 信息提取效率:杂乱环境降低目标信息的识别速度和质量(Chun & Wolfe, 2005)。

  5.理论模型与假设

  本文的概念框架以 “图片与 TO 的显著性交互” 为核心,结合社交媒体参与度的驱动逻辑与视觉美学感知规律,提出:需通过平衡图片(动态程度)与 TO(大小、中心性)的视觉显著性,提升内容的视觉吸引力,最终促进用户参与度。

图片2.png

  本文提出了如下假设:

  H1a:对于动态图片,TO 大小与消费者参与度呈倒 U 型关系—— 即 TO 在图片中占据的面积比例增加时,参与度先上升至一个最优阈值,超过该阈值后,参与度反而下降。

  H1b:对于静态图片,TO 大小与消费者参与度呈正相关关系—— 即 TO 在图片中占据的面积比例越大,参与度越高。

  H2a:对于动态图片,TO 中心性与消费者参与度呈负相关关系—— 即 TO 位置越靠近图片边缘(中心性越低),参与度越高;越靠近图片中心(中心性越高),参与度越低。

  H2b:对于静态图片,TO 中心性与消费者参与度呈正相关关系—— 即 TO 位置越靠近图片中心(中心性越高),参与度越高。

  一、实验设计

  Study 1Twitter实地研究

  研究目的:

  本实地研究旨在探讨三个关键变量——图像动态性、文本叠加层(TO)大小与TO中心性——在真实社交媒体环境(Twitter)中对用户参与度(以转发数衡量)的交互影响。该研究提供了观察性证据,为后续的实验奠定基础。

  研究材料:

  数据来源:来自八个知名品牌(可口可乐、福特、沃尔玛、乐购、麦当劳、亚马逊、迪士尼、耐克)在2016年5月1日至2017年5月1日期间的推文。

  样本:在排除纯文本、视频和多图推文后,最终样本包含5,589条带单张图片的推文。

  因变量:参与度(转发数)

  自变量:图像动态性(由人工评分员在1到7的量表上打分(1为“非常静态”,7为“非常动态”),评分者间一致性高)、TO大小(TO所占据的图片面积百分比)、TO中心性(在1到7的量表上评分(1为“完全不居中”,7为“非常居中”))

  控制变量:文本特征(情感、唤醒度、可读性)、图像特征(主色集中度、是否出现人物)以及元数据(发布时间、粉丝数)

  研究流程:

  数据收集:使用Python的Selenium工具进行自动化爬取。

  数据编码:由训练后的编码员对图片进行标注;随机抽取500条推文进行人工核对,准确率为100%。

  统计分析:由于转发数为过度离散的计数数据,采用负二项回归分析。为了解决TO大小与中心性之间的多重共线性问题(相关系数为0.86),研究使用“将TO中心性对TO大小回归后的残差”作为工具变量。

  研究结果:

  主效应:图像动态性对参与度有显著正向影响(IRR = 1.043,z = 5.70,p < .001);动态性每增加1个单位,转发数增加4.3%。

  交互效应:对于动态图片,TO大小呈倒U型影响(线性项:IRR = 1.008,p < .001;二次项:IRR = .999,p < .001)。当TO大小占图片面积约24%时,参与度达到峰值;当超过46%时,参与度反而低于无TO的图片。对于静态图片,TO大小的影响不显著(p > .05)。对于动态图片,TO中心性有负向影响(IRR = .929,p < .001);TO越居中,参与度越低。对于静态图片,TO中心性有正向影响(dy/dx = .640,p < .001);TO越居中,参与度越高。

  Study 2a2b:在线实验

  研究目的:

  研究2a与2b是预先注册的在线实验,旨在在受控环境中对研究1的发现进行因果验证。研究2a聚焦于TO大小与图像动态性之间的交互作用,研究2b则聚焦于TO中心性与图像动态性之间的交互作用。

  实验材料:

  刺激物:使用了研究1中的20张原始图片(10张静态,10张动态),并对TO的大小(小、中、大)与中心性(边缘、中等、居中)进行操控,最终形成120种不同的图文组合。

  研究2a:共招募339名参与者(最终有效样本为315人);平均年龄为38.58岁;女性占49.4%。

  研究2b:共招募165名参与者(最终有效样本为154人);平均年龄为39.47岁;女性占50.6%。

  筛选标准:美国居民;Prolific平台接受率≥95%;已完成不少于500个任务;在Facebook/Instagram/Twitter上活跃;年龄在18至65岁之间。

  实验流程:

  实验设计:混合设计。其中,图像动态性(静态 vs. 动态)为组间变量,TO大小(研究2a)或TO中心性(研究2b)为组内变量。

  任务:每位参与者随机评估10条推文,这些推文在TO大小或中心性上有所不同。

  分析方法:使用面板回归分析,并控制参与者和刺激物的固定效应。

  实验结果:

  研究2a(TO大小):对于动态图片,TO大小呈现倒U型影响(主效应:β = -.078,p = .03;二次项:β = -.077,p = .03)。对于静态图片,TO大小的影响不显著(p > .05)。

  研究2b(TO中心性):对于动态图片,TO中心性有负向影响(β = -.255,p = .02)。对于静态图片,TO中心性的影响不显著(p > .05)。

  Study 3:在真实环境中操控TO

  研究目的:

  研究3a与3b是在Facebook广告管理平台上进行的实地A/B测试,旨在真实广告环境中验证TO设计对行为结果(点击率,CTR)的影响。研究3a测试了TO大小与动态图像的组合效果,研究3b测试了TO中心性与动态图像的组合效果。

  实验材料:

  广告:为虚构品牌“Adventure Tours”制作广告。

  研究3a:使用一张动态滑雪图片,并操控TO的大小。

  研究3b:使用一张动态冲浪图片,并操控TO的中心性。

  预算与投放:每个广告版本的预算为100美元,在一周时间内投放给18至54岁、对滑雪/冲浪感兴趣的美国用户,仅展示在桌面版Facebook动态消息中。

  实验流程:

  所有广告版本同时通过Facebook广告管理平台投放。每个版本的展示次数(impressions)与点击次数(clicks)均被记录。点击率(CTR)通过公式 CTR = 点击数 / 展示数 计算,并使用卡方检验比较不同版本之间的差异。

  实验结果:

  研究3a(TO大小):中等大小的TO获得了最高的点击率(0.33%),显著高于大TO(0.26%;χ² = 4.57,p = .03)和小TO(0.15%; χ²=40.36, p<.001)。与小TO相比,中等TO的点击率提升了127%。

  研究3b(TO中心性):边缘位置的TO获得了最高的点击率(0.74%),显著高于中等居中位置(0.60%;χ² = 4.78,p = .03)和完全居中位置(0.62%; χ²=3.68, p=.06)。与居中TO相比,边缘TO的点击率提升了20%。

  Study 4:机制探索

  研究目的:

  研究4a与4b旨在探索视觉吸引力在TO设计与用户偏好之间的中介作用,并将其与其他潜在机制(好奇心、创意性、注意力、惊讶感、精细加工)进行比较。

  实验材料与流程:

  实验设计:两项研究均采用3×3的组内设计。

  研究4a:操控TO大小(小、中、大)。

  研究4b:操控TO中心性(边缘、中等居中、完全居中)。

  刺激物:每项研究使用了三张不同的动态产品图片,共生成九种刺激组合。

  参与者:从Prolific平台招募(研究4a共113人,研究4b共110人)。

  因变量:对帖子的偏好程度(1 = “非常不喜欢” 到 9 = “非常喜欢”)。

  中介变量:使用9点量表测量,包括:视觉吸引力、好奇心、创意性、注意力、惊讶感、精细加工。

  分析方法:使用多层结构方程模型(MSEM)检验中介效应,并控制参与者和刺激物的随机效应。

  实验结果:

  研究4a(TO大小):视觉吸引力是最强的中介变量(β = –.252,p < .001),其解释力显著优于好奇心(β = –.076,p = .01)和精细加工(β = –.063,p < .01)。创意性、惊讶感和注意力不是显著的中介变量。

  研究4b(TO中心性):视觉吸引力再次成为最强的中介变量(β = –.187,p < .001),其解释力优于好奇心(β = –.049,p < .01)和创意性(β = .028,p < .01)。注意力与惊讶感不是显著的中介变量。

  Study 5Instagram实地研究

  研究目的:

  研究5将前述研究发现推广至Instagram平台,并开发了一个基于Vision Transformer(ViT)模型的自动化图像动态性分类工具,以帮助管理者在实际中进行应用。

  实验材料:

  数据来源:与研究1相同的八个品牌,在Instagram平台上从2015年1月至2020年2月发布的帖子。

  样本:共8,467条带单张图片的帖子。

  因变量:参与度以点赞数与评论数之和衡量(Instagram无转发功能)。

  自变量:图像动态性(使用Vision Transformer(ViT)模型进行自动分类,该模型基于研究1与Instagram中的图片进行训练,模型测试准确率为85.8%)。TO特征:使用Google Cloud Vision API自动识别,同时对TO大小与中心性进行人工编码验证。

  实验流程:

  模型开发:ViT模型经过超参数调优(训练4轮,批次大小为64,学习率为0.00005)。

  数据分析:采用与研究1相同的负二项回归分析方法。

  实验结果:

  核心发现再次在Instagram上得到验证:

  图像动态性对参与度有显著正向影响(IRR = 1.139,p < .001)。对于动态图片,TO大小呈倒U型影响,最优值约为11%。TO中心性对参与度有负向影响(越居中,参与度越低)。对于静态图片,TO大小有正向影响,而TO中心性影响不显著。

  工具验证:ViT模型能够有效实现图像动态性的自动分类,为大规模应用提供了可能。该工具允许管理者上传图片,并获得最佳TO大小与位置的推荐。

  二、研究启示

  本研究首次揭示“图像动态性×文字叠加层(TO)显著性”平衡是驱动社交媒体参与的核心机制,为理论与实操提供三点启示:

  理论层面:跳出“文字越大越居中越好”的传统视觉显著性假设,把“元素间显著性平衡”纳入多模态美学与参与度模型;视觉吸引力被证实是该平衡影响参与的唯一中介,为后续社交媒体研究提供可复制的分析路径。

  设计层面:先判“动/静”再定TO——动态图配中小号、边缘TO;静态图可居中,但大小微调收效甚微;同时保证TO与图像、标题语义互补,避免重复造成的认知过载。

  工具层面:用ViT自动识别图像动态性,用KNIME开源插件实时预测TO效果并做A/B测试,把“显著性平衡”指标嵌入日常内容工作流,实现数据驱动的创意优化。

  未来需继续破解“静态图TO无显著效应”的悖论,检验多TO并存及跨平台(短视频、电商图)场景,并迭代模型精度,最终建立适用于全域社交媒体的“动态显著性平衡”内容与效果标准。

  至此,本次Seminar文章研读完毕。

  之后,由王紫灵、朱伊平、朱雅阁、彭沁缘分享研究进展,由卫广宇分享AI相关案例与行业应用,老师与同学们提出了建议,并明确了进一步的研究计划至此,本学期第7次Seminar圆满结束。

文字 / 张宇瑄

  排版 / 张宇瑄

  审核 / 左翎