无监督机器学习模型与产品视觉独特性

时间: 2025-05-24 19:20:22   阅读:


  2025年5月16日14:00,中国营销工程与创新研究中心(以下简称“MEI”)2024-2025年第二学期第13次研讨会(以下简称“Seminar”)在MEI如期举行,参与本次研讨会的有黄敏学老师、朱华伟老师及MEI各位成员。

  本次Seminar由贺光耀研读文章《Visual Uniqueness in Peer-to-Peer Marketplaces: Machine Learning Model Development, Validation, and Application》。

图片1.png

  一、研究背景

  近年来,点对点(Peer-to-Peer, P2P)市场实现了指数级增长,涌现出大量由个体提供者创造的独特产品。然而,对于视觉独特性的可扩展量化方法及其在Airbnb等平台上对消费者需求的影响,学界尚缺乏系统研究。那么,如何实现视觉独特性的量化?

  本文开发并验证了一种无监督机器学习模型,用以从图片中自动提取独特性特征,并进一步量化其对平台需求的影响。

  二、文献综述

  2.1独特性(uniqueness)及相似概念

  在市场营销策略中,独特性与差异化( differentiation) 和区别性(distinctiveness)同义,用于描述差异化产品或品牌属性 (Carpenter, Glazer, and Nakamoto 1994)。

  在消费者行为中,在消费者研究中,独特性的概念常常在“消费者对独特性的需求”这一框架内进行讨论(Tian, Bearden and Hunter 2001),其根源在于社会心理学,关注个体区分自己与他人的需求。

  在产品设计和广告吸引力的背景下,如“原型性”(prototypicality)、 “原创性”(originality)和“区别性”(distinctiveness)。

  总的来说,独特性源于与类别原型的偏离,对独特性的感知源于比较过程。

  2.2概念化视觉复杂环境(如P2P)下的视觉独特性

  我们借鉴了认知视觉处理的研究,将对视觉独特性的感知和评估概念化为一个由自下而上的处理、比较评估和整体个体化驱动的过程。这个过程评估所有的视觉特征,如色彩方案、对比、物体位置和纹理,

  不仅仅是在个别图像内,如Itti和Koch(2001)所建议的,而是跨图像进行比较以突出差异。

  • 自下而上( Bottom-up)作为主要的处理机制。基于视觉刺激的固有特征进行直接分析,独立于先前的知识或期望。

  • 比较作为核心评估过程。独特性的认知本质上需要比较。在视觉感知中,这意味着识别那些从其他刺激中脱颖而出的刺激。

  • 整体个体化胜于基于特征的分析。基于对刺激整体的整体感知来识别和区分刺激,而不是孤立地分析和比较单个特征。

  2.3无监督对比学习

  图像唯一性这一主题仍然相对缺乏研究,这一空白主要归因于缺乏必要的标记数据集用于模型训练。即使有人类标签可用,由于标签的时间敏感性和依赖于具体环境的特性,它们通常也会带来挑战(Zhong et al. 2022)。此外,当以可扩展的方式解释什么构成图像的唯一性时,复杂性也会增加。

  一种方法是利用对比损失(Oord, Li 和 Vinyals 2018),这是一种基础算法,可以引导无监督模型(不需要标记数据)区分相似样本和不同样本,就像在一篮混合水果中辨别苹果和橙子一样。它根据每对样本之间的“距离”(可以使用余弦距离或欧几里得距离进行测量)对样本进行分类,并将它们组织成相似性和差异性的簇,形成一个高维表示空间(Chopra, Hadsell 和 LeCun 2005)。

  对比学习允许刺激之间在各个方面进行比较,模仿人类在刺激比较中的整体自下而上的视觉处理。

  三、模型开发:量化视觉独特性

  3.1模型开发

图片2.png

  数据准备。2022年4月至2023年4月每月收集它们的房产图片。分为训练集420,735张图片和保留测试集61,012张图片。首先将图片调整为224 × 224像素的统一大小,这是我们的模型所需的,并将其光照标准化,以最小化不同光照条件的影响。

  步骤1:创建相似和不同的图像对。相似对:这些是通过对同一图像应用随机增强(例如,模糊、水平翻转)而创建的。不同的配对:这些是通过将每个图像与从整个图像数据集中随机抽取的无关图像配对生成的

  步骤 2:提取和存储向量表示。编码器通过仅捕捉最重要的信息来缩减图像大小,将每个大图像转换为 128 维特征的紧凑表示。

  步骤 3:计算对比损失。计算得出的 InfoNCE 值 L 是机器学习模型的损失函数;值越小,图像越独特。

  步骤 4:独特性分数转换。通过线性变换来计算每个图像的"独特性分数",即调整之前测得的损失L:独特性 = -L + 截距,其中截距是所有图像中损失的最大值。

  3.2模型解释

  机器学习模型的一个常见批评是它们的不透明性(Lipton 2018)。这种不透明性使企业在诊断问题或制定策略时难以提供可解释和可操作的建议。为了解决这个问题,我们采用了表示学习可解释性(RELAX)框架(Wickstrom et al. 2021),在像素级别上识别使图像独特的因素(即独特性预测的驱动因素)。

  (1) 随机掩盖图片中某些像素点这改变了图像的矢量表示及其结果的独特性预测,使我们能够推断特定像素对总体独特性分数的贡献。

  (2) 创建一个独特性热图每个像素贡献的重要性通过像素级别的颜色强度表示。

  热图让我们能够准确定位图像的特定像素级特征如何影响其预测的独特性评分。

  二、实验过程

  Ø  Study1:用于预测有效性的眼动实验室实验

  · 推断:先前的文献表明,独特的刺激往往能自然地引起我们的注意

  · 假设:如果我们的模型能够充分预测视觉独特性,那么机器预测的独特性分数和人类视觉注意力之间应该存在正相关。

  · 样本:欧洲212名大学生

  · 程序:参与者被要求浏览这些Airbnb的图片,以便前往纽约市旅行,然后每个参与者都看到了两个图像集中的一个:拼贴A或拼贴B由12张Airbnb房产图片组成,代表模型预测的独特性分数的四个级别——2、6、10和14。

  对图像在四种显示变化中的位置进行了随机化,以尽量减少图像放置对注意力的影响

  将图像亮度标准化,以避免由不寻常的照明引起的注意力偏差。

  · 测量:记录了两个关键指标:

  注视的总持续时间,表示参与者注视某一点的时间长度;与处理的信息类型和复杂性有关。

  注视次数,表示对图像的总注视次数,表明处理的信息量

  · 结果:相关分析和混合固定回归分析(尽管控制了美学、视觉复杂性和图像位置FE)都显示机器预测的独特性分数与人类

  视觉注意力之间存在正相关。

  Ø  Study2:构建有效性的实验室实验

  · 目的:探讨两个方面来检验我们独特性测量的构念效度

  (1) 个体是否认为模型预测的独特性得分较高的图像比得分较低的图像更独特

  (2) 我们的模型识别的像素级图像特征是否与人类感知一致。

  · 抽样:288名参与者(54. 86%女性,44. 79%男性,0. 34%其他,平均年龄=20.22岁)来自一所欧洲大学

  · 程序:

  1. 参与者被指示观看电脑屏幕上显示的12张Airbnb房源图片,想象他们正在计划前往纽约市的旅行。

  2. 选择他们认为最独特的三张图片。

  3. 对于每张选定的图像,参与者被要求识别并点击房间内五个特定点,这些点有助于他们感知图像的独特性

  · 结果:

  (1) 模型预测的独特性增加一个单位(大约独特性增加6%)会导致选择可能性增加4. 12%,即使控制了诸如图像美学等不同因素。

  (2) 每张图像被分成64 * 64个部分或网格,我们分析每个网格中的人类点击。因变量是所有参与者在网格上的总点击数;自变量是模型预测的网格像素级重要性值之和。

  结果表明,模型生成的图像特征聚合重要性与人类判断的图像特征重要性之间存在积极且显著的相关性。这表明我们的模型能够准确地指出对图像独特性有贡献的区域,其方式与人类评估一致。

  Ø  Study3:在线实验与操纵图像

  · 目标:通过删除我们的模型确定为独特性预测的关键贡献者特征来实验性地修改图像,以确定这些改变是否会影响人类对图像独特性的感知。

  · 样本:通过Amazon Mechanical Turk在北美地区招募了399名参与者(49. 12%为女性,50. 88%为男性,平均年龄=39.25岁)

  · 程序:参与者观看了一组六张Airbnb房源图片,排列成一个3×2的拼贴画。参与者被随机分配到四种条件之一:一种是没有图像处理的对照组,以及三种处理组,其中每组包含三张目标图片中的两张。参与者被要求观看拼贴画,并想象他们正在计划前往纽约市的旅行,然后从这六张图片中选择他们认为最独特的三张。

  · 结果:根据表7中报告的逻辑回归边际效应,图像操作降低了模型预测的独特性得分,显著减少了选择的可能性,降低了22. 15% (b =?0.2215,p<0.001)。这表明,通过独特性热图识别出的独特性贡献元素的操作,改变了感知到的视觉独特性。

  Ø  Study4:模型应用

  · 目标:利用Airbnb数据评估视觉独特性对房产需求的影响

  · 理论基础:视觉独特性不仅可能通过吸引注意力和体验价值积极影响属性需求,还可能因与不确定性相关联而产生负面影响(Bolton和Drew 1991;Ghose 2009)。以往文献记录

  了产品需求与产品特性如新颖性、复杂性和典型性之间存在倒U型关系。

  · 假设:

  H1:在Airbnb上,视觉独特性和需求之间存在倒U型关系。

  H2:高入住率和正面的物业评级可以降低预订风险,从而减轻视觉独特性对需求的影响。这种调节可以增强独特性的益处,特别是对于高度独特的物业。

  · 数据:我们通过每月从2022年4月到2023年4月收集纽约Airbnb房源的图片,构建了一个Airbnb房产图像数据集。与此同时,我们从第三方数据提供商AirDNA获得了这些房源在同一时期的供求、定价和物业特征等历史数据,该数据被称为Airbnb需求数据集。我们移除了因数据抓取问题导致的陈旧属性、异常值和缺失数据。整合这两个数据集后,生成了一个包含14,121个属性的数据集,时间跨度为13个月,覆盖纽约市。

  · 测量:属性独特性评分。我们对每张图片应用对比机器学习模型,得出一个独特性评分。每个月,我们根据该属性列出的所有图片计算出平均独特性评分。

  · 结果:

  使用同一邮政编码区内不可比的Airbnb房源的平均属性特征(即浴室数量)作为工具变量,并采用BLP型工具变量。价格和入住率(公式[5]和[6])同时通过三阶段最小二乘法(3SLS)方法估计,以允许两个方程中的误差项相关(Sargan 1964),从而联合建模Airbnb定价与入住率之间的相互依赖关系。

  研究结果表明,在控制房产图片的视觉美学和视觉复杂度的情况下,独特性和需求之间存在倒U型关系。这一发现支持了我们的假设,即虽然最高水平的独特性可以提升需求,但过于独特的房产可能会让潜在客户望而却步。

  可以看出,这两个变量都显著且正向地调节了视觉独特性的线性和二次项。此外,如图8所示,响应率或总体评分的提高往往会使U型的独特性需求关系趋于平坦。这些发现表明,高质量的适应性,即高响应率或总体评分,可以减少不确定性,从而增强独特性对吸引游客的正面影响。

  三、讨论

  5.1理论和实务贡献

  1. 首先,我们的工作扩展了基于特征的类别原型的传统产品差异化概念。我们将视觉独特性的感知与评估视为一个自下而上、比较性和整体性的过程,在这一过程中,所有图像特征在不同图像之间进行对比,而不依赖于预设模式或标准化特征。

  2. 其次,我们的研究加入了并扩展了关于视觉特征对消费者选择影响的对话。一方面,我们确立了视觉独特性作为一个独立的构念,可以与相关构念区分开来;另一方面,我们发现视觉独特性与属性需求之间存在倒U型关系,并进一步证明高评分和高主机响应性的属性从视觉独特性中获益更多。

  3. 最后,我们通过展示视觉独特性对需求的独特贡献,为新兴的点对点市场文献增添了新的内容。

  5.2方法学贡献

  1. 首先,我们是最早将心理学理论用于构建和验证无监督机器学习模型的机构之一。在市场营销研究中,监督机器学习模型被广泛使用,其中大量特征被测量并添加到预测模型中,以预测关键的因变量。

  2. 其次,使用眼球追踪实验和涉及人类参与者的验证研究来系统地验证机器学习模型是一种创新的方法。

  3. 此外,这项研究为机器学习在消费者研究中的新兴应用带来了创新。我们为营销研究中图像分析应用对比学习和表示学习技术(Becker和Hinton 1992)提供了合适的案例。可解释人工智能技术的创新应用,如独特性热图的创建,进一步增强了模型的实际效用和可解释性。

  4. 最后,我们的研究表明,使用无监督机器学习进行“合成消费者研究”的可行性和效率。

  5.3管理意义

  1. 利用独特性进行营销和推荐。P2P平台可以通过突出房产的独特之处来增强其营销策略。

  2. 平衡独特性与质量保证。我们发现独特性和需求之间存在倒U型关系,这表明主办方应避免过分强调独特性。

  3. 对房东的可操作性。想象一下,如果Airbnb实施了一个使用我们模型的图像分析工具,那么新房东、正在翻修房产或更新图片的人就可以利用该工具的见解来指导他们在翻修、家具和装饰方面的投资。

  4. 应用到其他情境。我们的方法论框架在各种图像丰富且独特的领域具有广泛的适用性,图像的视觉独特性可能对消费者行为产生重大影响。

  至此,本次Seminar文章研读完毕。

  之后,由谢晓东、卫广宇、朱雅阁、喻英豪分享了最近的研究进展。针对研究中的问题,老师与同学们提出了一些建议,并且明确了进一步的研究计划。

  至此,本学期第13次Seminar圆满结束。

  文字/朱雅阁

  排版 /朱雅阁

  审核 /左  翎