全面解析 UGC 平台物品冷启动策略
在 UGC 平台中,物品冷启动是新发布物品面临的关键问题。由于新物品缺乏用户交互数据,难以融入常规推荐流程,其曝光与精准推荐成为挑战。有效的冷启动策略不仅能提升用户体验,增强作者创作动力,还能挖掘潜在优质内容,对平台发展至关重要。下面将深入探讨 UGC 平台物品冷启动的优化目标、评价指标、召回通道、流量调控以及 AB 测试等关键内容。
一、物品冷启动的优化目标与评价指标
(一)优化目标
UGC 平台物品冷启动聚焦于精准推荐、激励发布和挖掘高潜三个核心目标。精准推荐旨在克服新物品推荐的困难,将其精准推送至合适用户,避免引起用户反感 。激励发布通过向低曝光新物品倾斜流量,加快其首次曝光与交互时间,提升作者发布积极性,充实平台内容池 。挖掘高潜则是借助初期小流量试探,从大量新物品中筛选出高质量、有潜力成为热门的内容,给予更多流量支持 。
(二)评价指标
评价指标涵盖作者侧、用户侧和内容侧。作者侧指标用于衡量作者发布积极性,发布渗透率和人均发布量越高,表明对低曝光笔记的扶持效果越好 。用户侧指标反映推荐精准度,新物品消费指标(如点击率、交互率)能体现新笔记与用户兴趣的契合度,同时需关注大盘消费指标(如用户消费时长、日活、月活),确保冷启动策略不损害整体用户体验 。内容侧指标通过高热物品占比,评估冷启动挖掘优质笔记的能力,占比越高,挖掘效果越好 。
二、物品冷启动的召回通道
(一)挑战与适用通道
物品冷启动召回面临诸多挑战,新笔记缺乏用户交互信息和有效的笔记 ID embedding,致使双塔模型和 ItemCF 召回效果不佳 。然而,仍有一些召回通道适用于冷启动场景。类目、关键词召回在新笔记发布初期较为有效,系统依据用户画像中的兴趣类目和关键词,从维护的索引中召回最新笔记,但窗口期短且个性化不足 。聚类召回基于内容相似度,借助多模态神经网络将笔记图文映射为向量并聚类,为用户推荐相似内容,但仅对刚发布的新笔记有效 。Look - Alike 人群扩散召回适用于发布一段时间且有少量点击的低曝光物品,通过将笔记推荐给种子用户的相似用户,扩大曝光范围 。
(二)双塔模型改进
为应对冷启动难题,双塔模型可进行改进。一是采用 default embedding,让新笔记共享一个预先学习的 ID embedding 向量,待后续有足够交互数据时再更新 。二是利用相似笔记 embedding 向量,通过多模态神经网络找出内容相似的高曝光笔记,取其 embedding 向量的平均值作为新笔记的 embedding 。实践中常设置多个向量召回池,在不增加训练成本的前提下,增加新笔记曝光机会 。
三、流量调控策略
(一)流量调控的重要性与阶段
流量调控在物品冷启动中起着关键作用,直接影响作者发布指标。其发展历经多个阶段,从最原始的在推荐结果中强插新笔记,到对新笔记提权、保量,再到差异化保量,技术手段愈发精细 。这些策略旨在促进新笔记发布,挖掘优质内容,确保新笔记在初始阶段获得足够曝光,提升其成长为热门笔记的机会 。
(二)具体调控方法
新笔记提权通过干涉粗排、重排环节,给新笔记的分数乘以大于 1 的系数,增加其通过漏斗的机会,但提权系数难以精确设置,易导致过度曝光或曝光不足 。保量则致力于确保新笔记在发布后的前 24 小时获得一定次数(如 100 次)的曝光,通过在原有提权系数基础上乘以额外系数实现,不过保量成功率受推荐链路、提权系数和线上环境变化等因素影响 。差异化保量根据笔记内容质量和作者质量确定不同的保量目标,普通笔记保底 100 次曝光,优质笔记可额外增加曝光次数,上限为 500 次 。
四、物品冷启动的 AB 测试
(一)AB 测试的复杂性
物品冷启动的 AB 测试比普通推荐系统测试更为复杂,除关注用户侧消费指标外,还需考察作者侧发布指标 。在设计实验方案时,需考虑新笔记分组是否会抢流量、新老笔记抢流量方式在测试与推全后是否一致、同时隔离笔记和用户是否会缩小内容池