YouTube油管时长购买时长推导的深度解析
很硬核 容易劝退本文将深入探讨 YouTube 排序模型中 Watch Time 的推导过程,揭示其背后复杂而精妙的数学原理。
一、训练目标与预测值的差异引发思考
在论文所涉及的 YouTube 排序模型里,训练目标明确为视频点击率,其计算公式为 。这一公式体现了基于特征 预测视频被点击( )的概率 的逻辑。然而,当模型上线后,预测值的计算方法却变为 ,这种看似矛盾的差异不禁让人思考其背后的设计逻辑。
二、从 Logit 回归探究预测值计算方式
Logit 回归基础原理
Logit 回归是整个推导的重要基石。它致力于对样本正负概率比值 的对数值进行线性回归建模。具体而言,其表达式为 。从直观上理解,这一公式通过特征 与参数 的线性组合来刻画样本属于正类(点击)与负类(未点击)概率比值的对数关系。
推导预测值为 值
基于上述 Logit 回归公式,经过数学推导可得 。这一推导结果清晰地表明,YouTube 模型在预测阶段所输出的值实际上就是正负概率比值,也就是所谓的 值。由此,我们得出第一个关键结论:排序模型预测值为 ,即 。这一结论为后续深入探究奠定了基础,让我们初步理解了模型预测值计算方式背后的逻辑起点。
三、Weighted Logistic 与播放时长加权的奥秘
Weighted Logistic 损失函数解读
YouTube 在训练过程中采用了独特的 Weighted Logistic 方法,其损失函数为 。其中, 这一变量代表播放时长,它在损失函数中的作用至关重要。这种加权方式从本质上相当于将当前正样本复制了 次。为了更好地理解这一过程,我们引入一系列样本集合的概念。
样本集合的定义与关系构建
设某一特定样本特征为 (这里 为具有明确取值的向量),我们定义此类样本的总体为 ,其中正例总体 ,负例总体 。在训练样本中出现的此类样本的采样集合记为 ,正样本采样集合 ,其大小记为 ,负样本采样集合 ,大小记为 。 当正样本复制 次后,相应的采样集合记为 ,正样本采样集合 ,负样本集合记为 (此处负样本 值可能存在疑问,但暂按此逻辑推导),复制后采样集合对应的总体集合记为 ,正样本总体 ,负样本总体 。
基于采样充分性的推导与结论
在假设训练数据采样足够充分,即 的条件下,我们可以进行一系列推导。首先, 。接着, ,其中 ,且 。 综合上述推导以及之前得出的预测值为 的结论,我们可以得出第二个重要结论:Time Weighted Logitic 模型预测目标为 。这一结论进一步揭示了播放时长加权在模型预测目标中的具体体现,表明预测值不仅仅与点击率概率 相关,还与播放时长 紧密相连。
四、泰勒展开式助力最终结论推导
为了得到更简洁且具有直观意义的表达式,我们引入泰勒展开式对 进行展开。根据泰勒展开式可得: (这里由于 ,高次项的影响相对较小,可近似处理)。 基于此,我们最终得出结论: 。
这意味着模型的预测值近似为总体集合 上的播放时长的期望。这一最终结论深刻地揭示了 YouTube 排序模型在考虑播放时长加权后的预测值本质,它将点击率概率与播放时长有机结合,旨在通过预测值更好地反映视频在用户群体中的综合价值,从而为视频排序提供更为精准和全面的依据。
通过对 YouTube 排序模型中 Watch Time 的推导过程的详细剖析,我们从训练目标与预测值的差异出发,逐步深入到 Logit 回归、Weighted Logistic 以及泰勒展开式等数学原理的运用,最终揭示了模型预测值与播放时长期望之间的内在联系。这一推导过程不仅展示了数学在构建复杂模型中的强大力量,也为我们深入理解 YouTube 平台的视频排序机制提供了宝贵的视角,有助于相关领域的研究人员和从业者更好地把握视频推荐系统的核心原理,并为进一步优化和创新提供理论基础。
版权声明:
作者:小火箭shadowrocket
链接:https://www.shadowrocket888.org/738.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论