Motivation & Contribution
1.给出一种时长预估任务上较为完备的 framework formulation: CREAD
2.分析了离散化分桶过程中的误差来源, 认为两种误差不能同时减小
3.提出一个观看时长预估分类任务中的自适应分桶的框架
Challenges of Discretization 分桶离散化的关键挑战
1.离散化的操作引入了两种误差:
(i). Learning Error 学习误差. 什么是”学习误差”? 因采用更多的分桶导致的样本数量有限导致的单个分桶效果的天花板; 如果我们增加分桶数 $M$ , 会导致每个分桶内的样本就会减少, 限制了分类性能
(ii). Restoration Error 恢复误差: 这种恢复方式省略了每个桶的详细的概率密度, 会引入误差
值得思考的是, 上述两种误差不能同时减小
EAD
等距分桶
等频分桶
合并为
2.CREAD 的缩写是 Classification-Restoration framework with Error-Adaptive-Discretization
Reference
[1]. CREAD: A Classification-Restoration Framework with Error Adaptive Discretization for Watch Time Prediction in Video Recommender Systems.
[2]. https://zhuanlan.zhihu.com/p/675844142
转载请注明来源, from goldandrabbit.github.io