2020 Annual Summary

Rethinking

Created At : 2020-12-31 23:11

Count:4.4k Comment:

年度关键词

Embrace long-termism

工作内容: 导购转化预估模型 & 面向大促的预估模型优化

Guide Purchase CVR Prediction

1.导购场景 CVR 预估的意义. CVR 模型在排序阶段会将全用户平均意义上发生转化可能性最高的物料排序, 而不是对于某个用户来说某个实时性兴趣的一种. 放眼整个系统中去看CVR预估的角色.

2.CTR 是 CVR 的一种基础保证. 在导购或者以内容为主的场景的一道基础保证, 如果缺少 CTR 或者其他相关性保证机制, 那么提升转化无从谈起.

3.转化只是一种结果, 而用户的体感却是方方面面的. CVR 模型上线之后, 可能线上会有直接的提升, 但是还需要辅助改进一些用户体验上的策略. 比如很多高 CVR 的商品其实都是十分低价的, 仔细想想, 这是我们场景现阶段所需要的吗? 简而言之, 提升场景效果实则不难; 改善用户体验确实长久需要做的事情.

1111 TLJ Delay FeedBack & Presale

1.大促时期是用户兴趣得到充分释放的购物时间区间, 我们需要把整个场景优化目标放眼到整个大促周期, 从”预热期”=>”预售期”=>”爆发期”三个阶段存在一定的相对独立性, 因此建模需要具备时间全局意识, 让每个时期的特点更鲜明的凸显出来, 就是算法核心的目标

(i). 预售: 种草商品的集中体现, 商品的成交笔单价有显著的爆发, 尤其在大家电/电子设备/鞋类/高价美妆类目, 这些商品的折扣额度在这个时期内是”全年最低”, 因此推荐结果一定要从充分打满商品品牌和档次, 通过提升客单价的路径来契合用户的种草以久带来的爆发.
(ii). 爆发: 爆发期相对来说混合了较多的因素, 包括平台最后时刻释放的临时红包, 活动以及很多场外因素(比如晚会临时带来的冲动行消费), 在爆发期具备时间短, 行为密集而丰富的主要特点, 因此这里我的设计原则是基于重定向的思路召回, 重点关注实时性需求的召回, 模型复杂度要求反而可能不需要太高. 在效果实施上有一个注意点在于一定要锁定爆发期的开始时间, 在流量迎来峰值的时候具备稳妥的变更方案, 保证线上稳定的过渡.
(iii). 预热: 相对于以上两个时期, 用户剁手心智会极度热化, 因此需要将推荐结果和以上两类行为进行显式的区分, 具体的形式需要结合产品的形式来确定, 以抽奖, 做任务的形式来看, 需要结合相应的权益形式或者营销形式制定算法方案.

技术总结

Deep-Rank

1.完成总结 feature interaction 模型的相关体系, 并且用 tf.estimator 结合 functional api 实现. deep ctr 边际效应递减. 但对于一个推荐系统来说, deep model 只能影响到排序的一个因素, 在大流量场景可能比较明显. 但在很多时候 deep ctr 模型边际效应较小且递减明显. 尤其在小流量没有形成业务闭环的场景, 突破重点更需要一种产品或者运营的思维去看待, 简而言之, 快刀斩乱麻当断则断, 投入到边际效应更大的目标上, 带着 ROI 去推进目标.

Match/MTL/Graph

1.加深 item-cf 理解. 在梳理和落地一些 match 方法并且看了大量的 bad case 之后, 尤其加深了 item-cf 这种方法的理解, 虽然现在进入深度召回时代, 但能够彻底地 item-cf 的理解我认为是提升对推荐系统理解相当有效的路径, 宏观来看, 方法本身没有对错高低之分, 关键还是在于用方法的人.

2.Graph. Graph从一开始就为我们建立起来一种理解数据的视角, 这点当然也是 follow 学术界的一个正常反应.但从目前的落地的情况来, 可能还是定位于一种锦上添花的位置, 并非一种可以拿来即用的屠龙之术. 因为实际业务使用图学习的场景是动态且复杂的. 例如图的实时更新, 选择怎样的几组关系来进行抽象, 工程师需要经过比较高的迭代成本去迭代和试错. 个人感觉ROI不一定很高. 希望在 2021 有更多能够提升落地层次的技术应用出现.

工作方法论

搭建体系

搭建体系是今年方法论上的最重要的认识改变, 一个体系可以是工作或者生活中的任意一个内容, 先不用考虑太复杂的细节, 明确主要做的 3-4 个方面.
1.比如从推荐系统的技术角度来看, 首先有一个大的 pipeline 体系, 分为物料/召回/排序/策略, 每个部分由可单独拆分一个体系去展开来优化
2.扩大到对于一个产品的视角, 比如对于某个 tk 产品来说用户增长/导购属性/工具属性, 可能是重点的三个发展的体系

质量保证体系

建立一种不以人的意志为依赖的质量保证体系. 简单来说分为两部分.
1.重点项目指定唯一负责 PM, PM 全局精通, 对所有问题负责
2.维护 checklist, 跟进 checklist 在项目迭代周期内所有的状态.

2021年工作/学习需要改进/深入的点

站出来, 往前冲. 在工作中, 仍然需要具备更强的owner意识, 这种意识2020年有一定提升, 但是还不够. 需要更主动的承担对问题把握.

插一句, 再插一句. 在开会讨论/团队讨论中, 需要更多发表对问题的见解, 在2021年尤其需要关注的是同伴的工作, 同事的工作, 和自己kpi无关的一些内容, 大胆质疑和挑战, 提供自己的见解, 不怕在意的眼光. 只要自己不尴尬, 尴尬的就不是自己.

Serving服务待打通. 由于ali基建和造轮子的能力, 日常工作中对于技术的底层原理往往是不求甚解, 会用就行. 在 2021 年需要对底层技术提出更深入的要求；从目标来看需要建设好如何把推荐系统从打通数据闭环到提供线上稳定 Serving 的 pipeline.

年度宏观思考

用至少30%感性决策
至少用 30% 的感性做关键决策: 大胆地用感性来决策. 世界上大多数东西看起来似乎都是能被量化继而决策的, 尤其是对算法工程师或者数据从业者而言. 我们总是遵循这种模式数据反应 A 群体具备 B 占比的 C 行为特点, 因此我们针对 C 采用方案 D 指导 A, 这种模式听起来是没什么错误的, 但是现实中很多问题并不是通过历史统计, 或着某一种分析框架下就能解决的. 例如

(i). 2020 武汉封城. cov19 是新病毒历史上从来没有出现过, 当时谁也没有有效的治疗手段, 也不知道扩散速度和这种病的致病因子到底是什么. 每个人都在一种恐慌的情绪下, 那么问题来了?如何应对? 如果按照上述模式, 简单来说: 完全没有 ABC 的定义, 请出台方案D. 但是大胆选择了封城, 全员戴口罩, 严查出入, 健康码, 钉钉上课这样的一些列手段, 事实证明是非常正确的, 那么深入想想有个问题, 当时你100%充分的理由去解决该问题吗? 我认为没有, 因为上述决策, 并不完全是现有的, 可以拿来就用的方案, 而是我们根据一种相对模糊的经验, 一种并不能完全看清全局的判断做出的决定.
(ii). 抗美援朝战争. 不同于抗日战争. 对手是美国人, 且作战的主场在朝鲜. 美国并没有深入的打到你的领土上, 我们也没有和美国人在战场上证明打过, 美国兵是可以战胜的吗?他们的武器那么先进经过二战洗礼, 海陆空配合一体, 我们能打得过吗?有多少胜算? 输了怎么办? ROI 如何. 当时的领导人我认为也无法在做完决策时之前就说出答案. 上述这些考虑在当时的情况下是不可能完全看清的. 但仍然选择了义无反顾的抗美援朝, 保家卫国. 事实证明又一次采取了正确的选择.
(iii). 选择学校和工作. 从以往的经历来看, 我在选择学校和工作时理由往往是十分充分的, 能列出很多理由说服自己为什么选择 bupt 和 alimama, 但事实上很多选择的坑在当时是看不出来的, 也是不可能看出来的, 只是在我当时视野下找到一个局部最优, 而不是全局最优

结论: 在今后的决策中, 我打算放弃类似全盘理性（其实根本做不到, 因为好多变量你无法提前计算）, 而是采取至少 30% 感性的方式去做关键决策.也叫[有限理性] 说起来这个思想有点类似于 dropout, 我为了拟合一个确定的目标, 在我已有的样本上疯狂的降低 loss, 也只是在你那已有的样本上做这件事情, 不妨想想样本真的够吗? 样本质量真的够吗? 样本多样性真的够吗?

对等价值量化与长期主义

懂得对等价值才会影响做事的方式

平时周末花 200 元去吃火锅. 假如以余额宝这种货币基金 2.5% 平均年化计算, 需要 10k 存一年才能达到. 这个钱允许被我花掉, 但是也得想清楚, 这同时意味着用多少钱在别人的手里保存, 承担一定的风险才能达到同等的收益.

12 月份我用了前 3 周, 每周跑量平均 20km, 体重基本上稳定下降了 1kg, 60km 的跑量虽然也算不上太多, 但是相比这个 1kg, 却是一种对等的概念. 同时每次跑 6-8km 的热量, 等同于也就是一个汉堡王天椒皇堡的概念. 但为了消耗这一个汉堡, 我得在跑步机上用 45-55min 时间对抗无聊感. 即使目前我对跑步这项运动非常有兴趣, 但是仍然这个时间是需要用毅力支撑并非全盘享受的.

长期主义

1.量化一种时间价值. 2020 另一个思考是通过学习货币金融学课程非常详细的理解了利率, 复利等金融概念, 这些概念其实在日常生活中也是经常听, 但是并没有把这种概念变成自己做事, 长期做事的一种日常化的态度和本能行为动机. 在 2021 年, 需要将长期主义这种态度融入到日常的工作, 理财和做事当中去. 包括但不限于以下几个方面
2.推荐系统技术打通. 推荐系统从小里面说可以实现一个几十行的cf也是, 但是到一个成熟的工业级推荐系统需要非常完善的技术体系和质量保证体系. 比如数据生产, 实时特征和实时样本, 多维度评价体系, 复杂模型线上Serving, 实时监控以及效果保证.
3.长期跑步. 2020 年 5 月, 跑奥森南远跑了 2.3km 已经完全跑不动了; 9月份开始重启跑步, 10月份42分钟完成南园5km, 12月初 36min 完成北园 5km, 12 月底 1h34min 完成了南北 10 km (状态不佳实际速度比这个快), 等到 2021 年 12 月 31 日, 我想看看自己能达到怎样的水平.

Blog & Github. 作为技术人, 对于技术的积累和业务的思考是一直有的，通过Blog和Github将所有的东西归纳在一起, 回过头来看自己还是很有意义. 今年完成了初步的搭建和主要的体系梳理, 2021年需要在重点方向上深入, 养成长期总结和汇总的好习惯.

另一种获得成功的价值认同方式: 时间>=距离>=效率

Hiit. 因为疫情影响, 年初一个人在家办公经历了太孤独的一段时间, 商店不开门, 门口超市都不太敢进去. 尝试了下 Hiit L3 难度的站立挑战, 发现全套动作认真做起来还是真不容易. 但是 Hiit 对于场地完全没有要求, 燃脂效率也非常高, 是一项值得长期做的运动. 并且发现了一种适合自己的方法, 以 L3 站立挑战来说, 1 组13min保证 100% 完成效果远远不如重复做 2 组每组 80% 的效果好.

ASICS. 入坑跑步, 有一次跑完之后发现脚疼, 缓了 1 个多星期才恢复. 于是狠下心来买了价值 1390 不打折的ASICS kayano 27 于是狠下心来买了价值 1390 不打折的ASICS KAYANO 27. 品牌名来自拉丁语格言”anima sana in corpore sano”的首字母缩写, 意为健全的精神寓于强健的体魄, 这种理念随着年龄增长我是越来越认同的. 我是不相信一个男性没有野性, 没有粗犷的体魄 (至少认同这种体魄的价值) 只靠着聪明的大脑能够干出丰功伟绩. 尤其是看了广马施一公首次完赛, 以及日本本土马拉松惊人的水平, 决定向优秀的日本跑者看齐.

智者务其实, 愚者图虚名

这句话是新三国中司马懿的一段话, 新版三国我最佩服的还是司马懿, 孔明在三国演义中是顶峰存在，但是仍然在关键时候存在过于谨慎的特点, 比如子午谷不敢出兵, 司马懿策略层面略逊于孔明，但是在宏观韬略上面却要胜出孔明一筹.

足球

拜仁8-2巴萨

光环掩盖问题. 看球以来可能是最让人难受的一场结局, 刚得知新闻一瞬间感觉梅西真应该去年踢完欧冠就退役. 但仔细想想, 还是由于巴萨本身实力不足, 加上梅西个人具有光环的表现使得整个团队看起来是成功的团队, 掩盖了过多的问题.

三个投资, 一个成功. 从拜仁的成功来看, 有一个因素是青年人才快速崛起, 印象比较深的阿方索戴维斯, 格雷茨卡, 格纳布里, 似乎三条线上都有了非常强的人才补强. 反观巴萨和皇马就不尽如人意了, 不过巴萨皇马真的是前几年没有布局吗?我认为绝对不是, 巴萨皇马在15年之后都有非常充分的人才培养, 每个年轻球员至少是在当时是绝对看起来充满潜力的. 但是为什么失败呢?我认为这涉及到了足球的一点本质: 球员还是会归结于一种投资, 这种投资本身是带有失败的概率. 只不过在很多因素作用下这种失败或者说不成功没有被放大凸显出来, 欧冠拜仁巴萨这场将这种失败完全地放大了. 因此足球本质上还是一笔非常难做的生意.