疫情偷走的两年-算法从业者的突围
-
Agent的潜意识
2021-12-31 20:52:51
-
数据库开发技术
-
原创
疫情下,整个生活方式还是发生了很多变化。显著的一点是社交活动少了很多,很多老朋友也不再聚了。多了很多自己的时间。有时候会怀念学生时代,当放寒假时,时光慢了下来,可以整理好一年的心绪,内心没有任何挂碍。悠闲的晒着冬日暖阳,看着《红楼梦》啥的闲书,或者跟家人打打牌,我可以很清楚的知道家里每个角落的物品;而现如今,空闲时间就会写上一整天的代码。内心不得闲,非常焦虑。 有时候觉得喝醉一把中断一些思绪会是很美的享受。10年代的时候,每周五我们会出去鬼混。我跟一个哥们有一次从夕阳西下喝到饭店打烊。后来数了下两个人18瓶啤酒。喝High后,我们一路闲逛,整个人非常relax。小哥摘了朵野花插在耳朵上,我们顺势就进了一家KTV,跟一帮正在搞社区聚会的团队一起K歌,阴差阳错自来熟的认识了很多年轻的学生和当时流行的歌曲。交了不少新朋友。每个人都有鲜活的故事。就像过年回老家的列车上,会跟旁座的车友一路闲聊。大家都特别兴奋,工作辛苦一年终于回家了。有很多新鲜的故事分享,每个人的生活都是一部诗歌。疫情下就不一样了。比如当下火车上,大家都戴着口罩。紧张地期待时光跑过火车。
这两年有时候会一秒emo。生活上有些不顺心是其次。主要是自己一直期待开始下一个阶段没有实现。我期待的生活其实也很简单,能有个每月睡后10万的收入,我招聘一个前端,一个java架构,加上我三个人,我估计都可以把天干翻。如果没有10w,那5w也可以,我高低搞个library,开源出去影响一代AI人。可是找了几家公司,包括蚂蚁都上不了市。梦想破灭的瞬间感觉时光白过了。不过转念一想,人家滴滴的、快手的朋友,也过得不尽如人意。事实上,我从小读书一路走来,到现在有房有车,手上有足够cash能保证有质量的生活,在一线互联网公司做AI,这还是很多学生的梦想。也是我小时期待的生活。这样内心也会淡然些。 跟别人比容易焦虑。活着要开心。开心是一天,不开心也是一天。为啥不开心呢? 若无闲事挂心头,夏有凉风冬有雪,便是人间好时节。祝大家新年快乐。
算法比一般的软件开发有高一些的壁垒和专业度。因此,天花板也要高些。当一个行当你沉淀的越深,你壁垒越高,你不断深挖能挖到更深的水的时候,这是好的行当。而如果一个行业积累10年跟积累2年没有太多区别,你是很容易被替代的。 所有互联网从业者,每个月都要问自己一个问题:你相比半年前的自己有什么质的不一样。你的经验和能力是否是聪明的应届生通过半年努力就能学会的。如果是,就要转变工作内容和方式了。既然你踏上了这个行当,你大可不必转行做java后端。这是对一些由于算法工程师人员过载转行人的忠告。但算法比开发卷是真的。开发你做一个功能就有产出,算法很容易做到一个高度,没法再迭代优化推全拿新收益了。忙活一阵发现没什么产出内心很焦虑。 既然在这么卷的行当中,行业就会不由自主的推着我们向前走。算法是最需要专业度的。所以必须精益求精,跟进时下业界最新潮的算法。让自己专业度更高比寻找好的业务落地场景更重要。比如说某个跨境电商企业,一开始不温不火,一个算法负责人很轻松就可以把搜推广做好拿到不少GMV提升,但当公司发展到一定量后,公司对算法的期待越来越多,他的能力不足以支撑梦想,公司很快高薪请来更专业的算法,慢慢他就被卷出去了。这个是真实的故事。 所以每个人必须提升自己的专业度。把这个当做首要职业发展观。 这几年在关注搜推广。从互联网行业来看,搜推广才是直接对营收负责的第一阵线,CV、NLP更多的是感知器。那就聊聊这个行业的算法进展吧。 搜推广存在很多不同。搜索是用户主动意图的高质量流量,他的评价是如果最短路径解决用户需求;而推荐则很大一个是挖掘用户需求,因而多样性是一个很重要的评价尺度;而广告直接以带来广告消耗为目的,因而如何给广告主带量成为了更重要的评价指标。我们抛开这些差异性。着重从排序甚至精排角度来看这些问题。 如果一个项目还不够卷,你稍加修改动点脑筋从数据入手是很好拿到收益的。数据入手的方式有很多中,比如说数据集构建的方式更合理,例如抽样跟有代表性,时间更有覆盖度,数据清洗更精细化等等;或者说深入理解业务,构建更有表达力的特征,都可以很好的拿到业务结果。或者说debug一下lookup表,特征分分group,特征排序降维清洗等等。但如果一个算法项目已经推全了很多次。再想拿业务结果就必须下真功夫在建模上做文章了。 目前搜推广还能在哪些方面发力拿业务结果呢?我整理了一些算法点。 1)MTL。多任务学习时下是业界主打法了。例如推荐系统,业务既要点击又要转化,还要评论点赞转发,还要停留时长等等。通过多任务学习建模拿收益是一个很好的点。这一块核心优化点是如何让多个任务共享有价值的信号,同时又可以有个性化的信号。同时,对于样本稀疏的任务,如何利用其它任务来辅助排序。 2)debias。我们的互联网排序系统的日志收集其实是有偏的。因为排第一位置的Item跟排第十位的item有着天然的流量差异,把他们放在同一个模型尺度下评价是不公正的。因而把这些bias 消除是很好拿收益的。例如autodibias方法值得把玩。 3)transformer行为序列分析(session推荐)。如果把用户的过往行为当做输入,自监督学习他下一个行为,这就是一个transformer建模的天然场景。这样的方式建模会话推荐、会话搜索是很nature的。这也是当下好拿业务结果收益好方向。 4)图网络。图算法首先在社交网络挖掘上落地。随后在信用风险控制场景拿到结果。随后开始漫卷了整个算法圈。基于时空图的流量预测,基于注意力图的召回算法,甚至可以在CV领域图算法做人体关键节点检测。 目前图算法在搜推广落地,比较好拿收益的点还是在召回上。基于传统的多路召回总归有遗漏的,或者信号提取不准确的,但构建item的图网络,可以通过图卷积将相关items 一网打尽。 5)强化学习。广告算法中一直EE(exploit-explore)问题。一般用bandit算法来做。但随着强化学习的发展,这一块用Agent来做更好。这个业务场景就是,精排模型的后面,最终的流量决策器是一个Agent,他可以一一定概率来走精排模型基于已有样本集取最佳排序,他还可以有一定概率走探索未知的item。两者的rewards是系统长期收益更大。 6)meta-learning。元学习目前已经在很多排序场景中落地了。拿广告算法来说,基于元学习的千人(ad)千模的广告算法,能更多的照顾到不同广告主的感受。拿到更多的业务结果。