且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

更新时间:2022-10-03 19:10:08

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

这是一个高考揣着731分竟没录上北大数学系,转而投奔了计算机直升博一的少年。

这是一个小坎坷不断、大困难没有,却在大淘宝技术实习到“自闭”的青年。

今天聊聊他的故事,聊聊他在大淘宝技术的609天,以及他在学术界和产业界“反复横跳”的收获。

凌晨2点半,刚快乐吃鸡完准备睡觉的测试工程师居凡,收到了师弟小冉的钉钉消息:“师兄,我悟了!

他哭笑不得地拿起手机想要叮嘱他早点睡觉。紧接着,聊天框上一排“对方正在输入”,小冉咣咣咣咣连砸了10个消息过来,有问题描述也有解决方法,还带俩歪歪扭扭的实际模型数据图。

这是2周内居凡第3次收到“我悟了”系列,而就在一周前,这还是个困扰小冉到精神萎靡、茶饭不思的技术难题。他似乎,已经获得了某种突破难题的技巧和规律,并以越来越快的速度实现验证。

  北大顶尖学子,一路顺顺利利“不费劲儿”

冉德智(花名:潇窈)目前是北京大学计算机学院软件工程研究所一年级直博生,跟随谢涛教授从事软件工程相关的研究。去年毕业于北大计算机科学图灵班,成绩排名前三的他,各种荣誉和论文也是盆满钵满。(北大未名学士、CCF优秀大学生、国家奖学金、北京大学计算机科学拔尖计划代表,五篇一作论文等……)

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”


打从高中数学考满分、成绩不费劲、轻松上北大以来,这个典型尖子生的小同学一直顺风顺水。考试、做题、做研究,那些跳跃在纸间的逻辑被他轻易捕捉住,并被条分缕析地钉在了预期的解决空间里。

对于小冉目前感兴趣的移动应用测试方向,博导谢涛老师轻描淡写告诉他:你得去产业第一线,寻找能够具有产业影响力的研究点。

2020年7月31日,杭州,小雨。

小冉兴奋地在阿里巴巴西溪园区外的路口踱来踱去,等着自己的一面面试官&直系师兄居凡来接他。出生在山东的小冉很喜欢下雨天,尤其是南方连绵不绝的小雨。连缀不停的雨珠,从玻璃窗上汩汩滚落,就像是零散的思维被串成了线。他感觉在这样的天气里,总能获得更优质的思考。


北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

“与同龄人相比,他是个思维成熟,做事很有目标感的孩子。”居凡回忆起面试时对小冉的印象。98年的射手座,饱满的理想主义,擅于多维度发散性思考,一进来就给自己前2个月定下了很高的目标。

两星期后,他在大淘宝技术遭遇了一波前所未有的“打击”。

  如何解决一个无法推进的问题?

在北大,小冉的学习生活圈很纯净。早上9点起床,上午喜欢在寝室里写代码和读论文,下午时常在实验室里和师兄弟们开会讨论,晚上八九点去健身房跑3-5公里。喜欢游戏,闲暇时候看看英雄联盟和CSGO的比赛,除此之外,大概很难在北大社团和学生组织活动里看到他的身影。

他的心思也很纯净。就像有的人爱好游戏,有的人爱好小说,作为一个本科期间就连续发表了4篇一作论文的学术***分子,小冉对学术研究有着极高的崇敬和热爱。他自称是“慢热型人格”,对于一个问题,需要花费较长的时间去理解问题空间与解决方案空间,在能够完全理解这个问题之后,才可以快速提出解决方案。

大二下学期,他开始跟着边老师进行计算机网络领域的研究工作。网络领域在学术界是个比较有“年代感的老大哥”,有比较成熟的研究范式和问题,大家关注更多的是某个大系统的实践效果好不好,能不能更好;对于“问题新不新”的前沿价值判断,由于缺乏大范围的实践项目支撑作为背景,普通研究容易陷入空中楼阁,很难做出系统性的开拓工作,自然也很难被学术界认可。一般来说,大家会更倾向于选择主流常规问题,这对于“拿结果”来说是更能期待的事情。

当时边老师给小冉指出3个小的研究方向,其中2个比较稳健的方向只需要对现有工作做出改进,他却对于一个此前未有研究者涉足的方向展现出了极大兴趣。19年那会儿,短视频在中国已经是流行的视频消费方式,然而在视频传输领域尚未有对于短视频的研究。小冉琢磨了很久,依然冲破“新旧”的桎梏,决定探索短视频流传输优化进行建模和改进。

这是一篇有关短视频传输的用户体验质量指标分析文章,他的第一篇paper,麻雀虽小,五脏俱全,他花费了很多时间去理解这个新的时代背景下的问题,并针对性的给出了问题的建模。由于19年时短视频流传输尚未得到学术界的关注,一些审稿人甚至提出了“短视频是什么”的问题,因此被主流评审拒绝了3次,直至短视频在全球流行后才得以发表。在IEEE 云计算大会(IEEE CLOUD2020)上展示完自己的工作后,Session Chair 笑着说,尽管听闻TikTok多次,但这是他第一次真正知道短视频的形态是什么样子。此后的几篇文章,小冉围绕短视频流传输与推荐的协同优化,短视频平台下最优广告机制设计等问题进行了定义,并提出了解决方案。投发论文最强烈的快乐并不来自于论文被收录的本身,而是横亘于【理解问题和创新问题】并孤身发现新大陆的过程,这正是小冉不断出挑于同龄人的关键所在。同时,这也逐步奠定了小冉的研究风格,在此后的研究中,他始终关心那些在产业中真实存在的问题,并运用自己擅长的算法和技术进行建模和解决。

整个2020年8月到2021年6月,正是大淘宝技术质量团队对于【基于视觉的智能化测试】问题的攻坚期。小冉是近乎以一张白纸的状态加入的,此前研究计算机网络的他实际没有任何软件工程和软件测试的背景,甚至已经过时了几十年的基础概念都不清楚含义,更没有产业界的实际项目经验。“那时基本就是,从名词解释开始学起,在实践中吸收软件工程本科生在基础课程中就学到的概念。”

即便如此,他依旧以饱满的热情投入到学习和研究中,在边做边学的过程中实现了工具原型,并如期迎来自己的第一个打击——在小数据集上表现极好的模型使用淘宝实际数据运行时,整个系统都崩了。

这和小冉过往遇到的困难不一样:回溯流程和思路没有任何问题,但是结果完全不符合预期。

师兄居凡回忆起当时的小冉,“看得出来受打击了,自己给自己的压力很大。他眼睛本身有点不好,情绪压力大时就红红的。”

按照此前选定的思路,这个难题基本是无法推进的状态了,小冉连打开b站看自己喜欢的up都有点索然无味,以往能一天睡10小时以上的他,清晨也会早早醒来。他陷入一种无论在做什么吃什么,头顶都自带一朵乌云的 sad 状态。

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

打从进公司,小冉就发现师兄和自己有很多相似的经历:都是山东人,都是北大的,都是搞工程的转测试方向,都喜欢过学姐……同样,面对一个无法推进的难题,师兄也有过来人的经验。

在居凡的耐心沟通辅助下,小冉的【理解问题分析法】有了2.0版的提升。

“如果一个问题没有遇到任何困难,说明价值不大。如果一个问题走了很久也没通,有可能就是走不通的,强行硬碰硬意义也不大。我现在的反思分成2步,第一步思考问题空间时,要考虑是不是真实应该去解决的问题,第二步思考解决方案空间,面对难题要尝试把大问题拆解成小问题,从小的价值开始做,慢慢串起来总能找到突破口。”

下午三四点,想到头秃的小冉徘徊在西溪园区湖心的实木栈道上,盯着水里穿行的小鱼苗,意识到自己“完全基于深度强化学习的视觉测试”的目标本身就是一个“假”问题,尽管在研究上它足够重要。在整个淘宝量级上,也很难有足够的数据进行训练。即使在小数据集上模型在理论上拟合的很好,但是随着规模增大,就像是吹气球,越吹越大,在数据量级最终引起质变时,气球一定会被吹爆。

想明白了这点,小冉又重新开始亢奋起来。

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

  还不够,真正的产业界不是这样“玩”的

回想当年,小冉的第一填报志向其实是数学系,机缘巧合被录取到了计算机科学图灵班。即便如此,第一学期过后,揣着满分数分试卷,小冉找到已经年过花甲的谭老师,表示自己想转数学。

老人家劝诫他考数学和做数学是两码事彼时,小冉默默想了想手拿馒头矿泉水接受采访的“韦神”,轻松以满分摘得IMO金牌,又想到自己拿着731分总分成绩进北大的他,也没录上数学系......再想想自己是一个喜欢看到明确收益价值的正反馈青年,他放弃了转系,决定再“爱”计算机一次。

考试和研究是两回事,研究和实践也是两回事。

于1月14日 被ICSE 2022接收的这篇Automated Visual Testing in an Industrial Setting,是小冉与大淘宝技术质量团队同事们的阶段性成果,也是以小冉为代表的“学术范儿”和以居凡为代表的“工业范儿”争论最激烈的时候。

小冉回忆,从端到端的全覆盖,到传统方法和深度学习的融合,再到大数据集的调试和实验,这样一套首创的融合性的深度学习的自动化视觉测试方案,他们经历了“否定之否定”的螺旋,90天,6次深度会议讨论,无数次茶余饭后的battle,密密麻麻的钉钉消息记录……

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

通过一系列数据调试,小冉用理论数据可以在这套自研工具方法里达到相当高的覆盖率和准确率,也能让论文结果十分漂亮,以充分证明这套融合方法的有效性。

师兄居凡感觉头大,“我们正是因为拿不到这样理想的数据,才需要这套方案工具去帮我们解决人力成本的问题。”假设淘宝APP背后是这样一套理想化数值,无论表面多精巧都是一个假象,当一个产品需求变化的时候,80%就无法用了。

在一系列争论中,小冉最终放弃了高数值的结果模型,这是小冉在北大做研究时未曾经历过的“多棱镜”,也从更加宽厚的角度,重新尊重和理解学术的成果。产研结合的最终目的,依然是有助于业务的实际收益。评判的维度甚至不止收益,还有资源调配与投入的合理性,规模化复制的可能性等等。而正是因为业界复杂的因素影响,更能反过来推动学术和技术的创新。

这篇论文最终在 ICSE 2022拿到了很强的分数(得分4 4 3,满分为4分),这项工作也获得了2021年软件质量效能大会QECON大会上海站十佳项目。小冉本人作为一个在校生,也拿到了阿里巴巴集团“2020年度优秀实习生”,以及“2021年度优秀学术合作实习生”,并获得了和阿里巴巴合伙人、集团首席技术官程立(鲁肃)面对面的交流机会。

交流会上,鲁肃提到自己当年第一次在阿里实习时,想把学术界最新最炫的架构引入支付宝,做了一半发现,真实的生产场景过于复杂,最后还是改变想法使用了不那么炫、却相对更加可靠成熟的架构。小冉暗自拍腿共鸣:看来软件系统的研究在产业落地都会遇到类似的情景,真理和规律果然经得起时间检验。

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

鲁肃告诉小冉,每次他最担心的就是软件质量和软件测试,因为软件测试非常耗费人力和资源,同时测试的自动化这个问题也很难做,能够有进展是很不容易的。小冉的研究项目为业界探索了自动化测试的新思路,形式化方法,软件测试的学术工具能够落地到工业场景,真的很棒。

会后采访的录制镜头前,小冉一如既往地低调和谦虚“没有,一般,还行”,急的师兄一边拍大腿:这种时候孩子可不能摆烂啊!要替我们宣传呀!>_<

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

这是小冉的第一份业界实习工作,一个在98er眼里的“大龄”团队竟远比他想象的更加有创造力。“我来之前觉得这么大的淘宝,技术肯定是更加重视稳定性的,没想到师兄师姐们真的很能折腾,在探索的方向都很前沿。”

除了工作折腾,团队生活也“折腾”。依然是一群“大龄”的团队,团建毫不服输要选爬山这种项目,保留节目必须选唱歌,“师兄花名居凡,很喜欢唱《平凡之路》。每次都要怀着饱满的感情唱两三遍,就没有技巧全是感情。”


  “我理解的***是,在对社会有益的前提下,能做自己喜欢的事情”


“别整天窝在实验室,多去北大图书馆逛逛。图书馆女孩子们可漂亮了。”“以后送礼物送口红最保险,像是什么999之类的。香水不行,味型不对容易踩雷。”

同样是北大毕业的师兄居凡,实实在在操着一把老父亲的心。

做研究其实是比工作更忙碌的事情,工作还有上下班,research 仿佛永无止境。小冉目前还不太适应读博士的节奏,因为他发现事情永远都做不完。唯一的好处是,这竟然能够反向治疗“拖延症”:因为问题做不完,永远在挨个处理下去,就不存在拖延的事实了。

他曾经在高二的暑假,每天花10个小时阅读,啃下了普鲁斯特的《追忆似水年华》。这是本长期占据“买了来读不下去的书”榜单前三甲的书,甚至被戏称为“判了无期徒刑的犯人比较容易读完”。17岁的小冉原本是怀着向同学们装x炫耀的心态展开它,却第一次被另一人的人生记忆和庄严的时间规律深深触碰到。“时间的流动是没法阻止的,因此更加想让自己有意义地成长,不枉这一生。”

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

他不是一个只会死读书的呆子,而是更能清晰地厘定自己各个阶段的首要目标。恋爱随缘,娱乐从简,他正处于一个飞速成长和吸纳知识的时刻。“互联网更新变化快,研究热点也始终在变,但是做研究的思路大同小异。我想要修炼这份核心竞争力,这样以后总能在新的场景下找到发力点。”

他也不是一个天生的骨骼惊奇的学习分子。小冉抱着学术研究的心态打开某音,一个不小心被推荐的好玩段子击中,2个月内刷了三四千条视频……回看数据报告时吓得他赶忙卸载,人的成长期一定需要更多的理性和克制来对抗本性,始于立心,成于勤勉。

2022年3月30日,今天,是小冉在大淘宝技术的last day了。
北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

回望在大淘宝技术实习的1年多时间,小冉非常感慨自己在工程思维培养和交流协作能力上的提升,尤其是能够在产业第一线展开产研结合的学术研究,它给了小冉最大限度的资源和***,也给了他可贵的机会和竞争壁垒。

他的内心依然深爱数学,他明白一些具体数学问题很难解释,但更难解释的是问题的意义。

谈到***,小冉觉得有点抽象。“我目前阶段理解的***是,在对社会有益的前提下,能做自己喜欢的事情。”未来,他希望能够从事计算机研究性的工作,倾向于研究那些有着明确收益价值的问题,比如说做1篇10年内都有影响力的论文,做1个实用的工具,解决某个范围下的1个业务问题,创造某个解决问题的新方法等等,能够用自己一点点力量,带来可期的变化。

岁月因青春慨然以赴,而更加美好;世间因少年挺身向前,而更加瑰丽。

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”

北大直博生在大淘宝的609天:“我发现了学术界和产业界的小秘密。”  后记

ICSE 2022论文解读预告——

由大淘宝技术质量团队与北京大学谢涛教授团队合作,小冉的这篇Automated Visual Testing in an Industrial Setting,即将在4月份公开。

Paper主要分享了我们研发和部署基于视觉的自动化测试工具VTest的经验,届时我们将带来一篇深度的论文解读文章,并附上paper的公开阅读链接,敬请期待!


  团队介绍


大淘宝技术质量团队,负责保障整个淘宝和天猫主站的业务质量,一直致力于技术驱动,构建业界领先的质量体系。

我们有QCon、QECon、MTSC、GIAC、绿盟、TOP100 Summit等众多行业大会的讲师,有GitHub获得3.2k Star的开源产品JVM-Sandbox作者,最关键的是有对技术极致追求,对生活充满热爱的大家庭,欢迎加入我们。