亚马逊资深首席科学家李沐:工作这五年

自CMU机器学习博士毕业至今,亚马逊资深首席科学家李沐的业界之路已经走过了五年空儿。期间,李沐博士对技巧、产物、管理、升职加薪等工作中的方方面面都有了更深的感悟。「专一于最有代价的工作」是他对过往五年工作历程的最好总结。

五年前的今天我飞往西雅图参加亚马逊的面试。面试完后连夜做红眼航班飞往波士顿赶去参加老婆在 MIT 的博士答辩。答辩一半的时候电话响了,对方说恭喜你面试通过,想聊下薪水。我说其实就面了你们一家,直接给就是,先挂了。答辩完第二天跟老婆去市政局登记结婚。在宣誓厅门口排队的时候,老板打电话过来,很兴奋的说你来了后可以做这个做那个。我说是挺好的,但先要结婚去了。老板一愣,道了一声恭喜,继续往下说。我不得不打断:得先走了,轮到我们进去宣誓了。五年一眨眼就过去了。外面来看最大的变化是多了两个娃。但最大的变化来自认知,是人生观、世界观、代价观的改变。博士毕业的时候曾写过我的体会博士这五年。

博士这五年:https://zhuanlan.zhihu.com/p/25099638

很多同学留言说深受鼓舞。现在我想同样给人人分享这五年工作中的经验和感悟。更确切说是失败的教训,因为每一点就是付出了学费后获得的教训。希望这些同样能对人人有所赞助和启发。工作的代价是对社会的代价读书的时候,你会有明确的目标,例如考试的分数、深造的学校、或找到好工作。工作后的最大分歧是你有太多可以最求的目标。这个带来的改变是你需求决定哪些工作现在做,哪些以后做,哪些可以不去做。决定优先级应该是根据工作的代价。我现在评估一件事的代价是它对社会的代价,用公式来写就是 

受害人数 x 人均空儿 x 单位空儿代价差

这里能从一件工作受害的人数,和受害的人均空儿是这件事本身属性。第三项取决于你对这件事完成的好坏,就是你做得比他人做的类似的工作要好,从而受害人从你这里受害比从他人那里多。这个公式可以用在各种分歧的工作上,接下来我们会不断使用它。这里先举几个例子。例如伟大的产物一般具有极高的代价。拿微信来说,它是手机通讯软件,面向几十亿手机用户,每人每天会使用数小时,所以它代价的前两项非常大。因为微信用户体验很好,它比其它替代品的用户体验好给用户带来的代价就是代价差。所以微信是一个非常有代价的产物。举个小点的例子,例如你带人写一篇论文。论文影响的人数就是这个研究领域的大小;作用空儿是他人做一个跟你工作相关的研究所花的空儿,能够一辈子就几个月;代价差则是你的研究相在前人工作之上的进献。这样看来,你需求做热门领域和跨时代论文才能取到高代价。但我们知道一篇论文一般进献不大、也就几个人会读,所以算下来基本没什么代价,为什么人人还是会积极 “灌水” 呢?这里我们还要细看两个代价:一是你通过这个研究熟悉了一个新领域或者新方法,对你个人有学习代价。二是你带人做研究能晋升他们在想方法、做实验、和写论文上能力,对他们代价很大。所以即使是知名研究者,名字也会出现在很多新手习作一样的论文上面。再举一个更小的例子。过去四年里我花在带娃上的空儿比工作多。在相当一段空儿内都觉得事业被娃耽搁了。直到后来我用这个公式来算:虽然人数只是两个人,但受害空儿相当高,一周五十小时以上。而且父亲就一个,有我陪和没我陪对小孩来说区别巨大(自我感觉),所以代价公式的后两项很高。此外,带娃对我个人也有代价,包括如何去理解思维方式完全不一样的他人,以及时刻跟自己想暴怒的冲动做斗争,最终达到佛性的状态。这样算下来心里就顺了服务社会最后也是服务自己上面这个代价公式强调的是工作对他人的进献。在用它之前,我的代价公式更关注自己。例如我常用一件工作的好玩程度,或者里面的技巧含量来划分优先度。问题是虽然享受做工作这个过程,但之后的成就感不高。有点类似打完游戏后的空虚。因为做完后经常发现,这个虽然酷炫但没什么用,没多少人理睬。原因是对个人的有直接高代价的工作,对他人代价不一定大。很有能够这件工作本身只对很小群人有意义,能够每个人受害空儿短,或者其实是重复造轮子,市面上已经有了差不多的替代品。如果优化对社会的代价,你会得到对自己的延后回报。这个回报包括了你知道做这个工作对他人有用时带来的更高层次的内心满足,以及他人从你这里受害时给与的馈赠(给你点赞、或者老板给你升职加薪)。当然,这两者不一定同时出现。很多时候你创造的代价不一定被他人关注(数十年维护那些人人用起来习以为常的开源工具包),也有时候人人会夸大吹捧你的进献。你应该积极寻求他人的肯定,这会给你更多的资本做更大工作。但你应该更体贴内心的满足,因为更可控、不容易别他人误导。更多是它会给你内在动力去把工作做得更好,这是你能不断成长的根基。技巧最终是为产物服务技巧专业的同学刚进入公司平时会继续做技巧。刚毕业那会儿我觉得进入大公司就是做技巧,成为世界上最好的技巧专家之一。而且不要做产物,因为如果做产物的话我为什么不自己创业呢,赚的钱还是自己的。后半句没什么问题,但前半句忽略了技巧最终是为产物服务这一事实。虽然因为公司的分歧,对技巧进入产物的预期空儿会分歧,但平时在半年到五年之间。预期是超过五年的公司屈指可数,而且大多已经作古。所以就算你在公司的研究部门,也应该知道公司对于技巧落地空儿的预期。否则空儿一到就会面临公司削减不达预期的技巧的投资。最坏情况是你们上新闻了:某某公司研究院院长离职,部门成员各奔东西。那么什么样的技巧能进产物?平时你会根据公司现有的产物有个大致的想法。接下来你要知道这个产物的主要代价是什么(套用之前的公式)。然后你需求去琢磨你做的技巧对这个产物的代价。如果你的技巧能晋升产物的核心功能,哪怕是一点点,也会得到资本来落地技巧。例如晋升微信的视频压缩技巧、今日头条的推荐算法、苹果的外壳材料。反过来,如果没有抓住主干,例如微信装皮肤、今日头条网页版加速,苹果操作系统兼容其他硬件。就算你可以做到比现有技巧晋升很多,产物团队也能够没动力帮你,甚至一开始就告诉你别做这个。所以不管你是在产物团队做技巧,还是在公司研究院,都应该对产物的代价有所了解。例如深入理解产物经理的口头禅:市场、刚需、痛点、高频。同时也应该知道你手上的技巧对产物的代价,用它来指导你对技巧路线的规划。不想当将军的士兵不是好士兵人的满足感来自于对比,不管是对比他人还是对比自己过去。这个欲望驱动你去追求有更大代价的工作。这意味着你需求更多资本去做大做强。最起码的是你需求一个团队。你能够是这个团队的管理者、领导者、或者兼任两者。也许你更喜欢一个人做技巧,至少我一开始是这么想的。但随着你的能力的增长,他人对你的责任的期望也越大,你不可避免得去带一个团队。否则你得去其他地方找满足感。与其别动的被推到了这个位置,不如一开始就做好准备。这里有大量的职场书籍可以参考。我自己的经验很简单:领导者是带路者,需求有好眼光。管理者是后勤官,让团队执行高效。下面分别解释这两点。放眼在三年以后领导者最重要的是在带着团队探索未知领域时找出正确的方向。也就是说保证你们做的产物或技巧是有代价的。因为做一件事需求空儿,所以你得预判工作在未来的代价。如果判断不准,人人辛苦做了很久,做完后发现效果一般,那么团队士气就会低下。各种问题就会接踵而来。你去想一件工作未来的代价时,空儿不要太短也不要太长,三年比较合适。假设你想继续沿着现在的方向走,那么需求考虑三年后你关注的用户群和使用空儿是不是会发生变化。变多是好事,不变表示你做不了太大,但如果会变少,你得考虑要转向了。你还需求警惕新技巧的出现,很能够新的技巧会短短几年就完全推翻旧技巧(深度学习、智能手机、电动车)。分析那些失败的例子,当事人其实很早就察觉到了新技巧,但低估了它的能量。他们只看到了新技巧比现有成熟技巧的不足,然后套用成熟技巧的发展速度在新技巧上,低估了三年后新技巧能到达的高度,和用户喜新厌旧的程度。如果你要做一个新的方向,那你能够不再有技巧积累优势,就是跟他人比你给用户带来的代价差能够不明显,甚至更低。那么你需求找到好赛道(投资人口头禅),平时是颠覆性的新技巧,以及随之带来产物和用户的变化。只有在快速变化的赛道上,新入局者才更容易通过更准确的预测未来的代价来弯道超车。也就是乱世出英雄。好的眼光需求一个长期的训练。你需求不断的去做深入思考,获得自己独特的观点,而不是靠朋友圈里人人的高见。所以你需求时不时放下手头的工作,给自己空出空儿做深入思考。例如我会时不时去家附近的 Bay Trail 走上几个小时,边走边想。亚马逊资深首席科学家李沐:工作这五年管理的核心是诚心待人如果你有一个明确的团队目标,和一个高质量的团队,高效执行是水到渠成的工作。所以管理者有三个核心工作:招人、留住厉害的成员、和赞助落后的。招人最理想是招比自己厉害的人。另外是每次招的人都比同级别的一半人厉害,这样能保证团队扩张时能不断晋升团队质量。能力突出的成员在哪里都会受欢迎。你的一个任务是让他们能尽能够长的留在团队里(虽然最终是要走的)。一个办法是把自己放在他们的位置,想象你想你的领导如何待你。例如我自己最希望的是不断做有更大代价的工作(成就感),并从中学到新东西(个人晋升)。在我困难时候老板能给与支持(经常发生)。其他的都可以换算成当前待遇,例如可以多少空儿做不喜欢的工作(不赞同一件事的代价,但又没能说服他人不做)、上下班路上很堵、食堂没中餐。所以大方向上是创造轻松的环境、每年能新立项有代价的项目、和尽量给人人争取待遇。对于绩效不理想的队员,你需求经常性的指出问题并给予建议,如果一段空儿没改进则需求讨论是不是当前项目不合适。如果仍然无进展的话,那只能赞助他们换组,或者要求他们离开。同样,你需求把自己代入对方的位置,明白想得到什么样的赞助和尊重。绝大部分时候,不是他们人不行,只是你们不合适。愉快的分手能让前成员更快的找到更合适的地位(从而避免他们给你寄刀片)。专一!专一!有人说创业公司一个常见死因是在有了一定成绩后盲目扩张。这个在哪里都成立。不管你是一个人,带一个团队,还是领导一家公司,资本总是有限。集中资本在最有代价的工作才能保证成功。例如苹果好几十万人,但对于产物线的扩张上非常谨慎。从而能保证每一款产物都砸上足够多资本来颠覆市场。在初期你也许可以广撒网多捕鱼,一旦工作的代价慢慢清晰,我们需求逐步集中资本。因为同时把做几件类似的工作最好,不如只把一件工作做到极致、做到市面上最好。这样你总是可以得到正的代价差。一个第一比十个第二好,第三平时都活不长。同样的道理也可以用在生活、社交、和学习上。只要投入力气,短板可以变成优势 以前每次发布 MXNet 的新特性时,知乎同学都是吐槽:回去写好文档先。人人都知道程序员不喜欢写文档。我从小语文和英语都是在及格线徘徊,更是心有抵触。17 年的时候痛下决心来写文档,我把我所有留下做技巧的空儿都花在上面,最后跟人人一起写出了《动手学深度学习》这本教科书,现在被全世界近 200 所大学采用做教材。所以,你的不足能成为你的机会。只要你直面它,狠下心来花力气,不断去改进,你的短板会变成优势。扬长避短所有命运的馈赠,都在暗中标好了价格。当我把精力都花在文档上时,便忽略了 MXNet 本身。没能组织投入大量资本去持续晋升它的性能和易用性,导致它没能做到前二。从代价上来说,《动手学深度学习》和 MXNet 在用户数和用户代价上差不多,但用户使用深度学习框架空儿多于读教材,所以 MXNet 代价更大。在不擅长的领域花费了大力气打赢一仗,但在优势领域失去了代价更大一个,很难说是划得来。所以,在扬长和补短上面,一定是要根据代价来判断,而不是面子。分布式系统里通讯开销才是大头当一台机器算力不够时,我们用多台机器协同工作来共同完成任务。虽然分布式系统是很多家互联网公司的基础架构,但晋升性能仍然是很难。因为每台机器实际算力会有分歧,时不时还会罢工。而且一台完成自己的小任务时,经常需求等其他机器任务的结果,导致频繁数据通讯和等待。所以人人都知道晋升性能的关键是减少通讯开销。当你需求一个大团队来协同做一件事时,同样通讯开销是大头,优化起来比分布式系统能难,因为人的差异性和不稳定性比机器大多了。人的能力分歧,做事效率分歧。每个人分工的分歧,导致做事方式也不样,甚至优化的目标都不一样。大部分人只体贴自己的工作,不想也不愿操心他人的工作。如果不能有效把所有人拧在一起,就是一盘散沙,做不成大事。如果你刚进职场,最关键的一点是你需求意识到:你需求预留足够多的空儿和精力来沟通。不要抱怨这是你们公司的制度问题,这是大团队作战时的固有现象。升职我因为运气不错升到了一个比较高的地位,从而有机会经常参加公司的从高级工程师、科学家到总监的升职评定。虽然公司、地位、级别分歧带来差异性,但总体来说,一个人能否升职成功取决于她做的最大项目对公司的代价是不是达到这个地位的要求。这里有三个要点:一是项目对公司的代价。意味着针对的人群和代价差都是公司体贴的,而不是你个人或者社会体贴的。这里代价平时就是给公司赚了多少钱,或者 3-5 年后能够会赚多少钱。二是看的是你最大的项目要够 “档次”。累积很多项目,想通过不看功劳看苦劳升职能够是行不通的。三是你在项目中的进献,例如你负责多大一块,是进献了代码、团队协调、宣传、制定计划、还是申请到了资本。一个常见误解是跟人合作会降低我的进献。如果你和合作者配合不好,导致 1+1 远小于 2,那么你的进献确实降低了。但如果通过合作把项目代价做大了,那么你分到的进献是不会少的。特别是如果项目代价上了一个档次,那就更好了。升职有一个经常被忽略的“潜规则” 是影响力。随着地位的升高,公司对你的影响力的期望也越高。从能影响一个小团队,包括制定技巧路线、赞助队员上手、解答疑惑、甚至是赞助他人来完成工作,到影响隔壁组(经理),影响隔壁部门(高级经理),影响隔壁集团(总监),最后到影响整个公司战略(副总裁)。除非你是天生的领导者,不然你得花力气去培养自己的影响力。简单来说是在管好自己的工作外,积极的去赞助他人。当他人信你、咨询你意见、愿意找你合作时,那你就有了对他们的影响力。你能够会觉得帮他人会耽误自己的活。但从公司角度来看,是需求鼓励这种奉献精神,而且要予以奖励。此外,你从中赢下的信任给你带来名声和人脉,长远来看是很有用的。加薪大公司里薪酬相对透明,每个级别对应的薪酬平时可以在网上找到。一个级别内薪酬有浮动,一般有个最小值和最大值。80% 在中值附近,两头各 10%,分别是刚升到这个级别的人和快要到下一个级别的人。可以简单的认为,随着能力的晋升,你的薪酬会从最小值逐步跳到最大值,然后升职到下一个级别对应的区间。分歧级别的薪酬中值平时是个等比序列,而不是等差。例如比你高一级的人能够工资比你多一半,但高三级的人不是比你多 150%,而是多 238%。在这个模型里,你需求优化你的五年后,或者十年后能到达的高度。所以在比较 offer 时,你不要太体贴它们之间的数字差价,而是体贴去你去了之后的发展(你说我现在多拿点去买币,说不定马上就财富自由了,那也是一个思路🤣)。总结:专一于最有代价的工作如果把这五年的感悟精炼成一句话的话,会是很平淡的一句:专一于最有代价的工作。首先,你需求对代价有清晰的认识。接着,对一件工作,不仅是要认识当下的代价,更多的是对未来代价的预测。其次,当你通过不断的快速试错对未来有了把握的时候,你需求逐步的把你能调用的资本专一到最有代价的那一件工作上,尽你能够的做好。如果一生中能做好几件有着极大代价的事,那也就值了。写此文的时候惊闻袁隆平老师逝世。谨以此文纪念他伟大的一生:专一于杂交水稻,创造了人类历史上最伟大的代价之一。我辈楷模。知乎原文链接:https://www.zhihu.com/people/mli65

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/ya-ma-xun-zi-shen-shou-xi-ke-xue-jia-li-mu-gong-zuo-zhe-wu/

(0)
上一篇 2021年 5月 23日 下午12:37
下一篇 2021年 5月 25日 下午2:42

相关推荐

  • 斥资20亿出圈 蜂巢动力上海车展启动业内首个革新日

    4月20日,以“革新动力 引领未来”为主题的蜂巢动力首个革新日在本届上海车展期间正式启动,标志着蜂巢动力品牌策略进级进入2.0阶段。在革新日发布会现场,蜂巢动力宣布进入品牌2.0阶段,并成立蜂巢资源,投入20亿元基金扶植家产革新,计划招募跨界家产合作伙伴20家,全世界招募100名革新先蜂科学家,旨在通过跨界合作,集结全家产链上下游各企业力量,打造动力电池行业产、学、研、用相结合的跨界融合革新生态圈,提升本土企业的自立革新和深度研发实力。品牌全新进级 蜂巢动力进入2.0  活动现场,蜂

    2021年 4月 25日
  • 库克、盖茨等500余人联名倡议:让每一个中小先生都能学计算机课程

    蒂姆 · 库克、杰夫 · 贝佐斯、比尔 · 盖茨等科技界知名人士在公开信上签了名。近日,500 余名商业、培养和非营利部门的知名人士签订了一封联名信,呼吁州长和培养领导者更新美国基础培养 K-12 课程,让「每所书院的每一个先生都有时机进修计算机科学」。签订者名单包含许多科技界的知名人士,包孕苹果首席执行官蒂姆 · 库克、亚马逊创始人兼执行主席杰夫 · 贝佐斯、Alphabet 首席执行官桑达尔 · 皮查伊、微软联合创始人比尔 &mi

    2022年 7月 13日
  • 一场AI竞赛,怎么就让这群年轻人变化这么大?

    人工智能到底有什么用?这要从一场AI竞赛说起……

    2021年 6月 17日
  • 火了一整年的多模态进修,在工业界的落地和实践进展到底怎么样了?

    在小红书,看见多模态进修的无限可能。

    2022年 11月 23日
  • 500万奖金,代码可上太空!华为开发者大赛启动

    2022华为开发者大赛将于6月15日启动,大赛分为云底座和产业两大赛道,包含云使用翻新、代码上太空、世界难题、无人车等7大赛事,总奖金额将达500万。其中,华为云联合北京邮电大学等合作单位共同发起“代码上卫星”活动,面向广大开发者征集能适用于卫星的翻新使用,入选作品将有机会通过华为云和北邮联合设计的全球首个“云原生卫星盘算平台”布局到“天年星座”计划的多颗卫星中,完成“星海畅游”。“代码上太空”旨

    2022年 6月 13日
  • 线上分享 | Transformers库维护者之一、UCSD博士生分享库背后的故事

    自 2017 年提出以来,Transformer 已经成为占据主导地位的自然语言处理(NLP)架构,在自然语言理解和自然语言生成等任务上表现出的性能超过了卷积和循环神经网络等其他神经模型。之后,Transformer 的训练数据和模型规模也不断扩展,从而促进了高效并行训练以及长期序列特征捕获。

    2020年 12月 11日
  • 2021图灵奖揭晓:高机能较量争论先驱、超算TOP500榜单创始人之一Jack Dongarra获奖

    他曾说过:未来的较量争论架构会是 CPU 和 GPU 的结合。

    2022年 3月 31日
  • 教授何恺明在MIT的第一堂课

    700 座的大教室,相比去年增加一倍容量,仍然座无虚席:这就是麻省理工学院(MIT)计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况。今年是四位教授,每人负责一部分课程:课程信息:https://advances-in-vision.github.io/index.html有网友评论说,能选上这课的学生太幸运了,每节都是计算机视觉顶会 CVPR Oral 的体验。对于很多人来说,其中最为期待的自然是新晋教授何恺明的课。MIT 电气工程与计算机科学系副教授

    2024年 3月 11日
  • 长城科技节开场要点:魏建军的「唯一机会」、华为与高德的「减法思考」,以及李克强提出的「落后束缚」

    在今日开幕的第8届长城科技节上,魏建军发布了长城汽车的2025战略——到2025年,实现全球年销量400万辆,其中80%为新能源汽车,营业收入超6000亿元。同时,长城汽车轮值总裁孟祥军也指出,长城正加速企业低碳智能升级,并计划2045年全面实现碳中和。为了实现这些目标,长城将在未来五年累计研发加入将达到1000亿元。这些加入,将集中在纯电动、氢能、混动等新能源领域,同时也将着力在低功耗、大算力芯片和碳化硅等第三代半导体关键核心技术,以及现代传感、信息融合、人工智能等方面,做好软件和硬件的交

    2021年 6月 29日
  • 技术博客丨动手实践系列:CV语义宰割!

    作者:游璐颖,福州大学,Datawhale成员 图象宰割是计算机视觉中除了分类和检测外的另一项基本任务,它意味着要将图片根据内容宰割成不同的块。相比图象分类和检测,宰割是一项更精细的工作,因为需要对每一个像素点分类。如下图的街景宰割,由于对每一个像素点都分类,物体的轮廓是精准勾勒的,而不是像检测那样给出边界框。图象宰割可以分为以下三个子领域:语义宰割、实例宰割、全景宰割。 由对比图可发现,语义宰割是从像素层次来识别图象,为图象中的每一个像素制定类型标记,目前广泛应用于医学图象和无人驾驶等;实例宰割相对

    2022年 1月 11日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注