在三丫坡,一个德国科学家用一杯咖啡碰撞出一个奇迹



作者 | Jonas Oberhauser
来源 | 心声社区、蓝血研究(lanxueyanjiu)
投稿 | lanxueziben(微信)
顾问招聘 | lanxueziben(微信)

作者在华为年度全球软件技术峰会上
01
带着一个问题
加入华为欧研院
在加入华为之前,我从事的是“形式化方法”的学术研究。什么是形式化方法呢?它和建筑师用材料和物理应力模型来建造坚固的摩天大楼是一个道理。我们用数学建模来构建多核CPU硬件和底层系统软件,并通过严谨的数学方法证明其可靠性。
在德国萨尔大学做博士后期间,我与我的导师Paul Wolfgang教授(德国最高科研奖莱布尼茨奖获得者,欧洲科学院院士)一起撰写过一本书,名为A Pipelined Multi-Core Machine with Operating System Support(《支持操作系统的流水线化多核CPU的设计与形式验证》),这本书详细描述了用形式化方法来构建经过数学证明的多核CPU的方法。

《支持操作系统的流水线化多核CPU的设计与形式验证》著作封面
该书出版后,在学术界引起了一定关注。然而,遗憾的是,当时这个CPU的数学模型在产业界找不到任何应用机会。我非常想知道学术界和产业界之间为什么会存在这么大的差异?是不是我们的数学模型对于行业应用来说太简单了?
不久,我收到了斯坦福研究所和斯德哥尔摩皇家理工学院等学术机构的加盟邀请。如果当时我选择走学术路线,做挑战性的理论研究工作,那么这些邀请对我来说是很好的机会。但是我更希望在理论技术突破的同时,将理论研究的成果落地到实际的应用场景中,服务千家万户。我很清楚,只有深入到行业应用场景,才能真正理解学术界与产业界的差异,从而将学术界的研究成果转化为产业实践。
当时,我偶然遇到一位在华为工作的博士同学,当我将我的想法分享给他时,他主动邀请我加入华为在德国德累斯顿新成立的研究所。在面试过程中,我惊喜地发现,研究所的第一任所长居然是多年前在一次学术会议上相识的老朋友付明老师。付明老师不仅详细介绍了德累斯顿研究所的愿景,还分享了他在中央软件院OS(操作系统)内核实验室的工作经历,以及他从学术界转身到工业界的一些切身感受。这次对话让我对华为充满了向往,加入华为的想法也得到了我导师的支持。于是,在2020年1月,我接受了华为的Offer,成为了一名华为人。

付明老师、我的导师和我(作者为右一)
02
第一次中国行,遇见三丫坡
我加入研究所的时候,团队也刚刚成立不久,初建团队由20位背景差异极大的研究员和工程师组成,他们来自实时操作系统、可靠性工程、形式化方法、网络工程、微内核等多个领域。由于是新团队,我们还没有成立正式的部门。如何建立口碑?如何与产品线协作?我们面临很多挑战,未来似乎充满了不确定性。但是,在付明老师的带领下,我们坚持摸索前行。
经过一年的努力,我和同事们一起开发出一种高效的并发算法验证工具,并使用该工具设计和实现了很多更高效且可靠的并发算法,德累斯顿研究所也因此获得了OS内核实验室和产品线的认可。在解决并发程序验证的挑战性难题的过程中,我获得了灵感。于是,我作为第一作者,输出了一篇研究论文,并在操作系统和体系结构ASPLOS(计算机体系结构的顶级学术会议)2021峰会上进行了发表,最终获得了杰出论文奖,受到学术界的认可。
2021年的一天,在与付老师开会时,我们第一次听说在位于华为总部的三丫坡园区,云集了一大批来自全球各地的科学家和专家,正在热火朝天地进行着一系列解决技术难题的项目,在操作系统相关的关键技术难题中,有些难题正好与我们的专业领域技术积累非常匹配。付明老师建议我们参与其中,结合我们在可证明、高性能的众核并发控制技术的专业领域的优势积累,去解决难题,实现场景价值落地。而且,通过亲临现场,与同事们面对面交流,我们也能更准确地了解华为面临的实际挑战和困难,使自己的研究成果更加贴近客户。
“这太棒啦!”听到这个建议,我和我的德国同事们兴奋不已。加入公司以来,我们一直都很想亲身前往中国,体验和了解中国文化和华为文化。于是,就踊跃地报了名,对中国之行充满期待。

与德国团队同事在三丫坡合影(右四为作者)
2021年10月,我们踏上了首次中国行。出发前,我们既兴奋又紧张,因为大家即将前往一个神秘而陌生的国度,面临不同的语言和文化。感谢公司细致、周到的安排,我们顺利抵达了东莞三丫坡。
经过几天的近距离接触,我们深刻感受到中国同事们的热情,通过更深入的了解,我们看到了一个开放、包容、充满魅力的国家。总部的同事们非常用心地迎接世界各地的科学家们的到来,他们的热情好客让我们倍感温暖!
在中国,我经历了很多难忘的时刻:第一次荣幸地作为海外所科学家代表,在三丫坡海外科学家欢迎仪式上发言,并听到了2012实验室主任查钧先生对大家的期许;第一次入住公司安排的三丫坡安朴酒店,让我们在繁忙的工作之余,享受到一流的住宿环境和优质的服务;第一次去唱中国KTV,我学会了《成都》和《北京北京》;第一次去江西的三清山看日出,体验当地的文化和风土人情;我还认识了很多十分友好乐于助人的中国朋友,比如在疫情期间热心为我提供帮助的同事们、在大暴雨中帮我联系出租车的美团小哥、在松山湖景区帮我垫付押金租车的素不相识的小伙子……
03
一杯咖啡碰撞出“三丫坡奇迹”
当我与国内各领域技术专家一起工作时,我学习到很多关于ICT基础设施行业的场景信息,同时也意识到,这些行业面临着怎样的关键挑战和难题。我感受到,在与大家现场交流中获得的信息量,远比从文字资料中汲取的更详细、更充分。这些在场景中遇到的最初始的痛点,帮助我更准确地识别出最核心的问题,从而可以选择最直接有效的方案,达成目标。
一个阳光明媚的午后,我走进三丫坡的一家咖啡吧,点了一杯美味的生椰拿铁,无意间,我注意到旁边一些同事正在讨论OS内核实验室的一个关键场景中的难题。这是个非常有挑战性的难题,我非常感兴趣。于是,我拉过一把椅子加入了他们的讨论。同事们详细地与我沟通了难题解决场景的细节,他们告诉我现有的同步原语虽然能满足性能要求,但是却有很高的时延,他们提出的新方案激发了我的思考。为了实现新方案,保证系统的实时性,我们定位出一些关键的问题,其核心在于如何在传统的锁机制中加入任务优先级的实时传递,这是过去从未有人提出过的想法。考虑到锁算法的复杂度,能不能找到一种新算法,快速证明其正确性及可行性?
我手捧着咖啡杯,冥思苦想。刹那间,脑海中擦出灵感的火花,冒出了一个新的并发算法。我兴奋地站起身,拿来几张餐巾纸,快速地将这种低时延并发控制算法设计写下来,给大家做了现场的演示。在得到大家的认可后,我又找来几张白纸,“刷刷刷”地奋笔疾书,一步步地推导着、演算着,直至证明了该算法的正确性。同事们大为惊叹,纷纷起立为我鼓掌。
一个同事端起咖啡杯,向我祝贺,并笑着对我说:“Jonas,你用一杯咖啡碰撞出了一个奇迹!”这个故事一传十、十传百,最后成了一段佳话,在项目组广为流传。后来,我又花了几个星期的时间在计算机上进行了推演求证,并在产品代码的使用中获得了很好的结果。

三丫坡咖啡时间(作者为右起第三位)
“三丫坡奇迹”让我和同事们倍受鼓舞,我们之间的沟通与协同也越来越深入和默契。我们共同探讨识别关键场景,一起挖掘核心问题,通过“想法+算法”的自主创新方法,扫除了一个个理论和根技术上的障碍,实现了很多突破性成果。除此之外,在三丫坡期间,我修复了现网系统内存模型的多个缺陷,相关补丁被社区接收;我还开发了零误报死锁检测工具和硬件LSU(加载存储单元)的验证工具原型,并用它成功发现并修复某开源项目中LSU实现的缺陷。
为了帮助工程师在实践中更快地推广和应用先进的技术,我通过技术沙龙分享我的成果,并走访多个国内业务属地,积极推广相关技术,为一线同事们赋能。通过多渠道的交流,我也获得不同领域专家的意见和建议,帮助我批判性地审视原方案中的隐含假设。这正如德国一句名言所说:“当你深入某件事情的时候,你会因为只看到了树木而错过整片森林。”

三丫坡战地复盘研讨(第二排右一为作者)
04
读懂学术界和产业界的差异
转眼间到了2023年,我已经多次前往中国,每一次来到公司总部,我都会发现同事们又取得了惊人的进展。那些最初减慢我们前进脚步的障碍,最终都成了我们扎到根、捅破天的助力。大家勇于担责,克服万难,让我们在管理能力和技术实力方面都获得了飞速的进步。
学术界和产业界之间为什么会存在这么大的差异?关键差异到底在哪里?这些都是曾经困扰我很久的问题。通过在华为这段经历,我有了很多启示与收获:
第一,学术界一些习以为常的想法在行业实践中可能并不适用。例如,学术界通常认为,最重要的是发现尽可能多的问题。但是与产品线专家交流后,我们发现大部分问题对客户来说都是不重要的,测出一个重要的问题比测出100个不重要的问题要有用的多。通过业务价值驱动,聚焦主要矛盾,我们才能快速理解和修复系统性的问题,达到事半功倍的效果。我把这个观点带回了德累斯顿,并指导我们团队构建了一个工具。虽然它还在原型期,但已经发挥了非常大的作用。
第二,学术界大多数设计的复杂性高,开发速度要慢得多。因此,学术界设计开发的方法往往不能适应快节奏的行业应用。然而,我也发现,在某些情况下,场景的复杂性增加,也使得行业实践设计开发的速度大大放缓,同时复杂性也使可靠性难以保证。
多数情况下,当一项根技术相对成熟时,人们就不会再去想如何改进它了。因为它们是经过漫长的时间由一批批优秀的人持续优化迭代形成的,很难被推翻。但是,当我们被限制停止使用这些已有的技术后,我们必须重新面对老问题,提出新的解决方案。在这些新方案中,很多已超越了过往的方案,比如Linux RCU(读取-拷贝-更新)算法的无内存屏障实现方案,还有前面提到的低延迟锁,以及我的中国同事们很多类似的研究成果,都是生动的例子。
回顾两年多在三丫坡的经历,虽然遇到了很多阻碍,但我们不断挑战,找到创新的方法和突破新技术,并透过快速赋能和推广,来促进新技术的应用,实现了高可靠性和高性能的产品竞争力。这是我们团队共同打造的扎到根、捅破天的“三丫坡奇迹”。
人们也许会好奇,是什么力量造就了“三丫坡奇迹”?如果你来到三丫坡园区,看到镌刻在石墙上的那句话“没有退路就是胜利之路”,就会了解奇迹背后的力量,它承载了华为人在面对逆境绝境时攻坚克难的决心和对胜利的信心!

镌刻着“没有退路就是胜利之路”的石墙
05
建立“解决业界挑战难题”研究风格
2023年5月,我有幸代表德累斯顿研究所,参加了华为年度全球软件技术峰会,并分享了我们的研究成果。我的报告让来自学术界和工业界的学者专家们印象深刻。其中,有一位著名的学者问我:“两年前,如此令人印象深刻的研究成果还只来源于学术界,现在它来源于行业实践,学者们是否要有危机感了?”
我充满信心地告诉他:“不用担心。我们所有的工作都是通过与工程师的深入交流和倾听他们的需求来开展的,并帮助他们找到核心问题,提供最直接的解决方案,或者发明更好的工具,来帮助他们大幅提升生产力。一些成果,经过最多两三年的时间,就可以转化为商业价值。但学术界的教授们不需要这样做,他们面对的是关于未来15年甚至更长远的世界梦想,以及如何一步一步迈向并实现这个梦想。两者并不冲突。”
感谢三丫坡的这段宝贵经历,它帮助我们在德累斯顿研究所建立了以“解决业界挑战难题”为导向的研究风格,让我们与许多不同领域的工程师面对面,从而有机会将一些先进的技术方法匹配到业务场景,实现价值的落地。
就我个人而言,这段经历最大的收获不仅仅是工作成果上的,更是通过开放的沟通,使我近距离接触和深入了解中国的文化,感受文化的异同,让我与中国之间更加亲近。通过与很多中国朋友的交流,包括外卖小哥和高校教授,我深刻地领悟到文化交流的目的——通过互相的融合,我们成为更好的自己!
我期待与我的伙伴们再次相聚。那时,我们定会举杯相庆,我将引用当年在海外科学家欢迎仪式上听到的那句我非常喜欢的中国名言,向更多的科学家们送上祝福:“有朋自远方来,不亦乐乎?”
▼▼▼
蓝血研究院公开课
课程内容 课  时 开课形式  时间
《华为干部培养与训战结合赋能方法》
2天1夜 线下 11/3-4
《企业大学:仗怎么打,兵就怎么练》 1天
线上
待定
《华为经营计划与预算预测》
1天 线上 11/25
《客户洞察与竞争情报》 2天1夜 线下 11/17-18
《战略解码工作坊》 2天1夜 线下 待定
《从战略到执行-从市场机会到经营构建》 2天1夜 线下 10/13-14
《经营分析会,战略落地的有效手段》 2天1夜 线下 待定
《经营型组织诊断》 1天
线上 11/11
《营销战术与大客户关系》 2天1夜 线下 待定
《驱动经营实现价值倍增的利润中心建设》 1天 线上 待定
《华为财经变革及数字化转型》 2天1夜 线下 10/28-29
《标杆企业营销业绩倍增实战兵法》 3天2夜 线下 待定
《打造立体型激励体系》 2天1晚 线下 待定
《人才盘点与任职资格》 1天 线上 待定
《一线呼唤炮火的项目管理实践》 2天 线下 10/20-21
《建设渠道生态,聚合千军万马》 1天 线上 11/12

格格老师:18603075818(微信同号)
吴老师:15260211397(微信同号)
到顶部