作者:段戎来源:心声社区、华为人
一个倔强的老太太
段戎
我是青岛人,在青岛度过了20多年的求学时光。那是一座啤酒之城,大街小巷都能买到清爽的扎啤,随口一声吆喝,小贩就会手脚麻利地挂上塑料袋,拧开酒桶上的水龙头。随着凉丝丝的啤酒倾泻而下,绵密的泡沫汩汩地冒上来,空气里弥漫着麦芽的香味。
后来,去美国工作生活后,我喝的最多的变成了咖啡。不论在家里、办公室、咖啡馆,还是路边的自动售卖机,我执着于简单的美式,不加糖或奶,任凭微酸带着焦香扑进口腔,舌根的淡苦和舌尖的微甜交织、纠缠在一起。
这两种截然不同的风味,构成了我性格的底色——豪爽直率,简单倔强。在很多对外交流的场合,别人会给我贴上很多浓烈、鲜亮的标签,比如“华为财经首席数据科学家”“美国史蒂文斯理工学院博士”“AT&T实验室20多年工作经验”,可我最常用的自我介绍是“一个倔强的老太太”。
首先,我已经到了知命之年,在华为一众蓬勃的年轻人中,已然可以被称为“老太太”。说倔强,是因为我这人“一根筋”。2017年加入华为后,在参与财经AI(人工智能)探索的5年里,我一直很坚持自己的技术理念,也不怕得罪人,慢慢地,可能也变成了别人口中那个“有点倔强的老太太”。
一杯咖啡,从美国喝到了华为
1996年,当我第一次踏入AT&T(美国电话电报公司)实验室的时候,因为兴奋,手心微微有些冒汗。大厅里,悬挂着一排以木板为底的诺贝尔奖得主的铜制头像,特别壮观。
它的前身是久负盛名的贝尔实验室。自其成立的半个多世纪以来,贝尔实验室一直是全球最具创新力的科研实验室,许多沿用至今的发明,如晶体管、太阳能电池、通信卫星、C 语言、UNIX 操作系统等均诞生于此。虽然由于组织拆分,贝尔实验室被一分为二,但我入职的时候,我们都在位于美国新泽西州莫瑞山的办公楼一起工作,AT&T实验室也继承了其自由开放的创新氛围。
入职后,我发现身边的大神们遍布各个专业:生物、化学、物理、心理学、经济学,还有学哲学的。在这里,没有人给我们设置KPI,布置什么具体任务,每个人都是自发地思考自己可以为这个领域做点什么,很多项目都是大家坐在一起喝咖啡聊出来的。
茶水间是大家分享点子、互通有无的地方。最初配备的是带加热器的普通咖啡机,然后是一系列功能更完备的浓缩咖啡机和磨豆机。同事们每天多次来这里喝咖啡,聊聊工作、生活,也会提到自己正在做的研究。记得有一阵子我在烦恼“数据质量”的难题,觉得无处入手,一位数据库大牛在茶水间里听了一耳朵,一边搅拌着手中的咖啡,一边不紧不慢地对我说:“我在组织一个星期二的讨论会,也许对你会有帮助,你要不要来?”果然,后来的交流对我的启发很大,让我少走了很多弯路。
在AT&T的20年间,我一直在和数据打交道,从数据集成到质量控制、前台应用,再到数据挖掘,就像是一块磁铁滚过一路铁屑似的,不停地吸取知识。就在我以为会继续这样工作下去的时候,一杯咖啡改变了我的人生轨迹。
那是2016年,在一次学术会议中,我认识了华为无线大数据实验室的负责人,一杯咖啡下肚,他邀请我去参观,并询问我对华为的数据分析工作是否感兴趣。虽然那时我并未做好准备,委婉地拒绝了,但一切已埋下伏笔。又过了一段时间,华为数据管理部部长、质量与流程IT首席数据官马运找到我,向我描述了在华为总部工作的场景,再次诚恳地邀请我,他说:“华为有海量的数据,你加入我们,就可以进入到任何领域,这是一个开放的广阔天地。”这一次,我动心了。
在原来的公司,我更多接触的是单点的业务场景,是基于收到的数据来做建模,时常会出现“巧妇难为无米之炊”的窘境,而华为要做数字化变革,是从系统、全局的视角出发,我有机会自己定义所需要的数据,自由地挖掘数据宝藏,这样的机会充满诱惑。
此时,我的家人给了我最坚定的支持。我的先生和我分享了他对于华为的印象和感受,他说:“这是一家伟大的公司,拥有着最丰富的场景和庞大的数据,你一定可以发挥自己的价值。”我的两个女儿也鼓励我说:“妈妈,如果你不想过一眼望到头的人生,就抓住这个机会吧,去试试吧!”
于是,2016年12月21日,我永远记得这一天,我从美国回到中国,第一次走进华为的深圳总部。正值午餐时间,涌动的人潮朝着食堂的方向走去,冬日的暖阳下,每个人看起来都是那么朝气蓬勃,神采飞扬,一副赏心悦目的画面,我内心止不住地兴奋:华为,我来了!
“这杯咖啡,太值了!”
最初我加入的是数据管理部,对口支持财经领域的AI探索,后来才正式转入因华为财经智能化而生的冯·诺依曼工作室。
刚入职时,部门邀请我去公司的专家大讲堂讲课。那时,我看到国内对大数据的备受推崇,几乎把大数据和AI划等号,而忽略了技术的演化途径和积累的重要性,于是我有感而发,想谈谈自己的理解。
我以东西方文明类比AI发展的两个阶段,第一个阶段类似西方文明,讲求的是机理与逻辑,对待AI,要先把人的知识分解清楚,再把逻辑的方法变成计算机的语言进行推理。第二个阶段,类似东方文明中“神农尝百草”后的经验总结,并在几千年的历史中被实践检验无数次,是用大数据驱动问题的解决。两种方法各有利弊,但在一个有管理目标的企业组织中,只有“中西结合”,搞清楚承载企业管理理念背后的机理和逻辑,再结合经验和大数据,才能为决策提供有力支撑。
讲座后不久,财经两个年轻的算法工程师愁容满面地找到我,说要请我喝咖啡。他们顶着“熊猫眼”坐在我的对面,肉眼可见的疲惫。
当时,他们正在做财经领域SSE(员工自助报销系统)报销的违规检测项目,账务人员从历史的违规单中抽象出很多的规则,但是按照规则识别出的问题单据多得超出了想象,命中率极低。大家对AI算法学习寄予厚望,希望能实现有效“揪”出问题单据的目标。
在灌进一整杯苦涩的咖啡后,一个小伙子一股脑儿倒出了自己的郁闷:“我俩对着这个模型反复调整参数好久了,可不管怎么捣鼓,都毫无进展,效果一如既往的差……”
“具体是什么样的表现呢?”我问道。
“在训练模型的时候,我们采样了两年的数据,训练时表现极好,但是验证数据时,命中率却极差……”
我在脑子里迅速思索了一下:“根据我的经验来说,如果训练和测试时的表现偏差较大,最大的可能就是两者原本就是不同维度的数据。这是什么导致的?可能是切分数据的技巧不对,也有可能是业务规则变了,选取数据的时候没有做相应的调整。”
这好比我们要用AI来找出“最漂亮的人”,但在训练模型的时候,今天让它看漂亮的人,明天让它看中等外貌的人,两个规律和标准并不相同,数据特征自然混杂了,最终训练出来的模型,当然很难实现精确识别。
他们点了点头:“怪不得我们拼命调整参数没有用,可能方向就错了啊!”
在告别之前,我嘱咐他们:“一定要和业务人员确认清楚,两年间的规则是否发生过变化。”
最后的结果证明,我的猜测是对的。他们回去后仔细询问了账务人员,才发现一个细微的报销政策的规则调整被忽略了。在账务人员看来,这个微不足道的政策调整,不会对数据产生什么影响,因此向算法人员讲述应用场景时,并没有强调。但从采样数据的角度来看,微小的错误在2年的时间跨度中累积起来,可能造成巨大的偏差。
症结找到了,问题自然也解决了,两个年轻人感激地对我说:“这杯咖啡,喝得太值了!”
这个小插曲,再一次让我看到大家对于AI的重视和渴望,但是,每一个AI模型都有它的局限性,都有自己能够发挥作用的前提假设,如果对业务的需求和业务本质缺乏深刻的理解,没有弄清楚到底要解决一个什么样的问题,只是闭着眼睛挑选模型和工具,这个不行就换另一个,那根本无法为业务人员提供决策参考。
所以,后来在与年轻人交流时,我都会引导他们深入思考业务的本质问题,具有什么样的特征,怎样选择数据范围,怎样合并或产生一些特征,哪种算法可以去探索,哪种算法不适合,为什么适合,为什么不适合……让他们走在正确的道路上。
这样的移花接木,行不行?
尽管有些小插曲,SSE员工报销项目还是顺利地完成了既定目标。与此同时,随着问答系统的兴起,2017年,差旅报销热线也而成为财经AI的试点项目之一。
对于华为员工来说,出差就是日常。每年,华为员工的飞行里程总数相当于绕地球13.6万圈,足迹遍布全球200多个国家和地区。因此员工涉及差旅报销的提问也是多如牛毛,如何更快、更准确地解答?大家把目光投向了AI。
AI的第三次浪潮在自然语言处理、图像、语音的识别上取得了巨大的突破,但在企业内部的应用上,这种基于大数据、大模型训练出来的黑盒模型很快遇到了瓶颈。这是因为像差旅报销政策这类既有华为特色,又有财经专业特色的对象,能够拿来训练的语料非常有限。而且,政策文档一般都很简练、严谨,依靠概率统计出的AI模型,满足不了这种知识的获取。
如何找到突破口呢?在关注业界动态的过程中,“知识图谱”进入了我的视线。
谷歌在2012年提出“知识图谱”的概念,以图的形式表现客观世界中的实体(概念、人、事物)之间的关系,初衷是为了优化搜索引擎返回的结果,增强用户搜索体验。举个例子,百度或者谷歌一下“小乔的丈夫”,搜索引擎会准确返回“周瑜”的信息,说明它构建了“知识图谱”的关系图,理解了用户的真实意图,知道我们要搜索的是“周瑜”,而不是仅仅返回关键词为“小乔的丈夫”的网页。不仅如此,当你搜索信息、看新闻、刷短视频、网购时,精准推送给你的内容,背后都可能有“知识图谱”的作用。
虽然当时“知识图谱”主要应用于开放域的搜索和问答引擎上,但我觉得,这种图形化表达知识之间关系的方法,可以融合专家经验和数据统计,非常适合差旅报销热线这样既有一定量的专家经验,又有一定量数据积累的场景,于是强烈推荐给了项目组。
当然,这样的“移花接木”也很挑战,因为不同于互联网企业,建立的是实体的人或物的关系,我们要建立起像会计规则这样的虚拟事物之间的关系。为此,我们花了很多时间与业务人员“泡”一起,抽象差旅场景的知识建模,构建起华为财经的第一个知识图谱。比方知道“员工周日要坐飞机出差上海”,系统就会关联出,到达上海后如何完成机票、住宿的预订,具体的报销规则是什么,还能关联出节假日出差的报销注意事项等,并给员工打包送上历史上提问过的所有相关问题。
这种“知识图谱”的构建,一方面扩展了问答对,改变了问答对只能靠历史积累的问题,另一方面也提高了热线机器人对语义理解的能力。在大家的共同努力下,差旅报销热线获得了成功,这么多年一直是公司众多热线系统中表现最好的。
尝到“知识图谱”的甜头后,我们又在财经领域大大小小构建了十多个“知识图谱”的应用,如银行知识图谱、电商管控中的关系图谱,可以帮助电商迅速降低被攻击的可能性。在这个过程中,我们加深了对企业“知识图谱”的认知,在“知识图谱”的特点和构建上突破了一些技术难点,并总结了一套方法论,申请了7个相关专利。一些成果被CIKM、KMIS等国际会议选中,作为指导性建议或论文进行宣讲。
受挫的眼泪
很多人问过我,AI是不是一种技术?我说,它是技术,但又不仅仅是一种技术,更是一种机制、一种环境。你可以把AI当成一个“孩子”,要让它成才,就要建立一个系统的培养机制。从教它听懂“人话”,到教它学会理解和思考,再定期去考核它、重新训练它,让它不断进步。
这两年,在AI技术加速在各行业落地应用过程中,我逐渐意识到“知识+数据”驱动的重要性,开始把“知识表示”作为一种重要的技术方向。
这个概念听起来很高深,其实就是为了让机器能听懂“人话”,并且自己会“思考”。比如,“拿包出门”这个指令,机器可能以为就是“拿起包,直接穿过门就出去了”,很难理解这包含一系列动作:拿起包,打开门,出去,关门,更不理解为啥要这样做。所以,“知识表示”就是要做三件事,一是把知识掰开了揉碎了,建立结构化的逻辑,二是把这些内在关系用“二进制”的语言说给机器听,三是把这部分逻辑和数据挂钩。这样一来,机器不仅听得懂,还会自己根据内在逻辑去思考、计算、判断。下次你要出门,还没开口,它就自动帮你提包了。
我一直坚定地认为,在专业性很强的财经领域,“知识表示”可以派上大用场——把确定的规则结构化,结构化的规则网络化,不确定的规则科学化,让AI真正具备思考和预测的能力,帮助企业做出更好的决策。所以,2020年,在X业务预测领域的AI探索上,我一直坚定地主张使用“知识表示”技术。
但对于产品经理而言,要把知识结构化,是一个工作量巨大的工程。所以尽管他们已经梳理清楚影响预测的所有因素,具备了构建业务逻辑的基础,但依然拒绝了这项技术。在一次会议上,我们爆发了激烈的争吵。
“你们为什么不多做一步呢?”我十分不理解这样半途而废的行为,不自觉提高了音量。
“为什么要多此一举呢,我们已经达成目标了。”产品经理摆摆手,同样的不解。在他看来,把影响预测的每一个因素用代码写出来,让机器听得懂“人话”就行了,为什么非要把知识结构化,让机器知道为啥这么做?
“不这样做,这只是一个‘死’系统,机器还是没有分析和思考能力。”尽管我很坚持,但显然彼此的沟通并不在一个频道上,最终只能不欢而散。
明明这是一个大家都谁受益的方向,为什么这么难落地?在华为,我们拥有其他任何企业可能不具备的场景、能力,为什么我们已经在了这个时代的前沿,反而要止步不前呢?我觉得特别受挫,坐在偌大的咖啡厅里,和一个熟识的同事聊起这件事,我忍不住流下了眼泪。
“这难道不是我们共同的理想吗?”我痛苦地问道。
同事一边给我递纸巾,一边真诚地对我说:“那只是你的理想,还没有成为大家的理想,你要给大家时间。”
我一怔,是的,我很清楚,只有把业务逻辑与数据处理结合起来,才能构建一个快速响应、逻辑清晰的信息系统,为业务做分析推演。但从业务人员的角度来看,“知识表示”只是一个概念,它能达成什么价值,还要经过实践的检验。背负着交付压力的他们,怎么能开开心心做第一个吃“螃蟹”的人呢?
我反省自己,在表达上过于强势了。在我的认知里,技术目标永远是摆在第一位的,却忽略了很重要的一点——“独行快,众行远”,真的要做成、做大,必须要一个团队朝着一处使劲。与其从理念上去说服别人,不如先提供一个工具,让业务马上能用上,尝到“甜头”,切身感受到它的价值,这样才能实现共赢。
后来,我转变了做法,从推广理念变成推广工具,不再执拗于一步到位。从2022年开始,“知识表示”技术项目正式孵化为一个子产品,先完成以解决用户痛点为本的基本功能,在某些场景先小试牛刀,后续再迭代优化。
比如,在“基本价的合理性检验”这个场景中,定价的合理性验证要通过成本降幅、商务降幅等8个相互关联的要素来决定,定价业务想测试这些要素对价格的影响。为了完成业务的诉求,在底层技术上,我们采用“知识表示”的技术构建了对价格产生影响的各个要素之间,以及要素与数据之间的关系,并自动翻译成可执行代码,提供给业务分析工具。在工具界面,业务人员可以自由调节每个要素的值,并链接数据库,算出对应的价格,并可以依据自己的经验,分析所得结果是否合理。
相信随着越来越多的应用落地和效果的彰显,由“知识表示”底层技术构建起来的知识网会越织越大,为业务提供更广阔的知识链接,“知识表示”产品也会得到越来越多的认可。未来,人与机器不只是一起工作,而是持续地互相学习。
我的小目标
如果把华为公司比作是一个人的话,华为财经监控的就是人的各项身体指标。这些指标既彼此相互影响,又受到外部因素的影响,所以我们要从系统的角度找到问题指标背后的真正原因。比如得了“高血压”,就要找到导致“高血压”的根源是什么,是吃得过于油腻,还是缺乏锻炼,或是生活环境发生剧烈变动。只有以场景为核心,把算法、算力和数据聚集起来,那才是真正意义上的AI,才能有效支撑公司做出经营决策。
在探索AI的几年时间里,我欣喜地看到,华为财经围绕洞察、效率、控制三大职责,构建了一系列优秀的AI产品,如企业风控、电商支付风控、规划推演和财经助手产品等,并且从散点建设到体系化建设,沉淀出“知识图谱”“知识表示”“知识数据底座”等公共产品。
记得几年前我加入冯·诺依曼工作室时,给自己定过一个小目标——看清楚华为财经三年之内能用上的技术。现在回头看,在这一点上,我做到了。我坚持了自己的专业理念,也把过去20多年在学术界和工业界积累的经验,用在了华为财经这个广阔的平台上,我觉得很值!
希望若干年后,等我离开华为时,人们提起我会说:“哦,是的,那个老太太挺倔的,但我们都很喜欢她!”
来源/《华为人》
风起堂观察/为您讲述华为奋斗者的故事