【ITBEAR】10月28日,由微博、新浪新闻联合主办,清华大学经管学院EMBA倾力支持的“新浪新闻·2024探索大会”在北京举行。华为云Marketing部总裁董理斌分享了题为《解难题,做难事,AI重塑千行万业》的演讲。
华为云Marketing部总裁董理斌——主题演讲
以下是董理斌先生演讲实录,内容经编辑略有删减:
先生们、女士们,大家下午好。
华为云在去年发布盘古大模型的时候,提出来“解难题做难事”,目标是希望通过解行业难题,能够让AI的能力,AI的技术,普惠到我们各行各业。
今天好几位嘉宾提到了诺贝尔奖这个事情,我想在座的很多人和我可能有类似的想法。当诺贝尔物理学奖颁发给AI科学家,心里想为什么把物理学奖颁发给AI的科学家。但是看到这个化学奖也颁发给AI科学家的时候,我想在座的诸位可能跟我一样,意识到今天无论是在我们企业界,还是在我们的科学界都已经深深地认识到AI将重塑千行万业,改变我们的生产生活的方式,也会改变我们科学研究的方式。今天我也是想借助探索大会这个机会,分享一下华为云和我们的客户伙伴,在AI领域里面的探索的一些创新实践。
首先是在新药发现领域。其实相对于其他的疾病,包括我们谈之色变的肿瘤,细菌感染而导致的人类死亡的人数是远远超过肿瘤的,如果说有一天,人类能够攻克细菌感染,就有可能极大地提升我们人类的寿命。
治疗细菌感染对应的药是抗生素,大家都知道青霉素,它是我们人类科学家发现的第一支广谱抗生素。由于青霉素的发现,使我们人类的寿命普遍提升了至少20岁。大家看我上面分享的图,其实在最近这40年间,人类都没有发现新类别的广谱抗生素,大家可以看到,有一些大家可能不是很了解的超级细菌,如鲍曼不动杆菌,用青霉素治还治不好,它对我们人类有很大的影响。
新的抗菌药应该怎么研发?西安交通大学第一附属医院的刘冰教授团队,通过噬菌体入侵细菌的机制研究发现了全新的抑菌机制,同时找到了杀死细菌的新的靶点。这个靶点大家可以理解成,要把细菌攻克,就像是要在细菌细胞壁上找到一个“钥匙孔”,这个钥匙孔就是靶点,但是你还要找到一个“钥匙”才能把它打开。找到靶点已经很难得,还要找一把钥匙出来,过去需要通过大量的科学实验,大量的推理才能够最后找到。
刘冰教授团队通过盘古大模型,学习了17亿种小分子化合物的化学结构,然后生成了1亿种新的小分子化合物,再用盘古大模型进一步进行药物的筛查。我们和刘冰教授合作,把药物要求,比如说一系列的特征设定到筛选条件里面,通过盘古大模型,在1亿种小分子化合物里面筛选出来100种作为候选。刘冰教授团队就从这100种的前10种中挑出4种,然后进行化学的合成,然后才发现了这样一个新的药物。这个药物名称叫肉桂酰菌素,它有可能是我们人类发现的,近40年来首个新类别、新靶点的一款广谱抗生素,它将会对我们的身体、生命健康起到极大的作用。
另外一个案例想给大家分享,就是气象预测。当前主流的气象预报模式是通过数值计算,这种大气流体力学的方程是极为复杂的,差不多有1000多行的方程,所以需要用超级计算机来进行方程求解。
AI提供了另外一种预测方式。我们中国有一句俗语,“看云识天气,朝霞不出门,晚霞行千里”。过去人们预测天气是通过看到的一些天气现象,总结其中的规律,然后得出对天气的预测。AI现在能够做到什么?我们将过去40年的气象数据,通过AI进行学习。比把整个地球的大气分成13层,每一层上面的每一个点,包含了这个点的高度、温度、湿度、气压等等这些参数,都输入到大模型里面进行学习,然后通过神经网络进行计算。我们发现通过这种AI预测天气的方式,改变了过去的传统数值计算方式。过去大家可以看到,预报一个台风未来7天的路径,起码需要三四个小时,现在用这种AI的大模型推理,几秒钟就可以推理出来。
这里给大家分享的就是华为云和深圳气象局的合作。深圳气象局基于盘古气象大模型开发了区域预报模型智霁。我分享的这几张图,就是对今年摩羯台风进行预测的结果。从预测可以看到,黑色这条线是“摩羯”台风的实际路径,红色就是盘古和智霁的预测路径。大家可以看到,相对于欧洲气象中心,以及美国气象中心的预测,盘古和智霁能够极为精准地预测到台风移动的方向,包括台风可能登陆的地点。这边是深圳气象局当时用智霁预测的结果,从台风生成开始就预测这个台风将靠近粤西和海南。前两天去迪拜,迪拜这种干旱的地方,也可以通过AI预测人工降雨的条件,对大气环境污染也可以用这些模型。从这些例子我们看到,AI逐渐在我们的生活、工作、科研都在产生影响。
除了药物研发和气象预测这两个领域,大家也可以看到, AI正在重塑千行万业。比如说我们在煤矿,可以通过AI进行远程的异物识别,使工人可以远程操作。在武汉高铁动车段,过去需要大量的人工检测,因为高铁要保障绝对的安全,工人每天晚上都得检测,现在可以通过AI+机器人来辅助工人进行检测。另外在港口、钢铁等等一系列场景中,大家可以看到AI正在帮助我们各行各业打开新的解题方式。华为云最近也提出“从现在开始构建AI原生思维”的理念,中国有一个很核心的优势,并不仅仅是在算力、算法方面,我们有无穷无尽的场景,我们可以把各个场景开放出来,和AI结合,我们就会找到更优的解题之道。
华为云能够给我们的客户、伙伴、开发者提供些什么?首先我们能够提供AI-Native的云基础架构。大家可能会看到,现在已经有千亿参数大模型、万亿参数大模型,甚至有更高的10万亿参数大模型等等。但是大家想一想,这个模型怎么训练出来的,它到底是用100张卡组建一个集群来训练最优,还是是200张卡、1000张卡最优?这些计算的资源,无论是CPU、GPU、NPU,要可组合,可以把它们组合起来,实现一个最优的训练方案。华为云提供了CloudMatrix架构,把过去的主从架构转化成全分布、全池化的架构。通过全分布、全池化的架构,就会使得你需要多少的计算资源,就能提供多少计算资源;需要多少的存储资源、内存资源,就能提供多少的内存资源,所以我们把它叫作“一切可组合、一切可池化、一切皆对等”的AI原生云基础设施架构。
基于这样的架构,华为云还提供了昇腾AI云服务,支持大模型的长稳训练。过去训练千亿参数的大模型,两三天可能就要中断一次,现在可以做到40天不中断,帮助大家加速AI的开发、模型的开发。
华为云在中国有三大核心枢纽节点,分别在内蒙古乌兰察布、贵州贵安、安徽芜湖。现在三大枢纽节点都已经升级到AI的算力中心,能够在全国提供30毫秒的低时延,无论你在哪里,你只要接上去,就可以使用充足的、澎湃的算力。
与此同时,我们经常提到AI for Science、AI for industries,AI能够帮助我们重塑千行万业,提升生产效率。为了帮助客户打造自己的大模型,华为云还提供了丰富模型的训练工具,使模型开发、应用的开发更加的简单。
今天我想稍微着重讲一下数据这一块。当企业训练模型的时候,第一个是数据的质量很重要,第二个是数据怎么“喂”给模型做训练。企业要把数据做标注,为了让这个数据训练以后能够成为所在企业的知识库,要制作大量的问答对,这些事情如果是我们人工来做是很痛苦的。今年华为云对DataArts数据治理生产线进行升级,希望能够帮助企业构建以知识为中心的数据底座,通过这种工具进行标注、重新数据治理了以后,直接可以转化成大模型可以学习的知识,这样企业再训练自己专有的大模型,或者说优化自己AI的应用,就像是插上了飞翔的翅膀。
最后,很多中国企业都希望有一天,一方面服务好国内的客户,一方面也能够走到海外去。华为云在过去的一年,相继在沙特、土耳其、埃及等地开服,今年还将不断新增一些海外节点,希望大家无论走到哪里,都可以用华为云上创新的服务,去构建自己企业的数字底座,去实现自己产品的创新、技术的创新。
我们希望和大家一起,让云无处不在,让智能无所不及,共建智能世界云底座,谢谢大家!