文 | AI大模型工场,作者|参商,编辑|星奈
2016年,AlphaGo横空出世,以4:1的战绩击败世界围棋冠军李世石,震惊全球。
AlphaGo的胜利成功地展示了AI在解决复杂策略问题上的潜力,成为人工智能发展史上的一个重要转折点。
从象棋到围棋,从深蓝到AlphaGo,棋盘上的对弈不再是单纯的胜负较量,而是人类智慧与人工智能深度交融的舞台。
如今,AI与棋盘的故事仍在继续。2024年国际象棋世界冠军赛(WCC)11月23日正式拉开帷幕,现任棋王丁立人接受年仅18岁的印度国际象棋特级大师多曼拉朱·古凯什挑战「王冠之战」。
值得关注的是,谷歌作为此次大赛的赞助商,在现场也带来了AI深度体验项目。
AI大模型工场有幸受到谷歌邀请来到在新加坡举办的2024年国际象棋世界冠军赛(WCC)现场,见证这场巅峰对决。
在WCC现场,谷歌展示了基于棋类AI的最新探索,从AlphaGo到AlphaZero,从Chess Fiction到GenChess,AI在跨越棋盘,落地我们生活的方方面面。
一、现场直击WCC,用AI解锁国际象棋新玩法
在WCC上,谷歌的AI体验区成为焦点。 三大展台Chating Chess、Chess Fiction 和 GenChess,让AI用游戏的方式帮助大家重新理解象棋。
Chating Chess:象棋知识一键解锁顾名思义,Chating Chess,是能够通过对话快速提升观众对国际象棋的理解水平的“AI解说员”。在对话框中向Gemini提问关于国际象棋的问题,Gemini就会深入浅出地讲解各种复杂概念
比如,对象棋小白来说,只需输入“如何下象棋”这类关键词,Gemini 就能详细讲解国际象棋的规则,不仅如此,它还能预测你的后续问题。同时,如果你将棋局给它,它还能指导你的棋局下一步。
Chess Fiction:象棋赛事的拟人化演绎Chess Fiction通过Gemini模型,将经典赛事拟人化,让不懂国际象棋的人也能像读小说一样了解整个对战的过程,赋予每场比赛叙事的魔力。
例如,当你输入 “将2017年侯逸凡对战Borya Ider的比赛改编成一个奇幻故事”,Gemini 会生成以下充满想象力的内容:
在神秘的直布罗陀王国,一位名为侯逸凡的女巫以精妙的策略和冷静的判断统治棋盘。面对充满大胆与冒险精神的蒙古骑士Borya,他们展开了一场智谋与魔法的对决。侯逸凡召唤了“迷人的棋子”和“无懈可击的防御网”,而Borya释放的“凶猛骑士”与“雷霆般的攻击”同样让人屏息凝神……
即便是毫无棋艺基础的观众,也能通过这种叙事方式,感受到棋盘上的紧张与刺激,体会象棋场上的激烈对决。
GenChess:打造你的专属棋盘在AI体验环节,最具创意的还要当属GenChess,可以输入prompt生成专属的风格化国际象棋。
比如,我让Gemini帮我生成了一个Butter Bear(黄油小熊)的专属棋子,一个奶黄色的可爱小熊棋子,拿捏人心。不仅如此,还可以用同一主题生成不同各具特色的棋盘进行对弈。
在展示墙上,也放满了人们的想象力,包括饺子、鸡蛋等个性化的象棋。
实际上,这些好玩的AI应用背后包括图像生成模型Imagen 3和Gemini Flash模型等。
就在3个月前,谷歌发布了图像生成模型Imagen 3,在文本语义还原、色彩搭配、文本嵌入、图像细节、光影效果等方面相比第二代大幅度提升,同时还能支持生成人物图像。GenChess背后Imagen 3功不可没。
这些技术背后都体现了AI在棋盘世界的新高度,而提到这一切,不得不追溯到AI棋类技术的开端,从AlphaGo到AlphaZero,以及背后推动这场变革的关键人物。
二、AI棋盘背后的那个男人:从AlphaGo到AlphaZero
今年诺贝尔奖AI成为当之无愧的顶流,先是AI教父辛顿凭借深度学习的突破获得诺贝尔物理学奖; 第二天 Google DeepMind 联合创始人兼首席执行官 Demis Hassabis。
则因开发了AlphaFold解决蛋白质结构预测难题而获得诺贝尔化学奖。
实际上,谷歌在棋盘上取得的成就,Demis Hassabis在其中扮演了重要角色。
在新加坡WCC现场,谷歌组织了一场Demis Hassabis 自传电影《The Thinking Game》观影会。这个电影耗时五年拍摄,详细讲述了Demis及其团队如何一步一步探索 AI 的未来发展,以及为人类带来的价值。
Demis的故事始于棋盘,13岁时,他已是国际象棋少年冠军,并且世界排名第二。那时,他脑海中萌生了一个独特的想法:如果将所有人类智慧与计算机结合,会发生什么?
Demis似乎一直在思考,14岁考上牛津,他本可以在15岁时进入剑桥学习计算机科学,但他延迟了两年才入学。在此期间,他进入公司,设计开发出经典模拟游戏《主题公园》。
但这只是开始,他始终在思考大脑是如何工作的,为了更深入地了解大脑的工作原理,Demis在2005年进入伦敦大学学院攻读认知神经科学博士学位,并开创性地发现了大脑中海马体与情景记忆间的关系。
2010年,Demis与苏莱曼、谢恩·莱格共同创办了DeepMind,目标明确:创造能够“思考”的人工智能。2016年,AlphaGo的问世震撼全球,这个AI程序不仅在围棋上战胜了世界冠军李世石,更向世界证明了人工智能在复杂认知任务上的强大潜力。随后的2017年,AlphaGo以3:0的比分击败围棋世界第一柯洁,再次刷新了人类对AI的认知。
但Demis没有止步于此。两年后,AlphaZero的推出,彻底改变了游戏规则。不同于AlphaGo的围棋专项训练,AlphaZero通过自我对弈,迅速掌握围棋、国际象棋和将棋的复杂规则,超越了所有人类顶级棋手的水平。
2018年,Demis再次将目标锁定在科学的前沿:蛋白质折叠。通过AlphaFold,DeepMind成功预测了蛋白质的三维结构,并且将所有成果开源。
电影中经常出现的列车旅行场景仿佛象征着人生的旅途以及关于AGI发展的征程。
最打动我的是Demis对于AGI阐释 “人工智能需要具备通用性,即,可以解决任意问题而不是单一问题。这是智慧的体现。”
从AlphaGo到AlphaZero再到AlphaFold,Demis对于AGI的技术理念奠定了Gemini系列模型发展的基石,Google在棋盘上验证的技术也在不断向更广泛的医疗、文化、社会领域扩展。
三、从棋局开始,不止棋局
自20世纪50年代以来,游戏一直是人工智能的试验场。
1990年,奇努克(Chinook)机器击败了世界上最好的跳棋选手,这是一个转折点。7年之后,IBM的“深蓝”超级计算机超越了国际象棋特级大师加里·卡斯帕罗夫(Garry Kasparov)。
2011年,另一台IBM机器“沃森”超越了《危险边缘》游戏的所有赢家。
之后,谷歌的AlphaGo横空出世、 AlphaZero全面进化,AI在棋类领域的胜利不仅展示了其超越人类的决策能力,更验证了深度学习的潜力。
自2022年OpenAI发布ChatGPT后,大模型爆火出圈,从科技巨头到初创公司,从模型到应用,AI发展进入加速期。
谷歌也迅速响应,去年年底Gemini1.0诞生,当时和市面上现有大语言模型相比,Gemini从一开始定位就是多模态模型,可以处理包括文本、图像、视频、音频等不同类型的信息。
今年2月,Google又推出了拥有百万token超长上下文窗口的Gemini 1.5 。三个月后又推出1.5 Pro ,上下文长度翻倍,达到200万token,同时也推出轻量级Gemini 1.5 Flash,速度更快、效率更高。
同时,在多模态领域,谷歌也发布了文生图工具Imagen 3、与Youtube&音乐家合作的“AI音乐沙盒”,以及视频生成模型Veo。
如果说去年大家还在卷模型,到今年一个明显的变化是卷向应用层,让AI落地到应用场景成了潮水翻涌的方向。
在Gemini模型的加持下,谷歌在应用方面也做出不少探索。
除了上文展示的Chess Fiction、Chating Chess、GenChess等在棋盘上推出的应用外,谷歌在AI搜索中引入多模态搜索功能,计划推出订阅服务“Gemini Advanced”,允许用户定制个性化助手,实现高度个性化交互。
在办公领域,谷歌将Gemini 1.5 Pro整合至Workspace Labs,用户可利用AI快速生成邮件摘要、分析PDF附件、提取Google Meet录音摘要等,提升办公效率。
在端侧,则计划将轻量化的Gemini Nano引入Pixel手机,借助“Circle to Search”功能,用户通过简单手势即可搜索文字、图片、视频或音频,进一步优化移动端AI体验。
还有最近爆火的AI播客生成工具NotebookLM,连OpenAI CEO奥特曼都连连称赞。
事实上,当下国内外的大模型公司已经逐渐从单纯的技术比拼阶段,悄然向产品应用的竞争维度过渡。谷歌在这一转型浪潮中,凭借自身极为广泛且完善的产品生态体系,将AI技术落地到搜索、办公软件、手机等诸多实际应用场景之中,稳步构建起庞大而多元的商业生态格局,并确立其在市场中的领先地位。
谷歌的AI技术在棋盘上找到归宿,但它的影响力早已突破棋局本身。棋盘的胜利成为AI技术向办公、生活、医疗、科学等更广泛领域延展的基石。AI正在不断突破行业边界,融入人类社会的方方面面。
棋局之上,AI为人类解锁了更多可能。
注:部分Google技术仅适用于出海开发者 。