每经记者 文巧 李孟林 蔡鼎 谭玉涵 每经编辑 高涵 卢祥勇
(资料图片)
ChatGPT掀起的生成式人工智能(AI)竞争如火如荼,谷歌正在奋力追赶。
当地时间4月20日,据路透社报道,谷歌母公司Alphabet Inc宣布了一项重大的重组,将合并旗下两个主要的AI研究部门——DeepMind和谷歌研究院的Google Brain,以便于帮助该公司在AI领域的竞争中取得优势。
谷歌的焦急之态愈发明显,另一边,微软在大型语言模型上的布局随着媒体的不断爆料也越发清晰——早在2019年左右,微软就开始酝酿取代英伟达芯片的计划。在芯片短缺且成本高昂的情况下,微软选择自研芯片的确不失为一条出路。实际上,谷歌也早在2016年就发布了第一代TPU芯片。
一位不愿具名的硅谷工程师告诉《每日经济新闻》记者,谷歌的模型都是用TPU训练的,相对于英伟达的GPU来讲,优势在于芯片级别的互联性特别高。鉴于当前用电连接芯片的损耗过高,一个潜在的方案是光互联。
AI战事愈演愈烈,谷歌和微软都使出浑身解数,以期在这场竞赛中不落下风。但最近,OpenAI首席执行官Sam Altman的一席话却令业界哗然。
在最近麻省理工大学的一场活动上,OpenAI首席执行官Sam Altman表示,巨型AI模型时代即将终结。
实际上,Altman所说并非没有道理,为了帮助OpenAI训练ChatGPT,微软耗资数亿美元为其量身打造了超算,如此的高成本早已注定了这只是一场少数人的游戏。
上述硅谷工程师告诉记者,业内不应当只看当下的商业利益,他也在尝试劝说国内几个大佬放弃当下训练解决具体场景的大模型的思路。“我希望这个行业少一点竞争,大家直奔通用人工智能而去。如果说这是市场共识,就不会有300个公司,可能就只有具有长远远景的几家公司往这个方向努力。”他说道。
同时,随着AI之战更加白热化,就连医药公司也坐不住了。当地时间4月20日,美国生物技术公司莫德纳在官网宣布与IBM公司达成一项协议,将合作探索使用量子计算和AI等下一代技术,加速推进mRNA的研究。
在此背景下,AI竞赛的出路究竟在何方?《每日经济新闻》记者连线硅谷工程师等业内人士进行解答。
谷歌重大重组 将生成式AI引入广告
DeepMind和谷歌研究院的Google Brain合并,是谷歌追赶OpenAI和微软的最新举措。
DeepMind成立于2010年,因其研发的AlphaGo人工智能围棋程序击败了韩国围棋九段棋手李世乭而声名大噪。2014年,谷歌以5亿美元的价格收购了DeepMind,其后DeepMind 一直作为独立部门进行运营。2015年,谷歌联合创始人Larry Page宣布成立Alphabet,目的是让新业务独立于谷歌运营,Alphabet将这些新业务叫作“other bets”,它们仍然隶属于谷歌公司。DeepMind 一直是Alphabet的“other bets”之一。
过去十年,DeepMind在AI方面的集体成就涵盖了AlphaGo、word2vec、WaveNet、AlphaFold、深度强化学习等,以及用于表达、训练和部署大规模机器学习模型的分布式系统和软件框架,如TensorFlow 和 JAX;而 谷 歌 大 脑(Google Brain)也已经交付了许多备受瞩目的项目,其中包括Transformer,这项技术也是ChatGPT创建的基石。
据报道,负责监督Google Brain团队的谷歌研究院前任主管Jeff Dean将转任新设立的首席科学家职位,并领导该公司“与AI有关的最关键和最具战略性的技术项目”,包括一系列新的强大AI项目。
谷歌首席执行官Sundar Pichai当天在一篇博文中表示:“在谷歌计算资源的支持下,将所有这些人才整合成一个专注的团队,将大大加快我们在AI方面的进展。”
此外,据《金融时报》4月20日报道,谷歌还计划在未来几个月内将生成式AI技术引入其广告业务,如此便可制作更加复杂的广告内容,效果甚至可以媲美广告公司制作的专业内容。据悉,目前谷歌已经在其广告业务中使用AI技术来生成简单的提示,从而鼓励用户购买其产品。
根据内部文稿所展示的内容,广告商可以提供与特定广告活动相关的内容,如图像、视频和文本,然后人工智能将识别和整理这些材料,根据目标受众群体和广告商所要求的销售目标来生成一份广告。
微软自研芯片 秘密研发“雅典娜”5年?
自ChatGPT诞生以来,因与OpenAI结盟,微软的AI事业正乘着ChatGPT的东风扶摇直上。眼看ChatGPT这把火越烧越旺,从聊天机器人Bard到将AI融入办公系统Workspace,谷歌已频繁亮出“杀手锏”。
谷歌的焦急之态从拉响“红色警报”起就愈发明显,而另一边,微软在大型语言模型上的布局,随着媒体的不断爆料也越发清晰——早在2019年左右,微软就开始酝酿取代英伟达芯片的计划。
当地时间4月20日,据The Information最新报道,实际上早在大约5年前,微软就开始秘密研发一种内部代号为“雅典娜”(Athena)的芯片,研发人数总共300人。
微软选择自研芯片的原因很简单,算力实在太贵了。据The Information报道,为了帮助OpenAI训练ChatGPT,微软将3万多个英伟达A100芯片连接起来,耗资数亿美元为OpenAI量身打造了超算。
目前,英伟达GPU A100和H100仍是训练大模型最主流的GPU芯片。据IDC估计,GPU芯片占AI算力的90%,而英伟达占GPU市场的80%。市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,随着OpenAI进一步展开 ChatGPT和其他GPT模型的商业应用,其GPU 需求量将突破3万张(该报告计算以A100为主)。强大的市场需求和供货量的缺少使得整个科技行业都面临芯片短缺的问题。
“并不是说(A100芯片)完全无法被替代,但是它的通用性比较强,大家用起来很方便很顺手,是最适合用来训练的,”长期关注芯片产业的集微咨询资深分析师钱禹告诉《每日经济新闻》。
现在,微软想要继续开发GPT-4以及GPT-4之后模型的商业应用,必定需要大量的算力支持。
据报道,开发“雅典娜”的成本约为每年1亿美元。SemiAnalysis首席分析师Dylan Patel表示,ChatGPT的运营成本大概是每天70万美元,每次查询的成本大概为0.36美分。如果OpenAI用上微软自研芯片,成本能直降三分之一。据预测,微软可能最早在明年大面积应用“雅典娜”芯片。
印度裔CEO纳德拉 能否带领微软重回巅峰?
谈到微软发力AI,就不得不提及微软第三任掌舵——55岁的印度裔CEO萨提亚·纳德拉。从2014年2月4日出任CEO至今,纳德拉治下的微软市值已从3000亿美元以下攀升到目前的2万亿美元以上。
要知道,微软曾经是全球市值第一的公司,1999年就创造过6205.8亿美元的阶段性市值纪录,但由于错失了移动互联网时代,微软市值逐步萎缩至3000亿美元以下的水平。而正是得益于纳德拉上任后手术刀式的内外改革,才让目前微软市值重回第一阵营。
2014年成为CEO后,纳德拉调转了微软船头,他认为,“微软应该转向‘cloud first,mobile first(云优先、移动优先)’,不再是以个人计算机为先,甚至也不是手机为先。在一个‘云优先、移动优先’的世界里如何让微软实现成功,是我们面临的共同挑战。”他砍掉了不赚钱的手机业务组,布局微软2B业务的公司走向,让Office、微软云与AI成为公司研发的重点。
从那时起,纳德拉逐步带领微软重拾业界地位。在短短三年半的时间里,他让微软的市值增长超过2500亿美元。得益于不俗的公司业绩表现,2021年10月,微软八年来首次将苹果挤下最高市值宝座。也正是在那年年中,微软董事会全票通过纳德拉担任公司新任董事长。
作为硅谷最具代表性的印度裔高管之一,微软创始人比尔·盖茨曾这样评价纳德拉:“纳德拉是一位公认的领导者,他拥有超强的工程师技能、商业眼光和将众人团结起来的能力”。一语概括了一名科技公司CEO应该具有的三个特质:技术过硬,商业头脑,人际把控能力。可以说是“软”“硬”兼备。
事实上,纳德拉的成长之路并非一帆风顺。1967年出生在印度第四大城市海德拉巴的纳德拉,父亲是公务员,母亲是大学教师。15岁时,纳德拉去了海德拉巴公立学校,随后在印度理工学院(IITs)的入学考试中失败了。IITs是当时所有印度学生的最高梦想。退而求其次,纳德拉在马尼帕尔理工学院学习电气工程,并在成年后成为了第一代移民来到美国。
在美国期间,纳德拉选择攻读计算机科学的研究生学位,不过他并未入读斯坦福大学或者麻省理工,而是去了威斯康星大学密尔沃基分校。在高手如云的科技公司,他的学历背景不算突出。毕业后,纳德拉在发明Java语言的公司太阳微系统工作了几年,后于1992年加入微软,当时的纳德拉年仅25岁。
虽然学历背景不算突出,但纳德拉走的是差异化竞争这条路。他很早就表示,不想做一个纯粹的技术人员。纳德拉的同学曾问他,为什么不读一个博士学位?他回答说:“我要做招聘博士的人。”1997年,也就是在加入微软5年后,纳德拉完成了芝加哥大学的MBA项目,向着他理想的路径迈出一大步
纳德拉后来成为微软企业暨云计算部门负责人,在微软在线研究与开发部门和微软商业部担当副总裁一职。他主导的Microsoft Azure企业业务大获成功。Azure是微软云计算部门的核心,在云基础设施市场仅次于亚马逊AWS,领先谷歌。Azure已是微软新的创收利器,每个季度都保持了超过90%的营收增长率。
在这一波由ChatGPT引领的AI浪潮之下,微软之所以能率先吃到螃蟹,也是因为纳德拉接过了当初OpenAI抛出的橄榄枝。
至今,微软已经累计向OpenAI投资约130亿美元。在去年12月的微软年度股东大会上,纳德拉还表示:“即便是当今最流行的人工智能应用程序之一ChatGPT,也都是在Azure超级计算机上训练的。”
巨型模型将终结 光互联芯片才是出路?
对于渴望分到一杯羹的科技厂商来说,“现在问题是买不到芯片。对于目前训练大模型的主流芯片,例如英伟达GPU A100和(更新一代的)GPT H100,市场上所有的公司都在抢货。一个公司能抢到多少?”前述工程师表示。
在芯片短缺且成本高昂的情况下,微软选择自研芯片的确不失为一条出路。而实际上,谷歌早在2016年就发布了第一代TPU芯片,相比GPU方案,功耗和成本都大幅降低。
前述工程师告诉记者,谷歌的模型都是用TPU训练的,相对于英伟达的GPU来讲,优势在于芯片级别的互联性特别高。“一个TPU的Porte,相当于是内部互联程度互通程度非常高的一个集群,里面是有几千个芯片的,并能提供非常快的计算能力。英伟达的GPU目前还不可以,但是他们其实也在往这个方向发展。”他说道。
此外,鉴于当前用电连接芯片的损耗过高,一个潜在的方案是光互联。“也就是用光纤连接,损耗基本上可以接受,而且延时也非常低。”前述工程师说道,对于国内芯片公司来说,这也是可以考虑发展的一个方向。
“重要的是,在做技术选型的时候,你去瞄准当下还是瞄准未来。国内芯片公司可以借鉴谷歌对未来5~10年的计算能力需求的想法,参考谷歌的TPU设计,并且考虑光互联的路子。”他告诉记者。
随着AI战事愈演愈烈,国内科技厂商都正使出浑身解数,以期在这场竞赛中不落下风。但在最近麻省理工大学的一场活动上,OpenAI首席执行官Sam Altman却表示,巨型AI模型时代即将终结。他表示,AI技术进一步的进展将不会来自于将模型做大。“我认为我们正处于巨型模型时代的尽头,最终我们将以其他方式使它们变得更好。”
这一席话却令业界哗然。毕竟,自ChatGPT诞生以来,不论是海外还是国内都引发了生成式AI和大型语言模型的狂潮。国外,微软、谷歌鏖战正酣,An-thropic、AI21、Cohere和Character.AI在内的众多资金雄厚的初创公司也正在投入巨大的资源努力追赶上OpenAI。
在国内,从百度3月份发布“文心一 言”以来,多家互联网大厂、AI企业和初创团队竞相宣布了自家的大模型或计算平台。不少人感慨,中国互联网产业已经有十年没有如此“卷”过了。
但实际上,训练模型的高成本早已注定了这只是一场少数人的游戏。前述硅谷工程师也告诉记者,业内不应当只看当下的商业利益,他也在尝试劝说国内几个大佬放弃当下训练解决具体场景的大模型的思路,而是直奔GPT-5的方向,即通用人工智能的方向而努力。
“不是说我希望国内公司全都能训练出通用人工智能出来,我希望的是这个行业少一点竞争,大家直奔通用人工智能而去。如果说这是市场共识,可能就只是具有长远愿景的几家公司往这个方向努力,而不是几百个公司都在做大模型。”他解释道,“这样出来的模型,其实泛化能力会比原先的要好。”
莫德纳瞄准AI 联手IBM加速mRNA研究
随着AI之战愈演愈烈,就连医药公司也坐不住了。
当地时间4月20日,美国生物技术公司莫德纳在官网宣布与IBM公司达成一项协议,将合作探索使用量子计算和AI等下一代技术,加速推进mRNA的研究。
据悉,IBM的人工智能模型“MoLFormer”可以帮助科学家们了解潜在mRNA药物的特征,两家公司将结合最先进的配方与生成式AI来设计具安全性和有效性的mRNA药物。
根据两家公司的协议,莫德纳将加入IBM量子加速器计划和IBM量子网络。IBM方面则将向莫德纳提供量子计算系统的访问权限,协助其探索和创造新的mRNA疫苗和疗法。
新冠疫情暴发后,莫德纳因其研发生产的mRNA疫苗与辉瑞疫苗成为全球最主流的一批新冠疫苗而名声大噪。随着全球对新冠疫苗的需求放缓,莫德纳正试图扩展mRNA技术平台的临床应用以治疗其他疾病。
据报道,近年来,随着量子计算和AI技术与生物医药技术的结合不断深入,极大地促进了生物基础科研的进步和药物研发的效率。去年,谷歌AlphaFold人工智能软件成功预测了人体几乎所有的蛋白质结构,意味着人工智能开始攻克生物科学和医学领域的重大难题。
每日经济新闻