2月21日,谷歌宣布正式发布了一款名为Gemma的开源大模型。而令人吃惊的是,这一发布距离谷歌上一次发布大模型Gemini1.5还不到一周时间。这表明大模型领域的竞争正在变得越来越激烈。
Sora的发布加剧了竞争
在2月15日,OpenAI发布了一款名为Sora的产品,它具备文生视频的能力,再次震撼了整个行业。即使是之前曾在视频领域引起轰动的公司如Runway和Pika的创始人,也不得不承认Sora的强大。
Sora以一种“病毒式”的传播在全球范围内迅速扩散,再次证明了OpenAI在营销方面的能力。正因为如此,即使Gemini 1.5在发布时刚好早于Sora两个小时,却无法获得本该属于它的全球关注度。
这一系列事件再次彰显了人工智能大模型领域的剧烈竞争。谷歌和OpenAI作为两大领先的公司,在不断推出创新产品和技术的同时,也在营销策略上展现出了巨大的竞争力。而消费者和行业观察人士也将从这些竞争中受益,因为这些竞争将推动产品的不断创新和提升。
无论是谷歌的Gemma还是OpenAI的Sora,它们的发布都为人工智能大模型领域注入了新的活力。我们可以期待,随着竞争的不断加剧,这个领域将会呈现出更多令人兴奋的创新产品和技术。
无论二者同期发布是奥特曼有意为之,还是一场意外,在巨头之间的大模型竞争已经到了白热化的现在,谷歌都需要再亮出一张底牌,重新赢得市场的关注。
Gemma是什么?
Gemma名字来源于拉丁语的“宝石”,灵感来自Gemini。它是谷歌最近开源的大模型。
这次谷歌发布的Gemma包含两个“小”模型,Gemma 2B和Gemma 7B,由于参数规模分别为20亿和70亿,参数规模并不大,谷歌将这两个模型归为轻量级开放模型系列。Gemma采用了和谷歌此前发布的主力大模型Gemini相同的技术架构,这使得Gemma成为可以直接在笔记本和台式机上运行的端侧大模型。
官方宣称Gemma是使用范围最广,功能最强大的AI模型。与其他大模型相比,Gemma是同类型尺寸中性能最佳模型。
在多项关键基准测试中,Gemma分数明显超越了Meta的Llama-2模型。
从开源方面来看,谷歌Gemma并不是第一个开源大模型。
早在2023年7月,Meta就对外发布了免费可商用的大模型Llama 2,而这一动作其实是Meta和微软合作的杰作,拥有7B、13B、70B三个参数级版本的Llama 2,当时被视为是OpenAI的ChatGPT的平替产品。
就在Meta开源Llama 2时,Yann LeCun不无感慨地公开表示,Llama 2的开源可商用将极大地改变大模型的市场格局。
国内开源大模型
而从国内来看,阿里是另一个开源大模型的推动者。
2023年8月,阿里云对外开源了通义千问7B大模型,成为国内最早推动大模型开源的企业,随后,阿里云又先后对外开源了14B、72B、1.8B参数规模的大模型,参数规模最大的72B版本,甚至超过了Llama 2。
科技巨头之所以愿意开源大模型,是为了借助开源社区的力量来加快技术的发展速度。这也是谷歌此次开源Gemma模型的主要目的。
未来大模型竞争激烈
在正式发布Gemma时,谷歌还告知了该模型在开发工具和运行平台上的支持情况。具体来说,Gemma提供Keras、PyTorch、JAX和Hugging Face Transformers等多种深度学习框架的实现参考。此外,Gemma模型可以在Notebook电脑、台式机、IOT设备、手机以及云端等主流设备上运行。并且,通过与NVIDIA的合作,可利用GPU来提升Gemma在计算能力上的表现。Google Cloud的Vertex AI也提供丰富的MLOps工具,如微调选项和一键云端部署功能。
面对Meta即将发布Llama 2.0,谷歌率先推出开源的Gemma模型。甚至将Gemma与Llama在一些基准测试上的表现进行了对比,显示 former优于后者。
无论从“攻击”或“防御”的角度来看,Gemma的开源意义在于表明了谷歌在AI开源上的态度。未来2024年,大模型的竞争将会更加白热化。