2月21日，谷歌宣布正式发布了一款名为Gemma的开源大模型。而令人吃惊的是，这一发布距离谷歌上一次发布大模型Gemini1.5还不到一周时间。这表明大模型领域的竞争正在变得越来越激烈。

Sora的发布加剧了竞争

在2月15日，OpenAI发布了一款名为Sora的产品，它具备文生视频的能力，再次震撼了整个行业。即使是之前曾在视频领域引起轰动的公司如Runway和Pika的创始人，也不得不承认Sora的强大。

Sora以一种“病毒式”的传播在全球范围内迅速扩散，再次证明了OpenAI在营销方面的能力。正因为如此，即使Gemini 1.5在发布时刚好早于Sora两个小时，却无法获得本该属于它的全球关注度。

这一系列事件再次彰显了人工智能大模型领域的剧烈竞争。谷歌和OpenAI作为两大领先的公司，在不断推出创新产品和技术的同时，也在营销策略上展现出了巨大的竞争力。而消费者和行业观察人士也将从这些竞争中受益，因为这些竞争将推动产品的不断创新和提升。

无论是谷歌的Gemma还是OpenAI的Sora，它们的发布都为人工智能大模型领域注入了新的活力。我们可以期待，随着竞争的不断加剧，这个领域将会呈现出更多令人兴奋的创新产品和技术。

无论二者同期发布是奥特曼有意为之，还是一场意外，在巨头之间的大模型竞争已经到了白热化的现在，谷歌都需要再亮出一张底牌，重新赢得市场的关注。

Gemma是什么？

Gemma名字来源于拉丁语的“宝石”，灵感来自Gemini。它是谷歌最近开源的大模型。

这次谷歌发布的Gemma包含两个“小”模型，Gemma 2B和Gemma 7B，由于参数规模分别为20亿和70亿，参数规模并不大，谷歌将这两个模型归为轻量级开放模型系列。Gemma采用了和谷歌此前发布的主力大模型Gemini相同的技术架构，这使得Gemma成为可以直接在笔记本和台式机上运行的端侧大模型。

官方宣称Gemma是使用范围最广，功能最强大的AI模型。与其他大模型相比，Gemma是同类型尺寸中性能最佳模型。

在多项关键基准测试中，Gemma分数明显超越了Meta的Llama-2模型。

从开源方面来看，谷歌Gemma并不是第一个开源大模型。

早在2023年7月，Meta就对外发布了免费可商用的大模型Llama 2，而这一动作其实是Meta和微软合作的杰作，拥有7B、13B、70B三个参数级版本的Llama 2，当时被视为是OpenAI的ChatGPT的平替产品。

就在Meta开源Llama 2时，Yann LeCun不无感慨地公开表示，Llama 2的开源可商用将极大地改变大模型的市场格局。

国内开源大模型

而从国内来看，阿里是另一个开源大模型的推动者。

2023年8月，阿里云对外开源了通义千问7B大模型，成为国内最早推动大模型开源的企业，随后，阿里云又先后对外开源了14B、72B、1.8B参数规模的大模型，参数规模最大的72B版本，甚至超过了Llama 2。

科技巨头之所以愿意开源大模型,是为了借助开源社区的力量来加快技术的发展速度。这也是谷歌此次开源Gemma模型的主要目的。

未来大模型竞争激烈

在正式发布Gemma时,谷歌还告知了该模型在开发工具和运行平台上的支持情况。具体来说,Gemma提供Keras、PyTorch、JAX和Hugging Face Transformers等多种深度学习框架的实现参考。此外,Gemma模型可以在Notebook电脑、台式机、IOT设备、手机以及云端等主流设备上运行。并且,通过与NVIDIA的合作,可利用GPU来提升Gemma在计算能力上的表现。Google Cloud的Vertex AI也提供丰富的MLOps工具,如微调选项和一键云端部署功能。

面对Meta即将发布Llama 2.0,谷歌率先推出开源的Gemma模型。甚至将Gemma与Llama在一些基准测试上的表现进行了对比,显示 former优于后者。

无论从“攻击”或“防御”的角度来看,Gemma的开源意义在于表明了谷歌在AI开源上的态度。未来2024年,大模型的竞争将会更加白热化。

谷歌gemma：先进的轻量级开源大模型

Sora的发布加剧了竞争

Gemma是什么？

国内开源大模型

未来大模型竞争激烈