Google DeepMindは4月6日、Gemma 4を正式に公開しました。これはGemmaシリーズのオープンウェイトモデルの第4世代で、4つのバージョンが提供されます。ライセンスはApache 2.0に変更され、多モーダル入力とagentのワークフローに対するネイティブなサポートが追加されています。
4種類の仕様:モバイル端末からサーバーまで全面カバー
31Bの高密度モデルは、Arena AIのテキストランキングにおけるオープンソースモデルの中で3位に位置づけられています。26Bの混合専門家モデルは6位です。Googleは、2つの大型モデルがArena AIのベンチマークテストにおいて、パラメータ数が最大20倍多い他のモデルに比べても優位性があると述べています。
主要な能力:多モーダル、音声、140種類の言語
4つのバージョンはいずれも、動画と画像の多モーダル入力をネイティブにサポートしており、OCRと図表の理解をカバーします。エッジ版(E2B、E4B)は、さらに音声入力をサポートし、音声認識のシーンで利用できます。
すべてのモデルは、関数呼び出し(function calling)、構造化JSON出力、そしてagentのワークフローを構築するためのネイティブなシステム指示をサポートします。学習データには140種類以上の言語が含まれています。
ライセンスはカスタムからApache 2.0へ変更され、商用利用により適しています
これまでのGemmaシリーズで使われていたカスタムライセンスには、改変や再配布に制限がありました。Gemma 4は業界標準のApache 2.0ライセンスに切り替えられ、商用利用、改変、再配布を許可し、Googleと別途で協議する必要はありません。Googleは、これによりGemma 4が企業や開発者のアプリケーションにより適するようになったと述べています。
4つのモデルはすでに全面的に利用可能です。Googleは現時点で、エッジモデルをAndroidまたは消費者向けハードウェア製品に統合する時期の予定をまだ公表していません。
この記事「GoogleがGemma 4を発表:4つの仕様、Apache 2.0ライセンス、スマホからサーバーまで全面カバー」は、最初に「鏈新聞 ABMedia」に掲載されました。