CoinDesk Japanが報じるところによると、4月3日、GoogleはマルチモーダルモデルGemma 4を発表しました。Gemma 4は、テキストおよび画像入力(小型モデルは音声入力をサポート)を処理し、テキスト出力を生成するために使用できます。このバージョンには、事前学習と指示チューニングを行ったオープンウェイトのモデルが含まれています。Gemma 4のコンテキストウィンドウは最大25.6万トークンを収容でき、140種類以上の言語に対応しています。Gemma 4は、密な型のアーキテクチャと、混合専門家(MoE)アーキテクチャの両方を採用しており、テキスト生成、エンコーディング、推論などのタスクに適しています。これらのモデルには4種類の異なる規模があり、E2B、E4B、26B A4B、31Bで、スマホからノートパソコン、サーバーまでさまざまな環境にデプロイできます。
GoogleはマルチモーダルモデルGemma 4を発表しました
CoinDesk Japanが報じるところによると、4月3日、GoogleはマルチモーダルモデルGemma 4を発表しました。Gemma 4は、テキストおよび画像入力(小型モデルは音声入力をサポート)を処理し、テキスト出力を生成するために使用できます。このバージョンには、事前学習と指示チューニングを行ったオープンウェイトのモデルが含まれています。Gemma 4のコンテキストウィンドウは最大25.6万トークンを収容でき、140種類以上の言語に対応しています。Gemma 4は、密な型のアーキテクチャと、混合専門家(MoE)アーキテクチャの両方を採用しており、テキスト生成、エンコーディング、推論などのタスクに適しています。これらのモデルには4種類の異なる規模があり、E2B、E4B、26B A4B、31Bで、スマホからノートパソコン、サーバーまでさまざまな環境にデプロイできます。