1M AI News のモニタリングによると、匿名モデル「HappyHorse-1.0」が先週、AI動画評価プラットフォーム Artificial Analysis の Video Arena ランキングで首位に立った。文章生成動画と画像生成動画の2つのトラック(無音声カテゴリ)で同時に1位を獲得し、ByteDance の Seedance 2.0 を2位に押し下げた。音声カテゴリでは、Seedance 2.0 がわずかな差で依然としてリードしている。発表会も、技術ブログも、会社名義の署名もなく、これまで誰も公に名乗り出ていない。
Video Arena の順位は Elo のブラインドテスト方式に基づき、ユーザーはモデルの身元を知らない状態で、生成された2本の動画から優先投票を行う。HappyHorse は掲載期間が短く、対比サンプル数は約3500回で、Seedance 2.0 の半分未満。信頼区間はやや広く(±12-13ポイント)、一方で無音声トラックにおけるリード幅(文章生成動画で約76ポイント、画像生成動画で約48ポイント)はなお、誤差範囲を大きく超えている。
公式サイトの言語順(中国語と広東語が英語より前)および「HappyHorse」という2026年・午年(馬年)のジョークから、業界ではモデルが中国のチームによるものだと判断されている。主な見解は2つ:
HappyHorse の公式サイトでは、モデルは150億パラメータで、40層の自己注意 Transformer。Transfusion アーキテクチャを採用しており(同一モデル内でテキストの自己回帰予測と動画音声の拡散生成を統一的に処理する)、8ステップ推論。1080p の、同期音声付き動画を出力し、中国語・英語・日本語・韓国語・ドイツ語・フランス語・広東語の7言語に対応した口パクの同期が可能。完全にオープンソースで、商用利用も許可されている。