AI時代、「共有計算力」は新しいプログラマーたちの小黄車

TechubNews · 2026-04-08T08:28:43+00:00

出典：極客公園執筆：徐珊「トークンのコストが急落している。」この言葉を2年前に聞いたら、きっとすべてのAIスタートアップ起業家は興奮しただろう。2023年から2025年にかけて、AI推論コストは99.7%下がった。GPT-4がリリースされた当時、1百万トークンあたりのコストは37.5ドルだったが、2025年にはこの数字は0.14ドルまで下がっている。この傾向から考えると、計算能力のコストは起業家にとって問題にならないはずだ。しかし現実は、まったく逆だ。同じ期間に、世界の企業のAIクラウド支出は11.5億ドルから37億ドルへと急増し、3倍以上に膨れ上がった。AIがA2A時代に入った後、数十のエージェントが反復的に相互作用することで、トークン呼び出し量は指数関数的に爆発的に増加した。これもまた、

TechubNews

2026-04-08 08:28:43

出所：極客公园

執筆：徐珊

「トークンのコストが暴落しています。」

この言葉を2年前に置いたら、AI起業家の誰もが興奮しただろう。2023年から2025年にかけて、AI推論コストは99.7%下がった。ご存じのとおり、GPT-4がリリースされた時点では、100万トークンあたりのコストは37.5米ドルで、2025年にはこの数字が0.14米ドルまで下がっている。この傾向なら、計算資源（算力）コストは起業家にとって問題ではないはずだ。

しかし現実はまさにその逆だ。

同じ期間に、世界の企業によるAIクラウド支出は115億米ドルから370億米ドルへと急増し、実に3倍になった。AIがA2A時代に入った後、数十のエージェントが反復的にやり取りすることで、トークン呼び出し量は指数関数的に爆発した。これにより、トークン単価はより安くなったにもかかわらず、1つのタスクで消費されるトークン量が狂ったように増えた。

明らかに、算力はこの時代で最も奇妙な資源になりつつある。どんどん安くなっているのに、そこにかけるお金はますます増えていく。

巨大企業にとって、この問題は自社で算力センターを建てれば解決できる。しかし大多数のスタートアップにとっては、公共の算力市場に立つしかなく、クラウド事業者の価格設定を受け入れることしかできない。算力の請求書は月ごとに高くなっていくのを見ているだけだが、値引き交渉の余地は一切ない。

共績科技の創業者・付智が見ていたのは、まさにこの市場のズレによって生まれた商機だ。

彼の考えでは、算力コストを下げる解法は、コストが自然に下がるのを待つだけではない。算力の使い方を別のものに変えることで、同じように算力コストの低下を始められる。算力を電力のように、必要なときにすぐ使えて、従量課金にし、大量にアイドルの状態で浪費されていた算力リソースを再び稼働させる。

近日、共績科技はPre-Aラウンドの資金調達を完了し、投資後評価額は人民元3.5億元で、近くAラウンドの資金調達も開始する予定だ。算力レース全体で圧力がかかりやすい2025年において、この「人工知能の方法でリソース調整（スケジューリング）問題を解決する」テック企業は、こっそり数千万元規模の売上を達成し、顧客の継続率は100%に近い。

共績科技は、算力調整を“本物の商売”にしようとしている。

共績科技創業者付智　画像出所：共績科技

01 AI企業が爆発すると、算力コストという帳尻に新しい解法が生まれる

新商品のローンチ直前、Remyのチームはほとんど眠らず、いつでも突発事態に備えていた。

だが、実際に会社のWebサイトに48時間で50万人のユーザーが殺到したとき、内テストからパブリックベータへ移行したばかりのAIスタートアップにとって、短時間であらゆるインフラを数十倍に増強する必要が出てきた。準備はしていたものの、ローンチ前にRemyはUcloud、阿里雲、華為雲など複数のクラウドサービスを事前テストしていた。それでも、降って湧いた流入が本当に叩き込まれた瞬間に、最終的な解決策を提供したのが共績科技だった。

要するに、共績科技がやっていることは、遊休の算力を調整して稼働させ、需要に柔軟性のあるAI企業へ、必要に応じて配分することだ。夜間に空回りしているネットカフェのマシンも、個人ユーザーの4090も、小規模なマシンルームの遊休リソースも、共績科技が調整できる算力プールの一部になり得る。顧客の需要が足りなければ、算力プールの中で随時追加調達して、必要な分だけ使う。

その48時間で、共績科技は緊急にRemyへ約1900枚のGPUカードを手配した。ユーザーがリクエストを1回起こすたびに新しい注文が発生し、ユーザーの計算が完了すると注文は即座にクローズする。その日、プラットフォームは100万件以上の注文を処理した。

「ピークの時間帯には、一般的な算力サービス事業者でも臨時に20枚のカードを用意するのが難しいことが多い。もっと多いケースでは、企業側が待つ必要があります。でも待つことはトラフィックの流出を意味します。それは企業が絶対に見たくないことです。」付智は、この件の後に、Remyが使っている算力の大半が共績科技によるものだったと話している。

Remyの算力に対するニーズは、実はとてもシンプルだ。トラフィックが爆発したときに、ユーザーのクリックへタイムリーに応答できること。算力の呼び出しが速くてタイムリーであること、そしてコストが低いこと。これらは、立ち上げたばかりのAIスタートアップにとって、算力に求める最も基本的なニーズだ。

対照的に、算力需要に直面する顧客の中には、よりニッチではあるが現実的なタイプもある。

昨年の春節期間に、景勝地でAIの着せ替え撮影を行う会社が共績科技を訪ねてきた。彼らは、流入が爆発するタイミングがいつなのかを知らないわけではないが、それでも算力コストの帳尻をうまく合わせるのは難しかった。

彼らのAI機器は景勝地に多く設置されていて、連休や祝日になると人であふれ、算力需要が急増する。しかし休みが終わると、算力需要はほぼゼロに戻る。「春節は年間最大のピークで、残りの半年あまりは景勝地に人があまりいません。」彼らは付智にそう伝えた。

こうした算力の変動を踏まえると、もしピークに合わせて算力をレンタルするなら、普段の90%の時間でお金を使ってカードを“養う”ことになる。平均値に合わせてレンタルするなら、春節の期間は需要が崩壊してしまい、ユーザー体験に大きく影響する。「この種の需要の変動は、従来の算力サービスの提案では、適切なソリューションを得にくい。なぜなら、この極端なピークと谷の差に対して、標準的な製品にはそもそも対応する価格設定ロジックが存在しないからです。」付智はそう語った。

しかし、このようなシーンは、共績科技の算力共有プラットフォームを使うのに非常に適している。

その月、サービスノードは1963台の個人用コンピュータに入れ替わり、春節の間に安定性の問題は一度も発生しなかった。「顧客自身がピークに合わせて算力をデプロイするのに比べて、私たちは約70%の費用を節約できました。」付智は付け加えた。

こうした時間変動型の需要は、ニッチな業種の小さなシーンだけに出るわけではなく、多くのAI新興企業にとっても同様によくある。

liblibは国内でユーザー数が最大級のAI画像生成プラットフォームの1つだ。彼らはクラウド事業者のプラットフォームで大量のGPUカードをレンタルしていた。しかし詳しく調べてみると、GPUの平均的な算定利用率は全体として45%にしかならないことが分かった。

つまり、半分以上のカードが毎日、ただ無駄にお金を燃やしていることになる。

付智によれば、実はliblibのような企業は少なくない。会社員層を主なユーザーとするAIアプリやツールのほとんどが、この問題に直面している。昼間はユーザーが集中して利用し、夜にはユーザー数が大幅に減る。ピークに合わせて算力を配分すれば夜間は稼働率が高くなるが、平均値で配分すると昼間はすべてのユーザー需要を満たせない。

AI業界はにぎやかに見えるが、会社の発展の生命線を止めてしまうのが、算力コストの帳尻になる可能性がある。多くの企業が算力への見積もりを過大に設定してしまい、算力コストがキャッシュフローを押し潰すこともある。逆に、算力の見積もりが不足して、使用量のピークでサービスが崩壊し、ユーザーが離れて二度と戻ってこないケースもある。

「AIアプリのトラフィックは本来、波動があるものです。算力市場の価格ロジックは、安定需要のために設計されていて、算力コストの配分方法もずっと比較的従来のやり方のままです」付智はそう語った。だからこそ、AI企業が本当に爆発したとき、算力コストという帳尻には新しいアルゴリズムが必要になる。

これまで、従来の算力サービスモデルは長期レンタル契約が中心だった。企業は1年分の算力を借り、使おうが使うまいが、算力に対する前払い費用が必要になる。算力がアイドル状態になるコストは主に企業自身が負担する。共績科技がやっていることは、実際にはこのコストを別の場所へ移すことだ。つまり、もともと遊休算力があるのに、自分では走り切れない人たち、たとえば個人ユーザーやネットカフェなどが持つ算力だ。これらの算力は本来、浪費されている。調整しても新たな算力コストは発生させず、すでに存在している遊休算力を活性化する。

「算力は多ければ多いほどいいわけではない」付智は言う。「重要なのは、流動的で、いつでも呼び出せることです。そうでないとね。」

02 弾性算力というこの商売は、エネルギー調整能力が試される

付智にとって、算力調整で商売をするためのきっかけは、実はある偶然のチャンスから生まれた。

2023年5月の連休、ちょうどAIの波が芽吹き始めた時期に、付智はAI起業家のコミュニティへ1通のメッセージを投げた。内容はとても単純だ。「A100があります。短く借りれば借りるほど安い。必要な人は来てください。」

当時の彼は、自分の期待はあまり大きくなかった。なぜならGPUは1枚しかなかったからだ。ところが結果は予想外で、最後には30人が相談してきて、しかも皆が快く支払ってくれた。

「お金を払うのが早い人に渡す。」彼は最終的に5人を選んで対応した。1枚のカード、5人の顧客。このことで、彼がずっと考えていた判断が裏付けられた。一般の人も算力を必要とし始めているのだ。

しかし彼は、この商売がそのタイミングで成立した理由は、運が良かったからではなく、その前にはそもそも成立する条件がなかったからだと分かっていた。

1999年には、すでに算力共有の構想を持つ人がいて、BOINCのプラットフォームを構築し、数十万人がそこで算力を提供していた。ただ当時は公益性のある科学計算プラットフォームで、誰もが無料で利用できた。後にビットコインが熱くなり、マイニングの熱気に乗って遊休算力を調整しようと考える人もいたが、それは合法ではなかった。

アイデアはずっとあったが、土壌がずっとなかった。

なぜなら、本当の意味で高性能GPUを持つ一般ユーザーは、90年代生まれ、00年代生まれの世代だからだ。それ以前は、個人のPC構成に4090が入っている人は多くなかった。さらに、個人PCでLinuxの仮想環境を安全に動かすWSL1.0.0も2022年になってから正式にリリースされたばかりだ。遠隔呼び出しで各地の個人デバイスを利用し、それを社内ネットワークへ貫通させる技術も、2021年前後になってようやく本格的に成熟した。

供給側、需要側、そして技術的な条件という3つが揃ったからこそ、今日この商売が可能になった。

ただ付智は、彼が本当に「時機が来た」と見つけたサインは、DeepSeekでも一体型マシンでもなく、AIの消費シーンがニッチなツールから一般の人の毎日の娯楽へ浸透し始めていることだと考えている。

「このプロセスが加速すれば、算力需要は数社の大手が買い付けるものではなくなる。電力と同じように、大規模かつノードをまたいで調整・分配される必要があるはずです。」付智はそう語った。

これが、共績科技が国家算力センターとの協業に向けた交渉を進めている理由でもある。現在、彼らはすでに京津冀、長三角、深圳、青海の省レベルの算力調整プラットフォームの構築に参加しており、各地で組み上げられている調整システムにも技術面で共績の関与がある。

ただし、「算力調整」は思っている以上に難しい。

算力調整と算力管理は同じではない。付智は調整と管理を区別して説明する。大手がやっているのは管理で、たくさんのマシンを同一のシステムに取り込み、誰が使っていて誰が空いているかは分かるが、地域やデバイスをまたいだ動的配分の実現は難しい。

一方、算力調整は別の話だ。ある場所のピーク需要を、別の場所の遊休算力で埋める必要がある。これはコンピュータ工学の分野では実は既成の解法がない。むしろエネルギー分野の昔からの問題で、「ピークカット＆バレー充填（削峰填谷）」という言葉自体が、もともと電力システムの用語だ。

付智の学部は清華大学の建築環境・エネルギー応用工学で、指導教員はエネルギー分野の院士だった。彼はエネルギー調整のアルゴリズムを算力版に移植し、解決しているのは算力における同じ問題で、これこそが共績の最核心の壁だ。

もちろん、エンジニアリングとして、このような地域をまたぐ調整体系を作るには、難しい問題も少なくない。たとえば、調整プールへ接続した個人用PCは、いつでも「占有される」可能性がある。ユーザーがゲームを起動したら、そのマシンは退出しなければならない。しかし下流の顧客はサービスを止めてはいけないという要求がある。

付智が選んだのは、ホットスタンバイと予測、つまり各タスクに対して事前に冗長なノードを用意しておき、同時に蓄積した過去データから各供給側のオンライン傾向を予測し、バックアップ比率を動的に調整することだ。データが多いほどバックアップはより正確になり、コストは低くなる。「以前は2台のマシンをバックアップとして用意する必要があった。でも、使うにつれて、今は1台で十分になった。」ネットワーク転送層も不安定だ。共績の対応は、同時に3つの大手クラウド事業者を接続することだと付智は言う。「同時に全部がダメになるはずがない」。

では、クラウド事業者はなぜ弾性算力をやらないのか？

付智の説明では、大手は見えているが、大手の弾性算力は製品の位置づけや価格戦略が共績とは異なる。共績の強みは価格と調整効率だ。

弾性算力の核心的な矛盾は、あなたが事前に「いつでも呼び出せる」算力を用意しておく必要があるのに、それらの算力は誰も使わないときは純粋な遊休コストになることだ。一般的な算力サービス事業者の弾性拡張は、通常価格の約5倍程度になるか、あるいは顧客に1年の長期契約を結ばせ、その遊休算力のリスクを顧客側に負担させる。

共績が本当の意味での弾性を提供できるのは、使っているリソースがもともと遊休だからだ。これらのリソースは、事前に調達してコストを圧縮する形にはなっていない。元々使われていないものなので、共績はより有利な価格を提示できる。

付智の分析によれば、市場全体では算力需要の80%が大手の長期レンタル一括（パッケージ）に流れ、残り20%が弾性需要の部分だ。付智は80%を奪いに行くつもりはなく、もっと注力しているのは20%の市場であり、AIアプリが継続的に成長するにつれて、この20%の市場規模もますます大きくなる。「相手のところでは、長く借りるほど安い。うちでは、短く借りるほど安い。」付智は補足した。現在、共績科技の共有算力プラットフォーム「suanli.cn」では、一般消費者がミリ秒単位で関連する算力をレンタルできる。

共績科技チーム集合写真　画像出所：共績科技

このような共有ビジネスモデルは、実はすでに他の領域で検証されている。

付智は、このビジネスの本質をAirbnbに例える。都市で大型の展示会があると周辺のホテルが満室になる。Airbnbは、遊休の部屋を持つ住民と、宿が取れない参加者をマッチングする。算力版の物語も同じパスだ。AIアプリはバージョン公開やトラフィック爆発の瞬間に大量の算力が必要で、普段の需要はその量に遠く及ばない。一方で、個人ユーザー、ネットカフェ、小規模なサーバールームの算力は夜や平日に大量に遊休している。両者をつなぐのが、共績がやっていることだ。

ただし、共有するのは部屋ではなく算力だ。

03 算力エネルギー調整、AI時代の「ソフトウェア定義インフラストラクチャ（Software-Defined Infrastructure）」

この道は、海外にも先行して歩んだ人がいる。例えばRunPodは、余剰算力を通じて弾性推論サービスを提供しており、2024年に英テル資本（Intel Capital）とDell Technologies Capitalが共同でリードした2000万米ドルのシードラウンドを獲得している。顧客にはCursor、OpenAI、Perplexityが含まれる。

しかし、米国でこれをやるのと、中国でやるのは、付智の見解ではまったく別の話だ。

AWSは誕生以来、弾性算力を提供しており、当初からオンデマンド利用を約束し、高価格の弾性サービスで成熟した市場に対応してきた。だが国内のクラウド事業者は、長期レンタルモデルを提供する傾向が強く、関連する優遇政策もそこに寄っている。弾性サービスへの重視度は高くなく、ユーザーの弾性算力への支払い意思も米国より大幅に低い。したがって、RunPodのロジックをそのまま国内に持ち込んでも、価格設定が成立しない。

ただ付智は、算力調整は“算力の貸し出し”だけを見る商売ではないと考えている。「共有算力は、単なるノックのための切り札（敷居を下げる入口）に過ぎないかもしれない。」彼はこの話をするとき迷いはなかった。彼の判断では、この商売にはおそらく2〜3年のウィンドウがある。算力の供給と需要のミスマッチがまだ続く限り、この隙間は存在するが、それは永遠には続かない。

このような冷静さは、起業家の中ではあまり見られない。しかしだからこそ、彼はもっと根本的なことを早くから考え始めていた。次に本当に爆発するAIアプリはどこから生まれるのか？この判断は、算力需要の行方を直接左右する。これについて付智は、将来を見据えた2つの見立てを持っている。

1つ目は、彼の分析によれば、中国のスーパーアプリはPC端の生産性ツールからは生まれない。真にチャンスがある方向は、モバイル端末のソーシャル娯楽、サプライチェーンと結びついた越境ハードウェア、そして実生活のシーンに埋め込めるAIアプリだということだ。

中国のインターネットは、深いPC生産性ツールの時代を経験したことがない。ユーザーはフィーチャーフォンの時代から、直接モバイルインターネットへ飛び込んだ。米国で伸びているAIドキュメント、AIスライド、AIコードアシスタントは、その背後に数千万の「PCで仕事をしていて、SaaSツールにお金を払う習慣がある」ユーザー層に依存している。しかし中国にはそれがない。「全中国で1億人以上がWordを書く必要があるのか？たぶんないと思います。」さらに厄介なのは、仮に需要があったとしても、大手がすぐにこれらの機能を無料のプラグインとして提供してしまうことだ。

彼はむしろ、ソーシャル娯楽のシーンで高い成長を見ていた。彼はショートドラマや映像の事業者と多く対話し、なぜ彼らがAIを積極的に取り込んでいるのかを尋ねた。相手のフィードバックが、彼に新しい考えをもたらした。「失うものがもうない。映画もドラマも誰も見ていない。私たちはもうすぐ死んでしまう。」これらの人たちは中国市場で最もAIを受け入れている層で、最先端の技術を理解しているからではない。逃げ場がないからだ。「いま、テレビや映画を見ている人はもういない。」

そしてAIハードウェアの発展についても、彼は少し違う見方をしている。

過去数年、AIハードウェアの主流の発想は「万物に対話ボックスをつける」、つまり何にでもチャットウィンドウを付けるというものだった。付智はこの方向性は違うと考えている。「消費者は詩を書ける冷蔵庫なんて必要ない。」

本当に生命力のあるAIハードウェアは、ユーザーがもともと持っている高頻度の利用シーンに入り込み、AIが裏で黙々と動いて完了させること。ユーザーを引っ張って、わざわざ座らせてAIとチャットさせるのではない。

たとえば、ペットカメラは猫が病気かどうかを自動で認識できるべきで、景勝地のカメラは着せ替え撮影を自動で完了させるべきだ。ユーザーは何も変える必要がなく、AIがそっと仕事を終える。「こうしたハードウェアがオープンソースモデルでデプロイできるなら、トラフィック爆発のタイミングでも弾性算力の顧客になり得る。」付智はこれも、共績科技の今後の成長ポイントの1つだと考えている。

付智の2つ目の見立ては、さらに深く隠れており、2024年末にはすでに形になっていたが、彼がそれを検証できる機会が来るまで今年まで待っていた。

彼は、「人がAIと直接対話する」こと自体が、効率の無駄だと考えている。人間の情報の入出力には上限があり、1回に1つの質問しかできず、答えが出てから次の質問をする必要がある。しかしAIは何千ものスレッドを同時に処理でき、ミリ秒の間に機械同士の情報伝達を完了する。「人間でAIを動かすのは、一番遅いボトルネックを使うようなもので、システム全体の速度を引きずってしまう。」

本来起きるべきなのは、AIとAIが直接協働することだ。A2A。あるタスクが指示されると、AIの一連の連鎖運転が起動し、人は目標を定義するだけでよく、中間の各ステップに参加する必要はない。これが、今日OpenClawが重視されている理由でもある。付智は、OpenClawが本当に重要なのは製品そのものではなく、それが「AIとAIの間でコミュニティが自動的に形成され得ること」を証明しているからだと考えている。A2Aで誰かが実際にお金を払う、この方向性は成立する。

A2Aモードが主流になれば、算力の消費は今日の数倍、あるいは数十倍になる。黄仁勋（ジェン・セン・ハン）はGTC 2026で、Agentic AIと推論能力の爆発により、当時必要とされる計算量は前年の予測より少なくとも100倍になっており、それは始まりにすぎないと述べた。そうなれば、算力は本当に電力のようになる。考えるべきは、どれだけカードを買いだめする必要があるかではなく、整備された「算力電力網（算力グリッド）」全体が、必要に応じて配分できるかどうかだ。算力リソース管理は、調整の領域へ到達する。

A2Aが本格的に到来すれば、算力は電力のように、誰にとっても、あらゆるタスクにとっても、そして各AIノードの背後にある基盤インフラになる。その時、誰が地域・デバイス・時間帯をまたいで算力を精密に調整できるのか、その人こそが、この網の本当の運用能力を握る。

付智の見立てでは、共績科技が今やっていることは、その時刻の準備だ。これからの2〜3年というウィンドウを使って、調整能力、ノードのネットワーク、顧客関係を構築する。A2Aの需要が本当に爆発するとき、この体系こそが共績科技の本当の堀（参入障壁）になる。

彼は最近、社内で1つの言葉を発した。インタビューが終盤に差し掛かったとき、彼はそれをもう一度繰り返した。

「それでも、このすべてはまだ始まったばかりだ。」

弾性算力の文脈で考えると、この言葉は起業家が市場に対して抱く楽観的な判断に過ぎないかもしれない。しかしA2Aの文脈で、彼が言う「開始」は、この商売が始まることを意味しているのではなく、算力がインフラであるという命題が、本当に始まる時が来たのかもしれない。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。