元テスラAI総監の前職で、OpenAIの創設メンバーであるAndrejo Karpathyは、4月9日にX上で長文を投稿し、公衆のAI能力に対する認識が深刻に分断されつつあると指摘した。彼は、無料版ChatGPTを使う人と、毎日Codex、Claude Codeなどの最先端のエージェントツールを使う技術者は、実際には「まったく別の製品」を議論しているのだが、双方とも自分が見ているものがAIの全貌だと思っている、と考えている。
2つの世界、2種類のAI認知
Karpathyは、現在のAI利用者を2つのグループに分けている。
1つ目のグループの人たちは、去年のどこかの時点でChatGPTの無料版を試し、それによってAI全体に対する印象を形成した。彼らが目にするのは、モデルのさまざまな失敗だ――幻覚、検索結果の支離滅裂、音声モードで「車で行くべきか、それとも歩いて洗車に行くべきか」といった単純な質問ですら失敗する。Karpathyは、これらの問題が確かに存在することを認めつつも、無料版と旧式モデルでは、2026年の最先端エージェントモデルの真の能力を代表できないと強調している。
2つ目のグループの人たちは、2つの条件を同時に満たす。最新の最先端エージェントモデル(OpenAI CodexやClaude Codeなど)を有料で使っていること、そしてプログラム開発、数学、研究などの技術分野で専門的に活用していることだ。Karpathyは、この人たちが非常に高い「AI精神的衝撃」(AI Psychosis)を経験していると述べている。なぜなら、これらのモデルの技術領域における最近の進歩は「驚くほかない」としか言いようがなく――あなたは目の前で、それまで数日、場合によっては数週間かかっていたプログラムの構造化の問題を、たった1時間で解決してしまうのを見ていられる。
なぜ進歩は技術領域に集中するのか
Karpathyは、AIの能力向上がなぜプログラム開発などの技術領域で特に顕著で、検索、文章作成、提案など一般用途ではあまり明確ではないのかを説明した。
理由は2つある。1つ目は、技術領域には検証可能な報酬関数があることだ(例えば単体テストが通るかどうか)。これにより強化学習の訓練が効果的に機能する。対して文章の品質の良し悪しは明確に判定しにくい。2つ目は、技術領域がB2Bの場面でより大きな商業価値を持つため、AI企業が最大の割合のチームリソースをこれらの方向に投入していることだ。
2つのグループは互いに相手の言っていることが分からない
Karpathyはまとめとして、これら2つのグループは「それぞれ別の話をしている」と述べた。OpenAIの無料版の音声モードが日常の問題をうまく処理できないのに対し、OpenAIの最上位の有料版Codexは、1時間でプログラム全体のコードベースを再構築したり、システム上の脆弱性を見つけたりできる――この2つは同時に成り立つ。
その後の返信で、彼は補足した。誰かが彼に次の見解を提示したのだ。「OpenClaw事件がこれほど大きな社会的注目を集めたのは、それが大量の非技術者にとって初めて、最新のエージェントモデルに触れる機会になったからだ。これらの人たちはそれまで、AIとはChatGPTのWeb版のことだとしか知らなかった。」
この記事 Karpathy:AI能力認知に深刻な断層が生じている、無料版と最先端のAgentは「まったく別の製品」 は、最初に 鏈新聞 ABMedia に掲載された。