

Atsushi Nakatsugawa
March 05, 2026
|1 min read
March 05, 2026
1 min read

Cut code review time & bugs by 50%
Most installed AI app on GitHub and GitLab
Free 14-day trial
A semantic history of vibe coding: Tweet, meme and workflow の意訳です。
AI の世界において、1年は永遠と同じくらい長い期間です。
2025年2月、Andrej Karpathy は、ソフトウェア界にツイートサイズの文化的マーカーを投下しました。それがバイブコーディングという言葉です。このフレーズが定着したのは、開発者エクスペリエンスにおける本質的な変化を捉えていたからです。構文を苦労して書くのではなく、意図を平易な英語で説明し、コードが現れるのを見て、現実がビジョンと一致するまで出力を調整するというものです。
この初期のバイブコーディングのビジョンにおいて、Karpathy は有名な言葉で、「完全に雰囲気に身を委ね、指数関数的な成長を受け入れ、コードが存在することさえ忘れる」エンジニアリングとして定義しました。

Karpathy のポイントは、単に AI がコーディングを支援できるというだけではありませんでした。Copilot は何年も前から存在していました。ポイントは、AI によってコードを1行ずつ書く必要があるものではなく、操縦可能な下書きとして扱いたくなるようになったということでした。
1年後、この「雰囲気(vibe)」は進化しました。
バイブコーディングは、もはや趣味のプロジェクトをコーディングしたり、プロトタイプを組み立てたりする際にやるものだけではなくなりました。私たちは、本番システムに向けた機械生成ロジックの爆発的な増加を管理しており、それもバイブコーディングと呼んでいることがよくあります。しかし、それは本当にバイブコーディングなのでしょうか?そうでないなら、何と呼ぶべきなのでしょうか?そして、本番システムではどのように扱うべきなのでしょうか?

バイブコーディングが2025年のCollins Dictionary による今年の言葉として選ばれたとき、このワークフローが主流になったことを示していました。しかし、フレーズが広がるにつれて、その重要性も高まりました。
今日のバイブコーディングは、Karpathy が最初に説明した特定のプロンプティング体験ではなく、プロンプト駆動開発全般の略語になっています。この変化は言語的な偶然ではありません。
何よりも、多くのエンジニアリングチームが AI をスタックに追加し、その出力品質と下流への影響に苦労しているというシグナルです。実際、本番環境レベルのシステム向けコード生成を説明するためにバイブコーディングという用語を使うことは、やや否定的な意味合いを帯びるようになりました。
多くの人にとってバイブコーディングはAI 生成コードに過度に依存しており、顧客向けアプリケーションではなく、週末プロジェクトに適した方法であって、LLM の雰囲気を信頼していることを強調するために使用されました。
例えば、2025年により多くのチームが AI コーディングエージェントを採用するようになると、LinkedIn の開発者たちは自分のプロフィールでバイブコーディングクリーンアップスペシャリストと名乗るようになりました(これは、今年のAWS Re:invent ブースで私たちが使ったジョークです)。さらに、Collins の競合である Merriam Webster は、今年の言葉として異なる方向に進みました。彼らは スロップ(slop) を選び、AI への楽観主義と AI の出力の間に依然として大きなギャップが存在することを強調しました。
実際、多くの人にとって、AI コーディングエージェントの約束は、AI スロップのレビューに何時間も費やし、不明確なプロンプトや意図によるコードの再作業、そして本番環境でのインシデントやバグへの対処に変わりました。
「捨ててもいい週末プロジェクト」(Karpathy が最初にバイブコーディングの使用を説明したもの)からコアインフラストラクチャに移行するにつれて、ソフトウェア開発の制約は変化しました。もはや作成の問題はありません。信頼性の問題があります。そして、その信頼の欠如は、2025年を通じて、職場でのコーディングプロセス全体に渡るAIの使用に対して、この言葉がどう使われるようになったかに反映されています。

最大手のテック企業のいくつかは、自社コードの増加している量が、すべてでないにしても、AI によって書かれていることを自慢しています。それは、単に開発者にAIを使うよう強制するだけでは達成できません。多くの開発者は、特定のタスクやコードタイプに対して AI エージェントを使用することの時間的・認知的節約を評価しています。
しかし、それが全体像ではありません。多くの開発者にとって、AI コーディングエージェントはコーディング以上の作業を意味することがよくあります。そしてそれは、最も経験豊富な人々が何時間を費やしているかで測定可能です。
Fastly の最近の調査では、791人のプロフェッショナル開発者を対象に、この変化がリアルタイムで示されています。データは、シニア開発者が大量の AI 生成コードをリリースする可能性がはるかに高いことを示しています。
ボリューム: 約3分の1シニア開発者が、リリースされたコードの約半分をAIによって生成されていると報告しています(ジュニアのわずか13%と比較して)。
レビュー税: シニア開発者のほぼ30%が、AI 出力の編集と監査が AI による初期時間節約のほとんどを相殺していると報告しています。
これは、最も経験豊富なエンジニアが AI を使って作業を減らしているのではないことを示しています。彼らは AI を使ってより多くの複雑性を製造し、それを管理しなければならないのです。それは、彼らがより多くコーディングしているだけではありません。AI コードのレビューは単純により困難だからです。例えば、私たちの State of AI vs. Human Code Generation study では、AI 生成コードにはバグと問題が1.7倍多く、重大な問題が1.4倍多いことがわかりました。
今日、職場で誰もがバイブコーディングをしているように見える中、コードレビューはもはやスプリントの終わりの予測可能な儀式ではありません。現在、それは高速エンジニアリングを安全にする主要なメカニズムです。あるいは、より正確には、問題やバグがより頻繁にすり抜ける領域であり、正しく行うために大幅により多くの時間と注意を必要とする領域です。
ある意味で、一部の開発者にとっては、ファウスト的な取引のように感じられるはずです。手動でコードを書く量を減らす代わりに、より多くのコードを手動でレビューしなければなりません。そしてレビューは、ソフトウェア開発ライフサイクルの中で、ますますストレスフルで負荷の高い段階になっています。
しかし、インシデントに関する見出しの急増を一目見れば、通常のレビューサイクル(そしておそらくシニア開発者)が追加された負荷の下で壊れていることが明らかに示されています。AI が生成する追加の問題をすべて見つけることの困難さは、AI 生成コードが原因であると疑われる、または AI 生成コードにさかのぼることができるインシデントの波につながっています。

AI 生成コードがプロトタイプから本番システムに移行するにつれて、インシデントデータはその負担が表面化されるようになりました。2025年初頭の業界停止追跡では、AI 採用のピーク月にグローバルサービス中断の測定可能な急増が示され、年の後半に安定しました。この分析は、より難しい質問を提起しました。AI がコードを生成できるかどうかではなく、チームがコードをリリースする前に十分に厳密に検証しているかどうかです。
同時に、チームは増加するレビュー負担を報告しました。より速い生成は、検査すべきより多くのロジック、推論すべきより多くのエッジケース、そしてキャッチすべきより多くの微妙なリグレッションを意味しました。検証プラクティスが出力と同じ速度でスケールしない場合、小さな欠陥が本番環境に漏れる可能性が高くなります。
最近の注目を集めた出来事は、このポイントを強化しました。例えば、ニュースレポートでは社内の AI コーディングアシスタントがコスト管理サービスの13時間の中断に関与した AWS の障害が詳しく報じられました。誤設定されたアクセス制御が根本原因として後に報告されましたが、自律的な AI の動作ではなかったものの、最終的にシステムをダウンさせる変更を行ったのは AI でした。
同様に、Moonwell は最近、Oracle エラーによって誤って $1.8百万の不良債権 を発行したインシデントに対処しました。多くの人は、このインシデントが AI を活用した開発によって引き起こされたと示唆しています。
Kimi チャットボットは、同社が積極的にスケールする中で需要が急増し、信頼性の問題と停止を経験しました。これは、急速な AI 採用がインフラストラクチャの成熟度を上回るときに、システムがどのように負担を受けるかを強調しています。
ここで「バイブコーディング」はさらにトーンが変わりました。プロンプト駆動の遊び心ある説明として始まったものが、本番環境のコンテキストでさらに懐疑的なエッジを帯びるようになりました。エンジニアが AI の活用を拒否しているからではなく、インシデントが検証ギャップを可視化するからです。変更速度が、レビューの精度向上なく加速すると、リスクが増加し、開発者は不満を抱くようになります。

Karpathy は最近、バイブコーディングのテーゼを洗練させ、vibe が探索として始まったものの、彼や他の人々が「エージェンティックエンジニアリング」と呼ぶものに成熟したと述べました。
これは、Karpathy がバイブコーディングという用語が抱える荷物から AI 駆動開発を切り離そうとする試みのように思えます。しかし、それはまた、技術的監督の定義方法における根本的な変化を必要とする別の種類のワークフローを示すことも意図しています。Karpathy が最近 X で述べたように、業界はスピードと厳密さがもはや相互排他的ではないモデルに向かって進んでいます。
「今日(1年後)、LLM エージェントを介したプログラミングは、より多くの監督と精査を伴いながらも、プロフェッショナルのデフォルトワークフローになりつつあります。目標は、エージェントの使用からレバレッジを獲得することですが、ソフトウェア品質も一切妥協しません」と、Karpathy は最近 X に投稿しました。

この新しいパラダイムは、バイブコーディング時代との区別を意図しています。仕事はもはやモデルをコーチすることや、モデルと雰囲気を合わせることではなく、そのロジックを計画し検証することです。
「エージェンティックエンジニアリング」が AI 駆動開発を説明する主な方法として定着するのか、それともプロフェッショナルなコンテキストでのバイブコーディングの軽蔑的な使用が続くのかは、まだわかりません。
ここに、過去1年の楽観的な読み方があります。
バイブコーディングはエンジニアリングを壊していません。たとえ、インシデントを増加させたとしてもです。代わりに、私たちにクラフトが実際に何であるかを定義し、今後数年でどのように進化する可能性があるかを想像することを強いました。それは、私たちがソフトウェアエンジニアリングの新しい黄金時代の瀬戸際にいるという話をする人もいれば、開発者は死んだと宣言する人もいる理由です。
自律エージェントが開発者を置き換えるかどうかは、依然として激しく争われています。しかし、明確なことは、言葉としてのバイブコーディングの未来は、AI 駆動開発が現在直面している品質問題を解決することに完全に依存しているということです。それが「バイブコーディング」が軽蔑的でなくなり、Karpathy の好む用語である「エージェンティックエンジニアリング」に進化する可能性を持つ唯一の方法です。
しかし、そこに到達するには、業界として厳密な「バイブチェック」を採用し、実行する必要があります(これは、Collins と Merriam Webster が聞いているなら、2026年の今年の言葉に対する私たちの提案です)。
本来の文化的コンテキストでは、バイブチェックは直感チェックであり、何かがそれが主張するほど本物であるかどうかを確認する精査の瞬間です。CodeRabbit では、2025年5月に初めてこの用語を使用し、私たちの AI コードレビューがコードの品質を保証する方法を説明しました。
2026年には、厳密なバイブチェックが技術標準にならなければならないと私たちは信じています。2025年にエージェンティックAI の採用に関して見られたのと同じ変化点が、2026年には AI 生成コードの検証とテストに焦点を当てたツールに関して起こらなければなりません。
これらのバイブチェックには、AI スロップと問題が本番システムに干渉するのを防ぐために設計されたさまざまなセーフガードとシステムが含まれます。AI コードレビューなどが含まれます。バイブチェックは、本質的には品質ゲートであり、AI コードがこれまで以上に重要にするものです。
私たちがバイブコーディングに恋に落ちたのは、それが感覚、脳が追いつく速さよりも速くコードが現れるスリルを名付けたからかもしれません。しかし、今後は、より少ないバイブとより多くのチェックが必要です。それがバイブコーディングが成長する唯一の方法です。
バイブチェックが必要ですか? 今すぐ CodeRabbit を無料でお試しください。