

Atsushi Nakatsugawa
July 10, 2025
1 min read
July 10, 2025
1 min read

Cut code review time & bugs by 50%
Most installed AI app on GitHub and GitLab
Free 14-day trial
What percentage of your code should be AI generated?の意訳です。
率直に言っておきます。このタイトルはほぼ釣りタイトルです。
この記事では、「コードベースの20%、30%、あるいは50%をAIで生成すべきだ」と主張するつもりはありません。ただ、近いうちに誰かがそう言い出すかもしれない兆しがあるため、この記事を書いています。その“誰か”とは、あなたの上司かもしれませんし、経営幹部かもしれません。
2025年4月、GoogleとMicrosoftが、自社の新規または既存コードの最大30%がAIによって生成されていると公に発表しました。興味深いのは、両社がほぼ同時期に同様の割合でAI活用を定量的に示した点です。さらに注目すべきは、彼らがその発言をどこで行ったかということです。

Googleのスンダー・ピチャイは、この数字を決算説明会で述べました。これは初めてではなく、2024年11月の決算説明会でも新規コードの25%がAI生成であると発言しており、AI導入の進捗を投資家に報告する文脈で話されています。
一方Microsoftのサティア・ナデラは、それに続いてLlamaConでのマーク・ザッカーバーグとの対談中に、自社コードの20〜30%がAI生成であると発言しました。
これらの発言から読み取れるのは、投資家や経営陣がAI導入状況や企業の将来性を測るための新たな指標を見出した可能性があるということです。では、このような割合が本当に意味するのは何なのでしょうか。そして、もしこの数字がAI導入や競争力の尺度として広く使われるようになった場合、企業や開発者はどのように「正しい割合」を判断すればよいのでしょうか。

2023〜2024年にかけて、なぜ多くの上場企業が急いで「AI戦略」を打ち出したのか不思議に思ったなら、その理由は株式市場がそれに反応したからです。AI導入によって収益増加やコスト削減が見込まれるという投資家の期待が、AI戦略を発表した企業の株価を平均2%押し上げたと報告されています。
さらに67%の企業は、株価が6%以上上昇するというより大きな恩恵を受けました。BuzzFeedに至っては、生成AIを使ってコンテンツを制作する計画を発表しただけで、株価が120%も上昇しました。AI戦略を明確にしなかった企業は、株式市場で不利な扱いを受ける傾向にありました。
こうしてAI導入は、実際のビジネス上の利益に加え、発表するだけで株価を押し上げる手段として、経営陣にとって優先事項になっていきました。
その結果、すべてのAI導入が「良い導入」と見なされる企業文化が一部で生まれつつあります。それが投資家や経営層を喜ばせ、「生産性やスピードが向上した」という印象を与えるためです。
2025年4月には、Lead Devが記事で、企業がAIコーディングの利用を義務づけており、それが「開発者を追い詰めている」と報じました。これには、AIコーディングエージェントの提案受け入れ数を増やすよう求める指示や、従業員ごとのAI使用率をランキングする公開ボード、さらにAI使用量の増加が求められる曖昧なOKR(目標と成果指標)などが含まれます。
問題は、こうした指標が複雑な結果を伴う行動を粗雑に測定・誘導してしまう点にあります。記事にリンクされたRedditの投稿のコメントでもそれが示されています。ある開発者はこう述べています。「毎月の全社エンジニア会議で、Copilotの使用状況が報告される。そして使用率をもっと上げるように言われる。その数枚後のスライドで、重大インシデントの件数も増加していると報告される」
AIツールの効果を巡って、開発者と経営層の間に認識のズレがあることは明白です。2024年にAtlassianが実施した2,000人以上のITマネージャーと開発者への調査では、経営層は「AIこそが開発者の生産性と満足度を高める最重要要素」と見なしていましたが、AIによって生産性が向上したと回答した開発者は3分の1にとどまりました。
AIの使用量ばかりを測定して、生成されたコードの品質やデバッグ・レビューにかかる時間を考慮しないのであれば、AI導入が企業にとってマイナスに働く場面でもそれを推進することになります。
最悪の場合、コードベースの50%がAI生成になる一方で、バグが急増し、ユーザーからの苦情や障害も増えることになりかねません。しかも、開発者がレビューや修正に同等の時間を費やすため、時間の節約にもならないかもしれません。

とはいえ、決算説明会では「30%がAI生成」と言えば聞こえは良さそうです。

GoogleやMicrosoftのような企業は、自社のコードベースの多くをAIで生成しようと競っています。MicrosoftのCTOは2030年までに全コードの95%がAI生成になると予測してさえいます。しかし、多くの企業がそこまでの高い目標を掲げているわけではありません。
2025年3月、Y Combinatorのマネージングパートナーであるジャレッド・フリードマンは、現コホートのスタートアップのうち4分の1がコードベースの95%がAI生成であると発言しました。
そのYouTube動画のコメント欄を要約すると、多くの開発者は「コードの95%がAI生成」という状況を“破滅的”だと受け止めています。
この問題は「ゴルディロックスのジレンマ」に近いです。つまり、多すぎても少なすぎてもダメで、ちょうどよい“魔法の数字”があるということです。では、それはいったい何パーセントなのでしょうか。
コードのどの程度がAI生成になると“やりすぎ”になるのでしょうか。40%?50%?75%以上?それはアプリケーションの種類や使用言語によって異なるのでしょうか。企業ごとに違うのでしょうか。そして、この割合を公表することで、その企業について何を示しているのでしょうか。

この疑問に答えるために、そもそもこの指標が何を測定しているのかを掘り下げましょう。
GoogleやMicrosoftのような企業が「30%のコードがAI生成だ」と発言するとき、それは何を計測しているのでしょうか。通常、これはCopilot、Cursor、Claude、WindsurfといったAIコーディングツールによって作成された行数やコミット数を指しています。しかし、コード行数という指標は、昔から生産性や価値の測定には不適切だとされています。さらに、AIが生成した後で大幅に修正された行はカウントされていない可能性もあります。
AIコーディングツールは、ボイラープレートや繰り返しがちなコードを書くのに長けています。つまり、もともと開発者が素早く書けるような、複雑性の低い、価値の低いコードです。こういった“簡単に稼げるポイント”をカウントすることで、AI導入率は膨らみますが、実際の生産性向上を意味しているとは限りません。さらに、存在しないAPIキーを生成するなど、AIによる幻覚的生成も頻繁に報告されています。
より重大なのは、単純な量に基づく指標では、生成されたコードの複雑さや品質が反映されない点です。AI生成コードのデバッグやレビューにどれだけの開発者の時間が必要だったのかも見えてきません。こうした文脈がなければ、「30%がAI生成」という数字は、実際の効率性や品質にはほとんど関係がありません。
開発者フォーラムや調査では、AI生成コードがバグや脆弱性を増やすことへの不満が繰り返し示されています。ある調査では、AIコーディングツールが最大41%多くのバグを生むと報告されています。たとえば、Harnessが最近発表した調査によると、67%の開発者がAI生成コードのデバッグに人間のコードよりも多くの時間を費やしており、68%がセキュリティ問題の修正に多くの時間を費やしていると回答しました。さらに59%は、AIコーディングツール使用時の半分以上のケースでデプロイに問題が発生していると答えました。
こうした背景を踏まえると、MicrosoftのようなAIエージェントを販売している企業が「コードベースに占める割合」という指標を成功基準として推進したがる理由は明白です。それは、AI活用をより包括的に評価する指標よりも、都合がよいからです。
しかし、誤ったOKR、硬直的なノルマ、開発者のAI使用率を可視化する公開ランキングなどは、文脈や品質を無視し、開発者が意味のない数字を追いかけることに時間を費やす原因になります。AI投資の価値を本当に測定したいのであれば、もっと適切な指標があります。

さらに憂慮すべき点として、多くの開発者が報告しているのは、こうしたAI導入の義務化が社内の採用凍結と結びついているということです。特にエントリーレベルの職種が影響を受けていることが多く、経営陣の間では「AIが開発者を置き換える」という楽観的な見方が広がっているようです。
たとえば、MetaのCEOであるマーク・ザッカーバーグ、SalesforceのCEOであるマーク・ベニオフ、AWSのCEOであるマット・ガーマンらは、AIが開発者の仕事を置き換える可能性について頻繁に言及しています。
2025年初頭、ベニオフはポッドキャストで「今年は誰も雇わないかもしれない」と発言しました。「AIエージェントによって信じられないほどの生産性向上が得られている」との理由からです。
もしあなたが、こうしたAIの可能性に対して過剰な楽観を感じているなら、その感覚は正しいといえるでしょう。実際、Microsoftのナデラ自身も、Copilotを使ったAIコード生成について「言語によって成果にばらつきがある」と認めています。
このような指標の問題点は、多くの企業がAI生成コードを導入することで、開発者の削減、あるいは少なくとも人数削減が可能になると信じてしまっている点です。もし、「コードベースの50%をAIに置き換えることで、最終的に開発者を半分に減らせる」と本気で思っているなら、それは大きな誤解です。
このような前提でこの指標を追いかけると、企業は大きな問題に直面する可能性があります。技術的負債や不具合の増加だけでなく、投資家をも失望させる結果になるかもしれません。人員削減が実現しなければ期待外れになりますし、仮に実現したとしても品質低下が明らかになれば、企業の収益に悪影響が及ぶでしょう。

コード行数の生成だけを測定するのではなく、企業は生成されたコードの品質やAI導入による実際の生産性への影響を測定すべきです。以下は、AI活用を評価するために併せて追跡すべき指標の例です。
AIコーディングツール導入前後でのバグ発生率
本番環境での障害発生頻度とAI使用量との相関
デバッグや複雑なコードレビューを含めた開発ライフサイクル全体での実際の時間短縮量
開発者からの定性的フィードバックをもとにした満足度と生産性の変化
もう一つの戦略として、ChargeLabが実施したアプローチがあります。LeadDevの記事でも紹介されたこの戦略は、開発者主体のAI活用方針です。彼らの開発者はAIツールを自由に選択でき、その結果、生産性が40%向上したという測定結果が得られました。これは義務化によるものではなく、開発者が自身で設定した文脈に応じた、意味のある指標に基づいていたからです。
また別のLeadDevの記事では、AI導入はコード生成に偏るべきではなく、コードレビューやリファクタリング、テスト、ドキュメント作成など、開発ライフサイクル全体での生産性向上に焦点を当てるべきだと述べています。「コードベースのAI比率」という指標は、それらの潜在的な効率化領域を無視してしまいます。
実際、DORAのAIがソフトウェア開発に与える影響に関するレポートでも、生産性向上を実現するための5つの戦略が示されており、その1つ目が「AIをコード生成だけでなく、開発の全工程に活用する」ことです。AIがあらゆるフェーズで活用される時代はすでに始まっており、私たちも先月の投稿で2025年の主要開発トレンドとしてこの流れを取り上げました。

効果的なAI導入指標は経営層ではなく、現場のエンジニアチームから生まれるべきです。現場を知らない経営陣が一方的に作った指標ではなく、開発の実態に即した評価基準が必要です。
理想的な指標は、次のような要件を満たしているべきです。
日々のワークフローを理解している開発者と協力して作成されている
表面的なAI導入率ではなく、実際の生産性やビジネス成果に連動している
柔軟で文脈に応じた実験を奨励し、厳格な強制ルールではない
たとえばChargeLabの戦略では、「AIによって年間100万ドルの開発時間を削減する」といった広い目標を掲げつつ、各チームがその目標をどのように達成するかは自由に決められるようになっていました。
これは、明確な方向性と開発者の裁量の両立を実現しており、単純なノルマやツール一択の指示ではなく、測定可能で意味のある成果に焦点を当てています。
このような指標があれば、「ここは手書きしたほうがいい」という場面では人間がコードを書き、コードレビューやQA・テスト工程ではAIを活用するなど、より柔軟で合理的な選択が可能になります。
結論として、「AI生成コードの割合」という単一の指標は、使い方に注意が必要です。それだけでは情報が単純化されすぎており、誤った行動を助長し、開発者にストレスを与える可能性があります。
その代わりに、エンジニアリングリーダーや開発者は、生産性、コード品質、開発者の満足度に明確に結びついた指標に注目すべきです。こうした複合的で成果志向の指標こそが、AI導入の真の効果を示すのです。「コードの何パーセントがAI生成か」だけでは決して見えてこない、本当のインパクトがそこにはあります。
より良いコードをより早くリリースするためのAIツールを試してみませんか? CodeRabbitの14日間トライアルを今すぐ始める