あなたのAIコーディングアシスタントは、偽のバグ報告に騙されて攻撃者のコマンドを実行しうる:”Agentjacking” 実験で成功率85%。ただし「実証」であって「実害」ではない【2026年6月】

Style ← お好みの文体を選べます。選択は自動で記憶されます

あなたのAIコーディングアシスタントは、偽のバグ報告に騙されて攻撃者のコマンドを実行しうる:

AIにコードを書かせ、エラーを調べさせ、修正まで任せる。そんな「AIコーディングAgent」(Claude Code / Cursor / Codex など)に対して、偽のエラー報告を読ませることで攻撃者の用意したコマンドを実行させられる、という新しい弱点が実証されました。セキュリティ企業 Tenet Security(Tenet Threat Labs)がこの攻撃クラスを “Agentjacking” と名付け、2026年6月に公表しています(出典: Infosecurity Magazine 2026-06-11 / Hackread)。「85%」「2,388社」といった数字が並ぶと、つい「もう広く攻撃されているのか」と身構えてしまいます。けれど先に一番大事な線引きを置いておきます。これは研究者が「こうすれば乗っ取れる」と実験で示した段階の話であって、「実際に大規模な被害が出た」という報告ではありません。本記事は2026年6月時点の報道に基づいて、この攻撃の仕組みを初心者の方にも分かるように噛み砕いたうえで、「どこまでが実証で、どこからが推測か」を分けて整理していきます。

この記事のポイント

  • セキュリティ企業 Tenet Security(Tenet Threat Labs)が、AIコーディングAgentを乗っ取りうる攻撃クラスを “Agentjacking” と命名し、2026年6月に公表した(出典: Infosecurity Magazine 2026-06-11 / Hackread)
  • 核心はプロンプトインジェクション。攻撃者は、Agentが信頼して読み込むデータ(特に Sentry のエラー報告)の中に、悪性のシェルコマンドや「解決策」を仕込む
  • AIは「外から取ってきた資料」と「あなたの指示」を同じテキストとして読む。だから報告に紛れた偽の修正手順を、正規の指示と区別できずに実行しうる
  • 入口は公開された Sentry の DSN(公開キー)。露出したキーがあれば認証もシステム侵入も不要で、1回のHTTP POSTで悪性コマンドを注入できる(出典: Hackread)
  • 実験での成功率は約85%。注入可能な状態のSentry DSNを持つと判明した組織は少なくとも2,388社、研究者がexploit可能と確認したターゲットは100件超(出典: Infosecurity / Hackread)
  • ただし全て「実験・露出・実証」の数字。「85%の攻撃が成功した」「2,388社が攻撃された」という実害の数字ではない
  • 防御の方向はSentryキーの定期ローテーション・認証情報スキャン・AI Agentの権限を最小に・異常挙動の監視(出典: 複数解説)

まず「何が新しいのか」から

これまでのサイバー攻撃は、ざっくり言えば二通りでした。一つは人間を騙すこと(偽のメールでパスワードを入力させる、など)。もう一つはシステムの穴を突くこと(プログラムのバグをついて侵入する、など)。

Agentjacking が新しいのは、そのどちらでもない第三の入口を突いている点です。狙われるのは人でもシステムの穴でもなく、「AIに渡されるデータ」です。AIが自分でツールを使い、外部の情報を取ってきて、自律的に判断して動く。その「自律性」こそが、新しい攻撃面になりました。AIに渡すデータを汚染して、AI自身に悪事をさせる。これがこの攻撃の発想です。

便利さの裏返し、と言ってもいいかもしれません。「エラーを調べて直しておいて」とAgentに丸ごと任せられるのは、Agentが外部のエラー報告を読み、解決策を考え、コマンドを実行できるからです。その一連の流れのどこかに偽の情報を紛れ込ませれば、Agentは言われたとおりに動いてしまう。自律性が上がるほど、「何を信じさせるか」が攻撃のポイントになるのです。

仕組みを丁寧に:AIには「命令」と「資料」の境界が見えにくい

ここが今回いちばん大事なところなので、ゆっくり説明します。

私たち人間は、文章を読むときに「これは自分への指示」「これは参考のために見ている資料」という区別を、ほとんど無意識にやっています。資料の中に「このコマンドを実行しなさい」と書いてあっても、それが資料の一部なら、勝手に従ったりはしません。

ところが現在のAIは、「あなたの指示」と「外から取ってきた情報」を、基本的に同じテキストの流れとして読みます。「このエラーを調べて」というあなたの依頼も、Agentが取ってきたエラー報告の中身も、AIにとっては地続きの文字列です。だから報告の中に「このエラーは○○が原因です。直すには次のコマンドを実行してください」と書かれていれば、それが攻撃者の仕込んだ一文でも、Agentは正規のアドバイスと区別できずに従いうる。AIには『どこからが命令で、どこからが資料か』の境界が、人間ほどはっきりとは見えていない。これがプロンプトインジェクションと呼ばれる弱点の本体です。

典型的なシナリオは、こう進みます(出典: Infosecurity Magazine)。

  1. 開発者がAgentに「このエラーを調べて直して」と頼む
  2. Agentが MCP(Model Context Protocol)という仕組み経由で、エラー監視サービス Sentry からエラーの詳細を取ってくる
  3. そのエラー詳細の中に、攻撃者があらかじめ仕込んでおいた偽の「修正手順」が紛れている
  4. Agentはそれを正規の解決策と思い込み、開発者本人の権限でそのコマンドを実行する

ポイントは、最後にコマンドを動かすのが開発者本人の権限だということです。Agentは開発者のマシンの上で、開発者ができることをやれる立場にいます。だから乗っ取りに成功すると、AWSの鍵・GitHubのトークン・SSHキーといった開発者のシークレットが盗み出されたり(exfiltration)、マシン上で任意のコードが実行されたりしうると報告されています(出典: Hackread)。

入口は「公開されたキー」:認証もいらない

もう一つ押さえておきたいのが、攻撃の入口の手軽さです。

この攻撃は、公開された Sentry の DSN(公開キー)を入口にします。Sentry はアプリのエラーを集める広く使われたサービスで、エラーを送るための「宛先キー(DSN)」があります。このキーが、公開リポジトリや設定の不備で外から見える状態になっていることがある。そういう露出したキーさえ見つかれば、攻撃者は認証も、システムへの侵入も不要で、1回のHTTP POST(=ごく普通の通信を1回送るだけ)で、エラーイベントの中に悪性のコマンドを仕込めてしまう、というのです(出典: Hackread / 複数解説)。

「鍵が外に落ちていて、その鍵で投函口に紙を差し込める」ような状態、と考えると分かりやすいかもしれません。投函口に紙を入れること自体には、何の特別な権限もいらない。問題は、その紙を後でAgentが疑わずに読んで、書いてあるとおりに動いてしまうところにあります。

数字を正しく読む:85%・2,388社・100件超は「何の」数字か

ここで、見出しになりがちな数字を一つずつ「何を数えた数字なのか」に戻して整理します。ここを混同すると、ニュースが実際より何倍も恐ろしく見えてしまうからです。

  • 実験成功率 約85%:これは Claude Code / Cursor / Codex など主要なAgentに対して、研究者が実験したときの成功率です(出典: Infosecurity / Hackread)。「実際の攻撃の85%が成功した」ではありません。研究室の条件で「こうすれば高い確率で乗っ取れる」と示された、という意味です。
  • 少なくとも2,388社:これは 注入可能な有効 Sentry DSN を持つと判明した(=キーが露出していた)組織の数です(出典: Hackread / 解説)。「2,388社が攻撃された・被害に遭った」ではありません。「鍵が外から見える状態だった家がそれだけあった」という調査時点の発見数です。
  • 100件超:これは 研究者が exploit 可能性を確認した実在ターゲットの数(”over 100 real-world targets”)です。悪用された実害件数ではありません。「ここは技術的に突けると確かめられた」という実証の件数です。

つまり、三つの数字はどれも「実験・露出・実証」を測ったもので、「実害」を測ったものではありません。設計上の弱点が高い精度で実証された、という段階の話です。煽る方向に読むのではなく、「危ないことが分かったから、今のうちに塞ごう」という材料として受け取るのが正確です。

ここで冷静に:これは「実証された弱点」であって「広く悪用された実害」ではない

念のため、もう一度はっきり書いておきます。今回のニュースは、研究者による実証(proof-of-concept)です。Tenet Security が「この経路で乗っ取れる」と示し、命名し、公表した。一次に近いのは Tenet の原レポートですが、本記事が確認できたのは Infosecurity Magazine / Hackread などの報道経由の数値で、野生(実際の世界)での大規模な悪用が確認された、という報告には、現時点の取得ソースは言及していません。

また、Claude Code / Cursor / Codex が「破られた危険なツール」だと名指しで断じる話でもありません。これらは実験の対象になっただけで、根っこの弱点(プロンプトインジェクション)は、外部データを読んで自律的に動くAgent型ツール全般に共通する課題です。特定製品の欠陥として責めるのは的外れになります。さらに、ベンダー各社(Anthropic / Cursor / OpenAI / Sentry)が公式にどう対応したか・修正したかは、本記事の取得ソースには明記がありませんでした。「修正済み」とも「放置されている」とも、本記事では書きません。

日本の読者・AIを使う副業勢にとっての含意

最後に、AIに作業を任せる側の、足元の話に下ろします。

教訓はシンプルです。Agentに「自動で調べて直して」と任せるほど、Agentが読む外部データ(issue・ログ・エラー報告・Webページ・ドキュメント)は、すべて『指示の入口』になりうる。これはAIを否定する話ではありません。便利さの源泉(外部データを読んで自律的に動けること)と、弱点(その外部データを疑わずに信じうること)が、同じ一つの仕組みから来ている、という構造の話です。

だからこそ、効くのは派手な対策ではなく、当たり前の運用です。報道が挙げる防御の方向はこうです(出典: 複数解説)。

  • Sentryなどのキーを定期的にローテーション(入れ替え)する。露出した古い鍵を生かしておかない。
  • リポジトリの認証情報スキャン。鍵がうっかり公開されていないか機械的に点検する。
  • AI Agentの権限を最小限にする。Agentにできることを絞っておけば、乗っ取られても被害が広がりにくい。
  • 危険なコマンドは人が確認する。Agentが「これを実行します」と言ったとき、特に削除・送信・鍵の扱いに関わるものは、人が一度目を通す。
  • 異常な挙動を監視する。Agentが普段やらないことをし始めたら気づける仕組みを持つ。

要するに、「AIには、命令と資料の境界が見えにくい」という前提を、使う側が肩代わりする。権限は最小に、危ないところは人が見る。AIの自律性が上がるほど、この当たり前の運用が効いてきます。

まとめ(FAQ)

Q. “Agentjacking” って、もう実際に攻撃が起きているの?
A. 本記事の取得ソースの範囲では、確認できているのは「研究者による実証」です。Tenet Security が「この経路で乗っ取れる」と実験で示し、2026年6月に公表しました。野生での大規模悪用が確認されたという報告には、現時点のソースは言及していません。「実証された弱点」であって「広く悪用された実害」ではない、と分けて読むのが正確です。

Q. 「成功率85%」って、攻撃の85%が成功するってこと?
A. いいえ。Claude Code / Cursor / Codex など主要Agentに対する研究者の実験での成功率です。「実際の攻撃の85%が成功した」ではありません。

Q. 「2,388社」は被害に遭った会社の数?
A. いいえ。注入可能な有効 Sentry DSN(公開キー)を持つと判明した、つまりキーが露出していた組織の数です。攻撃された数でも被害件数でもなく、調査時点の発見数です。

Q. なぜAIは攻撃者のコマンドに従ってしまうの?
A. 現在のAIは「あなたの指示」と「外から取ってきた資料」を同じテキストとして読むため、資料(エラー報告)に紛れた「このコマンドを実行して」を正規の指示と区別しにくいからです。人間のような「これは資料、これは命令」という境界が、AIには見えにくいのです。

Q. Claude Code / Cursor / Codex は危険なツールなの?
A. これらは実験の対象になっただけで、特定製品の欠陥という話ではありません。根っこの弱点(プロンプトインジェクション)は、外部データを読んで自律的に動くAgent型ツール全般に共通する課題です。ベンダー各社の公式な対応状況は、本記事の取得ソースには明記がなく、断定しません。

Q. 自分はどう備えればいい?
A. キーの定期ローテーション、リポジトリの認証情報スキャン、AI Agentの権限を最小限にする、削除や鍵の扱いなど危険なコマンドは人が確認する、異常な挙動を監視する。派手な対策より、この当たり前の運用が効きます。

Quotidia の視点

Quotidiaが注目するのは、この弱点が「バグ」ではなく「便利さの構造そのもの」から出てきている点です。AIコーディングAgentが頼もしいのは、外部のエラー報告を読み、自分で解決策を考え、コマンドまで実行してくれるからです。Agentjacking が突くのは、まさにその同じ仕組みです。外部データを疑わずに読めることが便利さの源で、外部データを疑わずに信じてしまうことが弱点になる。便利さと弱点が、別々のところにあるのではなく、一本の同じ筋から生えている。ここで渡したいリテラシーは二つです。一つは「AIには、命令と資料の境界が人間ほど見えていない」。私たちは資料に書かれた「これを実行しろ」を勝手には実行しませんが、AIは指示も資料も地続きの文字列として読みます。だから外部から来る文章は、すべて指示の入口になりうると考えておく。もう一つは「数字は、何を数えたものかに戻して読む」。85%は実験の成功率、2,388社は鍵が露出していた数、100件超は突けると確認された数で、どれも実害の数字ではありません。実証された弱点を、広く起きている被害と取り違えない。煽られず、かといって油断もせず、設計上の弱点が高い精度で示された段階なのだと正しい大きさで受け取る。AIに任せる範囲が広がるほど、何を信じさせるかが問われる。だから権限は最小に、危ないところは人が見る。便利さを手放さずに弱点だけを抑えるための、地味で確かな手つきのほうを、Quotidiaは見ておきたいと考えます。

関連記事:

運営: AI Quotidia 編集部

海外 AI ニュースを毎朝、日本語で解説する個人運営メディアです。記事は AI を活用して作成し、人手による確認・編集を経て公開しています。