AIエージェントが急におかしい時に：モデル劣化と決めつける前の切り分け手順

AIエージェントを毎日の業務に入れると、ある日突然「昨日までと挙動が違う」と感じることがあります。

返答が浅い。指示を取り違える。ツール実行でエラーが増える。いつもの手順なのに、同じ品質で返ってこない。

この時に一番危ないのは、すぐに「モデルが劣化した」と決めつけることです。もちろん、モデルや提供側の障害が原因のこともあります。ただし現場で起きている不調は、少なくとも次の4層に分けて確認した方が安全です。

1. モデル層
2. 提供基盤層
3. ツール・設定層
4. 社内コンテキスト層

この記事では、AIエージェントが急におかしく見える時に、中小企業が10分で行うべき切り分け手順を整理します。

まず「モデルが悪い」と断定しない

AIの返答品質が落ちたように見える時、利用者側から見える現象は似ています。

返答が途中で止まる
以前より確認漏れが増える
コード修正や文章作成の方針がぶれる
ツール実行やファイル操作で失敗が増える
同じプロンプトなのに別物のような返答になる

ただし、見た目が同じでも原因は違います。

モデルそのものの挙動が変わった可能性もあります。提供基盤側でエラーや遅延が出ている可能性もあります。ツールのバージョン、設定、権限、接続先、メモリ、プロジェクト指示が変わった可能性もあります。

特にAIエージェントは、単なるチャットより構造が複雑です。モデルだけでなく、ファイル読み取り、コマンド実行、MCP接続、プロジェクト設定、ローカル環境、権限管理が絡みます。

だからこそ、不調時の初動は「原因探し」ではなく「層ごとの切り分け」にします。

1. 公式Statusを確認する

最初に見るべきなのは、SNSや個人の体感ではなく、提供会社の公式Statusです。

たとえばClaudeの公式Statusでは、2026年6月16日に「Elevated errors across many models」というインシデントが掲載され、同時点でClaude CodeなどのコンポーネントにDegraded Performanceが表示されていました。6月15日、6月13日にもClaude Opus 4.8に関するElevated errorsの記録があります。

ここで大事なのは、「だから必ず自社の不調もそれが原因だ」と決めつけないことです。

公式Statusで確認するのは、次の3つです。

確認項目	見る理由
対象サービス	自分が使っているチャット、API、コードエージェントが影響範囲に入っているか
時刻	自社で不調を感じた時間と重なるか
状態	Investigating、Monitoring、Resolvedのどれか

時刻と対象サービスが重なっていれば、まずは提供側の影響を疑います。重なっていなければ、社内側の設定やコンテキストを優先して見ます。

2. 同じ作業を別モデル・別画面で試す

次に、同じ作業を別のモデル、または別の利用画面で試します。

この時に重要なのは、プロンプトを毎回作り直さないことです。作業目的、入力資料、期待する出力、禁止事項を短く固定し、できるだけ同じ条件で比較します。

確認すること:
  同じ入力で別モデルなら安定するか
  同じモデルでも別画面なら安定するか
  チャットでは動くがエージェントでは失敗するか
  ファイル操作やコマンド実行の部分だけ失敗していないか

別モデルでは安定するなら、モデル層または提供基盤層の影響が濃くなります。

チャットでは安定するのに、コードエージェントやローカルツールで失敗するなら、ツール・設定層を見るべきです。

どの環境でも同じように失敗するなら、入力情報、指示、作業条件、期待する出力が曖昧な可能性があります。

3. ツール・設定層を見る

AIエージェントの不調は、モデル以外の場所で起きることもあります。

Claude Codeの公式ドキュメントでは、Claude Codeがコードベースを読み、ファイル編集やコマンド実行を行い、開発ツールと統合するものとして説明されています。また、設定にはユーザー設定、プロジェクト設定、ローカル設定などのスコープがあり、CLAUDE.mdのようなメモリファイルもセッション開始時のコンテキストとして使われます。

つまり、AIエージェントの挙動はモデルだけで決まりません。

最低限、次を確認します。

層	確認すること
バージョン	ツール本体や拡張機能が更新されていないか
設定	グローバル設定、プロジェクト設定、ローカル設定のどこに指示があるか
権限	ファイル編集、コマンド実行、外部接続が制限されていないか
接続	MCP、外部API、リポジトリ、クラウド環境に問題がないか
メモリ	古い指示や矛盾したプロジェクト指示が残っていないか

特にプロジェクト設定と個人設定が混ざっていると、別の人や別のPCでは再現しない不調になります。

社内で使うなら、個人のチャット履歴や隠れた設定だけに頼らず、プロジェクト内のMarkdown、README、運用メモ、台帳に判断基準を残す方が安定します。

4. コンテキストを外に逃がす

AIエージェントが不安定な時ほど、作業中の文脈をチャットの中だけに閉じ込めないことが大事です。

たとえば、次のような短い引き継ぎメモをプロジェクトフォルダに置きます。

作業目的:
  何を完成させるか

入力:
  参照すべきファイル、URL、社内資料

禁止事項:
  触ってはいけないファイル、公開してはいけない情報

現在の状態:
  どこまで終わったか

次の確認:
  人間が見るべき点、再実行すべきコマンド

これがあると、別のAIエージェントに切り替えても、作業の前提を渡しやすくなります。モデルが回復するまで待つ場合でも、再開時に迷いにくくなります。

AI活用で本当に守るべきなのは、「同じAIを使い続けること」ではありません。

作業目的、入力、出力、確認基準、責任範囲が、ツールの外に残っていることです。

10分で行う切り分け手順

現場では、長い調査よりも初動の順番が重要です。

AIエージェントが急におかしい時は、まず次の順番で見ます。

時間	やること	判断
0-2分	公式Statusと対象時刻を見る	提供側の影響がありそうか
2-4分	同じ入力を別モデル・別画面で試す	モデル層かツール層か
4-6分	設定、権限、接続、メモリを確認する	社内側の変更がないか
6-8分	作業文脈をMarkdownに退避する	別AIへ渡せる状態か
8-10分	継続、切替、停止、人間確認を決める	業務を止める範囲を決める

この10分で原因を完全に特定する必要はありません。

目的は、止めるべき作業と進めてよい作業を分けることです。

たとえば、公開前チェック、請求、顧客対応、削除、契約、金額判断は、人間確認に戻します。一方で、社内メモの下書き、公開しない要約、比較表の一次整理なら、別モデルで継続できる場合があります。

中小企業が準備しておくべきこと

AIエージェントの不調は、珍しい例外ではなく、これからの業務運用で普通に起こる前提で見た方がよいです。

準備しておくべきなのは、特別な監視システムよりも、まず次の4つです。

公式Statusを見る担当と判断基準
別モデル・別ツールへ切り替える最小手順
作業文脈を残す共通フォーマット
人間確認に戻す業務の一覧

これがないままAIエージェントを業務に入れると、不調が起きた時に「AIを使うか、全部止めるか」の二択になります。

しかし実際には、二択にする必要はありません。

低リスクな作業は別モデルで続ける。高リスクな作業は止める。公開前の判断は人間に戻す。入力と出力は外部ファイルに残す。

この分け方があるだけで、AIの不調は「業務停止」ではなく「運用判断」に変わります。

Optiensの見方

Optiensでは、AI導入を「最新モデルを入れること」ではなく、「業務と責任の流れを設計すること」と捉えています。

無料のAI活用診断では、フォーム入力をもとに、どの業務がAI化に向くかを要点レベルで整理します。実装や伴走が必要な場合は、診断とは別の導入支援領域として扱います。

AIエージェントは、これからも変わります。モデルも、画面も、料金も、提供条件も変わります。

だからこそ中小企業が先に作るべきなのは、「どのAIを使うか」だけではありません。

AIが不調な日でも、業務を止める範囲と進める範囲を分けられる運用です。

AIエージェントが急におかしい時に