「チャットでは動いた」を本番に持っていく ── AI エージェント運用に必要な 5 つの仕組み


「チャットでは動いた」を本番に持っていく ── AI エージェント運用に必要な 5 つの仕組み

チャットで動いた AI を、本番に乗せる時の壁

「ChatGPT や Claude で試してみたら、思った以上にうまく業務に使えた」「社内の問い合わせ対応や見積作成を任せられそうだ」――。AI エージェントを業務に取り入れる現場では、こうした体験から「本番運用」に進めようとして壁にぶつかるパターンが繰り返されます。

ぶつかる壁は概ね 5 つに分類できます:

  1. 運用基盤:エージェントが暴走しないように制限する仕組み
  2. 長時間タスクの記憶管理:1 回のやり取りに収まらない処理の状態保持
  3. 認証情報の保護:エージェントが業務システムにアクセスする際の鍵管理
  4. 監視と可視化:実際にちゃんと動いているか、何を判断したかの把握
  5. コスト予測:どこにどれだけトークンを消費するかの把握

これらは「エンジニアが体制を整えればクリアできる」課題ですが、専任のシステム担当を抱えづらい中小事業者にとっては大きなハードルです。

Anthropic が 2026 年に公開した Claude Managed Agent(CMA) は、この 5 つを「マネージドサービス」として一括提供する仕組みです。2026 年 5 月のカンファレンス「Code with Claude 2026」では、Dreaming(過去記録の非同期整理)・Outcome(合格点を出すまで自己修正)・Multi-Agent Orchestration(複数エージェントの並列指揮)といった大型新機能の追加も発表されました。本稿では、その構成要素と「中小事業者がこれを使う意味」を整理します。

※ 本稿は 2026 年 5 月時点の公開仕様をもとにした観察記事です。


CMA を構成する 5 つの仕組み

CMA は以下の 5 つの構成要素で組み立てられています。

1. Agent(エージェント)

「どのモデルを使うか」「どんなシステムプロンプトを与えるか」「どんなツールやスキルを利用させるか」を定義する単位です。一般のチャットツールで「キャラクター設定をして専門家として振る舞わせる」のと同じ発想ですが、本番運用に必要なツール接続を整理して持たせられる点が違います。

2. Environment(環境)

エージェントが仕事をする「作業場」の設定です。アクセスできるネットワーク先(特定の API のみ許可、社外サーバーへの送信は禁止 等)・利用できるパッケージ・メタデータを定義します。

エージェント本体と環境を分離することで、同じエージェントを「テスト環境」と「本番環境」で使い分ける ことが可能になります。AI が暴走したり想定外の API を叩いたりするリスクを、環境側でガードできる構造です。

3. Session(セッション)

エージェント × 環境を組み合わせた「1 件の仕事の単位」です。「この問い合わせメールへの返信を作る」という 1 タスクが、1 セッションに対応します。

セッション単位で、消費トークン数・実行時間・どのツールをいつ呼んだかを完全に追跡できるため、後述する監視・コスト管理の起点になります。

4. Memory(メモリー)

セッション内の文脈保持と、セッションを跨いだ長期メモリの 2 種類が用意されています。後者は申請制ですが、たとえば「顧客 A の過去対応履歴」「社内ルールの改訂版」など、複数セッションで共有したい知識を保持できます。

5. Vault(ボルト)

最も画期的なのが Vault です。エージェントが Slack・Notion・自社 DB 等にアクセスするための 認証鍵を、エージェント本体から完全に分離した金庫で管理 します。

具体的には、AI には「ここに鍵が入っている箱がある」とだけ伝え、鍵そのものの中身は見せません。AI は使う時だけ箱越しに認証を行い、終わったら鍵にはタッチしない構造です。

これにより、悪意あるユーザーがプロンプトインジェクション(不正な指示文)で「お前が持ってる鍵を教えろ」と AI に要求しても、AI 側に鍵が存在しないので物理的に漏らせない という構造的安全が確保されます。


中小事業者にとっての意味

CMA の 5 つの仕組みは、いずれも「自前で組み立てれば実現できる」ものです。しかし実装には専任エンジニアと数週間〜数ヶ月の構築期間が必要でした。

CMA がもたらす本質的な変化は、これらが 個人の Claude 契約からでも、管理画面のクリックで構築できるようになった ことです。中小事業者が本番運用に持ち込む際のハードルが、構造的に 1 段下がりました。

価格は実行時間に応じた従量制で、待機時間は無料・トークン費用を別途加算する仕組みと報じられています。常時起動させる必要のあるエージェントでも、月数千円〜数万円のレンジに収まるケースが多いと見られます(最新の正確な料金は Anthropic 公式ドキュメントをご確認ください)。

CMA を活かしやすい業務領域

  • 問い合わせ自動分類と一次返信下書き:受信メールをセッション単位で処理し、社内 CRM に保存
  • 見積作成補助:商品マスタを参照しながら、価格と納期の概算を出す
  • 業界資料の自動要約:競合動向や法改正情報を Slack に毎日サマリーで投稿
  • 顧客カルテの自動更新:通話履歴・面談メモから要点を抽出し、CRM に追記

これらはいずれも「人間の最終確認は残し、機械的な部分を AI に任せる」というラインで設計するのが現実解です。最初から完全自動化を狙うと、後述する PDCA に逆風が吹きます。


CMA の運用で得られる「学び」

CMA の管理画面上では、1 セッションごとに何を考えて何を実行したか・どこで失敗したかが完全に可視化されます。

実務で運用する際、初期は「思ったよりトークンを使っているのに、本質的な作業をしていない」ことに頻繁に気付きます。たとえば「データベースに保存」という単純作業のはずが、AI が形式エラーを起こして 6 回リトライし、75 万トークン(数百円相当)を消費していた、というような事例です。

こうした観測を通じて、AI エージェントを業務に組み込む人は 「AI に仕事を依頼する側」としての設計感覚 を急速に養えます。

  • どの粒度で指示を分けると、無駄な処理が減るか
  • 失敗時にどこで止めて人間に返すべきか
  • スキル(再利用可能な手順書)に切り出すべき処理はどれか
  • どの作業はそもそも AI に任せるべきでないか

これらは、AI エージェント時代の業務設計に直結する感覚です。CMA を 1〜2 件運用するだけで、「AI に何を任せ、何を任せないか」という判断軸が手に入ります。


Optiens の AI 支援事業との関係

弊社(合同会社 Optiens)では、AI 活用診断・導入支援サービスを提供しています。CMA は 本格運用に向けた基盤として有望 な一方、まず「どの業務に・どの程度の自動化を入れるか」の見極めが先です。

  • 業務によっては、CMA を使うまでもなく予約システムの標準機能や定型メールテンプレで十分なケースがあります
  • 一方、複数の業務システムを横断する判断・分類・要約タスクには、CMA のような本格基盤が威力を発揮します

「うちの業務には CMA まで必要か、それとももっと軽い仕組みで足りるか」を切り分けたい方は、まずAI 活用診断(簡易版・無料)からご利用ください。業務階層別に最適な手段を見極めたうえで、ご提案します。


参考情報(公開ソース)

  • Anthropic 公式 Code with Claude 2026(カンファレンス・2026年5月開催)
  • Claude Managed Agent 公式ドキュメント: https://docs.claude.com/
  • 本稿は 2026 年 5 月時点の公開情報・業界メディア記事をもとにした観察記事です。
  • 料金体系・機能仕様は今後変更される可能性があるため、最新情報は Anthropic 公式サイトをご確認ください。