「AI が出した数字を信じる」は経営判断として危険
AI に売上集計・販売分析・KPI レポートを任せると、業務時間が大幅に短縮されます。
- 月次の販売データ集計が 数時間 → 数分
- 業種別売上比率の可視化が 半日 → 即時
- リピート顧客の傾向分析が 分析担当不在でも可能 に
ただし、ここで一つ見過ごされがちなリスクがあります。
AI が出した数字は、内容を検証せず経営判断に使ってはいけません。
本稿では、Optiens 自社内で実際に起きた数値ミスの事例と、それを防ぐ「経営者の 3 つのチェック」を整理します。
なお、本稿で取り上げる事例は AI 経由で人間がテンプレ化したケース ですが、AI が直接数値を出すケースでも構造的に同じミス が起きます。共通するのは「実データとの突合が抜けている」という点です。
実例: Optiens 自社のデモで起きた数値ミス
Optiens は社内デモとして 「販売データに自然言語で質問するデモ」 を構築しました。
サンプルデータ 30 件を用意し、典型的な質問に対する事前回答を 手書きで 用意しました(API 消費を避けるため)。
起きた問題
サイトに公開した直後、事前回答の数字 が サンプルデータと一致していない ことが判明しました。
| 質問 | 公開時の回答 | 実データ計算 | 差分 |
|---|---|---|---|
| 4 月の売上合計 | ¥1,440,000(5 件) | ¥1,911,000(8 件) | -¥471,000 / -3 件 |
| 士業の合計売上 | ¥1,235,500(8 件) | ¥1,180,000(5 件) | +¥55,500 / +3 件 |
| 保守プラン契約 | 7 件・¥290,000/月 | 8 件・¥340,000/月 | -1 件 / -¥50,000 |
これは AI が出した数字ではなく、人間が AI を介してテンプレ化した数字 でしたが、実データと突合しない という同じ構造のミスです。
このミスが本番だったら?
これは社内デモなので影響は軽微でした。しかし、本番の経営判断にこのまま使ったら:
- 4 月の売上を ¥471,000 過小評価 → 投資判断のミス
- 士業案件数を 3 件過大評価 → リソース配分のミス
- 保守 ARR を ¥600,000/年 過小評価 → 来期計画のズレ
数十万円〜百万円規模の判断ミスにつながります。
なぜ AI 出力は間違えるのか
AI(特に大規模言語モデル)が数値処理で間違える主なパターン:
パターン 1: モデルが暗算で済ませる
軽量モデル(GPT-4o-mini 等)は、プログラム的な計算ではなく言語的な確率推論 で数字を出すことがあります。30 行の足し算でも誤差が出ます。
→ 詳しくは 業務向け AI モデル選定ガイド もご覧ください。
パターン 2: データの一部を見落とす
長いコンテキストを与えたとき、末尾や中盤の行を AI が暗黙的にスキップ することがあります。30 件のデータを渡しても、AI は「30 件全部見た」とは限りません。
パターン 3: 集計対象の定義が曖昧
「士業の売上」と聞かれたとき:
industry = '士業'のレコード合計 ← 正解- 「士業っぽい」社名(行政書士等)でフィルタ ← 微妙にずれる
- 関連業種(顧問業)まで含める ← 範囲超過
AI は 質問の解釈の一意性 がないとき、独自判断で集計します。
パターン 4: テンプレ作成時の人為ミス
私の自社デモのケースのように、人間が AI を使って事前回答をテンプレ化 する際、人間側の確認漏れで誤りが入ります。
経営者の 3 つのチェック
AI が出した数字を経営判断に使う前に、経営者自身が必ず行うべき 3 つのチェック:
チェック 1: 計算根拠の表示を要求する
AI に数字を出させるとき、「計算式」「対象 ID」「集計範囲」 を必ず併記させます。
NG な AI 出力:
4 月の売上は ¥1,440,000 です。
OK な AI 出力:
4 月の売上は ¥1,911,000 です(8 件)。
計算根拠: 4 月計上分(S016〜S023)の amount_jpy 合計 = 580,000 + 450,000 + 5,500 + 360,000 + 180,000 + 50,000 + 5,500 + 280,000 = 1,911,000
これにより、人間が 検算 できる状態になります。
チェック 2: 実データとのスポット突合
すべてを検算する必要はありません。ランダムに 1〜2 件、AI の集計結果を実データで突合 します。
例:
- AI の主張: 4 月売上 8 件 ¥1,911,000
- 実データ確認: スプレッドシートで 4 月分をフィルタ → 8 件 ¥1,911,000 ✓
10 秒のチェックで、9 割の数値ミスを発見できます。
チェック 3: 誤差レンジを聞く
AI は基本的に 「正解を 1 つ」 出力しますが、現実のビジネスデータには 誤差・解釈の幅 があります。
AI に聞くべき質問:
この数字の前提となる「集計範囲」「除外条件」「計算式」を教えてください。 もし範囲を変えたら、結果はどう変わりますか?
AI が答える例:
集計範囲: industry が「士業」のレコード(5 件、¥1,180,000) 除外条件: なし もし「士業 + 関連業種」を含めると 7 件、¥1,260,000 になります
これにより、意思決定者が「どの解釈で判断するか」 を選べます。
システムプロンプトに組み込む
毎回 AI に「計算根拠を出して」「誤差レンジを聞いて」と言うのは面倒なので、システムプロンプトに固定 します。
例:
あなたは経営者向けデータ分析アシスタントです。
数値を出力する際の必須ルール:
1. 計算根拠(対象 ID 列挙・計算式)を必ず併記する
2. 集計範囲・除外条件を明示する
3. 解釈の幅がある場合、代替の集計結果も提示する
4. データ不足で確定的に答えられない場合は「断定できない」と明示
例: 「4 月の売上は ¥1,911,000(8 件)です。
計算根拠: S016〜S023 の合計
= 580,000 + 450,000 + ... = 1,911,000」
このルールをシステム固定にすれば、ユーザーが毎回指示しなくても 常に検証可能な数字 が出ます。
チェックを「文化」にする
AI による数値生成のチェックは、ツールでなく文化 にすることが重要です。
組織内で:
- 「AI が出した数字は、必ず計算根拠を併記する」
- 「数千万円規模の判断には、必ず手動スポットチェック」
- 「経営会議で AI 数字を引用するときは、出典 ID を必ず提示」
を運用ルールにすれば、AI の効率化 と 判断の信頼性 が両立します。
Optiens の取り組み
Optiens では、AI による数値レポート機能を構築する際、「計算根拠の自動併記」 をシステムプロンプトレベルで標準化しています。
実機で確認できるデモ:
- 自然言語データ検索 + 計算根拠表示 ── 各クエリに 「計算根拠」セクション が併記される設計
御社の AI 数値レポート構築を検討中の場合、無料 AI 活用診断 からご相談ください。
まとめ
- AI が出した数字は、検証なしで経営判断に使うと 数十万円〜百万円規模のミス につながる
- 失敗パターン: 暗算ミス・データ見落とし・解釈曖昧・テンプレ人為ミス
- 経営者の 3 つのチェック: 計算根拠の要求 / 実データ突合 / 誤差レンジの確認
- システムプロンプトに固定して 「文化」 として根付かせる
「AI に任せて楽になる」と「数字を信じて判断ミス」のバランスを取るために、3 つのチェックは経営者の必須スキルです。
出典:
- Optiens 自社デモ実装の数値整合事例(2026 年 5 月)
- 各種 AI 数値処理に関する公開知見