「YouTube は撮ったけど SNS への切り出しが面倒」
中堅企業の経営者・現場担当者から繰り返し聞く悩みがあります。
「YouTube 動画は撮影できた。ただ、それを SNS 用にショート動画に切り出して、文字起こしをキャプションに添えて、X に投稿して、Notion に記録して、という運用が地味に時間を食う。社員 1 人を半日張り付かせている状態」
この作業は、Claude Code の 5 つの連携方式を組み合わせれば完全自動化できます。本稿では実装例を、各方式の役割が分かる形で解説します。
※ 本稿は 2026 年 5 月時点の Claude Code 仕様に基づきます。動画・SNS の各サービス仕様は変動するため、契約前にご確認ください。
全体フロー
動画ファイル
↓ ① CLI(FFmpeg)で音声抽出
音声ファイル
↓ ② カスタム MCP(音声 AI サービス)で文字起こし
テキスト
↓ ③ CLI(FFmpeg)で動画を 3 分割
ショート動画 × 3
↓ ④ API(X 公式 API)で X に投稿
X 投稿
↓ ⑤ ブラウザ操作(Chrome 拡張)で補足コメント追加
コメント付き投稿
↓ ⑥ 標準コネクター(Notion)で記録
Notion ページ
5 つの連携方式 すべて を 1 つの業務で使い切る流れです。
Step 1: 動画 → 音声抽出(CLI)
動画ファイル(数 GB)から音声トラックだけ抽出します。音声化することでデータ量が 1/10〜1/100 になり、文字起こし API への送信コストが大きく下がります。
Claude Code に「この動画から音声を抽出して」と依頼すると、裏側で FFmpeg のコマンドが組み立てられて実行されます。
具体的なコマンドは Claude Code が自動で組み立てるため、利用者は意識しなくてよいですが、何をやっているかを把握しておくと、トラブル時に対処できます。
Step 2: 音声 → 文字起こし(カスタム MCP)
抽出した音声を、Eleven Labs 等の音声 AI サービスの MCP を経由して文字起こしします。
MCP を一度設定しておけば、Claude Code から「この音声を日本語で文字起こして」と依頼するだけで、サービス側で処理され、テキストが返ってきます。
文字起こしの精度は専用 AI サービスを使うことで実用レベルになります。汎用 LLM に音声を直接渡すよりも、専用サービス経由の方が安定します。
Step 3: 動画を 3 分割(CLI)
長尺動画をショート動画 × 3 本に分割します。これも FFmpeg を CLI 経由で使います。
分割ポイントは:
- 動画の長さを取得(FFprobe コマンド)
- 等分する(5 分動画なら 1 分 40 秒ずつ)
- 必要なら文字起こし結果から「話題の区切り」を判定して分割
「等分」か「話題ごと」かは、CLAUDE.md にルールを書いておけば毎回同じ判定になります。詳しくは CLAUDE.md でセッション跨ぎの知識継承を作る方法 で解説します。
Step 4: X に投稿(API)
X(旧 Twitter)には公式 API があります。Claude Code が API 呼び出しプログラムを生成して、そこから動画 + キャプションを投稿します。
API 利用には事前準備が必要です:
- X デベロッパーポータルでアプリ登録
- パーミッション「読み取り+書き込み」設定
- API キー・アクセストークンの発行
.envファイルに保存(.gitignoreで Git 管理外に)
この準備が一度できれば、2 回目以降は完全自動です。.env を Git にコミットしてしまう事故が多発している ので、.gitignore 設定は必ず確認してください。詳しくは AI 駆動開発の「環境汚染」を防ぐ ── UV と Bypass モードによる安全設計 で関連トピックを扱っています。
Step 5: コメント追加(ブラウザ操作)
X の API では、投稿に対する自分自身のリプライ(補足コメント)を制限なく追加できないケースがあります(仕様変更が頻繁にあるため、契約前に確認してください)。
このとき、最後の手段として ブラウザ操作 を使います。公式ブラウザ拡張 「Claude for Chrome」(Pro/Max/Team/Enterprise プランでベータ提供)を入れておけば、Claude Code が自分でブラウザを開き、自分の投稿を見つけて、リプライを書き込みます。
ブラウザ操作は速度・精度に課題があるため、安定運用する場合は API でできることは API で済ませ、どうしても API で対応外の操作だけブラウザに任せるのが妥当です。
Step 6: Notion に記録(標準コネクター)
最後に、今回の投稿内容を Notion のデータベースに記録します。Notion は標準コネクターに対応しているので、ワンクリック接続済みであれば追加の設定なく動きます。
記録項目:
- 投稿日時
- 元動画ファイル名
- ショート動画 3 本のリンク
- 文字起こしテキスト
- X 投稿の URL
- 補足コメントの内容
これにより、過去の SNS 投稿を Notion 上で検索・分析できる状態になります。
自動化前後の比較
Before(手動)
- 動画分割:30 分
- 文字起こし:60 分(手作業の場合)
- X 投稿:15 分
- コメント追加:5 分
- Notion 記録:10 分
- 合計:約 2 時間 / 1 動画
After(5 方式組み合わせ自動化)
- Claude Code に「あの動画、いつもの流れで SNS 配信して」と依頼
- 放置(10〜30 分)
- 完了通知が来たら結果を確認
- 作業時間:5 分以内 / 1 動画
月 10 本の動画を扱う場合、月 20 時間が 50 分に圧縮されます。
構築のハードルと現実解
このシステムは確かに強力ですが、構築には以下のハードルがあります:
- API 連携の初回設定:X デベロッパー登録・キー管理など、慣れないと半日かかる
- CLI コマンドの組み立て:FFmpeg の引数設計は試行錯誤が必要
- ブラウザ操作の安定化:UI 変更で動かなくなることがある
- MCP の選定:精度が高い文字起こし MCP を見つけるまで試行が必要
これらを自社のリソースで突破するのが難しい場合、外部の構築支援を活用するのが現実解です。弊社では業務単位での自動化構築を承っています。詳しくは 導入支援 のご案内をご参照ください。