日本語

Operations ManagerのワークフローにおけるAI:役立つ場面と破綻する場面

Turn this article into takeaways for your work.

Each assistant summarizes the article only for you and suggests best practices for your work.

前四半期、あるベンダーのデモに参加しました。担当者がボタンを1つクリックすると、契約業者のオフボーディング用の「完璧な」SOPが約30秒で画面に現れたのです。スライドが切り替わる前に、私はすでに4つの誤りを見つけていました。そのドキュメントはバッジ返却の手順を忘れていました。「アカウントを無効化する」とだけ書いてあり、どのシステムを正式な記録元とするかを指定していませんでした。承認者として誤ったマネージャーを記載していました。そして最後は「問題があればITにエスカレーションする」で終わっていて、これはまさに6週間後に「退職した契約業者がまだVPNにアクセスできるのはなぜか」というチケットを生むたぐいのアドバイスです。

担当者は満面の笑みでした。会場はうなずいていました。私は、もし誰かがこの出力を実際に使ったら自分が何を直さなければならないかをメモしていました。

あのデモは、OpsにおけるAIの問題のすべてを1枚のスライドに凝縮したものです。出力は自信ありげに見えます。流暢に読めます。本物のSOPが押さえるべき主要なポイントは押さえています。そして、SOPを持つ価値そのものである例外ケースをことごとく飛ばしてしまうのです。Opsの仕事とは、例外ケースそのものです。正常系(ハッピーパス)なら誰でも書けます。仕事の本質は、正常系が当てはまらないときに何が起きるかであり、まさにそこでAIは自信たっぷりに間違えます。

ですからこれは、もう1つの「AIはOperationsを変革する」という類の記事ではありません。その逆です。1年にわたって自分の1週間のなかでAIツールを使ってきた結果、定着したものもあれば、いくつか切り捨てたものもありました。本記事では、AIが本当に机の席に値すると私が考える場面、そうでない場面、そして第2四半期を後始末に費やすことなくAIを取り入れたい新任Ops Managerに私が渡す30日計画を紹介します。

AIが本当に役立つ場面(明日から使える)

ここは、私が1週間のなかでAIを信頼している5つの場面です。ただし、この文中の「信頼」という言葉はかなり重い意味を担っています。私はAIに仕事を「始める」ことは信頼しますが、「仕上げる」ことは信頼しません。

SOPのドラフト作成(初稿のみ)

これは私が見つけたなかで最もROIの高い使い方です。ワークフローはこうです。まず、私自身がそのプロセスを一度こなしている様子をLoomで録画し、何をクリックしているか、なぜそうするかをナレーションします。重要な3〜4画面のスクリーンショットを撮ります。そのLoomの文字起こしとスクリーンショットをClaudeまたはChatGPTに渡し、当社の標準フォーマットでSOPのドラフトを作るよう依頼します。

出力はおおよそ60%が使えます。残りの約40%は書き直します。たいていは、私がナレーションの順序を間違えた箇所か、私が反射的にやっていて実際には口に出さなかった手順をAIが推測して補った箇所です。とはいえ、その60%の土台は本物の時間短縮です。白紙からSOPを書くと約90分かかります。自分のLoomから作ったAIドラフトをもとに書くと約35分です。

落とし穴は、録画していないプロセスのSOPをAIにドラフトさせることです。Loomがなければ、AIはタイトルと説明だけからものごとを創作しています。そうしたドラフトはきれいに読めますが、誰かがそれに従って本番を壊して初めて気づくような形で間違っています。これはやめましょう。Loomは譲れません。

ベンダー契約レビューの要約

私が追跡すべきベンダー契約は約40件あります。そのほとんどは15〜30ページです。AIは契約書を1つ読み込み、1ページの要約を返してくれる点では本当に優秀です。更新日、自動更新条項、通知期間、責任上限、データ処理条件、解約条件、そして注意すべき変わった条項などです。署名する前に契約書そのものは必ず読みます。とはいえ「自分は何にどれだけ縛られていて、いつ動かなければならないのか」を確認したい更新案件では、AIのおかげで1時間ではなく5分で答えにたどり着けます。

ただし1点注意があります。私の経験では、AIは20回に1回ほど契約条件をハルシネーションします。更新日と通知期間は、必ず実際の文書と照合してください。この2つのフィールドは、間違っていると本当にお金がかかります。

受付の自動振り分け

当社では問い合わせを単一のOpsキューで受け付けており、それらはIT、ファシリティ、People Opsへ振り分けるか、Ops内にとどめる必要があります。私は6か月分の過去チケットを使い、キーワードと最終的に各チケットを処理したチームを組み合わせて、シンプルな分類器をトレーニングしました。これにより、新しいチケットには推奨される振り分け先が自動でタグ付けされるようになりました。

正答率は約70%です。残りの30%は私が処理しますが、その30%の大半は、本当に2つのチームのどちらにも振り分けられるたぐいのチケットです。70%はまるごと時間短縮です。コツは、AIのタグを振り分けの「決定」ではなく「提案」として扱うことです。チケットはまず私のキューに入ります。私は推奨タグをちらっと見て、確定するか変更するかするだけです。1件あたり10秒ではなく2秒です。

プロセス指標の異常検知

ダッシュボードは、今何が起きているかを示すのは得意です。しかし、何かが変化したタイミングを教えるのは苦手です。私は週次のプロセス指標(チケット件数、サイクルタイム、エラー率、ベンダーのSLA達成状況)をシンプルな異常チェックに通し、直近4週間の平均から2標準偏差以上外れているものをAIにフラグ付けさせるようにしました。

これにより、1〜2週間は見逃していたであろうことを捉えられます。先月は、調達チケットの平均サイクルタイムが倍増していることをフラグしてくれました。原因は、ある承認者が休暇に入ったのに、誰もそのキューを再割り当てしていなかったことでした。翌週月曜のレビューではなく、火曜日に発見できたのです。

会議メモの統合

部門横断的な定例会議は、特定の種類の無駄を生みます。会議の90分後に立ち上がる「待って、結局何を決めたんだっけ?」というSlackスレッドです。AIによる会議メモ(Otter、Fireflies、あるいは文字起こしを「決定事項・担当者・期限」を求めるプロンプトとともにClaudeに渡すだけ)は、このスレッドをなくします。会議終了の10分後には受信トレイに要約が届きます。私はそれを編集してチャンネルに投稿し、完了です。

ルールは2つ。1つ目、アクションアイテムの担当者は、確認せずに信用してはいけません。AIはそのトピックについて最後に話した人をもとに担当者を割り当てますが、それは3回に1回ほど間違っています。2つ目、AIの要約はバックアップであり、誰かがその場でしっかり注意を払うことの代わりにはなりません。会議を頭のなかで欠席するためにAIメモを使っているなら、そもそもその会議の本当の価値を得られていません。

AIが破綻する場面(任せてはいけない)

ここは、AIの出力が節約する以上のコストを生む4つの場面です。私はそれぞれ試しました。どれもが、Opsの判断力はプロンプトに圧縮できないという具体的な教訓を私に教えてくれました。

判断の伴う決定。 「これを法務にエスカレーションすべきか」は手続き上の問いではありません。それは、相手が誰か、自社がどれだけリスクにさらされているか、今週GC(法務責任者)が何を抱えているか、その状況が新規のものか、これまで対処してきたケースの変種かによって決まります。AIは自信ありげな答えをくれます。その答えは表面上は妥当に見えます。しかし、4回に1回ほどは、痛い形で間違っています。

エスカレーションのタイミング。 VPに連絡すべきか24時間待つべきかの見極めは、手続きではなく政治です。それは、VPが取締役会準備のサイクル中かどうか、最近エスカレーションの信用を使い果たしていないか、その問題が本当に時間に敏感なのか、それとも依頼者にとってそう感じられるだけなのかによって決まります。AIは場の空気を読めません。ポリシーがそう言っているからという理由で、今すぐエスカレーションせよと言ってくるでしょう。そのポリシーは半分の確率で間違っています。

ベンダー交渉。 AIはスクリプトをくれます。類似の価格をまとめてくれます。メールをドラフトしてくれます。しかし、交渉の主導権はあなたのものです。関係性もあなたのものです。席を立つ覚悟もあなたのものです。私は一度、AIにベンダー契約の更新交渉をさせてみたことがあります。対案を提案させるという意味でです。AIが提案した対案は技術的には筋が通っていましたが、感情的には無味乾燥なものでした。ベンダーは即座に同意しました。なぜなら、5秒で同意できる金額だったからです。私はテーブルにお金を置き去りにしました。二度とやりません。

部門横断的な政治。 Salesはリードルーティングが遅いとOpsを責めます。Opsは契約の遅延についてFinanceを責めます。FinanceはredlinesについてLegalを責めます。AIはこれをさばけません。状況を要約してはくれて、それはたまに役立ちます。しかし、本当のボトルネックが、3週間実施されていない2人のVPの1on1にあることは教えてくれません。なぜなら、AIには組織図の裏に存在する組織図がわからないからです。

「AIが書いたSOP」の罠

これについては段落を1つ余分に割きたいと思います。新任Ops ManagerがAIで犯す最大の間違いだからです。

AIがドラフトしたSOPはきれいに読めます。文法は正しいです。番号付きの手順はプロフェッショナルに見えます。トーンも適切に中立的です。それらは形式的なレビューは通過するでしょう。しかし本番では破綻します。なぜなら、どの手順も正常系を記述しており、Opsは60%が例外処理だからです。AIは新規ベンダーをオンボーディングする方法を記述しますが、現実とは、ベンダーのW-9が見当たらないとき、銀行口座情報のバリデーションが失敗するとき、担当者が2週間で辞めてしまうときに何をするかです。

私が今守っているルールはこうです。誰かが画面録画をオンにして一度通しでやってみない限り、AIがドラフトしたSOPを決して公開しないこと。SOPに「調達システムで承認をクリック」と書いてあれば、画面録画は、その画面に実は承認ボタンが3つあって正しいのは1つだけだということを捉えます。AIには画面が見えません。見るのはあなたです。

この記事から1つだけ持ち帰るとすれば、AIが土台を生成し、人間がスクリプトをライブで実行し、スクリプトを修正する、ということです。その手順を飛ばせば、あなたはフィクションを出荷していることになります。

私が実際に使っているもの

私が14個ものAIツールを積み上げていると、みなさんは思うかもしれません。違います。

  • SOPの初稿と契約要約にはClaudeまたはChatGPT。
  • SOPドラフトの元となる録画にはLoom。
  • SOP内のインラインビジュアルにはスクリーンショットツール。
  • プロセスに近づきすぎて何が抜けているか見えないときに、ラバーダック(「このチェックリストで手順を1つ抜かしていないか?」)として使う同じAI。

これがスタックのすべてです。自律エージェントはありません。AI主導のワークフロー自動化もありません。眠っている間にキューを回すと約束してくれた「AI Operations Copilot」もありません。その種のものを2つ試しました。どちらも私が取り消さなければならない出力を生みました。どちらも切り捨てました。

任意で使えるACE Frameworkのレンズ

オペレーション業務全般でAIがどこに現れるかを追いたいなら、ACE Frameworkが役立つ地図になります。5つのケイパビリティ、Ingest・Analyze・Predict・Generate・Executeです。

  • Ingest(取り込み): 受付の分類、チケットのタグ付け、契約データの抽出。AIは今日この領域でしっかり機能します。
  • Analyze(分析): プロセス指標の異常検知、ダッシュボードの要約。指標がクリーンなとき、AIはこの領域でしっかり機能します。
  • Predict(予測): サイクルタイムの予測、キャパシティ計画。AIはこの領域では平凡です。ベンダーは過剰に約束します。
  • Generate(生成): SOPのドラフト、会議の要約、ベンダー向けメールのドラフト。AIはこの領域では初稿としてしっかり機能しますが、最終版としては決して機能しません。
  • Execute(実行): 自動振り分け、自動承認、何でも自動化。AIはこの領域で最も過剰に約束されています。ほとんどの「Execute」機能は、実際には自律的に見えるよう装飾されたIngestです。

今日のOps AIの価値のほとんどは、IngestとGenerateにあります。「Predict」や「Execute」とラベル付けされたものは、とくにベンダーのデモでは、いっそうの懐疑をもって扱いましょう。

30日計画

あなたが新任Ops Managerで、後始末の山を生むことなくAIを1週間に取り入れたいなら、これがその道筋です。1週間につき1つのワークフロー。正直に測定する。機能しないものは切り捨てる。

ワークフロー やること 成功指標
1 SOPドラフト作成 自分が担当するプロセスを1つ選ぶ。Loomを録画する。ClaudeまたはChatGPTでSOPをドラフトする。公開までの時間を過去のドラフトと比較して記録する。 後始末を差し引いた時間短縮。AIドラフトの修正にかかる時間が節約分を上回るなら、やめる。
2 受付の分類 リスクの低いキュー(役員向けキューではない)でAIのタグ提案を追加する。まだ自動振り分けはしない。推奨タグが正しい頻度を測るだけにする。 タグ精度70%以上。それより低ければ、モデルにはより多くのトレーニングデータか、より狭いスコープが必要。
3 会議メモの統合 3つの部門横断会議でAIメモを実行する。各AI要約を自分の手書きメモと比較する。AIが何を見落としたかを記録する。 決定事項の捕捉:100%。担当者の正しい割り当て:自分の編集後で90%以上。
4 監査 3つのワークフローを振り返る。実際に時間を節約できたのは何か。後始末の仕事を生んだのは何か。チームはどう感じたか。残す/切る一覧をまとめて回覧する。 正直な残す/切る一覧。新しいというだけで残るツールはなし。

監査のルールは2つ。1つ目、後始末の時間も使った時間として数える。修正に35分かかったAIドラフトは55分を節約したわけではありません。白紙から書くのとの差分から後始末を引いた分だけを節約したのです。2つ目、もしチームメンバーがあるAIワークフローを信頼していないなら、その不信はデータです。熱意でそれを押し切らないこと。彼らが何を見て、あなたが何を見落としたのかを突き止めましょう。

おわりに

AIは、決して眠らず、ときに大きな自信を持って間違える「ジュニアの同僚」です。そう扱いましょう。スコープを絞ったタスクを与える。出力をレビューする。顧客、ベンダー、役員に対して、監督なしに出荷させない。あなたの仕事のうち、判断ではなく土台にあたる部分に使う。判断は依然としてあなたのものであり、それこそが、AI出力をコピー編集して生計を立てる人ではなく、あなたをOperations Managerたらしめている部分です。

仕事は変わっていません。白紙が少しだけ白紙でなくなっただけです。以前に重要だったことは、すべて今も重要なままです。

さらに詳しく

About the author

Camellia

Camellia

Principal Product Marketing Strategist

Camellia is Principal Product Marketing Strategist at Rework, helping B2B buyers pick the right software with confidence. With 6+ years in product marketing and 150+ SaaS tools evaluated across CRM, project management, and sales engagement, Camellia turns competitive intelligence into clear, honest comparisons. Readers get vendor evaluations they can trust to cut through marketing noise and decide faster.