社員のAI活用を底上げする。ケース共有でエキスパートチームを育てる

社員のAI活用を底上げする。ケース共有でエキスパートチームを育てる

冨田希望冨田希望
公開日:2026/06/10
読了目安:15分

AIツールは、もう一部の詳しい人だけが触る特別な道具ではなくなりました。
Claude Code、Codex、Cursor など、AIを開発作業に組み込むためのツールが広がっています。
さらに、MCP、Skills、Rules、Subagents など、AIに渡す情報や実行手順を拡張・整理する仕組みも増えています。
便利なんだけど、そのぶん「うまく使える人」と「まだ使い方を探っている人」の差も広がりやすくなっています。しかも、社員ごとに担当している案件、技術スタック、業務内容は違います。全員に同じプロンプトを配れば解決、という話ではありません。AIに任せる範囲、渡す情報量、検証の仕方、ツールの選び方は、現場ごとに判断が必要です。

だから、知見を属人化させたくないです。AI活用が得意な人のやり方をこっそり個人技にしておくのではなく、小さな工夫、迷った判断、採用しなかったAI回答、危なそうだから止めた場面を、チームで見える形にする。そうすると、他の社員が「それ、自分の仕事でも使えそう」と真似できます。

このブログで提案するのは、社員のAI利用ログを監査する運用ではありません。隔週でAI活用ケースを1件持ち寄り、どこで判断し、どこを検証し、次回どう良くするかを共有する運用です。目的は個人を点数化することではなく、社内に「真似できる使い方」を増やすこと。派手ではないけど、こういう仕組みの方が長く効きます。たぶんね。

提案するアプローチ

やることはシンプルです。以下の5ステップを隔週で回します。

  1. 隔週で、AIを使った作業ケースを1件回答してもらう
  2. 他の社員の回答を読む
  3. 参考になる工夫に、ケース単位でバッジを付ける
  4. コメントで質問・真似・注意点を残す
  5. 次回のAI活用を1つだけ良くする
AI活用ケース共有の改善サイクル

ここで大事なのは、提出してもらうケースを「成功事例」に限定しないことです。

うまくいった話だけだと、活用度が高い人しか書きにくくなります。AIを使い始めたばかりの人や、エンジニア初心者の人ほど、「ちゃんとした事例を書かなきゃ」と思って止まりがちです。しんどいですね。

だから、対象にしていいケースは広めにします。

  • AIに任せるか迷った作業
  • AIの案をそのまま採用しなかった作業
  • 小さな工夫で少し楽になった作業
  • うまくいかなかったけど、次回変える点が見えた作業
  • 危なそうだったので、人間側で止めた作業

大きな成果でなくていいです。むしろ、小さな判断が共有される方が、他の人は真似しやすいです。

なぜログ監査ではなくケース共有なのか

AI活用の改善を考えると、AIとの会話ログやプロンプト履歴を集めて見ればいいのでは、という案も出ます。気持ちは分かります。全部見れば何か分かりそうに見えるので。

ただ、実際に運用するとなると懸念が多いです。

確認コストが大きすぎる。 AIとの会話ログは長くなりがちで、全部読むだけでかなり重いです。しかも、長いログを読んでも「この人が何を判断したのか」が必ず分かるとは限りません。

機密情報の問題がある。 ログには顧客情報、仕様、社内事情、認証やDBまわりの情報が混ざる可能性があります。監査のために集めるほど、管理しなければいけない情報も増えます。

心理的安全性が下がる。 自分のAI利用ログを見られる運用は、どうしても監視されている感覚が出やすいです。そうなると、社員は失敗や迷いを書きにくくなります。改善したいのに、改善材料が出てこなくなる。これはかなりもったいないです。

指標ハックが起きる。 AI利用回数、プロンプト数、MCP使用回数、生成コード量のような数字を主指標にすると、その数字を増やす行動が始まります。でも、AIをたくさん使うことと、良い判断ができることは別です。

プロンプト採点は長期的につらい。 AIモデルはどんどん変わります。昔は細かく手順を書いた方がよかった場面でも、今はゴール、制約、成功条件、検証観点を明確にして、解き方はAIに任せた方がうまくいくことがあります。

つまり、見るべきなのは「プロンプトがきれいか」ではありません。

見るべきなのは、次のような判断です。

  • AIに任せる範囲をどう決めたか
  • どんな情報を渡し、何を渡さなかったか
  • AIの回答をどう検証したか
  • 採用しなかった案があるなら、なぜ採用しなかったか
  • リスクがある作業で、どこで人間判断に戻したか
  • 次回、AIへの頼み方をどう変えるか

ログの海を掘るより、本人が選んだ1ケースを一緒に見る方が、ずっと現実的です。

1ケースだけで、本当に底上げになるのか

ここで、もうひとつ自然な懸念があります。

「隔週で1ケースだけ丁寧に共有しても、それ以外の作業では結局なんとなくAIを使うだけになるのでは?」という話です。うん、分かります。かなり現実的な心配です。

ただ、究極的には、それでもよいと思っています。この運用の目的は、社員のすべてのAI利用を管理することではありません。うまく使える工夫を、社内で見つけやすく、真似しやすく、再利用しやすい状態にすることです。

実務で本当に役に立つ使い方なら、人は自然に使います。うまく使える方法が目の前にあって、自分の仕事も楽になるなら、あえて使わない理由はあまりありません。だから、全員の全作業を追いかけるより、「これは使える」と思える具体例を増やす方が効きます。

それに、なんとなくAIを使ってうまくいっているなら、それはそのタスクに対しては十分よい使い方かもしれません。毎回、立派なプロンプトを書いたり、がちがちに手順を固めたりすることが正解とは限りません。小さい確認、小さい言い換え、軽い壁打ちで十分な場面もあります。

大事なのは、すべてのAI利用を型にはめることではなく、必要な場面でちゃんと切り替えられることです。リスクが高い作業では止まれる。影響範囲が広い作業では検証できる。曖昧な依頼ではゴール、制約、成功条件を明確にできる。そういう判断力をチームで育てたいわけです。

つまり、1ケース共有は管理のための提出物ではなく、学習素材を生み出す入口です。普段のAI利用を全部きれいに整えるためではなく、良い使い方が自然に社内へ広がるための仕組みです。

回答フォームは「的を射た質問」にする

AI活用ケースレビューの回答フォームイメージ

この運用で一番大事なのは、質問設計です。

広すぎる質問は、回答を引き出せません。「AI活用で工夫したことはありますか?」と聞かれても、慣れていない人ほど「特になし」と書いてしまいます。実際には小さな工夫をしていても、それを工夫として認識できていないことが多いからです。

なので、質問は具体的にします。しかも、運用しながら磨き続けます。最初に作った質問がずっと正解、ということはありません。回答が薄くなる質問、迷わせる質問、書く負荷が高い質問は、隔週運用の中で少しずつブラッシュアップしていきます。

ここでは、6問に絞ります。

Q1. 対象ケース

この期間で、AIの使い方に何らかの工夫・判断・迷いがあったタスクを1つ書いてください。成果が大きかったタスクでなくても構いません。

書くとよいことは、どんな作業で、どこにAIを使ったのかです。作業の規模は小さくて大丈夫です。

回答例:

一覧画面のフィルタリング処理で、条件を組み合わせると件数が正しく絞り込まれないケースがあり、AIと一緒に原因を調査して修正した。

初心者の場合は、もっと短くてもいいです。

エラー内容をAIに説明してもらい、原因になりそうなファイルを一緒に探した。

これで十分です。どこからAIを使ったかが見えれば、次の会話につながります。

Q2. 自分で判断した部分

今回、AIに全部任せず、自分で判断した部分はどこですか? 採用した案、採用しなかった案、修正範囲を狭めた判断などを書きます。

ここはかなり重要です。AI活用の質は、AIに何をさせたかより、人間がどこで舵を握ったかに出ます。

回答例:

AIはフィルタリングロジックを共通ユーティリティに切り出してテストを整備する案を出したが、今回は対象の絞り込み処理だけを直す方が安全と判断した。リファクタリングは別タスクで対応する方針にした。

初心者向けの回答例:

AIの説明だけでは不安だったので、先輩に確認してから修正した。自分では、まずエラーが出ている画面だけを見ることにした。

「自分で判断した」と言われると難しく感じますが、実際は「AIに言われたけど一回止まった」「誰かに確認した」「範囲を小さくした」も立派な判断です。

Q3. 採用しなかったAI回答

AIの回答で、そのまま採用しなかった部分はありますか? あれば、なぜ採用しませんでしたか? なかった場合は空欄でもOKです。

この質問は任意です。毎回あるとは限りません。

ただ、採用しなかった回答には学びが多いです。AIの案を疑う、既存仕様と比べる、影響範囲を見る。こういう判断は、他の社員にとってかなり参考になります。

回答例:

AIはフィルタ条件の管理方法を全体的に見直す案を提案したが、影響範囲が広すぎるため採用しなかった。今回の不具合は特定条件の組み合わせ時のみ発生するため、その箇所だけをピンポイントで修正する判断をした。

初心者向けの回答例:

AIが出したコマンドの意味が分からなかったので、そのまま実行しなかった。あとで調べたら、不要なファイルまで変更しそうだった。

これはすごく良い回答です。分からないコマンドを実行しないのは、ちゃんとしたAI活用です。

Q4. 意図的に工夫したこと

AIの回答精度、作業効率、安全性を上げるために、意図的にやったことを選び、具体的に書きます。

選択肢はこのくらいにします。

  • 任せ方を工夫した
  • 情報の渡し方を工夫した
  • 会話・セッション管理を工夫した
  • ツール・機能の使い分けを工夫した
  • AI回答の検証・取捨選択を工夫した
  • 再利用・共有できる形にした
  • 上記にあてはまらない独自の工夫をした
  • 特になし

回答例:

会話・セッション管理、ツール・機能の使い分け、AI回答の検証・取捨選択を選択。Claude Codeのプランモードで修正案を出させたが、影響範囲が大きい案だったためそのまま進めず、ChatGPTにまっさらな状態で別案を確認した。

初心者向けの回答例:

エラー文だけでなく、直前に自分が変更したファイル名もAIに伝えた。最初より原因の候補が絞りやすくなった。

小さいですね。でも、これでいいです。こういう小さい工夫が積み上がると、チーム全体のAI活用がじわっと良くなります。

Q5. 次回変えること

次に同じ作業をAIで行うなら、先にAIへ伝える情報を1つ増やす、または減らすとしたら何ですか? 1点だけでOKです。

改善は欲張らない方が続きます。毎回1つでいいです。

回答例:

最初から「他画面への影響を最小化したい」「共通のユーティリティはなるべく触らない」という制約を伝える。

初心者向けの回答例:

次は、エラー文だけでなく、自分が試したことも先に書く。AIに同じ確認を何度もさせないようにする。

「次回は何を変えるか」が残っていると、次のケースレビューで改善を確認できます。

Q6. 他の人が真似できそうなポイント

大きなノウハウでなくて構いません。「この聞き方は使えそう」「この切り分け方は便利だった」くらいでOKです。

この質問も任意です。ただ、チームの底上げにはかなり効きます。

回答例:

AIにいきなり修正させる前に、複数案の影響範囲を比較させてから、最小影響の案を選ぶ進め方。1つのAIセッションで修正案が大きくなりすぎた場合は、別AIや別セッションで別案を確認する進め方。

初心者向けの回答例:

エラーを貼る前に「初心者にも分かる言葉で、原因候補を3つに絞って」と伝えると理解しやすかった。

こういう回答は、他の初心者にもすぐ使えます。すごく実用的です。

コメントは評価ではなく、学習の反応

AI活用ケースへのコメントUIイメージ

コメント欄は、採点する場所ではありません。

「それは違う」「もっとこうすべき」と詰める場所にすると、すぐ誰も書かなくなります。やだね、そういうの。

コメントの役割は、提出されたケースを次の学習につなげることです。投稿者だけでなく、読む人、質問する人、真似する人も運用の参加者になります。

使いやすいコメント種別は、次の5つです。

  • 参考になった
  • 真似したい
  • 質問したい
  • 自分も試した
  • 注意点あり

コメント例:

参考になった: この /btw の使い方は、自分の実装相談でも使えそうです。

真似したい: AIに修正させる前に、複数案の影響範囲を比較させる進め方を真似してみます。

質問したい: セッションを分けるタイミングは、どのくらい会話が長くなった時に判断しましたか?

自分も試した: 似たログ調査で、この整理方法を試したら、確認漏れが減りました。

注意点あり: DB変更系では、AIにSQLを書かせる前に既存マイグレーションの確認も入れた方が安全そうです。

同じような回答が増えるのでは、という懸念もあります。これは、あまり問題にしなくていいと思います。

他者の回答を読んで「この使い方いいな」と思い、自分の作業に取り入れる。それは立派なAI活用です。むしろ、どんどん真似してほしいです。

「○○さんの使い方を真似しました」

これも価値ある回答です。よくある回答が増えるのは、良い工夫が社内に広がっているサインでもあります。もちろん、完全なコピペだけで実務に接続していないなら改善が必要ですが、真似して、試して、自分の案件に合わせて少し変えるなら、それはちゃんと成長です。

バッジは能力証明ではなく、参考ポイントのラベル

6つのジョブ系バッジの一覧

バッジは、人をランク付けするためのものではありません。

「Aさんは優秀」「Bさんはまだまだ」という見方を始めると、運用が一気に息苦しくなります。ここで見るのは人ではなく、ケースです。

つまり、こう見ます。

Aさんの今回のケースには、コンテキスト管理の参考になる工夫がある。

Bさんの今回のケースには、AI回答を採用しなかった判断がある。

1ケースにつき、バッジは最大2から3個程度にします。多すぎると意味が薄くなるので、特に参考になるポイントだけ拾います。書かれていないことは減点しません。推測でも付けません。

リスクガーディアン

危ない作業でAIを止め、人間判断に戻せたケースに付けます。

対象になりやすいのは、本番影響、DB変更、認証、セキュリティ、顧客情報、仕様判断が必要な作業です。

例:

DB変更を伴う可能性があったため、AIには影響範囲と確認観点の整理だけを任せた。実際にどのカラムを変更するかは、人間側で既存仕様と本番影響を確認して判断した。

メリットは、AIに任せない判断も良い活用として見えることです。使うことだけがAI活用ではありません。止まれる人は強いです。

スキル鍛冶師

一度きりのAI活用で終わらせず、次回も使える手順、Skill、Rules、チェックリストとして残したケースに付けます。

例:

今回のログ調査は今後も似たケースがありそうだったため、最後にAIへ調査手順を整理させ、次回使えるチェックリストとして残した。

メリットは、個人の工夫がチームの資産になりやすいことです。できる人の頭の中だけにあった手順を、他の人も使える形にできます。

ツール軍師

AI開発支援ツールや拡張機能を、目的・作業内容・リスクに応じて使い分けられたケースに付けます。
例:Claude Code、Codex、Cursor、MCP、Skills、Rules、Subagents、スラッシュコマンドなど

大事なのは、使ったことではなく、選んだ理由です。

例:

新機能の実装と並行して、Supabase MCPを使いDBのテーブル設計とマイグレーションをAIに進めてもらった。実装コードとスキーマの整合性をリアルタイムで確認しながら開発できたため、後から仕様ズレに気づくような手戻りが少なかった。

メリットは、ツール名の流行に振り回されにくくなることです。使わない判断も、ちゃんと共有価値があります。

コンテキスト航海士

AIに渡す情報、渡さない情報、会話やセッションの分け方を意図的に管理できたケースに付けます。

例:

修正方針の本筋とは別に、軽く気になった点は別の会話で質問した。本筋に混ぜると、AIが修正範囲を広げすぎる可能性があったため。実装方針の会話には、対象コード、修正方針、制約だけを残した。

メリットは、AIとの会話が濁りにくくなることです。AIは文脈の影響を強く受けるので、何を入れて、何を入れないかはかなり大事です。

検証アナリスト

AIの回答を鵜呑みにせず、疑い、比較し、既存仕様やテストと照合したケースに付けます。

例:

AIが提案した修正方針は、考えられる影響範囲を幅広くカバーした丁寧な内容だったが、今回の運用では対象外にしてよいケースまで含まれていた。実際に問題が発生するケースに絞って再判断し、より影響範囲の小さい修正にした。

メリットは、AIを使うほど必要になる検証力を共有できることです。AIが賢くなるほど、もっともらしい間違いも見抜きにくくなります。だからこそ、人間側の検証プロセスを見える化します。

AI発明家

既存カテゴリに収まらないが、他の社員が真似したくなる実務上の工夫があるケースに付けます。

例:

実装方針を決める前に、AIに「この方針に反対するレビュアー」の立場で懸念点を出させた。その結果、見落としていた既存画面への影響に気づけた。

メリットは、新しい使い方を拾えることです。AIツールは変化が速いので、最初から分類しきれない工夫が出てきます。その余白をちゃんと残します。

活用度が低い人ほど、書くメリットがある

AIを使い始めたばかりの人は、「自分の回答なんて役に立たない」と思うかもしれません。

でも、むしろ書いた方がいいです。

初心者のつまずきは、他の初心者にとって一番分かりやすい教材になります。エキスパートの高度な使い方も大事ですが、最初の一歩で何に困ったか、何をAIに聞いたら理解しやすくなったか、どこで怖くて止まったかも、かなり価値があります。

例えば、こんな内容で十分です。

  • エラー文を貼るだけでは分からなかったので、自分が直前に変更したファイルも伝えた
  • AIが出したコマンドの意味が分からなかったので、そのまま実行しなかった
  • 先輩に聞く前に、AIに質問案を整理してもらった
  • AIの説明が難しかったので、「初心者向けに言い換えて」と頼んだ
  • 次回は、試したことを先に書くようにする

これらは全部、AI活用の改善です。

「すごい使い方」だけを集めると、一部の人の発表会になります。でも、「小さな判断」も集めると、チーム全体の学習になります。底上げって、そういう地味なところから始まるんだと思います。

運用するときのコツ

この仕組みは、作って終わりではありません。運用しながら育てます。

まず、隔週くらいの頻度で始めるのがちょうどいいです。週1だと重くなりやすいですし、月1だと記憶が薄れます。さらにAIツールは機能追加や使い方の変化が速いので、月1では「先月の良いやり方」がもう少し古くなっている可能性もあります。隔週なら、最近の作業を思い出しやすく、AIツールの変化にも追いつきやすいです。

次に、回答フォームは固定しすぎないことです。回答が薄い質問があれば、質問文を変えます。似た回答ばかりになるなら、例を増やします。初心者が書きにくそうなら、「小さな迷いでもOK」と明記します。

バッジも、最初は6種類で十分です。増やしすぎると迷います。運用してから、本当に必要なカテゴリだけ追加すればいいです。

コメントは、最初から完璧な文化にはなりません。まずは運営側やAI活用に慣れている人が、「参考になった」「真似したい」「この観点も良さそう」と軽くコメントして、空気を作るのがよいです。

そして、ランキングは出さない方がいいです。バッジ数、コメント数、投稿数を競わせると、学習のための場が成果アピールの場に変わります。数字は運用の健康診断として見るくらいで十分です。

まとめ

社員のAI活用スキルを底上げするには、正解プロンプトを配るより、AI活用の判断を共有できる仕組みを作る方が強いです。

この運用なら、初心者も参加しやすく、上級者の工夫も共有されやすくなります。AIツールが変わっても、運用自体を少しずつ更新できます。

AI活用エキスパートチームは、最初から一部のすごい人だけで作るものではありません。

小さなケースを持ち寄って、うまい使い方を真似して、危ない使い方を避けて、次回ひとつ良くする。その積み重ねで、チーム全体がじわじわ強くなっていきます。

それくらいの温度感が、たぶん一番続きます。