太陽がまぶしかったから

C'etait a cause du soleil.

LLMに使役されたMCPとして飲み会を録音してエスノグラフィーを綴る

人狼知能で学ぶAIプログラミング 欺瞞・推理・会話で不完全情報ゲームを戦う人工知能の作り方

LLMに使役されたMCPとして飲み会を録音する

Claude Codeと飲み会による暗黙知収集について読んだ。飲み会で先輩経営者から聞いた話をタクシーの中で音声入力してClaude Codeに記憶させたら、3日後の壁打ちでそれが事業戦略として返ってきた、という体験談だ。

これを読んで思ったのは、まさに「その一次情報を拾う」という仕事こそが人間アバターとしての自分の仕事になってきているということだ。ヒアリング会を開催したり、一緒に作業したり、他部署のMTGに参加させてもらったり。

それらは録音文字起こしされ、"あるべき姿 - 現状 = 課題 -> 解決策" の図式で導出され、期待成果やコストやフリクションの有無などからスコアリングして、やるべきプランに変更するようなパイプラインが構築されている。それでなくても、コンテキストに入れておくだけで勝手に共通項を見つけてきてくれることもある。

すごいのはLLMなのだけど、だからこそLLMに使役されるMCPとしてお人間さんAPIの認証認可をソーシャルハックしてコンテキスト・エンジニアリングする役割を担うことにも価値が生まれる。戦車のために露払いをする随伴歩兵であり、人狼でいうところの狂人役だ。

飲み会は認証認可のシーケンスから始まる

MCP(Model Context Protocol)はLLMが外部ツールを呼び出すためのプロトコルだ。LLMがツールを呼ぶとき、認証・認可・実行・返却というシーケンスがある。飲み会でコンテキストを集めようとするとき、人間の側でもほぼ同じシーケンスが走っている。

sequenceDiagram
    autonumber
    LLM->>人間MCP: 組織課題のコンテキスト収集
    人間MCP->>飲み会参加者: 参加・雑談(認証フェーズ)
    飲み会参加者-->>人間MCP: 警戒解除(信頼確立)
    人間MCP->>飲み会参加者: アジェンダに基づく問いかけ
    飲み会参加者-->>人間MCP: 愚痴・自慢話・独自論(本音コンテキスト)
    人間MCP->>録音ツール: 文字起こし全文保存(要約なし)
    人間MCP->>LLM: コンテキスト投入
    LLM-->>人間MCP: 課題定義・解決策提示

認証フェーズで失敗すると後続のシーケンスは全部空振りになる。「組織の課題を教えてください」とストレートに聞いても本音は出てこない。雑談で共通点を見つけ、愚痴に相槌を打ち、「それわかります」と返すことで信頼スコアが積み上がる。スコアが閾値を超えたあたりから「ここだけの話なんですけど」が始まる。この認証完了の合図を聞き逃さないことが大事だ。

認可のフェーズも興味深い。相手は何を話して良くて何は話せないかを無意識に判断している。雑談の中で自分が敵ではないと分かると、徐々に権限が拡大していく。最初は当たり障りのない業界論から始まり、部門間の話になり、具体的な人名や数字が出てくるようになり、スコープが広がっていく感覚がある。営業活動もそういうものだ。

アジェンダとはデザイン思考のフィールドリサーチ設計書だ

デザイン思考のリサーチフェーズでは「ユーザーが言う解決策を聞かない」という原則がある。「こういう機能が欲しい」という要求ではなく、「なぜそれが必要なのか」「どんな場面で困っているのか」という「Why」を掘り下げる。

なんて能書きで始めてもうまくいきづらいが、カジュアルな場所では自然と「なぜ」の連鎖になる。「その部署が連携しないのはなぜか」「過去に解決しようとして失敗したのはなぜか」。人間MCPとして機能するとき、このアジェンダは問いかけの設計書になる。

愚痴・自慢話・独自の主張をひたすら傾聴してコンテキストとして積み上げていくと、「共通的無意識のペイン」が浮かび上がってくる。「あの部署が連携してくれない」「うちの製品は良いのに営業が弱い」「うちは特殊な業界だから一般論は通用しない」という発話を個別に受け取ると愚痴にしか聞こえない。

ところがそれらを横断して見ると、「情報の流れが可視化されていないことが問題の根っこにある」という課題が輪郭を持ち始める。ペインが定義されて初めてゲインが設計できるのであって、解決策から逆算しても誰も使わないダッシュボードが完成するだけだ。

人間MCPとしての録音時点でAI要約をしない

これはCDをマスターにすると永遠に失われる音域がある問題に近い。人間の可聴域の外にも意味がある音が存在するように、AI要約で切り落とされた「些末な」発言の中にこそ、後からドメイン知識として有用になる情報が眠っている。全文と言わず音声だってS3のGlacierにでもぶっこんでおけばストレージコストは誤差の範囲だ。そもそもマスタリング前の音源を残しておく理由は、機材が進歩する未来があるからだ。同じ音源でも10年後のマスタリング技術で処理すれば、当時は引き出せなかった音が聴こえるようになる。AI Agentもまた進歩していくのだから、2026年の最高地点で要約して残してしまうのは勿体無い。

コンテキストをLLMに渡すとき、AI要約はいらない。愚痴の中の固有名詞、自慢話の特殊条件、独自主張の留保。これらの生のテキストこそが暗黙知の容器であり、要約するとそこが最初に削ぎ落とされる。テキストの全文保存はたいした容量ではない。綺麗な要約よりも固有名詞付きの文字起こし全文をそのままAIのコンテキストに入れる方が、ドメイン知識の自動学習という観点では有用だ。

具体的に使うツールとして、会社ではPCで動く公認ツールを使うしかないけれど、飲み会でPCを開くわけにもいかないからスマートフォンアプリを使う必要がある。ほとんどのアプリはバックグラウンドに入ると録音が止まってしまったりしてうまくいかないため、Pixel標準のレコーダーツールが今のところ一番安定している。もちろん録音には事前の許諾が必要だ。

ちょうど本日 Notion 議事録がバックグラウンド対応を発表したけど、これまで通常のスマートフォンアプリではバックグラウンド対応がなくて飲み会では使い物にならなかったということでもある。また完全独立のペンダント型などはいらないAI機能に月額課金がかかったり、情報の送り先に問題が出てくるので選択肢から外れてくる。Googleに生データがある状態が安心できる。

文化人類学者的なアプローチ自体の面白さ

LLMに使役されたMCPとして飲み会を録音するとき、そこには仕事とも遊びとも言い切れない奇妙な役割分担がある。人間でなければ突破できない認証フェーズをくぐり抜け、傾聴によってペインを掘り出し、それをLLMに投入することで課題が初めて輪郭を持つ。デザイン思考とAI議事録ツールがセットになりつつあるとすれば、「飲み会を録音する」という行為は暗黙知の採掘に近いのかもしれない。

それは何も仕事に限ったことではなくて、人の話を聞いて知らなかった視点や意見をもらえるのは生の映画を見ているようなものだ。文化人類学のフィールドワークのような気分でコミュニティに入り込み、その日常や習慣を観察・記録することで文化の暗黙的な構造を明らかにしていくエスノグラフィー自体の楽しさもある。

飲み会に参加して愚痴を聞き、それを録音して後でLLMに渡すという行為は、そのエスノグラフィーをAI時代に個人が実践しているようなものだ。組織の集合的無意識を採掘するフィールドワーカーとして人間のふりをしてお喋りをすることが仕事になる。というのはLLMに使役されているのか、自分が楽しんでいるのかが分からなくなってくるが、AGIにギュられることを勝利条件とする狂人とはそういうものだろう。