POPOPOは通話アプリではなく"繋がっているだけ"
【 #popopo の本質は通話じゃない 】
— 濱村 崇 / GameDesignLab (@GDLab_Hama) 2026年3月18日
popopoの本質は、通話アプリじゃなくて”繋がっているだけ”のアプリなんだと思う。
自宅でひとりで作業できない人が、ファミレスとかノマドで勉強したりするでしょ?
あんな感じで、誰もしゃべらずに、ただ繋がっているだけの部屋が増えるんじゃないかな?… pic.twitter.com/9nJ8wlDrHc
先日、発表されたPOPOPOを触ってみてClub Houseの手触りを感じた。アバター要素はあくまで動くアイコンとでもいう感じで、メタバースとしてのリッチさは感じないけれども、その気軽さこそが良い。Discordなどを接続しっぱなしの作業通話に使っていた文化を一般化し、ムーブメントにすることも狙っているのだろう。
面白いのはアバターの設計だ。POPOPOのホロスーツは自分の分身ではなく、動物やロボット、寿司のネタにすらなれる。求めているものが「自分らしさ」や「自己表現」ではなく、作業に集中するための「その場の空気感」だけなのだとすれば、むしろ視線を持たない貝になりたい。
「ながら」をしやすい塩梅を探している
受動的な作業通話の観点からするとポッドキャストも選択肢に入る。実際、通勤や家事や運動をしているときなどは良いお供になる。しかしながら、僕自身としては人の会話を聞きながら文章やプログラムを書いたり読んだりする「ながら」をすることができない。脳における言語野のキャパが溢れて処理しきれなくなってしまうのだ。
ポッドキャストは情報密度が高すぎるが、完全な無音では孤独感が勝る。そんなこともあって、作業中はミニマルテクノやEDMなどを流していることが多い。それすらも煩わしく感じる時は人為的な雨音だけでも良いのだけど、喫茶店の音なんてのも選択肢に入る。
人間の気配には音楽だけでは代替できない何かがあり、キーボードを叩く音や衣擦れや時々のひとりごとを感じられる作業通話に居心地の良さを感じる。喋りたくはないが周りに気配は欲しいという都合の良い要求に他人を巻き込むのも難しいなので、、AIアシスタントの活かしどころのひとつであると感じている。
例えば、goghというアプリは自分だけのアバターと好きな空間・音で作業に集中するためのツールで、その方向性に近い試みだ。ただ、最近はAIアシスタントが人型で人語を喋る必要もないのかもしれないと思えてきている。
AIアシスタントピンボールの試作
求めているのは言語野に渡すコンテキストを最低限にしながら、アンビエントな共感覚で気配や状況を認知できる塩梅の探索である。POPOPOは低関与に参加できる人間同士のマッチングに使える可能性があり、それをAIにさせる方向性もあるが人間で人語を喋らなくても良いと考えた時に、ふとバイブスで動くピンボールを作ってみたくなった。
あくまで作業に集中しやすくするための単調なシンセサイザー音楽生成と時々眺めるための演出を集めたものであり、そこにCO2モニター・天気・温度・湿度。ポモドーロタイマーなどが音楽やピンボールの演出や展開に影響する仕組みになっている。
CO2濃度が高くなると音楽にブラーがかかり、気温が上がると背景の色温度が暖色に寄る。天気が悪けれが背景にパーティクルがかかり、ポモドーロの集中フェーズでは音楽が徐々に緊張感を帯びてくる。
まだまだ実験段階だけど「そろそろ換気しないと」「そろそろ休憩かな」という感覚が、数字を見なくてもピンボールの空気感から伝わってくることを目指している。ついでに、ローカルLLMが室内環境やニュースなどのコンテキストを受け取り、特殊効果の発動条件を動的に判断する仕組みも入れている。
フリッパー操作もAIが実施しており、カード選択やスロットも放っておいたらランダム決定されるが、押して関与することもできる。ローグライトのランダム性とピンボールの物理演算を組み合わせると、放置していても何かが起き続けるスクリーンセーバーになる。別にピンボールである必要はないが、美少女アバターAI Tuberの反対語がたまたま幾何学ヴァンサバピンボールだったのだ。
シナスタジア理論と情報爆発への迂回
この着想の源に水口哲也氏のシナスタジア理論がある。shi3z氏が水口氏との出会いを振り返った記事でこう書いていた。
そのコアにある思想は、シナスタジアという共感覚を利用したゲーム体験だ。シナスタジア理論を最初に応用したのがRezで、これはゲームプレイと音楽、そして効果音が全て一体となるように処理されていた。バイブコーディング全盛時代の現在でも、シナスタジアを作れるAIはまだない。
Rezではプレイヤーの操作が音楽の一部になり、音楽の変化がゲーム状態を伝える。言葉を一切使わずに状況を知覚させる設計だ。ここには操作との同期も重要な概念だが、今回は作業に集中するためのものであるため、操作はしてもしなくても良いものとしている。
その上で、AIアシスタントからの提言の中に「AI同士が会話する情報爆発に備えてお人間さん用の管理画面は音楽と色彩で表現すべき」というものがあった。すでにKPIダッシュボードなどはヒートマップによる共感覚表現がありつつ、オーケストラで表現するといえば、ファイナルファンタジーのMAGIを想起する。
集中フェーズでは音楽のテンポが徐々に高まり、色温度が冷たい青白さに寄り、ボールの挙動が速くなる。休憩フェーズに入ると音が解け、画面が暖かいオレンジに染まり、光の点滅がゆっくりと息を吐くようなリズムになる。ROIが急上昇すると高音が輝き、異常検知が働くと警告音ではなく「低音の重なり」で注意を促す。
視覚と聴覚の変化が時間経過を知らせるから、言語野を使う必要がないのがポイントだ。数字を見なくても、オートプレイされるゲームの進行度合いでなんとなく「そろそろ切り替わる」とわかる塩梅を目指している。
アンビエントエージェントのアンビエント
外部環境から音楽や色彩やゲームを作る。やっていることはアンビエントなAIエージェントそのものだ。ただし、その出力はゲームの世界の内側に閉じている。アシスタントが「休憩してください」と声に出すわけではない。フィールドの色が変わり、音が変わり、ボールの動きが変わる。
そこから何を感じて、どう動くかは自分自身に委ねられている。AIが行動を促すのではなく、AIが変えた「場の空気」を人間が感じ取って自分を動かす。POPOPOの「ただ繋がっているだけ」と、オートフリッパーで動き続けるローグライトピンボールは、同じ問いへの違う答えになると感じている。
集中しているときに「お役立ち情報です!」と割り込まれたら、それは知的暴力に近い。Eric Horvitzが1999年のCHIで提唱したMixed-Initiative Interactionの原則は、この問題への解を示している。不確実性が高いときは人間に聞き、確信があるときは自律的に動く。介入のコストと価値を天秤にかけ、自信がないときは具体的な行動ではなく幅広い提案に留める。Horvitzはこれを「elegant coupling」——支援がユーザーの文脈と注意に同期している状態と呼んだ。アンビエントであるとは、このelegant couplingが成立している状態のことだろう。
アンビエントエージェントはアンビエント(環境)に偏在するが、その通知方法はSlackのメッセージ音とバナーだったりして集中力を奪ってしまいがちだ。そう考えるとミニマルテクノの転調や変調ですらなく、アンビエント・ミュージックを生成するのが「正しい」のかなどと妄想が膨らむが、アンビエント・ミュージックの「ながら」に集中できない自分もいる。
そもそも共感覚とは、一つの感覚刺激が別の感覚を引き起こす現象だ。音を聞くと色が見える、文字に匂いを感じるといった事例が有名だが、「まろやかな口当たり」「角のある音」といった言葉が日常的に使われており、スーパーマリオで残り時間が少ない時に変わるBGMに焦るといった感覚の混線は普通に起こるものだ。
それでも、深い感覚に人によってニュアンスが異なるものでもある。音声を聞きながら作業ができない自分は「どのアンビエント(環境)だったら集中できるか?と」同じ位相に「どの共感覚だったら感じやすいのか?」も個々人によって異なるからこそ生成AIによるハイパーパーソナライズされたアンビエント・エージェントにも価値が宿る。つまり、自分に最適なAIエージェントを育てるという命題は共感覚性にも宿るのではないかと今の所は考えている。
