実在する会社のデジタルツインから訓練するニーズ
かつての米国には潰れかけた通販会社やスタートアップから顧客名簿を買いとるビジネスがあったという。事業者から見れば顧客リストは負債整理の過程でまとめて換金できる最後の資産であり、買い手からすれば検証済みの実在顧客データを割安に調達できるチャンスだった。このような名簿屋ビジネスが、いまは実在するSlackやJIRAのデータになってきているらしい。
AI labs are paying hundreds of thousands of dollars to buy email, Slack and Jira threads from dead startups as feedstock for ‘reinforcement learning gyms,’ which specialize in using defunct company data to build simulated work environments https://t.co/QuCk36wAPY
— Iain Martin (@_IainMartin) 2026年4月16日
具体的にはスタートアップの清算を専門とするSimpleClosureが「Asset Hub」というプラットフォームを立ち上げ、ソースコード・ドキュメント・Slackメッセージ・メールのライセンス販売を仲介している。過去1年で100件近くの取引を処理し、1社あたりの支払いは1万〜10万ドルにのぼる。
例えば、AIエージェントに「経費精算の申請」「スプレッドシートのピボット作成」「CRMでの顧客情報更新」といった実務タスクを訓練するために、Anthropicは強化学習インフラに最大10億ドルを投じる方針とも伝えられている。
名簿が「顧客の実在」を保証するデータだったとすれば、Slack・Jira・メールなどのログは「仕事の実在」を保証するデータだ。本物の人間が本物の締め切りと本物のプレッシャーのもとで仕事をした記録であり、フェーズ感や組織の温度まで含んだ文脈付きのデータになっている。合成データではなかなか再現できない「仕事の複雑さ」がそこに記録されている。


