太陽がまぶしかったから

C'etait a cause du soleil.

スタートアップのコミュニケーションログからSKillを蒸留できる時代におけるデータセットバイアウトというイグジット

ベンチャーわれ倒産す: 昔、大臣賞今、自己破産 (小学館文庫 R い- 13-1)

実在する会社のデジタルツインから訓練するニーズ

かつての米国には潰れかけた通販会社やスタートアップから顧客名簿を買いとるビジネスがあったという。事業者から見れば顧客リストは負債整理の過程でまとめて換金できる最後の資産であり、買い手からすれば検証済みの実在顧客データを割安に調達できるチャンスだった。このような名簿屋ビジネスが、いまは実在するSlackやJIRAのデータになってきているらしい。

具体的にはスタートアップの清算を専門とするSimpleClosureが「Asset Hub」というプラットフォームを立ち上げ、ソースコード・ドキュメント・Slackメッセージ・メールのライセンス販売を仲介している。過去1年で100件近くの取引を処理し、1社あたりの支払いは1万〜10万ドルにのぼる。

例えば、AIエージェントに「経費精算の申請」「スプレッドシートのピボット作成」「CRMでの顧客情報更新」といった実務タスクを訓練するために、Anthropicは強化学習インフラに最大10億ドルを投じる方針とも伝えられている。

名簿が「顧客の実在」を保証するデータだったとすれば、Slack・Jira・メールなどのログは「仕事の実在」を保証するデータだ。本物の人間が本物の締め切りと本物のプレッシャーのもとで仕事をした記録であり、フェーズ感や組織の温度まで含んだ文脈付きのデータになっている。合成データではなかなか再現できない「仕事の複雑さ」がそこに記録されている。

実際の仕事環境をそのものをシミュレーターとしたい

続きを読む

『プロジェクト・ヘイル・メアリー』公式が勧める3Dプリンターとオンデマンド製造時代のファングッズ在庫のリスクテイキング

プロジェクト・ヘイル・メアリー 上 (ハヤカワ文庫SF)

公式が「3Dプリンター」と検索させた日

3月から全世界で公開中のSF映画『プロジェクト・ヘイル・メアリー』が大ヒットしており、日本でもSFマニアを中心に人気だ。僕もIMAXで観て、劇場のグッズ売り場を探したのだけど、日本で買えた公式グッズはパンフレットだけだった。日本では権利の問題で、日本ではそれ以上のグッズを展開できないとのこと。

そして4月6日、その日本の公式アカウントがAmazonで「3Dプリンター」と検索した結果のリンクを無言で投稿していることに面白さを感じた。グッズを売る権利がないから、代わりに3Dプリンタを使えと言っている。そもそも映画小道具自体が3Dプリンタで作られたことからデータはあったのだろうし、映画の主題との相性も良い。

ネットプリントではプリクラのようにシール印刷ができる機種が出てきているし、時間と共に高機能化していくであろうことを想像するとコンビニの複合機に3Dプリンタ機能がつく日も、そう遠くないのかもしれない。フィジカルAI元年と呼ばれる2026年、僕たちはすでに日常の中で「転送」を体験し始めている。そうなったとき、Amazonはコンビニ3Dプリンタがない時代の「ゆっくり配送方式」になっていくのかもしれない。

以前から、3DプリンターはIPグッズと相性が良いと思っていたが、地域権利の迂回にまで使える可能性についてはあまり考えてこなかった。

地域制限という物理的なDRM

続きを読む

Gemma 4のVision機能でPDFを画像のまま読み解くローカルPDFチャットツールを作ってAPI課金恐怖症から解放される

ローカルLLM実践入門

Gemma 4 でローカル Vision LLM の実用化

Google が Gemini 3 の研究をベースにした Gemma 4 をリリースした。ライセンスが Apache 2.0 に変わり、何より大きいのが Vision 対応だ。26B-A4B は MoE アーキテクチャで実質 4B 程度のアクティブパラメータしか使わないのに、テキストだけでなく画像の理解能力が実用レベルに達しているとのこと。

画像処理などはバッチ処理で大量に行う必要が出てくることもあり、その場合にAPIをガンガン叩く作りは課金額やレートリミットやポリシー違反等によるBANリスクなど怖くなってしまうポイントが多いので、ローカルで完結できると安心感がある。Claude Codeの定額内でやれないこともないが、大量処理をしようとすると嫌がって途中打ち切りや今日はやめますか?となるシステムプロンプトが組まれていると思われる挙動をされがちだったりもする。

そんなわけで、PDFファイルを画像ファイルとして切り出して、それをRAGして会話したり、文字起こしできたりするツールを作ってみた。

PDF をテキスト化せずに画像のまま Vision LLM に読ませる

続きを読む