太陽がまぶしかったから

C'etait a cause du soleil.

阿部由延『AITuberを作ってみたら生成AIプログラミングがよくわかった件』感想〜楽しい趣味としてのプログラミングとクリエイティビティの総合格闘技

AITuberを作ってみたら生成AIプログラミングがよくわかった件

AITuberを作りながら生成AIプログラミングを学ぶ

プログラミングを学んでいる人なら、誰もが気になる生成AI。どのように生成AIを利用して、生成したデータをどのように生かすのか。どのようにアプリケーションに組み込むのか。実例が知りたいですよね。

そこで、AITuberを作ってみるのはいかがでしょう。AITuberは、YouTube配信を行うAIです。その根幹となるのが生成AI。YouTubeの配信に書き込まれたコメントを取得して、それに合う返答を生成する。ここで生成AIを使います。どのようにプログラムから返答を生成するのか、その実例が本書でわかります。AITuberのキャラクターにふさわしい返答を生成するには、どのようにプロンプトを作っていくのか、そのコードの原則がマスターできます。

本書は、生成AIを活用し、実際に動く配信システムを構築するための実践的ガイドブックである。Pythonの基本的な知識を持ちながらも、「具体的にどのようにアプリケーションへ組み込むか」に悩む初学者に対し、Open AI APIの使い方だけでなく、音声合成(VOICEVOX)、配信基盤(OBS)、YouTube APIとの統合方法を具体的に示しながらエンタメとしてのAI活用の方法を示している。

2023年11月に出版された書籍であることあって、今となっては古いと感じる部分があったりもするが、逆に言えばこの頃から生成AIを活用したエンタメへの試行錯誤がされており、一種のオーパーツのような輝きもある。

最近になって、当時の空気感を振り返った動画が配信されており、僕としても改めて本書を読んでみようと思ったのだ。深夜帯とはいえ地上波で放映されるような状況になっている状況になっていることにも脅かされた。

楽しい趣味としてのプログラミング総合格闘技

 しかし、生成AIを使ったプログラミングを、最初に業務の効率化を目的としたアプリケーション開発から学ぼうとした場合、実務における実用性やセキュリティレベルの確保、あるいは自分が楽しんで開発できるかといった懸念から消極的になってしまう人も多いと思います。
 その点でAITuberは「趣味のプログラミング」として最適です。実務ではないので実際に役立つかを追い求める必要はなく、業務上の機密情報に神経を使うこともありません。YouTubeに公開することで、学んだことを形にすることができます。

この指摘はまさにその通りで、当時において業務システムへの生成AI組込みを考えると機密情報の認証認可問題や、安定しない出力結果などのつらみが楽しさに優っていたが、AITuberは業務用の秘密情報を扱う必要がなく、配信システムの構築という具体的なアウトプットがあるため、プログラミング初心者にも達成感を与える仕組みとなっている。

それでいて、AITuberとしてやれることは幅広く、キャラクターデザインや性格設定はもとより、他者とのリアルタイムな会話リアクションや音声合成、動画配信基盤、ニュースやSNSトレンドなどの話題生成やリスナーの記憶管理といったプログラミングとクリエイティビティの総合格闘技の様相を帯びてくる。

ここに来て、ゲームチェンジャーとなり得る動画生成AIや音楽生成、検索機能を持ったエージェントなどのリリースが相次いでいるが、業務として試すのにはハードルがあるが、AITuberとしてのオープニングムービーを作ったり、雑談配信を作るために組み込んだりすることはできる。最悪失敗してもそれ自体がライブ感のあるエンターティメントになるからこそ、先進的なオープンソースAPIの取り組みが行われやすい状態にあり、そこで場数を踏めるサンドボックスであり、前哨基地のような役割を担うこともある。

キャラクターを現実界に召喚する儀式

AITuberの真価は、ユーザーが自由にキャラクターや能力を自由にカスタマイズできる点にある。かつて流行したデスクトップゴースト「伺か」と同様、自分の好みに合わせてキャラクターの感情や服装を自在に変更したり、新しいことをできるようにスクリプトを組みつつも、その変化を視聴者に「お披露目」できる楽しさも持つ。

VTuberは結局のところで演者の人間性が価値を生み出しているが、AITuberではAI自身の設定や人格の一貫性こそが求められる。人間の不完全さや偶然性で人気を得るVTuberと異なり、AIモデル自体にはキャラクタナイズされた個性がないため、メソッド演技的な設定の深掘りが求められる。これは面倒なことである一方で「設定厨」にとっては深掘り可能な楽しみとなる。

キャラクター設定の掘り下げについては次回作の『AITuberを作ってみたらプロンプトエンジニアリングがよくわかった件』が詳しい。2025年5月25日時点でポイント半額還元セールであるためセットで読むと良いだろう。

僕自身としては今更ながらに、ローカルにたてたVOICEVOXサーバーとローカルLLMでずんだもんの声をリアルタイムに制御できる楽しさに気づいたりもした。AITuber としての配信をするかまでは微妙だけれども、オリキャラのChatBotまでは作っているので時間の問題かもしれない。

現代のAI技術は「最適化」に進みやすくあり、それだけでは魅力的では側面もある。むしろAITuberと戯れて楽しいのはハルシネーション(幻覚)による飛躍であったり、ある種の不完全さを伴うチャーム(愛嬌)にあったりもするだろう。楽しい趣味としてのプログラミングとクリエイティビティの総合格闘技でありながらも、最新技術のサンドボックスとしてAITuberは面白い分野になっていくのではないかと感じている。