Before
WEBTOON Entertainmentは、世界最大級の縦スクロール型ウェブコミックプラットフォームを運営するグローバルデジタルエンターテインメント企業である。WEBTOONとWattpadの2つのプラットフォームを通じて、世界中の数百万ユーザーにロマンス、ファンタジー、アクション、スリラーなど多様なジャンルのクリエイタードリブンコンテンツを提供している。
同社のビジネスモデルの根幹には、膨大な作品カタログから適切なコンテンツを発見し、適切なユーザーに届ける「コンテンツ理解」というプロセスがある。しかし、従来このプロセスはほぼ手作業に依存していた。コンテンツチームは新規タイトルが公開されるたびに、全作品を人力で読み込み、ジャンル分け、キーワード抽出、マーケティングポイントの特定を行わなければならなかった。
作品数が数万タイトル規模に達すると、このアプローチは明らかに限界を迎えた。マーケティングチームはトレンドのアーク(物語の展開ポイント)からキャンペーンアイデアを生み出すために大量の作品を読む必要があり、翻訳チームは原作のトーンやニュアンスを正確に把握するために時間を要し、レコメンドチームはメタデータを抽出してターゲットセグメントを特定する必要があった。これらの業務が手作業であるがゆえに、クリエイターを支援し権利を保護する本質的な活動へのリソース配分が妨げられていた。
AI導入内容
この課題に対し、WEBTOONは WEBTOON Comprehension AI(WCAI) を構築した。LangGraphを活用したエージェントワークフローにより、物語の深い理解を自動化するシステムである。
技術アーキテクチャ
WCAIはVision-Language Models(VLMs:GPT-4o等)とLangGraphによるマルチエージェント・オーケストレーションを組み合わせたハイブリッドアーキテクチャを採用している。
LangGraphの採用理由は、以下の厳格な要件を満たすためである:
- ステートフルなマルチエージェント制御: 複数の専門エージェント間で作品の文脈(コンテキスト)を維持しながら、循環的な推論プロセスを実行
- 動的ルーティング: 作品のジャンルや形式(縦スクロールの密度等)に応じて、最適なVLMモデルや処理ノードを動的に選択
- ドメインエキスパートの知識注入: 編集者やマーケターの「物語の捉え方」をグラフのノードロジックとしてコード化
LangGraphのノードベースアーキテクチャは、ビジュアル特徴抽出・キャラクター相関図構築・物語のターニングポイント検出など、個別のワークフローステージに特化したLLMプロンプトと制御ロジックをモジュール化することを可能にした。また、LangSmithとの統合により、エージェントの推論パスを可視化し、精度向上に向けたデバッグサイクルを高速化している。
コアエージェントワークフロー
WCAIは、物語理解の特定側面を担当する以下の専門エージェント群で構成される。
ビジュアル・キャラクター識別エージェント
VLMを用いたゼロショット物体検出と顔認識・クラスタリングにより、各作品に登場するキャラクターのビジュアルプロファイルを構築する。単なる画像認識にとどまらず、服装や外見の変化を超えて同一人物を識別し、物語内での役割(主役、脇役、悪役)を推定する。
話者・コンテキスト解析エージェント
ウェブコミック特有の「吹き出し」とキャラクターの配置関係を分析する。セグメンテーション技術を用いて吹き出しを分離し、VLMが文脈から「誰が誰に対して発言しているか」を同定。これにより、テキスト情報だけでは不可能な深い対話理解を実現する。
シーン・物語構造解析エージェント
作品を 「シーン」単位で自動分割(セグメンテーション) し、各シーンの感情的なトーンや重要イベントを抽出する。LangGraphのループ機能を利用し、前後のシーンの関連性を考慮しながら、物語のアーク(起承転結)を構造化されたメタデータとして出力する。
ビジネスインサイト生成(SME)レイヤー
抽出された構造化データを基に、ユーザーの意図(マーケティング、レコメンド、翻訳支援)に応じた最終出力を生成する。例えば、 「読者が最も感情的に揺さぶられるシーン(クリフハンガー)」 を特定し、SNS広告用のキャッチコピーやクリエイティブの素材を自動提案する。このレイヤーの出力は、CTR(クリック率)の向上や離脱率の低減に直接寄与する。
WCAIは大量のWEBTOONタイトルを分析し、ジャンル、物語スタイル、 cliffhangerなどの高品質キーワードを各作品に生成。これらはユーザーが好みに合ったタイトルを発見するのに役立つ。
実装上の工夫
WEBTOONのAIチームは、研究環境でのマルチエージェントフレームワークと異なり、生産環境では制御可能性・解釈可能性・信頼性を重視した。LangGraphのアーキテクチャは、このニーズに完璧に適合した。内部ユーザーは透明性と結果を操縦する能力を求めており、ノードベースの設計はその要望に応える。
また、LangSmithのトレース機能により、視覚トークンの非効率な処理に起因する過剰なトークン使用量などの問題を特定し、効率的で信頼性の高いデータ生成を実現している。
After
WCAIの導入により、WEBTOON Entertainmentは以下の定量的・定性的成果を達成した。
コンテンツチームの業務負荷:70%以上削減
従来、コンテンツチームが新規タイトルからユーザー向けキーワードを抽出するために全作品を人力で読んでいたプロセスが自動化された。WCAIの活用により、この作業負荷が70%以上削減され、チームはより戦略的でクリエイティブなコンテンツプロモーション活動に集中できるようになった。
この成果は単なる業務効率化にとどまらず、組織全体に波及効果をもたらした。
- マーケティングチームの生産性向上: トレンドアークからキャンペーンアイデアを生成する際の調査時間が大幅に短縮
- 翻訳チームの品質向上: 原作のトーンやニュアンスを事前に把握でき、ローカライゼーションの精度が向上
- レコメンド精度の向上: 構造化されたメタデータにより、ユーザーセグメントターゲティングが高度化
- クリエイター支援へのリソース集中: 物語理解の手作業から解放され、クリエイターの権利保護と創作支援に注力可能に
重要な点として、WCAIはクリエイターの作品をモデルトレーニングに使用していない。コンテンツを分析して情報を解釈・構造化するのみで、創作コンテンツの保護を徹底している。
現在もWCAIは進化を続けており、様々なビジネスシナリオでのワークフロー評価、人間とエージェントの相互作用の細粒度制御、外部データソースの統合などの改善が進行中である。LangChainのMCPアダプターなどの新機能も検証され、より広範な外部知識をWEBTOONシリーズ分析に組み込むことが可能になる見込みだ。
公開日: 2025年5月19日
事例一覧に戻る