Before
Rexeraは、年間500億ドル規模の不動産取引業界において、AIを活用して手作業のワークフローを自動化するスタートアップである。支払い状況確認書の発注、書類からの重要データ抽出、品質管理チェックなど、不動産取引に伴う複雑な認知タスクをAIエージェントが担うことで、取引の迅速化とコスト・エラーの削減を目指している。
不動産取引において品質管理(QC)は不可欠だ。Rexeraは1日に数千件のワークフローをレビューする専用QCアプリケーションを開発しており、データ処理、顧客コミュニケーション、HOA(ホームオーナーズ協会)や郡役場、公益事業会社などの取引先とのやり取りを含む、取引のあらゆる段階でエラーをチェックしていた。
当初、Rexeraは単一プロンプトのLLMチェックを複数実装していた。書類の正確性、顧客期待の充足、ワークフローのタイムリー性(SLA遵守)、コスト管理などを検証する設計だった。しかし、このアプローチには根本的な限界があった。単一プロンプトのLLMは、不動産ワークフローの複雑性を十分に把握できず、限られたコンテキストでは多次元的なシナリオを適切にナビゲートできなかった。
Rexeraは数千件のワークフロー実行を通じて、LLMチェックの有効性を3つの主要指標で評価していた。
- 正確性(Accuracy):問題特定の正確さスコア
- 効率性(Efficiency):1件あたりの実行速度
- コスト効率(Cost-effectiveness):関連するLLMコスト
このアプローチは潜在的な問題をフラグ付けし、手動レビューの必要性を減らすことでQCを効率化した。しかし、複雑な不動産ワークフローに対処するには、より高度なソリューションが必要だと判断された。
AI導入内容
CrewAIによるマルチエージェントアプローチ
単一プロンプトLLMの限界を認識し、RexeraはCrewAIを用いたマルチエージェントアプローチを試行した。各AIエージェントが取引プロセスの異なる部分を担当する設計である。例えば、「シニアコンテンツ品質チェックアナリスト」という役割を持つエージェントに、「クライアントが依頼したHOA書類がすべて発注されているか確認し、対応するETAとコスト情報がクライアントに送信されているか検証する」というタスクを割り当てる。
このアプローチにより、単一プロンプトLLMと比較して改善が見られた。
- 偽陽性(問題ではないものを誤ってフラグ付け):35% → 8%
- 偽陰性(実際の問題を見逃す):10% → 5%
しかし、CrewAIのアプローチにも課題が残った。AIエージェントは能力はあったものの、GPSが長いルートを選んでしまうように、意思決定で誤った経路を取ることがあった。この精密な制御の欠如は、複雑なシナリオでエージェントが軌道を外れ、偽陽性や偽陰性を生む原因となっていた。
LangGraphへの移行:精度と制御の実現
CrewAIの限界を克服するため、RexeraはLangGraphへ移行した。LangChainチームが開発したLangGraphは、制御可能なエージェントフレームワークであり、特に複雑なケースでメリットを発揮する。人間介入(human-in-the-loop)ワークフロー、状態管理などの統合も可能になった。
LangGraphを用いて、RexeraはQCアプリケーションにツリー状の構造を作成した。この構造では、サイクルと分岐が可能であり、緊急注文(rush order)などの一般的な複雑性に応じて異なるパスをナビゲートできる。
アプリケーションが緊急注文を識別すると、「緊急注文」ブランチへ誘導される。標準的な注文の場合は、通常の処理チェックに焦点を当てた別のブランチを辿る。このツリー状の構造により、決定的な意思決定が導入され、エージェントが誤った経路へ進むランダム性が削減された。
LangGraphへの移行により、CrewAIからさらに改善が実現した。
- 偽陽性:8% → 2%
- 偽陰性:5% → 2%
同じ緊急注文シナリオを比較すると、以下のような差異が確認できる。
単一プロンプトLLMの出力:「クライアントの緊急要請をコミュニケーションで明示的に承認していない」→ 偽陽性(実際には承認・実行済みだったが、LLMが複雑な多段階インタラクションを認識できなかった)
CrewAIの出力:「クライアントが緊急注文を要請し、チームが承認・実行した」→ 部分的に正確(緊急注文の実行結果は正しかったが、システム内の注文タイプの記録不一致を見逃した)
LangGraphの出力:「注文詳細に『Rush Order: False』と記載されているが、クライアントが緊急注文を要請し、チームが承認・実行している」→ 完全に正確(緊急注文の承認と実行を確認し、注文タイプの記録不一致も特定した)
After
LangGraphのサイクルと分岐機能を活用することで、Rexeraはよりインテリジェントで適応性の高いQCアプリケーションを構築した。各シナリオに対して適切なチェックを実行するAIエージェントを確実に制御できるようになり、不動産取引の効率性と正確性が向上した。
誤検出率の劇的な削減
偽陽性は35%から2%へ、偽陰性は10%から2%へと削減された。これは、AIエージェントが不動産取引の複雑なワークフローを正確に理解し、適切な判断を下せるようになったことを示している。
業務効率の向上
手動でレビューしていたQCプロセスの大部分が自動化され、人間のオペレーターと同等の精度で問題を事前に特定できるようになった。取引遅延の防止に直結する品質管理の強化は、顧客満足度の向上にも貢献している。
スケーラビリティの確保
LangGraphによる決定的なワークフロー設計により、Rexeraは1日数千件のワークフローを安定的に処理できる体制を確立した。取引の複雑性が増しても、カスタム設計された決定パスに従って正確なQCチェックを継続できる。
Rexeraの取り組みは、不動産という規制が厳しく複雑な業界において、AIエージェントの「制御可能性」が本番運用の成否を分ける重要な要素であることを示している。LangGraphによる構造化された意思決定フレームワークは、他の業界における複雑なワークフロー自動化にも応用可能なモデルとなっている。
公開日: 2024年10月9日
事例一覧に戻る