Applaud：生成AI HRアシスタントの本番導入から学んだ5つの教訓

Before

多くの企業がChatGPTの可能性に注目し、HRサービスデリバリーへの生成AI導入を検討している。しかし、制御されたセールスデモと実際の本番環境には大きな隔たりがある。Applaudは、大企業向けに生成AI HRアシスタントを本番展開する過程で、事前に予想もしなかった多くの課題に直面した。

第一の課題はコンテンツの品質であった。社内のイントラネットには時代遅れの文書や重複したポリシーが溢れており、この「ゴミ」をAIに学習させれば、当然質の低い回答が返ってくる。第二に、グローバル企業では英国の従業員に米国の医療保険情報が提示されるといった、パーソナライズ不足による誤回答が頻発するリスクがあった。第三に、従業員が思いつくあらゆる質問に対応するAIのテスト方法が未確立であった。第四に、100%正答率を求める過剰な期待が現実との乖離を生んでいた。第五に、ゴライブが終わりではなく、改善の始まりであることを組織が理解していなかった。これらの課題を乗り越えるために、Applaudは現場から得た知見を体系化していった。

AI導入内容

ApplaudはHR領域に特化した生成AIアシスタントを開発・展開し、従業員からの福利厚生、給与、休暇などに関する問い合わせに対話的に回答する仕組みを構築した。同社が本番導入から学んだ5つの核心的教訓は以下の通りである。

1. コンテンツ品質の徹底管理（Garbage in, garbage out）

社内AIアシスタントは、インターネットの公開データではなく、企業内部の知識コンテンツに依存する。ApplaudはSharePointやServiceNowなどの既存システムと連携し、指定された場所の文書のみを自動的にインデックス化するアプローチを採用。これにより、レガシーな不要文書を除外しつつ、マスタードキュメントの管理場所を変更することなく知識を統合した。

注意点として、画像や動画、PowerPoint、長大なテーブルに埋め込まれたポリシーなど、AIが読み取り困難なコンテンツが存在することも判明した。現時点ではWord文書やPDF、適切にラベリングされたExcelシートにコンテンツを整理することが精度向上の近道となった。

2. 「HR Aware」によるパーソナライズ対応

「私にはどんな福利厚生があるのか」という質問に対し、従業員の所属国や職種、管理職かどうかといったコンテキストなしに適切な回答は不可能である。Applaudは従業員関連情報をボットに入力し、質問者の属性に基づいて回答をパーソナライズする「HR Aware」エンジンを構築した。

例えば、「ベルギーの店舗マネージャーであるJean-Pierre」が育児休暇について質問した場合、AIはベルギーの小売業向け休暇ポリシーに基づいた回答を生成する。導入初期は個人情報への懸念から国や職種、部署などの基本情報のみを入力する企業が多いが、それだけで回答の精度は飛躍的に向上する。

3. 無限の可能性に対するテスト方法論

従業員が思いつくあらゆる質問に対応するAIのテストは、従来のHRシステム導入時のテスト計画ではカバーしきれない。Applaudはテストを「面接」に例える方法論を独自に開発した。サービスデスクで最も頻度の高いトピックトップ10（給与、福利厚生、休暇など）を特定し、各トピックで実際に寄せられる質問トップ10〜30を洗い出す。このアプローチにより、実際の業務で発生する質問に即したテスト計画を構築できる。

評価には正解/不正解の二値判定ではなく、Red/Amber/Greenのステータスや10段階評価を採用。数学の問題とは異なり、回答の品質は質的に判断する必要がある。さらに、悪意のある質問への対応やjailbreak試行、トーン・オブ・ボイスの統一など、セーフティに関するテスト項目も含めている。

4. 100%完璧を目指さない現実的アプローチ

AIは間違った回答を出すことがあり、それを受け入れる必要がある。知識コンテンツが100%完全・正確・最新であることは現実的ではなく、コンテンツに答えがない場合、生成AIは隙間を埋めるために「幻覚」を生じやすい。Applaudは温度パラメータの調整（0〜10）とプロンプトエンジニアリングを両方で精度と対話性のバランスを制御しつつ、「これはAIアシスタントであり、誤った回答をすることがあります」という免責表示と組織的変更管理を徹底している。

5. ゴライブはレースのスタート地点

AIアシスタントのゴライブはゴールではなく始まりに過ぎない。従業員は予想もしなかった質問をし、コンテンツには気づかない穴が多数存在する。Applaudはユーザーのフィードバック収集と分析ダッシュボードを構築し、回答ごとのサムズアップ/サムズダウン、低評価の理由分類（「役に立たない」「間違っている」「有害」）を可能にした。HR担当者はトレンドを監視し、コンテンツの更新や新ポリシーの追加、AIプラットフォーム設定の調整を通じて継続的に精度を高めていく。

After

Applaudの生成AI HRアシスタントの本番導入は、理想と現実のギャップを埋める貴重な知見を生み出した。

5つの本番導入ノウハウの体系化

コンテンツ品質管理、パーソナライズ対応、テスト方法論、現実的な精度目標設定、継続的改善プロセスの5つの領域において、実践的なフレームワークを確立した。これらは単なる教訓ではなく、今後の導入企業に対して再現性のある導入ロードマップを提供する資産となっている。

パーソナライズされた従業員体験の実現

「HR Aware」エンジンにより、従業員一人ひとりの属性に応じたコンテキスト依存の回答が可能になった。グローバル企業における地域間の情報混在や、職種・管理職区分に応じたポリシー適用の精度が向上し、従業員の自己サービス利用率の向上に寄与している。

継続的改善サイクルの確立

ゴライブ後の週次モニタリングから、定期的なビジネス-as-usual体制への移行まで、フィードバックに基づく精度向上のサイクルを確立した。ダッシュボードによる可視化により、HRリーダーが自らAIの精度を管理できるようになり、ベンダー依存からの脱却を進めている。

Applaudの取り組みは、デモの感動から本番の現実へ、そして継続的な価値創出へとつなげるための、HR領域における生成AI導入の現実的ロードマップを示している。