Addverb:98言語対応の音声AGV制御システムで倉庫業務を効率化

AddverbがLlama 3とChatGPTのハイブリッドLLMでAGV音声制御システムを構築。98言語対応で倉庫業務を効率化し、熟練エンジニア不足を補う。

+98 ヶ国語対応
数値の信頼性
公式出典あり
音声AI RAG

この事例のポイント

導入効果
+98ヶ国語対応
導入分野
物流

Before

Addverbは2016年に設立されたグローバルロボティクス企業で、倉庫や工場向けの自動化ソリューションを提供している。同社のクライアントにはCoca-Cola、Amazon、DHLなど350社以上の大手企業が名を連ね、世界中の物流現場で同社のAGV(無人搬送車)が稼働している。

AGVフリートが拡大するにつれて、メンテナンスの需要は増大し、一方で訓練されたメンテナンスエンジニアの不足は深刻化していた。多くのAGVの問題は、適切な方法で機器と通信できれば未訓練の倉庫作業員でも解決可能なものだったが、言語の壁が大きな障害となっていた。グローバルな倉庫運営では作業員が数十の異なる言語を話しており、統一的なインターフェースを提供することが困難だった。

従来のAGVメンテナンスでは、専用のターミナルや固定された言語での操作が必要で、現場の作業員が即座に対応できる環境ではなかった。AGVが停止した際のダウンタイムは物流全体の効率を低下させ、顧客の満足度にも直結する重大な課題となっていた。

AI導入内容

Addverbは、倉庫作業員が母国語でAGVと対話できるAI駆動型音声制御アシスタントを開発した。システムは音声をテキストに変換し、自然言語命令をAGVの制御指令に翻訳する多段階パイプラインで構成される。

ハイブリッドLLMアーキテクチャ

Addverbのソリューションは、要件に応じて2つの異なる大規模言語モデルを使い分けるハイブリッド構成を採用した。

Llama 3(エッジ推論用):オープンソースかつ無料で利用可能なLlama 3をエッジサーバーに展開し、オンプレミスでの推論を実現。常時のクラウド接続を必要とせず、ルーティンな問い合わせに対するコスト効率の高い処理を可能にした。AddverbはLlama 3を「エッジサーバーに展開するには十分コスト効率が高い」と評価している。

OpenAI ChatGPT(クラウド高性能用):「性能が必要な場合」に使用される商用クラウドベースのLLM。AGVへの指令生成時間(トークン生成時間)を短縮するために利用され、より複雑な問い合わせや高速レスポンスが求められる場面で機能する。

このデュアルLLMアプローチは、コスト、レイテンシ、性能のバランスを取る実用的なアーキテクチャパターンとして設計された。

エッジコンピューティング基盤

計算基盤として、AI・機械学習ワークロード向けに設計されたSupermicro IoT SuperServer SYS-111E-FWTRを採用。4th Generation Intel Xeon Scalable Processorsを搭載し、最大32コア(64スレッド)、最大2TBのDDR5 RAM、1GbEおよび10GbEネットワークポートを備えている。3つのPCIe 5.0拡張スロットにはIntel Data Center GPU Flex SeriesなどのGPUを搭載可能で、追加のAI推論処理能力を確保している。

エッジコンピューティングを選択した背景には、倉庫運営におけるクイックレスポンスの必要性、インターネット接続への依存低減、工業環境におけるデータセキュリティとプライバシーの懸念、そしてLlama 3のローカル実行によるトークン単位のAPIコスト回避がある。

98言語対応の音声認識と命令変換

システムは音声認識技術を最初の処理段階として使用し、現代の倉庫における多様な人材に対応するため98言語をサポート。この多言語対応機能は、さまざまな言語背景を持つ作業員が自動化システムと対話する必要があるグローバル物流運営において特に重要である。

自然言語からAGV固有の制御命令への変換には、慎重なプロンプトエンジニアリングと必要に応じたファインチューニングが施されている。誤った翻訳は工業環境での運用上の問題や安全性の懸念を引き起こす可能性があるため、正確な命令生成が最重要とされた。

After

AddverbのAGVメンテナンスアシスタントは、工業現場におけるLLMの興味深い実装例として注目されている。多言語音声認識機能は、グローバル物流運営における実際の課題に対処している。

エッジでの自律処理

Llama 3によるエッジ推論により、インターネット接続が不安定な環境でもAGVとの対話が可能になった。倉庫内のローカルネットワークのみで完結する運用は、セキュリティとレイテンシの両面で優位性を持つ。

コストと性能の最適バランス

オープンソースモデルと商用APIの使い分けにより、ルーティンな問い合わせのコストを抑えつつ、複雑な問題には高性能モデルを投入する柔軟な運用を実現。組織がLLMを本番運用する際に直面する典型的なコスト対能力のトレードオフに対する実用的な回答を示している。

作業員の生産性向上

未訓練の倉庫作業員でも母国語でAGVの状態確認や基本的なトラブルシューティングを行えるようになり、熟練メンテナンスエンジニアへの依存度が低下。AGVダウンタイムの削減と倉庫全体の運転率向上に貢献している。

ただし、工業環境での音声制御機器の安全性や、自然言語命令の正確な解釈の重要性については、継続的な検証が必要な分野として残されている。Addverbの事例は、エッジコンピューティングシナリオにおいてレイテンシ、コスト、信頼性がすべて重要な役割を果たすアーキテクチャパターンの実例として、業界に示唆を与えている。

公式出典あり この事例の効果数値は、企業のプレスリリースまたは公式発表に基づいています。 出典を確認

この記事をシェア

X でシェア Facebook LINE

公開日: 2024年6月1日

事例一覧に戻る