Before
Agmatixは農業技術(AgTech)企業で、種子の遺伝子研究、肥料、作物保護分子(殺虫剤、除草剤、殺菌剤、生物農薬など)のR&Dプロセスを加速させるデータ駆動型ソリューションに特化している。農業イノベーションにおける大きな課題の一つは、フィールド試験データの管理と分析である。新品種や農薬の有効性を実際の環境で検証するための試験は、膨大な量の複雑なデータを生成する。
従来、農学者や研究者がフィールド試験データから有意義なインサイトを得るプロセスは、手作業で時間を要するものだった。各試験には数百の異なるパラメータが含まれており、ユーザーが自分の特定の調査にとって意味のあるデータポイントを理解するのは困難だった。ANOVA One-Way、回帰分析、箱ひげ図、地図など、数多くの分析可視化ツールやグラフタイプが存在する中で、パターンを理解し異常を特定するために最も適切な可視化手法を選択することは容易ではなかった。
さらに、分析ダッシュボードを作成した後でも、異なるデータポイント間の結論を導き出し関連付けることは複雑だった。試験結果が仮説を支持するか、どの外部要因が製品の効能に最も大きな影響を与えているかを判断するには、熟練した農学者の経験と直感に大きく依存していた。生データのクリーニング、標準化、調和化、処理は時間を消費する傍系作業であり、戦略的な高付加価値業務に集中できない状況が常態化していた。
AI導入内容
Agmatixは、農学者や研究者が複雑なフィールド試験データをより効率的に分析できるよう支援する生成AIアシスタント「Leafy」を開発した。AWS上に構築された技術アーキテクチャは、データパイプラインと生成AI層が連携して動作する。
AWSネイティブなデータパイプライン基盤
データパイプラインは複数のAWSコンポーネントで構成されている。多源データはまずAmazon S3データレイクに受信・保存される。AWS GlueがS3からデータにアクセスし、データ品質チェックと重要な変換を実行する。AWS Lambda関数がさらに変換されたデータをエンリッチ化する。処理されたデータはAI/MLサービスの入力となり、生成されたインサイトはAgmatixのインターフェースを通じてユーザーに提供される。
この既存のデータパイプラインにより、クリーンで変換されたデータを生成AI層に供給できる環境が整っており、データ品質と準備の重要性が強調されている。
Amazon BedrockとClaudeによる自然言語分析
生成AIチャットボットアプリケーション「Leafy」は、3つの基礎コンポーネントで構築されている。プロンプト(ユーザーからの質問やタスク)、データ(質問に答えるために必要な情報)、エージェント(タスクを調整するオーケストレーション層)である。
農学者がLeafyに質問すると、AgmatixのInsightsソリューションがAmazon Bedrock上のAnthropic ClaudeにAPIリクエストを送信する。Claudeに送信されるプロンプトは、ユーザーの質問と、可視化ウィジェットタイプのリストなどモデルへの文脈データ指示、および特定のフィールド試験データの2種類のデータから構成される。
プロンプトエンジニアリング中心のアプローチ
Agmatixのソリューションは、ファインチューニングやRAGではなく、プロンプトエンジニアリングに大きく依存している。プロンプトはユーザー質問と文脈指示、試験固有のデータを組み合わせたもので、関連データはベクトルデータベースから検索されるのではなく、プロンプト文脈に直接含まれるシンプルなアプローチを採用している。チームはAnthropic Claudeのプロンプトエンジニアリングガイドラインに従い、期待される出力を正確に導き出すための工夫を凝らしている。
サーバーレス構成による運用効率
Amazon Bedrockを使用することで、Agmatixは独自のモデルインフラストラクチャを管理する必要がなくなった。これは、運用オーバーヘッドを削減したい企業にとって一般的なLLMOpsパターンである。生成AI機能は既存製品(Insights)に統合されており、LLM機能を既存アプリケーションに追加して強化する実例となっている。
After
Agmatixの生成AI導入により、農業研究におけるデータ分析のワークフローが変化し始めた。
分析効率の向上
AWS上のAmazon Bedrockを活用したデータ駆動型フィールド試験サービスにより、20%以上の効率向上、25%以上のデータ整合性改善、3倍の分析スループット向上が実現された。手作業だった分析プロセスが自然言語対話に置き換わり、農学者は戦略的な判断に更多的时间を割けるようになった。
最大規模のオープン栄養データベース
Agmatixのインフラストラクチャによって支えられる最大規模のオープン栄養データベースでは、研究者が何千ものフィールド試験からインサイトにアクセスできる。生成AIによってガイドされた質問プロンプトと回答により、作物の栄養吸収と除去のトレンドを理解し、意思決定支援システムの作成を簡素化している。
既存製品へのシームレス統合
Leafyは既存のInsightsプラットフォームに統合されており、ユーザーは新しいシステムを学習する必要なく、自然言語で試験データに問い合わせできる。これにより、導入障壁が低減し、迅速な価値創出が可能になった。
ただし、複雑な分析質問に対する多段階推論や応答の正確性検証の方法については、今後の改善課題として残されている。Agmatixの事例は、マネージドサービスを通じて基盤モデルを使用し、既存データ製品を自然言語インターフェースで強化することで、エンドユーザーがデータにアクセスし分析する際の複雑さの障壁を下げる、ますます一般的になっているLLMOpsパターンを示している。
公開日: 2024年6月1日
事例一覧に戻る