著者: Naveen Kamat、Dennis Perpetua
「この記事は人が執筆しました。」という記載は、1年前には必要ありませんでした。しかし、AIによる文章作成が進む現在、「執筆者」を記載する必要があるのでしょうか?
生成AIのビジネス利用への期待は高まり、企業の生成AIソリューションへの支出は、2027年までに1,430億ドルに達すると予測されています。1さらに、マッキンゼーの調査によると、生成AIは世界経済に年間2.6兆ドルから4.4兆ドル相当の利益をもたらすとも予測されています。2企業が生成AIの導入を検討するにあたって直面するのは、生成AIがどのように顧客、従業員、株主に真の価値をもたらすのか、という疑問です。
企業が生成AIの力を最大限に引き出すために、次の4つの柱に取り組む必要があると私たちは考えています。
- 強固なデータ基盤の構築
- 大規模言語モデル運用(LLMOps)の活用
- シャドーAIの発生リスク管理
- 適切なユースケースの選択
強固なデータ基盤の構築
OpenAIのGPT-3.5 TurboやGoogleのLaMDAなどの大規模言語モデル(LLM)を調整したり、独自の基礎モデルを作成することがあり、いずれにしても、適切なデータ戦略が欠かせません。健全なデータアーキテクチャーは、成果を加速させる上、AI時代の波に乗るために必須です。最終的な生成AIビジネスソリューションのゴールは、リアルタイムデータ、厳選されたドキュメントストアおよびベクターデータベースにアクセスできること、規制を確実に遵守するために確立されたアクセス制御とプロトコルを遵守することです。
生成AI導入にあたって、まずはデジタル環境全体にデータファブリックを構築し、優れたデータガバナンスを確立することから始めましょう。生成AIの精度を大きく左右するのはデータです。誤ったデータのラベル付けやモデルドリフト(予測性能が劣化すること)で、事実に基づかない情報の生成、誤り、単に質の悪い情報を生成する可能性があります。生成AIの精度を最大限に高めるには、プロンプトテンプレートやプロンプトシーケンスの設計、拡張生成の検索、モデルパラメータの調整など、ビジネス向けの生成AI固有のアーキテクチャー調整を行う必要があります。
LLMは、個人識別可能なデータや機密性の高い個人情報を保護するために、データを必ず非特定化、または匿名化します。このデータの非特定化と匿名化は、データガバナンスの観点から特に重視するべき点といえるでしょう。
データ基盤を導入するハードルは乗り越えられないものではありません。しかし、そのハードルを乗り越えるためには、基本的なデータ戦略が必要です。データ戦略の内容を変更しないまま、生成AIをテクノロジースタックに追加すると、コスト超過やコンプライアンス上の問題などが起こる原因となります。
ユースケース:データ基盤とSQLルックアップ
カスタマーサービス部門では、SQLデータベースからのレポートをアドホックにリクエストすると時間がかかることがあります。その理由は、月に何百件にのぼるレポートを完成させる必要があり、レポートを一つひとつ完成させるには膨大な時間がかかるためです。さらに、エージェントは多数寄せられるカスタマーサービスリクエストの解決策を見つけるため、大量のユーザーガイドやドキュメントをじっくり調べる必要があります。
企業のSQLデータベースとユーザーガイドで訓練された生成AIカスタマーサービスアシスタントは、自然言語の質問をSQLクエリに翻訳し、クエリを実行し、その結果を自然言語に翻訳してわかりやすくします。このプロセスは、ユーザーガイドのライブラリ全体にも適用されるため、顧客の疑問や不明点に対する解決策をすばやく検索し、迅速に対応することができます。