{{item.title}}
{{item.text}}
{{item.text}}
個人が持つ経験やプロジェクトで得た知見を組織全体で共有し、さらに深めていくことは、専門性を高めるうえで欠かせません。こうしたナレッジを誰もが瞬時に活用できる状態をつくり、同時に資料作成などの定型業務を効率化して高付加価値業務に集中できるようにするため、PwCコンサルティングは生成AIを用いた「Knowledge Fusion Platform」を開発し、当社だけでなくPwC Japanグループの他メンバーファームに向けにもリリースしています。
本システムはRetrieval Augmented Generation(RAG)アーキテクチャを採用し、パブリッククラウド環境上に構築しています。IaC(Infrastructure as Code)ツールを用いて環境構築および構成管理を行い、閉域ネットワーク構成(仮想ネットワーク統合およびプライベート接続)を前提とした設計としています。外部公開点はアプリケーションゲートウェイ(Web Application Firewallを含む)に集約し、バックエンドサービスを保護しています。
本稿では、全体アーキテクチャと主要コンポーネントの役割、ならびにデータパイプラインとアプリケーションの処理について解説します。
最初に、Knowledge Fusion Platformのアーキテクチャ全体図を示します。
図表1:アーキテクチャ全体図
次にKnowledge Fusion Platformのコンポーネントとそれぞれの用途について説明します。
サービス |
用途 |
フロントエンド |
プロンプト入力UI、進行状況表示、生成スライドの挿入/プレビュー |
バックエンドエージェント |
取得方針判定、RAGオーケストレーション |
バックエンド(スライド生成) |
スライドファイル生成 |
アプリケーションゲートウェイ |
L7ロードバランス、SSL終端、WAF防御 |
ベクトルデータベース |
ベクトル検索/ハイブリッド検索基盤 |
文書解析PaaS |
テキスト抽出、埋め込み、生成 |
NoSQLデータベース |
会話履歴、メタデータ、ユーザーログを保存 |
データ処理基盤 |
データ前処理・ベクトル化バッチ/インデックス登録処理の実行 |
| データ連携基盤 | ストレージからの収集オーケストレーション、差分取り込み、データ処理の起動・スケジューリング |
ストレージ |
収集したドキュメント、サムネイルなどの資材を保存 |
シークレット管理基盤 |
シークレット・証明書の保管 |
Knowledge Fusion Platformが社内資料をナレッジ化し、ベクトルデータベースに保存するまでのフローは以下の通りです。
図表2:データパイプラインのフロー
Knowledge Fusion Platformがナレッジを活用してスライドを生成するまでのフローを解説します。
図表3:アプリケーションのフロー
今後は、共有フォルダと連携した社内ドキュメントの自動収集機能をETL(抽出:Extract、変換:Transform、格納:Load)環境に整備し、データ収集の効率化を一層推進していく予定です。
私たちはKnowledge Fusion Platformのさらなるナレッジの拡充と、資料作成支援に限らない幅広い業務領域での活用を想定した新機能の検討を進めています。また、Knowledge Fusion Platform開発で培ったノウハウを活用してクライアントを支援します。
{{item.text}}
{{item.text}}
{{item.text}}
{{item.text}}