メッシュアーキテクチャが切り開く新たなデータアナリティクス~

第10回 生成AIがもたらしたデータ品質要求の変化

  • 2026-01-30

第7回から第9回では、主にメッシュアーキテクチャを実現するための中央組織について述べました。メッシュアーキテクチャにおいては、データ品質に対する責任を中央組織とドメインに分散させることが重要であることはすでに述べましたが、今回は各ドメインが品質担保を求められる生成AI時代のデータ品質について、AIレディネス(AI readiness)に焦点を当てながら論じます。

データ品質に対する意識の変化

PwCが実施した「生成AIに関する実態調査2024 春」では、「適切なユースケース設定」と「データの品質」が生成AI活用の効果を最大化するための両輪と位置付けられるなど、生成AIの利用が急速に広がる中、データ品質に対する意識も着実に高まってきています。

またこれまで、業務システムや分析結果の信頼性を確保する観点から、「正確性」「完全性」「一貫性」「可用性」「最新性」といったデータ品質の評価項目がさまざまな団体で定められており、これらが重点的に評価されてきました。しかし近年、この評価項目にも変化が見られます。

生成AIは大量のデータを活用して推論やコンテンツ生成を行うため、その社会的影響やリスク管理を考慮しなければなりません。そこで従来の項目に加えて、

  • コンピュータがデータの意味を適切に解釈するための「理解性」
  • 生成されたコンテンツを安心して利用できるようにする「信ぴょう性」
  • データの出所や処理履歴を明確にする「追跡可能性」

といった観点が、重要な評価尺度となりつつあります。

さらに、さまざまな見解や意見を公平に取り扱いながら、そこから多角的な視点や解決策を導き出し、新たな価値創造を推進する観点から、データの「多様性」も今後重要な評価軸になるとして注目されています(図表1)。

以上のような、AI時代に求められるデータ品質評価をクリアし、価値あるユースケースを創出できる状態のことを、「AIレディネス」と言います。

図表1:データ品質の評価項目

(デジタル庁「データ品質管理ガイドブック」を参照しPwC作成)

AIレディネスなデータとは

これまでも多くの企業において、データ可視化や分析などのデータ活用に取り組んできました。一方で幅広い職員が、可視化されたデータや分析結果を解釈し、それを知恵としてさまざまな施策につなげていく上では、個々の職員が持つ担当業務やデータを取り扱うスキル・経験によって差が生じていました。生成AIはそうした差を埋め、解釈や知恵をガイドする存在として期待されています。

こうした取り組みに必要なのが「AIレディネスなデータ」ですが、その構築のポイントをご紹介します。まずは、社内の基幹システムや社外のオープンデータなどを対象に、それらをユースケースに応じて意味付けを行うことで「情報化」し、さらにその情報から導出される「知恵」として提示します(図表2)。これをセマンティックデータまたはセマンティック情報と言います。

例えば、これまでは人がデータをBIツールなどで可視化し、期間ごとの売上実績などを表示していました。今後はセマンティックデータを準備することで、そこからビジネス的な意味(=情報)と、その意味から導かれる対策などを生成AIが提示するといった振る舞いが可能になります。このようにAIレディネスなデータの活用が進むことで、システムと人の役割に境目はなくなっていきます。

図表2:生成AI時代のデータと情報、知恵の関係

さらに、生成AIがデータから提示した情報や知恵に対して、その結果が満足度の高いものだったかを利用者がフィードバックすることも重要です(図表3)。それ自体を学習データとすることで、生成AIが提示する回答の精度も高くなっていきます。なお、フィードバック内容は時と場合によって異なるため、フィードバックの背景となるユースケースと併せて管理しないと良い学習データとならない可能性があることには注意が必要です。

図表3:フィードバックの重要性

AIレディネスなデータの品質担保

データから情報、そして知恵に変える作業は、これまで各事業部門、いわゆるドメインが担っていました。データが示す意味やその背景は事業部門が一番よく分かっているためです。生成AIではデータや情報、知恵を一体で管理して学習させることでさらに活用が広まることを考えると、その品質担保の責任も各事業部門=ドメインが担うことが自然です。さらに自らのドメインだけでなく、経営部門など他のドメインも利用できるよう「データプロダクト」化を行うことで、経営も含め全社でデータの見方を合わせることが可能となります(図表4)。

図表4:データプロダクトの特徴(コラム第3回 再掲)

AIレディネスなデータとメッシュアーキテクチャの親和性

今回は、生成AIを生かすデータ環境である「AIレディネスなデータ」について、構築する上でのポイントを解説しました。これらはメッシュアーキテクチャにおけるドメインの役割、責任である

  1. ドメインは、自らが持つデータやアナリティクスに対して相互運用性を意識し品質管理を行うこと
  2. ドメインは、自らが持つデータやアナリティクスをプロダクトとして他ドメインに共有し、利用できるようにすること

と親和性が高いです。

次回は、さらにドメインがデータの品質担保にどのように関与すべきかについて説明します。

執筆者

黒田 育義

ディレクター, PwCコンサルティング合同会社

Email

澤村 章雄

マネージャー, PwCコンサルティング合同会社

Email

林 勇希

マネージャー, PwCコンサルティング合同会社

Email

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

本ページに関するお問い合わせ