メッシュアーキテクチャが切り開く新たなデータアナリティクス~

第11回ドメインにおけるデータ品質管理

  • 2026-03-02

第10回では、生成AIがもたらしたデータ品質要求の変化について、AIレディネス(AI readiness)に焦点を当てながらドメインの関与の重要性が増したこと、ドメインにデータ品質責任を分散させるメッシュアーキテクチャとの親和性が高いことを述べました。第11回ではドメインがデータ品質の担保にどのように関与すべきかを解説します。

ドメインは何を担うべきか

メッシュアーキテクチャにおいて、各事業部門、いわゆるドメインは「データに最も近い存在」と見なされ、保有するデータ品質に対するオーナーシップが求められます。また、各ドメインが持つデータのオーナーとして、社内や必要に応じて社外に向けてデータプロダクトを公開する役割を担います。

第10回でも述べたように、ドメイン側はAIレディネスの観点でデータ品質を管理する必要があります。その実現にあたっては、「セマンティックに重きを置いたメタデータ管理」と「AIレディネス志向のデータ品質管理」の両輪で取り組むことが不可欠です。

セマンティックに重きを置いたメタデータ管理とは、単なる項目一覧や技術メタデータの整備ではなく、ドメインが自らの業務文脈に基づいて、語彙・定義・指標の意味を明確に設計し、揃えることを指します。具体的には、「このデータは何を表しているのか」「どの業務判断に使われる前提なのか」といった点を明文化し、指標の算出ロジックや前提条件を含めて共有可能な形で管理します。これにより、人間だけでなくAIにとっても解釈可能なデータとなります。

一方、AIレディネス志向のデータ品質管理では、従来の正確性や完全性に加え、データの来歴や偏りまで含めて品質を捉えます。データがどの業務プロセスで生成され、どのような処理・変換を経て現在の形になっているのかを追跡可能に保つことで、数値の根拠や再現性を説明できる状態を作ります。また、特定の期間・地域・条件に偏ったデータになっていないかをドメイン自身が点検し、必要に応じて補正の実施や利用上の注意を明示します。

さらに、全てのデータに一律の品質を求めるのではなく、ユースケースに応じて品質基準を定義・調整することもドメインの重要な責務です。レポーティング用途、業務判断用途、AI学習用途といった利用目的に応じて、許容される欠損率、更新頻度、精度水準を定め、利用者と合意した上で管理します。これにより、過剰な品質投資を避けつつ、AI活用に耐えうるデータを効率的に整備することが可能になります。

このように、ドメインが担うべき役割は、意味を設計する「セマンティックに重きを置いたメタデータ管理」と、使われ方を前提に品質をコントロールする「AIレディネス志向のデータ品質管理」を実務として回し続けることであり、これがメッシュアーキテクチャにおけるデータプロダクトの信頼性を支える基盤となります(図表1)。

図表1:ドメイン側が担うべきデータ品質

品質を「継続的に」高める仕組み

AIレディネスなデータの品質を継続的に高めるためには、データ品質を監視、異常を検知したら通知し、さらに修正や改善を行うといった一連の活動が必要となります。膨大で多種多様、かつ日々変化するデータに対応するためには、この一連の活動をAIを活用して自動化することが必要不可欠です。こうした仕組みは一般的にDataOpsと呼ばれています*1が、具体的には以下の図表2のようなものが挙げられます。

図表2:データ品質を継続的に高める仕組み

ドメインの品質管理を可能にする、中央組織のあるべき姿

ドメインによる自律的な品質向上の取り組みを継続していくためには、中央組織からのサポートが不可欠です。ただし、このサポートではドメインの自主性を阻害しないガードレールのような環境づくりに注力すべきです。具体的なサポート例として、ドメインだけでは対応が難しいマスターデータの環境整備と、ドメイン間およびドメイン・中央組織間で発生する費用負担の整理について紹介します。

AIレディネスなマスターデータ管理においては、従来の正確性や完全性を重視した中央集権的なアプローチだけでは十分とは言えません。多言語対応や別名、通称など標準の枠外にある多様なデータを扱う必要があります。特に取引先や顧客情報の管理ではあいまいな表記を含む名称を同一なものであると識別することが重要であり、これはAIが適切な与信判断やリスク把握を行うための前提条件です。このような背景からも、マスターデータ管理の責任主体を明確にすることが求められます。例えば取引先情報であれば、調達部門やリスク管理部門が多様性の管理に責任を持つことが合理的であり、中央組織は企業全体で共有されるデータの責任分担におけるルール設計と監査に注力し、管理の主体をドメインに任せ、統制していく役割分担が効果的です。

また、ドメインがデータ品質を管理する際の費用負担も課題となります。従来のデータマネジメントでは中央IT部門が一元的に管理し、費用も中央で負担する、あるいは各部門に均等に配賦することが多かったのですが、メッシュアーキテクチャではデータプロダクトの提供者であるドメインが品質維持や法令順守にかかるコストを負担するケースも少なくありません。問題となるのは、受益者とコスト負担者が一致しない場合です。このようなケースでは、コストを負担するドメイン側で品質維持の動機が薄れ、データのメンテナンスや提供をやめてしまう可能性も出てきます。さらに、いつか使うかもしれないという理由でとりあえず保管されているデータは、利用しないドメインにもコスト負担が発生している格好となり、不満の要因となります。これを防ぐためには、データの利用状況に応じた費用負担ルールの設定や、データに対するオブザーバビリティを強化し、利用頻度の低いデータを定期的に棚卸しするといった対策が必要です。こうしたルール設計は全体最適の視点で設計しなければならないため、中央組織が実態調査を行い、納得感のある費用負担のあり方を考案します。場合によってはコーポレートファンドの設立による全社的なコスト負担スキームの構築も有効でしょう。

代表的な中央組織の関与例を挙げましたが、共通の標準設定やルール整備に関しては、企業全体の業務とシステムを最適化するためのフレームワークであるエンタープライズアーキテクチャ(EA)を活用し、指針となるガイドラインの整備やデータカタログ、モニタリングツール、APIゲートウェイといったプラットフォーム面での環境整備を進めることも効果的です。中央組織の役割は、ドメインの自律と中央で定めた基準の展開という、一見対立する2つの要素を調和させることによる、創造的な分散と全体最適を両立するガバナンスの実現にあります。すでにEAを構築している企業においても、AIレディネスを踏まえたデータ運用を持続的に拡張していくため、従来型のEAの再定義が求められるケースが増えてきています(図表3)。

図表3:中央組織が担うべき二律背反要素の調和

PwCコンサルティングでは、データマネジメントを切り口にデータ利活用推進の取り組みを行い、企業文化としてデータドリブン化を目指すためのデータトランスフォーメーションを支援しています。これからのAIレディネスなデータのあり方を考える上で重要となるメッシュアーキテクチャの導入検討時には、ぜひ私たちにご相談ください。

*1 独立行政法人情報処理推進機構 IPA 2023年5月「データマネジメントの高度化に対応するためのDataOpsの導入 俊敏で柔軟なデータ処理を可能にする新しいデータマネジメント手法」

執筆者

黒田 育義

ディレクター, PwCコンサルティング合同会社

Email

澤村 章雄

マネージャー, PwCコンサルティング合同会社

Email

林 勇希

マネージャー, PwCコンサルティング合同会社

Email

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

{{filterContent.facetedTitle}}

{{contentList.dataService.numberHits}} {{contentList.dataService.numberHits == 1 ? 'result' : 'results'}}
{{contentList.loadingText}}

本ページに関するお問い合わせ