
メッシュアーキテクチャが切り開く新たなデータアナリティクス~第8回 競争優位を築くメッシュアーキテクチャの実践
メッシュアーキテクチャ実現に向けたポイントをシステムの観点から考察し、中央データ基盤に求められる機能群ごとに解説します。
2025-05-28
第7回では、データ利活用人材の育成に焦点を当て、組織全体でのデータリテラシー向上の重要性を議論しました。今回は、競争優位を築くためのメッシュアーキテクチャ実現に向けたポイントを、システムの観点から考察します。
メッシュアーキテクチャでは、各ドメインでデータプロダクトを生成し、APIなどを通して他ドメインへデータプロダクトを提供します。この連携をスムーズに実現するにあたり、中央データ基盤には以下の機能群が求められます。
図表1:メッシュアーキテクチャにおける中央組織活動と中央データ基盤機能
ドメイン同士の効率的な相互連携を実現するため、ドメインが持つデータプロダクト間の連携方式を中央データ基盤で統一します。代表的な連携方式としては、APIやファイル連携などがあり、リアルタイム・バッチ双方をサポートします。データプロダクトに更新があった場合の通知機能も備えることで、ドメイン間でのデータ断面の不整合を防ぐことができます。
その他、アクセスの正当性を担保する仕組みとしての認証/認可やアクセスキー管理の機能、意図しない過剰なアクセスを抑止するための課金・アクセスの上限設定、ユーザーがデータプロダクトに簡便にアクセスできるようにするための利用者向けポータルサイトの構築も考えられます。
生成AIの活用においては、ドキュメントや画像・動画などの非構造データの取り扱いも欠かせません。これをサポートする代表的な機能に、ナレッジグラフやベクトルデータベース(DB)があります。例えばナレッジグラフは、情報をエンティティとそれらの関係に基づいて構造化したグラフ表現であり、情報の相互関係を理解するのに役立ちます。またベクトルDBは、画像や文をベクトル(数値情報)の形式で保管・管理する方式であり、類似検索や近傍探索など大規模データセットを扱う手法の高速化を実現します。
機能①「ゲートウェイ」や機能②「統合検索」は、データプロダクト利用までの‟アクセス(How)”に必要な機能でしたが、データプロダクトの‟中身(What)”を知るための機能も重要です。「カタログ」機能は、データプロダクトの意義を明確にし、ユーザーが必要な情報を容易に見つけられるようにします。これにはデータカタログが含まれ、データセットのメタデータや構造、利用方法を整理します。また、データリネージを通じてデータの変遷を可視化し、ユーザーがデータの出所や変化の過程を理解できるようにすることで、データの信頼性と透明性が向上します。
各ドメインがデータプロダクトを効率的に開発・運用するための支援機能も必要です。
例えばドメインごとに製品や部品などのIDが異なる場合、他ドメインのデータプロダクトの結果をうまく活用できないケースが発生します。中央データ基盤としてMDM(Master Data Management)を実施し、マスターデータの管理方式を統一することで、ドメイン間でシナジーのあるデータ利活用を支援します。
開発作業を効率化する機能も重要になります。例えば、AIモデル開発でよく利用する汎用ライブラリや、テストデータの品質を簡易に確認するダッシュボード機能などを中央データ基盤として整備することで、ドメインはデータプロダクトのカスタマイズに注力できます。また生成AIによるコード生成機能も搭載する場合は、プロンプトに含まれる社内・ドメイン特有の用語やナレッジ対応のためにRAG(Retrieval Augmented Generation)も導入することで、ユーザビリティを最大限に高められます。
その他、一般的なシステムでも必要となる監視や障害対応機能を構築します。これらの機能を備えることで、各ドメインのデータプロダクト提供の信頼性向上に寄与します。
データプロダクト特有の課題として、継続的なデータ更新やメンテナンス、ユーザーからのフィードバックの収集と反映が挙げられます。データプロダクトの精度がデータのトレンドに左右されるため、リアルタイムな性能評価やバージョンアップが求められます。性能評価基準の定義はドメイン特有の知識が必要になるため各ドメインで行い、中央データ基盤としては統一したバージョン管理手法やドキュメント管理手法を提供することで、各データプロダクトの品質担保を効率的にサポートします。
データプロダクトは、その特性上、個人情報や機密情報などを出力することがあります。このような不適切な情報提供はユーザーの満足度を低下させるだけでなく、企業のレピュテーションリスクを招く可能性があります。特に生成AIを活用したプロダクトの場合、ドキュメントをインプットとして使用することが多く、個人情報の混入リスクが高いです。そこで、中央データ基盤は、こうした情報がインプットされないようにする仕組みや、出力時に規制をかける機能を備えるべきです。これにより、企業としてのブランド価値を毀損するリスクを低減できます。
前述の各機能説明において“統一”という言葉を用いましたが、一口に“統一”と言ってもその実現方法はさまざまです。ここでは“共通化”と“標準化”に分けて議論します。
共通化は、「共通する機能や案件プロセスに対して、それらを1つにまとめて提供すること」を指し、モノやプロセス自体の統一に該当します。中央組織があらかじめ定めた製品や手法のリストがあり、ドメインはそのリストから選択します。共通化は、例えば機能①「ゲートウェイ」に適しています。具体的には、データプロダクトへのアクセス方法はAPIまたはアクセスキーなどシステム間連携に限定し、ユーザーによるデータ取得は認めない、などです。個々のデータプロダクトでアクセス方式やID管理システムが異なるとユーザー側でアクセス方法の使い分けが必要になり、ユーザビリティが低下します。
標準化は、「社内外の法令や指標、動向に応じて基準を定めること」を指します。中央組織が手法や製品の選択基準を定め、ドメインはその基準に従って選択します。例えば、機能④「データプロダクト開発/運用(MLOps/DataOps)」は標準化が向いています。データプロダクトの仕様によって開発/運用要件には差があり、それぞれに適したツールを使いたいという要望が発生することが考えられます。一方、各ドメインが好きなように選択していては結局サイロ化を引き起こします。ユーザーに一定の自由度を持たせながら、最低限満たすべき基準を中央組織が定義することが標準化にとって肝要です。
共通化/標準化は一概にどちらかにすべきというものではなく、個社特性や機能に応じて適宜使い分ける必要があります。
図表2:共通化/標準化の定義
従来の中央集権的なデータ基盤とは異なるメッシュアーキテクチャを推進する場合においても、各ドメインのデータ利活用のサポートを目的とした中央データ基盤が不可欠です。各機能群の整備や共通化/標準化の効果的な使い分けにより、ユーザーが参加しやすいメッシュアーキテクチャの仕組みを実現でき、多数のドメインが相互連携することで競争優位の獲得に繋がります。
メッシュアーキテクチャ実現に向けたポイントをシステムの観点から考察し、中央データ基盤に求められる機能群ごとに解説します。
メッシュアーキテクチャの導入について、人材育成に焦点を当て、昨今のビジネス環境で求められるデータ利活用人材の役割と教育方法について深掘りします。
企業には財務的な成果を追求するだけでなく、社会的責任を果たすことが求められています。重要性が増すサステナビリティ情報の活用と開示おいて、不可欠となるのがデータガバナンスです。本コラムでは情報活用と開示の課題、その対処法について解説します。
生成AIの影響により、データ活用の裾野が広がっています。セールスフォース・ジャパンTableau事業統括部のディレクターの嶋ピーター氏と、PwCコンサルティングのパートナーの高橋功、マネージャーの澤村章雄が、日本企業のCDOが今後進むべき方向性について語り合いました。
PwCが実施した「データマネタイゼーション実態調査2022」をもとに、データマネタイゼーションの実態や現在の潮流、事例とともに、データマネタイゼーション成功へのポイントを前後編に分けて解説します。前編では調査結果から見えてきた実態と課題についてです。
社会のあらゆる場面でAIが活用され始めた昨今、AIリスクを起因とするインシデント事例が世界的に増加しています。これに対応するため、国際機関や各国政府はAIリスクに対応するための原理原則や中間的ルールの整備を進めています。
データに基づいて最適な打ち手を実行してフィードバック・ループを高速に回す「データドリブン」型経営が主流となり、各企業は「DXの推進のためのデータの収集および活用」に積極的な姿勢を打ち出しています。本稿では、データ解析に必要な「データ分析人材」および「ビジネス人材」について考えます。
PwCコンサルティング合同会社と、一般社団法人東京ヴェルディクラブは、eスポーツプロ選手の熟練した技能(匠の技)を、複数の情報を組み合わせたマルチモーダルAIを活用し分析したプロジェクトを実施しました。