{{item.title}}
{{item.text}}
{{item.text}}
第3回の本稿では、第2回「統合管理を含めたデータガバナンス/マネジメントの要諦」にて示したデータガバナンス/マネジメントを実行するために必要なアーキテクチャの概論を述べます。
前回はサステナビリティデータにおけるガバナンスの要諦として、個別最適ではなく全体最適でデータソース/指標データの品質管理を行うこと、迅速な指標データの再利用を促すための一元管理が重要となることを述べました。
サステナビリティ指標データを管理することは、組織横断での意思決定や組織戦略に対する各業務施策のPDCAサイクルを運用する上で重要です。例えば、第1回で述べたようなエネルギー消費データという指標を基に、エネルギーのコストパフォーマンス最適化などの施策につなげることや、サプライヤーの温室効果ガス(GHG)排出量という指標を基に、企業価値向上に資するコミュニケーションが可能になるなど、サステナビリティ指標は財務指標や業務指標にも大きく関わります。その他にもサステナビリティ指標と財務とのつながりを分析することで経営管理に生かす、企業価値創出のためにどの資本に投資すべきかを特定する際の一つのKSF(重要成功要因)に位置付けるなどの活用が進んでいます。
このようにサステナビリティ指標は今後の企業運営に重要なものであることから、その指標データは組織内で定義され、完全性を持った状態で一元的に管理/運用する必要があります。また、指標データを扱うユーザーに対して解釈を提供し、データアクセスを明示することも重要です。加えて、指標データを生成するためのデータソースとそのビジネスロジック(≒加工プロセス)や品質情報を管理することも求められます。これにより、外部報告から内部活用までを整合性をもって連携することが可能となります。
これらを踏まえて、サステナビリティデータアーキテクチャは以下を必要な要件とします。
次章では、こうした必要要件に基づくアーキテクチャ実現に向けた方針について述べていきます。
1章で説明した要件を実現する技術概念として、「セマンティックレイヤー」と「メトリクスストア」が挙げられます。セマンティックレイヤーは分析の対象となるデータが何なのか、どのような定義をされているのかを管理し、ユーザーがデータウェアハウス(DWH)、データマート(DM)からデータ抽出を円滑に実施することができる存在です。従来は、セルフサービスBIツールなどに搭載されており、ユーザーがセマンティックレイヤーを自由に定義することが可能である一方で、ビジネスロジックの定義が分散してしまうという課題を持っていました。
この分散を防ぐために、指標データとそのビジネスロジックを統合管理するメトリクスストア(後述)をセマンティックレイヤーの中に織り込むことで、社内の指標の一元化とその共通利用を実現することが可能です。
このようなセマンティックレイヤーは、以下の機能で構成されます。
これらの機能を利用することで、データソースが物理的に分散していたとしても、ユーザーは単一のアクセスポイントから正しい指標データを取得することが可能となります。
本セマンティックレイヤーの考え方をサステナビリティ基盤に活用することで、指標データの定義に対して信頼性を与える仕組みの実現が可能になります。
図表1:サステナビリティデータ基盤の構成イメージ
図表1はセマンティックレイヤーの考え方を踏まえたサステナビリティデータ基盤の構成イメージです。
大構成としては、データソース層/データレイク層/DWH層/セマンティックレイヤー/活用層という形で成り立っており、従来のデータ基盤の構成に統合的なセマンティックレイヤーを組み込んだ構成となっています。なお、上記図表ではデータそのものを一元管理する中央集権型のアーキテクチャを記載していますが、規模によっては分散型アーキテクチャ(例:メッシュアーキテクチャ*)による実現も検討する必要があります。
*メッシュアーキテクチャについてはこちらのコラムで解説しています
本アーキテクチャの特筆すべき点について説明します。
メトリクスストアは、指標データとビジネスロジックを保存・管理します。図表2のように組織横断で整合した指標を扱うために、指標の定義/指標の加工プロセス/データソースなどを一元管理し、標準化することが目的です。ユーザーはメトリクスストアに管理されている指標定義を用いることで、論理的な整合を保つことができます。もし、指標に変更が必要となった場合には、指標を利用しているユーザーに変更を通知することを前提に、メトリクスストア側の定義を変更します。これにより、指標を利用している各テーマ側で重複する変更工数を削減することが可能です。そのため指標データに関しては、各サステナビリティテーマで検討された指標の定義を収集し、ビジネス上の定義も含めて整理し、どのテーマで活用しているかについても管理することが望ましいです。ビジネスロジックに関しては、ロジックの定義/ロジックを適用する範囲/指標を計算するタイミングなどを管理します。
メトリクスストアで扱う指標のデータソースに関しては、そのデータの種類によっても管理する項目は変更されます。テーブルや表計算ソフトなどの構造化されたデータであれば、上記の管理項目が該当しますが、非構造データを扱う場合には注意が必要です。テキスト情報を生成AIやOCRで読み込む場合には、データ抽出のタイミングや利用したAIモデルのバージョンをメトリクスストアにて管理し、指標抽出の再現性を担保しておく必要があります。
このようにメトリクスストアを通して、指標のビジネス定義を含め、再利用性や再現性を担保した情報を管理することが可能です。また、サステナビリティ監査という観点では、データの成り立ちを確認する作業がこの取り組みにより効率化できます。
図表2:メトリクスストアの必要性
メトリクスカタログは、指標の定義/指標の生成プロセス/データソースに関する指標のメタデータを、ビジネスユーザーに分かりやすい形で整理したものです。データカタログの拡張機能とも言え、ユーザーが指標を利用する業務要件やアプリケーション開発時に用います。
メトリクスストア、およびメトリクスストアを介したDWHにアクセス可能な組織/ユーザーを管理します。中には社外のデータを扱う場合もあるため、特にデータソースのセキュリティ観点/監査観点で重要になります。
指標を共通的に利用するためにAPI(アプリケーション・プログラミング・インターフェース)プロトコルを用意し、さまざまなアプリケーションの連携先を用意しておきます。
上記のように、サステナビリティデータ基盤では従来のデータ基盤に加えて、正しい指標データをメトリクスストアに一元的に管理し、データソースおよび加工プロセスの信頼性/再現性を担保した上で、共用/共通利用可能な仕組みを構築することが重要です。
次回以降は、データガバナンス/データマネジメントの要諦を踏まえた組織/推進体制について解説します。
{{item.text}}
{{item.text}}
{{item.text}}
{{item.text}}