はじめに
今回のコラムはデータマネジメントについて扱います。
特に、「データマネジメントが重要だと言われるが、結局データマネジメントをやるとどんなメリットがあるのか?逆にやらないとどんなデメリットがあるのか?」といった点について、より具体的な例を用いて理解を深めて頂くことを目標にしたいと思います。
なおデータマネジメントの概略については、MKIナレッジの過去のコラム「データマネジメントについて」(2022.02.09)でご紹介しました。「そもそもデータマネジメントってどんなもの?」という方はこちらからお読みください。
「データマネジメントについて」(/knowledge/column122.html)
この記事ではより現実的な疑問に答えるQ&A形式で、データマネジメントへの理解を深めるお手伝いができればと考えています。
データマネジメントに関する疑問
ここからはよくある疑問とその答え、という形で書いていきます。
Q1.データマネジメントとは結局何のためにあるのか?
近年、機械学習をはじめとした所謂AI/人工知能の発展が目覚ましいのは広く知られるところかと思います。データをより有効に利活用して大きな効果を得たい、というのは多くの人・企業が考えることではないでしょうか。
一方で、データ分析の部分だけに注目・注力してしまうと、利活用の仕組みは作ったけれどうまく運用を継続できない、あるいは維持コストが膨大になってしまう、といったことが起こりえます。こうした問題を解決したり未然に防いだりするためには、「データ分析」そのものだけではなく、「データをどう扱うか」の部分もしっかりと整備する必要があります。下の図で言えば、右上のデータ利活用の部分だけに注力するだけではなく、その周辺の部分のことも考えようというイメージです。
この考え方がデータマネジメントです。

このように、データを継続的に利用・改善して行けるように、しっかりと仕組みづくりをしましょう、というのがデータマネジメントの目指すところです。
(※なお、注目されやすいのはデータ分析の部分ですが、必ずしもデータ分析だけが対象ではありません。すべての企業活動はデータと共にありますし、そうしたデータに関わる活動すべての最適化をデータマネジメントは目指します。)
Q2.たとえばどんな課題を解決できるのか?
ここでは、具体的にどんな課題があり、それをどんなデータマネジメント手法で解決できるのかの幾つかの例を示します。
例1:社内にデータに詳しい社員がいて、データのことは全てその人に任せていた。
そのため、その人が退職したら誰もデータを扱えなくなってしまい、データ分析システムも使われなくなってしまった。
→メタデータ:
メタデータとはデータそのものに対して説明するデータを指します。いくつかの種類がありますが、そのうちビジネスメタデータと呼ばれるものが、そのデータの業務上の意味や特性を表現したものです。同じ用語でも企業によって少し使い方が違ったり、部分的に特殊なデータが入っていたりしますので、それを表現するイメージです。
ビジネスメタデータをまとめて参照できる辞書のような形にしたものはデータカタログと呼ばれます。データカタログがたとえばWebアプリケーションの形で必要なメンバに共有されていれば、「あの人に聞かないと分からない」状態を避けることができます。離任時に限った話ではなく、今までは人と人との関係がなければ入手できなかった情報も共有できる、といったメリットもあります。

例2:同じ名前のデータや似たようなデータが社内の複数個所で作られ、存在している。
たとえば商品マスタが複数のシステムや部署で作られてメンテナンスされており、どれもが少しずつ違っている。
→参照データとマスタデータ:
現実世界における「この会社で扱うべき商品情報はこれだ」と一種類に決まるのであれば、本質的には会社の商品マスタも一種類であるべきです。従い、「この会社の商品マスタはこれ」というあり姿を整理の上で作成し、それを共有するのが理想的です。実現方式としてはマスタデータの源泉となるようなデータ生成・管理システムを一か所に統一し(たとえばWebアプリケーションとして実現)、そこで生成されたデータを必要な人・システムに配布する形を取ります。

例3:システム間のデータ連携のコストが膨大化している。
→データ統合と相互運用性:
N個のシステム間のすべての組み合わせについて、互いに1対1で接続すると接続数はN * (N - 1) / 2であり、Nの2乗に比例して増えていきます。N=3の場合は3で済みますが、N= 10となると45まで増加します。さらに、これらのデータ連携をそれぞれのシステムが得意とする形で独自に実装すると、使用される技術の種類数や製品の種類数も増加していきます。こうした状態を避けるためにHUB型が推奨されます。各システムはHUBとの接続ならびに自分のシステムに合わせたデータ変換だけを意識すればよくなり、N個のシステムを連携するときの辺の接続数はNとなります。
これにより開発対象も管理対象も大幅に削減することができます。

例4:ここまでに記載したような仕組みを作ったけれど、結局きちんと運用されない。
→データガバナンス:
ここまでに書いたようなデータマネジメントの手法を適用して、システムを構築したとしても、それがきちんと運用されなければ結局効果を発揮することはできません。従い、これらの仕組みが機能するように管理していく必要があり、このための取り組みがデータガバナンスです。データガバナンスでは、データマネジメントが適切に行われるための体制づくり、規約の策定、実施状況のモニタリングなどを実施し、データマネジメントの継続と発展に繋げます。
長くなりましたが、ここまでの内容が、データマネジメントがデータに関する課題を解決する代表例です。
Q3.データマネジメントの有効性は分かったが、範囲が広すぎる。どこから手を付けたらよいのか?
データマネジメントの知識体系であるDMBOK(*1)には11もの領域があるため、壮大過ぎて何からやったらいいのか分からない/やろうにも人が足りない、ということもあるかも知れません。現実的な策としては、段階的な導入が現実的です。
データを分析してみてメリットが得られるのかをまずは試してみたい、というお客様が多い印象です。当社としても、まずはデータを活用できる環境を整えて(ただし、将来的な視点からも見て妥当性を判断)、ある程度の効果が得られてからそれを継続的に改善していける仕組みを整えていくという進め方を推奨致します。
(*1)DMBOK(Data Management Body of Knowledge)は、米国に本部があるDAMA(Data Management Association)Internationalが発刊しているデータマネジメントに関する知識を体系立ててまとめた書籍のことです。詳しくは、過去コラム「データマネジメントについて」をご覧ください。
Q4.データマネジメントでできないことは何か?
データマネジメントは、「データを使って実現したいこと」をうまく実現・継続するための手段です。言い方を変えれば、「データを使って実現したいこと」そのものは提供されません。実現したいことは例えば、一週間後の商品売り上げを予測したい、報告資料を迅速に作成したい、など多様ですが、当社ではこれを「テーマ」と呼び、テーマを定める過程はデータマネジメントとは別の過程として扱っています。
まとめると、以下のようになります。
1. テーマ:データを使って何を実現したいか。つまり「目的」
2. データマネジメント:テーマの実現のために、データをどのように扱うか。つまり「手段」
おわりに
データを使って実現したいテーマを定めたい、テーマは決まっているけれどどのように実現すればよいか分からない、データ管理の仕組みは構築したけれど課題があるのでなんらかの手法で解決したい、などデータに関しては様々なお悩みがあるかと思います。
三井情報では、こうした課題の解決をサポートしていますので、是非ご連絡ください。
関連ページ
おすすめコラム:
データマネジメントについて
データドリブンな意思決定とその難しさ

大内
データマネジメント技術部 第一技術室
データ利活用基盤の構築ならびにデータマネジメント観点での顧客業務支援を担当
コラム本文内に記載されている社名・商品名は、各社の商標または登録商標です。
本文および図表中では商標マークは明記していない場合があります。
当社の公式な発表・見解の発信は、当社ウェブサイト、プレスリリースなどで行っており、当社又は当社社員が本コラムで発信する情報は必ずしも当社の公式発表及び見解を表すものではありません。
また、本コラムのすべての内容は作成日時点でのものであり、予告なく変更される場合があります。