2017.03.17

一滴の雫が大河になる~データ活用の分水嶺

一滴の滴が大河になる~データ活用の分水嶺

コグニティブ・システムや人工知能システムの実用化にあたり、あらためてデータの整備、ライフサイクル管理、データガバナンスが注目されています。データ活用でビジネス競争に打ち勝つには、テクノロジーの仕組みだけでなく、企業の体質改善(ガバナンス)、体力増強(データ整備)が必要です。

「業務プロセスから知恵・知識・知見を包含するデータを生み出し、テクノロジーを活用して示唆を導き出す。そして、示唆に基づいて施策を立案・実行し、その結果がデータとして更に次のサイクルに活かされる」――。そんなデータ活用を実現するため、特にデータガバナンスに着目してポイントを紹介します。

IBM鈴木至
鈴木 至
パートナー グローバル・ビジネス・サービス事業本部 コグニティブ推進

インフォメーションマネジメント、ビッグデータ分野のコンピテンシーリーダーを歴任し、現在コグニティブビジネスのパートナーとしてビジネス開発をはじめ、オファリング開発、コンサルティングから実装・運用までのデリバリー推進の責任者として従事。

いかにデータの整備・充実を検討するかが重要

人口知能のブームに始まり、コグニティブ・システムを実用化した事例が連日リリースされています。しかし、多くの企業にとって、訓練データ、テストデータの整備には予想以上のワークロード、コスト、時間を要し、新たな課題となっているのが現実です。

これは、これまで本格的にデータ活用を実践してこなかったにもかかわらず、人工知能を契機に一足飛びに未体験ゾーンに突入したためだと考えられます。そのため、人工知能やコグニティブの検討に先立ち、いかにデータを整備し充実させるか検討することの重要性が増しています。また、データ整備の検討が進むにつれ、データ活用実現・定着の成功要因の一つとして、データガバナンスが着目されています。

これまで、日本ではデータガバナンスが「統制・管理の仕組み」といった観点で捉えられていて、データの重要性やデータ戦略について語られることがありませんでした。欧米諸国では、企業規模にかかわらずチーフ・データ・オフィサー(CDO)がアポイントされていて、業界・業務内外のコミュ二ティー活動が盛んであるのとは対照的です。

デ—タガバナンス自体は、データを企業戦略に活かすためのものであり(データ活用)、決して目新しいものではありませんが、ここでは人口知能やコグニティブにおけるデータガバナンスのポイントについて述べていきます。

人工知能/コグニティブならではのデータガバナンスの考慮点とは?

人工知能/コグニティブはデータの価値を見出し、お客様に新たな体験を提供することを目指すためのものであり、企業にとっては、必要かつ充分なケーパビリティーが求められます。データを整備することは価値あるデータを生み出すことであり、企業戦略に沿ったデータの戦略と施策は不可欠です。つまり、まさにデータガバナンスの実装が重要となります。そこで、人口知能/コグニティブならではのデータガバナンスの考慮点について、特にそのスコープ、データプラットフォームと体制について簡単にポイントを紹介します。

「制御(Control)—管理(Management)—活用(Governance)」

ビッグデータという言葉が広く使われるようになって久しいですが、企業で捉えることができるデータには、さまざまな制約が存在します。また、特に日本では社外で活用できるオープンデータが少なく、まさに制御されている状態とも言えるでしょう。この点について、今後は政府・公共機関・産学が一体となって、大きく変革していくことに期待します。

一方、企業に目を向けてみると、多くの場合、何らかのプロセスや担当者によって、業務の開発・変更、各種レポート作成など、作業・プロセス改善のためのデータ管理を実施しています。しかし、ガバナンスを紹介する際に「業務は回っているのだから、コストをかけてまでプロセスを変えたくない」との意見がよく聞かれます。そのため、データを管理することから利用することへの意識改革、ゴールと課題の共有までを会社全体で取り組み、競争に打ち勝つための体質改善を目指す必要があると考えています。データ活用の現状の把握と、戦略に基づいたゴールのギャップを明確にすることから、データガバナンス施策の検討を始めましょう。

データの持つ価値の届け先、さらにその先にいる、結果としてメリットを享受する利用者を想定したデータガバナンスが必要である点が、従来と大きく異なります。

「データのライフサイクル」

前述したとおり、訓練データ、テストデータなどのデータ準備のためには、データから得られた示唆、知見の結果をデータとして学習する必要があり、これは、業務プロセスやオペレーションに大きく影響します。まさにデータが新たなデータを生み出すわけで、人口知能/コグニティブが、従来の基幹系データをベースにした情報系システムと大きく異なる点です。データガバナンスの観点からすると、データ利用者に提供するデータや情報は常に評価する必要があり、適切なアクション、例えば訓練データの見直しなどを実施します。

「データプラットフォーム」

「全社的な人口知能・コグニティブのプラットフォームを構築して備えたい」。これもよく聞かれる言葉ですが、前述した通り、テクノロジーや機能の組み合わせの観点でインフラを構築しても、管理はできてもデータガバナンスには充分ではなく、利用者の要望に応えきれない事態が発生することが想定されます。データ利用者(分析担当者・ビジネスの責任者)とともにデータガバナンスを実装し、PDCAサイクルをまわし、変更管理をしていく中で、インフラを実装するアプローチをとるべきと考えます。

「データガバナンス体制」

常に新たなデータが生み出され、利用者の要求が変化し続ける状況の中で、最適に対応するために、データガバナンスに基づいたデータプラットフォームの運用が求められます。データのオーナーシップ、データ品質の担保など、全社的に組織で対応できるようなデータガバナンス体制の設計が必要です。

人口知能/コグニティブで直面する新たなチャレンジであるデータガバナンスについて、簡単に紹介しました。これは、決して避けて通れない検討課題であり、これまで確固たる経験がない分野でもあることから、ハードルの高さを実感することと思います。すでに検討されている、これから検討しようとされている方々の何らかのヒントになれば幸いです。