「データサイエンティストは社内にいるものの、データを完全に活用できているとは言えない」という企業や、「データサイエンティストとのコミュニケーションがうまくいかない」という企業は少なくないではないでしょうか。
「データサイエンティストを活かすことができない」ということには、明確な理由があります。
今回は「データサイエンティストを活かせないワケ」として5つのポイントを挙げたいと思います。
なお、タイトルには「データサイエンティスト」書いていますが、 「データ分析の専門家」という意味では、「 データアナリスト」といった職種も含みます。
人材不足
「データサイエンティストが足りない」ということはメディアや書籍等でも散々言われていることですし、それは日本に限らず世界的にも同様な状況と言えます。
GAFAのような先進的なIT企業でさえ人材確保に苦労している状況の中では、事業会社がデータサイエンティストを確保することはさらに難しくなります。(「日本人」ということに限るとさらに少なくなる)
「データサイエンティスト」と一言で言っても様々なタイプがありますが、データサイエンスに必要な要素と言われている、
・ビジネス(ビジネス課題の設定や解決力)
・エンジニアリング(データハンドリングやプログラミング)
・サイエンス(数学、統計学、情報科学)
という3つの能力をすべて兼ね備えているような人は、ほぼいないと思ってよいでしょう。
そうした中では、自社の課題やどのような分析がしたいかによって、ビジネスに強いタイプか、エンジニアリングに強いタイプか、サイエンスに強いタイプか、ということを決めて、データサイエンティストを採用あるいは育成するということが求められます。
様々なデータが増えるにつれて、ビジネスサイドからは「こんな分析はできないか、あんな分析はできないか」という要望が次々と降ってきます。
一方で、データを扱える人間というのは急に増やすことはできません。
すでにデータ分析にある程度取り組んでいる企業であっても、データ分析を専門的に担当する人間は1人あるいは2人しかいない、ということも珍しくないでしょう。
特に、経営層がデータ分析に関わる加工や集計といったことに詳しくない場合は、無理難題を押し付けてしまうケースが多くなります。
一般の社員もある程度のデータリテラシー、分析力を身に着けない限り、「人手不足」を解消することは難しいというのが現状です。
業務知識が分析に活かされない
多くの場合、データサイエンティストといったようなデータ分析の専門家は、ビジネスに関する経験、知識を持っていません。
そうした中で、ビジネスサイドがデータサイエンティストに分析を「丸投げ」してしまうと、ビジネス課題の定義やそれに沿った分析結果を出すということが難しくなります。
したがって、中途半端な分析結果になってしまったり、ビジネスサイドからすると「当たり前」の結果や、次のアクションに結びつかない結果が出てしまうということが起きます。
これは、データ分析の専門家が「どれほどビジネスに興味関心があるか」ということにも左右されますが、基本的にはそうした専門家は「ビジネスにはあまり興味がない」という前提で接したほうがよいでしょう。
それを踏まえると、ビジネス担当者はデータサイエンティストに、
・なぜその分析が必要なのか
・分析が必要となる背景
・分析のために必要な業務知識
・出してほしい成果物(指標、グラフ、見せ方など)
といったことを明確に伝える必要があります。
これは下で解説する「分析業務の非効率」や「意思疎通の壁」といったことにも通じてきますが、ビジネス担当者とデータ分析者で上記のような項目を事前にしっかりとすり合わせをしておかないと、分析が終わった後に、「これを追加してほしい」「これが足りない」「これは意味が分からない」といったことになってしまい、余計な工数が発生してしまう原因になります。
分析業務の非効率
データ分析業務というものは、日々のビジネスで発生する課題や問題への質問に対して回答していくというプロセスになります。
さらに多くの場合は、一度出された分析結果から、さらに別の問題点が発見されたり、仮説が導き出されたりということが起こります。
こうしたプロセスを何度も繰り返すことによって真相に迫っていくわけですが、こうしたプロセスをデータ分析者だけに任せていては、このプロセスが上手くいかないばかりか、最初の質問を解決するまでに数日、数週間という時間がかかってしまいます。
自社のデータを扱うのであればある程度は融通が利くかもしれませんが、他社から預かっているデータや、他社のデータソースに接続してデータ分析を実施したいような場合は、「欲しいデータが欲しいときに揃わない」といったことがよく起こります。
経営層やビジネス担当者がそうした「データの流れ」を明確に理解していればよいですが、理解できていない場合は、余裕のないデータ分析スケジュールになり、データ分析者にかなりの負担がかかります。
データ分析者が行うデータ分析プロセスそのものを効率よく実施するということも大切ですが、データ分析者だけの力で業務プロセスを改善するということには限界があります。
対象となるビジネスの市場環境やお金の流れ、顧客などを理解します。
対象となるビジネスの課題や、問題点を洗い出し整理します。
課題、問題に沿ったKPIの策定や分析手法、アウトプットを決めます。
分析のために必要なデータを集め、適切に管理・保管します。
分析できる形にデータを加工します。
データを集計、分析し、必要に応じてグラフ等で可視化します。
図:データ分析のプロセス
データ分析者だけではなく、経営層やビジネス担当者も「データ分析のプロセス」というものをしっかりと意識してデータ活用の議論を進めていくことが非常に大切です。
意思疎通の壁
ビジネスサイドは、「データサイエンティストが出してきた分析結果がよく分からない」と言い、データ分析者は「ビジネスサイドがどのような結果が欲しいのかよく分からない」と言います。
これが、データ分析あるいはデータサイエンスをビジネスに活かすことができない大きな壁となっています。
こうした「コミュニケーションの壁」ができてしまう原因は、上記で解説した「業務知識」に関することと、統計学や分析手法といった「分析技術」に関することが影響します。
データ分析者に「業務知識」がなければ、ビジネスの課題解決や仮説検証にどのようなデータを揃えて分析し、適切なアウトプットを出せばよいのかが分かりませんし、ビジネスサイドに「データを読む力」がなければ、データが表している意味やその背後に存在する背景といったことを認識、判断し意思決定に役立たせることができません。
分析のアルゴリズムによる精度があまり良くなかったとしても、それは手法やプログラミングの問題ではなく、そもそも扱ったデータの質が悪い、ということをビジネスサイドが理解できれば、「データサイエンスは使えない」という結論にはなりませんが、現実にはデータサイエンティストとのコミュニケーションがうまく行かず、「データ」という意味でも「人材」という意味でも「宝の持ち腐れ」になっていることは少なくないでしょう。
データ分析やデータサイエンスというものは、「ものごとを分解して突き詰める」という性質を持っていることから、非常にロジカルな頭の使い方が求められる業務になります。
あくまで私の経験上ですが、上記の「データ分析の特性上」、データ分析の専門家はどちらかというと拘りが強く、物事をはっきりさせたがる性格の人が多いです。
したがって、データ分析者が自分なりの分析の切り口や手法、見せ方に拘ってしまって、ビジネスサイドがついていけない、望んだ結果が出てこない、ということもあります。
「研究」的な色合いが強いデータサイエンスであればそれも強みになりますが、市場環境の変化や様々な利害関係者の意向が複雑に絡み合う「ビジネスデータサイエンス」においては、「ビジネス力」「エンジニアリング力」「サイエンス力」という3つの要素に加えて、「柔軟なマインド」といった人間性も非常に大切になるかもしれません。
データサイエンティスト活用の困難
データの活用にあまり慣れていない企業の場合は、データにまつわるちょっとしたことにおいても、「データ」という名称がつく職種の人に依存しがちになります。
データアナリストやデータサイエンティストといった人材は、大学や大学院で教育したからといってすぐにビジネスに使えるようになるものではなく、ビジネスへの理解やIT全般の知識、社内政治、時代の流れといった多くのことを知り、経験する必要があります。
ただでさえ希少価値の高いそうした人材を、本来任せるべき業務に集中させることができていない、ということは非常にロスを生みます。
例えば、
・簡単な分析ツールの使い方をなんでもデータサイエンティストに聞く
・ビジネス担当者が見やすいようにデータの見せ方やレポート、スライド作成に多くの時間を割く
といったことです。
データアナリストやデータサイエンティストは、レポートやスライドを作ることは得意ではありませんし、そこに時間を使わせるのは非常にもったいないと言わざるを得ません。
もちろん、そうしたデータ分析者とビジネス担当者が、「データの見せ方」について一緒に議論するということは大切ですが、最終的にどのようなアウトプットにするかを決めるのは、あくまでもビジネス担当者でなくてはなりません。
データ分析者が足りない現場では、データの管理から、データ加工、分析、可視化というところまですべて一人の人間に任せている場合がありますが、分析するための「データ加工」は、「データ分析のプロセスの中で8割の工数や時間を占める」と言われています。
「データ加工」には主にSQLというデータベース言語を使用したり、専門のツールを使用したりする場合がありますが、ローデータを加工するとなると、どうしてもSQLを書かざるを得なくなります。
アドホック的な分析であるほどSQLの使いまわしができなくなるため、加工に時間、工数がかかります。
「データサイエンティストがSQLを書く必要があるか」ということは置いておいて、自社にSQLを書ける人間が「データサイエンティスト」しかいないのであれば、そこに業務を集中させることが必要です。
データの可視化やレポートの作成といったことは「データサイエンティスト」ではなくてもできます。
「データサイエンティストにはデータサイエンティストにしかできない仕事」に集中させましょう。
まとめ
今回は、「データサイエンティストを活かせない5つのワケ」として、
①人材不足
②業務知識不足
③分析業務の効率性
④コミュニケーション
⑤人材活用
という5つのキーワードで解説を致しました。
「データ分析の専門家が足りない」というのは、今すぐに解決することが難しい課題です。
しかし、業務知識の共有や、社内のデータリテラシー向上、データサイエンティストではなくてもできる仕事を別の社員に任せるといったことは、いますぐにでもできます。
こうした「当たり前のことを当たり前にできていない」ということが「データ分析をビジネスに活かせない企業」であるとも言えます。
まずは、すぐに手をつけられる部分から始めて、データサイエンティストの潜在能力をフルパワーに発揮してもらえるようにしていきませんか?