1. トップページ
  2. DXコラム
  3. 【コラム】データサイエンティストの心得「データ活用の限界3選」

【コラム】データサイエンティストの心得その3:
「データ活用の限界3選」


本コラムは、データサイエンティスト・神山が全4回シリーズで
データ活用の面白さと難しさを語ります。
データサイエンティストのこぼれ話としてお楽しみいただければ幸いです。


私は子どもの時、いわゆる"スポ根"のマンガやアニメが好きでよく見ていました。
主人公が戦う相手の中には、データを重視して、主人公の特徴を的確に把握して、
弱点を攻め、主人公を苦しめるキャラクターやチームが登場します。

最初は、データで戦う力を見せつけ主人公を圧倒するのですが、次第に劣勢になり、
最終的には主人公に負ける、これがよくあるパターンです。データサイエンティストと
しては、この手のストーリーを見ると複雑な気持ちになります。

現実世界ではどうでしょうか?
近年は、データ活用がビジネスにも浸透しはじめています。データ活用は、どんな
問題も解決する"万能の薬"となるのでしょうか。私は、データ活用は素晴らしい効果が
あるが、使い方次第では毒にもなると考えております。今回は、データ活用の限界、
注意するポイントを自分なりに3点まとめてみます。

(1)データから分かるのはあくまでも"傾向"
例えば、「ストレスの高い人は、退職しやすい」という結果が得られたとします。
しかし、データから分かるのはあくまでも傾向です。ストレスが高くても、ストレスと
うまく付き合って高いパフォーマンスを発揮し、退職は全く考えていない人もいるで
しょう。逆にストレスは低くても、仕事にやりがいが感じられなくて退職する人もいます。
もちろん傾向をつかむことは大事ですが、それが全てではありません。

(2)因果関係を結論づけるのは難しい
データ分析では、データの項目同士で相関関係を調べることがよくあります。例えば、
「残業時間の長さとストレスは相関関係がある」という結果が得られたとします。「残
業時間が長いからストレスが高くなる」というように、因果関係を結論づけるのは、
論理的にも納得です。しかし、「ストレスが高いから仕事を効率的にできなくなって、
残業時間が長くなる」という可能性もあります。
データから見える相関関係だけでは、因果関係を結論づけるのは意外に難しいの
です。
※残業時間の長さは問題にならないという意味ではないのでご注意を!

(3)データの解釈には人間のバイアスが影響する
ニュースを見ると、凶悪犯罪がよく取り上げられています。「怖い世の中になったな」
と、感じる人が多いのではないでしょうか。実際に、令和元年の刑法犯犯罪認知
件数は約75万件というデータがあります。このデータだけを見ると、「世の中が
どんどん危険になっている」と思う人もいるでしょう。しかし、刑法犯犯罪認知
件数は平成14年をピークに右肩下がりに減っている(※)のです。

(※)出所:公共社団法人日本防犯設備協会「刑法犯犯罪認知件数と検挙率」
https://www.ssaj.or.jp/pubdoc/graph.html

データの数字そのものは嘘をつきませんが、解釈は人間のバイアスが影響するため
嘘になりうるのです。

このように、データから何らかの事実が分かっても、使い方を間違えると、誤った
結論や効果のないデータ活用につながりかねません。データ活用の良い部分だけ
ではなく、悪い部分や限界も理解して、有効活用したいですね。


※本記事は2021年08月18日現在の情報です。

お問合せ

まずはお電話かメールにてお気軽にご相談ください

お電話でのお問合せ

03-5577-3203

PAGE TOP