データを「平均値」で見る人が量産される根本理由

日本政府も本腰「AI人材」育成

日本政府の「AI戦略 2019」(令和元年6⽉統合イノベーション戦略推進会議決定)によると、「我が国が、⼈⼝⽐ベースで、世界で最もAI時代に対応した⼈材の育成を⾏い、世界から⼈材を呼び込む国となること」を⽬標に掲げ、日本におけるAI推進のために、人材育成を重視すると明言しています。これをうけて、数理・データサイエンス・AI教育プログラム認定制度検討会議では「数理・データサイエンス・AI (リテラシーレベル)モデルカリキュラム 〜データ思考の涵養〜」を2020年4⽉に策定しています。

この提言の中では、文科系・理科系を問わず、すべての大学・高専生(年間約50万人卒業)に対して、「数理・データサイエンス・AI」のリテラシーレベルの教育を行うように提言しています。具体的な教育カリキュラム、教育方法、認定制度なども記載され、非常に実践的なものになっています。

日本政府としても、データサイエンスに関わる基礎知識が重要であり、大学・高専生が身につけるべき知識と考えるようになったのです。数理・データサイエンス・AIを「全ての学⽣が、今後の社会で活躍するにあたって学び⾝に付けるべき、新たな時代の教養教育と⾔うべきもの」とも言っています。

もちろん誰もがデータサイエンスに関する専門的な知識を持つことは不可能です。しかし、専門性のあるデータサイエンティストが分析した結果を理解する能力は求められます。必ずしも深い知識は必要ないのですが、データや数字というだけで苦手意識をもつ人が多いようです。

例えば、ビジネス上の判断で、ある商品の売上実績をみて、さらに生産を拡大すべきかどうかを考える場合を想定しましょう。全国平均の売上は順調に増加しているというだけで判断をしがちですが、エリア別のバラツキなどを考慮することが必要です。

全国平均の売上が増加しているのは首都圏という1つのエリアが売上を大幅に伸ばしているだけであって、他のエリアでは減少しているといったことも考えられます。数学的な表現を使えば「平均値は増加しているが、エリア別の偏差が大きく、中央値は減少している」といえるかもしれません。

データの特徴量を表す指標は平均値だけではなく、標準偏差、中央値、最頻値、誤差、信頼区間など、様々な要素があります。これらの指標を使い分けながらデータの特徴を議論すべきなのですが、このような表現をすることで理解できない(理解しようとしない)人が多いのです。結果として、平均が増加しているというデータだけをみて判断をしてしまう人が多くいます。

「文理別」教育の弊害

この背景にあるのは数学などの理科系の基礎知識を持っていない人が多いことがあげられます。

当然、理系の学部を卒業していればよいというわけではありません。しかし、日本の教育制度の実態を考えると、高校の早い段階から、理系か文系かを選び、大学受験の準備をすることが多いのです。受験科目以外を学ぶ時間は最低限にし、より効率的に受験勉強に励むことを優先しがちです。その結果として、高校卒業の時点で数学の知識を忘れている人も多いのではないでしょうか。

つまり、社会に出る前に理系科目の教育をしっかりと受けている人が少ないことが問題なのです。それが、日本全体でデータサイエンスの思考を遅らせている要因になっていると言えます。データサイエンスの高次元の教育体系が整備されていないこととともに、基礎的な裾野の理解を促進する学習の機会も不足しています。

社会人になった時には、「読み・書き・そろばん」と同じようにデータサイエンスに関する基礎教育を受けていることが当たり前になった時代がこようとしています。裾野が拡大するという意味では、理系人材の不足問題は解決されるかもしれません。

大学におけるデータサイエンス教育は、まだ始まったばかりですが、少しずつ変化の兆しが見え始めています。特に大学生の「意識」が変わってきています。

一般社団法人データサイエンティスト協会のアンケート調査をみると、大学生のデータサイエンティストという職種の認知率は30%でした。他の職種と比較した結果をみると、システムエンジニアの認知率(59%)と比較すると低い水準ではありますが、マーケターの認知率(33%)と比べて大きな差はありません。データサイエンティストは新しい職種ですが、大学生には浸透しつつあると言えるでしょう。

所属学部別の傾向をみると興味深い結果になっています。情報学部などの関連する学部での認知が高くはなっていますが、教育学部や法学部などの文科系においてもデータサイエンティストの認知率は高くなっています。データサイエンティストは理科系の限られた学部にだけ知られている職種ではなく、広く開かれた職種になりつつあると言えるでしょう。

 

データサイエンティストの将来性は?

このアンケート調査では、大学生がデータサイエンティストに将来性を感じる割合も調査しており19%という割合でした。これはシステムエンジニアに将来性を感じる割合と同水準であり、現役データサイエンティストだけではなく、大学生もデータサイエンティストに将来を感じていると言えます。

これから大学を卒業して、企業に就職する大学生の中には、データサイエンスに関する専門的な教育を受けた人も増えてきます。大学を卒業した時点で、データサイエンスでビジネスを変える素養を持った人たちが就職してくるのです。また、一般教養として、データサイエンスの教育を受けた人も増え、データサイエンス人材の底上げも行われるでしょう。これらのデータサイエンス人材を有効活用できるか否かは、受け皿である企業次第ともいえます。