データサイエンティスト育成講師が語るデータサイエンティストとは?定義や求められるスキル、企業のニーズを考察

株式会社D4cアカデミー取締役社長の和田陽一郎と申します。私は10年以上のデータサイエンティストとして活動を続けてきました。現在は講師としてデータサイエンティストの育成に励んでいます。

データサイエンティストという言葉には定義が無いため、「実際のところどういう職種なのか」が明確にイメージできないという方も多いでしょう。

本記事では、長年データサイエンティストとして働いてきた立場として考えるデータサイエンティストの定義をはじめ、仕事内容、求められるスキル、企業のニーズ、さらには今後の動向まで、データサイエンティストに関するよくある疑問について解説していきます。

データサイエンティストとは?

データから課題解決の知見を見出すのが「データサイエンティスト」

データサイエンティストのことを、私は「データから知見を見出し、ビジネスに貢献する人」と定義しています。

仕事内容は平たく言えば「課題解決をするための知見をデータから抽出する」という作業の一連、またはその一部です。

単純にデータ分析の精度が求められるもの、データ分析の結果から施策を導くもの、データ分析の結果を利用してシステム開発に落とし込むものなど、アウトプットの形はさまざまです。

データサイエンスのベースは「データ」と「課題」

さて、世の中には「データサイエンスを用いれば素晴らしい成果物が生まれ、ビジネスが上手くいく」と語る人がいます。こういったイメージはデータサイエンスを売り込む口上としては間違ってはいませんが、実際のデータサイエンスの実務としては若干矛盾があります。

例えば企業のデータを分析した結果、「社員がお弁当を手作りすると社内環境が良くなる」という知見を導き出したとしましょう。一見すると良い発見に思えますが、そもそも社員の誰も社内環境を良くしたいと思っていなければ全く意味が無いものになってしまいます。

大切なのは、「データ」に加えて「課題」が存在することです。何か問題があって初めて、解決のために利用できそうなデータがあるかどうかを模索できるのです。

企業が商品の売上が伸びないという問題を抱えていたとしたらどうでしょう。データから優良顧客を見つければ、効率よく販売を伸ばすことが可能です。このように、もやもやとした問題をデータサイエンスによって解決できる課題として落とし込み、具体的にデータによる解決方法を模索することがデータサイエンスそのものです。

データサイエンスの事例

もう少し具体的にデータサイエンスの事例についてご紹介しましょう。

最近の事例ですが、例えば工場でものづくりをしている企業が、どのような状態の材料なら高品質の製品が作れるのかという課題を抱えていたのでお手伝いさせていただきました。材料の品質はその日の気温や湿度によって差異が出るのすが、その変動要素は100を超えるので、人間の直感では課題解決できない分野だったからです。そこでデータをお預かりして、品質が良いモノになる要因を探りました。結論としては材料に含まれるある成分の含有量(企業秘密)だったことと明らかにしました。数多くの変動要素があるなかで、全ての要素を管理するためには莫大なコストがかかります。しかし、とりあえずこの成分の量だけを厳密にコントロールをすれば良いことがわかったのです。すなわち、低コストで、製品の高品質化に貢献できました。

また、教育分野での活用もあります。プログラミング教室で受講生の方たちのプログラムの実行ログを用いて、どういう風にプログラムを組んだ受講生が早く課題を完成させられるのかを調べました。プログラミングをやったことがある人なら直感的に「試行錯誤が早く、失敗してもとにかくプログラムを走らせる受講生のほうが、考え込んで手を動かさない受講生より早いだろう」と想像できると思います。実際に受講生の行動と課題解決までの早さの関係を分析したところ、その通りの結果になりました。当たり前のように思えますが、こういった事実もデータによって客観的に証明できます。今はさらに、どのような指導をしたら、どのような改善があり、結果として課題完成までの時間をどれだけ短縮できたかについて解析を進めています。

以上のように、データサイエンスというものはデータと課題があれば業界も職域も全く問わず活用できます。

データサイエンティストになるためには何が必要?

資格は不要。求められるのは3つのスキル

データサイエンティストになるために特別な資格は必要ありません。

要はデータから知見を抽出し、課題を解決できればいいのです。しかし、そういった観点でいえば、求められるスキルは明確に存在します。

よく言われるのが、「ビジネススキル」「分析スキル」「ITスキル」の3つです。

●ビジネススキル ビジネス上で何か問題が発生したときにその問題をデータサイエンスで解ける課題へと翻訳しなければいけないので、問題の意味を正しく掴むビジネスパーソンとしてのスキルが必要です。 ●分析スキル データを分析するためには当然分析スキル、すなわちデータサイエンスの知識も求められます。 ●ITスキル 課題を設定できたら実際にデータから知見を抽出していきますが、データといってもすぐさま使える形になっているわけではありません。企業内に蓄積されているデータがバラバラで整理されていなかったり、世の中にオープンデータのような形で点在しているものをかき集めなければいけないこともあります。 分析対象として使えるデータを作ることから始めなければいけないわけですが、excelで手作業というわけにはいきません。プログラムで自動化するなどITの力に頼ることになるので、エンジニアリングの能力が必須です。 いざデータが揃ったら、さらに統計処理などデータサイエンスの処理をするためのプログラミングをしなければいけません。データマネジメントとデータサイエンス、両方を行うためのITスキルが必要なのです。

3つのスキルを全て身につける必要があるのは、データサイエンティストが一人でプロジェクトをやりきる仕事だから……というわけではありません。実際にはチームを組んで取り組むことのほうが多いでしょう。

しかし、どれか一つのスキルだけに特化していて、ほかのことはわからない人同士がチームを組んでもなかなか上手くいきません。比較的エンジニアリングが得意、分析が得意といった傾向はあったとしても、データサイエンスに取り組むメンバーは3つの要素についてそれなりに知識を持った状態でなければいけないのです。

私は「一度、データサイエンスの導入に挑戦してみたのだが、うまくいかなくて…」といった企業の方に相談を持ち掛けられることがあります。よくよくお話を伺うと「プロジェクトに関わったメンバー(IT部門の方、外部からのデータサイエンティスト、ユーザー部門の方…等)同士、お互いに言っている事がわからなかった」といった状況であったことが多々ありました。

キャリアを振り返って自分に不足している能力を見極めよう

これからデータサイエンスを始めたい人が身につけるべきスキルは、その人の出発点によって変わります。

ITスキルがそれなりにあるなら、まずはデータサイエンスのことを学ぶ、ビジネスの現場に入ってビジネススキルを身につけるといった選択肢が考えられます。現在SEでビジネスのこともよくわかっているなら、データサイエンスに手をつけるべきです。現在大学生で分析やプログラミングの素養はあるけれどもビジネスのことはわからないということなら、ビジネスについて学ぶのがいいでしょう。

実際に多いのは、事業ドメインの知識を持った方がデータサイエンスとプログラミングスキルを身に付け、その事業領域のデータサイエンティストとして活躍するケースです。経営企画や専門職の方に多く、事業会社のデータ分析部門での活躍が期待できます。

もう一つは、すでにプログラミングを習得されているSEやプログラマーの方がフルスタックなデータサイエンティストになるケースです。システム開発会社のデータサイエンス部門や、データ分析専門の会社で働くことが想定されます。

企業におけるデータサイエンティストの需要と今後の動向

データサイエンティストを採用する企業は増加している

データサイエンスはあらゆる業界で活用できるということもあり、近年は事業会社が自社にデータサイエンティストを置くケースが増えてきました。専門の部署を新たに設置する企業も多いです。需要の高まりは感じられる一方、各社は「即戦力の経験者」を欲しがっているため、実際の需要と供給のバランスは悪い状況と言えるかもしれません。

不況の際にニーズが高まるのは規制産業、好況の際はマーケティング分野

データサイエンティストのニーズやトレンドは世の中の景気に左右される部分があります。特に比較的不景気な状況で活用シーンが多くなるのは、金融や製薬といったいわゆる規制産業です。民間の事業会社も含め、不況の際はリスクや費用を管理したいというニーズが高まるからかもしれません。

また、好況のときは、分野としては業種を問わずマーケティングなど市場を広げる方向性のご依頼が多くなります。好況のときは市場を広げて、売上高を獲りにいきたいのでしょう。

今後、コロナはデータサイエンスの領域にどう影響する?

アフターコロナは不況が到来すると言われていますが、実際に世の中がどういう方向に向かうかは不明確で、私にも正直なところわかりません。

例えば事業会社さんならば、アフターコロナの中でどう売上を作っていくのかという課題に対する需要があるでしょう。しかし一方で、分析をやっているような場合ではないからその費用は削ってしまおうと判断される可能性もゼロではないでしょう。

金融機関、例えば銀行さんの場合は分析よりも先に融資先を救って何とかこの状況を乗り切らなければいけませんし、ある程度状況が落ち着いたら今度は不良債権を出さないようにするために必要な支援を考えていくかもしれません。少なくとも、今すぐにコロナに由来するニーズが生まれない状況だと言えます。

全体としてのニーズがどうなるか不透明な状況ではありますが、いずれにせよデータサイエンスに必要なのはデータと課題です。どんな企業であっても、分析でなんとか課題を解決しなければならない必要性が出てくれば、仕事は自ずと増えてくると思います。

データサイエンスを面白がれるかどうかが適正判断のポイント

データサイエンティストの教育事業を手掛けていると、「データサイエンティストになると高収入かつ自由な働き方ができる」といったような、夢の職業だと思われることがあります。もちろん経験豊富なデータサイエンティストは一般的なエンジニアよりも高収入になるケースが多いのは間違いありません。

ですが、データサイエンティストの仕事の本質は企業の持つ課題を解決することです。一人で課題を決めてプログラムを書いて分析するのではなく、企業内外のさまざまな人との関わりや会話の中で課題を適切に見定め、多くの人を巻き込みながらプロジェクトを進めていかなければなりません。実際にデータサイエンティストになってみると、「案外普通の仕事と変わらない」ということがわかると思います。

では、データサイエンスがつまらない仕事なのかと言えばそうではありません。ビジネス上の課題を数理的なアプローチで解決できるというのはそれだけで非常に楽しいですし、課題解決が目的なので当然はっきりとした成果も生まれます。一歩前に進める達成感が最も大きなやりがいだと言えるでしょう。

人間の感情や主観から一歩離れた立場で数字を冷静に判断し、価値ある成果を出し続ける。そこに楽しさを見いだせる人こそ、データサイエンティストの適正があると思います。

株式会社D4cアカデミー取締役社長、株式会社データフォーシーズ執行役員 和田 陽一郎さん

東京工業大学大学院にて博士号を取得後、2008年株式会社データフォーシーズ入社。以後、10年以上に渡りデータサイエンティストとして活躍、マーケティングや金融の分野を中心に、多数のプロジェクトに参画。データ分析のみならず、システム開発やコンサルティングにも携わり、プロジェクトリーダーとして数々のプロジェクトを牽引。現在はデータサイエンスアカデミー学長としてデータサイエンティストの育成に注力しながら、北海道大学理学研究院客員教授、九州大学大学院システム情報科学研究院客員准教授を務めている。

FLEXYとはABOUT FLEXY

『FLEXY』はエンジニア・デザイナー・CTO・技術顧問を中心に
週1~5日のさまざまな案件を紹介するサービスです