エンジニアからみたデータ活用

エンジニアからみたデータ活用

2022年3月24日に開催したCTOmeetupのテーマは、「エンジニアから見たデータ活用」です。多くの企業では現在データドリブン経営が当たり前になってきていますが、膨大なデータを適切に処理し、最適な活用を行うのは容易ではありません。
実際にエンジニア組織ではどんな成功・失敗事例があり、どんなポイントを押さえながらデータ活用を推進しようとしているのでしょうか。元グロービスの宮島さんとDashcomb代表取締役CEOの小野さん(愛称:トニーさん)をお招きして、エンジニアから見たデータ活用についてディスカッションしていただきました!

<パネラー>
●小野 邦智氏

<モデレータ>
●宮島 弘行氏

データ活用事例

データ組織が持つ代表的な4つの機能の定義とは

宮島:今回は事例をお話しする前に、一般論としてのデータ活用について私からご説明したいと思います。そもそもデータ組織には、大きく分けると2つの役割があります。一つがビジネス貢献、もう一つがデータ活用の土台です。

データ組織の代表的な4つの機能

宮島:ビジネス貢献はさらに2つに分かれます。一つが意思決定の支援で、これはデータ分析やAIを用いてビジネス上の意思決定の精度を高めていく機能を指します。データの民主化やKPIのダッシュボード開発が具体的な業務ですね。ファクトベース、あるいはAIの予測によって意思決定の精度を高めていきます。
ビジネス貢献のもう一つの要素が、プロダクト開発です。これはAIを用いた機能開発をしてITプロダクトに組み込み、ビジネスKPIやUXを向上させることが該当します。具体的な例としてわかりやすいのが、レコメンド機能の開発です。

意思決定支援のゴールは人を動かすこと。プロダクト開発のゴールはシステムを作ることです。どちらもAIやデータを用いていますが、出口が違うのが最も大きな違いでしょう。
データ組織のもう一つの機能であるデータ活用の土台の分類と定義、業務内容は、上記に記載の通りです。本日は特にビジネス貢献における意思決定支援とプロダクト開発の2点についてディスカッションできればと思います。

データを基にPDCAを回した結果、アプリ開発の中止を決断

宮島:それでは早速、意思決定支援についてトニーさんからお話を伺っていきます。トニーさんはCTOやCEOの立場で経営レベルの意思決定を行う経験がおありかと思いますが、そのあたりのデータ活用について教えていただいていいですか?

小野:私がC ChannelでCTOを務めていたとき、経営陣の大きな決断にデータは必要不可欠だと感じました。会社全体の大きな決断――例えば事業を続ける・やめるという一瞬の決断の前段階には、サービスに関する細かいデータの分析と仮説、説明があるからです。一連の議論を重ねた上でシンプルな回答を導き出すということですね。こういった話は、宮島さんもご経験があるのではないでしょうか。

宮島:意思決定においては定性・定量の両面が必要ですね。当然定量という意味ではデータ分析が活きてくるので、経営でも現場でも、データ活用を行うのは当然のことです。経営レベルでいえば財務やファイナンスもデータ活用に該当しますね。

小野:実際にC Channel時代は、一つひとつのKPIの数字をデータとして取得し、エクセルにまとめていました。それらのデータを基に、アプリ開発を中止した事例があります。最も大きな判断基準だったのは、APIの活用率です。例えばウィークリーやマンスリーでリテンションレートを見ていった結果、ダウントレンドが見え始めていました。何ヶ月か数値が横ばいの時期もあったので、数字が上がるのか下がるのかを毎日見ることで徐々にトレンドを察知し、最終的にはアプリを停止する決断をしたわけです。
もちろん役員の中では半年以上前から各種施策のためのデータ収集や失敗時のデータ分析も行われていて、停止以前からPDCAはぐるぐると回していました。

宮島:PDCAを回すときに、データはすごく活きてきますよね。

レコメンドエンジンを自作するも教師データの不足が原因で失敗

宮島:では、AIや機械学習をプロダクトに用いて成功、あるいは失敗した事例はありますか?

小野:成功よりも失敗した事例のほうが印象深いです。C Channelでレコメンドエンジンを自作した例があるのですが、実は安易にレコメンドエンジンを作ろうとすると、失敗する確率が非常に高いんですよね。
我々の場合は完全にモデルからエンジンを自作。自分たちが持っているログや行動データを入れて関係値を算出して、レコメンドしていこうとしました。しかし、我々はユーザーのペルソナを上手くデータ化できず、レコメンドの精度が非常に悪くなってしまったのです。
振り返りをした結果、自社には教師データもレコメンデーションユーザーの情報も足りていなかったことがわかりました。これは教訓として心に残っています。

宮島:レコメンドはAIプロダクトの典型例ですが、実際にやってみると意外と正解データが足りない状況に陥りがちです。どんなユーザーが何を出したときにどれを見るのかといったデータが取れていないと、なかなか作りにくかったりしますよね。

小野:一度アウトプットしたレコメンド結果を再びレコメンドエンジンの中にフィードバックするのもありなのですが、そこも足りていませんでした。というのも、普段蓄積しているデータの中にノイズがあったんです。データはきちんとクレンジングをしてアルゴリズムの中入れるのが重要なのですが、そうしたデータを用意できないとデータ活用は難しくなります。

宮島:AI開発の9割は、準備データの前処理だと言われますからね。集めてきたデータが正しいのかを確認し、そのデータを綺麗な形に整えていくには膨大な時間がかかります。実際にモデルを作る時間は、それに比べたら少ないのが実態です。

教師データ不要のレコメンドエンジンで送客数を2倍にできた

宮島:私からは、成功事例を一つ紹介したいと思います。私がグロービスに努めていたときに、同じくレコメンドエンジンを開発したことがありました。レコメンドというのは行動履歴をもとにする方法と、アイテム自体の情報を利用する方法(コンテンツベース)の2種類があり、私が手掛けたのは後者のパターンです。
グロービスはオンライン動画サービスやオウンドメディアを展開しており、両者の相互送客を重視していました。特にオウンドメディアの記事から動画サービスに誘導し、有料会員数を増やす部分ですね。ここはもともと記事のカテゴリと同じカテゴリの動画をランダムで出すロジックになっていたのですが、より関連性の高いコンテンツを紐付けるために、アイテムの類似度を計算するアプローチに変更しました。
細かい説明は省きますが、このアプローチの利点は教師データが不要なところです。記事の内容と動画の説明情報から、テキストの類似度を計算するからです。結果として送客数は2倍になり、ビジネス的なインパクトが一定生まれました。
成功のポイントは、繰り返しになりますが教師データ不要でクイックに開発できた点。もう一つは、すでにサービスに組み込まれているルールベースのロジックにテコ入れをした点です。AIプロダクトの成功率は日本では低いと言われますが、やり方さえ精査すれば、成功率は上げられます。

小野:素晴らしいですね。我々が似たようなアプローチにトライしようとしたときは動画データの文字起こしが必要だったので、そこで挫折してしまって。メンバー間では、「もう少しチームにリソースがあれば、いろいろと試せたのではないか」と何度も振り返りました。

宮島:今ならGCPなど汎用的なAIソリューションを使って動画の文字起こしが可能ですから、典型的なAIに関わるタスクは、外部のクラウドサービスを使うのも良いですよね。

小野:時代はますます進化しているので、まずはそういう情報をキャッチアップして知っておくのも重要ですね。

データ組織について

データ組織に必要なデータ人材と組織の型に応じた職種の内訳

宮島:続いてのテーマは、データ組織です。そもそもデータ人材にはどのようなタイプがいるのかというところから、一般論をお話しさせていただければと思います。いわゆるデータ人材の定義を語るときに外せないのが、データ人材に必要な3つのスキルです。

3タイプのデータ人材

宮島:これはデータサイエンティスト協会が提唱しているものです。データサイエンス力、データエンジニアリング力、ビジネス力のうち、データ人材にどれを求めるのかが非常に重要になります。
もちろんこれら3つのスキルを高いレベルで備えているのが理想ですが、そんな人材はまれです。よくある考え方としては、このうち2つ兼ね備えている人を探すことになるでしょう。データサイエンス力とデータエンジニアリング力を兼ね備えている人がエンジニア系、データサイエンス力とビジネス力を兼ね備えている人がアナリスト系、どの能力も幅広く持ち合わせている人がジェネラリスト系と定義されています。
これら3つのタイプは職種として、以下の通りに細分化できます。

出典:データサイエンティスト協会

データ系職種定義と担当業務

人材の確保よりも組織にデータリテラシーを啓蒙するのが先決

宮島:ではここからはトニーさんから、ベンチャー企業におけるデータ組織作りのご経験や工夫した点、困った点などについてお話しいただければと思います。

小野:私が経験したのは、ほとんど立ち上げ期に近い組織ですね。リソースやスキル不足という現実的な問題が目の前にあり、誰がデータ活用を行うのか、常に悩んでいた時期があります。フロントやバックエンエンジニアはデータに詳しいわけではありませんから、まずは社内で共通の土台を作らなければいけないと考えました。例えば、「データはクレンジングしなければならない」とメンバーに話したら、「クレンジングってなんですか?」と言われ、明らかに土台の部分からズレていると感じた瞬間もありましたからね。
現実のスタートアップ組織はメンバーのスキルも認識もバラバラですから、土台作りにあたってはデータ活用に関する基本的なコンセプトをクリアにして、社内で勉強できるような資料を共有しておかなければなりません。組織の透明性も重要です。仕事のどの部分にどんな課題があり、何の目的でデータ活用を行うのか、そのためにどんなデータ分析が必要なのかを逐一説明しました。
社内メンバー全員がデータに詳しい状態を作れれば理想的ですが、それは一旦忘れて、現実を見ながら土台を作るのがスタートアップでは大切です。

宮島:おっしゃる通りですね。今のお話は、「データリテラシー」という言葉に集約されるかと思います。データリテラシーの中にAIリテラシーも入っています。データリテラシーを高めていくのは、データ活用の初期においてはかなり重要なポイントになるでしょう。
実際に私もグロービスでデータ組織を立ち上げたときは、勉強会という形での啓蒙活動を行いました。そうでないと、データ分析やAIでどんなことができるかが社内に浸透せず、そもそも部署に相談がこなかったり、逆に期待値が過剰になってしまったりするからです。技術的な部分はなるべく削ぎ落として、データ分析やAIの本質をビジネスサイド向けに説明し、前提を揃えていきましたね。

ゼロからデータ組織を立ち上げるならフリーランスの活用がおすすめ

小野:宮島さんがいたような大企業の場合だと、やはりデータリテラシーが高い人材を厳格に採用していくんですか?

宮島:意外とそうでもありません。大手といっても立ち上げ期は社内にデータ人材が不在なケースが多いので、そもそも採用の観点からするとデータ人材から認知してもらえず、採用には苦戦します。リードタイムに半年~1年ほどかかることもざらでした。
私はよく「ゼロからデータ組織を作るにはどうしたらいいですか」と相談を受けますが、最初はフリーランスを使いながら最小構成で組織を立ち上げるのをおすすめしています。その後じっくり時間をかけて正社員採用に取り組み、プロパーの比率を高めていく手法が最も成功確率が高いと考えているからです。
フリーランスの方がジョインしてプロジェクトが進み、実際にダッシュボードやプロダクトが完成して成果が出れば、「データ活用でこういうことができるんだ」という実感が得られます。組織にデータ活用を行う空気感を醸成できて、プロジェクトを推進しやすくなるのです。やはりクイックに組織を立ち上げて、その後内製化していくのが一番いいですね。

小野:むしろそれが唯一の成功方法ではないかと思いますね。フリーランスの人を採用したら、プロパーのメンバーにどのように知識やノウハウ、リテラシーを啓蒙していくのでしょうか?

宮島:一定期間一緒に仕事をするので、当然引き継ぎで業務内容は教えてもらいます。とはいえ教材になるようなレベルで資料化や言語化をしてもらうのは難しいので、例えば開発してもらったシステムやデータ基盤などに対して「なぜその設計にしたのか」を聞いて、プロパーの方に伝えることがありますね。「なぜそうしたのか」には、ノウハウが隠れているんです。

質疑応答

個人情報保護に関しては専門家のアドバイスが必須

質問者:GDPRや個人情報保護法の対応は外部の専門家に任せていますか?

宮島:もちろん外部の方の意見を伺う必要があります。特に法律の部分は個人情報や情報セキュリティに強い弁護士からアドバイスをもらわなければいけませんね。一方で意思決定は社内で行いますから、啓蒙活動の中に個人情報に関する部分も含まれてくるかと思います。

小野:特にGDPRについては専門家を雇うべきですね。国によっては法律の解釈が異なるケースがありますから。

宮島:自社サービスがヨーロッパに展開する可能性が少しでもあるのなら、最初からGDPRは想定しておいたほうがいいですね。

データのポテンシャルが高く、裁量のある環境はデータ人材にとって魅力的

質問者:フリーランスのデータエンジニアやデータサイエンティストの方々が働きたいと思う仕事内容や職場環境は、どのようなものでしょうか?

宮島:どのデータ人材にも共通しているのが、扱えるデータそのものが魅力かどうかですね。その企業でしか取り扱えないようなデータがあるなら、大きな魅力になると思います。該当データを使って、大きなビジネス価値が作れるかどうかも重要です。データ分析を料理と考えるなら、素材が良ければ調理のしがいがあるということです。
またシニアレベルの方であれば、裁量の大きさは求められるでしょう。技術選定を自由に行えるような環境は、データ人材に刺さります。

小野:シニアの方にとっては完全に売り手市場ですから、自社サービスの魅力や裁量のポイントを伝えるのは大事ですね。
また10社も20社も列を成している状態なので、フリーランスのエンジニアの方々は一緒に働く組織からリスペクトを感じられないとすぐに辞めてしまい、二度と自社には戻ってきてくれません。そういう失敗例もあります。

宮島:そこは案外重要ですよね。あとはフリーランスの方に対して「外部の人だから」と壁を作ってしまう企業もあれば、プロパーと変わらずに受け入れる企業もありますが、シニアのエンジニアであればどちらかというと後者の企業が働きやすいと感じるでしょう。

FLEXYとはABOUT FLEXY

『FLEXY』はエンジニア・デザイナー・CTO・技術顧問を中心に
週1~5日のさまざまな案件を紹介するサービスです