今年初めに、ホワイトハウスはDJパティル博士を初代のチーフ・データサイエンティスト(Chief Data Scientist)に指名したと発表しました。米国では「価値をもたらすデータ力が高まっている」という主張を掲げて、ホワイトハウスのミーガン・スミスCTO(元グーグル)が、データ主導の決定を下すことが世の中で普及しておりそれは最先端のベンチャー企業や大手テクノロジー企業だけのことではないという考え方をさらに強調しています。

どの分野であれ、企業はそうした時流に乗り社内の専任「データサイエンティスト」となる人物を迎え入れています。LinkedInのジョナサン・ゴールドマンのような人物がこの新たな職種を切り拓いたのですが、ハーバード・ビジネス・レビュー誌はそうしたキャリアを「21世紀でもっともセクシーな仕事」だとさえ称しています。

それでは、最初のドットコムドメインが登録されデジタルデータの堰が切られてからほぼ30年経った今、なぜこうした動きが見受けられるのでしょうか?

企業が生み出すデータ量が急激に増えているのは、誰もが知る事実です。2012年時点で、2.5エクサバイト(25億ギガバイト)のデータ量が毎日生み出されており、その量はほぼ40ヶ月ごとに倍増しています。データ量は増える一方であり、データが生み出されるスピードはさらに加速化していると言えるかもしれません。

それと同時に、このようなデータ急増は増え続けるデータを解明するために求められるツールとスキルが、単に開発業者やマーケティングアナリストが持つツールキットのさらなるツールではなく、専門的な知識や技能になってきたということでもあるのです。

そこで、データサイエンティストの登場です。

データサイエンティストは必要か?

慌てて初のデータサイエンティストを雇う求人広告を明日にも掲載する前に、そもそもデータサイエンティストが必要なのかを社内チームと話し合ってください。

カギとなる問題は三つあります:

  • 大量の既存顧客データ分析に代わるものとして、将来に関する複雑な予測モデルを構築する必要性はあるのか?
  • 独自の複雑なデータインフラを管理する対応力と意欲はあるのか?
  • 貴社データの大半は、ユーザーがウェブサイトやモバイルアプリを利用する際に生み出されているものか?(つまり、貴社ビジネスは主にオンラインベースであり、一度限りの接触ということではなくリピーターのユーザーが関わっているか?)

もし上記質問のうちいずれかの回答が「いいえ」なら、技術に詳しくない貴社のユーザーが日々使える適切な第三者分析プラットフォームを利用する方が良いでしょう。たとえ数多くのユーザーから毎月膨大なデータが生み出されているとしても、第三者ツールを利用すれば自前で所有する総コストよりもまだ安く上がり、貴社の(内部インフラをサポートしなくてもよい)エンジニアリングチームやサポートを受けるため社内チームに教えを請う必要がない営業、マーケティング、製品、オペレーション、カスタマーサクセス等の各チームがともに貴重な時間を費やす負担から解放されることが見込まれます。

それでも、データサイエンスチームを独自に立ち上げることを検討すべきケースが二つあります。それは、1)予測モデルを構築する必要があるか、2)貴社ビジネスの大部分がオフラインである場合です。どちらのケースにも該当し、さらに独自のデータインフラ構築をサポートすることが可能な場合には、データサイエンスチームの立ち上げを検討することが求められるでしょう。

データサイエンティストを雇用する際に注目すべき点とは?

そこで、貴社にとってそうした対応が優先事項だという場合、次に何をすべきなのでしょうか?

これは、新進企業の創設者とフォーチュン500企業CTOの双方からよく訊かれる質問です。アナリティクス分野とデータニーズはあまりにも急速に発展してきたため、貴社にとって最善の採用者が「データサイエンティスト」の職責を以前に務めていなかった場合や、マーケティングやオペレーションのような特定分野での分析業務に従事していたというケースは多々あることです。

個人的な経験と創業者からのフィードバックに基づいた場合、貴社にとって最初のデータサイエンティストを雇用する際に注目すべき点として私が見いだしたのは主に以下のポイントです:

  • まずインテリジェンスとイノベーションを重視せよ。 データサイエンスはまだ目新しい分野であるため、新しい手法にいち早く順応できる抜きん出た人材が必要です。あなたよりも頭が良く、あなたと一緒に大きなことを成し遂げられる人物を見つけ出すことも重要なことです。
  • 分析と統計の豊富な経歴がテーブルステークだ。 履歴書で注目すべき万能な経歴はありませんが、統計学を理解している分析に長けた人物を必ず雇用するようにしましょう。分析ツールやデータプラットフォームを使用した経験があり、求められる仕事での適性を確かめるため物理学やその類の学位を取得している人物を探してください。一部の調査ではこうした専門性を持った人材は今後の数年で不足する可能性があるとされているため、適性人材の発掘には今すぐ取り掛かりましょう。
  • テリトリーではなく、結果に集中せよ。 データサイエンティストとして他の点では素晴らしい候補者であっても、その中には賢明で強固なデータ番人の身に捉われて、技術に詳しくないユーザーにデータツールを託すことができる新しいツールやプロセスの採用を拒む者もいます。私が何回となく目の当たりにしてきた経験では、データサイエンティストが費やす時間はその90パーセントまでもが単に内部データソースのデータクリーンアップやデータスクラブに費やされています。これは、オートメーション化への投資が十分になされておらず、データサイエンティストが技術に詳しくないユーザーを過度に独自対応させることを懸念しているからです。しかるべき採用候補者とは、できるだけデータスクラブを排除し、技術力がないチームに日々の決定を下す適切なツールを委ね、貴社が直面する本当の意味で難を要する戦略的なデータサイエンス上の問題に自ら尽力するような人物です。
  • 社内から採用すべし。 結局のところ、貴社にとって必要なのはデータを解釈する上で貴社ビジネスを理解している人物です。常に選択肢というわけではありませんが、社内の人材を採用するのは貴社ビジネスを理解している候補者を確保するという意味では最善の方法の一つとなり得ます。とりわけ未開拓分野でデータサイエンスを実践することを目標としたオンラインルートの発展に伴い、貴社としては部外者を雇用するよりも時間をかけずに高度な潜在能力を秘めた高い分析力のあるチームメンバーをさらに向上させることもできるでしょう。

データサイエンティストとなるには?

あなたが求職する立場でデータサイエンティストになろうとしているのであれば、検討すべき点がいくつかあります。そこで、経験の浅い駆け出しのデータサイエンティストからそうした質問を受けた際に、私が助言している主なポイントを紹介します:

トレーニングを受ける。 これまでに統計やデータに関わった経歴がない場合でも、学業に戻って求められる勉強をする必要はありません。直接レッスンやウェブベースのトレーニングプログラムなど、利用可能なリソースには様々なものがあります。

コネを作る。  実際にこの職種で食べている人やあなたが知るべきことについて助言できる立場にある人を探して話をしましょう。そうした人物が周りにいない場合は、ネット上で対象者を検索して連絡し話をする機会を設けてください。そうした対応はあまりにも気がひけるという場合は、分析ツールを日常的に使っている人を見つけて彼らが日々取り組んでいることについて理解を深めましょう。

実践する。 この仕事があなたにとって適職なら、早速やってみるしかありません。ネット上には、KaggleやCloudera’s Data Challenges、Topcoderのように現実世界の問題で腕を試すことができるリソースが数多くあります。

========================================================
執筆者:Business2Community、ジェレミー・レヴィー。
掲載はNewsCred出版者ネットワークから許可を取得しています。