POSTD PRODUCED BY NIJIBOX

POSTD PRODUCED BY NIJIBOX

ニジボックスが運営する
エンジニアに向けた
キュレーションメディア

Alex Smolyanskaya

本記事は、原著者の許諾のもとに翻訳・掲載しております。

私が神経科学のポスドクからStitch Fixでのデータサイエンスの職に転職することを決意したのは、 collaborative data-driven discoveryといった、サイエンティストとして私が熱望することをもっとやってみたいという希望があったからです。皆さんに、その願いが叶ったことを証明するデータをお見せしようと思います。

私は、この3年間、 Toggl というアプリを使って、自分の時間を何に使ってきたのかを記録してきました。作業を始めるときにボタンをクリックし、件名を入力すれば、次の作業を入力するまでタイマーが起動するというアプリです。履歴を見れば、時間がどのように使われているのか一目瞭然で、感情をコントロールしたりストレスに対処したりすることが容易になります。

時間を分類する

私の1日がどのように変化しているのかをより深く理解するために、タスクを特徴ごとに分類しました。分類する際には、なるべく2つの仕事が重複するようにしています。例えば、”ミーティング”のカテゴリーには、アカデミックジャーナルクラブ、アドバイザーとの毎週の個別ミーティング、そしてStitch Fixのマーケティング&ファイナンス部門のビジネスパートナーとのミーティングなどが含まれています。

最終的に18のカテゴリーに分類されましたが、私の時間の90%が以下のカテゴリーのどれかに収まりました。

  • 分析と学習
  • 執筆
  • 助成金の申請
  • ミーティング
  • アドホックなリクエスト
  • その他:Eメールやコミュニティサービス(書類やチームブログの見直しなど)、実験機材の構築、ジャーナルや業界紙の読書

ある週の各カテゴリーの時間配分は以下の通りです。

proportion of time spent by category

私の時間はどこへ?

データの分析を開始するようになってから、4つのことが明らかになりました。

  • データと向き合っている時間が長くなったこと。
  • より共同作業が多くなったこと。
  • 執筆にはあまり時間をかけなくなり、他のチームからのアドホックなリクエストに応えている時間が長くなったこと。
  • データマンジングにあまり時間を費やしていない。

データに、より多くの時間を費やす


私は実験神経科学者でしたから、ポスドク時代はほとんどの時間をデータの収集や処理などの実験に費やしていたという結果を見ても驚きはしませんでした。ポスドクの任期が満了していたなら、私の時間は実験ではなく、分析や執筆、就職活動などに使われていたでしょう。ですから、上のグラフは完全なアカデミックのプロジェクトを表しているとは言えません。とは言うものの、この2年間で、私がどれだけ長く実験用の白衣に身を包んでいたかというのは、目を引くものがあります。最初の2年では、20%の時間しか分析に費やしていませんでした。Stitch Fixでは元々、データは長時間に渡ってストリーミングされていて、私が入社したことでデータの分析を開始するようになりました。入社してからの5カ月間、私の時間の半分以上を分析に費しており、私自身それをとても楽しんでいます。更に、データサイエンスの仕事がA/Bテストなどにも広がれば、仕事の本質そのものに変化が現れるでしょう。例えば、デザインやデプロイメントなど私が楽しいと思える仕事の時間が増え、データの収集などの、毎日の単純作業に費やす時間がもっと減ってくるはずです。総合的な見方をすれば、データサイエンスは、私にクリエイティブな仕事をする時間を増やす機会を与えてくれたと言えます。

より多くの共同作業

チームの一員となり、皆が同じ目標に向かって作業するようになったことで、ポスドクだったころに比べると、チームの仲間やビジネスパートナーとのミーティングに費やす時間が4倍にも増えました。転職する前は、ビジネスミーティングでの私の知識はほとんど、テレビ番組から得たものでしたから、ミーティングが増えることに抵抗がありました。ですが実際は、転職によって得ることのできた、驚くべき嬉しい変化の1つとなりました。短期間のビジネスプライオリティは急速に変化するので、頻繁にミーティングを行うことで、目標や期待に対する情報を常に皆で共有することができます。ビジネス関係者が全員集まって行うミーティングも何度かあり、そこで新しい目標やソリューションを特定することもあります。これによって仕事が楽しくなり、活気が出てきます。時には、短期間のタスクが大きくなり、その目標が広がりを見せるとバランスを取る努力が必要となりますが、意識してこのような妥協を行うことも理解することができます。

執筆の時間が減り、より多くの時間をアドホックなリクエストに費やすように

執筆の依頼がないわけではありませんし、書く機会はたくさんあるのですが、今では論文の執筆や助成金の申請はしていません。私は助成金を申請したり論文を執筆したりすることを心から楽しんでいたので(自覚症状あり)、同じく私が楽しいと感じる”分析と学習”のカテゴリーにまとめることも考えたのですが、このように図で視覚化するには、執筆という全身全霊を捧げるタイプの作業は別項目にした方が分かりやすいという結論に至りました。執筆の代わりに、私はアドホックなリクエストに時間を充てるようになりました。例えば、他のチームが直接アクセスできないようなデータのためにデータベースのクエリを実行することなどです。こういった作業を面倒に思う人もいるかもしれませんが、私は普段あまり考えることのないビジネスの側面を学ぶ機会を持てて、嬉しく思いました。全身全霊を捧げるタイプの作業とは程遠いので、多くの時間を割かれることもありません。しかし、これは私が比較的、新人だからでもありますし、他チームのメンバーも各自で必要なデータにアクセスできるようStitch Fixから権限を与えられているからでもあります。最近、私へのリクエスト件数が増えてきているので、数カ月後には私の立ち位置が分かるようになるでしょう。

データマンジングはどうか?

データサイエンティストになる前から、その生活に関する記事を多く読んでいたので、データマンジングに多くの時間を費やすことになるだろうと思っていました。データマンジングとは、データをログファイルや第三者ツールのようなもの、または自由形式テキストのような構造化されていないフォーマットから有用なフォーマットに変換することです。しかし、私がこういったことをする機会は少ないので、実際はデータマンジングをする必要がなかったのです。私は、非常に優れたデータプラットフォームチームによってサポートされている熟練のデータチームに所属しているので、必要なデータのほとんどは簡単にアクセスできます。データの精度の検証やデータベースエラーの修復に時間を費やすこともありますが、今のところ大した時間はかかっていないと感じています。私がもう1つ書いておきたいことは、ポスドク時代は、日々の実験の後、神経細胞の電位差というアナログ信号から有効な活動電位のタイムスタンプを抽出するのに大体3時間ほどの時間を費やしていたということです。マンジングは決してテクノロジー業界特有のものではありません。

より直接的な影響

私のTogglデータからは、プロジェクトのタイムスケールにおけるアカデミアと業界の違いは分かりませんが、ペースの著しい変化は特筆に値します。アカデミアでは、分析に着手して発見に至るまで、データ収集に通常2年以上を要するようなプロジェクトに取り組んでいました。しかし現在の私の仕事は、チームのシミュレーションや予測をもとに、1週間ごと、四半期ごと、1年ごとに主要な事業運営の指導を行うことです。分析と行動の間には明確な道筋があり、より直接的に具体的な成果や影響をもたらすことができます。その結果、日々がより充実したものになり、四半期ごとの事業も上手くいきます。チームによる最高の勝利というわけです。

進路を変えるべきか?

言うまでもなく、これは1人のデータサイエンティストの話にすぎません。分析やマンジング、アドホックなリクエストに費やす時間は企業やデータ分析チームによって大きく異なるでしょう。私の場合は、進路を変えるという選択肢が望ましい結果になりましたが、あなたの場合は全く異なる結果になるかもしれません。

良い情報としては、産業界やテクノロジー業界はアカデミアに比べてキャリアの選択肢が幅広く、流動性もあるということです。例えば、まずは何でも屋のようなデータサイエンティストになることから始めて、その後、機械学習について深く掘り下げて研究することもできます。最終的にはチームを管理して、モデルの構築を支援することになるかもしれません。あなたにとって最適な進路が何であろうと、データサイエンティストとして働く中で見極めることができるでしょう。