課題を正しく設定し、チームで協調することが重要 ~リクルートテクノロジーズ アドバンスドテクノロジーラボ 小嵜耕平氏インタビュー~
国際的なデータ分析コンペティションであるKaggleで活躍されている小嵜耕平氏に、どのように現在のスキルを身に着けるに至ったか、また、データ分析の技術やプラットフォームやそれらの今後について、お話を伺いました。
Kaggle コンテスト Cervical Cancer Screening Contestの受賞イベント会場にて、受賞イベントの時間まで入賞者とビールを飲んでいる写真。左から5番目が小嵜氏。
小嵜耕平氏(略歴)
2011年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了(工学)。2014年、同博士後期課程単位取得退学。2015年、データ分析コンテストKDD Cup 2015優勝。同年11月より株式会社リクルートテクノロジーズ アドバンスドテクノロジーラボ シニアソフトウェアエンジニアとして、データ分析および機械学習に関する技術開発に従事。
--- これまでの経歴や現在の業務についてお聞かせください。
システム運用、研究開発、広告配信最適化、保険金不正請求の分析、ツール開発や技術検証など、幅広い分野で仕事をしてきました。いずれもソフトウェアエンジニアリングとデータの活用という言葉でまとめることができると思います。大学では自然言語処理の研究をしていましたが、研究の応用分野に興味を持ち、社会人として研究開発やデータ分析分野でのキャリアをスタートしました。
現在はリクルートテクノロジーズのアドバンスドテクノロジーラボで、データ分析のプロセスの効率化に取り組んでいます。例えば、過去の分析レポートや前任者の分析レポートに出てくる数値や結果が再現できないものだと困りますよね。業務引き継ぎの観点でも、チームで分業する上でも、再現性の確保はとても重要なことだと思います。そういった場面で役に立つツールを開発したりしています。その他、コンピュータビジョンやディープラーニングの研究成果がどういった場面で活用できるのか、どこまで有用であるのかを実装からはじめて評価検証をしています。
--- 扱ってきたデータ分析や技術も様々なようです。新しいことに取り組む時に、これまでの経験が生きないかもしれない、といった不安はありませんでしたか?
保険業のような、いままでに関わりのなかった業界で仕事をすると決めたときは、うまくやっていけるのか不安でドキドキしました。ただ、どういった役割が必要とされており、その役割をこなすことができそうだと自信を持つことができたので決断できました。
自信を持つことができたのは、Kaggle での経験のおかげだと思います。Kaggle では、様々な業界のデータセットに触れることができます。データは様々でも、タスクを設計して、データの傾向を見てパターンを探し、そのデータやタスクに適したモデルを作る。そういったプロセスはどの業界でも同じであると感じました。Kaggle ではタスクを設計するというレベルでの経験や予測モデルを運用するといった経験を積むことはできませんが、Kaggle で蓄積した知識を活かすことはできます。