K Squad

『評価指標入門』書評


『評価指標入門』を献本いただきました

代表のkomiです。

先日ご縁あり『評価指標入門』という書籍を著者の @Mrr_ma さんから献本いただきました。

読ませていただいたところ、非常に良い内容だったので今回ご紹介させていただこうと思います。

データサイエンスの課題とビジネスの課題

今回の書籍が最も伝えたいメッセージは「データサイエンスとして解く問題がちゃんとビジネスに結びついているか?」という問題提起です。

我々もデータ基盤開発の仕事をしていてちょうどビジネスサイドとデータサイエンティストの間に立つことが多いので、この両者が食い違うケースに思っている以上に遭遇します。 多くの場合、データサイエンティストとビジネスサイドの両者で言葉が異なっているというか、前提条件がズレているというのが原因だったりします。

データサイエンティストの多くがアカデミックなバックグラウンドを持っていて機械学習モデルの開発を研究活動のように捉えてしまい、ビジネスサイドの人はなんかいい感じのインサイトを提供してくれればいいやというフワッと感で注文してしまう。 こうしたミスコミュニケーションがこのような事象を招きます。

これらの問題を解決するために、データに携わる全員が「我々は何を課題としていてデータモデリング等の手法でそういった課題をどう解決したいか」という認識を全員で合わせておく必要があります。

ここで鍵となるのが本書のタイトルにもある「評価指標をビジネス上のKPIに可能な限り近づけること」です。

構成

評価指標入門では概論としてデータサイエンスとビジネスの食い違いを起こさないためにどのような取り組みをすれば良いのか、どのような評価指標を使えば良いのか(RMSEなど)というのを説明しつつ、補論として各トピックでの具体的なケースワークが記述されています。

例えばユーザーに対してDMを送付する施策を行った際に製品を購入するかどうかの二値分類問題において、その結果とコストの算出といったビジネスインパクトの計算を具体的な数値を元に説明しています。

二値分類以外にも多クラス分類、回帰問題についても解説してあり、様々な評価指標について解説がなされており、非常に分厚い内容となっていてかなり読み応えがあります。

本書の想定読者

本書はデータに携わるあらゆる人にお勧めできる内容で、

  • PM
  • プロダクトオーナー
  • データサイエンティスト
  • データエンジニア
  • マーケター

などあらゆる職種の人に向いている内容かと思います。

ただ一部数式が出てくることやPythonのソースコードが出てくるので、数理コンテンツアレルギーをお持ちの方には少々骨が折れる重さかもしれません。

終わりに

というように今回のエントリーでは本書の概要やおすすめポイントなどを書こうと思ったんですが、少々自分の言語化能力ではあまりに良さを説明しきれません。

ただひとまず興味ある方は是非とも手に取ってください。本当に良書です。