推薦書籍
さまざまな分野でデータサイエンスに携わるスキル委員のメンバーに、実際に業務で役に立った書籍を推薦してもらって一覧化しました。データサイエンスの情報収集やスキル向上にお役立て下さい。
書籍名 | スキル委員のコメント | 著者名 | 出版社名 | タグ | 初学者向け/上級者向け |
---|---|---|---|---|---|
実践データマイニング—金融・競馬予測の科学 | 株価予測と競馬予測にデータマイニングを使ってみたらこうなった、という解説本。具体的なINPUTデータとモデルを適用した結果が解説されているのでイメージがわきやすいし、「自分もやってみようかなー」という気になれる、かも。データ解析を自分ごと化する一助に。 | 月本 洋 | オーム社 | 予測、機械学習、金融、株価、競馬 | 初学者向 |
すべての仕事はクリエイティブ・ディレクションである。 | ほぼデータサイエンティストと関係ない(データサイエンティストに限らない)内容ですが、Sound Of HONDAの話題などはデータ可視化の良例。データの専門家ではない人がこれを発想して生み出した、ということに危機感とか焦燥感を感じることができます。慢心しないための一冊としていかがでしょう。 | 古川裕也 | 宣伝会議 | 広告、クリエイティブ、ディレクション、データ可視化 | ※これで危機感を覚えるひとは中級者以上かも? |
データの見えざる手 | センサーデータの具体的な活用、あるいはこれからデータ収集・活用していく1つの方向性としての観点でも面白い。数年にわたって実際に収集したセンサーデータをもとにした具体的な研究結果として解説されているのでイメージしやすい。 | 矢野 和男 | 草思社 | IoT、ウェアラブル、センサーデータ、運、ハピネス、ソーシャルグラフ、人工知能 | |
Rによるテキストマイニング入門 | 日本語文章のテキストマイニングをこれから始めてみようと思う人にピッタリの良書。RとMeCabを連携させる「RMeCab」の開発者である筆者が、これらのフリーソフトの基本的な使い方から応用を含めテキストマイニングのイロハを分かり易く解説。私は本書でテキストマイニングの基礎を学びました。 | 石田基広 | 森北出版株式会社 | R、MeCab、テキストマイニング、文書分類、分かちがき | 初学者向 |
入門UNIXシェルプログラミング | データの前処理、クレンジングなどに活用できるシェルスクリプトに関するほぼ全てを網羅しており、UNIXにある程度慣れていて、これからシェルを学びたい、効率的なシェルプログラミング方法を習得したい、といった人にピッタリの良書。ある程度シェルをいじれる人も、傍らに置いておくとイザというときホント役に立ちます。 | Bruce Blinn(山下哲典 訳) | ソフトバンクパブリッシング株式会社 | プログラミング、シェル | |
Apache Spark入門 | Apache Sparkの概要、導入方法、アプリケーション開発(「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などの周辺ライブラリの活用含む)を分かり易く解説する良書。私も本書を傍らにリアルタイムでSparkをいじっています! | 株式会社NTTデータ 猿田浩輔 , 土橋 昌, 吉田耕陽, 佐々木 徹, 都築正宜, 下垣 徹 (監修) | 翔泳社 | 並列分散処理、Spark | |
Rによるデータサイエンス-データ解析の基礎から最新手法まで | 多変量解析からデータマイニングまでコンパクトに情報がまとめられた書籍。Rの勉強を始める人は手元に置いておきたい一冊。 | 金 明哲 | 森北出版 | R、多変量解析、データマイニング | 初学者向 |
多変量解析の実践—初心者がらくらく読める〈上〉 | 多変量解析/数量化に関する基礎的な内容がまとめられている書籍。多変量解析をはじめて勉強する人におすすめ。 | 菅 民郎 | 現代数学社 | 多変量解析 | 初学者向 |
多変量解析の実践—初心者がらくらく読める〈下〉 | 多変量解析/数量化に関する基礎的な内容がまとめられている書籍。多変量解析をはじめて勉強する人におすすめ。 | 菅 民郎 | 現代数学社 | 多変量解析 | 初学者向 |
購買心理を読み解く統計学—実例で見る心理・調査データ解析28 | 古典的な分析手法から最新の分析手法まで、各分析手法がどのような場面で適用することができるかコラム形式でまとめられた書籍。分析に疲れた時に、気分転換として読む本。 | 豊田 秀樹 | 東京図書 | 多変量解析、データマイニング | 初学者向 |
BIシステム構築実践入門 (DB Magazine Selection) | ビジネス・インテリジェンスに関する入門書。BIシステムに関わる人はまず最初に読むべき1冊。 | 平井 明夫 | 翔泳社 | ビジネスインテリジェンス | 初学者向 |
シグナル&ノイズ-天才データアナリストの「予測学」 | データサイエンティストは膨大なデータを読み解き、意味合いを抽出する必要があるが、そのことについて示唆された1冊。 | ネイト・シルバー | 日経BP社 | 意味合いの抽出、洞察など | |
イシューからはじめよ-知的生産の「シンプルな本質」 | 最初に手にして欲しいが、読むのは簡単ではありません。そのことについては、著者ご自身がブログで語られています。「痛みを知らない人への座学」 | 安宅和人 | 英治出版 | 問題解決、意味合いの抽出、洞察など | |
自分のアタマで考えよう-知識にだまされない思考の技術 | 論理思考関連の書籍として最初に手にする事を薦める1冊です。 | ちきりん | ダイヤモンド社 | 論理的思考 | 初学者向 |
分析力を武器とする企業-強さを支える新しい戦略の科学 | 「分析」をいかに組織に浸透させるかについて書かれている1冊。データ利活用が競争優位性に大きく影響することが分かりつつも、悩んでいる方に読んで頂きたい。 | トーマス・H・ダベンポート | 日経BP社 | 活動マネジメント | |
分析力を駆使する企業-発展の五段階 | サブタイトルにある通り、組織にどのように「分析」を浸透させていくか、その発展段階について書かれた1冊。 | トーマス・H・ダベンポート | 日経BP社 | 活動マネジメント | |
本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 | 名は体を表すとはこのこと。タイトル通りの1冊です。 | 吉田 寿夫 | 北大路書房 | 統計数理基礎 | 初学者向 |
考える技術・書く技術—問題解決力を伸ばすピラミッド原則 | ピラミッドストラクチャーが何なのかが良く分かります。 | バーバラ・ミント | ダイヤモンド社 | ストーリーライン | 初学者向 |
その数学が戦略を決める | 実際に企業で活用している事例が非常に豊富なので読み易い。 | イアン・エアーズ | 文藝春秋 | 統計数理基礎、予測 | |
道具としてのビッグデータ | ビッグデータの利活用の上でのノウハウを事例を交えながら解説された本。 | 高橋 範光 | 日本実業出版社 | プロセス、事業に実装する | |
ヤバい統計学 | 現実問題に対して統計的にどう捉え・解釈したか、事例を交えて解説された本です。 | カイザー・ファング | CCCメディアハウス | 統計数理基礎 | |
医薬品開発のための統計解析 | これから医薬の統計解析に関わる方にオススメ。サイエンティスト社の本書のページから、使用しているデータを取得できるため、EXCELやJMPを用いて演習を行うことができる。 | 芳賀敏郎 | サイエンティスト社 | 統計学全般、医薬、医療、医学、臨床、前臨床、検定/判断 | 初学者向 |
毒性・薬効データの統計解析—事例研究によるアプローチ | 臨床、前臨床の統計解析関係者の中ではすこぶる著名かと。スキルシートの検定カテゴリの項目はほぼ網羅されている。医薬品開発に必要な知識もコラム的に載っており、非常に有用。 | 吉村功 | サイエンティスト社 | 統計学全般、医薬、医療、医学、臨床、前臨床、検定/判断 | |
トップデータサイエンティストが教える データ活用実践教室 | 「価値あるデータ分析を行うには」「データ活用をどのようにビジネスに活かすか」…現役のデータサイエンティストが、それぞれの視点で語っています。 | 高橋威知郎/安宅和人/河本薫/吉田隆光/北川拓也/工藤卓哉/西山直樹/シバタアキラ | 日経BP社 | 問題解決 | 初学者向 |
データサイエンティスト養成読本 | 出版後、若干年数が経過しているものの、データサイエンティストの仕事内容、事例、ツール紹介等、網羅的に書かれており、データサイエンティストの仕事を概観するための入口として。 | 佐藤 洋行, 原田 博植, 下田 倫大, 大成 弘子, 奥野 晃裕, 中川帝人, 橋本 武彦, 里 洋平 , 和田 計也 , 早川 敦士, 倉橋 一成 | 技術評論社 | 事例紹介、ツール紹介 | 初学者向 |
SASによるデータ解析入門 第3版 | 統計解析ソフトのSASによる分析手順を一通り覚えるのに非常にわかりやすい書籍 | 竹内啓(監修)、市川伸一、大橋靖雄、岸本淳司、浜田知久馬、下川元継、田中佐智子 | 東京大学出版会 | 分析環境、統計学全般 | 初学者向 |
みんなのR データ分析と統計解析の新しい教科書 | Rのインストール方法や環境について一から丁寧にまとめられており、初学者向けの教科書として活用することができる。数式が全く出てこない代わりにサンプルコードが多く記載されているため、原理がわかってなくても動かしてみたいという人におすすめ。 | Jared P.Lander/著 高柳慎一/訳 牧山幸史/訳 簑田高志/訳 | マイナビ | R、多変量解析、データ加工 | 初学者向 |
新しいアナリティクスの教科書 データと経営を結び付けるWeb解析の進化したステージ | デジタルマーケティングに取り組む場合に良書であることに加え、アナリティクスを組織的に始める際に考慮すべき点に生々しく言及していることが秀逸で、どんな分野の方でも一読をお勧めします。 | アナリティクスアソシエーション/著 | インプレス | 事業に実装する | |
フリーソフトではじめる機械学習入門 | 数学があまり得意でない人が最初に読む機械学習の本として適している。フリーソフトWekaで、実際に解析してみることができる。 | 荒木雅弘/著 | 森北出版 | 機械学集 | 初学者向 |
基本統計学 第4版 | 初学者が、統計検定2級の範囲を体系立てて学ぶのに適している。第4版を重ねており、著者の情熱も感じられる。 | 宮川公男/著 | 有斐閣 | 統計基礎 | 初学者向 |
コンピュータビジョン 最先端ガイド 6 | 画像認識において近年注目を浴びている手法を取り上げているシリーズの中、第6巻ではディープラーニングが紹介されています。調査論文の形式になっているのが特徴で、参考文献が多く記載されています。 基本から最近の動向までがまとめられており、手法や分野に関するチュートリアルとして活用することができます。 | 八木康史/編 斎藤英雄/編 藤代一成/著 高橋成雄/著 竹島由里子/著 金谷健一/著 日野英逸/著 村田昇/著 岡谷貴之/著 齋藤真樹/著 | アドコム・メディア | 機械学習、画像認識 | |
統計学入門 | 統計検定2級を学習する際の副読本として、定評がある。 | 東京大学教養学部統計学教室/編 | 東京大学出版会 | 統計基礎 | 初学者向 |
まずはこの一冊から 意味がわかる統計学 | 特に文系の方を対象に、統計学の勉強を始める第一歩として適している。難しい数学はなるべく避け、直感的に分かりやすく説明されている。 | 石井俊全/著 | ベレ出版 | 統計基礎 | 初学者向 |
入門・演習数理統計 | 統計検定2級を取得した人が、準1級、1級取得に向け、数理統計の基礎を学ぶのに適している。演習問題が豊富であり、実践的である。 | 野田一雄/著 宮岡悦良/著 | 共立出版 | 数理統計 | 初学者向 |
これからデータ分析を始めたい人のための本 | トップデータサイエンティストによる実体験を元にデータ分析の勘所が解説されている。 | 工藤卓哉/著 | PHPエディターズ・グループ | 行動規範、プロセス | 初学者向 |
p値とは何か 統計を少しずつ理解する34章 | p値だけでなく統計解析がどのように役立つかを、誰でもイメージできそうな例を挙げて説明してくれる。厳密な教科書とは対極に位置付く肩の力を抜いて読める書籍を好む方には適している。 | Andrew Vickers/著 竹内正弘/監訳代表 | 丸善出版 | 統計数理基礎 | 初学者向 |
統計数字を読み解くセンス 当確はなぜすぐにわかるのか?( | 統計を学ぶ上で青木先生のWebサイトを参考にされた方も多いと思いますが、日常生活で触れることのある題材で説明されており、初学者にオススメ。 | 青木繁伸/著 | 化学同人 | 統計数理基礎 | 初学者向 |
データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC | 統計基礎を学んだ方が、次に一般化線形モデルを学ぶ際に適している。数式ではなく文章での説明を基本とし、必要に応じてRとWinBUGSのコードが掲載されており、読み進め易くまとまっている。 | 久保拓弥/著 | 岩波書店 | 一般化線形モデル | 初学者向 |
シリーズUseful R 2 データ分析プロセス | データ入手から分析までの一連のプロセスに沿って記述され、実践に役立つ内容が多い。 | 金明哲/編 | 共立出版 | プロセス | |
Rによる時系列分析入門 | 時系列データの基本的な扱いからARIMAモデルの推定までを、R言語を通して一通り学ぶことができる。 | 田中孝文/著 | シーエーピー出版 | 時系列 | 初学者向 |
機械学習プロフェッショナルシリーズ 機械学習のための確率と統計 | 日本における機械学習の若き第ー人者である著者が機械学習に必要な数学・確率・統計理論をコンパクトに解説している。機械学習に限らず、初学者がベースを固めるために最適な書籍。 | 杉山将 | 講談社 | 統計数理基礎、機械学習 | 初学者向 |
R言語逆引きハンドブック | Rでプログラミングする際に辞書として活用できる、あると便利な一冊。 | 石田基広/著 | シーアンドアール研究所 | R言語 | 初学者向 |
Rによる統計解析 | R言語で統計解析を行う際の必携本。統計基礎は習得済みの方向けである。 | 青木繁伸/著 | オーム社 | R言語 | |
Python Machine Learning | 「機械学習の考え方とPython実装法がわかる」が謳い文句で、Amazonの「Neural Networks」カテゴリーで首位を取るなど、よく売れている。実装を中心に機械学習を掘り下げた良書。和訳本は2016/6に発売予定。 | Sebastian Raschka | Packt Publishing | 機械学習、プログラミング | |
イラストで学ぶ 機械学習 最小二乗法による識別モデル学習を中心に | 著者が東工大時代に書いた機械学習の初学者向け解説書。初学者が読むためには「機械学習のための確率と統計」等、前提の確率・統計理論を固めてから読む必要があるが、MatLabのサンプルコードもついており、実践への配慮もある。 | 杉山 将 | 講談社 | 機械学習 | 初学者向 |
イラストで学ぶ ディープラーニング | ディープラーニング全般を平易に説明した解説書。理論的な追及よりも、直感的な理解等を重視しており、ディープラーニング全般を概要的に理解するための初学者に適している。 | 山下 隆義 | 講談社 | 機械学習 | 初学者向 |
Rによるデータサイエンス | R言語でデータマイニング、機械学習を始めたい方に最良の本。幅広く扱っているため、まずはどんか解析方法があるか一通り読み、実データで解析する際には辞書的に活用すると良い。 | 金 明哲 | 森北出版 | R言語 | 初学者向 |
はじめてのパターン認識 | 一般的なパターン認識の手法が分かりやすく解説されており、機械学習を学ぶ最初の一冊として適している。 | 平井有三/著 | 森北出版 | 機械学習、パターン認識 | 初学者向 |
日本統計学会公式認定 統計検定1級対応 統計学 | 統計検定1級、準1級の試験範囲を、一通り学ぶことができる。但し、統計検定2級レベルがいきなり挑むにはハードルが高く、事前に数理統計や多変量解析の基礎を押さえておくことが必要。 | 日本統計学会/編 | 東京図書 | 統計学 | 初学者向 |
わかりやすいパターン認識 | 数理的な面から機械学習を学ぶ際の最初の1冊として、お勧めできる。続編と合わせれば、機械学習の手法を一通り学ぶことができる。 | 石井 健一郎/著 前田 英作 /著 上田 修功/著 村瀬 洋/著 | オーム社 | 機械学習 | 初学者向 |
わかりやすいパターン認識 続 | 続編では、入門書が少ない「教師なし学習」を中心に書かれており、貴重である。 | 石井健一郎/著 上田修功/著 | オーム社 | 教師なし学習 | 初学者向 |
入門 機械学習による異常検知—Rによる実践ガイド | 異常検知にフォーカスをあてた機械学習の書籍で、Rコードもあり、実践的です。理論面を深堀したい方には、同じ著者で「機械学習プロフェッショナルシリーズ 異常検知と変化検知」が、ある。 | 井手剛/著 | コロナ社 | 異常検知 | 上級者向 |
多変量解析入門 線形から非線形へ | 数理的な面から多変量解析を学ぶ際の最初の1冊として、お勧めできる。 | 小西貞則/著 | 岩波書店 | 多変量解析 | 初学者向 |
Pattern Recognition and Machine Learning | 機械学習のアルゴリズムについて,ベイズ理論の観点から解説した教科書的書籍。PRMLと略称され、もはや古典的な教科書になっている。丸善から和訳本がでている。 | Christopher Bishop | Springer | 機械学習、ベイズ理論 | |
Machine Learning: a Probabilistic Perspective | GoogleのKevin P. Muryphyが書いた機械学習のリファレンス本。背景知識について確認しながら、段階的に難しいアイテムに到達するスタイル。また、実践を重視し、MatLabのサンプルコードも豊富に用意してある。残念ながら現時点では、和訳は未。 | Kevin P. Murphy | The MIT Press | 機械学習、プログラミング | |
機械学習プロフェッショナルシリーズ 深層学習 | 画像認識関連の第一人者である著者がディープラーニングについて解説する。ニューラルネットの歴史的背景にも触れ、基礎からオートエンコーダ、CNN、RNN、RBMまでほぼ網羅的に解説している。CNNでは構造やプロセスが視覚的に捉えられ、興味深い。 | 岡谷貴之 | 講談社 | 機械学習、ディープラーニング、画像処理 | 上級者向 |
機械学習プロフェッショナルシリーズ オンライン機械学習 | JubatusやChainerを作ったPFNのメンバーが、オンライン機械学習を解説する。理論、実装、応用をすべて網羅している。性能解析や実装についてもポイントを解説しており、オンライン機械学習についての数少ない解説書になっている。 | 海野裕也/岡野原大輔/得居誠也/徳永拓之 | 講談社 | 機械学習 | 上級者向 |
機械学習プロフェッショナルシリーズ サポートベクトルマシン | 現在SVMを解説した書籍の中で網羅度の面で他に例を見ない。従来のSVMのアルゴリズムを詳しく解説すると共に、構造化SVMや弱ラベルSVMなど、比較的新しいアルゴリズムについても解説している。また、S/Wと実装にも触れており、実践的でもある。 | 竹内一郎/著 鳥山昌幸/著 | 講談社 | 機械学習、SVM | 上級者向 |
深層学習 Deep Learning (監修:人工知能学会) | 人工知能学会が監修したディープラーニングのリファレンス本的解説書。「機械学習プロフェッショナルシリーズ 深層学習」ほど分り易くはないが、学習手法全般と画像、音声、自然言語の応用処理についても詳しく解説されており、高速化手法等の実装面の解説もある。 | 麻生 英樹/安田 宗樹/前田 新一/岡野原 大輔/岡谷 貴之/久保 陽太郎/ボレガラ ダヌシカ , 人工知能学会 (監修), 神嶌 敏弘 (編集) | 近代科学社 | 機械学習、ディープラーニング、画像処理、音声処理、言語処理 | 上級者向 |
自然科学の統計学 | 「統計学入門」と合わせて持っておきたい一冊。トップデータサイエンティストが何人も推薦している。 | 東京大学教養学部統計学教室/編 | 東京大学出版会 | 統計数理基礎 | |
人文・社会科学の統計学 | 「統計学入門」と合わせて持っておきたい一冊。タイトルからは文系向けに見えるかもしれないが、先入観無しで一度手に取ってみることをお勧めします。 | 東京大学教養学部統計学教室/編 | 東京大学出版会 | 統計数理基礎 |
公開日:
最終更新日:2016/05/20