【2022年最新】R言語の本「人気・高評価のおすすめ15冊」

こちらでは、データ解析・統計分析などに有用なプログラミング言語「R言語」に関する人気・高評価のおすすめ本を紹介していきます。

 

 

  1. R言語の本 人気ランキング/10冊詳細
    1. 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
    2. Rが生産性を高める〜データ分析ワークフロー効率化の実践
    3. 実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得 (KS情報科学専門...
    4. R言語ではじめるプログラミングとデータ分析
    5. Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎知識
    6. Rではじめるデータサイエンス
    7. Rグラフィックスクックブック 第2版 ―ggplot2によるグラフ作成のレシピ集
    8. RStudioではじめるRプログラミング入門
    9. 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...
    10. サラっとできる!フリー統計ソフトEZR(Easy R)でカンタン統計解析
  2. R言語の本 最新・高評価のおすすめの5冊
    1. 自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)
    2. 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
    3. RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】
    4. Rによる機械学習[第3版]
    5. 実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得 (KS情報科学専門...
  3. R言語の本「新書一覧(2020年、2021年刊行)」
  4. R言語の本「Kindle Unlimited 読み放題 人気本ランキング」
  5. 関連:Python・データ解析系の本
  6. 関連:最新おすすめのKindle端末

R言語の本 人気ランキング/10冊詳細

以下が「R言語の本」人気ランキングと人気の10冊詳細です。

(2022/01/25 12:07 更新)
Rank製品価格
1
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
3,278円
3,278円
3,278円
2
Rが生産性を高める〜データ分析ワークフロー効率化の実践
発売日 2022/01/26
igjit, atusy, hanaori (技術評論社)
3,190円
(+124pt)
3,190円
3,190円
3
3,520円
3,520円
3,520円
4
R言語ではじめるプログラミングとデータ分析
発売日 2020/01/20
馬場真哉 (ソシム)
総合評価
(4.4)
3,300円
3,000円
3,300円
3,300円
5
3,278円
3,278円
3,278円
6
Rではじめるデータサイエンス
発売日 2017/10/25
Hadley Wickham, Garrett Grolemund (オライリージャパン)
総合評価
(3.7)
4,400円
(+132pt)
4,400円
4,400円
7
Rグラフィックスクックブック 第2版 ―ggplot2によるグラフ作成のレシピ集...
発売日 2019/11/21
Winston Chang (オライリージャパン)
総合評価
(4.3)
3,960円
(+119pt)
3,960円
3,960円
8
RStudioではじめるRプログラミング入門
発売日 2015/03/25
Garrett Grolemund (オライリージャパン)
総合評価
(4.2)
2,860円
2,860円
2,860円
9
3,300円
2,310円
3,300円
3,300円
10
サラっとできる!フリー統計ソフトEZR(Easy R)でカンタン統計解析...
発売日 2020/11/16
善伸, 神田 (オーム社)
総合評価
(4.3)
2,860円
2,574円
2,860円
2,860円
 

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
(著)松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛
発売日 2021/06/03
総合評価
(4.6)
(2022/01/25 12:07時点)
(概要)
2018年に刊行した通称「#宇宙本」を最新の情報に改訂!
本書は、R言語のIDEであるRStudioと、モダンなデータ分析を実現するtidyverseパッケージの入門書です。RStudioの基本機能からはじまり、Rによるデータの収集(2章)、データの整形(3章)、可視化(4章)、レポーティング(5章)といったデータ分析ワークフローの各プロセスの基礎を押さえることができます。
RStudio v1.4に対応し、新たに追加されたVisual Editor機能やRStudio v1.2で追加された「Jobs機能」などを紹介します。また、dplyr 1.0に対応し、データ処理系の関数の解説を追加しています。さらに改訂版では付録として、「stringrによる文字列データの処理」「lubridateによる日付・時刻データの処理」の2章を追加しています。
さまざまな機能が追加されていくRStudioとtidyverseに触れ、モダンなデータ分析をはじめましょう!

(こんな方におすすめ)
・R / RStudioでモダンな分析環境を手にしたい方
・分析フローを意識した業務/解析をしたい方

(目次)
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 RやRStudioで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 API
2-5 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 tidyrのその他の関数
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
A-3 正規表現
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
はじめに
 本書の特徴
 本書の構成
 本書の対象読者
 本書で解説しなかったこと
 さあRStudioで分析を
tidyverseとは
 tidyverseのパッケージ
 tidyverseの過去
 tidyverseの未来
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
 macOS
 Windows
1-2 RStudioの基本操作
 RStudioのインターフェース
 プロジェクト機能
 Rスクリプトの新規作成と保存
 Rのコマンドの実行
 オブジェクトの確認
 補完機能
 Jobs機能
1-3 RStudioを自分好みにカスタマイズ
 RStudio全般
 コーディング
 外観
 Terminal
 キーボードショートカット
1-4 ファイルの読み込み
 Rの標準関数の問題点
 readrパッケージ
 Excelファイルの読み込み
 SAS,SPSS,STATAファイルの読み込み
 RStudio(GUI)によるデータの読み込み
 ファイル読み込みのまとめ
1-5 RやRStudioで困ったときは
 ヘルプを使う
 Vignetteを見る
 チートシートを使う
 コマンドパレット
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
 スクレイピングとは
 手作業によるデータ取得の限界
2-2 スクレイピングに必要なWeb知識
 HTML
 CSS
 XMLとXPath
2-3 Rによるスクレイピング入門
 rvestパッケージ
 Webページタイトルの抽出
 パイプ演算子
 スクレイピング実践
2-4 API
 APIとは
 rtweetパッケージによるTwitterデータの収集
 ツイートの収集
 COLUMN ブラウザの自動操作
 COLUMN Webスクレイピングをするときの注意点
2-5 まとめ
 参考文献
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
 tidy dataの定義
 tidyではないデータ
3-2 tidyrによるtidy dataへの変形
 tidyではないデータ
 pivot_longer()による縦長データへの変形
 pivot_wider()による横長のデータへの変形
3-3 dplyrによる基本的なデータ操作
 tibbleとデータフレームの違い
 dplyrの関数の概要
 1つのデータフレームを操作する関数の共通点と%>%
 演算子による処理のパイプライン化
 filter()による行の絞り込み
 COLUMN dplyrの関数内でのコード実行
 arrange()によるデータの並び替え
 select()による列の絞り込み
 relocate()による列の並べ替え
 mutate()による列の追加
 summarise()によるデータの集計計算
3-4 dplyrによる応用的なデータ操作
 グループ化
 COLUMN 複数の値を返す集約関数とsummarise()
 COLUMN ウィンドウ関数
 COLUMN selectのセマンティクスとmutateのセマンティクス
 複数の列への操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
 inner_join()によるデータの結合
 さまざまなキーの指定方法
 inner_join()以外の関数によるデータの結合
 semi_join()、anti_join()による絞り込み
3-6 tidyrのその他の関数
 separate()による値の分割
 extract()による値の抽出
 separate_rows()による値の分割(縦方向)
 暗黙の欠損値
 complete()による存在しない組み合わせの検出
 COLUMN group_by()による存在しない組み合わせの表示
 fill()による欠損値の補完
 replace_na()による欠損値の置き換え
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
 準備
 エステティックマッピング
 COLUMN グラフに肉付けする
 統計的処理:stat
 COLUMN X軸に離散変数をマッピングした場合における折れ線グラフ
 配置の指定:position
 COLUMN position_dodge()とposition_dodge2()
 軸の調整
 グラフの保存
4-3 他者と共有可能な状態に仕上げる
 themeの変更
 文字サイズやフォントの変更
 配色の変更
 ラベルを変更する
4-4 便利なパッケージ
 複数のグラフを並べる
 表示される水準の順番を変更したい
4-5 まとめ
 参考文献
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
 ドキュメント作成の現場
 手作業によるドキュメント作成の問題点
5-2 R Markdown入門
 Hello, R Markdown
 Rmdファイルと処理フロー
 Markdownの基本
 Rチャンク
 ドキュメントの設定
 RStudioで使える便利なTips
 COLUMN Visual ModeによるRmdファイルの編集
5-3 出力形式
 html_document形式
 pdf_document形式
 word_document形式
 スライド出力
 R Markdownの出力形式を提供するパッケージ
 COLUMN 日本語環境での注意点
5-4 まとめ
 参考URL・参考文献
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
 str_c()による文字列の連結
 str_split()による文字列の分割
 str_detect()による文字列の判定
 COLUMN fixed()/coll()を用いた挙動の調整
 str_count()による検索対象の計上
 str_locate()による検索対象の位置の特定
 str_subset()/str_extract()による文字列の抽出
 str_sub()による文字列の抽出
 str_replace()による文字列の置換
 str_trim()/str_squish()による空白の除去
A-3 正規表現
 任意の文字や記号の検索
 高度な検索
 regex()
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
 文字列から日付・時刻への変換
 数値から日付・時刻への変換
 readrパッケージによる読み込み時の変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
 wday()を使った曜日の計算例
 floor_date()を使った週ごとの集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数
 zipanguパッケージ
 sliderパッケージ

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

他著:松村 優哉
松村優哉(まつむら ゆうや) IT企業勤務。修士(経済学)。学生時代の専門はベイズ統計学、統計的因果推論およびそれらのマーケティングへの応用。ホームページ:https://ymattu.github.io/ 仕事および趣味でRを使用し、ブログ(https://y-mattu.hatenablog.com/)にてRやPythonなどの情報を発信しているほか、Rの勉強会Tokyo.Rの運営にも携わる。著書に『データサイエンティストのための最新知識と実践 Rではじめよう![モダン]なデータ分析』(マイナビ出版, 2017)。本書の第1章、第2章を執筆。

他著:湯谷 啓明
湯谷啓明(ゆたに ひろあき) IT企業勤務。データの可視化への興味からggplot2を知り、Rを使い始める。tidyverseへのコントリビューションも多数。技術ブログ(https://notchained.hatenablog.com/)でもRに関する小ネタや最新情報を発信している。好きな言語はRと忍殺語。著書に「Rによるスクレイピング入門」(C&R研究所, 2017)、翻訳書に「Rプログラミング本格入門」(共立出版, 2017)。本書の「tidyverseとは」、第3章、付録Bを執筆。

他著:紀ノ定 保礼
紀ノ定保礼(きのさだ やすのり) 静岡理工科大学情報学部 講師。博士(人間科学)。同志社大学文化情報学部在学中にRを習うも、当時はRStudioがなく、いつしか疎遠になる。統計モデリングとtidyverseへの興味から再びRを使い始め、今ではRはなくてはならない存在に。大阪大学大学院人間科学研究科助教を経て、現職。専門は、認知心理学、交通心理学、人間工学。翻訳書に『ベイズ統計モデリング-R, JAGS, Stanによるチュートリアル-原著第2版』(共立出版, 2017)。本書の第4章と付録Aを執筆。


↓全て表示↑少なく表示

  

Rが生産性を高める〜データ分析ワークフロー効率化の実践

Rを使って自動化/効率化への第一歩を踏み出しましょう!

データ分析によって価値ある意思決定につなげたいと考えるのがデータ分析者の本分ではないでしょうか。ところが「データ分析」を行うためには、さまざまな工程を経ることになります。データ分析に携わったことのある方であれば身に覚えがあるでしょう。

ExcelのGUI操作、可視化の設定、レポート、他ツールとの連携などで発生する繰り返し作業を減らすための手間を惜しんではいけません。これらの工程で発生する手作業を無自覚に受け入れることは、本来取り組まなければならない「分析」の時間を無駄にすることと同じです(1回の業務が5分短縮できたとしましょう。1年で300回同じ作業が発生したとしたら、1500分=25時間。約1日です。この時間で何ができるでしょうか?)。​

あなたがRを利用していれば(これからRをはじめるという方も)ラッキーです。Rの豊富なパッケージを利用することでデータ分析のワークフローを効率化できます。本書は以下のような構成で、単純な作業をプログラミングによって自動化する方法を解説していきます。

1章 R環境の準備と基本操作
2章 Excel・CSV・TSVファイルの読み込みとデータ整形
3章 グラフ描画の基本と応用
4章 HTML・Word文書への出力と分析結果の共有
5章 Googleサービスとの連携
6章 Web上のデータ取得とWebブラウザの操作
7章 データフローの整理と定期実行

Excel操作、グラフ描画、レポート、Googleサービス連携、スクレイピングなどデータ分析に欠かせない工程が、本書の内容によって効率化できるかもしれません。Rでなんでも完結してしまいたいというR愛にあふれる執筆者が集まり、便利なパッケージの使いどころを解説していきます。

Rを使って自動化/効率化への第一歩を踏み出しましょう!

↓全て表示↑少なく表示
 
  

実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得 (KS情報科学専門...

◆RとPython両方学べる。コスパ最強の一冊!◆

・コードが理解の試金石!
・「データサイエンスの準備」にページを割いているから、プログラミング経験ゼロで大丈夫!
・自分に合った言語を見つけたい、言語を乗り換えたいという方にもおすすめ!

[サポートサイト]
https://github.com/taroyabuki/fromzero

[主な内容]
第1部 データサイエンスのための準備
1章 コンピュータとネットワーク
2章 データサイエンスのための環境
3章 RとPython
4章 統計入門
5章 前処理

第2部 機械学習
6章 機械学習の目的・データ・手法
7章 回帰1(単回帰)
8章 回帰2(重回帰)
9章 分類1(多値分類)
10章 分類2(2値分類)
11章 深層学習とAutoML
12章 時系列予測
13章 教師なし学習
付録A 環境構築
 
内容サンプル

(引用元Amazon)

 
目次
第1部 データサイエンスのための準備
1章 コンピュータとネットワーク
1.1 コンピュータの基本操作
1.2 ネットワークのしくみ
2章 データサイエンスのための環境
2.1 実行環境の選択
2.2 クラウド
2.3 Docker
2.4 ターミナルの使い方
2.5 RとPython
2.6 サンプルコードの利用
3章 RとPython
3.1 入門
3.2 関数
3.3 コレクション
3.4 データフレーム
3.5 1次元データの(非)類似度
3.6 Rのパッケージ,Pythonのモジュール
3.7 反復処理
3.8 その他
4章 統計入門
4.1 記述統計
4.2 データの可視化
4.3 乱数
4.4 統計的推測
5章 前処理
5.1 データの読み込み
5.2 データの変換
第2部 機械学習
6章 機械学習の目的・データ・手法
6.1 機械学習の目的(本書の場合)
6.2 機械学習のためのデータ
6.3 機械学習の手法
7章 回帰1(単回帰)
7.1 自動車の停止距離
7.2 データの確認
7.3 回帰分析
7.4 当てはまりの良さの指標
7.5 K最近傍法
7.6 検証
7.7 パラメータチューニング
8章 回帰2(重回帰)
8.1 ブドウの生育条件とワインの価格
8.2 重回帰分析
8.3 標準化
8.4 入力変数の数とモデルの良さ
8.5 変数選択
8.6 補足:正則化
8.7 ニューラルネットワーク
9章 分類1(多値分類)
9.1 アヤメのデータ
9.2 木による分類
9.3 正解率
9.4 複数の木を使う方法
9.5 欠損のあるデータでの学習
9.6 他の分類手法
10章 分類2(2値分類)
10.1 2値分類の性能指標
10.2 トレードオフ
10.3 2値分類の実践
10.4 ロジスティック回帰
11章 深層学習とAutoML
11.1 Kerasによる回帰
11.2 Kerasによる分類
11.3 MNIST:手書き数字の分類
11.4 AutoML
12章 時系列予測
12.1 日時と日時の列
12.2 時系列データの予測
13章 教師なし学習
13.1 主成分分析
13.2 クラスタ分析
付録A 環境構築

↓全て表示↑少なく表示
著者略歴

著:辻 真吾
1998年 東京大学工学部計数工学科数理工学コース卒業
2005年 東京大学大学院工学系研究科先端学際工学専攻修了
現 在 東京大学先端科学技術研究センター 特任准教授
    情報処理技術者試験委員
著 書 『Pythonスタートブック[増補改訂版]』技術評論社(2018)
    (共著)『Pythonによるあたらしいデータ分析の教科書』翔泳社(2018)
    『Pythonで学ぶアルゴリズムとデータ構造』講談社(2019)

著:矢吹 太朗
1998年 東京大学理学部天文学科卒業
2004年 東京大学大学院新領域創成科学研究科基盤情報学専攻修了
現 在 千葉工業大学社会システム科学部プロジェクトマネジメント学科 准教授
    情報処理技術者試験委員
著 書 『Webアプリケーション構築入門(第2版)』森北出版(2011)
    『基礎からしっかり学ぶC++の教科書』日経BP社(2017)
    『Webのしくみ』サイエンス社(2020)


↓全て表示↑少なく表示

  

R言語ではじめるプログラミングとデータ分析

R言語ではじめるプログラミングとデータ分析
(著)馬場真哉
発売日 2020/01/20
総合評価
(4.4)
(2022/01/25 12:05時点)
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

R言語によるデータ分析をはじめてみよう!

この本は、初心者向けのR言語の入門書です。
R言語はデータ分析に秀でたプログラミング言語です。もちろん無料で使えます。
この本では、R言語の初歩と、データ分析の基本を解説しています。
Tidyverseと呼ばれる「データ分析の生産性を上げてくれる便利なパッケージ群」の解説もしています。


【特徴】
・基礎から順にステップアップするので、初心者でも読みやすい
・「3行で終わる短いプログラミング事例」を豊富に紹介
・難易度マークがついているので、難しい箇所は飛ばしながら読める
・巻末にRリファレンスがついているので、読み返しやすい


【内容】
第1部【導入編】Rを始める
第2部【初級編】Rによるデータ分析の基本
第3部【中級編】長いコードを書く技術
第4部【応用編】Tidyverseの活用
参考文献
索引
Rリファレンス

↓全て表示↑少なく表示
 
Users Voice
大学生の子の希望で購入しました。難しい本を読むのだなと感心。子が住んでいる住所へ送料無料で送る事ができ良かったです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示

  

Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎知識

プログラミング未経験者に向けたR入門書!

ビジネスパーソンに向けた、脱Excel、プログラミングの入口につながるRでのデータ分析入門書!

日々の仕事の中で、こんな作業はありませんか?
・表データに決まった手順でフィルターをかけて、それをグラフにする
・複数のExcelファイルを1つのExcelファイルにまとめる
・定型のPowerPointを作成する

単純なデータの加工や集計はExcelで事足ります。ただ、複雑な処理や繰り返しの処理が必要となったときには、より高度な関数やマクロを使いこなす必要が出てきます。

本書はマクロを含め、プログラミングにまったくふれたことがない人を対象に書かれています。Rの本としては珍しく、数式も統計学も出てきません。文系出身の普通のビジネスパーソンでも、普段行っているデータの加工がより楽に、効率的にできるようになります。

Rは、統計処理に特化したプログラミング言語と言われています。1990年代に作られて以降、統計だけでなくさまざまなところで利用されています。
表形式のデータを自由自在に加工・集計できる機能も含まれており、プログラムを書いてデータを取り扱うことができるというその性質から、ルーチンワークやたくさんのデータを処理する際に使われてきました。その便利さは、Excelの比ではありません。

本書は、オンラインコースのUdemyでベストセラーとなっている著者の人気コース「医師が教えるR言語での医療データ分析入門」をベースとし、Excelでのデータ加工と集計に特化して作成されました。オンラインでのレクチャー同様、「語りかける」ように解説します。

著者は企業の産業医をするかたわら、データの処理や分析を行ってきました。その中で、Excelより効率的にデータの加工・分析ができる、Rと出会いました。Rを普及させたい! そんな思いで本書を執筆しました。
Excelより効率的にデータを加工して、周りと差をつけたい。プログラミングに興味あるし、実務にも生かしてみたい。そんなあなたに、本書は最適な導入となるはずです。

↓全て表示↑少なく表示
 
  

Rではじめるデータサイエンス

Rではじめるデータサイエンス
(著)Hadley Wickham, Garrett Grolemund
発売日 2017/10/25
総合評価
(3.7)
(2022/01/25 12:07時点)
ggplot2、dplyrといったRを代表するパッケージやRStudioの開発で知られる「Rの神様」ハドリー・ウィッカムと、『RStudioではじめるRプログラミング入門』の著者ギャレット・グロールマンドによる、Rプログラミングを通してデータサイエンスの理解と知識を深めるための一冊。
Rの機能と威力を知り尽くし、また、統計とデータサイエンス教育のプロフェッショナルでもある著者たちによるわかりやすくクリアな説明は、既存のデータサイエンス入門書とは一線を画します。
データサイエンスに必要な要素とプロセス(インポート、整理、変換、可視化、モデル、コミュニケーション、プログラミング)を明確に定義し、それぞれ順を追い、各節の最後には練習問題を掲載して、ていねいに説明します。データサイエンティストを目指すなら必読の一冊です。
 
目次
第1部 探索(ggplot2によるデータ可視化
ワークフロー:基本 ほか)
第2部 データラングリング(tibbleのtibble
readrによるデータインポート ほか)
第3部 プログラム(magrittrでパイプ
関数 ほか)
第4部 モデル(modelrを使ったモデルの基本
モデル構築 ほか)
第5部 コミュニケーション(Rマークダウン
ggplot2でコミュニケーションのためのグラフ作成 ほか)

↓全て表示↑少なく表示
Users Voice
tidyverseは今まで作図に困ったときにググって出てきたggplotのコードを改変して使う程度だったが、この本でtidyverseの全体を見渡すことが出来た。 これまでオリジナルのデータフレームを使っていたが、これからはtibbleを使っていくつもり。 解析に困ったらまた見返すことになると思う。 面倒がって練習問題は目についたのしかやってないが、gitbookに解答があることに後半になって気付いた。 素のデータフレームとか勉強するより最初からtidyverseを勉強した方が良かった気がしている。 (参考:honto)

↓全て表示 ↑少なく表示
問題を飛ばして1周目完走。次は、問題を解きつつ、2周目。 (参考:honto)

↓全て表示 ↑少なく表示
著者略歴
ウィッカム,ハドリー(Wickham,Hadley)
RStudioのチーフサイエンティストでR Foundationのメンバー。データサイエンスをより簡単に、より迅速に、より楽しく行うための計算および認識に関わるツールを開発。その業績にはデータサイエンス用パッケージtidyverse(ggplot2、dplyr、tidyr、purrr、readrなど)や原則に基づいたソフトウェア開発用パッケージ(roxygen2、testthat、devtools)がある。データサイエンスのためのR利用で促することに関する、著者、教育者、スピーカーでもある

グロールマンド,ギャレット(Grolemund,Garrett)
統計学者、教師、R開発者。RStudioに勤務。有名なlubridateパッケージの開発や、『Hands-on programming with R』(邦題『RStudioではじめるRプログラミング入門』大橋真也監訳、長尾高弘訳、オライリー・ジャパン、2015)の著者。DataCamp.comやoreilly.com/safariにおける常連のRインストラクターであり、Google、eBay、Rocheといった名だたる企業でRとデータサイエンスを教えている

黒川利明(クロカワトシアキ)
1972年、東京大学教養学部基礎科学科卒。東芝(株)、新世代コンピュータ技術開発機構、日本IBM、(株)CSK(現SCSK(株))、金沢工業大学を経て、2013年よりデザイン思考教育研究所主宰。過去に文部科学省科学技術政策研究所客員研究官として、ICT人材育成やビッグデータ、クラウド・コンピューティングに関わり、現在情報規格調査会SC22 C#、CLI、スクリプト系言語SG主査として、C#、CLI、ECMAScript、JSONなどのJIS作成、標準化に携わっている

大橋真也(オオハシシンヤ)
千葉大学理学部数学科卒業、千葉大学大学院教育研究科修士課程修了。千葉県公立高等学校教諭。千葉大学非常勤講師、Apple Distinguished Educator、Wolfram Education Group、日本数式処理学会、CIEC(コンピュータ利用教育学会)。現在、千葉県立千葉中学校・千葉高等学校数学科教諭(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

Rグラフィックスクックブック 第2版 ―ggplot2によるグラフ作成のレシピ集

オープンソースの統計解析用のプログラミング言語、Rの強力な描画用パッケージggplot2を使ってさまざまなグラフを作成するためのレシピ集です。
棒グラフや折れ線グラフ、散布図といった基本的なグラフから、複雑なグラフや地図の作成方法だけでなく、きめ細かいカスタマイズ方法、効果的な使い方、色の使い方の注意、さらには文書用データへの変換方法まで、グラフに関することはほとんど網羅しています。
実際の「やりたいこと」に応じた解決法を提示。描きたいグラフがすぐに描ける実用的な一冊です。
 
  

RStudioではじめるRプログラミング入門

RStudioではじめるRプログラミング入門
(著)Garrett Grolemund
発売日 2015/03/25
総合評価
(4.2)
(2022/01/25 12:05時点)
「統計を使わずに、Rを純粋にプログラミング言語として学ぼう」というコンセプトに基づいて書かれた本書は、
統計学についての難しい知識がなくても、また、プログラミングの経験があまりなくても、
プログラミングを学んでみようという意欲さえあれば読むことのできる、画期的な書籍です。
サイコロを作る、トランプゲームを作る、スロットマシンを作る、という3つの簡単なプロジェクトに取り組む過程で、
Rのプログラミング統合環境、RStudioを活用し、楽しみながら効率的にRのプログラミングスキルを身に付けていきます。
統計だけに使うのはもったいない、Rのプログラミング言語としての隠れた魅力と可能性、さらにはデータサイエンスの基礎としてのデータ分析を紹介します。
 
内容サンプル

(引用元Amazon)

 
目次
1部 プロジェクト1:ウェイトをかけたサイコロ(基本中の基本
パッケージとヘルプページ)
2部 プロジェクト2:トランプ(Rのオブジェクト
Rの記法
値の書き換え
環境)
3部 プロジェクト3:スロットマシン(プログラム
S3
ループ
スピード)
付録
Users Voice
データ分析のためにRを使いたいと思うなら、この本を読んでみると良いと思います。R言語を使うとどういうことが出来るのかを知ることで、単純な操作をミスなく自動化できたり、再現性のある解析が出来るようになるはずです。GUIでポチポチするより、断然こっちが良いと感じます。6章と8章はR言語の仕組みやプログラミングに関連する要素(?)が多く、少し難しかったです。データ分析のためにRの勉強をしてみようかな、という人は飛ばしても差し支えないと思います。それにしても勉強になった。一冊やると、自信がつきますね。 (参考:honto)

↓全て表示 ↑少なく表示
予想以上に充実した内容でした。非常に分かり易く、とても勉強になりました。最近のデータサイエンスではPythonの方が人気あるようですが、Rはまた別の面白さがあるように思います。この本は統計用のプログラミング言語の、言語の部分だけに焦点を絞ったものなので、統計での利用に関しては近いうちに別の本を読んでみる予定です。 (参考:honto)

↓全て表示 ↑少なく表示
今までRは単純に統計ソフトとして使って、必要な時にはネットにある達人の方々のスクリプトをそのまま使っていた。けれど、やることが複雑になるにつれてスクリプトの内容やデータ型についても理解が必要になってこの本にたどり着いた。順を追った丁寧な説明で,ようやく中身が理解でき始めた気がする。これからも折に触れて読み返すことになるだろう。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴
グロールマンド,ギャレット(Grolemund,Garrett)
統計学者であり、教師であり、R開発者。現在はRStudioに勤務

大橋真也(オオハシシンヤ)
千葉大学理学部数学科卒業、同教育学部教育学研究科修了。千葉県公立高等学校教諭。Apple Distinguished Educator、Wolfram Education Group Instructor、日本数式処理学会、CIEC(コンピュータ利用教育学会)。現在、千葉県立啓明高等学校数学科・情報科教諭

長尾高弘(ナガオタカヒロ)
1960年千葉県生まれ。東京大学教育学部卒。株式会社ロングテール社長(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...

「基本をより実践的に!」学べる新シリーズの第一弾は、「統計モデリングの世界」へのファーストブック。基礎から学べる超入門!
・チュートリアル形式だから、すぐに実践できる!
・統計、確率、ベイズ推論、MCMCの基本事項から、やさしくサポート!
・brmsやbayesplotなどのパッケージの使い方も、しっかり身につく!
・一般化線形モデル(GLM)→一般化線形混合モデル(GLMM)→動的線形モデル(DLM)→動的一般化線形モデル(DGLM)を体系的に学べる!
【本書のサポートページ】
https://logics-of-blue.com/r-stan-bayesian-model-intro-book-support/

【実践Data Scienceシリーズ】
「基本をより実践的に!」を合言葉に、データサイエンスで用いられる各種手法の基本を、プログラミングの実装とともに解説していきます。はじめて学ぶ大学生、大学院生、ソフトウェアエンジニアに向けた注目の新シリーズです。

【主な内容】
1部 【理論編】ベイズ統計モデリングの基本
1 はじめよう! ベイズ統計モデリング
2 統計学の基本
3 確率の基本
4 確率分布の基本
5 統計モデルの基本
6 ベイズ推論の基本
7 MCMCの基本

2部 【基礎編】RとStanによるデータ分析
1 Rの基本
2 データの要約
3 ggplot2によるデータの可視化
4 Stanの基本
5 MCMCの結果の評価
6 Stanコーディングの詳細

3部 【実践編】一般化線形モデル
1 一般化線形モデルの基本
2 単回帰モデル
3 モデルを用いた予測
4 デザイン行列を用いた一般化線形モデルの推定
5 brmsの使い方
6 ダミー変数と分散分析モデル
7 正規線形モデル
8 ポアソン回帰モデル
9 ロジスティック回帰モデル
10 交互作用

4部 【応用編】一般化線形混合モデル
1 階層ベイズモデルと一般化線形混合モデルの基本
2 ランダム切片モデル
3 ランダム係数モデル

5部 【応用編】状態空間モデル
1 時系列分析と状態空間モデルの基本
2 ローカルレベルモデル
3 状態空間モデルによる予測と補間
4 時変係数モデル
5 トレンドの構造
6 周期性のモデル化
7 自己回帰モデルとその周辺
8 動的一般化線形モデル:二項分布を仮定した例
9 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1部 【理論編】ベイズ統計モデリングの基本
第1章 はじめよう! ベイズ統計モデリング
第2章 統計学の基本
第3章 確率の基本
第4章 確率分布の基本
第5章 統計モデルの基本
第6章 ベイズ推論の基本
第7章 MCMCの基本
第2部 【基礎編】RとStanによるデータ分析
第1章 Rの基本
第2章 データの要約
第3章 ggplot2によるデータの可視化
第4章 Stanの基本
第5章 MCMCの結果の評価
第6章 Stanコーディングの詳細
第3部 【実践編】一般化線形モデル
第1章 一般化線形モデルの基本
第2章 単回帰モデル
第3章 モデルを用いた予測
第4章 デザイン行列を用いた一般化線形モデルの推定
第5章 brmsの使い方
第6章 ダミー変数と分散分析モデル
第7章 正規線形モデル
第8章 ポアソン回帰モデル
第9章 ロジスティック回帰モデル
第10章 交互作用
第4部 【応用編】一般化線形混合モデル
第1章 階層ベイズモデルと一般化線形混合モデルの基本
第2章 ランダム切片モデル
第3章 ランダム係数モデル
第5部 【応用編】状態空間モデル
第1章 時系列分析と状態空間モデルの基本
第2章 ローカルレベルモデル
第3章 状態空間モデルによる予測と補間
第4章 時変係数モデル
第5章 トレンドの構造
第6章 周期性のモデル化
第7章 自己回帰モデルとその周辺
第8章 動的一般化線形モデル:二項分布を仮定した例
第9章 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
Users Voice
ベイズモデリングの見通しが良くなった。 数式は最小限で、実際にコードを書いて結果を見ながら何をしているのかを学んでいくというコンセプト。 あえて理論的な小難しい話には立ちいらず、雰囲気を掴んでいけるため、これからベイズ統計モデリングを学んでいくにあたり非常にためになる一冊であった。 簡単なモデルから出発し、章を追うごとに組み合わせるパーツを増やしていくため、とても読みやすい。 (参考:honto)

↓全て表示 ↑少なく表示
かなりわかりやすい。brmsではなくstanを中心にコードを解説してほしかった気もするが。 (参考:honto)

↓全て表示 ↑少なく表示
Stanのコードを動かしながらベイズ統計について学ぶ本です。初心者向けではありますが必要な箇所には数式もあってベイズを使った統計モデリングが理解しやすく良い本かと思います(分かりやすいのはモデルを書き下すStanの特性も多分にあると思いますが)。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

著:馬場 真哉
Logics of Blue(https://logics-of-blue.com/)というWebサイトの管理人

著 書『平均・分散から始める一般化線形モデル入門』(プレアデス出版,2015年)
    『時系列分析と状態空間モデルの基礎:RとStanで学ぶ理論と実装』(プレアデス出版,2018年)
    『Pythonで学ぶあたらしい統計学の教科書』(翔泳社,2018年)


  

サラっとできる!フリー統計ソフトEZR(Easy R)でカンタン統計解析

統計解析の定番ソフト「R」が、EZR(Easy R)で手軽に使いこなせる!
本書は、統計解析の定番ソフト「R」がGUIで使いこなせる「EZR(Easy R)」を活用して、初心者でも手軽に統計解析ができる方法を解説する入門書です。
EZRを使えば、コンソール入力を行わなくても、マウスでサクサク解析を進めることができます。しかも、EZRの開発者である著者が専門とする医療分野を中心に、統計解析の現場で活用されている本格的なパッケージなので、安心して使うことができます。
本書では、多くの方に親しみやすいテーマを扱いながら、日常生活から実務まで役立つ統計解析の基本的な考え方をやさしく解説するとともに、サンプルデータを用いたわかりやすい事例をとおして、EZRを操作しながら統計解析手法の基本を押さえることができます。
EZRと本書で、サラっとカンタンに、統計解析を始めましょう!
 
目次
第1部 探索(ggplot2によるデータ可視化
ワークフロー:基本 ほか)
第2部 データラングリング(tibbleのtibble
readrによるデータインポート ほか)
第3部 プログラム(magrittrでパイプ
関数 ほか)
第4部 モデル(modelrを使ったモデルの基本
モデル構築 ほか)
第5部 コミュニケーション(Rマークダウン
ggplot2でコミュニケーションのためのグラフ作成 ほか)

↓全て表示↑少なく表示
著者略歴
ウィッカム,ハドリー(Wickham,Hadley)
RStudioのチーフサイエンティストでR Foundationのメンバー。データサイエンスをより簡単に、より迅速に、より楽しく行うための計算および認識に関わるツールを開発。その業績にはデータサイエンス用パッケージtidyverse(ggplot2、dplyr、tidyr、purrr、readrなど)や原則に基づいたソフトウェア開発用パッケージ(roxygen2、testthat、devtools)がある。データサイエンスのためのR利用で促することに関する、著者、教育者、スピーカーでもある

グロールマンド,ギャレット(Grolemund,Garrett)
統計学者、教師、R開発者。RStudioに勤務。有名なlubridateパッケージの開発や、『Hands-on programming with R』(邦題『RStudioではじめるRプログラミング入門』大橋真也監訳、長尾高弘訳、オライリー・ジャパン、2015)の著者。DataCamp.comやoreilly.com/safariにおける常連のRインストラクターであり、Google、eBay、Rocheといった名だたる企業でRとデータサイエンスを教えている

黒川利明(クロカワトシアキ)
1972年、東京大学教養学部基礎科学科卒。東芝(株)、新世代コンピュータ技術開発機構、日本IBM、(株)CSK(現SCSK(株))、金沢工業大学を経て、2013年よりデザイン思考教育研究所主宰。過去に文部科学省科学技術政策研究所客員研究官として、ICT人材育成やビッグデータ、クラウド・コンピューティングに関わり、現在情報規格調査会SC22 C#、CLI、スクリプト系言語SG主査として、C#、CLI、ECMAScript、JSONなどのJIS作成、標準化に携わっている

大橋真也(オオハシシンヤ)
千葉大学理学部数学科卒業、千葉大学大学院教育研究科修士課程修了。千葉県公立高等学校教諭。千葉大学非常勤講師、Apple Distinguished Educator、Wolfram Education Group、日本数式処理学会、CIEC(コンピュータ利用教育学会)。現在、千葉県立千葉中学校・千葉高等学校数学科教諭(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

   

R言語の本 最新・高評価のおすすめの5冊

以下が「R言語の本」最新・高評価のおすすめの5冊詳細です。

(2022/01/25 12:07 更新)
Rank製品価格
1
2,970円
2,970円
2,970円
2
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
3,278円
3,278円
3,278円
3
RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】...
発売日 2021/04/26
有賀 友紀, 大橋 俊介 (技術評論社)
総合評価
(4.6)
3,982円
3,783円
3,982円
3,982円
4
Rによる機械学習[第3版]
発売日 2021/02/10
Brett Lantz (翔泳社)
総合評価
(4.6)
4,180円
3,971円
4,180円
4,180円
5
3,520円
3,520円
3,520円
 

自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)

近年,Rなどのオープンソースのデータ解析環境が整ってきており,これらを活用することで,実験・測定・調査を行った結果に対して,研究者自身の手で高度な分析手法を適用できるようになった。
しかし,自然科学研究の多様化に伴い,研究者が扱わなければいけないデータの種類や量は増える一方である。また,データ解析手順も複雑化している。そのため自然科学系の実験分野においても,データ解析の再現性の重要性は高まっている。
Rでは解析の再現性を保証する方法としてRMarkdownが広く活用されている。その方法は本シリーズ第3巻『再現可能性のすゝめ』で詳しく解説されているが,本書はその実践集である。自然科学分野で主に取り扱うデータを想定した上で,RおよびRStudioを活用して,実験ノートやレポートをまとめあげる方法を,本書では具体例をあげつつ詳しく説明している。
 
目次
Chapter 1 はじめに
1.1 RMarkdown
1.2 sessioninfoによるバージョン情報の確認
1.3 プロジェクトの作成
1.4 本章のまとめと参考文献
Chapter 2 基本的な統計モデリング―要因と目的変数の関係解析(1)
2.1 データの読み込み・概観チェック・集計・可視化
2.2 【レポート例2-1】
2.3 検定・相関解析
2.4 統計モデリング第一歩
2.5 【レポート例2-2】
2.6 本章のまとめと参考文献
Chapter 3 発展的な統計モデリング―要因と目的変数の関係解析(2)
3.1 データの読み込み・集計・可視化
3.2 【レポート例3-1】
3.3 検定
3.4 統計モデリング
3.5 【レポート例3-2】
3.6 本章のまとめと参考文献
Chapter 4 実験計画法と分散分析
4.1 一元配置分散分析―One-way ANOVAによる精製カラムの検討
4.2 二元配置分散分析―Two-way ANOVAによる検出器の検討
4.3 【レポート例4-1】
4.4 直交表を使った分散分析―多数の因子がある場合の組み合わせ効率化:注入口条件の最適化
4.5 分析法の検証
4.6 【レポート例4-2】
4.7 本章のまとめと参考文献
Chapter 5 機械学習―代謝産物の変動解析を例に
5.1 データの読み込み・加工・可視化・検定
5.2 機械学習による判別分析
5.3 変数重要度が上位の因子によるpathway解析および機能解析の準備
5.4 【レポート例5】
5.5 本章のまとめと参考文献
Chapter 6 実践 レポート作成―化学物質の分子記述子と物性の関係解析を例に
6.1 ファイル作成・YAML記述
6.2 本文の記述とデータの読み込み
6.3 機械学習モデル
6.4 バリデーションセットを用いた精度の検証
6.5 変数重要度
6.6 実行環境・引用文献
6.7 本章のまとめと参考文献

↓全て表示↑少なく表示
著者略歴
江口哲史(エグチアキフミ)
2013年愛媛大学理工学研究科博士後期課程修了。日本学術振興会特別研究員などを経て、千葉大学予防医学センター助教。専門、環境分析化学

石田基広(イシダモトヒロ)
1989年東京都立大学大学院博士後期課程中退。現在、徳島大学総合科学部教授。専攻、テキストマイニング(本データはこの書籍が刊行された当時に掲載されていたものです)

  

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
(著)松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛
発売日 2021/06/03
総合評価
(4.6)
(2022/01/25 12:07時点)
(概要)
2018年に刊行した通称「#宇宙本」を最新の情報に改訂!
本書は、R言語のIDEであるRStudioと、モダンなデータ分析を実現するtidyverseパッケージの入門書です。RStudioの基本機能からはじまり、Rによるデータの収集(2章)、データの整形(3章)、可視化(4章)、レポーティング(5章)といったデータ分析ワークフローの各プロセスの基礎を押さえることができます。
RStudio v1.4に対応し、新たに追加されたVisual Editor機能やRStudio v1.2で追加された「Jobs機能」などを紹介します。また、dplyr 1.0に対応し、データ処理系の関数の解説を追加しています。さらに改訂版では付録として、「stringrによる文字列データの処理」「lubridateによる日付・時刻データの処理」の2章を追加しています。
さまざまな機能が追加されていくRStudioとtidyverseに触れ、モダンなデータ分析をはじめましょう!

(こんな方におすすめ)
・R / RStudioでモダンな分析環境を手にしたい方
・分析フローを意識した業務/解析をしたい方

(目次)
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 RやRStudioで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 API
2-5 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 tidyrのその他の関数
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
A-3 正規表現
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
はじめに
 本書の特徴
 本書の構成
 本書の対象読者
 本書で解説しなかったこと
 さあRStudioで分析を
tidyverseとは
 tidyverseのパッケージ
 tidyverseの過去
 tidyverseの未来
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
 macOS
 Windows
1-2 RStudioの基本操作
 RStudioのインターフェース
 プロジェクト機能
 Rスクリプトの新規作成と保存
 Rのコマンドの実行
 オブジェクトの確認
 補完機能
 Jobs機能
1-3 RStudioを自分好みにカスタマイズ
 RStudio全般
 コーディング
 外観
 Terminal
 キーボードショートカット
1-4 ファイルの読み込み
 Rの標準関数の問題点
 readrパッケージ
 Excelファイルの読み込み
 SAS,SPSS,STATAファイルの読み込み
 RStudio(GUI)によるデータの読み込み
 ファイル読み込みのまとめ
1-5 RやRStudioで困ったときは
 ヘルプを使う
 Vignetteを見る
 チートシートを使う
 コマンドパレット
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
 スクレイピングとは
 手作業によるデータ取得の限界
2-2 スクレイピングに必要なWeb知識
 HTML
 CSS
 XMLとXPath
2-3 Rによるスクレイピング入門
 rvestパッケージ
 Webページタイトルの抽出
 パイプ演算子
 スクレイピング実践
2-4 API
 APIとは
 rtweetパッケージによるTwitterデータの収集
 ツイートの収集
 COLUMN ブラウザの自動操作
 COLUMN Webスクレイピングをするときの注意点
2-5 まとめ
 参考文献
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
 tidy dataの定義
 tidyではないデータ
3-2 tidyrによるtidy dataへの変形
 tidyではないデータ
 pivot_longer()による縦長データへの変形
 pivot_wider()による横長のデータへの変形
3-3 dplyrによる基本的なデータ操作
 tibbleとデータフレームの違い
 dplyrの関数の概要
 1つのデータフレームを操作する関数の共通点と%>%
 演算子による処理のパイプライン化
 filter()による行の絞り込み
 COLUMN dplyrの関数内でのコード実行
 arrange()によるデータの並び替え
 select()による列の絞り込み
 relocate()による列の並べ替え
 mutate()による列の追加
 summarise()によるデータの集計計算
3-4 dplyrによる応用的なデータ操作
 グループ化
 COLUMN 複数の値を返す集約関数とsummarise()
 COLUMN ウィンドウ関数
 COLUMN selectのセマンティクスとmutateのセマンティクス
 複数の列への操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
 inner_join()によるデータの結合
 さまざまなキーの指定方法
 inner_join()以外の関数によるデータの結合
 semi_join()、anti_join()による絞り込み
3-6 tidyrのその他の関数
 separate()による値の分割
 extract()による値の抽出
 separate_rows()による値の分割(縦方向)
 暗黙の欠損値
 complete()による存在しない組み合わせの検出
 COLUMN group_by()による存在しない組み合わせの表示
 fill()による欠損値の補完
 replace_na()による欠損値の置き換え
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
 準備
 エステティックマッピング
 COLUMN グラフに肉付けする
 統計的処理:stat
 COLUMN X軸に離散変数をマッピングした場合における折れ線グラフ
 配置の指定:position
 COLUMN position_dodge()とposition_dodge2()
 軸の調整
 グラフの保存
4-3 他者と共有可能な状態に仕上げる
 themeの変更
 文字サイズやフォントの変更
 配色の変更
 ラベルを変更する
4-4 便利なパッケージ
 複数のグラフを並べる
 表示される水準の順番を変更したい
4-5 まとめ
 参考文献
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
 ドキュメント作成の現場
 手作業によるドキュメント作成の問題点
5-2 R Markdown入門
 Hello, R Markdown
 Rmdファイルと処理フロー
 Markdownの基本
 Rチャンク
 ドキュメントの設定
 RStudioで使える便利なTips
 COLUMN Visual ModeによるRmdファイルの編集
5-3 出力形式
 html_document形式
 pdf_document形式
 word_document形式
 スライド出力
 R Markdownの出力形式を提供するパッケージ
 COLUMN 日本語環境での注意点
5-4 まとめ
 参考URL・参考文献
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
 str_c()による文字列の連結
 str_split()による文字列の分割
 str_detect()による文字列の判定
 COLUMN fixed()/coll()を用いた挙動の調整
 str_count()による検索対象の計上
 str_locate()による検索対象の位置の特定
 str_subset()/str_extract()による文字列の抽出
 str_sub()による文字列の抽出
 str_replace()による文字列の置換
 str_trim()/str_squish()による空白の除去
A-3 正規表現
 任意の文字や記号の検索
 高度な検索
 regex()
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
 文字列から日付・時刻への変換
 数値から日付・時刻への変換
 readrパッケージによる読み込み時の変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
 wday()を使った曜日の計算例
 floor_date()を使った週ごとの集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数
 zipanguパッケージ
 sliderパッケージ

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

他著:松村 優哉
松村優哉(まつむら ゆうや) IT企業勤務。修士(経済学)。学生時代の専門はベイズ統計学、統計的因果推論およびそれらのマーケティングへの応用。ホームページ:https://ymattu.github.io/ 仕事および趣味でRを使用し、ブログ(https://y-mattu.hatenablog.com/)にてRやPythonなどの情報を発信しているほか、Rの勉強会Tokyo.Rの運営にも携わる。著書に『データサイエンティストのための最新知識と実践 Rではじめよう![モダン]なデータ分析』(マイナビ出版, 2017)。本書の第1章、第2章を執筆。

他著:湯谷 啓明
湯谷啓明(ゆたに ひろあき) IT企業勤務。データの可視化への興味からggplot2を知り、Rを使い始める。tidyverseへのコントリビューションも多数。技術ブログ(https://notchained.hatenablog.com/)でもRに関する小ネタや最新情報を発信している。好きな言語はRと忍殺語。著書に「Rによるスクレイピング入門」(C&R研究所, 2017)、翻訳書に「Rプログラミング本格入門」(共立出版, 2017)。本書の「tidyverseとは」、第3章、付録Bを執筆。

他著:紀ノ定 保礼
紀ノ定保礼(きのさだ やすのり) 静岡理工科大学情報学部 講師。博士(人間科学)。同志社大学文化情報学部在学中にRを習うも、当時はRStudioがなく、いつしか疎遠になる。統計モデリングとtidyverseへの興味から再びRを使い始め、今ではRはなくてはならない存在に。大阪大学大学院人間科学研究科助教を経て、現職。専門は、認知心理学、交通心理学、人間工学。翻訳書に『ベイズ統計モデリング-R, JAGS, Stanによるチュートリアル-原著第2版』(共立出版, 2017)。本書の第4章と付録Aを執筆。


↓全て表示↑少なく表示

  

RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】

(概要)

本書は野村総研で開催されている全社コンサルタントとエンジニア向けのビジネスアナリティクス講座をベースにした書籍の増補改訂版です。具体的なサンプルを元にデータ分析とモデリングを進めるところが特徴です。また、統計解析や機械学習では「何ができないか」や、ビジネスデータの分析時に陥りがちな「落とし穴」など、現場で活用できる実践的な解説も満載です。改訂にあたっては、全編を最新のシステム環境に合わせてまとめ直しました。環境設定についてはコラムでも細やかにフォローし、データサイエンスと機械学習の基礎が学びやすいように進化しています。


(こんな方におすすめ)

・データ分析・統計解析や機械学習について知りたい方

・データサイエンティストになりたい方


(目次)

第1章:データサイエンス入門

 1.1:データサイエンスの基本

 1.2:データサイエンスの実践

第2章:RとPython

 2.1:RとPython

 2.2:R入門

 2.3:Python入門

 2.4:RとPythonの実行例の比較

第3章:データ分析と基本的なモデリング

 3.1:データの特徴を捉える

 3.2:データからモデルを作る

 3.3:モデルを評価する

第4章:実践的なモデリング

 4.1:モデリングの準備

 4.2:データの加工

 4.3:モデリングの手法

 4.4:因果推論

第5章:機械学習とディープラーニング

 5.1:機械学習の基本とその実行

 5.2:機械学習アルゴリズムの例

 5.3:機械学習の手順

 5.4:機械学習の実践

 5.5:ディープラーニング

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1章:データサイエンス入門
 1.1:データサイエンスの基本
  1.1.1:データサイエンスの重要性
  1.1.2:データサイエンスの定義とその歴史
  1.1.3:データサイエンスにおけるモデリング
  1.1.4:データサイエンスとその関連領域
 1.2:データサイエンスの実践
  1.2.1:データサイエンスのプロセスとタスク
  1.2.2:データサイエンスの実践に必要なツール
  1.2.3:データサイエンスの実践に必要なスキル
  1.2.4:データサイエンスの限界と課題
 コラム:ビジネス活用における留意点
第2章:RとPython
 2.1:RとPython
  2.1.1:RとPythonの比較
 2.2:R入門
  2.2.1:Rの概要
  2.2.2:Rの文法
  2.2.3:データ構造と制御構造
 2.3:Python入門
  2.3.1:Pythonの概要
  2.3.2:Pythonの文法
  2.3.3:Pythonでのプログラミング
  2.3.4:NumPyとpandas
 2.4:RとPythonの実行例の比較
  2.4.1:簡単な分析の実行例
第3章:データ分析と基本的なモデリング
 3.1:データの特徴を捉える
  3.1.1:分布の形を捉える ─ ビジュアルでの確認
  3.1.2:要約統計量を算出する ─ 代表値とばらつき
  3.1.3:関連性を把握する ─ 相関係数の使い方と意味
  3.1.4:Rを使った相関分析 ─ 自治体のデータを使った例
  3.1.5:確立分布とその利用 ─ 理論と実際の考え方
 3.2:データからモデルを作る
  3.2.1:目的変数と説明変数 ─ 説明と予測の「向き」
  3.2.2:簡単な線形回帰モデル ─ Rによる実行と結果
  3.2.3:ダミー変数を使ったモデル ─ グループ間の差異を分析
  3.2.4:複雑な線形回帰モデル ─ 交互作用,モデル間の比較
  3.2.5:線形回帰の仕組みと最小二乗法
 3.3:モデルを評価する
  3.3.1:モデルを評価するための観点
  3.3.2:この結果は偶然ではないのか? ─ 有意確率と有意差検定
  3.3.3:モデルはデータに当てはまっているか? ─ フィッティングと決定係数
  3.3.4:モデルは複雑すぎないか? ─ オーバーフィッティングと予測精度
  3.3.5:残差の分布 ─ 線形回帰モデルと診断プロット
  3.3.6:説明変数同士の相関 ─ 多重共線性
  3.3.7:標準偏回帰係数
第4章:実践的なモデリング
 4.1:モデリングの準備
  4.1.1:データの準備と加工
  4.1.2:分析とモデリングの手法
 4.2:データの加工
  4.2.1:データのクレンジング
  4.2.2:カテゴリ変数の加工
  4.2.3:数値変数の加工とスケーリング
  4.2.4:分布の形を変える ─ 対数変換とロジット変換
  4.2.5:欠損値の処理
  4.2.6:外れ値の処理
 4.3:モデリングの手法
  4.3.1:グループに分ける ─ クラスタリング
  4.3.2:指標を集約する ─ 因子分析と主成分分析
  4.3.3:一般化線形モデル(GLM)とステップワイズ法
  4.3.4:2値データを目的変数とする分析 ─ ロジスティック回帰
  4.3.5:セグメントの抽出とその特徴の分析 ─ 決定木
 4.4:因果推論
  4.4.1:データから因果関係を明らかにする ─ 統計的因果推論
  4.4.2:因果の有無の検証
  4.4.3:因果効果の推定
  4.4.4:因果関係の定式化 ─ 構造方程式モデリング
  4.4.5:因果関係の定式化 ─ 構造的因果モデル
  4.4.6:因果関係の定式化 ─ ベイズ統計モデリング
  4.4.7:因果の探索
  4.4.8:因果関係に基づく変数選択
第5章:機械学習とディープラーニング
 5.1:機械学習の基本とその実行
  5.1.1:機械学習の基本
  5.1.2:機械学習ライブラリの活用 ─ scikit-learn
  5.1.3:機械学習の実行(教師あり学習)
  5.1.4:機械学習の実行(教師なし学習)
  5.1.5:スケーリングの実行(標準化・正規化)
  5.1.6:次元の削減(主成分分析)
 コラム:機械学習と強化学習
 5.2:機械学習アルゴリズムの例
  5.2.1:k近傍法
  5.2.2:ランダムフォレスト
  5.2.3:ロジスティック回帰とリッジ回帰
  5.2.4:サポートベクターマシン(SVM)
 5.3:機械学習の手順
  5.3.1:機械学習の主要な手順
  5.3.2:ホールドアウト法による実行
  5.3.3:クロスバリデーションとグリッドサーチ
  5.3.4:閾値の調整
  5.3.5:特徴量の重要度と部分従属プロット
 5.4:機械学習の実践
  5.4.1:データの準備に関わる問題
  5.4.2:特徴抽出と特徴ベクトル
  5.4.3:機械学習の実行例
 5.5:ディープラーニング
  5.5.1:ニューラルネットワーク
  5.5.2:ディープラーニングを支える技術
  5.5.3:ディープラーニング・フレームワーク
  5.5.4:ディープラーニングの実行
  5.5.5:生成モデル

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
  

Rによる機械学習[第3版]

Rによる機械学習[第3版]
(著)Brett Lantz
発売日 2021/02/10
総合評価
(4.6)
(2022/01/25 12:07時点)
絶え間なく更新されるベストプラクティスが
「ベスト」であり続けるための基礎技術のすべて

【本書の内容】
本書は
Brett Lantz, "Machine Learning with R - Third Edition",
Packt Publishing, 2019
の邦訳版です。

本書は「機械学習」で語られることの多い手法(最近傍法や回帰法、ナイーブベイズ
や決定木を使った分類法)を網羅し、それぞれの意味や成立条件を解説します。
といっても、ゴリゴリの数式だけを使うわけではなく、既存のデータを使用し、
それら手法によって解析した結果、どのようなグラフが表示されるか、を
手取り足取りで解説してくれます。
ですから、機械学習を構成するさまざまな手法を、実際に使えるレベルで理解できる
ようになります。
そのため、自身が関わるプロジェクトにおいて、どの手法がベストプラクティスと
なるのか、無意味な分析・解析を避ける勘所がわかるようになるでしょう。
「機械学習」を学んだものの「もやもや」に付きまとわれているエンジニアに
よく効く一冊です。

【本書のポイント】
・「機械学習」と呼ばれる手法を網羅
・手法を構成する手続きやその前準備を微細に解説
・各手法のメリットとデメリットも紹介
・実際に手を動かすことで各種手法を正しく利用できるようになる

【読者が得られること】
・機械学習とその派生手法のモデルを頭の中に構築できる
・機械学習を成立させるさまざまな手法に精通できる
・プロジェクトで真に必要な手法がわかる
・(ついでに)R言語(4.x系)も習得できる

【著者について】
・Brett Lantz(ブレット・ランツ)
社会学者として教育を受けた著者は、人間の行動を理解するために10年以上に
わたってイノベーティブなデータ手法を活用してきた。
DataCampの講師であり、世界中の機械学習カンファレンスやワークショップで
たびたび講演を行っている。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
内容サンプル

(引用元Amazon)

 
  

実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得 (KS情報科学専門...

◆RとPython両方学べる。コスパ最強の一冊!◆

・コードが理解の試金石!
・「データサイエンスの準備」にページを割いているから、プログラミング経験ゼロで大丈夫!
・自分に合った言語を見つけたい、言語を乗り換えたいという方にもおすすめ!

[サポートサイト]
https://github.com/taroyabuki/fromzero

[主な内容]
第1部 データサイエンスのための準備
1章 コンピュータとネットワーク
2章 データサイエンスのための環境
3章 RとPython
4章 統計入門
5章 前処理

第2部 機械学習
6章 機械学習の目的・データ・手法
7章 回帰1(単回帰)
8章 回帰2(重回帰)
9章 分類1(多値分類)
10章 分類2(2値分類)
11章 深層学習とAutoML
12章 時系列予測
13章 教師なし学習
付録A 環境構築
 
内容サンプル

(引用元Amazon)

 
目次
第1部 データサイエンスのための準備
1章 コンピュータとネットワーク
1.1 コンピュータの基本操作
1.2 ネットワークのしくみ
2章 データサイエンスのための環境
2.1 実行環境の選択
2.2 クラウド
2.3 Docker
2.4 ターミナルの使い方
2.5 RとPython
2.6 サンプルコードの利用
3章 RとPython
3.1 入門
3.2 関数
3.3 コレクション
3.4 データフレーム
3.5 1次元データの(非)類似度
3.6 Rのパッケージ,Pythonのモジュール
3.7 反復処理
3.8 その他
4章 統計入門
4.1 記述統計
4.2 データの可視化
4.3 乱数
4.4 統計的推測
5章 前処理
5.1 データの読み込み
5.2 データの変換
第2部 機械学習
6章 機械学習の目的・データ・手法
6.1 機械学習の目的(本書の場合)
6.2 機械学習のためのデータ
6.3 機械学習の手法
7章 回帰1(単回帰)
7.1 自動車の停止距離
7.2 データの確認
7.3 回帰分析
7.4 当てはまりの良さの指標
7.5 K最近傍法
7.6 検証
7.7 パラメータチューニング
8章 回帰2(重回帰)
8.1 ブドウの生育条件とワインの価格
8.2 重回帰分析
8.3 標準化
8.4 入力変数の数とモデルの良さ
8.5 変数選択
8.6 補足:正則化
8.7 ニューラルネットワーク
9章 分類1(多値分類)
9.1 アヤメのデータ
9.2 木による分類
9.3 正解率
9.4 複数の木を使う方法
9.5 欠損のあるデータでの学習
9.6 他の分類手法
10章 分類2(2値分類)
10.1 2値分類の性能指標
10.2 トレードオフ
10.3 2値分類の実践
10.4 ロジスティック回帰
11章 深層学習とAutoML
11.1 Kerasによる回帰
11.2 Kerasによる分類
11.3 MNIST:手書き数字の分類
11.4 AutoML
12章 時系列予測
12.1 日時と日時の列
12.2 時系列データの予測
13章 教師なし学習
13.1 主成分分析
13.2 クラスタ分析
付録A 環境構築

↓全て表示↑少なく表示
著者略歴

著:辻 真吾
1998年 東京大学工学部計数工学科数理工学コース卒業
2005年 東京大学大学院工学系研究科先端学際工学専攻修了
現 在 東京大学先端科学技術研究センター 特任准教授
    情報処理技術者試験委員
著 書 『Pythonスタートブック[増補改訂版]』技術評論社(2018)
    (共著)『Pythonによるあたらしいデータ分析の教科書』翔泳社(2018)
    『Pythonで学ぶアルゴリズムとデータ構造』講談社(2019)

著:矢吹 太朗
1998年 東京大学理学部天文学科卒業
2004年 東京大学大学院新領域創成科学研究科基盤情報学専攻修了
現 在 千葉工業大学社会システム科学部プロジェクトマネジメント学科 准教授
    情報処理技術者試験委員
著 書 『Webアプリケーション構築入門(第2版)』森北出版(2011)
    『基礎からしっかり学ぶC++の教科書』日経BP社(2017)
    『Webのしくみ』サイエンス社(2020)


↓全て表示↑少なく表示

   

R言語の本「新書一覧(2020年、2021年刊行)」

IT技術・プログラミング言語は、最新情報のキャッチアップも非常に重要、すなわち新書は要チェック

ということで、2020年以降に発売したR言語の本の新書一覧(発売日の新しい順)が以下です。

(2022/01/25 12:07 更新)
製品価格
Rが生産性を高める〜データ分析ワークフロー効率化の実践
発売日 2022/01/26
igjit, atusy, hanaori (技術評論社)
3,190円
(+124pt)
3,190円
3,190円
3,278円
3,278円
3,278円
3,520円
3,520円
3,520円
3,300円
3,300円
3,300円
データサイエンスのための Rプログラミングスキル
発売日 2021/07/07
Michael Freeman, Joel Ross (共立出版)
5,280円
(+159pt)
5,280円
5,280円
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
3,278円
3,278円
3,278円
RとPythonで学ぶ統計学入門
発売日 2021/05/24
増井敏克 (オーム社)
総合評価
(4.2)
3,300円
3,135円
3,300円
3,300円
RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】...
発売日 2021/04/26
有賀 友紀, 大橋 俊介 (技術評論社)
総合評価
(4.6)
3,982円
3,783円
3,982円
3,982円
Rによる機械学習[第3版]
発売日 2021/02/10
Brett Lantz (翔泳社)
総合評価
(4.6)
4,180円
3,971円
4,180円
4,180円
サラっとできる!フリー統計ソフトEZR(Easy R)でカンタン統計解析...
発売日 2020/11/16
善伸, 神田 (オーム社)
総合評価
(4.3)
2,860円
2,574円
2,860円
2,860円
 

R言語の本「Kindle Unlimited 読み放題 人気本ランキング」

「Kindle Unlimited」は、Amazonの定額本読み放題サービス。

最近はKindle Unlimitedで読める本もどんどん増えており、雑誌、ビジネス書、実用書などは充実のラインナップ。

以下がKindle Unlimitedで読み放題となるR言語の本の一覧です。

30日無料体験も可能なので、読みたい本があれば体験期間で無料で読むことも可能です。

(2022/01/25 12:07 更新)
Rank製品価格
1
実践入門!ゼロから学ぶR言語
発売日 2020/03/28
きのこ
Kindle Unlimited対象
総合評価
(3.5)
350円
 

関連:Python・データ解析系の本

以下ではRと同じくデータ解析・統計分析に有用なPythonと、機械学習・データ解析系の本をまとめています、合わせてのぞいて見てください。

関連:最新おすすめのKindle端末

以下では最新のKindle端末について比較、おすすめ紹介しています、合わせてのぞいて見てください。

いじょうでっす。

コメント

タイトルとURLをコピーしました