【2023年最新】R言語の本「人気・高評価のおすすめ15冊」

こちらでは、データ解析・統計分析などに有用なプログラミング言語「R言語」に関する人気・高評価のおすすめ本を紹介していきます。

 

 

  1. R言語の本 人気ランキング/10冊詳細
    1. Rによる多変量解析入門 データ分析の実践と理論
    2. 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
    3. 入門 機械学習による異常検知―Rによる実践ガイド
    4. 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...
    5. Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎知識
    6. RとPythonで学ぶ統計学入門
    7. The R Tips 第3版 データ解析環境Rの基本技・グラフィックス活用集
    8. 前処理大全[データ分析のためのSQL/R/Python実践テクニック]
    9. Rによる教育データ分析入門
    10. RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】
  2. R言語の本 最新・高評価のおすすめの5冊
    1. 自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)
    2. 改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
    3. RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】
    4. Rによる機械学習[第3版]
    5. 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...
  3. R言語の本「新書一覧(2021年、2022年刊行)」
  4. R言語の本「Kindle Unlimited 読み放題 人気本ランキング」
  5. 関連:Python・データ解析系の本
 

Kindle Unlimited 1ヶ月無料

kindle_unlimited_sale
 
  • 1ヶ月無料で読み放題
  • 1ヶ月以内でも解約可能
  • 解約後も1ヶ月まで利用可


 

R言語の本 人気ランキング/10冊詳細

以下が「R言語の本」人気ランキングと人気の10冊詳細です。

ランキングはAmazonの書籍売上ランキングに基づき毎日更新されています。

(2023/05/15 12:10 更新)
Rank製品価格
1
Rによる多変量解析入門 データ分析の実践と理論
発売日 2018/07/19
川端 一光, 岩間 徳兼, 鈴木 雅之 (オーム社)
総合評価
(4.3)
3,740円
(+136pt)
3,366円
3,740円
3,740円
2
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
(+119pt)
3,278円
3,278円
3,278円
3
入門 機械学習による異常検知―Rによる実践ガイド
発売日 2015/02/19
剛, 井手 (コロナ社)
総合評価
(4.2)
4,180円
4,180円
4,180円
4
3,300円
(+120pt)
3,300円
(+279pt)
3,300円
3,300円
5
3,278円
3,278円
3,278円
6
RとPythonで学ぶ統計学入門
発売日 2021/05/27
増井敏克 (オーム社)
総合評価
(4.3)
3,300円
(+120pt)
2,970円
3,300円
3,300円
7
The R Tips 第3版 データ解析環境Rの基本技・グラフィックス活用集...
発売日 2017/07/14
舟尾暢男 (オーム社)
総合評価
(4.7)
3,960円
(+144pt)
3,564円
3,960円
3,960円
8
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
発売日 2018/04/13
本橋 智光 (技術評論社)
総合評価
(4.1)
3,300円
(+120pt)
3,300円
3,300円
3,300円
9
Rによる教育データ分析入門
発売日 2020/09/14
雄一郎, 小林, 彰, 濱田, 篤, 水本 (オーム社)
総合評価
(3.9)
3,080円
(+112pt)
2,772円
3,080円
3,080円
10
RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】...
発売日 2021/05/06
有賀 友紀, 大橋 俊介 (技術評論社)
総合評価
(4.6)
3,982円
(+144pt)
3,783円
(+137pt)
3,982円
3,982円
 

Rによる多変量解析入門 データ分析の実践と理論

Rによる多変量解析入門 データ分析の実践と理論
(著)川端 一光, 岩間 徳兼, 鈴木 雅之
発売日 2018/07/19
総合評価
(4.3)
(2023/05/15 12:10時点)
多変量解析手法の理論と実践をバランスよく習得できる!
様々な媒体、経路を通じて大規模データが、驚くほど低コストで入手できるようになった現在、多変量解析手法に習熟したデータサイエンティストに対する学術界、ビジネス界からのニーズは非常に高まっており、これに対して大学や企業では、高いデータ解析力を持った人材の育成に注力し始めています。しかし、多くの多変量解析についての学習書は、理論的な説明に終始し、実務場面でどのように利用されているかについて、殆ど配慮がない野が現状です。
そこで本書は、多変量解析手法の理論と実践をバランスよく解説することで、統計が得意ではない大学生や実務者にも利用しやすい構成とし、本書1冊で多変量解析手法を実務に応用できるまで習得できる内容となっています。
 
内容サンプル

(引用元楽天Books)

 
目次
第Ⅰ部 多変量解析入門
第1章 Rによる多変量データの基本的な統計処理
第2章 Rによるデータハンドリング
第Ⅱ部 量的変数の予測
第3章 どの要因が影響しているのかが知りたい①―重回帰分析―
第4章 どの要因が影響しているのかが知りたい②―階層的重回帰分析―
第5章 様々な集団から得られたデータを分析したい―マルチレベルモデル―
第6章 複雑な統計的仮説を統計モデルとして表したい① ―パス解析―
第Ⅲ部 尺度の分析
第7章 尺度を科学的に開発したい―探索的因子分析―
第8章 尺度を科学的に開発したい―確認的因子分析―
第9章 複雑な統計的仮説を統計モデルとして表したい② ―潜在変数を伴うパス解析―
第Ⅳ部 質的変数の予測
第10章 クロス集計表をもっと丁寧に分析したい―対数線形モデル―
第11章 質的結果を予測したい―ロジスティック回帰分析―
第Ⅴ部 個体と変数の分類
第12章 傾向が似ているものを分類したい―クラスタ―分析―
第13章 質的変数間の連関を視覚化したい―コレスポンデンス分析―
第Ⅵ部 多変量解析を使いこなす
第14章 多変量データのもつ情報を効率的に可視化したい
第15章 多変量解析手法を実践で生かすために

↓全て表示↑少なく表示
Users Voice
大学生で学ぶ子どもが必要という事で代理購入。近所の本屋では取り扱いがなくこちらで購入できて良かった!何軒も本屋を探し回るよりもこちらで、しかもPayPay払い、Tポイントのポイントバックもあって安く購入できてよかったです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
どのような場面でどのような多変量解析手法を適用すればよいか、Rによる実装例とともに網羅的に書かれた一冊。辞書的に使えそう。手法:多変量データの記述統計と推測統計・Rによるデータハンドリング・重回帰分析・階層的重回帰分析・マルチレベルモデル・パス解析・探索的因子分析・確認的因子分析・潜在変数を伴うパス解析・対数線形モデル・ロジスティック回帰分析・クラスター分析・コレスポンデンス分析・ggplot2によるグラフ描画 (参考:honto)

↓全て表示 ↑少なく表示
一通りの多変量分析手法がのっている。 前半はplot関数だが、14章はggplot2に沿って書かれている。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元楽天Books)

 
著者略歴
川端一光(カワハシイッコウ)
2008年早稲田大学大学院文学研究科博士後期課程単位取得退学、博士(文学)。現在、明治学院大学心理学部准教授。専門、心理統計学・教育測定学

岩間徳兼(イワマノリカズ)
2011年早稲田大学大学院文学研究科博士後期課程修了、博士(文学)。現在、北海道大学高等教育推進機構講師。専門、心理統計学・教育測定学

鈴木雅之(スズキマサユキ)
2013年東京大学大学院教育学研究科博士課程修了、博士(教育学)。現在、横浜国立大学教育学部准教授。専門、教育心理学(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
(著)松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛
発売日 2021/06/03
総合評価
(4.6)
(2023/05/15 12:10時点)
(概要)
2018年に刊行した通称「#宇宙本」を最新の情報に改訂!
本書は、R言語のIDEであるRStudioと、モダンなデータ分析を実現するtidyverseパッケージの入門書です。RStudioの基本機能からはじまり、Rによるデータの収集(2章)、データの整形(3章)、可視化(4章)、レポーティング(5章)といったデータ分析ワークフローの各プロセスの基礎を押さえることができます。
RStudio v1.4に対応し、新たに追加されたVisual Editor機能やRStudio v1.2で追加された「Jobs機能」などを紹介します。また、dplyr 1.0に対応し、データ処理系の関数の解説を追加しています。さらに改訂版では付録として、「stringrによる文字列データの処理」「lubridateによる日付・時刻データの処理」の2章を追加しています。
さまざまな機能が追加されていくRStudioとtidyverseに触れ、モダンなデータ分析をはじめましょう!

(こんな方におすすめ)
・R / RStudioでモダンな分析環境を手にしたい方
・分析フローを意識した業務/解析をしたい方

(目次)
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 RやRStudioで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 API
2-5 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 tidyrのその他の関数
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
A-3 正規表現
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
はじめに
 本書の特徴
 本書の構成
 本書の対象読者
 本書で解説しなかったこと
 さあRStudioで分析を
tidyverseとは
 tidyverseのパッケージ
 tidyverseの過去
 tidyverseの未来
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
 macOS
 Windows
1-2 RStudioの基本操作
 RStudioのインターフェース
 プロジェクト機能
 Rスクリプトの新規作成と保存
 Rのコマンドの実行
 オブジェクトの確認
 補完機能
 Jobs機能
1-3 RStudioを自分好みにカスタマイズ
 RStudio全般
 コーディング
 外観
 Terminal
 キーボードショートカット
1-4 ファイルの読み込み
 Rの標準関数の問題点
 readrパッケージ
 Excelファイルの読み込み
 SAS,SPSS,STATAファイルの読み込み
 RStudio(GUI)によるデータの読み込み
 ファイル読み込みのまとめ
1-5 RやRStudioで困ったときは
 ヘルプを使う
 Vignetteを見る
 チートシートを使う
 コマンドパレット
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
 スクレイピングとは
 手作業によるデータ取得の限界
2-2 スクレイピングに必要なWeb知識
 HTML
 CSS
 XMLとXPath
2-3 Rによるスクレイピング入門
 rvestパッケージ
 Webページタイトルの抽出
 パイプ演算子
 スクレイピング実践
2-4 API
 APIとは
 rtweetパッケージによるTwitterデータの収集
 ツイートの収集
 COLUMN ブラウザの自動操作
 COLUMN Webスクレイピングをするときの注意点
2-5 まとめ
 参考文献
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
 tidy dataの定義
 tidyではないデータ
3-2 tidyrによるtidy dataへの変形
 tidyではないデータ
 pivot_longer()による縦長データへの変形
 pivot_wider()による横長のデータへの変形
3-3 dplyrによる基本的なデータ操作
 tibbleとデータフレームの違い
 dplyrの関数の概要
 1つのデータフレームを操作する関数の共通点と%>%
 演算子による処理のパイプライン化
 filter()による行の絞り込み
 COLUMN dplyrの関数内でのコード実行
 arrange()によるデータの並び替え
 select()による列の絞り込み
 relocate()による列の並べ替え
 mutate()による列の追加
 summarise()によるデータの集計計算
3-4 dplyrによる応用的なデータ操作
 グループ化
 COLUMN 複数の値を返す集約関数とsummarise()
 COLUMN ウィンドウ関数
 COLUMN selectのセマンティクスとmutateのセマンティクス
 複数の列への操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
 inner_join()によるデータの結合
 さまざまなキーの指定方法
 inner_join()以外の関数によるデータの結合
 semi_join()、anti_join()による絞り込み
3-6 tidyrのその他の関数
 separate()による値の分割
 extract()による値の抽出
 separate_rows()による値の分割(縦方向)
 暗黙の欠損値
 complete()による存在しない組み合わせの検出
 COLUMN group_by()による存在しない組み合わせの表示
 fill()による欠損値の補完
 replace_na()による欠損値の置き換え
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
 準備
 エステティックマッピング
 COLUMN グラフに肉付けする
 統計的処理:stat
 COLUMN X軸に離散変数をマッピングした場合における折れ線グラフ
 配置の指定:position
 COLUMN position_dodge()とposition_dodge2()
 軸の調整
 グラフの保存
4-3 他者と共有可能な状態に仕上げる
 themeの変更
 文字サイズやフォントの変更
 配色の変更
 ラベルを変更する
4-4 便利なパッケージ
 複数のグラフを並べる
 表示される水準の順番を変更したい
4-5 まとめ
 参考文献
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
 ドキュメント作成の現場
 手作業によるドキュメント作成の問題点
5-2 R Markdown入門
 Hello, R Markdown
 Rmdファイルと処理フロー
 Markdownの基本
 Rチャンク
 ドキュメントの設定
 RStudioで使える便利なTips
 COLUMN Visual ModeによるRmdファイルの編集
5-3 出力形式
 html_document形式
 pdf_document形式
 word_document形式
 スライド出力
 R Markdownの出力形式を提供するパッケージ
 COLUMN 日本語環境での注意点
5-4 まとめ
 参考URL・参考文献
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
 str_c()による文字列の連結
 str_split()による文字列の分割
 str_detect()による文字列の判定
 COLUMN fixed()/coll()を用いた挙動の調整
 str_count()による検索対象の計上
 str_locate()による検索対象の位置の特定
 str_subset()/str_extract()による文字列の抽出
 str_sub()による文字列の抽出
 str_replace()による文字列の置換
 str_trim()/str_squish()による空白の除去
A-3 正規表現
 任意の文字や記号の検索
 高度な検索
 regex()
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
 文字列から日付・時刻への変換
 数値から日付・時刻への変換
 readrパッケージによる読み込み時の変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
 wday()を使った曜日の計算例
 floor_date()を使った週ごとの集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数
 zipanguパッケージ
 sliderパッケージ

↓全て表示↑少なく表示
Users Voice
とても迅速に発送していただき、すぐに手元に届きました。内容もR studioについて詳細に掘り下げてありとても分かりやすかったです。活用していきたいです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

他著:松村 優哉
松村優哉(まつむら ゆうや) IT企業勤務。修士(経済学)。学生時代の専門はベイズ統計学、統計的因果推論およびそれらのマーケティングへの応用。ホームページ:https://ymattu.github.io/ 仕事および趣味でRを使用し、ブログ(https://y-mattu.hatenablog.com/)にてRやPythonなどの情報を発信しているほか、Rの勉強会Tokyo.Rの運営にも携わる。著書に『データサイエンティストのための最新知識と実践 Rではじめよう![モダン]なデータ分析』(マイナビ出版, 2017)。本書の第1章、第2章を執筆。

他著:湯谷 啓明
湯谷啓明(ゆたに ひろあき) IT企業勤務。データの可視化への興味からggplot2を知り、Rを使い始める。tidyverseへのコントリビューションも多数。技術ブログ(https://notchained.hatenablog.com/)でもRに関する小ネタや最新情報を発信している。好きな言語はRと忍殺語。著書に「Rによるスクレイピング入門」(C&R研究所, 2017)、翻訳書に「Rプログラミング本格入門」(共立出版, 2017)。本書の「tidyverseとは」、第3章、付録Bを執筆。

他著:紀ノ定 保礼
紀ノ定保礼(きのさだ やすのり) 静岡理工科大学情報学部 講師。博士(人間科学)。同志社大学文化情報学部在学中にRを習うも、当時はRStudioがなく、いつしか疎遠になる。統計モデリングとtidyverseへの興味から再びRを使い始め、今ではRはなくてはならない存在に。大阪大学大学院人間科学研究科助教を経て、現職。専門は、認知心理学、交通心理学、人間工学。翻訳書に『ベイズ統計モデリング-R, JAGS, Stanによるチュートリアル-原著第2版』(共立出版, 2017)。本書の第4章と付録Aを執筆。


↓全て表示↑少なく表示

  

入門 機械学習による異常検知―Rによる実践ガイド

入門 機械学習による異常検知―Rによる実践ガイド
(著)剛, 井手
発売日 2015/02/19
総合評価
(4.2)
(2023/05/15 12:10時点)
 
内容サンプル

(引用元Amazon)

 
目次
1 異常検知の基本的な考え方
2 正規分布に従うデータからの異常検知
3 非正規データからの異常検知
4 性能評価の方法
5 不要な次元を含むデータからの異常検知
6 入力と出力があるデータからの異常検知
7 時系列データの異常検知
8 よくある悩みとその対処法
Users Voice
非常に発送が早くて助かりました。 また、包装もすごく丁寧にしていただけました。 商品も問題なく、信用できるショップだと思います。 ありがとうございました。 また、リピート購入したいと思います。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
最尤推定とは「ある観測結果が与えられたとき、尤度とよばれる量が最大となるようにパラメターを決める」という手法で、確率分布の引数に観測結果を代入したものが尤度である。「データ洗浄」、「外れ値検出」、「クラスタリング」、「正準相関分布」、「異常部位検出」、「変化点検知」、「主成分分析」などの解説と数式的な根拠が記載されている。それぞれの手法をどのようにして、プログラムやビジネス、生活習慣に反映させて行くかが重要であることに変わりはないため、各手法の活用例や、長所や短所を把握するため再読を実施したい。 (参考:honto)

↓全て表示 ↑少なく表示
Rでざっとプログラムを実行したくらいのまさに流し読みなんですが、これは使いどころというか勘所がわからないと難しいです。再読必須なのですが、コロナ社のサポートページが充実しているので救いになれば。。 なんとなくですが、PRMLを初めて手にした時のわかりそうなのにわからない感が、この本にも(私には)あります。 (参考:honto)

↓全て表示 ↑少なく表示
著者略歴
井手剛(イデツヨシ)
1990年国立苫小牧工業高等専門学校機械工学科卒業、1993年東北大学工学部機械工学科卒業。2000年東京大学大学院博士課程修了(物理学専攻)、博士(理学)。2000年IBM東京基礎研究所研究員。2013年IBM T.J.Watson Research Center,Senior Technical Staff Member、現在に至る(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...

「基本をより実践的に!」学べる新シリーズの第一弾は、「統計モデリングの世界」へのファーストブック。基礎から学べる超入門!
・チュートリアル形式だから、すぐに実践できる!
・統計、確率、ベイズ推論、MCMCの基本事項から、やさしくサポート!
・brmsやbayesplotなどのパッケージの使い方も、しっかり身につく!
・一般化線形モデル(GLM)→一般化線形混合モデル(GLMM)→動的線形モデル(DLM)→動的一般化線形モデル(DGLM)を体系的に学べる!
【本書のサポートページ】
https://logics-of-blue.com/r-stan-bayesian-model-intro-book-support/

【実践Data Scienceシリーズ】
「基本をより実践的に!」を合言葉に、データサイエンスで用いられる各種手法の基本を、プログラミングの実装とともに解説していきます。はじめて学ぶ大学生、大学院生、ソフトウェアエンジニアに向けた注目の新シリーズです。

【主な内容】
1部 【理論編】ベイズ統計モデリングの基本
1 はじめよう! ベイズ統計モデリング
2 統計学の基本
3 確率の基本
4 確率分布の基本
5 統計モデルの基本
6 ベイズ推論の基本
7 MCMCの基本

2部 【基礎編】RとStanによるデータ分析
1 Rの基本
2 データの要約
3 ggplot2によるデータの可視化
4 Stanの基本
5 MCMCの結果の評価
6 Stanコーディングの詳細

3部 【実践編】一般化線形モデル
1 一般化線形モデルの基本
2 単回帰モデル
3 モデルを用いた予測
4 デザイン行列を用いた一般化線形モデルの推定
5 brmsの使い方
6 ダミー変数と分散分析モデル
7 正規線形モデル
8 ポアソン回帰モデル
9 ロジスティック回帰モデル
10 交互作用

4部 【応用編】一般化線形混合モデル
1 階層ベイズモデルと一般化線形混合モデルの基本
2 ランダム切片モデル
3 ランダム係数モデル

5部 【応用編】状態空間モデル
1 時系列分析と状態空間モデルの基本
2 ローカルレベルモデル
3 状態空間モデルによる予測と補間
4 時変係数モデル
5 トレンドの構造
6 周期性のモデル化
7 自己回帰モデルとその周辺
8 動的一般化線形モデル:二項分布を仮定した例
9 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1部 【理論編】ベイズ統計モデリングの基本
第1章 はじめよう! ベイズ統計モデリング
第2章 統計学の基本
第3章 確率の基本
第4章 確率分布の基本
第5章 統計モデルの基本
第6章 ベイズ推論の基本
第7章 MCMCの基本
第2部 【基礎編】RとStanによるデータ分析
第1章 Rの基本
第2章 データの要約
第3章 ggplot2によるデータの可視化
第4章 Stanの基本
第5章 MCMCの結果の評価
第6章 Stanコーディングの詳細
第3部 【実践編】一般化線形モデル
第1章 一般化線形モデルの基本
第2章 単回帰モデル
第3章 モデルを用いた予測
第4章 デザイン行列を用いた一般化線形モデルの推定
第5章 brmsの使い方
第6章 ダミー変数と分散分析モデル
第7章 正規線形モデル
第8章 ポアソン回帰モデル
第9章 ロジスティック回帰モデル
第10章 交互作用
第4部 【応用編】一般化線形混合モデル
第1章 階層ベイズモデルと一般化線形混合モデルの基本
第2章 ランダム切片モデル
第3章 ランダム係数モデル
第5部 【応用編】状態空間モデル
第1章 時系列分析と状態空間モデルの基本
第2章 ローカルレベルモデル
第3章 状態空間モデルによる予測と補間
第4章 時変係数モデル
第5章 トレンドの構造
第6章 周期性のモデル化
第7章 自己回帰モデルとその周辺
第8章 動的一般化線形モデル:二項分布を仮定した例
第9章 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
Users Voice
Stanだけではなく、brmsなどのパッケージの使い方も丁寧に解説されていて大変良かったです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
ゼミで使うのに素晴らしい本です。授業を楽しんでる (参考:YahooShopping)

↓全て表示 ↑少なく表示
ベイズモデリングの見通しが良くなった。 数式は最小限で、実際にコードを書いて結果を見ながら何をしているのかを学んでいくというコンセプト。 あえて理論的な小難しい話には立ちいらず、雰囲気を掴んでいけるため、これからベイズ統計モデリングを学んでいくにあたり非常にためになる一冊であった。 簡単なモデルから出発し、章を追うごとに組み合わせるパーツを増やしていくため、とても読みやすい。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

著:馬場 真哉
Logics of Blue(https://logics-of-blue.com/)というWebサイトの管理人

著 書『平均・分散から始める一般化線形モデル入門』(プレアデス出版,2015年)
    『時系列分析と状態空間モデルの基礎:RとStanで学ぶ理論と実装』(プレアデス出版,2018年)
    『Pythonで学ぶあたらしい統計学の教科書』(翔泳社,2018年)


  

Rでらくらくデータ分析入門 ~効率的なデータ加工のための基礎知識

プログラミング未経験者に向けたR入門書!

ビジネスパーソンに向けた、脱Excel、プログラミングの入口につながるRでのデータ分析入門書!

日々の仕事の中で、こんな作業はありませんか?
・表データに決まった手順でフィルターをかけて、それをグラフにする
・複数のExcelファイルを1つのExcelファイルにまとめる
・定型のPowerPointを作成する

単純なデータの加工や集計はExcelで事足ります。ただ、複雑な処理や繰り返しの処理が必要となったときには、より高度な関数やマクロを使いこなす必要が出てきます。

本書はマクロを含め、プログラミングにまったくふれたことがない人を対象に書かれています。Rの本としては珍しく、数式も統計学も出てきません。文系出身の普通のビジネスパーソンでも、普段行っているデータの加工がより楽に、効率的にできるようになります。

Rは、統計処理に特化したプログラミング言語と言われています。1990年代に作られて以降、統計だけでなくさまざまなところで利用されています。
表形式のデータを自由自在に加工・集計できる機能も含まれており、プログラムを書いてデータを取り扱うことができるというその性質から、ルーチンワークやたくさんのデータを処理する際に使われてきました。その便利さは、Excelの比ではありません。

本書は、オンラインコースのUdemyでベストセラーとなっている著者の人気コース「医師が教えるR言語での医療データ分析入門」をベースとし、Excelでのデータ加工と集計に特化して作成されました。オンラインでのレクチャー同様、「語りかける」ように解説します。

著者は企業の産業医をするかたわら、データの処理や分析を行ってきました。その中で、Excelより効率的にデータの加工・分析ができる、Rと出会いました。Rを普及させたい! そんな思いで本書を執筆しました。
Excelより効率的にデータを加工して、周りと差をつけたい。プログラミングに興味あるし、実務にも生かしてみたい。そんなあなたに、本書は最適な導入となるはずです。

↓全て表示↑少なく表示
 
目次
はじめに
0.1 本書の目的
0.2 本書が扱う範囲
0.3 本書の対象読者
0.4 再現可能なレポートとは
0.5 本書の特長
0.6 配布データのダウンロード
0.7 Rを気軽に学んでいこう
第1章 RとRStudioの基礎
1.1 RとRStudioとは
1.2 Rをインストールしよう
1.3 RStudioをインストールしよう
1.4 RStudioの画面を見てみよう
1.5 Rを使って計算しよう
1.6 画面同士を連携させよう
1.7 RStudioでファイルを管理しよう
第2章 Rの機能
2.1 Rのスクリプトを書いてみよう
2.2 型を理解しよう
2.3 変数を用意しよう
2.4 変数のルールや操作方法を確認しよう
2.5 オブジェクトとは
2.6 データの帯(ベクトル)について理解しよう
2.7 ベクトルの型を変換しよう
2.8 ベクトルとベクトルで計算しよう
2.9 データフレームで表を作ろう
2.10 関数を理解しよう
2.11 パッケージを読み込もう
2.12 パッケージを読み込まずに関数を利用しよう
第3章 Excelファイルのインポート
3.1 インポートとは
3.2 パスとは
3.3 ワーキングディレクトリを確認・設定しよう
3.4 パスがなぜ重要なのか理解しよう
3.5 Excelファイルを実際に読み込もう
3.6 tibbleについて理解しよう
3.7 読み込むファイルの型を推定しよう
 3.7.1 表の一部を抜き出そう
3.8 Excelファイル以外のデータを取り込もう
 3.8.1 テキスト形式のデータの取り込み
 3.8.2 統計ソフトのデータの読み込み
第4章 データ加工に適したTidyデータ
4.1 Tidy(タイディー)データとは
4.2 Tidyでないデータとは
4.3 複数の変数が列名となっているデータをTidyにしよう
4.4 行と列に変数が含まれているデータをTidyにしよう
4.5 複数の項目がテーブルに含まれるデータをTidyにしよう
4.6 Tidyデータがまだわからないという人へ
第5章 データ加工に必要なパッケージ群「tidyverse」
5.1 tidyverseとは
5.2 本書で紹介する関数一覧
第6章 列の加工
6.1 関数と関数をつなごう
6.2 列を追加しよう
6.3 列名を変更しよう
6.4 列を選択しよう
第7章 行の加工
7.1 行を並び替えよう
7.2 ロジカル型を理解しよう
 7.2.1 ロジカル型とは
 7.2.2 ロジカル型で印をつけよう
 7.2.3 印をつけたものを取り出そう
 7.2.4 ロジカル型のTRUE、FALSEを!でひっくり返そう
7.3 行を絞り込もう
第8章 文字を自由に操る正規表現
8.1 正規表現とは
8.2 いらない文字を除去しよう
8.3 探している文字が含まれているか判定しよう
8.4 探している文字を抜き出そう
8.5 目的の文字を置き換えよう
第9章 カテゴリカルデータのための因子型
9.1 アンケートのデータを集計しよう
9.2 架空のアンケートデータを作成しよう
 9.2.1 ランダムな数字を生成しよう
 9.2.2 くじ引きをやってみよう
 9.2.3 ランダムな表データを作成しよう
9.3 因子型とは
9.4 因子型の列を作成しよう
9.5 変数を利用した因子型の設定
第10章 条件別による列の加工
10.1 割引クーポンを使ってアイスクリームの値段を計算しよう①
10.2 別の列の値に応じて列を加工する方法を確認しよう
10.3 割引クーポンを使ってアイスクリームの値段を計算しよう②
10.4 もっと複雑な条件に応じて列を加工しよう
第11章 特殊な加工に必要なtidyrパッケージ
11.1 複数の列を1つにまとめよう
11.2 複数の列に分割しよう
 11.2.1 列を分割しよう
 11.2.2 要素を抽出して列を作ろう
11.3 欠損値を好きな値に変換しよう
 11.3.1 欠損値を埋めよう
 11.3.2 データをリストとして保持しよう
11.4 欠損値を埋めよう
11.5 欠損値を好きな文字に置き換えよう
第12章 煩雑なデータをTidyに~縦データと横データの変換~
12.1 縦と横のデータを理解しよう
12.2 横のデータを縦のデータに変換しよう
12.3 縦のデータを横のデータに変換しよう
12.4 横から縦への変換の応用~列データを変換しながら複数の列に分割しよう~
12.5 縦から横への変換の応用~欠損しているデータを埋めよう~
12.6 自由にデータを変換しよう
第13章 マスタデータと戦おう
13.1 リレーショナルデータベースとは
13.2 複数の表を結合させよう
13.3 名前が違う列同士を結合しよう
13.4 いろいろな結合方法を知ろう
13.5 表を結合してデータを抽出しよう
第14章 単純な集計
14.1 平均・最小・最大を集計しよう
14.2 表を集計しよう
14.3 文字型(因子型)を集計しよう
第15章 集団の集計
15.1 表を1つの変数で分割して集計しよう
15.2 表を2つの変数で分割して集計しよう
15.3 表が何行か調べよう
15.4 行の前後の値で比較しよう
15.5 売上データの店舗別・月別変化を調べよう
第16章 日付・時刻データ
16.1 日付と時刻をRで表現しよう
16.2 文字や数字を日付型・日付時刻型に変換しよう
 16.2.1 文字の日付型・日付時刻型への変換の応用
 16.2.2 数字の日付型・日付時刻型への変換の応用
16.3 地域ごとの時差を表現しよう
16.4 日付と時刻を計算しよう
 16.4.1 引き算での計算
 16.4.2 物理的な時間の経過を表そう
 16.4.3 カレンダー上の時間の経過を表そう
 16.4.4 「時間の帯」同士の重なりの有無を調べよう
16.5 時間を集計しよう
第17章 Tidyデータの作成
17.1 例1:出勤、退勤時刻に関するデータをTidyにしよう
 17.1.1 出勤、退勤時刻データの加工1
 17.1.2 pivot_wider()とリストコラム
 17.1.3 出勤、退勤時刻データの加工2
17.2 例2:人気ランキングと価格の表をTidyにしよう
17.3 例3:複数の販売個数データをTidyにしよう
 17.3.1 ファイルを処理しよう
 17.3.2 関数を作ろう
 17.3.3 ファイルを処理する関数を作成しよう
第18章 データの保存
18.1 状況に応じたデータの保存形式を考えよう
18.2 表データをファイルとして保存しよう
 18.2.1 表データをCSVファイルで保存しよう
 18.2.2 表データをExcelファイルで保存しよう
18.3 Rのオブジェクトを.rds形式で保存しよう
18.4 Rのオブジェクトを.RData形式で保存しよう
第19章 レポートの出力
19.1 R Markdownでレポート作成しよう
 19.1.1 R MarkdownからWordファイルを生成しよう
 19.1.2 Markdownとは
 19.1.3 R Markdownとは
19.2 Rでグラフを書こう
19.3 kable関数でキレイな表を出力しよう
19.4 レポートを実際に出力しよう
おわりに
結語と謝辞

↓全て表示↑少なく表示
著者略歴

著:西田典充
医師。日本産業衛生学会認定、産業衛生専門医。労働衛生コンサルタント。労働衛生機関に勤務するかたわら、2016年から2020年まで大学発のベンチャー企業でRを利用した医療データの前処理、分析、レポーティングシステム開発に携わる。2018年よりUdemyでRを普及するためのオンラインコースを公開。2019年より大規模病院において、臨床研究に関わるデータの加工、抽出などについてのコンサルティングを行う。2021年からは企業の専属産業医として勤務。


↓全て表示↑少なく表示

  

RとPythonで学ぶ統計学入門

RとPythonで学ぶ統計学入門
(著)増井敏克
発売日 2021/05/27
総合評価
(4.3)
(2023/05/15 12:10時点)
RとPythonで統計学を実践的に学ぶ!
本書はRとPythonを使って、統計学の基礎を実践的に学ぶテキストです。
近年、IoTや人工知能ブームなどに代表されるように、人が日々扱うデータは増え続けています。データの量・種類が増えるにつれ、ただ闇雲にツールを使って分析するだけではなく、なぜその手法を使うのか、結果から何を読み取るのかなどといったことがポイントになってきます。
このポイントを正しく理解し、適切にデータ分析を行うには十分な統計学の知識が必要になってきます。しかしながら統計学の土台は数学であり、数学に苦手意識をもつ方にとって純粋な統計学の教科書はハードルが高いと思われます。また、平易な参考書においても、結局のところ手元のデータをどうすればよいのかといったところで、また一つ壁があります。
そこで本書は、データ分析に優れた環境であるRと、機械学習など大規模なデータ分析に定評のあるPythonによるプログラミングを通して統計学を解説します。統計学を学びたい、データを分析したいというエンジニアや学生に向けて、数学的な壁を取り払いつつ、実際にデータを分析するための統計学の知識を提供します。

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1章 データ分析や統計学が注目される理由
第2章 基本統計量を知る
第3章 よく使われる分析手法を知る
第4章 確率の基本と推定を知る
第5章 検定の手法を知る
第6章 将来の予測や分類に応用する
付録 基本的な数学知識の解説
Users Voice
[墨田区図書館]
ちょうど"読みたい"設定をしている本だったのか。
図書館で見た時に題名には覚えがあるものの、何で知っていてどうしたい(読みたいなど)のかが分からないままにサラっと立ち読み。
Rが言語だということすら知らなかったけれど、「オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境」だったらしい。。。
どのPythonの本も読み流すだけで理解した(実行可能になった)とはいえないレベルではあるものの、ここまでの本は少なくともやっていることは理解出来た。ただ、、
"統計学"と言うだけあってこの本はPythonやR以前に"読むのが辛くなる"感じの本だった。流石に"統計学"に興味がない者が読む本じゃないな(笑) (参考:honto)

↓全て表示 ↑少なく表示
[墨田区図書館]

ちょうど"読みたい"設定をしている本だったのか。
図書館で見た時に題名には覚えがあるものの、何で知っていてどうしたい(読みたいなど)のかが分からないままにサラっと立ち読み。
Rが言語だということすら知らなかったけれど、「オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境」だったらしい。。。

どのPythonの本も読み流すだけで理解した(実行可能になった)とはいえないレベルではあるものの、ここまでの本は少なくともやっていることは理解出来た。ただ、、
"統計学"と言うだけあってこの本はPythonやR以前に"読むのが辛くなる"感じの本だった。流石に"統計学"に興味がない者が読む本じゃないな(笑) (参考:楽天)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴
増井敏克(マスイトシカツ)
増井技術士事務所代表。技術士(情報工学部門)。情報処理技術者試験にも多数合格。ビジネス数学検定1級に合格し、公益財団法人日本数学検定協会認定トレーナーとしても活動(本データはこの書籍が刊行された当時に掲載されていたものです)

  

The R Tips 第3版 データ解析環境Rの基本技・グラフィックス活用集

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

使い方自由自在!統計解析、数値計算、プログラム、シミュレーション、プロット図から複雑なグラフィックスまで詳細に解説!

 本書は2009年11月発行の『The R Tips 第2版 データ解析環境Rの基本技・グラフィックス活用集』(2005年3月に九天社から発行された書籍に対して、改訂・加筆を行いオーム社から再発行したもの)の改訂版です。
R は統計計算とグラフィックスのための言語・環境で、R の熟練度に合わせて読んでいただけるよう、2部構成にしています。初心者向けにはR入門編、統計や数値計算、プログラミング技法やデータハンドリング等、グラフィックスなど実行したい人はR-Tips 編で学ぶことができます。
 改訂にあたって、データ解析の内容を抜本的に見直し、グリッドグラフィックスの章を削り、代わりにパッケージdplyr とggplot2 に関する内容を新たに盛り込みました。


主要目次
第1編 R 入門 編
第1章 R のインストール
第2章 電卓としてR を使う──起動→計算→終了
第3章 代入(付値)
第4章 ベクトルの基本
第5章 関数定義とプログラミング入門
第6章 ヘルプ,パッケージ,関数定義の見方
第7章 グラフ作成入門
第8章 データ解析(入門編)
第2編 R Tips 編
第9章 データの種類と種々のベクトル
第10章 配列とリスト,要素のラベル
第11章 オブジェクトと出力
第12章 行列
第13章 関数とプログラミング
第14章 数値計算
第15章 データハンドリング
第16章 データ解析(実践編)
第17章 乱数とシミュレーション
第18章 グラフィックス
第19章 データ解析(多変量解析編)
第20章  ggplot2 入門
付録A 練習問題の解答
参考文献

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1編 R 入門 編
第1章 R のインストール
第2章 電卓としてR を使う──起動→計算→終了
第3章 代入(付値)
第4章 ベクトルの基本
第5章 関数定義とプログラミング入門
第6章 ヘルプ,パッケージ,関数定義の見方
第7章 グラフ作成入門
第8章 データ解析(入門編)
第2編 R Tips 編
第9章 データの種類と種々のベクトル
第10章 配列とリスト,要素のラベル
第11章 オブジェクトと出力
第12章 行列
第13章 関数とプログラミング
第14章 数値計算
第15章 データハンドリング
第16章 データ解析(実践編)
第17章 乱数とシミュレーション
第18章 グラフィックス
第19章 データ解析(多変量解析編)
第20章  ggplot2 入門
付録A 練習問題の解答
参考文献

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
  

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

こちらの書籍は 2019/05/29 紙版の4刷に対応するため更新をおこないました。(概要)
データサイエンスの現場において,その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで,予測モデルの構築やデータモデリングといった本来のデータサイエンス業務に時間を割くことができるわけです。
本書はデータサイエンスに取り組む上で欠かせない「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。ほとんどの問題についてR,Python,SQLを用いた実装方法を紹介しますので,複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。

(こんな方におすすめ)
・データサイエンティスト
・データ分析に興味のあるエンジニア

(目次)
第1章 前処理とは

第2章 抽出

第3章 集約

第4章 結合

第5章 分割

第6章 生成

第7章 展開

第8章 数値型

第9章 カテゴリ型

第10章 日時型

第11章 文字型

第12章 位置情報型

第13章 演習問題

↓全て表示↑少なく表示
 
目次
1 入門前処理(前処理とは)
2 データ構造を対象とした前処理(抽出
集約
結合
分割
生成
展開)
3 データ内容を対象とした前処理(数値型
カテゴリ型
日時型
文字型
位置情報型)
4 実践前処理(演習問題)
Users Voice
Awesome、Not Awesomeな書き方の違いについて、わかりやすい解説がなされており、すぐに実践で使える良書です。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
とてもわかりやすいため、すぐに見れるようにしています。困ったときにすぐに調べられるので重宝しています。 (参考:honto)

↓全て表示 ↑少なく表示
実用書である。
なにかと派手な話題が多いデータサイエンスの中で、地味だが大切な前処理を取り上げている。
しかもSQL,R,Pythonの主要なツールについて併記してあり大変助かった。
今までSQLについてまったく知らなかったがなかなか奥深い分野と思われる。
第1章 前処理とは
第2章 抽出
第3章 集約
 SQLのWindow関数は大変役に立つ関数が多い
第4章 結合
 JOIN句の説明がわかりやすかった
 4-3過去データの結合、4-4全結合はとても役に立ちそう。
第5章 分割
第6章 生成
第7章 展開
 長いこと縦持ち、横持ちのことがわからなかったがpythonのpivot_tableでわかるようになった
第8章 数値型
 数値のカテゴリ化など使えそう
 数値の補完にこんな手法があったのは知らなかった(多重代入法)
第9章 カテゴリ型
 カテゴリ型は結構大切
第10章 日時型
 SQLの実行にPostgreSQLを使っていたがこの章ではエラーがでてほとんど実行できなかった
 データベースによっては方言が存在するのかな?
 10-7 平日/休日への変換は役立ちそう
第11章 文字型
 高度な内容だったので手がです
第12章 位置情報型
 今回はデータとして緯度、経度が準備されていてそれを使うだけだったが
 その位置情報そのものを集めてくるのが大変そう
まとめ
データはデータベースに置きSQLでデータを前さばきしながらPython/Rでデータ加工するのが
最強のセットかな?SQLのWindow関数をもっと知りたい。 (参考:honto)

↓全て表示 ↑少なく表示
著者略歴
本橋智光(モトハシトモミツ)
システム開発会社の研究員、Web系企業のデータサイエンティストを経て、デジタル医療スタートアップのサスメド株式会社のCTO。株式会社ホクソエムにも所属。量子アニーリングコンピュータの検証に個人事業主として従事している。製造業、小売業、金融業、運輸業、レジャー業、Webなど多様な業種のデータ分析経験を持つ。KDD CUP 2015 2位(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

Rによる教育データ分析入門

Rによる教育データ分析入門
(著)雄一郎, 小林, 彰, 濱田, 篤, 水本
発売日 2020/09/14
総合評価
(3.9)
(2023/05/15 12:10時点)
教育現場のデータを活かすために!
本書は、教育現場に蓄積された多様なデジタルデータ(成績データ、アンケート結果など)の分析方法を解説します。
中・高・大や予備校などの教育現場には、多くのデータ(試験・入試の結果、TOEICなどの外部試験の結果、出席管理システムの情報など)が、なかば勝手に集積されていきます。昨今、データ利用の重要性が叫ばれるなか、そのようなデータの山の中から教育上、有用な知見を見つけ出すことが教育現場にも求められています。
本書は、大学や予備校、通信教育の教職員・事務職員、教育に熱心な中・高の教職員をおもたる対象として、教育データの分析手法や考え方を解説しています。オープンソースの統計分析向けのソフトウェア環境であるRを用いることで、実際に使える実践的な方法を解説しています。
教育分野の方以外にも、データ分析が身近な学校という現場を例に、どのように実応用されているかを知ることができる一冊になっています。

↓全て表示↑少なく表示
 
内容サンプル

(引用元楽天Books)

 
目次
準備編(Rの使い方)
基本編(記述統計ーテスト結果の概要を知りたい
層別分析・可視化ークラスごとの傾向を視覚的に把握したい
t検定ー2つのテスト結果を比較したい
分散分析・多重比較ー3つ以上のグループや繰り返しのテスト結果を比較したい
効果量ー指導法による成績の違いを調べたい
相関分析ー中間試験と期末試験の成績の関係を調べたい)
発展編(回帰分析ーテスト欠席者の見込み点を予測したい
因子分析ー授業評価アンケートを作成・分析したい
構造方程式モデリングー成績データから因果関係を探りたい
クラスター分析ー同じような特徴を持つ学習者をグループ化したい)

↓全て表示↑少なく表示
Users Voice
初心者向きで構造方程式モデリングを扱ってるのを探して、これにあたった。良かった。返却期限すぎるまで借りてしまった。 (参考:honto)

↓全て表示 ↑少なく表示
統計について標準偏差から構造方程式まであらゆる分析がRのプログラム例まで書いてある。さらに統計の基本的な用語から分析結果の解釈まで書いてあるのて、これ1冊で卒論や修論での統計分析は十分にできる。ただし、論文への結果の書き方は書いていないので、どの表を書いて結果をどこまで書くかは、先行研究の結果の書き方を真似するしかない。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元楽天Books)

 
著者略歴
小林雄一郎(コバヤシユウイチロウ)
日本大学生産工学部専任講師。大阪大学大学院言語文化研究科修了。博士(言語文化学)。関心領域は、コーパス言語学、英語の自動採点(ライティング、スピーキング)

濱田彰(ハマダアキラ)
明海大学外国語学部専任講師。筑波大学大学院人文社会科学研究科修了。博士(言語学)。関心領域は、第二言語習得、言語テスティング

水本篤(ミズモトアツシ)
関西大学外国語学部教授。関西大学大学院外国語教育学研究科修了。博士(外国語教育学)。関心領域は、コーパスの教育利用、学習方略(本データはこの書籍が刊行された当時に掲載されていたものです)

↓全て表示↑少なく表示

  

RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】

(概要)
本書は野村総研で開催されている全社コンサルタントとエンジニア向けのビジネスアナリティクス講座をベースにした書籍の増補改訂版です。具体的なサンプルを元にデータ分析とモデリングを進めるところが特徴です。また、統計解析や機械学習では「何ができないか」や、ビジネスデータの分析時に陥りがちな「落とし穴」など、現場で活用できる実践的な解説も満載です。改訂にあたっては、全編を最新のシステム環境に合わせてまとめ直しました。環境設定についてはコラムでも細やかにフォローし、データサイエンスと機械学習の基礎が学びやすいように進化しています。

(こんな方におすすめ)
・データ分析・統計解析や機械学習について知りたい方
・データサイエンティストになりたい方

(目次)
第1章:データサイエンス入門
1.1:データサイエンスの基本
1.2:データサイエンスの実践

第2章: RとPython
2.1: RとPython
2.2: R入門
2.3: Python入門
2.4: RとPythonの実行例の比較

第3章:データ分析と基本的なモデリング
3.1:データの特徴を捉える
3.2:データからモデルを作る
3.3:モデルを評価する

第4章:実践的なモデリング
4.1:モデリングの準備
4.2:データの加工
4.3:モデリングの手法
4.4:因果推論

第5章:機械学習とディープラーニング
5.1:機械学習の基本とその実行
5.2:機械学習アルゴリズムの例
5.3:機械学習の手順
5.4:機械学習の実践
5.5:ディープラーニング

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1章:データサイエンス入門
 1.1:データサイエンスの基本
  1.1.1:データサイエンスの重要性
  1.1.2:データサイエンスの定義とその歴史
  1.1.3:データサイエンスにおけるモデリング
  1.1.4:データサイエンスとその関連領域
 1.2:データサイエンスの実践
  1.2.1:データサイエンスのプロセスとタスク
  1.2.2:データサイエンスの実践に必要なツール
  1.2.3:データサイエンスの実践に必要なスキル
  1.2.4:データサイエンスの限界と課題
 コラム:ビジネス活用における留意点
第2章:RとPython
 2.1:RとPython
  2.1.1:RとPythonの比較
 2.2:R入門
  2.2.1:Rの概要
  2.2.2:Rの文法
  2.2.3:データ構造と制御構造
 2.3:Python入門
  2.3.1:Pythonの概要
  2.3.2:Pythonの文法
  2.3.3:Pythonでのプログラミング
  2.3.4:NumPyとpandas
 2.4:RとPythonの実行例の比較
  2.4.1:簡単な分析の実行例
第3章:データ分析と基本的なモデリング
 3.1:データの特徴を捉える
  3.1.1:分布の形を捉える ─ ビジュアルでの確認
  3.1.2:要約統計量を算出する ─ 代表値とばらつき
  3.1.3:関連性を把握する ─ 相関係数の使い方と意味
  3.1.4:Rを使った相関分析 ─ 自治体のデータを使った例
  3.1.5:確立分布とその利用 ─ 理論と実際の考え方
 3.2:データからモデルを作る
  3.2.1:目的変数と説明変数 ─ 説明と予測の「向き」
  3.2.2:簡単な線形回帰モデル ─ Rによる実行と結果
  3.2.3:ダミー変数を使ったモデル ─ グループ間の差異を分析
  3.2.4:複雑な線形回帰モデル ─ 交互作用,モデル間の比較
  3.2.5:線形回帰の仕組みと最小二乗法
 3.3:モデルを評価する
  3.3.1:モデルを評価するための観点
  3.3.2:この結果は偶然ではないのか? ─ 有意確率と有意差検定
  3.3.3:モデルはデータに当てはまっているか? ─ フィッティングと決定係数
  3.3.4:モデルは複雑すぎないか? ─ オーバーフィッティングと予測精度
  3.3.5:残差の分布 ─ 線形回帰モデルと診断プロット
  3.3.6:説明変数同士の相関 ─ 多重共線性
  3.3.7:標準偏回帰係数
第4章:実践的なモデリング
 4.1:モデリングの準備
  4.1.1:データの準備と加工
  4.1.2:分析とモデリングの手法
 4.2:データの加工
  4.2.1:データのクレンジング
  4.2.2:カテゴリ変数の加工
  4.2.3:数値変数の加工とスケーリング
  4.2.4:分布の形を変える ─ 対数変換とロジット変換
  4.2.5:欠損値の処理
  4.2.6:外れ値の処理
 4.3:モデリングの手法
  4.3.1:グループに分ける ─ クラスタリング
  4.3.2:指標を集約する ─ 因子分析と主成分分析
  4.3.3:一般化線形モデル(GLM)とステップワイズ法
  4.3.4:2値データを目的変数とする分析 ─ ロジスティック回帰
  4.3.5:セグメントの抽出とその特徴の分析 ─ 決定木
 4.4:因果推論
  4.4.1:データから因果関係を明らかにする ─ 統計的因果推論
  4.4.2:因果の有無の検証
  4.4.3:因果効果の推定
  4.4.4:因果関係の定式化 ─ 構造方程式モデリング
  4.4.5:因果関係の定式化 ─ 構造的因果モデル
  4.4.6:因果関係の定式化 ─ ベイズ統計モデリング
  4.4.7:因果の探索
  4.4.8:因果関係に基づく変数選択
第5章:機械学習とディープラーニング
 5.1:機械学習の基本とその実行
  5.1.1:機械学習の基本
  5.1.2:機械学習ライブラリの活用 ─ scikit-learn
  5.1.3:機械学習の実行(教師あり学習)
  5.1.4:機械学習の実行(教師なし学習)
  5.1.5:スケーリングの実行(標準化・正規化)
  5.1.6:次元の削減(主成分分析)
 コラム:機械学習と強化学習
 5.2:機械学習アルゴリズムの例
  5.2.1:k近傍法
  5.2.2:ランダムフォレスト
  5.2.3:ロジスティック回帰とリッジ回帰
  5.2.4:サポートベクターマシン(SVM)
 5.3:機械学習の手順
  5.3.1:機械学習の主要な手順
  5.3.2:ホールドアウト法による実行
  5.3.3:クロスバリデーションとグリッドサーチ
  5.3.4:閾値の調整
  5.3.5:特徴量の重要度と部分従属プロット
 5.4:機械学習の実践
  5.4.1:データの準備に関わる問題
  5.4.2:特徴抽出と特徴ベクトル
  5.4.3:機械学習の実行例
 5.5:ディープラーニング
  5.5.1:ニューラルネットワーク
  5.5.2:ディープラーニングを支える技術
  5.5.3:ディープラーニング・フレームワーク
  5.5.4:ディープラーニングの実行
  5.5.5:生成モデル

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
   

R言語の本 最新・高評価のおすすめの5冊

以下が「R言語の本」最新・高評価のおすすめの5冊詳細です。

(2023/05/15 12:10 更新)
Rank製品価格
1
2,970円
2,970円
2,970円
2
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
(+119pt)
3,278円
3,278円
3,278円
3
RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】...
発売日 2021/05/06
有賀 友紀, 大橋 俊介 (技術評論社)
総合評価
(4.6)
3,982円
(+144pt)
3,783円
(+137pt)
3,982円
3,982円
4
Rによる機械学習[第3版]
発売日 2021/02/10
Brett Lantz (翔泳社)
総合評価
(4.6)
4,180円
(+126pt)
3,762円
4,180円
4,180円
5
3,300円
(+120pt)
3,300円
(+279pt)
3,300円
3,300円
 

自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)

近年,Rなどのオープンソースのデータ解析環境が整ってきており,これらを活用することで,実験・測定・調査を行った結果に対して,研究者自身の手で高度な分析手法を適用できるようになった。
しかし,自然科学研究の多様化に伴い,研究者が扱わなければいけないデータの種類や量は増える一方である。また,データ解析手順も複雑化している。そのため自然科学系の実験分野においても,データ解析の再現性の重要性は高まっている。
Rでは解析の再現性を保証する方法としてRMarkdownが広く活用されている。その方法は本シリーズ第3巻『再現可能性のすゝめ』で詳しく解説されているが,本書はその実践集である。自然科学分野で主に取り扱うデータを想定した上で,RおよびRStudioを活用して,実験ノートやレポートをまとめあげる方法を,本書では具体例をあげつつ詳しく説明している。
 
目次
Chapter 1 はじめに
1.1 RMarkdown
1.2 sessioninfoによるバージョン情報の確認
1.3 プロジェクトの作成
1.4 本章のまとめと参考文献
Chapter 2 基本的な統計モデリング―要因と目的変数の関係解析(1)
2.1 データの読み込み・概観チェック・集計・可視化
2.2 【レポート例2-1】
2.3 検定・相関解析
2.4 統計モデリング第一歩
2.5 【レポート例2-2】
2.6 本章のまとめと参考文献
Chapter 3 発展的な統計モデリング―要因と目的変数の関係解析(2)
3.1 データの読み込み・集計・可視化
3.2 【レポート例3-1】
3.3 検定
3.4 統計モデリング
3.5 【レポート例3-2】
3.6 本章のまとめと参考文献
Chapter 4 実験計画法と分散分析
4.1 一元配置分散分析―One-way ANOVAによる精製カラムの検討
4.2 二元配置分散分析―Two-way ANOVAによる検出器の検討
4.3 【レポート例4-1】
4.4 直交表を使った分散分析―多数の因子がある場合の組み合わせ効率化:注入口条件の最適化
4.5 分析法の検証
4.6 【レポート例4-2】
4.7 本章のまとめと参考文献
Chapter 5 機械学習―代謝産物の変動解析を例に
5.1 データの読み込み・加工・可視化・検定
5.2 機械学習による判別分析
5.3 変数重要度が上位の因子によるpathway解析および機能解析の準備
5.4 【レポート例5】
5.5 本章のまとめと参考文献
Chapter 6 実践 レポート作成―化学物質の分子記述子と物性の関係解析を例に
6.1 ファイル作成・YAML記述
6.2 本文の記述とデータの読み込み
6.3 機械学習モデル
6.4 バリデーションセットを用いた精度の検証
6.5 変数重要度
6.6 実行環境・引用文献
6.7 本章のまとめと参考文献

↓全て表示↑少なく表示
著者略歴
江口哲史(エグチアキフミ)
2013年愛媛大学理工学研究科博士後期課程修了。日本学術振興会特別研究員などを経て、千葉大学予防医学センター助教。専門、環境分析化学

石田基広(イシダモトヒロ)
1989年東京都立大学大学院博士後期課程中退。現在、徳島大学総合科学部教授。専攻、テキストマイニング(本データはこの書籍が刊行された当時に掲載されていたものです)

  

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界

改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界
(著)松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛
発売日 2021/06/03
総合評価
(4.6)
(2023/05/15 12:10時点)
(概要)
2018年に刊行した通称「#宇宙本」を最新の情報に改訂!
本書は、R言語のIDEであるRStudioと、モダンなデータ分析を実現するtidyverseパッケージの入門書です。RStudioの基本機能からはじまり、Rによるデータの収集(2章)、データの整形(3章)、可視化(4章)、レポーティング(5章)といったデータ分析ワークフローの各プロセスの基礎を押さえることができます。
RStudio v1.4に対応し、新たに追加されたVisual Editor機能やRStudio v1.2で追加された「Jobs機能」などを紹介します。また、dplyr 1.0に対応し、データ処理系の関数の解説を追加しています。さらに改訂版では付録として、「stringrによる文字列データの処理」「lubridateによる日付・時刻データの処理」の2章を追加しています。
さまざまな機能が追加されていくRStudioとtidyverseに触れ、モダンなデータ分析をはじめましょう!

(こんな方におすすめ)
・R / RStudioでモダンな分析環境を手にしたい方
・分析フローを意識した業務/解析をしたい方

(目次)
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
1-2 RStudioの基本操作
1-3 RStudioを自分好みにカスタマイズ
1-4 ファイルの読み込み
1-5 RやRStudioで困ったときは
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
2-2 スクレイピングに必要なWeb知識
2-3 Rによるスクレイピング入門
2-4 API
2-5 まとめ
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
3-2 tidyrによるtidy dataへの変形
3-3 dplyrによる基本的なデータ操作
3-4 dplyrによる応用的なデータ操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
3-6 tidyrのその他の関数
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
4-3 他者と共有可能な状態に仕上げる
4-4 便利なパッケージ
4-5 まとめ
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
5-2 R Markdown入門
5-3 出力形式
5-4 まとめ
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
A-3 正規表現
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
はじめに
 本書の特徴
 本書の構成
 本書の対象読者
 本書で解説しなかったこと
 さあRStudioで分析を
tidyverseとは
 tidyverseのパッケージ
 tidyverseの過去
 tidyverseの未来
第1章 RStudioの基礎
1-1 RStudioのダウンロードとインストール
 macOS
 Windows
1-2 RStudioの基本操作
 RStudioのインターフェース
 プロジェクト機能
 Rスクリプトの新規作成と保存
 Rのコマンドの実行
 オブジェクトの確認
 補完機能
 Jobs機能
1-3 RStudioを自分好みにカスタマイズ
 RStudio全般
 コーディング
 外観
 Terminal
 キーボードショートカット
1-4 ファイルの読み込み
 Rの標準関数の問題点
 readrパッケージ
 Excelファイルの読み込み
 SAS,SPSS,STATAファイルの読み込み
 RStudio(GUI)によるデータの読み込み
 ファイル読み込みのまとめ
1-5 RやRStudioで困ったときは
 ヘルプを使う
 Vignetteを見る
 チートシートを使う
 コマンドパレット
1-6 まとめ
第2章 スクレイピングによるデータ収集
2-1 なぜスクレイピングが必要か
 スクレイピングとは
 手作業によるデータ取得の限界
2-2 スクレイピングに必要なWeb知識
 HTML
 CSS
 XMLとXPath
2-3 Rによるスクレイピング入門
 rvestパッケージ
 Webページタイトルの抽出
 パイプ演算子
 スクレイピング実践
2-4 API
 APIとは
 rtweetパッケージによるTwitterデータの収集
 ツイートの収集
 COLUMN ブラウザの自動操作
 COLUMN Webスクレイピングをするときの注意点
2-5 まとめ
 参考文献
第3章 dplyr/tidyrによるデータ前処理
3-1 tidy dataとは
 tidy dataの定義
 tidyではないデータ
3-2 tidyrによるtidy dataへの変形
 tidyではないデータ
 pivot_longer()による縦長データへの変形
 pivot_wider()による横長のデータへの変形
3-3 dplyrによる基本的なデータ操作
 tibbleとデータフレームの違い
 dplyrの関数の概要
 1つのデータフレームを操作する関数の共通点と%>%
 演算子による処理のパイプライン化
 filter()による行の絞り込み
 COLUMN dplyrの関数内でのコード実行
 arrange()によるデータの並び替え
 select()による列の絞り込み
 relocate()による列の並べ替え
 mutate()による列の追加
 summarise()によるデータの集計計算
3-4 dplyrによる応用的なデータ操作
 グループ化
 COLUMN 複数の値を返す集約関数とsummarise()
 COLUMN ウィンドウ関数
 COLUMN selectのセマンティクスとmutateのセマンティクス
 複数の列への操作
3-5 dplyrによる2つのデータセットの結合と絞り込み
 inner_join()によるデータの結合
 さまざまなキーの指定方法
 inner_join()以外の関数によるデータの結合
 semi_join()、anti_join()による絞り込み
3-6 tidyrのその他の関数
 separate()による値の分割
 extract()による値の抽出
 separate_rows()による値の分割(縦方向)
 暗黙の欠損値
 complete()による存在しない組み合わせの検出
 COLUMN group_by()による存在しない組み合わせの表示
 fill()による欠損値の補完
 replace_na()による欠損値の置き換え
3-7 まとめ
第4章 ggplot2を用いたデータ可視化
4-1 可視化の重要性
4-2 ggplot2パッケージを用いた可視化
 準備
 エステティックマッピング
 COLUMN グラフに肉付けする
 統計的処理:stat
 COLUMN X軸に離散変数をマッピングした場合における折れ線グラフ
 配置の指定:position
 COLUMN position_dodge()とposition_dodge2()
 軸の調整
 グラフの保存
4-3 他者と共有可能な状態に仕上げる
 themeの変更
 文字サイズやフォントの変更
 配色の変更
 ラベルを変更する
4-4 便利なパッケージ
 複数のグラフを並べる
 表示される水準の順番を変更したい
4-5 まとめ
 参考文献
第5章 R Markdownによるレポート生成
5-1 分析結果のレポーティング
 ドキュメント作成の現場
 手作業によるドキュメント作成の問題点
5-2 R Markdown入門
 Hello, R Markdown
 Rmdファイルと処理フロー
 Markdownの基本
 Rチャンク
 ドキュメントの設定
 RStudioで使える便利なTips
 COLUMN Visual ModeによるRmdファイルの編集
5-3 出力形式
 html_document形式
 pdf_document形式
 word_document形式
 スライド出力
 R Markdownの出力形式を提供するパッケージ
 COLUMN 日本語環境での注意点
5-4 まとめ
 参考URL・参考文献
付録A stringrによる文字列データの処理
A-1 文字列データとstringrパッケージ
A-2 文字列処理の例
 str_c()による文字列の連結
 str_split()による文字列の分割
 str_detect()による文字列の判定
 COLUMN fixed()/coll()を用いた挙動の調整
 str_count()による検索対象の計上
 str_locate()による検索対象の位置の特定
 str_subset()/str_extract()による文字列の抽出
 str_sub()による文字列の抽出
 str_replace()による文字列の置換
 str_trim()/str_squish()による空白の除去
A-3 正規表現
 任意の文字や記号の検索
 高度な検索
 regex()
A-4 まとめ
付録B lubridateによる日付・時刻データの処理2
B-1 日付・時刻のデータ型とlubridateパッケージ
B-2 日付・時刻への変換
 文字列から日付・時刻への変換
 数値から日付・時刻への変換
 readrパッケージによる読み込み時の変換
B-3 日付・時刻データの加工
B-4 interval
B-5 日付、時刻データの計算・集計例
 wday()を使った曜日の計算例
 floor_date()を使った週ごとの集計例
B-6 タイムゾーンの扱い
B-7 その他の日付・時刻データ処理に関する関数
 zipanguパッケージ
 sliderパッケージ

↓全て表示↑少なく表示
Users Voice
とても迅速に発送していただき、すぐに手元に届きました。内容もR studioについて詳細に掘り下げてありとても分かりやすかったです。活用していきたいです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

他著:松村 優哉
松村優哉(まつむら ゆうや) IT企業勤務。修士(経済学)。学生時代の専門はベイズ統計学、統計的因果推論およびそれらのマーケティングへの応用。ホームページ:https://ymattu.github.io/ 仕事および趣味でRを使用し、ブログ(https://y-mattu.hatenablog.com/)にてRやPythonなどの情報を発信しているほか、Rの勉強会Tokyo.Rの運営にも携わる。著書に『データサイエンティストのための最新知識と実践 Rではじめよう![モダン]なデータ分析』(マイナビ出版, 2017)。本書の第1章、第2章を執筆。

他著:湯谷 啓明
湯谷啓明(ゆたに ひろあき) IT企業勤務。データの可視化への興味からggplot2を知り、Rを使い始める。tidyverseへのコントリビューションも多数。技術ブログ(https://notchained.hatenablog.com/)でもRに関する小ネタや最新情報を発信している。好きな言語はRと忍殺語。著書に「Rによるスクレイピング入門」(C&R研究所, 2017)、翻訳書に「Rプログラミング本格入門」(共立出版, 2017)。本書の「tidyverseとは」、第3章、付録Bを執筆。

他著:紀ノ定 保礼
紀ノ定保礼(きのさだ やすのり) 静岡理工科大学情報学部 講師。博士(人間科学)。同志社大学文化情報学部在学中にRを習うも、当時はRStudioがなく、いつしか疎遠になる。統計モデリングとtidyverseへの興味から再びRを使い始め、今ではRはなくてはならない存在に。大阪大学大学院人間科学研究科助教を経て、現職。専門は、認知心理学、交通心理学、人間工学。翻訳書に『ベイズ統計モデリング-R, JAGS, Stanによるチュートリアル-原著第2版』(共立出版, 2017)。本書の第4章と付録Aを執筆。


↓全て表示↑少なく表示

  

RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】

(概要)
本書は野村総研で開催されている全社コンサルタントとエンジニア向けのビジネスアナリティクス講座をベースにした書籍の増補改訂版です。具体的なサンプルを元にデータ分析とモデリングを進めるところが特徴です。また、統計解析や機械学習では「何ができないか」や、ビジネスデータの分析時に陥りがちな「落とし穴」など、現場で活用できる実践的な解説も満載です。改訂にあたっては、全編を最新のシステム環境に合わせてまとめ直しました。環境設定についてはコラムでも細やかにフォローし、データサイエンスと機械学習の基礎が学びやすいように進化しています。

(こんな方におすすめ)
・データ分析・統計解析や機械学習について知りたい方
・データサイエンティストになりたい方

(目次)
第1章:データサイエンス入門
1.1:データサイエンスの基本
1.2:データサイエンスの実践

第2章: RとPython
2.1: RとPython
2.2: R入門
2.3: Python入門
2.4: RとPythonの実行例の比較

第3章:データ分析と基本的なモデリング
3.1:データの特徴を捉える
3.2:データからモデルを作る
3.3:モデルを評価する

第4章:実践的なモデリング
4.1:モデリングの準備
4.2:データの加工
4.3:モデリングの手法
4.4:因果推論

第5章:機械学習とディープラーニング
5.1:機械学習の基本とその実行
5.2:機械学習アルゴリズムの例
5.3:機械学習の手順
5.4:機械学習の実践
5.5:ディープラーニング

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1章:データサイエンス入門
 1.1:データサイエンスの基本
  1.1.1:データサイエンスの重要性
  1.1.2:データサイエンスの定義とその歴史
  1.1.3:データサイエンスにおけるモデリング
  1.1.4:データサイエンスとその関連領域
 1.2:データサイエンスの実践
  1.2.1:データサイエンスのプロセスとタスク
  1.2.2:データサイエンスの実践に必要なツール
  1.2.3:データサイエンスの実践に必要なスキル
  1.2.4:データサイエンスの限界と課題
 コラム:ビジネス活用における留意点
第2章:RとPython
 2.1:RとPython
  2.1.1:RとPythonの比較
 2.2:R入門
  2.2.1:Rの概要
  2.2.2:Rの文法
  2.2.3:データ構造と制御構造
 2.3:Python入門
  2.3.1:Pythonの概要
  2.3.2:Pythonの文法
  2.3.3:Pythonでのプログラミング
  2.3.4:NumPyとpandas
 2.4:RとPythonの実行例の比較
  2.4.1:簡単な分析の実行例
第3章:データ分析と基本的なモデリング
 3.1:データの特徴を捉える
  3.1.1:分布の形を捉える ─ ビジュアルでの確認
  3.1.2:要約統計量を算出する ─ 代表値とばらつき
  3.1.3:関連性を把握する ─ 相関係数の使い方と意味
  3.1.4:Rを使った相関分析 ─ 自治体のデータを使った例
  3.1.5:確立分布とその利用 ─ 理論と実際の考え方
 3.2:データからモデルを作る
  3.2.1:目的変数と説明変数 ─ 説明と予測の「向き」
  3.2.2:簡単な線形回帰モデル ─ Rによる実行と結果
  3.2.3:ダミー変数を使ったモデル ─ グループ間の差異を分析
  3.2.4:複雑な線形回帰モデル ─ 交互作用,モデル間の比較
  3.2.5:線形回帰の仕組みと最小二乗法
 3.3:モデルを評価する
  3.3.1:モデルを評価するための観点
  3.3.2:この結果は偶然ではないのか? ─ 有意確率と有意差検定
  3.3.3:モデルはデータに当てはまっているか? ─ フィッティングと決定係数
  3.3.4:モデルは複雑すぎないか? ─ オーバーフィッティングと予測精度
  3.3.5:残差の分布 ─ 線形回帰モデルと診断プロット
  3.3.6:説明変数同士の相関 ─ 多重共線性
  3.3.7:標準偏回帰係数
第4章:実践的なモデリング
 4.1:モデリングの準備
  4.1.1:データの準備と加工
  4.1.2:分析とモデリングの手法
 4.2:データの加工
  4.2.1:データのクレンジング
  4.2.2:カテゴリ変数の加工
  4.2.3:数値変数の加工とスケーリング
  4.2.4:分布の形を変える ─ 対数変換とロジット変換
  4.2.5:欠損値の処理
  4.2.6:外れ値の処理
 4.3:モデリングの手法
  4.3.1:グループに分ける ─ クラスタリング
  4.3.2:指標を集約する ─ 因子分析と主成分分析
  4.3.3:一般化線形モデル(GLM)とステップワイズ法
  4.3.4:2値データを目的変数とする分析 ─ ロジスティック回帰
  4.3.5:セグメントの抽出とその特徴の分析 ─ 決定木
 4.4:因果推論
  4.4.1:データから因果関係を明らかにする ─ 統計的因果推論
  4.4.2:因果の有無の検証
  4.4.3:因果効果の推定
  4.4.4:因果関係の定式化 ─ 構造方程式モデリング
  4.4.5:因果関係の定式化 ─ 構造的因果モデル
  4.4.6:因果関係の定式化 ─ ベイズ統計モデリング
  4.4.7:因果の探索
  4.4.8:因果関係に基づく変数選択
第5章:機械学習とディープラーニング
 5.1:機械学習の基本とその実行
  5.1.1:機械学習の基本
  5.1.2:機械学習ライブラリの活用 ─ scikit-learn
  5.1.3:機械学習の実行(教師あり学習)
  5.1.4:機械学習の実行(教師なし学習)
  5.1.5:スケーリングの実行(標準化・正規化)
  5.1.6:次元の削減(主成分分析)
 コラム:機械学習と強化学習
 5.2:機械学習アルゴリズムの例
  5.2.1:k近傍法
  5.2.2:ランダムフォレスト
  5.2.3:ロジスティック回帰とリッジ回帰
  5.2.4:サポートベクターマシン(SVM)
 5.3:機械学習の手順
  5.3.1:機械学習の主要な手順
  5.3.2:ホールドアウト法による実行
  5.3.3:クロスバリデーションとグリッドサーチ
  5.3.4:閾値の調整
  5.3.5:特徴量の重要度と部分従属プロット
 5.4:機械学習の実践
  5.4.1:データの準備に関わる問題
  5.4.2:特徴抽出と特徴ベクトル
  5.4.3:機械学習の実行例
 5.5:ディープラーニング
  5.5.1:ニューラルネットワーク
  5.5.2:ディープラーニングを支える技術
  5.5.3:ディープラーニング・フレームワーク
  5.5.4:ディープラーニングの実行
  5.5.5:生成モデル

↓全て表示↑少なく表示
内容サンプル

(引用元Amazon)

 
  

Rによる機械学習[第3版]

Rによる機械学習[第3版]
(著)Brett Lantz
発売日 2021/02/10
総合評価
(4.6)
(2023/05/15 12:10時点)
絶え間なく更新されるベストプラクティスが
「ベスト」であり続けるための基礎技術のすべて

【本書の内容】
本書は
Brett Lantz, "Machine Learning with R - Third Edition",
Packt Publishing, 2019
の邦訳版です。

本書は「機械学習」で語られることの多い手法(最近傍法や回帰法、ナイーブベイズ
や決定木を使った分類法)を網羅し、それぞれの意味や成立条件を解説します。
といっても、ゴリゴリの数式だけを使うわけではなく、既存のデータを使用し、
それら手法によって解析した結果、どのようなグラフが表示されるか、を
手取り足取りで解説してくれます。
ですから、機械学習を構成するさまざまな手法を、実際に使えるレベルで理解できる
ようになります。
そのため、自身が関わるプロジェクトにおいて、どの手法がベストプラクティスと
なるのか、無意味な分析・解析を避ける勘所がわかるようになるでしょう。
「機械学習」を学んだものの「もやもや」に付きまとわれているエンジニアに
よく効く一冊です。

【本書のポイント】
・「機械学習」と呼ばれる手法を網羅
・手法を構成する手続きやその前準備を微細に解説
・各手法のメリットとデメリットも紹介
・実際に手を動かすことで各種手法を正しく利用できるようになる

【読者が得られること】
・機械学習とその派生手法のモデルを頭の中に構築できる
・機械学習を成立させるさまざまな手法に精通できる
・プロジェクトで真に必要な手法がわかる
・(ついでに)R言語(4.x系)も習得できる

【著者について】
・Brett Lantz(ブレット・ランツ)
社会学者として教育を受けた著者は、人間の行動を理解するために10年以上に
わたってイノベーティブなデータ手法を活用してきた。
DataCampの講師であり、世界中の機械学習カンファレンスやワークショップで
たびたび講演を行っている。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1章 機械学習入門
1.1 機械学習の起源
1.2 機械学習の利用と乱用
1.3 機械はどのように学習するか
1.4 実際の機械学習
1.5 Rによる機械学習
1.6 まとめ
第2章 データを管理し、理解する
2.1 Rのデータ構造
2.2 Rでのデータの管理
2.3 データを調べて理解する
2.4 まとめ
第3章 怠惰学習―最近傍法を使った分類
3.1 最近傍法分類を理解する
3.2 例:k最近傍法を使って乳がんを診断する
3.3 まとめ
第4章 確率論的学習―ナイーブベイズを使った分類
4.1 ナイーブベイズを理解する
4.2 例:ナイーブベイズを使ってSMSスパムをフィルタリングする
4.3 まとめ
第5章 分割統治―決定木と分類ルールに基づく分類
5.1 決定木を理解する
5.2 例:C5.0の決定木を使ってあぶない融資を特定する
5.3 分類ルールを理解する
5.4 例:分類ルール学習器を使って毒キノコを識別する
5.5 まとめ
第6章 数値データを予測する―回帰法
6.1 回帰を理解する
6.2 例:線形回帰を使って医療費を予測する
6.3 回帰木とモデル木を理解する
6.4 例:回帰木とモデル木を使ってワインの品質を予測する
6.5 まとめ
第7章 ブラックボックス手法―ニューラルネットワークとサポートベクトルマシン
7.1 ニューラルネットワークを理解する
7.2 例:人工ニューラルネットワークを使ってコンクリートの強度をモデル化する
7.3 サポートベクトルマシンを理解する
7.4 例:SVMを使って文字を認識する
7.5 まとめ
第8章 パターン検出―相関ルールを使ったバスケット分析
8.1 相関ルールを理解する
8.2 例:相関ルールを使って頻繁に購入される商品を特定する
8.3 まとめ
第9章 データのグループを特定する―k-means法
9.1 クラスタリングを理解する
9.2 例:k-means法を使ってマーケティングセグメントを特定する
9.3 まとめ
第10章 モデルの性能を評価する
10.1 分類の性能を計測する
10.2 将来の性能を推定する
10.3 まとめ
第11章 モデルの性能を改善する
11.1 定番のモデルの性能を向上させる
11.2 メタ学習でモデルの性能を改善する
11.3 まとめ
第12章 機械学習の専門的なトピック
12.1 現実のデータの管理と前処理
12.2 オンラインデータとオンラインサービスの操作
12.3 問題領域固有のデータを操作する
12.4 Rの性能を向上させる
12.5 まとめ

↓全て表示↑少なく表示
Users Voice
第2版も使用していて大変役立ちました。第3版も期待どおり素晴らしい。 (参考:楽天)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴
ランツ,ブレット(Lantz,Brett)
社会学者。DataCampの講師であり、世界中の機械学習カンファレンスやワークショップでたびたび講演を行っている(本データはこの書籍が刊行された当時に掲載されていたものです)

  

実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専...

「基本をより実践的に!」学べる新シリーズの第一弾は、「統計モデリングの世界」へのファーストブック。基礎から学べる超入門!
・チュートリアル形式だから、すぐに実践できる!
・統計、確率、ベイズ推論、MCMCの基本事項から、やさしくサポート!
・brmsやbayesplotなどのパッケージの使い方も、しっかり身につく!
・一般化線形モデル(GLM)→一般化線形混合モデル(GLMM)→動的線形モデル(DLM)→動的一般化線形モデル(DGLM)を体系的に学べる!
【本書のサポートページ】
https://logics-of-blue.com/r-stan-bayesian-model-intro-book-support/

【実践Data Scienceシリーズ】
「基本をより実践的に!」を合言葉に、データサイエンスで用いられる各種手法の基本を、プログラミングの実装とともに解説していきます。はじめて学ぶ大学生、大学院生、ソフトウェアエンジニアに向けた注目の新シリーズです。

【主な内容】
1部 【理論編】ベイズ統計モデリングの基本
1 はじめよう! ベイズ統計モデリング
2 統計学の基本
3 確率の基本
4 確率分布の基本
5 統計モデルの基本
6 ベイズ推論の基本
7 MCMCの基本

2部 【基礎編】RとStanによるデータ分析
1 Rの基本
2 データの要約
3 ggplot2によるデータの可視化
4 Stanの基本
5 MCMCの結果の評価
6 Stanコーディングの詳細

3部 【実践編】一般化線形モデル
1 一般化線形モデルの基本
2 単回帰モデル
3 モデルを用いた予測
4 デザイン行列を用いた一般化線形モデルの推定
5 brmsの使い方
6 ダミー変数と分散分析モデル
7 正規線形モデル
8 ポアソン回帰モデル
9 ロジスティック回帰モデル
10 交互作用

4部 【応用編】一般化線形混合モデル
1 階層ベイズモデルと一般化線形混合モデルの基本
2 ランダム切片モデル
3 ランダム係数モデル

5部 【応用編】状態空間モデル
1 時系列分析と状態空間モデルの基本
2 ローカルレベルモデル
3 状態空間モデルによる予測と補間
4 時変係数モデル
5 トレンドの構造
6 周期性のモデル化
7 自己回帰モデルとその周辺
8 動的一般化線形モデル:二項分布を仮定した例
9 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
 
内容サンプル

(引用元Amazon)

 
目次
第1部 【理論編】ベイズ統計モデリングの基本
第1章 はじめよう! ベイズ統計モデリング
第2章 統計学の基本
第3章 確率の基本
第4章 確率分布の基本
第5章 統計モデルの基本
第6章 ベイズ推論の基本
第7章 MCMCの基本
第2部 【基礎編】RとStanによるデータ分析
第1章 Rの基本
第2章 データの要約
第3章 ggplot2によるデータの可視化
第4章 Stanの基本
第5章 MCMCの結果の評価
第6章 Stanコーディングの詳細
第3部 【実践編】一般化線形モデル
第1章 一般化線形モデルの基本
第2章 単回帰モデル
第3章 モデルを用いた予測
第4章 デザイン行列を用いた一般化線形モデルの推定
第5章 brmsの使い方
第6章 ダミー変数と分散分析モデル
第7章 正規線形モデル
第8章 ポアソン回帰モデル
第9章 ロジスティック回帰モデル
第10章 交互作用
第4部 【応用編】一般化線形混合モデル
第1章 階層ベイズモデルと一般化線形混合モデルの基本
第2章 ランダム切片モデル
第3章 ランダム係数モデル
第5部 【応用編】状態空間モデル
第1章 時系列分析と状態空間モデルの基本
第2章 ローカルレベルモデル
第3章 状態空間モデルによる予測と補間
第4章 時変係数モデル
第5章 トレンドの構造
第6章 周期性のモデル化
第7章 自己回帰モデルとその周辺
第8章 動的一般化線形モデル:二項分布を仮定した例
第9章 動的一般化線形モデル:ポアソン分布を仮定した例

↓全て表示↑少なく表示
Users Voice
Stanだけではなく、brmsなどのパッケージの使い方も丁寧に解説されていて大変良かったです。 (参考:YahooShopping)

↓全て表示 ↑少なく表示
ゼミで使うのに素晴らしい本です。授業を楽しんでる (参考:YahooShopping)

↓全て表示 ↑少なく表示
ベイズモデリングの見通しが良くなった。 数式は最小限で、実際にコードを書いて結果を見ながら何をしているのかを学んでいくというコンセプト。 あえて理論的な小難しい話には立ちいらず、雰囲気を掴んでいけるため、これからベイズ統計モデリングを学んでいくにあたり非常にためになる一冊であった。 簡単なモデルから出発し、章を追うごとに組み合わせるパーツを増やしていくため、とても読みやすい。 (参考:honto)

↓全て表示 ↑少なく表示
内容サンプル

(引用元Amazon)

 
著者略歴

著:馬場 真哉
Logics of Blue(https://logics-of-blue.com/)というWebサイトの管理人

著 書『平均・分散から始める一般化線形モデル入門』(プレアデス出版,2015年)
    『時系列分析と状態空間モデルの基礎:RとStanで学ぶ理論と実装』(プレアデス出版,2018年)
    『Pythonで学ぶあたらしい統計学の教科書』(翔泳社,2018年)


   

R言語の本「新書一覧(2021年、2022年刊行)」

IT技術・プログラミング言語は、最新情報のキャッチアップも非常に重要、すなわち新書は要チェック

ということで、2020年以降に発売したR言語の本の新書一覧(発売日の新しい順)が以下です。

(2023/05/15 12:10 更新)
製品価格
Rが生産性を高める〜データ分析ワークフロー効率化の実践
発売日 2022/01/26
igjit, atusy, hanaori (技術評論社)
3,190円
(+116pt)
3,190円
3,190円
3,278円
3,278円
3,278円
3,520円
(+128pt)
3,520円
3,520円
3,300円
3,300円
3,300円
データサイエンスのための Rプログラミングスキル
発売日 2021/07/07
Michael Freeman, Joel Ross (共立出版)
総合評価
(5)
5,280円
(+192pt)
5,280円
5,280円
改訂2版 RユーザのためのRStudio[実践]入門〜tidyverseによるモダンな分析フローの世界...
発売日 2021/06/03
松村 優哉, 湯谷 啓明, 紀ノ定 保礼, 前田 和寛 (技術評論社)
総合評価
(4.6)
3,278円
(+119pt)
3,278円
3,278円
3,278円
RとPythonで学ぶ統計学入門
発売日 2021/05/27
増井敏克 (オーム社)
総合評価
(4.3)
3,300円
(+120pt)
2,970円
3,300円
3,300円
RとPythonで学ぶ[実践的]データサイエンス&機械学習【増補改訂版】...
発売日 2021/05/06
有賀 友紀, 大橋 俊介 (技術評論社)
総合評価
(4.6)
3,982円
(+144pt)
3,783円
(+137pt)
3,982円
3,982円
Rによる機械学習[第3版]
発売日 2021/02/10
Brett Lantz (翔泳社)
総合評価
(4.6)
4,180円
(+126pt)
3,762円
4,180円
4,180円
サラっとできる!フリー統計ソフトEZR(Easy R)でカンタン統計解析...
発売日 2020/11/16
神田 善伸 (オーム社)
総合評価
(4.3)
2,860円
(+104pt)
2,574円
2,860円
2,860円
 

R言語の本「Kindle Unlimited 読み放題 人気本ランキング」

「Kindle Unlimited」は、Amazonの定額本読み放題サービス。

最近はKindle Unlimitedで読める本もどんどん増えており、雑誌、ビジネス書、実用書などは充実のラインナップ。

以下がKindle Unlimitedで読み放題となるR言語の本の一覧です。

30日無料体験も可能なので、読みたい本があれば体験期間で無料で読むことも可能です。

(2023/05/15 12:10 更新)
Rank製品価格
1
実践入門!ゼロから学ぶR言語
発売日 2020/03/28
きのこ
Kindle Unlimited対象
総合評価
(3.5)
350円
 

関連:Python・データ解析系の本

以下ではRと同じくデータ解析・統計分析に有用なPythonと、機械学習・データ解析系の本をまとめています、合わせてのぞいて見てください。

いじょうでっす。

コメント

タイトルとURLをコピーしました