インプレス[コンピュータ・IT]ムック The Kaggle Workbook 著名コンテストに学ぶ!競技トップレベルの思考と技術
インプレス / 2023年10月19日 / 全161ページ
名高いコンペの解き方をたどる! ケーススタディと練習問題で実践力を養おう―代表的なコンペを取り上げ、どのようにソリューションを構築していったのかを解説。たとえば、ディスカッションを読み、ノートブックを再利用し、特徴量エンジニアリングやさまざまなモデルの訓練を見ていきます。各トピックの理解を深める練習問題も掲載。テーマによっては、基本的なソリューションから高度なものへと展開。どのような情報や知見、理論をもとにして、どのようなソリューションが導き出されたのかがわかります。
目次
- サンプル正誤表など
- 著者紹介
- レビュー担当者
- はじめに
- 第1章 最も名高いテーブルコンペティション―Porto Seguro’s Safe Driver Prediction
- 1.1 コンペティションとデータを理解する
- 1.2 評価指標を理解する
- 1.3 優勝したMichael Jahrerのソリューションを調べる
- 1.4 LightGBMベースのソリューションを構築する
- 1.5 デノイジングオートエンコーダとDNNをセットアップする
- 1.6 結果をアンサンブル化する
- 1.7 本章のまとめ
- 第2章 Makridakisコンペティション―正解率と不確実性に関するKaggleのM5
- 2.1 コンペティションとデータを理解する
- 2.2 評価指標を理解する
- 2.3 4位に入賞したMonsaraidaのソリューションを調べる
- インタビュー:Masanori Miyahara
- 2.4 特定の日付と時間区間の予測値を計算する
- 2.5 パブリックリーダーボードとプライベートリーダーボードの予測値を整理する
- 2.6 本章のまとめ
- サンプル正誤表など
- 著者紹介
- レビュー担当者
- はじめに
- 第1章 最も名高いテーブルコンペティション―Porto Seguro’s Safe Driver Prediction
- 1.1 コンペティションとデータを理解する
- 1.2 評価指標を理解する
- 1.3 優勝したMichael Jahrerのソリューションを調べる
- 1.4 LightGBMベースのソリューションを構築する
- 1.5 デノイジングオートエンコーダとDNNをセットアップする
- 1.6 結果をアンサンブル化する
- 1.7 本章のまとめ
- 第2章 Makridakisコンペティション―正解率と不確実性に関するKaggleのM5
- 2.1 コンペティションとデータを理解する
- 2.2 評価指標を理解する
- 2.3 4位に入賞したMonsaraidaのソリューションを調べる
- インタビュー:Masanori Miyahara
- 2.4 特定の日付と時間区間の予測値を計算する
- 2.5 パブリックリーダーボードとプライベートリーダーボードの予測値を整理する
- 2.6 本章のまとめ
- 第3章 画像分類コンペティション―Cassava Leaf Disease Classification
- 3.1 データと指標を理解する
- 3.2 ベースラインモデルを構築する
- 3.3 上位のソリューションから学ぶ
- 3.3.1 事前訓練
- 3.3.2 テスト時のデータ拡張3.3.3 Transformer
- 3.3.4 アンサンブル
- 3.4 完全なソリューション
- 3.5 本章のまとめ
- 第4章 自然言語処理コンペティション―Google QUEST Q&A Labeling
- 4.1 ベースラインソリューション
- 4.2 上位のソリューションから学ぶ
- 4.3 本章のまとめ
- 索引
- 翻訳者プロフィールSTAFF LIST
- 奥付
※このデジタル雑誌には目次に記載されているコンテンツが含まれています。それ以外のコンテンツは、本誌のコンテンツであっても含まれていません のでご注意ください。
※電子版では、紙の雑誌と内容が一部異なる場合や、掲載されないページがある場合があります。