以前買ってほとんど読まずに放置していたのに目が行ったので少し目を通してみました。
この本は原著が2019年で邦訳が2020年の比較的新しい本ですが、実用的とは思えない旧い手法だと思っていた(Hinton博士等による)制限付きボルツマンマシンや深層信念ネットワークが取り上げられているのが意外でした。
自分としては冒頭の機械学習の歴史的経緯の話が面白かったところで、それなりに役に立つ本だとは思います。
ただ書名にPythonを謳った本には必要とされていないのかも知れませんが、取り上げてられている各手法の原論文が明示されていないのが少し困るので星4つにします。
プライム無料体験をお試しいただけます
プライム無料体験で、この注文から無料配送特典をご利用いただけます。
非会員 | プライム会員 | |
---|---|---|
通常配送 | ¥410 - ¥450* | 無料 |
お急ぎ便 | ¥510 - ¥550 | |
お届け日時指定便 | ¥510 - ¥650 |
*Amazon.co.jp発送商品の注文額 ¥3,500以上は非会員も無料
無料体験はいつでもキャンセルできます。30日のプライム無料体験をぜひお試しください。
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用 単行本(ソフトカバー) – 2020/4/13
Ankur A. Patel
(著),
中田 秀基
(翻訳)
{"desktop_buybox_group_1":[{"displayPrice":"¥3,960","priceAmount":3960.00,"currencySymbol":"¥","integerValue":"3,960","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"AZxhEg%2Fm%2FOElp1Ucj1Mv2XQo9CLA0DWSV1AZAy5863QCiCii5bgsRu9UcHUVG3sV9Keqcon6IganBDA%2FUnjyF8LUM68rvdPh8Xk6pKzmmn%2Bea3kU1hQ1GNU0bPJSKTvQ3%2B2JEflhWlU%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}, {"displayPrice":"¥3,265","priceAmount":3265.00,"currencySymbol":"¥","integerValue":"3,265","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"AZxhEg%2Fm%2FOElp1Ucj1Mv2XQo9CLA0DWSWj0FAzLXfZ0RzTxxGYFIfrDH7sieH5L%2Bg49wspPwcrOh6awSzPAjI3vvD80RDaZ2Xm2OD0f0YWUsUqQJzCIg9es2nCNsvRW87Rj81boC2g8HIlUZHM8Xci7mU1VfOPiXxEymM8viBB6BCuqodHhdJg%3D%3D","locale":"ja-JP","buyingOptionType":"USED","aapiBuyingOptionIndex":1}]}
購入オプションとあわせ買い
教師なし学習はラベル付けされていないデータから学習する機械学習の一種です。
現在の機械学習では大量のラベル付きのデータを用いる教師あり学習が主流ですが、ラベルを付けるには膨大なコストがかかります。
現実世界に機械学習を適用していくためには、ラベル付けを必要としない教師なし学習の重要性が増してくると考えられます。
本書は実践的な視点から、データにある隠れたパターンを特定し、異常検出や特徴量抽出・選択を行う方法を紹介します。
ラベルなしデータを有効に利用することで、機械学習の可能性を各段に広げる教師なし学習の本質に迫ります。
さらに、変分オートエンコーダ(VAE)や敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介します。
現在の機械学習では大量のラベル付きのデータを用いる教師あり学習が主流ですが、ラベルを付けるには膨大なコストがかかります。
現実世界に機械学習を適用していくためには、ラベル付けを必要としない教師なし学習の重要性が増してくると考えられます。
本書は実践的な視点から、データにある隠れたパターンを特定し、異常検出や特徴量抽出・選択を行う方法を紹介します。
ラベルなしデータを有効に利用することで、機械学習の可能性を各段に広げる教師なし学習の本質に迫ります。
さらに、変分オートエンコーダ(VAE)や敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介します。
- 本の長さ344ページ
- 言語日本語
- 出版社オライリージャパン
- 発売日2020/4/13
- 寸法24 x 19 x 2 cm
- ISBN-104873119103
- ISBN-13978-4873119106
よく一緒に購入されている商品
対象商品: Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用
¥3,960¥3,960
最短で6月14日 金曜日のお届け予定です
残り1点(入荷予定あり)
¥3,740¥3,740
最短で6月14日 金曜日のお届け予定です
残り17点(入荷予定あり)
¥3,960¥3,960
最短で6月14日 金曜日のお届け予定です
在庫あり。
総額:
当社の価格を見るには、これら商品をカートに追加してください。
ポイントの合計:
pt
もう一度お試しください
追加されました
一緒に購入する商品を選択してください。
この商品を見た後にお客様が購入した商品
ページ: 1 / 1 最初に戻るページ: 1 / 1
商品の説明
著者について
Ankur A. Patel(アンクール・A・ペイテル):Vista Equity Partnersのポートフォリオ企業である7Park Dataのデータサイエンス担当副社長。7Park Dataでは、代替データを使用して、ヘッジファンドや企業向けのデータ製品を構築し、エンタープライズクライアント向けの機械学習サービス(MLaaS)を開発している。MLaaSには、自然言語処理(NLP)、異常検出、クラスタリング、時系列予測が含まれる。7Park Dataの前は、ニューヨーク市にあるイスラエルの人工知能会社ThetaRayでデータサイエンスを行っていた。ThetaRayは、教師なし学習の応用におけるリーディングカンパニー。JPモルガンのアナリストとしてキャリアをスタートし、その後、世界最大のグローバルマクロヘッジファンドであるブリッジウォーターアソシエイツの新興市場トレーダーとなり、後に機械学習ベースのヘッジファンドであるR-Squared Macroを設立、運営を5年間にわたり行う。プリンストン大学のウッドロー・ウィルソン・スクール卒業。現在、ニューヨーク市のトライベッカ在住。世界中を旅している。
登録情報
- 出版社 : オライリージャパン (2020/4/13)
- 発売日 : 2020/4/13
- 言語 : 日本語
- 単行本(ソフトカバー) : 344ページ
- ISBN-10 : 4873119103
- ISBN-13 : 978-4873119106
- 寸法 : 24 x 19 x 2 cm
- Amazon 売れ筋ランキング: - 207,626位本 (本の売れ筋ランキングを見る)
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。
著者の本をもっと発見したり、よく似た著者を見つけたり、著者のブログを読んだりしましょう
カスタマーレビュー
星5つ中3.8つ
5つのうち3.8つ
全体的な星の数と星別のパーセンテージの内訳を計算するにあたり、単純平均は使用されていません。当システムでは、レビューがどの程度新しいか、レビュー担当者がAmazonで購入したかどうかなど、特定の要素をより重視しています。 詳細はこちら
23グローバルレーティング
虚偽のレビューは一切容認しません
私たちの目標は、すべてのレビューを信頼性の高い、有益なものにすることです。だからこそ、私たちはテクノロジーと人間の調査員の両方を活用して、お客様が偽のレビューを見る前にブロックしています。 詳細はこちら
コミュニティガイドラインに違反するAmazonアカウントはブロックされます。また、レビューを購入した出品者をブロックし、そのようなレビューを投稿した当事者に対して法的措置を取ります。 報告方法について学ぶ
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2022年8月19日に日本でレビュー済み
Amazonで購入
2021年1月31日に日本でレビュー済み
Amazonで購入
教師なし学習に関する現行技術をハンズオン(=Pythonで実際にプログラミングしながら)で一通り学べる内容である。
同じオライリージャパンの「Pythonではじめる機械学習」(Andreas C. Muller、Sarah Guido著)にも教師なし学習についての解説はあるが、こちらがscikit-learnに特化した内容であるのに対し、本書はtensor-flow・kerasによるニューラルネットワークベースの教師なし学習(オートエンコーダ等)まで詳細に触れられている点が大きな特徴と言える。
これら教師なし学習を利用して、クレジットカードトランザクションデータセットから、ラベル情報無しで、不正アクセス検出システムを構築することをテーマに解説が進められる。
和訳もこなれていて非常に読みやすく、教師なし学習に関する理解を深めるうえでの良書と言えるだろう。
一方、本書は、機械学習に関する基礎は理解済であることを前提に書かれており、初心者向けの内容とは言い難い。
先ず、本書の冒頭(2章)で、「教師あり学習」によるクレジットカードトランザクションの不正検出性能を検証したうえで、後の「教師なし学習」と対比していく流れになっているが、そもそも、教師あり学習の評価手法(クロスバリデーション、平均適合率、auc-roc等)を理解していないと、この時点で躓くことになる。
少なくとも、先の「Pythonではじめる機械学習」等に記載されている内容を理解していないと、本書の内容を理解は難しいと思われる。
また、ハンズオンで、先ずはプログラムできるようになることを主眼に置いており、各教師なし学習に関する論理的バックグラウンドの解説は殆ど無いため、その点も注意。
同じオライリージャパンの「Pythonではじめる機械学習」(Andreas C. Muller、Sarah Guido著)にも教師なし学習についての解説はあるが、こちらがscikit-learnに特化した内容であるのに対し、本書はtensor-flow・kerasによるニューラルネットワークベースの教師なし学習(オートエンコーダ等)まで詳細に触れられている点が大きな特徴と言える。
これら教師なし学習を利用して、クレジットカードトランザクションデータセットから、ラベル情報無しで、不正アクセス検出システムを構築することをテーマに解説が進められる。
和訳もこなれていて非常に読みやすく、教師なし学習に関する理解を深めるうえでの良書と言えるだろう。
一方、本書は、機械学習に関する基礎は理解済であることを前提に書かれており、初心者向けの内容とは言い難い。
先ず、本書の冒頭(2章)で、「教師あり学習」によるクレジットカードトランザクションの不正検出性能を検証したうえで、後の「教師なし学習」と対比していく流れになっているが、そもそも、教師あり学習の評価手法(クロスバリデーション、平均適合率、auc-roc等)を理解していないと、この時点で躓くことになる。
少なくとも、先の「Pythonではじめる機械学習」等に記載されている内容を理解していないと、本書の内容を理解は難しいと思われる。
また、ハンズオンで、先ずはプログラムできるようになることを主眼に置いており、各教師なし学習に関する論理的バックグラウンドの解説は殆ど無いため、その点も注意。
2020年6月30日に日本でレビュー済み
教師あり学習と対比し、教師なし学習の利点や特性などを踏まえながら、以下の順で教師なし学習を紹介してくれている。
内容は、機械学習の基本知識をすでに理解している人向け。
・scikit-learnを用いた教師なし学習
次元削減:膨大な特徴量を含んだ高次元データを、関数近似などで特徴量を残しつつ低次元に変換する
・線形射影(主成分分析(PCA)、特異点分解、ランダム射影)
・多様体学習(ISOMAO、多次元尺度構成法、局所線形埋め込み、t-sne、辞書学習...)
クラスタリング:類似性に基づいて観測点をグループ分けする
・TensorFlowとkerasを用いた教師なし学習
オートエンコーダ:特徴量抽出手法の一つ
半教師あり学習:教師あり、なしの両方のメリットを組み合わせる。利用できるラベル情報を活用してデータセットの構造を明らかにして、残りのデータのラベルづけの補助ができる
・TensorFlowとkerasを用いた深層教師なし学習
RBM(制限付きボルツマンマシン)による映画推薦システムの構築
DBM(Deep Belief Network:深層信念ネットワーク)の構築:複数のRBMからなる
GAN:敵対的生成ネットワーク、DCGAN
時系列クラスタリング:一つの観測点でしかなかった横断的データ以外に、時系列データを学習できる
実際にgithubからソースコードをダウンロードして、クレジットカードのトランザクションデータを使って不正を検知する教師なし学習システムの構築演習を体験する事ができる。
機械学習における教師なし学習法についての一連の作業過程、分析手法の実例を勉強したい人に価値が出てくる著作だと感じた。
内容は、機械学習の基本知識をすでに理解している人向け。
・scikit-learnを用いた教師なし学習
次元削減:膨大な特徴量を含んだ高次元データを、関数近似などで特徴量を残しつつ低次元に変換する
・線形射影(主成分分析(PCA)、特異点分解、ランダム射影)
・多様体学習(ISOMAO、多次元尺度構成法、局所線形埋め込み、t-sne、辞書学習...)
クラスタリング:類似性に基づいて観測点をグループ分けする
・TensorFlowとkerasを用いた教師なし学習
オートエンコーダ:特徴量抽出手法の一つ
半教師あり学習:教師あり、なしの両方のメリットを組み合わせる。利用できるラベル情報を活用してデータセットの構造を明らかにして、残りのデータのラベルづけの補助ができる
・TensorFlowとkerasを用いた深層教師なし学習
RBM(制限付きボルツマンマシン)による映画推薦システムの構築
DBM(Deep Belief Network:深層信念ネットワーク)の構築:複数のRBMからなる
GAN:敵対的生成ネットワーク、DCGAN
時系列クラスタリング:一つの観測点でしかなかった横断的データ以外に、時系列データを学習できる
実際にgithubからソースコードをダウンロードして、クレジットカードのトランザクションデータを使って不正を検知する教師なし学習システムの構築演習を体験する事ができる。
機械学習における教師なし学習法についての一連の作業過程、分析手法の実例を勉強したい人に価値が出てくる著作だと感じた。