Kindle Price: ¥2,932

(Tax included)

Points earned:
176 pt (6%)

These promotions will be applied to this item:

Some promotions may be combined; others are not eligible to be combined with other offers. For details, please see the Terms & Conditions associated with these promotions.

You've subscribed to ! We will preorder your items within 24 hours of when they become available. When new books are released, we'll charge your default payment method for the lowest price available during the pre-order period.
Update your device or payment method, cancel individual pre-orders or your subscription at
Your Memberships & Subscriptions
Kindle app logo image

Download the free Kindle app and start reading Kindle books instantly on your smartphone, tablet, or computer - no Kindle device required.

Read instantly on your browser with Kindle for Web.

Using your mobile phone camera - scan the code below and download the Kindle app.

QR code to download the Kindle App

[エンジニアのための]データ分析基盤入門 データ活用を促進する! プラットフォーム&データ品質の考え方 Kindle Edition

4.1 4.1 out of 5 stars 49 ratings

(概要)

システムとデータの両面にスポットを当て、データ分析基盤の整備/運用/活用の指針をまとめた入門書。

データ分析の中心にある「データ分析基盤」を取り巻く環境は、大きく変わりました。機械学習/ディープラーニング、マーケティング、需給予測、不正検知を筆頭にデータ利用が多角化し、データ分析基盤に求められる役割も多様化が進んでいます。本書では、データ分析基盤の「今」に焦点を合わせ、基本用語の整理から歴史、クラウドをはじめとしたインフラ、主要な技術スタック、システムモデル、データドリブンのための可視化&測定術まで徹底解説。

合わせて、長期視点に立ったユーザー中心の運用に欠かせない「セルフサービス」「SSoT」に基づいたルール作り、それらを実現するためのゾーン/タグ管理、メタデータ管理、データの品質管理も平易にまとめました。広くデータ分析基盤に関わるエンジニア/ユーザーの方々へ、ユーザーが自然と集まり、データ活用を促進するシステムの実現のために、実践で活かせる考え方をお届けします。


(こんな方におすすめ)

・データ活用のために、データ分析基盤の開発に携わっているエンジニア

・データ分析基盤を利用して分析を行い、より良いデータ活用環境を実現したいとお考えのユーザーの方々

・データ分析基盤に関心をお持ちのインフラエンジニア、プログラマ、データ分析者


(目次)

第1章 [入門]データ分析基盤 データ分析基盤を取り巻く「人」「技術」「環境」

  1.1 データ分析基盤の変遷 多様化を受け入れるために進化する

  1.2 処理基盤/クラスターの変遷 よりマネージレスにしてコストを減らし、より本来の業務へ集中する時代

  1.3 データの変遷 ExcelからWeb、IoT、そして何でもあり(!?)へ

  1.4 データ分析基盤に関わる人の変遷 データにまつわる多様な人材

  1.5 データへの価値観の変化 データ品質の重要度が高まってきた

  1.6 データにおける開発の変遷 複雑化するプロダクトと人の関係

  1.7 本章のまとめ

第2章 データエンジニアリングの基礎知識 4つのレイヤー

  2.1 データエンジニアリングの基本 ポイントと本書内の関連章について

  2.2 データの世界のレイヤー データ分析基盤の世界を俯瞰する

  2.3 コレクティングレイヤー データを集める

  2.4 プロセシングレイヤー データを変換する

  2.5 ストレージレイヤー データやメタデータを貯蔵する

  2.6 アクセスレイヤー データ分析基盤と外の世界との連携

  2.7 本章のまとめ

第3章 データ分析基盤の管理&構築 セルフサービス、SSoT、タグ、ゾーン、メタデータ管理

  3.1 セルフサービスの登場 全員参加時代への移行期

  3.2 SSoT データは1ヵ所に集めよう

  3.3 データ管理デザインパターン ゾーンとタグ

  3.4 データの管理とバックアップ データ整理と、もしものときの準備

  3.5 データのアクセス制御 ほど良いアクセス権限の適用

  3.6 One Size Fits All問題 デカップリングで数々の問題を解決しよう

  3.7 データのライフサイクルマネジメント 不要なデータを残さないために

  3.8 メタデータとデータ品質による管理 データを知る基本ツール

  3.9 ハイブリット構成 ハイブリッドが抱える問題

  3.10 本章のまとめ

第4章 データ分析基盤の技術スタック データソースからアクセスレイヤー、クラスター、ワークフローエンジンまで

  4.1 データ分析基盤の技術スタック 全体像を俯瞰する

  4.2 データ分析基盤のためのクラスター選択 無理な利用にも耐えられる必要がある

  4.3 コレクティングレイヤーの技術スタック セルフサービス時代のデータの取り込み

  4.4 プロセシングレイヤーの技術スタック データ変換を行うレイヤー

  4.5 ワークフローエンジン データ取り込みと変換を統括する

  4.6 ストレージレイヤーの技術スタック データの保存方法

  4.7 アクセスレイヤー構築の技術スタック セルフサービス時代のユーザーへのデータ提供

  4.8 アクセス制御 アクセスレイヤーに対するアクセス制御

  4.9 本章のまとめ

第5章 メタデータ管理 データを管理する「データ」の重要性

  5.1 データより深いメタデータの世界 データは氷山の一角

  5.2 メタデータとデータ 3つのメタデータを整理/整備しよう

  5.3 データプロファイリング データの状態を見る

  5.4 データカタログ 手元にないメタデータはカタログ化しよう

  5.5 データアーキテクチャ リネージュ、プロバナンス。メタデータの総合力

  5.6 本章のまとめ

第6章 データマート&データウェアハウスとデータ整備 DIKWモデル、データ設計、スキーマ設計、最小限のルール

  6.1 データを整備するためのモデル DIKWモデル

  6.2 データマートの役割 「Data」を整備して知恵の創出をサポートする

  6.3 スキーマ設計 データに関するルールを設計する

  6.4 データマートの生成サポート コミュニケーションの省略&活用

  6.5 データマートのプロパゲーション メタデータやルールの作成

  6.6 ストリーミングとデータマート 瞬時にKnowledge化する

  6.7 本章のまとめ

第7章 データ品質管理 質の高いデータを提供する

  7.1 データ品質管理の基礎 データ蓄積から次の段階へ進む

  7.2 データの劣化 データは放置するだけで劣化する

  7.3 データ品質テスト 劣化に気づくための品質チェック

  7.4 メタデータ品質 生産性を向上させるために

  7.5 データ品質を向上させる 品質テストの結果を活かす

  7.6 本章のまとめ

第8章 データ分析基盤から始まるデータドリブン データ分析基盤の可視化&測定

  8.1 データ分析基盤とデータドリブン エンジニアもデータドリブンに行こう

  8.2 データドリブンを実現するための準備 データ分析基盤のPDCAと数値

  8.3 KPIをどのように開発に活かすのか データ分析基盤の「コスト削減KGI」の例

  8.4 データ分析基盤観点のKGI/(CSF)/KPI 改善の着眼点

  8.5 本章のまとめ

Appendix [ビッグデータでも役立つ]RDB基礎講座

  A.1 データベースとは何か? 検索、更新、制約機能を持った入れ物

  A.2 RDBの基本 データベースの基本を振り返る

  A.3 RDBにおけるアーキテクチャ RDBの設計

  A.4 Appendixのまとめ
Read more Read less
Due to its large file size, this book may take longer to download

Product description

About the Author

斎藤 友樹 Saito Yuki
SIerで官公庁、年金、広告などのシステムの要件定義〜保守運用まで、SEやマネージャーとしてフロントエンド〜サーバーサイドまでひととおり経験。現在は、事業会社にてビッグデータ分析に関するシステムの構築、蓄積したデータの活用を行う仕事に従事している。直近では利用者が数千万を超える環境で、ストリーミングデータの処理や一日あたり5000超のETLジョブを捌くデータ分析基盤のアーキテクチャ設計やデータ活用のためのしくみ作りを担当。また、AWSなどのパブリッククラウドイベントの登壇などを通して積極的に情報発信を行っている。

Product Details

  • ASIN ‏ : ‎ B09S5ZW33G
  • Publisher ‏ : ‎ 技術評論社 (February 18, 2022)
  • Publication date ‏ : ‎ February 18, 2022
  • Language ‏ : ‎ Japanese
  • File size ‏ : ‎ 25666 KB
  • Text-to-Speech ‏ : ‎ Enabled
  • X-Ray ‏ : ‎ Not Enabled
  • Word Wise ‏ : ‎ Not Enabled
  • Sticky notes ‏ : ‎ On Kindle Scribe
  • Print length ‏ : ‎ 528 pages
  • Customer Reviews:
    4.1 4.1 out of 5 stars 49 ratings

Customer reviews

4.1 out of 5 stars
4.1 out of 5
49 global ratings

Review this product

Share your thoughts with other customers
データ分析基盤導入の前にはぜひ読みたい書籍
5 Stars
データ分析基盤導入の前にはぜひ読みたい書籍
著者のUdemy講座で宣伝されていたので、ふらりと買ってみました。本書は講座と違い、実践のための知識体系をまとめた書籍でした。データ開発に関わる人への教科書的な立ち位置で、幅広いトピックに関して包括的に網羅されつつ抽象論だけで終わることなく、実践で行う際のイメージもしっかりと解説されています。これでもか!と解説されていますがおそらく範囲が広すぎるのだろうということで、解説はコアな部分にのみ絞っているのだと思います(監視などのどれでも共通的な話はほとんど飛ばされています。)。ただ、中途半端に記載されてページを水増しされるより良いと思いました。
Thank you for your feedback
Sorry, there was an error
Sorry we couldn't load the review

Top reviews from Japan

Reviewed in Japan on April 7, 2023
Verified Purchase
データ分析周辺のデータマネジメント手法から具体的な技術動向までわかりやすくまとまっていて、とても参考になりました。
2 people found this helpful
Report
Reviewed in Japan on April 11, 2022
Verified Purchase
ここに書かれている内容は、私が直近何年かでしてきたことなので、大きくは違和感なく受け入れられる内容で、自分の仕事内容をうまく説明する事ができなかったりすることが多いので、知識の整理や言語化するのに役に立ちました。
私がやっている業務内容を新たにチームに加わった方に理解いただくために使えそうだなと思いました。

一方で、技術的な知識に偏りが多少感じられたので、そこについてはここに私が補足して伝えられればいいのかなと感じました。

タイトルの通り、同領域の知識がない方に向けての入り口にはすごく合っていると思いました。
5 people found this helpful
Report
Reviewed in Japan on February 27, 2023
Verified Purchase
入門書として最適な網羅性でとても役に立つ。
3 people found this helpful
Report
Reviewed in Japan on November 13, 2022
Verified Purchase
データ分析基盤はどういうものか、というのを浅く理解するには良いと思いますが、実践で使えるというレベルにはなってない印象です。

また、単純に日本語の文章が読み辛いです。
誤植なのか、接続詞から終わりの言葉でしっくりこないことが多々ありました。
例:本書で扱う「データ」という用語ですが、(中略)、カンマで分けられたテキストベースデータのこと。
→個人的には「〜ですが」のあとで「〜のこと」で終わるのは違和感がある。
One person found this helpful
Report
Reviewed in Japan on July 3, 2022
Verified Purchase
データエンジニアリングを学んでいるエンジニアが2〜3冊目として読むのに良いかと思います。

まず1冊目としてはデータの基本や従来型データベースの挙動を学ぶため「データベーススペシャリスト試験」などで基本を学ぶことが推奨されます。そこから発展してデータ分析やデータエンジニアリングを学ぶための本として本書を読むことがオススメです。

データエンジニアリングとは何か、データ分析基盤の全体と各層の概要、メタデータ管理、アクセス制御、データのライフサイクル、ワークフロー、データ品質の維持、リネージュ、データマートの作り方、など一通りの知識が詰まっています。
3 people found this helpful
Report
Reviewed in Japan on March 13, 2022
Verified Purchase
具体性において。

本書は、ゆずたそ氏の類書より具体的。

本書は、オライリーのawsデータサイエンスの本より抽象的。

一般的に。抽象的な本は、浅いが広い知識が記載される。メリットは、部分最適になりにくい。デメリットは、何か出来るようにはならない。

具体的な本はメリット・デメリットが逆。
7 people found this helpful
Report
Reviewed in Japan on February 26, 2022
Verified Purchase
著者のUdemy講座で宣伝されていたので、ふらりと買ってみました。
本書は講座と違い、実践のための知識体系をまとめた書籍でした。

データ開発に関わる人への教科書的な立ち位置で、幅広いトピックに関して包括的に網羅されつつ
抽象論だけで終わることなく、実践で行う際のイメージもしっかりと解説されています。

これでもか!と解説されていますがおそらく範囲が広すぎるのだろうということで、解説はコアな部分にのみ絞っているのだと思います(監視などのどれでも共通的な話はほとんど飛ばされています。)。
ただ、中途半端に記載されてページを水増しされるより良いと思いました。
Customer image
5.0 out of 5 stars データ分析基盤導入の前にはぜひ読みたい書籍
Reviewed in Japan on February 26, 2022
著者のUdemy講座で宣伝されていたので、ふらりと買ってみました。
本書は講座と違い、実践のための知識体系をまとめた書籍でした。

データ開発に関わる人への教科書的な立ち位置で、幅広いトピックに関して包括的に網羅されつつ
抽象論だけで終わることなく、実践で行う際のイメージもしっかりと解説されています。

これでもか!と解説されていますがおそらく範囲が広すぎるのだろうということで、解説はコアな部分にのみ絞っているのだと思います(監視などのどれでも共通的な話はほとんど飛ばされています。)。
ただ、中途半端に記載されてページを水増しされるより良いと思いました。
Images in this review
Customer image
Customer image
9 people found this helpful
Report
Reviewed in Japan on April 5, 2022
Verified Purchase
データ分析基盤をリードする人の入門書でもあると感じました。
現場レベルでできることについて様々解説されています
3 people found this helpful
Report
Report an issue

Does this item contain inappropriate content?
Do you believe that this item violates a copyright?
Does this item contain quality or formatting issues?