Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウス

Apache Iceberg活用入門 オープンテーブルフォーマットによるデータレイク&データレイクハウ‪ス‬

Tomer Shiran and Others
    • ¥4,000
    • ¥4,000

Publisher Description

大規模クラウドのデータ課題を解決するオープンテーブルフォーマットの決定版

現代のビッグデータ基盤は、前処理の複雑さやツールへの依存といった多くの課題を抱えています。こうした問題を解決するために登場したのが、オープンソースのテーブルフォーマットApache Icebergです。本書は、Icebergの基礎から実践的な応用までを網羅したガイドブックです。Icebergの仕組みや使い方を学ぶことで、インタラクティブな分析、バッチ処理、機械学習、ストリーミング処理を効率的に実現できます。


●本書の特徴

○データ活用の障壁をなくす:データの抽出・変換・書き出しといった複雑な前処理をシンプルにし、データ統合を容易にします。これにより、効率的な分析が可能になります。

○Icebergのすべてを体系的に習得:なぜIcebergが生まれたのかという背景から、独自のアーキテクチャ、テーブル操作の裏側で行われる処理まで、その仕組みを深く理解できます。

○主要ツールでの実践ノウハウ:Apache Spark、Dremio、AWS Glue、Apache Flinkなど、人気のデータ処理エンジンでの具体的な使い方をハンズオン形式で学べます。

○本番運用で役立つ知識:メタデータテーブルによる監視、Gitライクなブランチ機能によるデータ変更の分離、リスクを抑えた移行戦略など、本番環境での運用ノウハウを習得できます。


●本書の構成

第1章 Apache Iceberg へようこそ

第2章 Apache Iceberg のアーキテクチャ

第3章 読み書きを行なうクエリのライフサイクル

第4章 Icebergテーブルの最適化

第5章 Icebergカタログ

第6章 Apache Spark

第7章 Dremio SQLクエリエンジン

第8章 AWS Glue

第9章 Apache Flink

第10章 Apache Icebergの本番利用

第11章 Apache Icebergとストリーミング処理

第12章 ガバナンスおよびセキュリティ

第13章 Apache Icebergへの移行

第14章 Apache Iceberg のユースケース


●こんな方におすすめ

○データエンジニア、データアーキテクト

○データレイクハウスの構築・運用に関わる方

○ビッグデータ基盤のパフォーマンスやコストに課題を感じている方


本書を通して、Icebergを自在に操り、複雑なデータ課題をシンプルに解決できるプロフェッショナルを目指してください。


※本書はO'Reilly Media『Apache Iceberg The Definitive Guide』の邦訳です。

GENRE
Computers & Internet
RELEASED
2025
November 12
LANGUAGE
JA
Japanese
LENGTH
480
Pages
PUBLISHER
インプレス
SELLER
Impress Communications Corporation
SIZE
21.1
MB