# 好书推荐 ## 好书奇遇季 # 《 Greenplum 构建实时数据仓库实践》,京东当当天猫都有发售。定价 89 元,网店打折销售其实没多少钱。
Greenplum 分布式数据库具有可选存储模式、事务支持、并行查询与数据装载、容错与故障转移、数据库统计、过程化语言扩展等方面的功能特性,因此 Greenplum 成为一款理想的分析型数据库产品。本书详解 Greenplum 数据仓库构建与数据分析技术,配套示例源码。
本书内容
本书共分 10 章。内容包括数据仓库简介、数据仓库设计基础、 Greenplum 与数据仓库、 Greenplum 安装部署、实时数据同步、实时数据装载、维度表技术、事实表技术、 Greenplum 运维与监控、集成机器学习库 MADlib 。
本书涉及的具体技术
( 1 ) MySQL 主从复制,保证为业务系统提供可靠的数据库服务,并提供数据来源。
( 2 ) Canal Server 实时获取增量 MySQL binlog ,并将其传入 Kafka 消息队列。
( 3 ) Kafka 将消息持久化,同时提供可伸缩、高吞吐的消息服务。
( 4 ) Canal ClientAdapter 负责消费 Kafka 中的消息,将数据流传输到 Greenplum 。
( 5 ) Greenplum 提供实时 ETL 功能,自动维护操作数据存储、维度表与事实表。
( 6 ) Greenplum 数据库权限与角色管理、数据导入导出、性能优化、监控与维护。
( 7 ) Greenplum 集成机器学习库 MADlib ,对数据进行分析与挖掘。
本书读者
本书适合 Greenplum 初学者、大数据分析系统设计与开发、数据仓库系统设计与开发、 DBA 、架构师等相关技术人员阅读,也适合高等院校大数据相关专业的师生作为实训教材。
本书作者
王雪迎 ,毕业于中国地质大学计算机专业,高级工程师, 20 年数据库、数据仓库相关技术工作经验。先后供职于北京现代商业信息技术有限公司、北京在线九州信息技术服务有限公司、华北计算技术研究所、北京优贝在线网络科技有限公司,担任 DBA 、数据架构师等职位。著有图书《 Greenplum 构建实时数据仓库实践》《 Kettle 构建 Hadoop ETL 系统实践》《 Hadoop 构建数据仓库实践》《 HAWQ 数据仓库与数据挖掘实战》《 SQL 机器学习库 MADlib 技术解析》《 MySQL 高可用实践》。