大数据&云计算
Kafka权威指南(第2版)

本书全面介绍Kafka的技术原理和应用技巧。

  • 豆瓣评分8.3
  • 作者[美] 格温·沙皮拉(Gwen Shapira) / [美] 托德·帕利诺(Todd Palino) / [英] 拉吉尼·西瓦拉姆(Rajini Sivaram) / [美] 克里特·佩蒂(Krit Petty)
  • 译者薛命灯
  • 出版社人民邮电出版社
  • 发行日期2022-11
  • ISBN9787115601421
  • 标签

本书全面介绍Kafka的技术原理和应用技巧。内容包括如何安装和配置Kafka、如何使用Kafka API、Kafka的设计原则和可靠性保证,以及Kafka的一些架构细节,如复制协议、控制器和存储层。本书列举了一些非常流行的Kafka应用场景,比如基于事件驱动的微服务系统的消息总线、流式处理应用程序和大规模数据管道。通过学习本书,你不仅能够深入理解这项大数据核心技术,还能够将所学知识付诸实践,在生产环境中更好地运行Kafka,并基于它构建稳健的高性能应用程序。

本书特色

本书第1版出版时,有超过30%的《财富》世界500强公司使用Kafka。5年后,这个比例已经达到70%。毋庸置疑,作为大数据时代的核心技术,Kafka已然成为所有动态数据平台的事实基础。本书为使用Kafka的软件工程师、架构师和运维工程师勾勒出一条完整的学习曲线,并强调原理剖析和应用实践。

来自Confluent和LinkedIn的一线Kafka开发人员将为你解释如何部署生产级Kafka集群、编写可靠的事件驱动微服务,以及使用Kafka构建可伸缩的流处理应用程序。通过详细的示例,你将了解Kafka的设计原则、可靠性保证,以及架构细节,包括复制协议、控制器和存储层。

  • 部署和配置Kafka的良好实践
  • Kafka生产者和消费者如何读写消息
  • 确保可靠传递数据的模式和用例要求
  • 用Kafka构建数据管道和应用程序
  • 用Kafka在生产环境中执行监控、调优和维护任务
  • Kafka的关键运维指标
  • Kafka针对流处理系统的交付能力

相关书籍

Spark快速大数据分析(第2版)
通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。
Kubernetes for Developers
A clear and practical beginner’s guide that shows you just how easy it can be to make the switch to Kubernetes!
Hadoop技术内幕:深入理解MapReduce架构设计与实现原理
介绍了MapReduce的设计理念和编程模型。