如何在Rails应用程序中使用Kafka？

Posted 2021-05-02 AI前线

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何在Rails应用程序中使用Kafka？相关的知识，希望对你有一定的参考价值。

作者 | AGIS ANASTASOPOULOS

编译 | 无明

编辑 | Emily

背景介绍

有那么一段时间，我们的系统需要用到分布式流式处理和消息系统，而 Apache Kafka 似乎成了我们建立业务关键型应用程序的坚实基础。它可用于很多场景下，比如产品更新管道、订单跟踪、实时用户通知、商户账单等。

接下来的故事讲述了我们如何将 Kafka 引入到我们的 Rails 单体代码库中，内容包括技术细节、我们面临的挑战以及我们在此过程中所做的技术决策。

眼前的挑战

第一个问题是 Kafka 只提供了相对较底层的抽象。虽然这具有一定的优势，但同时也意味着客户端开发者需要面对更多的 API，需要处理更多的细节，实现一个 Kafka 客户端也因此变成了一项艰巨的任务。

作为一个基于 Ruby 的项目，我们尝试了各种使用 Ruby 开发的 Kafka 客户端，但总是碰到一些难以诊断的错误。 Ruby 缺乏并发原语，要写出一个高效的客户端并不容易。

我们通过多种方式来归避这些问题：通过独立服务来隐藏底层的复杂性，只为客户端提供最小化的 API 集合。这个服务可以使用 Ruby 以外的语言开发，所以我们就可以用上久经验证的 librdkafka，我们在其他的 Python 和 Go 应用程序中也使用过这个库。

于是，我们开发了 Rafka——位于 Kafka 前端的代理服务，并通过简单的语义和 API 把它暴露出来。它提供了合理的默认配置，为用户隐藏了很多繁杂的细节。我们选择了 Go 语言，因为它已经有一个健壮的基于 librdkafka 的 Kafka 客户端，并提供了必要的工具来实现我们需要的功能。

为了避免让客户端的开发变复杂，我们选择使用 Redis 协议的一个子集。我们所要做的只是在 Ruby 的 Redis 客户端之上添加一个层。

几天后，我们便有了一个使用 Ruby 开发的客户端，打包成一个名为 rafka-rb 的 gem，其中包含了消费者和生产者。

有了 Rafka 及其配套的 Ruby 客户端，我们的服务和 Rails 应用程序就可以轻松地从 Kafka 读取数据和往 Kafka 写入数据。

大部分开发人员的时间都花在了我们的 Rails 主应用程序上，因此，能够在应用程序内轻松使用 Kafka 消费者和生产者就变得非常重要。接下来就是让 Rails 开发人员直接用上 Kafka 消费者和生产者。

在 Rails 应用程序中发送数据

将生产者集成到现有的应用程序中其实很简单，因为即使需要使用多个主题，也只需要一个生产者。

因此，我们使用了单个生产者实例，并在应用程序初始化的时候创建它，整个代码库都使用这个实例：

# config/initializers/kafka_producer.rb
Skroutz.kafka_producer = Rafka::Producer.new(...)

发送消息非常简单：

Skroutz.kafka_producer.produce("greetings", "Hello there!")

在 Rails 应用程序中读取数据

使用消费者就有点不一样了，因为消费消息需要长时间运行。接下来，我们将看到如何在 Rails 代码库中通过 Rafka 来使用 Kafka 消费者。

文末提供了相关组件源代码的链接。

消费者是普通的 Ruby 对象，它们的类是在 Rails 应用程序中定义的。它们继承了 KafkaConsumer 抽象类，这个抽象类集成了用于统计的 statsd 和用于错误跟踪的 Sentry，在将来可能还会集成其他东西。它们的类名以“Consumer”作为后缀，相应的文件按照 Rails 惯例来命名。