如何通过 Java 在 Kafka 中创建主题

Posted

技术标签:

【中文标题】如何通过 Java 在 Kafka 中创建主题【英文标题】:How to create a Topic in Kafka through Java 【发布时间】:2015-01-18 03:45:15 【问题描述】:

我想通过java在Kafka(kafka_2.8.0-0.8.1.1)中创建一个主题。如果我在命令提示符中创建一个主题,并且如果我通过 java api 推送消息,它工作正常。但我想通过java api创建一个主题。经过长时间的搜索,我找到了下面的代码,

ZkClient zkClient = new ZkClient("localhost:2181", 10000, 10000);
AdminUtils.createTopic(zkClient, myTopic, 10, 1, new Properties());

我尝试了上面的代码,它显示主题已创建,但我无法在主题中推送消息。我的代码有什么问题吗?或者任何其他方式来实现上述目标?

【问题讨论】:

【参考方案1】:
public static void create(String name) 
   AdminClient client = AdminClient.create(properties());
   NewTopic topic = new NewTopic(
      name,
      (int)conf().get("partition"),
      Short.parseShort(String.valueOf(conf().get("replication.factor"))));

   client.createTopics(Collections.singleton(topic));
   client.close();

【讨论】:

【参考方案2】:

编辑 - 较新版本的 Kafka 不需要 Zookeeper。有关 API 版本 0.11.0+,请参阅 @Neeleshkumar Srinivasan Mannur 的回答



原答案

我修好了..经过长时间的研究..

ZkClient zkClient = new ZkClient("localhost:2181", 10000, 10000);
AdminUtils.createTopic(zkClient, myTopic, 10, 1, new Properties());

从上面的代码中,ZkClient 会创建一个主题,但是这个主题信息对于 kafka 是没有感知的。所以我们要做的是,我们需要通过以下方式为 ZkClient 创建对象,

首先导入下面的语句,

import kafka.utils.ZKStringSerializer$;

并通过以下方式为 ZkClient 创建对象,

ZkClient zkClient = new ZkClient("localhost:2181", 10000, 10000, ZKStringSerializer$.MODULE$);
AdminUtils.createTopic(zkClient, myTopic, 10, 1, new Properties());

编辑 1:(用于@ajkret 评论)

上述代码不适用于 kafka > 0.9,因为 api 已更改, 将以下代码用于 kafka > 0.9


import java.util.Properties;
import kafka.admin.AdminUtils;
import kafka.utils.ZKStringSerializer$;
import kafka.utils.ZkUtils;
import org.I0Itec.zkclient.ZkClient;
import org.I0Itec.zkclient.ZkConnection;

public class KafkaTopicCreationInJava

    public static void main(String[] args) throws Exception 
        ZkClient zkClient = null;
        ZkUtils zkUtils = null;
        try 
            String zookeeperHosts = "192.168.20.1:2181"; // If multiple zookeeper then -> String zookeeperHosts = "192.168.20.1:2181,192.168.20.2:2181";
            int sessionTimeOutInMs = 15 * 1000; // 15 secs
            int connectionTimeOutInMs = 10 * 1000; // 10 secs

            zkClient = new ZkClient(zookeeperHosts, sessionTimeOutInMs, connectionTimeOutInMs, ZKStringSerializer$.MODULE$);
            zkUtils = new ZkUtils(zkClient, new ZkConnection(zookeeperHosts), false);

            String topicName = "testTopic";
            int noOfPartitions = 2;
            int noOfReplication = 3;
            Properties topicConfiguration = new Properties();

            AdminUtils.createTopic(zkUtils, topicName, noOfPartitions, noOfReplication, topicConfiguration);

         catch (Exception ex) 
            ex.printStackTrace();
         finally 
            if (zkClient != null) 
                zkClient.close();
            
        
    

【讨论】:

是的,向主题发送消息是可能的,但是消费者能得到消息吗?有什么想法吗? 您是通过低级消费者还是高级消费者来消费?能否请您提供一些代码。 0.9.0.1之后界面完全变了。 createTopic 不再接受 ZkClient。 AdminUtils 已被 AdminZkClient 弃用 zkUtils 现已在 Kafka 2.12-2.1.0 中弃用。【参考方案3】:

API 0.11.0+ 中的过程似乎大大简化了。使用它,可以如下完成

import org.apache.kafka.clients.admin.AdminClient;
import org.apache.kafka.clients.admin.CreateTopicsResult;
import org.apache.kafka.clients.admin.NewTopic;

Properties properties = new Properties();
properties.load(new FileReader(new File("kafka.properties")));

AdminClient adminClient = AdminClient.create(properties);
NewTopic newTopic = new NewTopic("topicName", 1, (short)1); //new NewTopic(topicName, numPartitions, replicationFactor)

List<NewTopic> newTopics = new ArrayList<NewTopic>();
newTopics.add(newTopic);

adminClient.createTopics(newTopics);
adminClient.close();

kafka.properties文件内容如下

bootstrap.servers=localhost:9092
group.id=test
enable.auto.commit=true
auto.commit.interval.ms=1000
key.deserializer=org.apache.kafka.common.serialization.StringDeserializer
value.deserializer=org.apache.kafka.common.serialization.StringDeserializer

请注意,必须关闭 AdminClient 的实例才能反映新创建的主题。

【讨论】:

感谢您的澄清。这是在哪里记录的? 不要认为它一定需要关闭,基本上createTopics 似乎是返回 Future 类型对象的惰性方法 - 要强制执行,您可以尝试“获取”响应它【参考方案4】:

AdminUtils API 即将被弃用。我们可以使用新的 API AdminZkClient 来管理 Kafka 服务器中的主题。

String zookeeperHost = "127.0.0.1:2181";
Boolean isSucre = false;
int sessionTimeoutMs = 200000;
int connectionTimeoutMs = 15000;
int maxInFlightRequests = 10;
Time time = Time.SYSTEM;
String metricGroup = "myGroup";
String metricType = "myType";
KafkaZkClient zkClient = KafkaZkClient.apply(zookeeperHost,isSucre,sessionTimeoutMs,
                connectionTimeoutMs,maxInFlightRequests,time,metricGroup,metricType);

AdminZkClient adminZkClient = new AdminZkClient(zkClient);

String topicName1 = "myTopic";
int partitions = 3;
int replication = 1;
Properties topicConfig = new Properties();

adminZkClient.createTopic(topicName1,partitions,replication,
            topicConfig,RackAwareMode.Disabled$.MODULE$);

详情可参考此链接:https://www.analyticshut.com/streaming-services/kafka/create-and-list-kafka-topics-in-java/

【讨论】:

AdminZkClient 类的文档 -> This is an internal class and no compatibility guarantees are provided, see org.apache.kafka.clients.admin.AdminClient for publicly supported APIs,目前的正确答案在 Neeleshkumar Srinivasan Mannur's answer【参考方案5】:

对于那些试图在 kafka v0.10.2.1 中实现这一点并遇到序列化错误“java.io.StreamCorruptedException: invalid stream header: 3139322E”问题的人,下面是一个带有必要导入的示例工作代码。

import org.I0Itec.zkclient.ZkClient;
import org.I0Itec.zkclient.ZkConnection;
import org.I0Itec.zkclient.exception.ZkMarshallingError;
import org.I0Itec.zkclient.serialize.ZkSerializer;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.PartitionInfo;

import kafka.admin.AdminUtils;
import kafka.admin.RackAwareMode;
import kafka.utils.ZKStringSerializer;
import kafka.utils.ZkUtils;

public static void createTopic(String topicName, int numPartitions, int numReplication) 
        ZkClient zkClient = null;
        ZkUtils zkUtils = null;
        try 
            String zookeeperHosts = "199.98.916.902:2181"; // If multiple zookeeper then -> String zookeeperHosts = "192.168.20.1:2181,192.168.20.2:2181";
            int sessionTimeOutInMs = 15 * 1000; // 15 secs
            int connectionTimeOutInMs = 10 * 1000; // 10 secs

            zkClient = new ZkClient(zookeeperHosts, sessionTimeOutInMs, connectionTimeOutInMs);
            //Ref: https://gist.github.com/jjkoshy/3842975
            zkClient.setZkSerializer(new ZkSerializer() 
                @Override
                public byte[] serialize(Object o) throws ZkMarshallingError 
                    return ZKStringSerializer.serialize(o);
                

                @Override
                public Object deserialize(byte[] bytes) throws ZkMarshallingError 
                    return ZKStringSerializer.deserialize(bytes);
                
            );

            zkUtils = new ZkUtils(zkClient, new ZkConnection(zookeeperHosts), false);

            int noOfPartitions = 2;
            int noOfReplication = 3;
            Properties topicConfiguration = new Properties();

            AdminUtils.createTopic(zkUtils, topicName, noOfPartitions, noOfReplication, topicConfiguration,
                    RackAwareMode.Enforced$.MODULE$);

         catch (Exception ex) 
            ex.printStackTrace();
         finally 
            if (zkClient != null) 
                zkClient.close();
            
        
    

【讨论】:

【参考方案6】:

只是指向任何使用 Kafka 更新版本的人的指针(在撰写本文时,我使用的是 Kafka v0.10.0.0)

你必须改变;

AdminUtils.createTopic(zkUtils, topicName, noOfPartitions, noOfReplications, topicConfiguration);

以下;

AdminUtils.createTopic(zkUtils, topicName, noOfPartitions, noOfReplications, true, Enforced$.MODULE$);

完成后关闭连接也是个好主意;

zkClient.close();

【讨论】:

以上是关于如何通过 Java 在 Kafka 中创建主题的主要内容,如果未能解决你的问题,请参考以下文章

如何使用Python以编程方式在Apache Kafka中创建主题

如何从具有小数类型列的主题在 ksql 中创建流

我们如何使用 API 从 IDE 在 Kafka 中创建主题

如何在kafka中创建topic

如何从kafka主题为ksqldb创建主题

创建 Kafka 主题时出错 - 复制因子大于可用代理