kafka 磁盘迁移

Posted 2023-05-16 蝎子莱莱②号

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了kafka 磁盘迁移相关的知识，希望对你有一定的参考价值。

磁盘迁移

背景介绍：Kafka搭建时，配置的磁盘过大，成本过高，所以需要迁移到小容量磁盘

原kakfa配置：

log.dirs=/data1/kafka/var/kafka-logs/1,/data2/kafka/var/kafka-logs/1 (kafka磁盘可以支持多磁盘配置，提高吞吐量)

log.retention.hours=168

修改后的kafka配置：

log.dirs=/data3/kafka-logs,/data4/kafka-logs

log.retention.hours=72

1.修改topic存储时间

适量减少topic存储时间，可以加快迁移节奏，如果本身日志量不大，不超过100G，则没必要执行此步骤

并且可以预估出调整后的磁盘占用大小

# 这种属于临时配置，不需要重启kafka，此修改会提交到zk中，kakfa会优先读取zk中的配置
# retention.ms=21600000 表示此设置topic 数据保存的时间，单位：毫秒，21600000 = 1000*60*60*6 = 6 小时
# 线上可以提前写好 sh脚本，批量处理topic
sh /home/hadoop/kafka_2.11-0.9.0.1/bin/kafka-configs.sh  --zookeeper zk配置地址 --alter --add-config \'retention.ms=21600000\' --entity-type topics --entity-name topic_name

观察kafkaServer.out日志，正常broker每5分钟触发一次删除任务，等看到日志中出现 ...delete...日志，并且观察磁盘文件大小，已经变成预估空间大小，则说明已经删除完成

2.停止kafka服务

./bin/kafka-server-stop.sh stop

观察日志，出现 shutdown complete字样的日志时，并且使用 jps -m 命令，找不到kafka的进程之后，表示停止完成

3.执行数据拷贝

mkdir -p /data3/kafka-logs
mkdir -p /data4/kafka-logs
mkdir -p /home/hadoop/kafka_2.11-0.9.0.1/logs

# 注意使用异步拷贝，防止当前shell窗口过期
nohup cp -r /data1/kafka/var/kafka-logs/1/* /data3/kafka-logs/ &
nohup cp -r /data2/kafka/var/kafka-logs/1/* /data4/kafka-logs/ &
# 后续可以使用此命令，查看是否拷贝完成
ps -ef | grep kafka-logs
df -h

当观察到新旧磁盘空间大小一致，且 ps -ef | grep kafka-logs 没有进程之后，说明拷贝完成

# 拷贝完成后，修改原目录名称
mv /data1/kafka /data1/kafka_bak
mv /data2/kafka /data2/kafka_bak

4.修改配置

# 修改kafka 配置文件
vim /home/hadoop/kafka_2.11-0.9.0.1/config/server.properties

# 找到下面配置，并更改
log.dirs=/data3/kafka-logs,/data4/kafka-logs
log.retention.hours=72

# 修改gc日志配置，默认的会一直打印gc日志
vim /home/hadoop/kafka_2.11-0.9.0.1/bin/kafka-run-class.sh
# 找到下面配置，并更改
KAFKA_GC_LOG_OPTS=" "

5.启动kafka服务

./bin/kafka-server-start.sh -daemon config/server.properties

# 观察日志：查看到启动完成，并且 集群中没有未同步副本时，说明此kafka已经完全启动
tail -f ./logs/kafkaServer.out

# 观察旧的磁盘目录下，没有新文件产生，说明迁移成功
ls -lrth /data1
ls -lrth /data2

6.恢复topic存储时间

千万不要忘了这一步。。。同样写脚本，处理所有topic

sh ./bin/kafka-configs.sh  --zookeeper zk配置地址 --alter --delete-config \'retention.ms\' --entity-type topics --entity-name topic_name

备注:

为什么要拷贝磁盘文件，而不是直接修改配置，重启kafka？
- 如果新的broker启动，加入集群，需要同步topic的数据；同步过程中，会占满带宽或磁盘IO，如果数据量过大，同步时间过长，会造成kakfa长时间不可用，线上数据淤积，影响业务
- kakfa会在数据磁盘下生成：recovery-point-offset-checkpoint，replication-offset-checkpoint这俩文件，会记录当前磁盘下topic数据存储offset信息，拷贝过去之后会根据这俩文件同步数据，不会造成数据错乱问题
- 所以拷贝磁盘数据在数据量较大时，会是较优的方案

kafka数据迁移

kafka数据迁移操作流程：

此次数据迁移主要是针对Isr自动同步异常，而进行手动干预的操作。

具体的故障截图如下：

一、确认同步异常的topic和Isr数目

./kafka-topics.sh --under-replicated-partitions --describe --zookeeper IP:2181

二、创建文件/tmp/topics-to-move.json

vim /tmp/topics-to-move.json

复制这些topic,并写成如下格式的文件, 命名为 topics-to-move.json

{"topics": [

{"topic": "test"} //test是对应的topic名字

"version":1

}

三、执行：

./kafka-reassign-partitions.sh --zookeeper localhost:2181 --topics-to-move-json-file /tmp/topics-to-move.json --broker-list "0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26" --generate

执行结果会生成一串新的topics-to-move.json数据，修改所需转换的Isr对应关系（例如（14,0）转换为（14,1））；

创建新配置文件 touch /tmp/reassignment-node.json

将修改后的topics-to-move.json文件写入reassignment-node.json

./kafka-reassign-partitions.sh --zookeeper localhost:2181 --reassignment-json-file /tmp/reassignment-node.json --execute //开始迁移

./kafka-reassign-partitions.sh --zookeeper localhost:2181 --reassignment-json-file /tmp/reassignment-node.json --verify //确认迁移同步情况，待所有进程都successful，迁移完成。

涉及到的监控脚本：

while true ;do /usr/hdp/2.2.0.0-2041/kafka/bin/kafka-reassign-partitions.sh --zookeeper localhost:2181 --reassignment-json-file /tmp/reassignment-node.json --verify|awk ‘/Reassignment/ && $5!~/completed/&& $6 !~ /successfully/‘|wc -l;sleep 10;done

/usr/hdp/2.2.0.0-2041/kafka/bin/kafka-topics.sh --zookeeper localhost:2181 --describe --topic CDR_AUDIT|awk -F‘,|[ ]*|\t‘ ‘{if(($9==14)||($10==14))print $0}‘

本文出自 “韩磊” 博客，请务必保留此出处http://deararvin.blog.51cto.com/11158301/1739463

以上是关于kafka 磁盘迁移的主要内容，如果未能解决你的问题，请参考以下文章