Kafka Streams 的 openjdk:8-alpine 替代方案

Posted

技术标签:

【中文标题】Kafka Streams 的 openjdk:8-alpine 替代方案【英文标题】:Alternative to openjdk:8-alpine for Kafka Streams 【发布时间】:2019-07-25 20:02:20 【问题描述】:

我正在使用 openjdk:8-alpine 来部署 Kafka Streams 应用程序。我正在使用 Windowing,它崩溃并出现以下错误:

Exception in thread "app-4a382bdc55ae-StreamThread-1" java.lang.UnsatisfiedLinkError: /tmp/librocksdbjni94709417646402513.so: Error loading shared library ld-linux-x86-64.so.2: No such file or directory (needed by /tmp/librocksdbjni94709417646402513.so)
    at java.lang.ClassLoader$NativeLibrary.load(Native Method)
    at java.lang.ClassLoader.loadLibrary0(ClassLoader.java:1941)
    at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1824)
    at java.lang.Runtime.load0(Runtime.java:809)
    at java.lang.System.load(System.java:1086)
    at org.rocksdb.NativeLibraryLoader.loadLibraryFromJar(NativeLibraryLoader.java:78)
    at org.rocksdb.NativeLibraryLoader.loadLibrary(NativeLibraryLoader.java:56)
    at org.rocksdb.RocksDB.loadLibrary(RocksDB.java:64)
    at org.rocksdb.RocksDB.<clinit>(RocksDB.java:35)
    at org.rocksdb.Options.<clinit>(Options.java:22)
    at org.apache.kafka.streams.state.internals.RocksDBStore.openDB(RocksDBStore.java:116)
    at org.apache.kafka.streams.state.internals.Segment.openDB(Segment.java:43)
    at org.apache.kafka.streams.state.internals.Segments.getOrCreateSegment(Segments.java:91)
    at org.apache.kafka.streams.state.internals.RocksDBSegmentedBytesStore.put(RocksDBSegmentedBytesStore.java:100)
    at org.apache.kafka.streams.state.internals.RocksDBSessionStore.put(RocksDBSessionStore.java:122)
    at org.apache.kafka.streams.state.internals.ChangeLoggingSessionBytesStore.put(ChangeLoggingSessionBytesStore.java:78)
    at org.apache.kafka.streams.state.internals.ChangeLoggingSessionBytesStore.put(ChangeLoggingSessionBytesStore.java:33)
    at org.apache.kafka.streams.state.internals.CachingSessionStore.putAndMaybeForward(CachingSessionStore.java:177)
    at org.apache.kafka.streams.state.internals.CachingSessionStore.access$000(CachingSessionStore.java:38)
    at org.apache.kafka.streams.state.internals.CachingSessionStore$1.apply(CachingSessionStore.java:88)
    at org.apache.kafka.streams.state.internals.NamedCache.flush(NamedCache.java:142)
    at org.apache.kafka.streams.state.internals.NamedCache.flush(NamedCache.java:100)
    at org.apache.kafka.streams.state.internals.ThreadCache.flush(ThreadCache.java:127)
    at org.apache.kafka.streams.state.internals.CachingSessionStore.flush(CachingSessionStore.java:193)
    at org.apache.kafka.streams.state.internals.MeteredSessionStore.flush(MeteredSessionStore.java:169)
    at org.apache.kafka.streams.processor.internals.ProcessorStateManager.flush(ProcessorStateManager.java:244)
    at org.apache.kafka.streams.processor.internals.AbstractTask.flushState(AbstractTask.java:195)
    at org.apache.kafka.streams.processor.internals.StreamTask.flushState(StreamTask.java:332)
    at org.apache.kafka.streams.processor.internals.StreamTask$1.run(StreamTask.java:312)
    at org.apache.kafka.streams.processor.internals.StreamsMetricsImpl.measureLatencyNs(StreamsMetricsImpl.java:208)
    at org.apache.kafka.streams.processor.internals.StreamTask.commit(StreamTask.java:307)
    at org.apache.kafka.streams.processor.internals.StreamTask.commit(StreamTask.java:297)
    at org.apache.kafka.streams.processor.internals.AssignedTasks$1.apply(AssignedTasks.java:67)
    at org.apache.kafka.streams.processor.internals.AssignedTasks.applyToRunningTasks(AssignedTasks.java:357)
    at org.apache.kafka.streams.processor.internals.AssignedTasks.commit(AssignedTasks.java:347)
    at org.apache.kafka.streams.processor.internals.TaskManager.commitAll(TaskManager.java:403)
    at org.apache.kafka.streams.processor.internals.StreamThread.maybeCommit(StreamThread.java:994)
    at org.apache.kafka.streams.processor.internals.StreamThread.runOnce(StreamThread.java:811)
    at org.apache.kafka.streams.processor.internals.StreamThread.runLoop(StreamThread.java:750)
    at org.apache.kafka.streams.processor.internals.StreamThread.run(StreamThread.java:720)

搜索上述问题,我遇到了https://issues.apache.org/jira/browse/KAFKA-4988。但这没有帮助。

所以,Alpine 使用 musl-libc,但 RocksDB 不支持它。 向 RocksDB 添加对 musl-libc 的支持的问题:facebook/rocksdb#3143。

问题:是否有任何 openjdk docker 映像可以使我的 Kafka Stream 应用程序运行并且不会出现 Rocksdb 问题?

Edit-1:我尝试了RUN apk add --no-cache bash libc6-compat,但它也失败并出现以下错误:

# A fatal error has been detected by the Java Runtime Environment:
#
#  SIGSEGV (0xb) at pc=0x000000000011e336, pid=1, tid=0x00007fc6a3cc8ae8
#
# JRE version: OpenJDK Runtime Environment (8.0_181-b13) (build 1.8.0_181-b13)
# Java VM: OpenJDK 64-Bit Server VM (25.181-b13 mixed mode linux-amd64 compressed oops)
# Derivative: IcedTea 3.9.0
# Distribution: Custom build (Tue Oct 23 11:27:22 UTC 2018)
# Problematic frame:
# C  0x000000000011e336
#
# Failed to write core dump. Core dumps have been disabled. To enable core dumping, try "ulimit -c unlimited" before starting Java again

【问题讨论】:

你试过这个解决方案吗? github.com/wurstmeister/kafka-docker/issues/… @MostafaHussein 是的。我试过了,它给了Segmentation Fault 错误。 您是否尝试过使用其他基础镜像?喜欢adoptopenjdk/openjdk8:slim @bratkartoffel 不,我没有尝试过任何其他 openjdk 变体。它能解决我的问题吗? @Mukeshprajapati 我尝试使用:apk add --no-cache bash libc6-compat 安装该软件包,并且成功了。你能确保你有最新版本的图像吗?图片ID792ff45a2a17 【参考方案1】:

对我有用的解决方案是将 docker 映像从 openjdk:8-alpine 更改为 adoptopenjdk/openjdk8:alpine-slim

adoptopenjdk/openjdk8:alpine-slimglibc 兼容的。

我是从http://blog.gilliard.lol/2018/11/05/alpine-jdk11-images.html 得知这张图片的。

希望它对某人有所帮助。

【讨论】:

【参考方案2】:

您已链接的票证 https://issues.apache.org/jira/browse/KAFKA-4988 提供了对该问题的很多见解。

如前所述,RocksDB 看起来与 musl libc 不兼容,因此需要 glibc。

安装libc6-compact 可能不行:它在 musl libc 上提供了一个兼容层,模仿 glibc 库结构并实现了一些缺失的功能,但这与安装 glibc 本身不同。 glibc 是一个复杂的实现,因此兼容性库和实际的 glibc 之间可能没有一对一的关联。请参阅here 了解一些细微的 musl/glibc 差异。

读取ticket cmets,故障库可能是librocksdbjni.so,依赖于libstdc++6。

因此,我会尝试以下方法(使用 openjdk:8-alpine 作为您的基本图像):

确保已安装libstdc++ 包; 手动安装 glibc,如 Dockerfile(anapsix/docker-alpine-java 的 glibc Dockerfile 的精简版)中所做的那样。

【讨论】:

我试过了......但不幸的是它因分段错误而失败。 @Mukeshprajapati 我明白了。您可以尝试使用anapsix/alpine-java:8 作为基础镜像吗?它是 Alpine 3.8 + glibc + Oracle Java 8 (hub.docker.com/r/anapsix/alpine-java)。它可能与 Kafka 更兼容。 @Mukeshprajapati 另外,是否正在生成 JVM 崩溃日志 (hs_err*.log)?如果是,请发布它 - 它可以帮助诊断确切的问题。 我得到了它与adoptopenjdk/openjdk8:alpine-slim的合作。感谢您的帮助。 @Mukeshprajapati 干得好!我看到该图像也启用了 glibc,使用普通的(兼容 glibc)OpenJDK Linux 二进制文件。【参考方案3】:

您可以为 Alpine 发行版构建 glibc,而不是更改默认的 docker 基础映像。比这更好的是,您可以从Sasha Gerrand's github page 获取预构建的 apk。以下是我们添加到 Dockerfile 中的内容,以使这一切都与他的预构建 apk 一起工作:

# # GLIBC - Kafka Dependency (RocksDB)
# Used by Kafka for default State Stores.
# glibc's apk was built for Alpine Linux and added to our repository
# from this source: https://github.com/sgerrand/alpine-pkg-glibc/
ARG GLIBC_APK=glibc-2.30-r0.apk
COPY $KAFKA_DIR/$GLIBC_APK opt/
RUN apk add --no-cache --allow-untrusted opt/$GLIBC_APK

# C++ Std Lib - Kafka Dependency (RocksDB)
RUN apk add --no-cache libstdc++

【讨论】:

【参考方案4】:

https://issues.apache.org/jira/browse/KAFKA-4988 有一个关于 Kafka Streams 和 Alpine linux 不兼容的已知问题。 对于那些使用 Java 11 的人,adoptopenjdk/openjdk11:alpine-slim 对我来说很好用。 另一种解决方案是仍然使用 openjdk:11-jdk-alpine 映像作为基础映像,然后手动安装 snappy-java 库

FROM openjdk:11-jdk-alpine
RUN apk update && apk add --no-cache gcompat
...

【讨论】:

以上是关于Kafka Streams 的 openjdk:8-alpine 替代方案的主要内容,如果未能解决你的问题,请参考以下文章

Akka Stream Kafka vs Kafka Streams

Kafka Streams 开发单词计数应用

Kafka Streams入门指南

初探Kafka Streams

Kafka streams概览

Kafka Streams应用程序在kafka服务器上打开了太多文件