Apache Flink - 外部 Jar

Posted

技术标签:

【中文标题】Apache Flink - 外部 Jar【英文标题】:Apache Flink - External Jar 【发布时间】:2020-05-13 19:39:56 【问题描述】:

我正在尝试使用 maven 和一个额外的依赖项创建一个 Flink 应用程序:

 <dependency>
      <groupId>com.microsoft.sqlserver</groupId>
      <artifactId>mssql-jdbc</artifactId>
      <version>8.2.2.jre11</version>
  </dependency>

我正在尝试从我们的数据库中获取额外信息。当我在本地运行代码时,一切都很好,但是在 Flink 上运行时,我收到以下错误消息:

所以我最初的想法是没有使用 maven 影子插件将依赖项加载到 fat jar 上,但我认为是。

我的 Flink 在 docker 容器中运行,我在容器上打开了 1433:1433 端口(在 compose 中)。

我的目标是通过用户自定义规则将 SQL 数据添加到警报系统的流中。

这是我的 pom.xml 的内容:

--> http://maven.apache.org/xsd/maven-4.0.0.xsd"> 4.0.0

<groupId>org.qscale</groupId>
<artifactId>FlinkPrototype</artifactId>
<version>1.0</version>
<packaging>jar</packaging>

<name>Flink Quickstart Job</name>
<url>http://www.myorganization.org</url>

<properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    <flink.version>1.10.0</flink.version>
    <java.version>1.8</java.version>
    <scala.binary.version>2.11</scala.binary.version>
    <maven.compiler.source>$java.version</maven.compiler.source>
    <maven.compiler.target>$java.version</maven.compiler.target>
</properties>

<repositories>
    <repository>
        <id>apache.snapshots</id>
        <name>Apache Development Snapshot Repository</name>
        <url>https://repository.apache.org/content/repositories/snapshots/</url>
        <releases>
            <enabled>false</enabled>
        </releases>
        <snapshots>
            <enabled>true</enabled>
        </snapshots>
    </repository>
</repositories>

<dependencies>
    <!-- Apache Flink dependencies -->
    <!-- These dependencies are provided, because they should not be packaged into the JAR file. -->
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-java</artifactId>
        <version>$flink.version</version>
        <scope>provided</scope>
    </dependency>
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-streaming-java_$scala.binary.version</artifactId>
        <version>$flink.version</version>
        <scope>provided</scope>
    </dependency>

    <!-- Add connector dependencies here. They must be in the default scope (compile). -->

    <!-- Example:

    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-connector-kafka-0.10_$scala.binary.version</artifactId>
        <version>$flink.version</version>
    </dependency>
    -->

    <!-- Project dependencies -->
    <dependency>
        <groupId>com.microsoft.sqlserver</groupId>
        <artifactId>mssql-jdbc</artifactId>
        <version>8.2.2.jre11</version>
    </dependency>

    <!-- Add logging framework, to produce console output when running in the IDE. -->
    <!-- These dependencies are excluded from the application JAR by default. -->
    <dependency>
        <groupId>org.slf4j</groupId>
        <artifactId>slf4j-log4j12</artifactId>
        <version>1.7.7</version>
        <scope>runtime</scope>
    </dependency>
    <dependency>
        <groupId>log4j</groupId>
        <artifactId>log4j</artifactId>
        <version>1.2.17</version>
        <scope>runtime</scope>
    </dependency>
</dependencies>

<build>
    <plugins>

        <!-- Java Compiler -->
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-compiler-plugin</artifactId>
            <version>3.1</version>
            <configuration>
                <source>$java.version</source>
                <target>$java.version</target>
            </configuration>
        </plugin>

        <!-- We use the maven-shade plugin to create a fat jar that contains all necessary dependencies. -->
        <!-- Change the value of <mainClass>...</mainClass> if your program entry point changes. -->
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-shade-plugin</artifactId>
            <version>3.1.1</version>
            <executions>
                <!-- Run shade goal on package phase -->
                <execution>
                    <phase>package</phase>
                    <goals>
                        <goal>shade</goal>
                    </goals>
                    <configuration>
                        <shadedArtifactAttached>true</shadedArtifactAttached>
                        <shadedClassifierName>shaded</shadedClassifierName>
                        <artifactSet>
                            <excludes>
                                <exclude>org.apache.flink:force-shading</exclude>
                                <exclude>com.google.code.findbugs:jsr305</exclude>
                                <exclude>org.slf4j:*</exclude>
                                <exclude>log4j:*</exclude>
                            </excludes>
                        </artifactSet>
                        <filters>
                            <filter>
                                <!-- Do not copy the signatures in the META-INF folder.
                                Otherwise, this might cause SecurityExceptions when using the JAR. -->
                                <artifact>*:*</artifact>
                                <excludes>
                                    <exclude>META-INF/*.SF</exclude>
                                    <exclude>META-INF/*.DSA</exclude>
                                    <exclude>META-INF/*.RSA</exclude>
                                </excludes>
                            </filter>
                        </filters>
                        <transformers>
                            <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
                                <mainClass>org.qscale.StreamingJob</mainClass>
                            </transformer>
                        </transformers>
                    </configuration>
                </execution>
            </executions>
        </plugin>
    </plugins>

    <pluginManagement>
        <plugins>

            <!-- This improves the out-of-the-box experience in Eclipse by resolving some warnings. -->
            <plugin>
                <groupId>org.eclipse.m2e</groupId>
                <artifactId>lifecycle-mapping</artifactId>
                <version>1.0.0</version>
                <configuration>
                    <lifecycleMappingMetadata>
                        <pluginExecutions>
                            <pluginExecution>
                                <pluginExecutionFilter>
                                    <groupId>org.apache.maven.plugins</groupId>
                                    <artifactId>maven-shade-plugin</artifactId>
                                    <versionRange>[3.1.1,)</versionRange>
                                    <goals>
                                        <goal>shade</goal>
                                    </goals>
                                </pluginExecutionFilter>
                                <action>
                                    <ignore/>
                                </action>
                            </pluginExecution>
                            <pluginExecution>
                                <pluginExecutionFilter>
                                    <groupId>org.apache.maven.plugins</groupId>
                                    <artifactId>maven-compiler-plugin</artifactId>
                                    <versionRange>[3.1,)</versionRange>
                                    <goals>
                                        <goal>testCompile</goal>
                                        <goal>compile</goal>
                                    </goals>
                                </pluginExecutionFilter>
                                <action>
                                    <ignore/>
                                </action>
                            </pluginExecution>
                        </pluginExecutions>
                    </lifecycleMappingMetadata>
                </configuration>
            </plugin>
        </plugins>
    </pluginManagement>
</build>

感谢您的帮助!

【问题讨论】:

屏蔽图像中的数据库字符串以及凭据。它被视为敏感信息。 只是一个微不足道的检查。是否添加了Class.forName 子句? @chuckskull 的依赖?对于我拥有的项目,org.qscale.StreamingJob 在阴影插件->变压器部分 @chuckskull Haa 我想我找到了问题所在。使用您的建议运行时出现此错误: 原因:java.lang.UnsupportedClassVersionError: com/microsoft/sqlserver/jdbc/SQLServerDriver 已由 Java 运行时的更新版本(类文件版本 55.0)编译,此版本的Java Runtime 只能识别最高 52.0 的类文件版本容器中的 java 版本是 OpenJdk8。我想这就是问题所在,也可能是它早期无法正常工作的原因。 将其添加为答案。 【参考方案1】:

我认为在你的主要方法中添加Class.forName("com.microsoft.sqlserver.jdbc.SQLServerDriver") 对你有用,因为阴影看起来是正确的。

另一个问题是您在 pom 中使用 java 1.8 进行编译,但添加了使用 java 11 编译的依赖项。将 jdbc 版本更改为以下版本有望起作用。

<dependency>
      <groupId>com.microsoft.sqlserver</groupId>
      <artifactId>mssql-jdbc</artifactId>
      <version>8.2.2.jre8</version>
  </dependency>

请阅读this了解更多详情

【讨论】:

【参考方案2】:

你是如何在 flink 上运行它的?在IDE中?码头工人? EC2 您可能需要将依赖项添加到您的类路径中。

您也可以尝试更改范围依赖以在您的 pom 中编译。

编译

【讨论】:

您好,感谢您的回答。所以它在docker中运行。默认情况下,如果未指定范围,则设置为编译。如何将我的依赖添加到类路径?

以上是关于Apache Flink - 外部 Jar的主要内容,如果未能解决你的问题,请参考以下文章

Spark实例-spark读取外部配置文件之--files

Flink如何加载其他目录的jar包

Flink 指标(二)

Java导出Highcharts需要的3个外部jar包

Hadoop外部罐子

Flink:如何在 flink 中处理外部应用配置更改