由async-http-client引起的Spark中的IllegalAccessError

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了由async-http-client引起的Spark中的IllegalAccessError相关的知识,希望对你有一定的参考价值。

上下文:我正在开发一个使用this library将数据写入InfluxDB的Spark流工作。这是环境。

  • 比例2.11.8
  • Spark 2.1.0(Dockerized独立集群)

相关依赖:

"org.apache.spark" %% "spark-core" % "2.1.0" % "provided",
"org.apache.spark" %% "spark-streaming" % "2.1.0" % "provided",
"org.apache.spark" %% "spark-streaming-kafka-0-8" % "2.1.0",
"com.paulgoldbaum" %% "scala-influxdb-client" % "0.5.2" // which uses "org.asynchttpclient" % "async-http-client" % "2.0.24"

一切都在我的本地计算机上编译并运行良好,但是当我将程序集jar提交给Spark集群时,我在驱动程序中收到此错误:

Exception in thread "main" java.lang.reflect.InvocationTargetException
  at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
  at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
  at java.lang.reflect.Method.invoke(Method.java:498)
  at org.apache.spark.deploy.worker.DriverWrapper$.main(DriverWrapper.scala:58)
  at org.apache.spark.deploy.worker.DriverWrapper.main(DriverWrapper.scala)
Caused by: java.lang.IllegalAccessError: tried to access field io.netty.handler.ssl.JdkSslContext.SUPPORTED_CIPHERS from class io.netty.handler.ssl.NettySslPackageAccessor
  at io.netty.handler.ssl.NettySslPackageAccessor.jdkSupportedCipherSuites(NettySslPackageAccessor.java:24)
  at org.asynchttpclient.config.AsyncHttpClientConfigDefaults.defaultEnabledCipherSuites(AsyncHttpClientConfigDefaults.java:85)
  at org.asynchttpclient.DefaultAsyncHttpClientConfig$Builder.<init>(DefaultAsyncHttpClientConfig.java:635)
  at org.asynchttpclient.DefaultAsyncHttpClient.<init>(DefaultAsyncHttpClient.java:67)
  at com.paulgoldbaum.influxdbclient.HttpClient.<init>(HttpClient.scala:21)
  at com.paulgoldbaum.influxdbclient.InfluxDB$.connect(InfluxDB.scala:16)
  ...

如果我删除写入InfluxDB的代码,问题就会消失。

我在一些环顾四周后学到的是,课程io.netty.handler.ssl.NettySslPackageAccessor实际上属于async-http-client图书馆。在io.netty.handler.ssl.JdkSslContext中访问受保护成员似乎是一个黑客级别。

我把这个问题搞砸了几天。我使其工作的解决方案是将async-http-client覆盖到不包含违规代码的早期版本。

dependencyOverrides ++= Set("org.asynchttpclient" % "async-http-client" % "2.0.12")

问题:为什么IllegalAccessError只发生在集群上,而不是我本地运行?有没有更好的方法来解决这个问题?

如果我的SBT可以正常编译,那么就不应该有任何这样的IllegalAccessError,所以这意味着我的本地代码和集群代码之间存在差异,这可能是provided spark依赖项,但它与集群版本相同。

我可以保留原样,但如果可以使用更新的版本会更好。或者至少我想了解为什么会出现这个问题并在将来避免它。

答案

我今天遇到了同样的问题,并在github上找到this issue解释了这个问题。使用Spark时,基本上你有多个ClassLoader

和io.netty.handler.ssl.NettySslPackageAccessor和io.netty.handler.ssl.JdkSslContext由不同的ClassLoader加载。

如果是这种情况,尝试访问package-private静态字段JdkSslContext.SUPPORTED_CIPHERS将失败并出现IllegalAccessError,因为package-private字段在ClassLoader级别是“作用域”。

哦,你的解决方案对我也有用,谢谢。

另一答案

这是因为在类路径中同时包含io.netty:nettyand org.asynchttpclient:async-http-client。如果要使用netty和assync-http-client,请将以下依赖项添加到gradle(类似于maven pom.xml)构建脚本:

compile 'org.asynchttpclient:async-http-client:2.0.38' compile 'org.asynchttpclient:async-http-client-netty-utils:2.0.38'

以上是关于由async-http-client引起的Spark中的IllegalAccessError的主要内容,如果未能解决你的问题,请参考以下文章

01Spar内核架构原理

如何区分两个“onpause”事件 - 由单击“暂停”按钮引起,以及由到达媒体片段末尾引起?

查找由智能指针引起的内存泄漏

spark 编译遇到的错误及解决办法

由 org.xmlpull.v1.XmlPullParserException 引起的错误

如何避免计算由 SUM() 内部的连接引起的行?