装配，包括我的罐子

Question

我想构建一个“胖”的代码罐。我理解如何做到这一点，但所有的例子我都使用jar不是本地的想法，我不知道如何在我组装的jar中包含我构建的scala代码使用的另一个JAR。像我必须包含的JAR文件夹一样？

通常，当我使用spark-shell将我当前的代码作为测试运行时，它看起来像这样：

spark-shell --jars magellan_2.11-1.0.6-SNAPSHOT.jar -i st_magellan_abby2.scala

（jar文件与.scala文件位于同一路径中）

所以现在我想构建一个build.sbt文件，它执行相同的操作并包含SNAPSHOT.jar文件？

name := "PSGApp"
version := "1.0"
scalaVersion := "2.11.8"

resolvers += "Spark Packages Repo" at "http://dl.bintray.com/spark-packages/maven"

//provided means don't included it is there.  already on cluster?

libraryDependencies ++= Seq(
    "org.apache.spark" %% "spark-core" % "2.2.0" % "provided",
    "org.apache.spark" %% "spark-sql" % "2.2.0" % "provided",
    "org.apache.spark" %% "spark-streaming" % "2.2.0" % "provided",
    //add magellan here somehow?

)

那么我在哪里将jar放入SBT项目文件夹结构中，以便在运行sbt程序集时它被拾取？那是在main / resources文件夹中吗？参考手册中说的是'主罐中包含的文件'去哪里了？

我会在这里放入库依赖项，以便它知道添加特定的jar而不是去网上获取它？

最后一件事，我还在我的测试代码中进行了一些导入，现在似乎不会飞，因为我把这个代码放在一个附加了def main的对象中。

我有类似的东西：

导入sqlContext.implicits._这是在上面的代码中正好使用它，如下所示：

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

import sqlContext.implicits._
import org.apache.spark.sql.functions.udf

val distance =udf {(a: Point, b: Point) => 
   a.withinCircle(b, .001f);  //current radius set to .0001
}

我不确定我可以将这些导入保留在def main中吗？或者我必须以某种方式将它们移到别处？（我仍在学习scala和争论范围）。