sparksql绯诲垪(涓€)鐜鎼缓

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sparksql绯诲垪(涓€)鐜鎼缓相关的知识,希望对你有一定的参考价值。

鏍囩锛?a href='http://www.mamicode.com/so/1/uil' title='uil'>uil   鑷繁   %s   ESS   long   lfw   park   瑁呭寘   

浠ュ墠鍏徃鐢ㄧ殑鏄痵park-core锛屼絾鏄崲宸ヤ綔鍚庣敤鐨勫鏄痵park-sql銆?br />鏈€杩戝涔犱簡寰堝spark-sql锛屽湪姝ゅ仛涓€涓湁spark缁忛獙鐨剆parksql蹇€熷叆闂ㄧ殑鏁欑▼銆?/div>
JDK瀹夎鍖?1.8鐗堟湰锛歨ttps://pan.baidu.com/s/1pLW3jyKv3N_FhQ7vvE4U2g    
SCALA瀹夎鍖咃細https://pan.baidu.com/s/17f8AiS2n_g5kiQhxf7XIlA
hadoop瀹夎鍖咃細https://pan.baidu.com/s/1YNM2_eTV8Zf_2SxamfMrSQ
Spark瀹夎鍖咃細https://pan.baidu.com/s/17mf2_DMiNy7OdlFwygekhg
IDE瀹夎鍖咃細https://pan.baidu.com/s/1caaKufvSuHBX1xEFXvCwPw

涓€锛欽DK鐜鎼缓

鍏朵腑閲嶈鐨勫氨鏄袱涓畨瑁呰矾寰凧DK璺緞鍜孞RE璺緞锛屼笁涓幆澧冨彉閲忥細JAVA_HOME銆丳ATH銆丆LASSPATH

鎴戞湰鍦扮殑鏄?  JDK璺緞(D:JAVAJDK)      JRE璺緞(D:JAVAJRE)     

JAVA_HOME(D:JAVAJDK)   

PATH(%JAVA_HOME%in;%JAVA_HOME%jrein;)  

CLASSPATH(.;%JAVA_HOME%libdt.jar;%JAVA_HOME%lib ools.jar;)

楠岃瘉鏂规锛歫ava -version

浜岋細SCALA鐜鎼缓

涓嬭浇鍚庯紝瑙e帇鍗冲彲銆傞厤缃竴涓幆澧冨彉閲忓嵆鍙€?/p>

閲嶈鐜鍙橀噺锛屽姞涓婂嵆鍙細SCALA_HOME(D:JAVAscala)      PATH(%SCALA_HOME%in;%SCALA_HOME%jrein;)  

楠岃瘉鏂规硶锛歴cala -version

涓夛細hadoop鐜鎼缓

銆€銆€銆€銆€涓嬭浇鍚庯紝瑙e帇鍗冲彲銆傞厤缃袱涓幆澧冨彉閲忓嵆鍙€?/p>

銆€銆€銆€銆€HADOOP_HOME(D:JAVAhadoop)      PATH($HADOOP_HOME/bin;)

銆€銆€銆€銆€鍏朵腑闇€瑕佸皢bin涓嬮潰鐨勪笢瑗挎浛鎹㈡垚window鐗堟湰锛屽洜涓烘槸window鐗堟湰銆備笂闈㈤摼鎺ヤ腑鐨勫凡缁忔浛鎹㈣繃銆?nbsp;       

鍥涳細杩愯鐨刯ar鍖?/h2>

銆€銆€銆€銆€spark 瑙e帇鐨勮矾寰勪腑jars鐩綍涓殑涓滆タ锛屾坊鍔犺繘IDE鐨刢lasspath灏辫浜?/p>

浜旓細IDE瑙e帇寮€灏辫

銆€銆€銆€銆€鎵撳紑鍚庢柊寤轰竴涓猻cala椤圭洰銆傚拰JAVA鐨処DE鎿嶄綔涓€妯′竴鏍凤紝鍦ㄦ涓嶈缁嗘弿杩般€?/p>

鍏細sparksql 浣犲ソ锛屼笘鐣?/h2>

銆€銆€銆€spark 瑙e帇鐨勮矾寰勪腑jars鐩綍涓殑涓滆タ锛屾坊鍔犺繘IDE鐨刢lasspath

            import java.util.Arrays
            import org.apache.spark.SparkConf
            import org.apache.spark.api.java.JavaSparkContext
            import org.apache.spark.sql.{DataFrame, Row, SparkSession, functions}
            import org.apache.spark.sql.functions.{col, countDistinct, desc, length, row_number, sum, trim, when,count}
            import org.apache.spark.sql.types.{LongType, StringType, StructField, StructType}
            import org.apache.spark.sql.expressions.Window
            import org.apache.spark.storage.StorageLevel
            import org.apache.spark.sql.SaveMode

            object WordCount {
                        def main(args: Array[String]): Unit = {
                                    val sparkSession= SparkSession.builder().master("local").appName("AppName").getOrCreate()
                                    val javasc = new JavaSparkContext(sparkSession.sparkContext)

                                    val nameRDD = javasc.parallelize(Arrays.asList("{鈥榥ame鈥?鈥榳angwu鈥?鈥榓ge鈥?鈥?8鈥?鈥榲ip鈥?鈥榯鈥榼",
                                                "{鈥榥ame鈥?鈥榮unliu鈥?鈥榓ge鈥?鈥?9鈥?鈥榲ip鈥?鈥榯鈥榼","{鈥榥ame鈥?鈥榸hangsan鈥?鈥榓ge鈥?鈥?8鈥?鈥榲ip鈥?鈥榝鈥榼"));
                                    val namedf = sparkSession.read.json(nameRDD)

                                    namedf.select(col("name")).show(100)

                        }
            }

hello锛寃orld璇﹁В

        sparkSession鐨勪綔鐢ㄥ氨鐩稿綋浜巗parkcontext锛屾槸鎿嶄綔鏁版嵁鐨勫叧閿?/p>

銆€銆€SparkSession.builder()        java宸ュ巶妯″紡鍝?/p>

銆€銆€master("local")                      闄愬埗妯″紡鏄湰鍦版ā寮?/p>

銆€銆€appName("AppName")       濉啓鑷繁app鐨勫悕绉帮紝鍏嶅緱浠诲姟澶氱殑鏃跺€欐壘涓嶅埌鑷繁鐨勪换鍔?/p>

銆€銆€getOrCreate()                       鍥哄畾鏂规硶锛屾垜涔熶笉鐭ラ亾涓轰粈涔堛€傚按灏紝灏村艾锛屽按灏?/p>

涓婄嚎sparksession鐨勫垵濮嬪寲

           鎬庝箞锛焥parksession鐨勫垵濮嬪寲杩樺垎鏈湴妯″紡鍜岀嚎涓婃ā寮忓悧锛?/p>

銆€銆€   涓嶏紝鍙槸涓婁竴娈典唬鐮佷腑鏈変竴涓猰aster鍙傛暟鏄痩ocal锛岃繖涓弬鏁扮殑鎰忔€濇槸鏈湴妯″紡銆傜湡姝d笂绾挎椂涓嶈兘鐢ㄨ繖涓紝闇€瑕佸幓鎺夈€?/p>

銆€銆€銆€val sparkSession= SparkSession.builder().appName("AppName").getOrCreate()

JavaSparkContext銆乶ameRDD銆乶amedf銆乻elect

銆€銆€javaSparkContext                鍏跺疄娌℃湁浠€涔堝嵉鐢ㄥ氨鏄皢json杞崲鎴恟dd

銆€銆€namedf                                  rdd杞崲鎴愮殑Dataframe锛屽叾瀹炲拰spark-core涓殑rdd鏄竴涓蹇点€傚皢json涓茶浆鎹负涓€涓猻parksql琛ㄤ簡銆?/p>

銆€銆€select                                     Dataframe鎵€鏈夌殑鎿嶄綔鍜孲QL鏄竴鏍风殑锛宻elect灏辨槸绠€鍗曠殑鏌ヨ

 

以上是关于sparksql绯诲垪(涓€)鐜鎼缓的主要内容,如果未能解决你的问题,请参考以下文章

锛堟暟鎹瀛﹀涔犳墜鏈?1锛塩onda+jupyter鐜╄浆鏁版嵁绉戝鐜鎼缓

vagrant鎼缓centos鐜

Hadoop+HBase+Spark+Hive鐜鎼缓

杞绘澗鎼缓CAS 5.x绯诲垪-鐧诲綍鍚庢樉绀洪€氱煡淇℃伅

棰樺璇濓細2020 骞磋鎬庝箞鐢?Intellij IDEA 鎼缓 Haskell 鐜

Spring涓婃柊 灏忕绯诲垪