国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

SparkSQL使用IDEA快速入門DataFrame與DataSet的完美教程

瀏覽:112日期:2024-07-12 15:04:25
目錄1.使用IDEA開發(fā)Spark SQL1.1創(chuàng)建DataFrame/DataSet1.1.1指定列名添加Schema1.1.2StructType指定Schema1.1.3反射推斷Schema1.使用IDEA開發(fā)Spark SQL1.1創(chuàng)建DataFrame/DataSet

1、指定列名添加Schema

2、通過(guò)StrucType指定Schema

3、編寫樣例類,利用反射機(jī)制推斷Schema

1.1.1指定列名添加Schema

//導(dǎo)包import org.apache.spark.rdd.RDDimport org.apache.spark.sql.SparkSession//代碼// 1.創(chuàng)建SparkSession val spark = SparkSession.builder().master('local[*]').appName('sql').getOrCreate()// 2.使用spark 獲取sparkContext 上下文對(duì)象 val sc = spark.sparkContext// 3.使用SparkContext 讀取文件并按照空格切分 返回RDD val rowRDD: RDD[(Int, String, Int)] = sc.textFile('./data/person.txt').map(_.split(' ')).map(x=>(x(0).toInt,x(1),x(2).toInt))// 4.導(dǎo)入隱式類 import spark.implicits._//5.將RDD 轉(zhuǎn)換為DataFrame 指定元數(shù)據(jù)信息 val dataFrame = rowRDD.toDF('id','name','age')//6.數(shù)據(jù)展示 dataFrame.show()1.1.2StructType指定Schema

//導(dǎo)包import org.apache.spark.sql.{Row, SparkSession}import org.apache.spark.sql.types.{IntegerType, StringType, StructField, StructType}//編寫代碼//1.實(shí)例SparkSession val spark = SparkSession.builder().master('local[*]').appName('sql').getOrCreate()//2.根據(jù)SparkSession獲取SparkContext 上下文對(duì)象 val sc = spark.sparkContext// 3.使用SparkContext讀取文件并按照空開切分并返回元組 val rowRDD = sc.textFile('./data/person.txt').map(_.split(' ')).map(x=>Row(x(0).toInt,x(1),x(2).toInt))// 4.導(dǎo)入隱式類 import spark.implicits._//5.使用StructType 添加元數(shù)據(jù)信息 val schema = StructType(List( StructField('id', IntegerType, true), StructField('name', StringType, true), StructField('age', IntegerType, true) ))//6.將數(shù)據(jù)與元數(shù)據(jù)進(jìn)行拼接 返回一個(gè)DataFrame val dataDF = spark.createDataFrame(rowRDD,schema)//7.數(shù)據(jù)展示 dataDF.show()1.1.3反射推斷Schema

//導(dǎo)包import org.apache.spark.rdd.RDDimport org.apache.spark.sql.SparkSession//定義單例對(duì)象 case class Person(Id:Int,name:String,age:Int)//編寫代碼//1.實(shí)例sparkSession val spark = SparkSession.builder().master('local[*]').appName('sql').getOrCreate()//2.通過(guò)sparkSession獲取sparkContext 上下文對(duì)象 val sc = spark.sparkContext//3.通過(guò)sparkContext 讀取文件并按照空格切分 將每一個(gè)數(shù)據(jù)保存到person中 val rowRDD: RDD[Person] = sc.textFile('./data/person.txt').map(_.split(' ')).map(x=>Person(x(0).toInt,x(1),x(2).toInt))// 4.導(dǎo)入隱式類 import spark.implicits._//5.將rowRDD轉(zhuǎn)換為dataFrame val dataFrame = rowRDD.toDF() //6.數(shù)據(jù)展示 dataFrame.show()

到此這篇關(guān)于SparkSQL使用IDEA快速入門DataFrame與DataSet的文章就介紹到這了,更多相關(guān)SparkSQL快速入門內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: IDEA
相關(guān)文章:
主站蜘蛛池模板: 91视频国产一区 | 成人毛片网站 | 成年人黄色网址 | 国产欧美一区二区三区免费看 | 国产精品分类视频分类一区 | 天堂视频免费看 | 亚洲碰碰 | 97在线观看视频免费 | 久热久操 | 亚洲人成免费网站 | 成人三级视频在线观看 | 国产日韩欧美综合一区二区三区 | 精品成人免费一区二区在线播放 | 久久久久久网站 | 国产成人综合亚洲欧美在 | 99精品久久秒播无毒不卡 | 国产成人精品一区二区三区 | 男人的天堂欧美精品色偷偷 | 成人自拍在线 | 国产精品一区二区三区免费 | 久久精品免视看国产明星 | 日韩色道 | 精品久久久在线观看 | 一级a美女毛片 | 精品国产品香蕉在线观看 | 97国产影院 | 99精品久久精品一区二区 | 国产大臿蕉香蕉大视频 | 一区精品麻豆经典 | 欧美成人一级视频 | 小屁孩和大人啪啪 | 欧美13一14周岁a在线播放 | 一级特黄一欧美俄罗斯毛片 | 精品日韩一区二区三区 | 国产成人综合网在线播放 | 成人99国产精品一级毛片 | 蕾丝视频永久在线入口香蕉 | 成人禁在线观看午夜亚洲 | 日本一级特黄aa毛片免费观看 | 成人18视频在线 | 国产在线精品观看一区 |