可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406 微信:aopopenfd777
[南開大學]20秋學期(1709、1803、1809、1903、1909、2003、2009 )《大數據開發(fā)技術(二)》在線作業(yè)
試卷總分:100 得分:100
第1題,Spark中DataFrame的()方法是進行排序查詢
A、order by
B、group by
C、select by
D、sort by
正確答案:
第2題,var a=10;
do{
a+=1;
}while(a20)
共循環(huán)了()次
A、9
B、10
C、11
D、12
正確答案:
第3題,GraphX中()是存放著Edg對象的RDD
A、RDD[Edge]
B、EdgeRDD
C、RDD[(VertexId,VD)]
D、VertexRDD
正確答案:
第4題,Dstream輸出操作中()方法將DStream中的內容按對象序列化并且以SequenceFile的格式保存
A、print
B、saveAsTextFiles
C、saveAsObjectFiles
D、saveAsHadoopFiles
正確答案:
答案來源:(www.),Dstream窗口操作中()方法基于滑動窗口對源DStream中的元素進行聚合操作,得到一個新的Dstream
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正確答案:
第6題,spark-submit配置項中()表示Driver程序使用的內存大小
A、--driver-memory MEM
B、--executor-memory MEM
C、--total-executor-cores NUM
D、--executor-coures NUM
正確答案:
第7題,PairRDD的()方法,可以把兩個RDD中鍵相同的元素組合在一起,合并為一個RDD。
A、join
B、union
C、substract
D、intersection
正確答案:
第8題,Scala 使用 () 關鍵字來繼承一個類
A、extends
B、override
C、extend
D、overrides
正確答案:
第9題,GraphX中graph.edges可以得到()
A、頂點視圖
B、邊視圖
C、頂點與邊的三元組整體視圖
D、有向圖
正確答案:
答案來源:(www.),圖結構中如果任意兩個頂點之間都存在邊,那么稱之為()
A、完全圖
B、有向完全圖
C、無向圖
D、簡單圖
正確答案:
第11題,Spark中DataFrame的()方法是進行分組查詢
A、order by
B、group by
C、select by
D、sort by
正確答案:
答案來源:(www.),以下哪個函數可以求兩個RDD差集 ()
A、union
B、substract
C、intersection
D、cartesian
正確答案:
第13題,()是Spark的數據挖掘算法庫
A、Spark Core
B、BlinkDB
C、GraphX
D、Mllib
正確答案:
第14題,Scala列表方法中將函數應用到列表的所有元素的方法是()
A、filter
B、foreach
C、map
D、mkString
正確答案:
答案來源:(www.),以下哪個函數可以對RDD進行排序()
A、sortBy
B、filter
C、distinct
D、intersection
正確答案:
第16題,GraphX中()方法可以查詢邊信息
A、numVertices
B、numEdges
C、vertices
D、edges
正確答案:
第17題,Scala列表方法中使用分隔符將列表所有元素作為字符串顯示的方法是()
A、filter
B、foreach
C、map
D、mkString
正確答案:
第18題,Spark中DataFrame的()方法是進行條件查詢
A、where
B、join
C、limit
D、apply
正確答案:
第19題,下列Scala代碼應輸出():
var a=0;var b=0var sum=0;for(a-1 until 3; b-1 until 3) {sum+=a+b;}println(sum);
A、36
B、35
C、11
D、12
正確答案:
答案來源:(www.),Scala列表方法中返回所有元素,除了最后一個的方法是()
A、drop
B、head
C、filter
D、init
正確答案:
第21題,spark-submit配置項中()表示啟動的executor數量
A、--num-executors NUM
B、--executor-memory MEM
C、--total-executor-cores NUM
D、--executor-coures NUM
正確答案:
第22題,圖結構中如果任意兩個頂點之間都存在有向邊,那么稱之為()
A、完全圖
B、有向完全圖
C、無向圖
D、簡單圖
正確答案:
第23題,在圖結構中,每個元素都可以有()前驅
A、至少一個
B、零個或多個
C、一個
D、零個
正確答案:
第24題,Spark Streming中()函數可以合并兩個DStream,生成一個包含兩個DStream中所有元素的新DStream對象
A、map
B、flatMap
C、filter
D、union
正確答案:
答案來源:(www.),()可以解決圖計算問題
A、Spark Core
B、BlinkDB
C、GraphX
D、Mllib
正確答案:
第26題,MLBase包括()
A、Mllib
B、MLI
C、SparkR
D、GraphX
正確答案:,B
第27題,MapReudce不適合()任務
A、大數據計算
B、迭代
C、交互式
D、離線分析
正確答案:
第28題,RDD是一個()的數據結構
A、可讀寫
B、只讀的
C、容錯的
D、可進行并行操作的
正確答案:
第29題,Spark可以從()分布式文件系統(tǒng)中讀取數據
A、HDFS
B、Hbase
C、Hive
D、Tachyon
正確答案:
答案來源:(www.),以下算法中屬于監(jiān)督學習算法的是()
A、KNN算法
B、邏輯回歸
C、隨機森林
D、Kmeans
正確答案:,B,C
第31題,以下哪種方法可以讓Spark不自定義分區(qū)也能對任何類型RDD 簡單重分區(qū)()
A、resetpartition
B、repartiton
C、Partition
D、coalesce
正確答案:
第32題,Spark創(chuàng)建DataFrame對象方式有()
A、結構化數據文件
B、外部數據庫
C、RDD
D、Hive中的表
正確答案:,B,C,D
第33題,MLlib中用于線性回歸算法的包主要有()
A、LinearRegressionWithSGD
B、RidgeRegressionWithSGD
C、LassoWithSGD
D、LeftRegression
正確答案:,B,C
第34題,以下哪個方法可以從集合中創(chuàng)建RDD()
A、parallelize
B、makeRDD
C、textFile
D、loadFile
正確答案:,B
第35題,Mllib實現了一些常見的機器學習算法和應用程序,包括()
A、分類
B、聚類
C、降維
D、回歸
正確答案:,B,C,D
第36題,默認情況下,Scala 使用的是可變集合
T、對
F、錯
正確答案:
第37題,RDD中的collect 函數是一個行動操作,把RDD 所有元素轉換成數組并返回到Driver 端,適用于大數據處理后的返回。
T、對
F、錯
正確答案:
第38題,Scala中高階函數經常將只需要執(zhí)行多次的函數定義為匿名函數作為參數
T、對
F、錯
正確答案:F
第39題,RDD的sortBy函數包含參數numPartitions,該參數決定排序后的RDD的分區(qū)個數,默認排序后的分區(qū)個數和排序之前的個數相等,即為this.partitions.size。
T、對
F、錯
更多答案下載:(www.)
第40題,RDD中zip操作要求兩個RDD的partition數量以及元素數量都相同
T、對
F、錯
正確答案:
第41題,用戶可以在Apache Mesos上運行Spark
T、對
F、錯
更多答案下載:(www.)
第42題,Scala 列表與數組非常相似,列表的所有元素可具有不同的類型。
T、對
F、錯
正確答案:F
第43題,Scala中創(chuàng)建一個方法時經常用void表示該方法無返回值
T、對
F、錯
正確答案:
第44題,圖(Graph)是一種復雜的非線性結構
T、對
F、錯
更多答案下載:(www.)
第45題,Scala 集合分為可變的和不可變的集合
T、對
F、錯
更多答案下載:(www.)
第46題,用戶可以在Hadoop YARN上運行Spark
T、對
F、錯
正確答案:
第47題,Spark取代Hadoop僅僅是取代MapReduce這種計算框架,Spark可以取代HDFS嗎
T、對
F、錯
正確答案:F
第48題,Scala中高階函數可以產生新的函數,并將新的函數作為返回值。
T、對
F、錯
正確答案:
第49題,RDD是一個可讀寫的數據結構
T、對
F、錯
正確答案:
答案來源:(www.),RDD的sortBy排序默認是升序
T、對
F、錯
正確答案:

