南開21春學(xué)期《大數(shù)據(jù)開發(fā)技術(shù)(二)》在線作業(yè)(標(biāo)準(zhǔn)答案)

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2021/8/31 0:13:00來源:admin瀏覽: 49 次

可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406      微信:aopopenfd777



21春學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)《大數(shù)據(jù)開發(fā)技術(shù)(二)》在線作業(yè)
試卷總分:100    得分:100
第1,Scala列表方法中使用分隔符將列表所有元素作為字符串顯示的方法是()
A、filter
B、foreach
C、map
D、mkString
正確答案:


第2題,Mllib中線性會館算法中的參數(shù)reParam表示()
A、要運(yùn)行的迭代次數(shù)
B、梯度下降的步長
C、是否給數(shù)據(jù)加干擾特征或者偏差特征
D、Lasso 和ridge 的正規(guī)化參數(shù)
正確答案:


第3題,Scala列表方法中輸出符號指定條件的所有元素的方法是()
A、drop
B、head
C、filter
D、init
正確答案:


第4題,Spark GraphX中類Graph的mask方法可以()
A、反轉(zhuǎn)圖中所有邊的方向
B、按照設(shè)定條件取出子圖
C、取兩個圖的公共頂點和邊作為新圖,并保持前一個圖頂點與邊的屬性
D、合并邊相同的屬性
正確答案:


答案來源:(www.),Spark中DataFrame的()方法是進(jìn)行分組查詢
A、order by
B、group by
C、select by
D、sort by
正確答案:


第6題,圖結(jié)構(gòu)中如果無重復(fù)的邊或者頂點到自身的邊,那么稱之為()
A、完全圖
B、有向完全圖
C、無向圖
D、簡單圖
正確答案:


第7題,PairRDD中()函數(shù)可以合并具有相同鍵的值
A、mapValues
B、groupBy
C、groupByKey
D、reduceByKey
正確答案:


第8題,Dstream窗口操作中()方法基于滑動窗口對源DStream中的元素進(jìn)行聚合操作,得到一個新的Dstream
A、window
B、countByWindow
C、reduceByWindow
D、reduceByKeyAndWindow
正確答案:


第9題,Scala類通過子類化和基于靈活的混合類來進(jìn)行擴(kuò)展,作為##的一個可靠性解決方案
A、多態(tài)
B、虛函數(shù)
C、派生
D、多重繼承
正確答案:


答案來源:(www.),以下哪個函數(shù)可以對RDD進(jìn)行去重()
A、sortBy
B、filter
C、distinct
D、intersection
正確答案:


第11題,PairRDD的()方法,可以把兩個RDD中鍵相同的元素組合在一起,合并為一個RDD。
A、join
B、union
C、substract
D、intersection
正確答案:


答案來源:(www.),Mllib中metrics.recallByThreshold
表示()指標(biāo)
A、準(zhǔn)確度
B、召回率
C、F值
D、ROC曲線
正確答案:


第13題,Spark GraphX中類Graph的reverse方法可以()
A、反轉(zhuǎn)圖中所有邊的方向
B、按照設(shè)定條件取出子圖
C、取兩個圖的公共頂點和邊作為新圖,并保持前一個圖頂點與邊的屬性
D、合并邊相同的屬性
正確答案:


第14題,GraphX中()方法可以釋放頂點緩存
A、cache
B、presist
C、unpersistVertices
D、edges.unpersist
正確答案:


答案來源:(www.),圖的結(jié)構(gòu)通常表示為:G(V,E),其中,E是圖G中()
A、頂點
B、頂點的集合
C、邊
D、邊的集合
正確答案:


第16題,Scala中重寫一個非抽象方法必須使用()修飾符。
A、extends
B、override
C、extend
D、overrides
正確答案:


第17題,GraphX中()方法可以查詢度數(shù)
A、degrees
B、degree
C、vertices
D、edges
正確答案:


第18題,Mllib中線性會館算法中的參數(shù)intercept表示()
A、要運(yùn)行的迭代次數(shù)
B、梯度下降的步長
C、是否給數(shù)據(jù)加干擾特征或者偏差特征
D、Lasso 和ridge 的正規(guī)化參數(shù)
正確答案:


第19題,Scala函數(shù)組合器可以對集合中的元素進(jìn)行分組操作,結(jié)果得到的是一個Map的方法是()
A、filter
B、flatten
C、grouby
D、flatmap
正確答案:


答案來源:(www.),Spark Streming中()函數(shù)可以使用func將源DStream中的每個元素進(jìn)行聚合操作,返回一個內(nèi)部所包含的RDD只有一個元素的新DStream
A、union
B、reduce
C、join
D、cogroup
正確答案:


第21題,以下哪個不是Scala的數(shù)據(jù)類型()
A、Int
B、Short Int
C、Long
D、Any
正確答案:


第22題,Spark Streming中()函數(shù)可以對源DStream的每個元素通過函數(shù)func返回一個新的DStream
A、map
B、flatMap
C、filter
D、union
正確答案:


第23題,圖是一種數(shù)據(jù)元素間為()關(guān)系的數(shù)據(jù)結(jié)構(gòu)
A、多對多
B、一對一
C、一對多
D、多對一
正確答案:


第24題,如果numPartitions是分區(qū)個數(shù),那么Spark每個RDD的分區(qū)ID范圍是()
A、[0,numPartitions]
B、[0,numPartitions-1]
C、[1,numPartitions-1]
D、[1,numPartitions]
正確答案:


答案來源:(www.),Graph類中如果要根據(jù)邊數(shù)據(jù)創(chuàng)建圖,邊數(shù)據(jù)需要加載為二元組,可以選擇是否對邊分區(qū),應(yīng)該用()方法
A、Graph(vertices,edges, defaultVertexAttr)
B、Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C、Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D、GraphLoader.edgeListFile(sc,filename)
正確答案:


第26題,Scala函數(shù)支持()
A、遞歸函數(shù)
B、高階函數(shù)
C、柯里化
D、匿名函數(shù)
正確答案:,B,C,D


第27題,以下哪個是Scala的數(shù)據(jù)類型()
A、Any
B、NULL
C、Nothing
D、AnyRef
正確答案:,B,C,D


第28題,Scala中可以用()方法來連接兩個或多個列表
A、::
B、#:::
C、List.::)
D、List.concat()
正確答案:,C,D


第29題,Spark可以通過哪些外部存儲創(chuàng)建RDD()
A、文本文件
B、目錄
C、壓縮文件
D、通配符匹配的文件
正確答案:,B,C,D


答案來源:(www.),Spark中的RDD的說法正確的是()
A、彈性分布式數(shù)據(jù)集
B、是Spark中最基本的數(shù)據(jù)抽象
C、代表一個可變的集合
D、代表的集合里面的元素可并行計算
正確答案:,B,D


第31題,Spark中DataFrame的()方法是查詢指定字段的數(shù)據(jù)信息
A、select
B、selectExpr
C、col
D、apply
正確答案:,B,C,D


第32題,以下哪個方法可以從集合中創(chuàng)建RDD()
A、parallelize
B、makeRDD
C、textFile
D、loadFile
正確答案:,B


第33題,TF-IDF中TF指的是()
A、詞頻
B、詞在文檔中出現(xiàn)的次數(shù)
C、逆文檔概率
D、詞在文檔集中出現(xiàn)的概率
E、詞在文檔集中出現(xiàn)的概率
正確答案:


第34題,Mllib實現(xiàn)了一些常見的機(jī)器學(xué)習(xí)算法和應(yīng)用程序,包括()
A、分類
B、聚類
C、降維
D、回歸
正確答案:,B,C,D


第35題,Spark SQL 可以通過()方法加載json文件為DataFrame
A、format
B、json
C、get
D、read
正確答案:


第36題,RDD的mapPartitions操作會導(dǎo)致Partitions數(shù)量的變化
T、對
F、錯
正確答案:F


第37題,Scala函數(shù)組合器中filter過濾移除使得傳入的函數(shù)的返回值為true的元素
T、對
F、錯
正確答案:


第38題,Scala是Scalable Language的簡寫,是一門多范式的編程語言,設(shè)計初衷是不包括面向?qū)ο缶幊痰奶匦浴?br/>T、對
F、錯
正確答案:F


第39題,Scala函數(shù)組合器中foreach和map類似,有返回值
T、對
F、錯
正確答案:


第40題,Spark中DataFrame 的查詢操作也是一個懶操作, 僅僅生成一個查詢計劃, 只有觸發(fā)Action 操作才會進(jìn)行計算并返回查詢結(jié)果。
T、對
F、錯
更多答案下載:(www.)


第41題,PairRDD中g(shù)roupBy(func)func返回key,傳入的RDD的各個元素根據(jù)這個key進(jìn)行分組。
T、對
F、錯
正確答案:


第42題,鍵值對RDD由一組組的鍵值對組成,這些RDD被稱為PairRDD。
T、對
F、錯
正確答案:


第43題,RDD的union函數(shù)會將兩個RDD元素合并成一個并且去處重復(fù)元素
T、對
F、錯
正確答案:


第44題,RDD中combineByKey不允許返回類型與輸入數(shù)據(jù)類型不同的返回值
T、對
F、錯
正確答案:F


第45題,RDD的行動操作通過某種函數(shù)將一個RDD 轉(zhuǎn)換為一個新的RDD , 但是轉(zhuǎn)換操作是懶操作,不會立刻執(zhí)行計算。
T、對
F、錯
正確答案:


第46題,Scala函數(shù)組合器中g(shù)roupBy是對集合中的元素進(jìn)行分組操作,結(jié)果得到的是一個Map
T、對
F、錯
正確答案:


第47題,Scala中元組是是一種可迭代的鍵值對(key/value)結(jié)構(gòu)。
T、對
F、錯
正確答案:


第48題,RDD是一個可讀寫的數(shù)據(jù)結(jié)構(gòu)
T、對
F、錯
正確答案:F


第49題,RDD的map操作不會改變RDD的分區(qū)數(shù)目
T、對
F、錯
更多答案下載:(www.)


答案來源:(www.),Spark只有鍵值對類型的RDD才能設(shè)置分區(qū)方式
T、對
F、錯
更多答案下載:(www.)














  • 上一篇:
  • 下一篇:
  • 作業(yè)咨詢 論文咨詢
    微信客服掃一掃

    回到頂部