可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請(qǐng)?zhí)砑観Q:3230981406 微信:aopopenfd777
21春學(xué)期(1709、1803、1809、1903、1909、2003、2009、2103)《大數(shù)據(jù)開(kāi)發(fā)技術(shù)(一)》在線作業(yè)
試卷總分:100 得分:100
第1題,Map Task和Reduce Task均由()啟動(dòng)。
A、Client
B、Job Tracker
C、Task
D、Task Tracker
正確答案:
第2題,MongoDB將數(shù)據(jù)存儲(chǔ)為一個(gè)()
A、關(guān)系
B、屬性
C、字段
D、文檔
正確答案:
第3題,MapReduce中最優(yōu)的Reduce任務(wù)個(gè)數(shù)取決于集群中可用的()的數(shù)目。
A、Split
B、Slot
C、Map
D、Shuffle
正確答案:
第4題,Hbase中()文件記錄了-ROOT-表的位置
A、Master
B、Region
C、Zookeeper
D、Chubby
正確答案:
答案來(lái)源:(www.),BigTable采用()作為底層數(shù)據(jù)存儲(chǔ)
A、HDFS
B、GFS
C、Hbase
D、傳統(tǒng)文件系統(tǒng)
正確答案:
第6題,Hadoop啟動(dòng)所有進(jìn)程的命令為()。
A、all-start.sh
B、all-start.exe
C、start-all.sh
D、start-all.exe
正確答案:
第7題,MapReduce處理關(guān)系的()運(yùn)算時(shí),Map過(guò)程需要記錄元組的信息及該元組來(lái)源。
A、投影
B、差
C、交
D、并
正確答案:
第8題,Hbase中()是最核心的模塊,負(fù)責(zé)維護(hù)分配給自己的Region,并響應(yīng)用戶的讀寫(xiě)請(qǐng)求
A、Master
B、Slaver
C、Regio服務(wù)器n
D、客戶端
正確答案:
第9題,關(guān)于Strom中Bolt說(shuō)法錯(cuò)誤的是()。
A、Bolt可以執(zhí)行過(guò)濾、函數(shù)操作、Join、操作數(shù)據(jù)庫(kù)等任何操作
B、Bolt是一個(gè)被動(dòng)的角色,Spout是一個(gè)主動(dòng)的角色
C、Bolt不僅可以處理Tuple還可以創(chuàng)建新的Tuple
D、Bolt是Streams的狀態(tài)轉(zhuǎn)換過(guò)程的抽象含義
正確答案:
答案來(lái)源:(www.),MapReduce設(shè)計(jì)的一個(gè)理念就是(),因?yàn)橐苿?dòng)數(shù)據(jù)需要大量的網(wǎng)絡(luò)傳輸開(kāi)銷。
A、數(shù)據(jù)向計(jì)算靠攏
B、計(jì)算向數(shù)據(jù)靠攏
C、計(jì)算向網(wǎng)絡(luò)靠攏
D、計(jì)算與數(shù)據(jù)并行
正確答案:
第11題,在Storm的工作流程中,對(duì)于Supervisor說(shuō)法錯(cuò)誤的是()。
A、Supervisor會(huì)去Zookeeper集群上認(rèn)領(lǐng)自己的Task
B、Supervisor節(jié)點(diǎn)首先將提交的Topology進(jìn)行分片,分成一個(gè)個(gè)Task,分配給相應(yīng)的Nimbus
C、Supervisor會(huì)將Task和相關(guān)的信息提交到Zookeeper集群上
D、Supervisor會(huì)通知自己的Worker進(jìn)程進(jìn)行Task的處理
正確答案:
答案來(lái)源:(www.),Google Fusion Tables是哪種可視化工具()
A、信息圖表
B、地圖工具
C、時(shí)間線工具
D、分析工具
正確答案:
第13題,批處理系統(tǒng)關(guān)注(),流處理系統(tǒng)關(guān)注()。
A、吞吐率,延時(shí)
B、延時(shí),吞吐率
C、延時(shí),速度
D、速度,吞吐率
正確答案:
第14題,使用Amazon云環(huán)境部署Hadoop的說(shuō)法中錯(cuò)誤的是()。
A、Hadoop不僅可以運(yùn)行在企業(yè)內(nèi)部的集群中,也可以運(yùn)行在云計(jì)算環(huán)境中
B、Hadoop自帶有一套腳本,用于在EC2上面運(yùn)行Hadoop
C、在EC2上運(yùn)行Hadoop尤其適用于一些工作流
D、Amazon EC2為Hadoop提供了存儲(chǔ)服務(wù)
正確答案:
答案來(lái)源:(www.),關(guān)于分布式并行編程,以下說(shuō)法錯(cuò)誤的是()。
A、"摩爾定律",CPU性能大約每隔12個(gè)月翻一番
B、"摩爾定律"逐漸失效后,人們開(kāi)始借助于分布式并行編程來(lái)提高程序性能
C、分布式程序運(yùn)行在大規(guī)模計(jì)算機(jī)集群上,可以并行執(zhí)行大規(guī)模數(shù)據(jù)處理任務(wù),從而獲得海量的計(jì)算能力
D、谷歌公司最先提出了分布式并行編程模型MapReduce
正確答案:
第16題,靜態(tài)數(shù)據(jù)采取()計(jì)算模式
A、批量
B、實(shí)時(shí)
C、大數(shù)據(jù)
D、動(dòng)態(tài)
正確答案:
第17題,優(yōu)點(diǎn)是性能好(高并發(fā)),靈活性高,復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活
提供嵌入式文檔功能的數(shù)據(jù)庫(kù)是()
A、列族數(shù)據(jù)庫(kù)
B、鍵值數(shù)據(jù)庫(kù)
C、圖數(shù)據(jù)庫(kù)
D、文檔數(shù)據(jù)庫(kù)
正確答案:
第18題,關(guān)于MapReduce中Shuffle過(guò)程,說(shuō)法錯(cuò)誤的是()。
A、Shuffle過(guò)程中為每個(gè)Map任務(wù)分配一個(gè)緩存
B、Shuffle過(guò)程中分區(qū)默認(rèn)采用哈希函數(shù)
C、Shulle過(guò)程的合并會(huì)改變最終結(jié)果
D、Shuffle過(guò)程在Reduce端首先從Map端領(lǐng)取結(jié)果,然后執(zhí)行歸并操作,最后輸送給Reduce任務(wù)進(jìn)行處理。
正確答案:
第19題,Storm中如果要隨機(jī)分發(fā)Stream中的Tuple,保證每個(gè)Bolt的Task接收Tuple數(shù)量大致一致,應(yīng)該采用哪種Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正確答案:
答案來(lái)源:(www.),SQL Azure體系結(jié)構(gòu)層中哪層將用戶的請(qǐng)求轉(zhuǎn)化為Azure內(nèi)部的TDS格式流
A、Client Layer
B、Services Layer
C、Platform Layer
D、Infrastructure Layer
正確答案:
第21題,優(yōu)點(diǎn)是查找速度快,可擴(kuò)展性強(qiáng),容易進(jìn)行分布式擴(kuò)展,復(fù)雜性低的數(shù)據(jù)庫(kù)是()
A、列族數(shù)據(jù)庫(kù)
B、鍵值數(shù)據(jù)庫(kù)
C、圖數(shù)據(jù)庫(kù)
D、文檔數(shù)據(jù)庫(kù)
正確答案:
第22題,應(yīng)用于專門(mén)用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù),比較適合于社交網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)是哪種()
A、列族數(shù)據(jù)庫(kù)
B、鍵值數(shù)據(jù)庫(kù)
C、圖數(shù)據(jù)庫(kù)
D、文檔數(shù)據(jù)庫(kù)
正確答案:
第23題,Storm中如果要保證相同字段的Tuple分配到同一個(gè)Task中,應(yīng)該采用哪種Stream Groupings()。
A、ShuffleGrouping
B、AllGrouping
C、GlobalGrouping
D、FiedlsGrouping
正確答案:
第24題,應(yīng)用于分布式數(shù)據(jù)存儲(chǔ)與管理
數(shù)據(jù)在地理上分布于多個(gè)數(shù)據(jù)中心的應(yīng)用程序的數(shù)據(jù)庫(kù)是哪種()
A、列族數(shù)據(jù)庫(kù)
B、鍵值數(shù)據(jù)庫(kù)
C、圖數(shù)據(jù)庫(kù)
D、文檔數(shù)據(jù)庫(kù)
正確答案:
答案來(lái)源:(www.),1秒定律體現(xiàn)了大數(shù)據(jù)的哪個(gè)特征()。
A、數(shù)據(jù)量大
B、數(shù)據(jù)產(chǎn)生速度快
C、數(shù)據(jù)存儲(chǔ)快
D、數(shù)據(jù)計(jì)算快
正確答案:
第26題,SQL Azure體系結(jié)構(gòu)層中哪層是存儲(chǔ)節(jié)點(diǎn)集群,相當(dāng)于普通Web系統(tǒng)的數(shù)據(jù)庫(kù)層
A、Client Layer
B、Services Layer
C、Platform Layer
D、Infrastructure Layer
正確答案:
第27題,Gephi是哪種可視化工具()
A、信息圖表
B、地圖工具
C、時(shí)間線工具
D、分析工具
正確答案:
第28題,以下亞馬遜的產(chǎn)品中哪個(gè)是分布式內(nèi)存緩存
A、ElastiCache
B、RDS
C、DynamoDB
D、Redshift
正確答案:
第29題,Hadoop中執(zhí)行MapReduce任務(wù)不含哪種方式()。
A、Mahout
B、Hadoop jar
C、Shell腳本
D、Python
正確答案:
答案來(lái)源:(www.),以下說(shuō)法不正確的是()。
A、MapReduce的核心思想就是"分面治之"
B、HDFS是對(duì)GFS的開(kāi)源實(shí)現(xiàn)
C、MapReduce是一種分布式計(jì)算模型
D、HDFS采用HBase作為其底層數(shù)據(jù)存儲(chǔ)
正確答案:
第31題,關(guān)系數(shù)據(jù)庫(kù)與NoSQL數(shù)據(jù)庫(kù)相比有哪些優(yōu)勢(shì)()
A、支持事務(wù)ACID四性
B、可以支持超大規(guī)模數(shù)據(jù)存儲(chǔ)
C、以完善的關(guān)系代數(shù)理論作為基礎(chǔ)
D、具有強(qiáng)大的橫向擴(kuò)展能力
正確答案:,C
第32題,MapReduce可以解決哪些計(jì)算問(wèn)題()。
A、矩陣乘法
B、關(guān)系代數(shù)運(yùn)算
C、聚合運(yùn)算
D、關(guān)系投影運(yùn)算
正確答案:,B,C,D
第33題,關(guān)系數(shù)據(jù)庫(kù)與NoSQL數(shù)據(jù)庫(kù)相比適用于哪些領(lǐng)域()
A、電信
B、銀行
C、互聯(lián)網(wǎng)企業(yè)大數(shù)據(jù)處理
D、傳統(tǒng)企業(yè)的數(shù)據(jù)分析
正確答案:,B
第34題,HDFS的命名空間包含()
A、節(jié)點(diǎn)
B、目錄
C、文件
D、塊
正確答案:,C,D
第35題,MapReduce的main函數(shù)中設(shè)置輸出類型的方法有()。
A、setOutputKeyClass
B、setOutputClass
C、setOutputValueClass
D、setKeyValueClass
正確答案:,C
第36題,Hadoop在配置偽分布式時(shí)需要修改哪幾個(gè)配置文件()。
A、hbase-site.xml
B、hdfs-site.xml
C、core-site.xml
D、map-site.xml
E、mapr-site.xml
正確答案:,C
第37題,哪些屬于數(shù)據(jù)可視化的重要作用()
A、分析數(shù)據(jù)
B、采集數(shù)據(jù)
C、輔助理解數(shù)據(jù)
D、觀測(cè)跟蹤數(shù)據(jù)
正確答案:
第38題,以下哪些是數(shù)據(jù)可視化時(shí)間線工具()
A、Echarts
B、Timetoast
C、Xtimeline
D、R
正確答案:
第39題,流計(jì)算是針對(duì)流數(shù)據(jù)的實(shí)時(shí)計(jì)算,可以應(yīng)用在()場(chǎng)景中
A、廣告投放
B、氣候模擬預(yù)測(cè)
C、機(jī)器翻譯
D、推薦系統(tǒng)
正確答案:
第40題,傳統(tǒng)的數(shù)據(jù)處理流程的前提是()。
A、存儲(chǔ)的數(shù)據(jù)是舊的
B、存儲(chǔ)的數(shù)據(jù)是實(shí)時(shí)的
C、需要用戶主動(dòng)發(fā)出查詢
D、不需要用戶主動(dòng)發(fā)出查詢
正確答案:,C
第41題,Pig是Hadoop項(xiàng)目中一種數(shù)據(jù)倉(cāng)庫(kù)工具。
T、對(duì)
F、錯(cuò)
正確答案:F
第42題,阿里云RDS中一個(gè)實(shí)例可以創(chuàng)建多個(gè)數(shù)據(jù)庫(kù),在實(shí)例內(nèi)數(shù)據(jù)庫(kù)命名唯一,所有數(shù)據(jù)庫(kù)都會(huì)共享該實(shí)例下的資源,如CPU、內(nèi)存、磁盤(pán)容量等
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第43題,HDFS中的NameNode的EditLog用于維護(hù)文件系統(tǒng)樹(shù)以及文件樹(shù)中所有的文件和文件夾的元數(shù)據(jù)
T、對(duì)
F、錯(cuò)
正確答案:F
第44題,Storm框架是實(shí)時(shí)計(jì)算系統(tǒng),所以不能使用數(shù)據(jù)庫(kù)。
T、對(duì)
F、錯(cuò)
正確答案:
第45題,關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵特性包括完善的事務(wù)機(jī)制和高效的查詢機(jī)制
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第46題,大數(shù)據(jù)計(jì)算處理方法主要分為兩種方法,即批處理方法和流處理方法。
T、對(duì)
F、錯(cuò)
正確答案:
第47題,大數(shù)據(jù)決策逐漸成為一種新的決策方式,大數(shù)據(jù)應(yīng)用有力促進(jìn)了信息技術(shù)與各行業(yè)的深度融合,大數(shù)據(jù)開(kāi)發(fā)大大推動(dòng)了新技術(shù)和新應(yīng)用的不斷涌現(xiàn)。
T、對(duì)
F、錯(cuò)
正確答案:
第48題,Hbase中緩存刷新,每次刷寫(xiě)都生成一個(gè)新的StoreFile文件,因此,每個(gè)Store包含多個(gè)StoreFile文件
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第49題,在HBase中,更新操作會(huì)用最新的當(dāng)前值去替換記錄中原來(lái)的舊值,舊值被覆蓋后就不會(huì)存在
T、對(duì)
F、錯(cuò)
正確答案:F
答案來(lái)源:(www.),HDFS 在設(shè)計(jì)上采取了多種機(jī)制保證在硬件出錯(cuò)的環(huán)境中實(shí)現(xiàn)數(shù)據(jù)的完整性。
T、對(duì)
F、錯(cuò)
正確答案:

