【南開】20秋學期(1709、1803、1809、1903、1909、2003、2009 )《大數(shù)據(jù)導論》在線作業(yè)(標準答案)

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2020-10-16 22:49:30來源:admin瀏覽: 197 次

可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406      微信:aopopenfd777





20秋學期(1709、1803、1809、1903、1909、2003、2009 )《大數(shù)據(jù)導論》在線作業(yè)

試卷總分:100  得分:100

一、單選題 (共 15 道試題,共 30 分)

1.大數(shù)據(jù)的特點不包含

A.數(shù)據(jù)體量大

B.價值密度高

C.處理速度快

D.數(shù)據(jù)不統(tǒng)一


2.大數(shù)據(jù)的最顯著特征是() 。

A.數(shù)據(jù)規(guī)模大

B.數(shù)據(jù)類型多樣

C.數(shù)據(jù)處理速度快

D.數(shù)據(jù)價值密度高


3.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動的主要是來自哪個階段( )。

A.運營式系統(tǒng)階段

B.用戶原創(chuàng)內(nèi)容階段

C.感知式系統(tǒng)階段


4.下列哪個工具常用來開發(fā)移動友好地交互地圖()

A.Leaflet

B.Visual.ly

C.BPizza Pie Charts

D.Gephi


5.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項?

A.診療數(shù)據(jù)

B.個人健康管理數(shù)據(jù)

C.公共安全數(shù)據(jù)

D.健康檔案數(shù)據(jù)


6.數(shù)據(jù)倉庫是隨著時間變化的,下列不正確的是()

A.數(shù)據(jù)倉庫隨時間變化不斷增加新內(nèi)容

B.捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨時間的變化不斷進行重新綜合


7.IaaS是()的簡稱

A.軟件即服務(wù)

B.平臺即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)


8.哪個選項不屬于大數(shù)據(jù)4V特點?

A.Volume

B.Valid

C.Variety

D.Value


9.第一個提出大數(shù)據(jù)概念的公司是( )。

A.麥肯錫公司

B.谷歌公司

C.微軟公司

D.臉譜公司


10.MapReduce中的Map和Reduce函數(shù)使用()進行輸入輸出

A.key/value對

B.隨機數(shù)值

C.其他計算結(jié)果


11.數(shù)據(jù)清洗的方法不包括

A.缺失值處理

B.噪聲數(shù)據(jù)清除

C.一致性檢查

D.重復數(shù)據(jù)記錄處理


12.以下不是數(shù)據(jù)倉庫基本特征的是()

A.數(shù)據(jù)倉庫是面向主題的

B.數(shù)據(jù)倉庫是面向事務(wù)的

C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對穩(wěn)定的

D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的


13.下列不屬于Google云計算平臺技術(shù)架構(gòu)的是()

A.并行數(shù)據(jù)處理MapReduce

B.分布式鎖Chubby

C.結(jié)構(gòu)化數(shù)據(jù)表BigTable

D.彈性云計算EC2


14.下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖()

A.ggplot2

B.network

C.ggmaps

D.animation


15.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是

A.IaaS

B.PaaS

C.SaaS


二、多選題 (共 15 道試題,共 30 分)

16.大數(shù)據(jù)時代預測人類移動行為的數(shù)據(jù)特點是

A.多樣化

B.數(shù)據(jù)量大

C.維數(shù)高

D.變化快


17.借助于大數(shù)據(jù)提供的##和##,政府可為農(nóng)業(yè)生產(chǎn)進行合理引導,依據(jù)需求進行生產(chǎn),避免產(chǎn)能過剩造成不必要的資源和社會財富浪費。

A.消費能力

B.趨勢報告

C.購物結(jié)果


18.關(guān)于R語言擴展包下列正確的是()

A.network可創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖

B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動畫

C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)

D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具


19.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過##或##等方式從網(wǎng)站上獲取數(shù)據(jù)信息。

A.網(wǎng)絡(luò)爬蟲

B.網(wǎng)站公開API

C.手動獲取


20.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()

A.描述性分析

B.預測性分析s

C.規(guī)則性分析


21.數(shù)據(jù)變換(Data Transformation)的方法有()

A.光滑

B.聚集

C.數(shù)據(jù)泛化

D.規(guī)范化


22.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()

A.內(nèi)存級數(shù)據(jù)分析

B.Bl級數(shù)據(jù)分析

C.海量級數(shù)據(jù)分析

D.巨量級數(shù)據(jù)分析


23.可使用##,##,##進行光滑。

A.最大值

B.箱中位數(shù)

C.箱邊界

D.箱均值


24.常見的分類方法有

A.決策樹

B.貝葉斯網(wǎng)絡(luò)

C.遺傳算法

D.FP算法


25.醫(yī)療大數(shù)據(jù)特點:除了包含了大數(shù)據(jù)4個“V” 的特點之外還有()

A.多態(tài)性

B.時效性

C.不完整性

D.冗余性


26.大數(shù)據(jù)在醫(yī)療中的應用有()

A.流行性疾病預防

B.慢性病健康管理

C.臨床決策支持

D.醫(yī)療器械研發(fā)


27.一個HDFS集群由一個##和##構(gòu)成。此外,還有與這兩個角色之間作為溝通橋梁的客戶端(Client)。

A.一個名字節(jié)點

B.若干個名字節(jié)點

C.一個數(shù)據(jù)節(jié)點

D.若干個數(shù)據(jù)節(jié)點


28.主流分布式計算平臺有()

A.google

B.IBM

C.baidu

D.Amazon


29.大數(shù)據(jù)存儲的特點與挑戰(zhàn)有()

A.容量問題

B.延遲問題

C.安全問題

D.成本問題


30.百度大數(shù)據(jù)引擎主要包含三大組件()

A.開放云

B.數(shù)據(jù)工廠

C.百度大腦。


三、判斷題 (共 20 道試題,共 40 分)

31.減少已分配但未使用的存儲容量的浪費,在分配存儲空間時,系統(tǒng)按需分配存儲空間。


32.廣播變量在廣播后可以修改


33.內(nèi)存級分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實時業(yè)務(wù)分析需求。


34.云存儲中用戶需要按需付費并使用存儲服務(wù)


35.云存儲是指通過集群應用、網(wǎng)絡(luò)技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)。


36.每個變量的最大值和最小值之差稱為極差


37.數(shù)據(jù)變換(Data Transformation)就是把原始數(shù)據(jù)轉(zhuǎn)化為適合于數(shù)據(jù)挖掘的數(shù)據(jù)形式


38.利用大數(shù)據(jù)技術(shù)對電子病歷中的數(shù)字化信息進行分析處理,既能夠讓醫(yī)生的診療有跡可循,還可以發(fā)現(xiàn)最有效的臨床路徑,從而及時為醫(yī)生提供最佳的診療建議。


39.數(shù)據(jù)集成(Data Integration)是將多個數(shù)據(jù)源中的數(shù)據(jù)合并存放到一個一致的數(shù)據(jù)存儲中


40.美國《自然》(Nature)雜志專刊——The next google,第一次正式提出“大數(shù)據(jù)”概念。


41.用一個函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)稱為回歸。


42.RDD是一種自定義的可并行數(shù)據(jù)容器,可以存放任意類型的數(shù)據(jù)


43.BI分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實時業(yè)務(wù)分析需求。


44.云存儲是一個由網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、服務(wù)器、應用軟件、公用訪問接口、接入網(wǎng)和客戶端程序等組成的復雜系統(tǒng)。


45.軌跡數(shù)據(jù)包含空間和時間屬性,并且通常規(guī)模巨大且維度高


46.預測性分析(Predictive Analysis)用于預測未來事件發(fā)生的概率和演化趨勢


47.數(shù)據(jù)存取和共享機制是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)


48.21世紀時數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓寬了互聯(lián)網(wǎng)的邊界和應用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。


49.交通數(shù)據(jù)集通常包括空間和時間特性而且跨越大范圍的時間空間。數(shù)據(jù)聚類可以有效的減小數(shù)據(jù)規(guī)模為隨后的分析提供便利。


50.社交網(wǎng)絡(luò)一一通常由通過一些特定類型的相互依賴關(guān)系(例如,親屬關(guān)系、友誼、共同興趣、信念或金融交換)鏈接的社會實體(例如,個人、公司、集體社會單位或組織)組成。


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部