23春學(xué)期(高起本:1709-2103、專升本/高起專:1903-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)-00002
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.DAS代表的意思是()
A.兩個異步存儲
B.數(shù)據(jù)歸檔軟件
C.連接一個可選的存儲
D.直連存儲
2.下列不屬于Google云計算平臺技術(shù)架構(gòu)的是()
A.并行數(shù)據(jù)處理MapReduce
B.分布式鎖Chubby
C.結(jié)構(gòu)化數(shù)據(jù)表BigTable
D.彈性云計算EC2
3.大數(shù)據(jù)的特點不包含
A.數(shù)據(jù)體量大
B.價值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
4.購物籃問題是##的典型案例
A.數(shù)據(jù)變換
B.關(guān)聯(lián)規(guī)則挖掘
C.數(shù)據(jù)分類
5.GFS中的文件切分成()的塊進行存儲
A.32MB
B.64MB
C.128MB
D.1G
6.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是主動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
7.下列不屬于商業(yè)大數(shù)據(jù)類型的是
A.傳統(tǒng)企業(yè)數(shù)據(jù)
B.機器和傳感器數(shù)據(jù)
C.社交數(shù)據(jù)
D.電子商務(wù)數(shù)據(jù)
8.數(shù)據(jù)倉庫是隨著時間變化的,下列不正確的是()
A.數(shù)據(jù)倉庫隨時間變化不斷增加新內(nèi)容
B.捕捉到的新數(shù)據(jù)會覆蓋原來的快照
C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容
D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨時間的變化不斷進行重新綜合
9.用于描述數(shù)據(jù)分散情況的是()
A.分布圖
B.箱式圖
C.餅圖
D.折線圖
10.哪個選項不屬于大數(shù)據(jù)4V特點?
A.Volume
B.Valid
C.Variety
D.Value
11.MapReduce中的Map和Reduce函數(shù)使用()進行輸入輸出
A.key/value對
B.隨機數(shù)值
C.其他計算結(jié)果
12.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是被動的主要是來自哪個階段( )。
A.運營式系統(tǒng)階段
B.用戶原創(chuàng)內(nèi)容階段
C.感知式系統(tǒng)階段
13.下列哪個工具常用來開發(fā)移動友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
14.下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖()
A.ggplot2
B.network
C.ggmaps
D.animation
15.SAN是一種()
A.存儲設(shè)備
B.專為數(shù)據(jù)存儲而設(shè)計構(gòu)建的網(wǎng)絡(luò)
C.光纖交換機
D.HBA
二、多選題 (共 15 道試題,共 30 分)
16.開放云()
A.價值呈現(xiàn):大數(shù)據(jù)應(yīng)用價值呈現(xiàn)和創(chuàng)新不足
B.應(yīng)用建設(shè):周期長、門檻高、多冗余、體驗差
C.組織流程:應(yīng)用跨部門,缺乏流程貫串和使能業(yè)務(wù)生產(chǎn)
D.生態(tài)建設(shè):無法有效構(gòu)建和融入新的數(shù)字生態(tài)圈
17.互連網(wǎng)上出現(xiàn)的海量信息可以劃分為三種,分別為( )
A.結(jié)構(gòu)化信息
B.非結(jié)構(gòu)化信息
C.半結(jié)構(gòu)化信息
D.特殊化信息
18.下列正確的是()
A.D3是數(shù)據(jù)驅(qū)動文件的縮寫,是最流行的可視化庫之一,它被很多其他的表格插件所使用
B.D3也可以通過一些自定義模塊來根據(jù)需求增添需要的(非DOM)特性,并在WebWorker上運行
C.D3采用的是Selectors API的第一級標(biāo)準(zhǔn)
D.基礎(chǔ)R已經(jīng)包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標(biāo)圖等多類圖形的功能。
19.大數(shù)據(jù)在教育中的應(yīng)用
A.網(wǎng)上公開課
B.慕課
C.智慧校園
D.翻轉(zhuǎn)課堂
20.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)來源有
A.志愿者定位數(shù)據(jù)
B.裝有導(dǎo)航設(shè)備的出租車軌跡數(shù)據(jù)
C.手機終端定位于通訊記錄
D.社會網(wǎng)絡(luò)簽到數(shù)據(jù)
21.下列屬于傳統(tǒng)統(tǒng)計學(xué)展示方法的是()
A.柱狀圖
B.餅狀圖
C.曲線圖
D.網(wǎng)絡(luò)圖
22.##和##,它們把原數(shù)據(jù)變換或投影到較小的空間。
A.小波變換
B.中心化變換
C.主成分分析
D.對數(shù)變換
23.大數(shù)據(jù)四大特征包括( )
A.數(shù)據(jù)量大
B.數(shù)據(jù)類型繁多
C.數(shù)據(jù)價值密度相對較低
D.處理速度快,時效性要求高
24.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()
A.內(nèi)存級數(shù)據(jù)分析
B.Bl級數(shù)據(jù)分析
C.海量級數(shù)據(jù)分析
D.巨量級數(shù)據(jù)分析
25.主流分布式計算平臺有()
A.google
B.IBM
C.baidu
D.Amazon
26.KNIME(Konstanz Information Miner)是一個對用戶友好的、智能、開源的平臺。該平臺包括了##、##、##、##。
A.數(shù)據(jù)集成
B.數(shù)據(jù)處理
C.數(shù)據(jù)分析
D.數(shù)據(jù)挖掘
27.離群點檢測的應(yīng)用包括()等。
A.欺詐檢測
B.入侵檢測
C.故障檢測
D.疾病的不尋常模式
28.數(shù)據(jù)變換的常用方法有##,##,##,##
A.中心化變換
B.極差規(guī)格化變換
C.標(biāo)準(zhǔn)化變換
D.對數(shù)變換
29.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)特點是
A.多樣化
B.數(shù)據(jù)量大
C.維數(shù)高
D.變化快
30.大數(shù)據(jù)帶來的挑戰(zhàn)有哪些( )。
A.會導(dǎo)致數(shù)據(jù)盲點
B.危及個人隱私
C.造成群體歧視
D.產(chǎn)生龐大能耗
三、判斷題 (共 20 道試題,共 40 分)
31.箱式圖用于描述數(shù)據(jù)的分散情況,主要數(shù)據(jù)節(jié)點包括:均值、中值、等中心值的度 量,標(biāo)準(zhǔn)偏差、方差等可變性度量。
32.交通數(shù)據(jù)涉及到交通車輛或者道路兩旁安裝的傳感器生成和手機的數(shù)據(jù)集。
33.關(guān)聯(lián)分析是從有噪聲的、模糊的、隨機的海量數(shù)據(jù)中,挖掘出隱藏的、事先不知道、但是有潛在關(guān)聯(lián)的信息或知識的過程。
34.NAS代表的意思是網(wǎng)絡(luò)附加存儲
35.數(shù)據(jù)倉庫是一個面向主題的(subject oriented)、集成的(integrate),相對穩(wěn)定的(non-volatile)、反映歷史變化(time variant)的數(shù)據(jù)集合,以用于支持管理決策過程。
36.Spark的亮點是充分利用內(nèi)存承載工作集,而且能保證容錯。
37.寧家駿委員指出,大數(shù)據(jù)要與“互聯(lián)網(wǎng)+”醫(yī)療健康緊密結(jié)合起來,國家明確支持“互聯(lián)網(wǎng)+”醫(yī)療、“互聯(lián)網(wǎng)+”健康。
38.利用虛擬化方法減少物理存儲空間的分配,最大限度提升存儲空間利用率。
39.內(nèi)存分析數(shù)據(jù)量比BI分析數(shù)據(jù)量大
40.數(shù)據(jù)可視化。將大型數(shù)據(jù)集中的數(shù)據(jù)通過圖形圖像方式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息。
41.交通數(shù)據(jù)的來源包括車輛GPS數(shù)據(jù),人類移動的GPS位置信息或者單位站點記錄,和監(jiān)視設(shè)備的視頻圖像技術(shù)記錄。
42.線性回歸涉及找出擬合兩個屬性(或變量)的“最佳”直線,使一個屬性可以用來預(yù)測另一個。
43.聚類分析(Cluster analysis)簡稱聚類(Clustering),是把數(shù)據(jù)對象劃分成子集(類)的過程,每個子集稱為一個簇(Cluster)
44.用戶可以感知不同屬性之間的相關(guān)性,過濾掉噪聲和不相關(guān)的軌跡,用于進一步調(diào)查有趣的案例。分析人員可以交互式地逐步優(yōu)化設(shè)置以改進結(jié)果。
45.大數(shù)據(jù)技術(shù)也能幫助政府進行支出管理,透明合理的財政支出將有利于提高公信力和監(jiān)督財政支出。
46.累加器只有驅(qū)動程序才能讀取
47.數(shù)據(jù)挖掘方法側(cè)重于從數(shù)據(jù)驅(qū)動的角度出發(fā)獲取模式或規(guī)律。因此,針對海量人類移動數(shù)據(jù),數(shù)據(jù)挖掘方法可以發(fā)揮其挖掘模式或規(guī)律的長處。
48.基于QQ用戶位置變化軌跡,建立模型測算遷徙規(guī)模,分析人口遷徙方向及其影響因素。
49.利用云存儲中的多租戶技術(shù),滿足了海量信息爆炸式增長趨勢,一定程度上節(jié)約企業(yè)存儲成本,提高效率。
50.不同類型的大數(shù)據(jù)可以揭示一個區(qū)域或城市的活動以及人口分布狀態(tài)( )
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

