22秋學(xué)期(高起本1709-1803、全層次1809-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)-00003
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 30 分)
1.PaaS是()的簡(jiǎn)稱
A.軟件即服務(wù)
B.平臺(tái)即服務(wù)
C.基礎(chǔ)設(shè)施即服務(wù)
D.硬件即服務(wù)
2.GFS中的文件切分成()的塊進(jìn)行存儲(chǔ)
A.32MB
B.64MB
C.128MB
D.1G
3.DAS代表的意思是()
A.兩個(gè)異步存儲(chǔ)
B.數(shù)據(jù)歸檔軟件
C.連接一個(gè)可選的存儲(chǔ)
D.直連存儲(chǔ)
4.()是Microsoft Office的核心組件
A.SQL
B.WORD
C.PPT
D.EXCEL
5.大數(shù)據(jù)的最顯著特征是() 。
A.數(shù)據(jù)規(guī)模大
B.數(shù)據(jù)類型多樣
C.數(shù)據(jù)處理速度快
D.數(shù)據(jù)價(jià)值密度高
6.下列哪個(gè)R語(yǔ)言擴(kuò)展包可以制作一系列的圖像并將它們串聯(lián)起來(lái)做成動(dòng)畫()
A.ggplot2
B.network
C.ggmaps
D.animation
7.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項(xiàng)?
A.診療數(shù)據(jù)
B.個(gè)人健康管理數(shù)據(jù)
C.公共安全數(shù)據(jù)
D.健康檔案數(shù)據(jù)
8.基礎(chǔ)設(shè)施即服務(wù)的英文簡(jiǎn)稱是
A.IaaS
B.PaaS
C.SaaS
9.數(shù)據(jù)清洗的方法不包括
A.缺失值處理
B.噪聲數(shù)據(jù)清除
C.一致性檢查
D.重復(fù)數(shù)據(jù)記錄處理
10.以下不是數(shù)據(jù)倉(cāng)庫(kù)基本特征的是()
A.數(shù)據(jù)倉(cāng)庫(kù)是面向主題的
B.數(shù)據(jù)倉(cāng)庫(kù)是面向事務(wù)的
C.數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是相對(duì)穩(wěn)定的
D.數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是反映歷史變化的
11.下列哪個(gè)工具常用來(lái)開發(fā)移動(dòng)友好地交互地圖()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
12.SAN是一種()
A.存儲(chǔ)設(shè)備
B.專為數(shù)據(jù)存儲(chǔ)而設(shè)計(jì)構(gòu)建的網(wǎng)絡(luò)
C.光纖交換機(jī)
D.HBA
13.大數(shù)據(jù)的特點(diǎn)不包含
A.數(shù)據(jù)體量大
B.價(jià)值密度高
C.處理速度快
D.數(shù)據(jù)不統(tǒng)一
14.下列哪個(gè)R語(yǔ)言擴(kuò)展包可以創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖()
A.ggplot2
B.network
C.ggmaps
D.animation
15.用于描述相等時(shí)間間隔下連續(xù)數(shù)據(jù)隨時(shí)間變化趨勢(shì)的是()
A.折線圖
B.散點(diǎn)圖
C.條形圖
D.餅圖
二、多選題 (共 15 道試題,共 30 分)
16.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()
A.流行性疾病預(yù)防
B.慢性病健康管理
C.臨床決策支持
D.醫(yī)療器械研發(fā)
17.常見的非結(jié)構(gòu)化數(shù)據(jù)有()
A.web網(wǎng)頁(yè)
B.即時(shí)消息
C.富文本文檔
D.實(shí)時(shí)多媒體數(shù)據(jù)
18.交通數(shù)據(jù)處理包括以下幾個(gè)步驟()
A.數(shù)據(jù)清洗
B.數(shù)據(jù)映射
C.數(shù)據(jù)組織
D.數(shù)據(jù)聚類
19.大數(shù)據(jù)采集主要包括()四種。
A.系統(tǒng)日志采集
B.網(wǎng)絡(luò)數(shù)據(jù)采集
C.數(shù)據(jù)庫(kù)采集
D.其他數(shù)據(jù)采集
20.數(shù)據(jù)歸約(Data Reduction)主要有()
A.維度規(guī)約
B.樣本規(guī)約
C.數(shù)據(jù)聚集
D.離散化概念分層
21.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過(guò)##或##等方式從網(wǎng)站上獲取數(shù)據(jù)信息。
A.網(wǎng)絡(luò)爬蟲
B.網(wǎng)站公開API
C.手動(dòng)獲取
22.常見的分類方法有
A.決策樹
B.貝葉斯網(wǎng)絡(luò)
C.遺傳算法
D.FP算法
23.層次方法可以分為()
A.K均值算法
B.K中心點(diǎn)算法
C.凝聚法
D.分裂法
24.下列正確的是()
A.D3是數(shù)據(jù)驅(qū)動(dòng)文件的縮寫,是最流行的可視化庫(kù)之一,它被很多其他的表格插件所使用
B.D3也可以通過(guò)一些自定義模塊來(lái)根據(jù)需求增添需要的(非DOM)特性,并在WebWorker上運(yùn)行
C.D3采用的是Selectors API的第一級(jí)標(biāo)準(zhǔn)
D.基礎(chǔ)R已經(jīng)包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標(biāo)圖等多類圖形的功能。
25.云計(jì)算的特點(diǎn)是()
A.大規(guī)模
B.高擴(kuò)展性
C.虛擬化
D.按需分配
26.數(shù)據(jù)變換的常用方法有##,##,##,##
A.中心化變換
B.極差規(guī)格化變換
C.標(biāo)準(zhǔn)化變換
D.對(duì)數(shù)變換
27.大數(shù)據(jù)在教育中的應(yīng)用
A.網(wǎng)上公開課
B.慕課
C.智慧校園
D.翻轉(zhuǎn)課堂
28.關(guān)于R語(yǔ)言擴(kuò)展包下列正確的是()
A.network可創(chuàng)建帶有點(diǎn)和邊的網(wǎng)絡(luò)圖
B.animation可制作一系列的圖像并將它們串聯(lián)起來(lái)做成動(dòng)畫
C.ggmaps通過(guò)樹圖來(lái)可視化層次型數(shù)據(jù)
D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具
29.數(shù)據(jù)處理的兩種方法是##,##
A.批處理
B.流處理
C.單個(gè)處理
D.交叉處理
30.醫(yī)療大數(shù)據(jù)特點(diǎn):除了包含了大數(shù)據(jù)4個(gè)“V” 的特點(diǎn)之外還有()
A.多態(tài)性
B.時(shí)效性
C.不完整性
D.冗余性
三、判斷題 (共 20 道試題,共 40 分)
31.數(shù)據(jù)分析是大數(shù)據(jù)價(jià)值鏈中最終和最重要的階段,其目的是挖掘數(shù)據(jù)中潛在的價(jià)值以提供相應(yīng)的建議或決策。通過(guò)分析不同領(lǐng)域中的數(shù)據(jù)集可以使數(shù)據(jù)在不同層面發(fā)揮最大價(jià)值。
32.由于數(shù)據(jù)變成資源,成為有價(jià)值的東西,數(shù)據(jù)私有化和獨(dú)占問(wèn)題就是客觀存在的,成為關(guān)注的焦點(diǎn)。數(shù)據(jù)產(chǎn)權(quán)界定問(wèn)題日益突出,在數(shù)據(jù)權(quán)屬確定的情況下,數(shù)據(jù)商品化將成為必然選擇
33.多維數(shù)據(jù)指的是具有多個(gè)維度屬性的數(shù)據(jù)變量。
34.標(biāo)簽云將關(guān)鍵詞根據(jù)詞頻或其他規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對(duì)關(guān)鍵詞進(jìn)行可視化。
35.數(shù)據(jù)缺失是大數(shù)據(jù)庫(kù)中常見的問(wèn)題,產(chǎn)生的原因也是多種多樣的。主要包括機(jī)械原因和人為原因。
36.數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的(subject oriented)、集成的(integrate),相對(duì)穩(wěn)定的(non-volatile)、反映歷史變化(time variant)的數(shù)據(jù)集合,以用于支持管理決策過(guò)程。
37.Python是一種面向?qū)ο蟮慕忉屝陀?jì)算機(jī)程序設(shè)計(jì)語(yǔ)言
38.預(yù)處理之后的數(shù)據(jù)需要被組織在數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中。
39.用戶可以容易地分析空間情況(道路網(wǎng)絡(luò)內(nèi)部)隨時(shí)間的任何變化,或分析道路段上的交通狀況的時(shí)間變化,或者利用歷史數(shù)據(jù)跟蹤單個(gè)車輛的即時(shí)狀態(tài)。
40.地圖屬于數(shù)據(jù)可視化的一種
41.Twitter作為主流社交網(wǎng)絡(luò)平臺(tái),不僅僅是一個(gè)海量公共數(shù)據(jù)集,它還是一個(gè)帶有時(shí)間刻度的海量公共數(shù)據(jù)集——用于捕捉特定時(shí)間中(在一些情況下,也是在特定空間中)數(shù)百萬(wàn)人關(guān)于所有主題事項(xiàng)的想法。
42.一個(gè)屬性如果能由另一個(gè)或一組屬性導(dǎo)出,則這個(gè)屬性可能是冗余的。
43.基于大數(shù)據(jù)研究個(gè)體或群體行為,發(fā)現(xiàn)活動(dòng)中蘊(yùn)含的空間認(rèn)知規(guī)律及空間行為和交互模式,建立以人為本的地理信息服務(wù),進(jìn)而支持個(gè)體或群體時(shí)空行為決策。
44.有些冗余可以被相關(guān)分析檢測(cè)到。
45.R語(yǔ)言是閉源的
46.彈性是指有容錯(cuò)的機(jī)制,若一個(gè)RDD分片去失,Spark可以根據(jù)粗粒度的日志數(shù)據(jù)更新記錄的信息重構(gòu)它。
47.空間視圖提供了交通堵塞的概覽
48.數(shù)據(jù)流要表現(xiàn)出流數(shù)據(jù)的特征,反映的是系統(tǒng)中流動(dòng)的數(shù)據(jù);
49.規(guī)則性分析(Prescriptive Analysis)用于解決決策制定和提高分析效率
50.R是一種開源編程語(yǔ)言和軟件環(huán)境,用于數(shù)據(jù)挖掘、數(shù)據(jù)分析和可視化。
奧鵬,國(guó)開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777