南開22秋學(xué)期(全層次1809-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2022-12-22 19:36:40來源:admin瀏覽: 0 次

22秋學(xué)期(高起本1709-1803、全層次1809-2103)《大數(shù)據(jù)導(dǎo)論》在線作業(yè)

試卷總分:100  得分:85


一、單選題 (共 15 道試題,共 30 分)

1.PaaS是()的簡稱

A.軟件即服務(wù)

B.平臺即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)


2.GFS中的文件切分成()的塊進(jìn)行存儲

A.32MB

B.64MB

C.128MB

D.1G


3.DAS代表的意思是()

A.兩個異步存儲

B.數(shù)據(jù)歸檔軟件

C.連接一個可選的存儲

D.直連存儲


4.()是Microsoft Office的核心組件

A.SQL

B.WORD

C.PPT

D.EXCEL


5.大數(shù)據(jù)的最顯著特征是() 。

A.數(shù)據(jù)規(guī)模大

B.數(shù)據(jù)類型多樣

C.數(shù)據(jù)處理速度快

D.數(shù)據(jù)價值密度高


6.下列哪個R語言擴展包可以制作一系列的圖像并將它們串聯(lián)起來做成動畫()

A.ggplot2

B.network

C.ggmaps

D.animation


7.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項?

A.診療數(shù)據(jù)

B.個人健康管理數(shù)據(jù)

C.公共安全數(shù)據(jù)

D.健康檔案數(shù)據(jù)


8.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是

A.IaaS

B.PaaS

C.SaaS


9.數(shù)據(jù)清洗的方法不包括

A.缺失值處理

B.噪聲數(shù)據(jù)清除

C.一致性檢查

D.重復(fù)數(shù)據(jù)記錄處理


10.以下不是數(shù)據(jù)倉庫基本特征的是()

A.數(shù)據(jù)倉庫是面向主題的 

B.數(shù)據(jù)倉庫是面向事務(wù)的

C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對穩(wěn)定的

D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的


11.下列哪個工具常用來開發(fā)移動友好地交互地圖()

A.Leaflet

B.Visual.ly

C.BPizza Pie Charts

D.Gephi


12.SAN是一種()

A.存儲設(shè)備

B.專為數(shù)據(jù)存儲而設(shè)計構(gòu)建的網(wǎng)絡(luò)

C.光纖交換機

D.HBA


13.大數(shù)據(jù)的特點不包含

A.數(shù)據(jù)體量大

B.價值密度高

C.處理速度快

D.數(shù)據(jù)不統(tǒng)一


14.下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖()

A.ggplot2

B.network

C.ggmaps

D.animation


15.用于描述相等時間間隔下連續(xù)數(shù)據(jù)隨時間變化趨勢的是()

A.折線圖

B.散點圖

C.條形圖

D.餅圖


二、多選題 (共 15 道試題,共 30 分)

16.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()

A.流行性疾病預(yù)防

B.慢性病健康管理

C.臨床決策支持

D.醫(yī)療器械研發(fā)


17.常見的非結(jié)構(gòu)化數(shù)據(jù)有()

A.web網(wǎng)頁

B.即時消息

C.富文本文檔

D.實時多媒體數(shù)據(jù)


18.交通數(shù)據(jù)處理包括以下幾個步驟()

A.數(shù)據(jù)清洗

B.數(shù)據(jù)映射

C.數(shù)據(jù)組織

D.數(shù)據(jù)聚類


19.大數(shù)據(jù)采集主要包括()四種。

A.系統(tǒng)日志采集

B.網(wǎng)絡(luò)數(shù)據(jù)采集

C.數(shù)據(jù)庫采集

D.其他數(shù)據(jù)采集


20.數(shù)據(jù)歸約(Data Reduction)主要有()

A.維度規(guī)約

B.樣本規(guī)約

C.數(shù)據(jù)聚集

D.離散化概念分層


21.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過##或##等方式從網(wǎng)站上獲取數(shù)據(jù)信息。

A.網(wǎng)絡(luò)爬蟲

B.網(wǎng)站公開API

C.手動獲取


22.常見的分類方法有

A.決策樹

B.貝葉斯網(wǎng)絡(luò)

C.遺傳算法

D.FP算法


23.層次方法可以分為()

A.K均值算法

B.K中心點算法

C.凝聚法

D.分裂法


24.下列正確的是()

A.D3是數(shù)據(jù)驅(qū)動文件的縮寫,是最流行的可視化庫之一,它被很多其他的表格插件所使用

B.D3也可以通過一些自定義模塊來根據(jù)需求增添需要的(非DOM)特性,并在WebWorker上運行

C.D3采用的是Selectors API的第一級標(biāo)準(zhǔn)

D.基礎(chǔ)R已經(jīng)包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標(biāo)圖等多類圖形的功能。


25.云計算的特點是()

A.大規(guī)模

B.高擴展性

C.虛擬化

D.按需分配


26.數(shù)據(jù)變換的常用方法有##,##,##,##

A.中心化變換

B.極差規(guī)格化變換

C.標(biāo)準(zhǔn)化變換

D.對數(shù)變換


27.大數(shù)據(jù)在教育中的應(yīng)用

A.網(wǎng)上公開課

B.慕課

C.智慧校園

D.翻轉(zhuǎn)課堂


28.關(guān)于R語言擴展包下列正確的是()

A.network可創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖

B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動畫

C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)

D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具


29.數(shù)據(jù)處理的兩種方法是##,##

A.批處理

B.流處理

C.單個處理

D.交叉處理


30.醫(yī)療大數(shù)據(jù)特點:除了包含了大數(shù)據(jù)4個“V” 的特點之外還有()

A.多態(tài)性

B.時效性

C.不完整性

D.冗余性


三、判斷題 (共 20 道試題,共 40 分)

31.數(shù)據(jù)分析是大數(shù)據(jù)價值鏈中最終和最重要的階段,其目的是挖掘數(shù)據(jù)中潛在的價值以提供相應(yīng)的建議或決策。通過分析不同領(lǐng)域中的數(shù)據(jù)集可以使數(shù)據(jù)在不同層面發(fā)揮最大價值。

32.由于數(shù)據(jù)變成資源,成為有價值的東西,數(shù)據(jù)私有化和獨占問題就是客觀存在的,成為關(guān)注的焦點。數(shù)據(jù)產(chǎn)權(quán)界定問題日益突出,在數(shù)據(jù)權(quán)屬確定的情況下,數(shù)據(jù)商品化將成為必然選擇

33.多維數(shù)據(jù)指的是具有多個維度屬性的數(shù)據(jù)變量。

34.標(biāo)簽云將關(guān)鍵詞根據(jù)詞頻或其他規(guī)則進(jìn)行排序,按照一定規(guī)律進(jìn)行布局排列,用大小、顏色、字體等圖形屬性對關(guān)鍵詞進(jìn)行可視化。

35.數(shù)據(jù)缺失是大數(shù)據(jù)庫中常見的問題,產(chǎn)生的原因也是多種多樣的。主要包括機械原因和人為原因。

36.數(shù)據(jù)倉庫是一個面向主題的(subject oriented)、集成的(integrate),相對穩(wěn)定的(non-volatile)、反映歷史變化(time variant)的數(shù)據(jù)集合,以用于支持管理決策過程。

37.Python是一種面向?qū)ο蟮慕忉屝陀嬎銠C程序設(shè)計語言

38.預(yù)處理之后的數(shù)據(jù)需要被組織在數(shù)據(jù)庫或數(shù)據(jù)倉庫中。

39.用戶可以容易地分析空間情況(道路網(wǎng)絡(luò)內(nèi)部)隨時間的任何變化,或分析道路段上的交通狀況的時間變化,或者利用歷史數(shù)據(jù)跟蹤單個車輛的即時狀態(tài)。

40.地圖屬于數(shù)據(jù)可視化的一種

41.Twitter作為主流社交網(wǎng)絡(luò)平臺,不僅僅是一個海量公共數(shù)據(jù)集,它還是一個帶有時間刻度的海量公共數(shù)據(jù)集——用于捕捉特定時間中(在一些情況下,也是在特定空間中)數(shù)百萬人關(guān)于所有主題事項的想法。

42.一個屬性如果能由另一個或一組屬性導(dǎo)出,則這個屬性可能是冗余的。

43.基于大數(shù)據(jù)研究個體或群體行為,發(fā)現(xiàn)活動中蘊含的空間認(rèn)知規(guī)律及空間行為和交互模式,建立以人為本的地理信息服務(wù),進(jìn)而支持個體或群體時空行為決策。

44.有些冗余可以被相關(guān)分析檢測到。

45.R語言是閉源的

46.彈性是指有容錯的機制,若一個RDD分片去失,Spark可以根據(jù)粗粒度的日志數(shù)據(jù)更新記錄的信息重構(gòu)它。

47.空間視圖提供了交通堵塞的概覽

48.數(shù)據(jù)流要表現(xiàn)出流數(shù)據(jù)的特征,反映的是系統(tǒng)中流動的數(shù)據(jù);

49.規(guī)則性分析(Prescriptive Analysis)用于解決決策制定和提高分析效率

50.R是一種開源編程語言和軟件環(huán)境,用于數(shù)據(jù)挖掘、數(shù)據(jù)分析和可視化。


 



奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學(xué)習(xí)
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部