南開大學-20春學期(2003)《大數據導論》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2020/5/13 0:57:20來源:admin瀏覽: 60 次

南開大學-20春學期(1709、1803、1809、1903、1909、2003)《大數據導論》在線作業(yè)

試卷總分:100  得分:100

一、單選題 (共 15 道試題,共 30 分)

1.大數據的特點不包含

A.數據體量大

B.數據不統(tǒng)一

C.處理速度快

D.價值密度高

 

2.基礎設施即服務的英文簡稱是

A.SaaS

B.PaaS

C.IaaS

 

3.下面哪一項不是中國發(fā)展大數據產業(yè)的基礎()。

A.大數據技術創(chuàng)新取得明顯突破

B.大數據應用推動勢頭良好

C.大數據產業(yè)支撐薄弱

D.信息化積累了豐富的數據資源

 

4.數據清洗的方法不包括

A.重復數據記錄處理

B.缺失值處理

C.噪聲數據清除

D.一致性檢查

 

5.以下不是數據倉庫基本特征的是()

A.數據倉庫的數據是相對穩(wěn)定的

B.數據倉庫的數據是反映歷史變化的

C.數據倉庫是面向事務的

D.數據倉庫是面向主題的

 

6.數據產生方式變革中數據產生方式是被動的主要是來自哪個階段( )。

A.運營式系統(tǒng)階段

B.用戶原創(chuàng)內容階段

C.感知式系統(tǒng)階段

 

7.數據產生方式變革中數據產生方式是自動的主要是來自哪個階段( )。

A.運營式系統(tǒng)階段

B.用戶原創(chuàng)內容階段

C.感知式系統(tǒng)階段

 

8.數據倉庫是隨著時間變化的,下列不正確的是()

A.數據倉庫隨時間變化不斷增加新內容

B.數據倉庫隨事件變化不斷刪去舊的數據內容

C.數據倉庫中包含大量的綜合數據,這些綜合數據會隨時間的變化不斷進行重新綜合

D.捕捉到的新數據會覆蓋原來的快照

 

9.購物籃問題是##的典型案例

A.數據變換

B.數據分類

C.關聯規(guī)則挖掘

 

10.PaaS是()的簡稱

A.軟件即服務

B.硬件即服務

C.平臺即服務

D.基礎設施即服務

 

11.下列哪個R語言擴展包可以制作一系列的圖像并將它們串聯起來做成動畫()

A.network

B.ggplot2

C.ggmaps

D.animation

 

12.數據產生方式變革中數據產生方式是主動的主要是來自哪個階段( )。

A.運營式系統(tǒng)階段

B.用戶原創(chuàng)內容階段

C.感知式系統(tǒng)階段

 

13.哪個選項不屬于大數據4V特點?

A.Volume

B.Variety

C.Value

D.Valid

 

14.以下哪項不是數據可視化工具的特性()

A.簡單操作

B.更豐富的展現

C.實時性

D.僅需一種數據支持方式即可

 

15.()是Microsoft Office的核心組件

A.WORD

B.SQL

C.PPT

D.EXCEL

 

二、多選題 (共 15 道試題,共 30 分)

16.云計算的特點是()

A.高擴展性

B.虛擬化

C.按需分配

D.大規(guī)模

 

17.大數據時代預測人類移動行為的數據來源有

A.裝有導航設備的出租車軌跡數據

B.社會網絡簽到數據

C.手機終端定位于通訊記錄

D.志愿者定位數據

 

18.百度大數據引擎主要包含三大組件()

A.百度大腦。

B.數據工廠

C.開放云

 

19.KNIME(Konstanz Information Miner)是一個對用戶友好的、智能、開源的平臺。該平臺包括了##、##、##、##。

A.數據集成

B.數據挖掘

C.數據處理

D.數據分析

 

20.大數據時代預測人類移動行為的數據特點是

A.維數高

B.數據量大

C.多樣化

D.變化快

 

21.大數據采集主要包括()四種。

A.網絡數據采集

B.系統(tǒng)日志采集

C.數據庫采集

D.其他數據采集

 

22.數據工廠包括

A.超強云安全

B.超大規(guī)模講分布式架構

C.新一代智能自動化運維

D.低能耗數據中心

 

23.數據分析的類型根據數據分析深度可以分為()

A.預測性分析s

B.規(guī)則性分析

C.描述性分析

 

24.主流分布式計算平臺有()

A.google

B.baidu

C.IBM

D.Amazon

 

25.交通數據分析可用于:

A.實時路況查詢播報

B.合理進行道路規(guī)劃

C.信號燈智能調度

D.交通流量實時分析

 

26.互連網上出現的海量信息可以劃分為三種,分別為( )

A.非結構化信息

B.結構化信息

C.特殊化信息

D.半結構化信息

 

27.一個HDFS集群由一個##和##構成。此外,還有與這兩個角色之間作為溝通橋梁的客戶端(Client)。

A.若干個數據節(jié)點

B.若干個名字節(jié)點

C.一個數據節(jié)點

D.一個名字節(jié)點

 

28.大數據在社交網絡中的應用

A.預測外部趨勢

B.輿情監(jiān)控、突發(fā)事件預警

C.用戶畫像、精準推薦

D.用戶偏好、情感、社交網絡結構

 

29.開放云()

A.組織流程:應用跨部門,缺乏流程貫串和使能業(yè)務生產

B.生態(tài)建設:無法有效構建和融入新的數字生態(tài)圈

C.應用建設:周期長、門檻高、多冗余、體驗差

D.價值呈現:大數據應用價值呈現和創(chuàng)新不足

 

30.大數據在電信中的應用有

A.精準的客戶分析及營銷

B.基于用戶、業(yè)務及流量分級的多維管控機制

C.利用位置和軌跡信息服務社會

 

三、判斷題 (共 20 道試題,共 40 分)

31.數據存在形式包括結構化數據和結構化數據

 

32.數據可視化。將大型數據集中的數據通過圖形圖像方式表示,并利用數據分析和開發(fā)工具發(fā)現其中未知信息。

 

33.Spark是基于內存的大數據并行計算框架

 

34.非結構化數據是指非純文本類數據,沒有標準格式,無法直接解析出相應的值

 

35.箱式圖用于描述數據的分散情況,主要數據節(jié)點包括:均值、中值、等中心值的度 量,標準偏差、方差等可變性度量。

 

36.Pentaho是最流行的開源商業(yè)智能軟件之一

 

37.網絡數據采集是利用互聯網搜索引擎技術對數據進行針對性、行業(yè)性、精準性的抓取,并按照一定規(guī)則和篩選標準將數據進行歸類,形成數據庫文件的一個過程。

 

38.云存儲不僅是存儲設備或技術,更是一種服務的創(chuàng)新。

 

39.當數據量表完全超過BI和傳統(tǒng)關系數據庫的能力時,我們將用到海量數據分析。

 

40.IDC給出的大數據定義是大數據(Big Data)是需要新的處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。

 

41.Paas:軟件即服務。它是一種通過Internet提供軟件的模式,用戶無需購買軟件,而是向提供商租用基于Web的軟件,來管理企業(yè)經營活動。

 

42.關聯分析是在數據集D中找出大于用戶所給定的最大支持度閾值和最大置信度閾值的關聯規(guī)則。

 

43.數據的大量聚集,使得黑客一次成功的攻擊能夠獲得更多的數據,無形中降低了黑客的進攻成本,增加了“收益率“。

 

44.數據采集,又稱數據獲取,是大數據生命周期的第一個環(huán)節(jié),通過RFID射頻識別技術,傳感器,交互型社交網絡,移動互聯網等方式獲得的各種類型的結構化、半結構化及非結構化的海量數據。

 

45.社交網絡一一通常由通過一些特定類型的相互依賴關系(例如,親屬關系、友誼、共同興趣、信念或金融交換)鏈接的社會實體(例如,個人、公司、集體社會單位或組織)組成。

 

46.數據表達是通過計算機圖形圖像技術來更加友好地展示數據信息,方便人們閱讀、理解和運用數據

 

47.時空數據是指帶有地理位置與時間標簽的數據。

 

48.大數據從概念化走向價值化是大數據的發(fā)展趨勢

 

49.大數據的應用之一是,促進健康管理的個性化和多元化。

 

50.FP-growth算法需要對數據庫進行三次掃描


  • 上一篇:
  • 下一篇:
  • 作業(yè)咨詢 論文咨詢
    微信客服掃一掃

    回到頂部