[南開大學]20秋學期《大數據導論》在線作業(yè)-2(標準答案)

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2020/10/18 23:11:54來源:admin瀏覽: 40 次

可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406      微信:aopopenfd777




20秋學期(1709、1803、1809、1903、1909、2003、2009 )《大數據導論》在線作業(yè)
試卷總分:100    得分:100
第1題,大數據的最顯著特征是() 。
A、數據規(guī)模大
B、數據類型多樣
C、數據處理速度快
D、數據價值密度高
正確答案:


第2題,下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網絡圖()
A、ggplot2
B、network
C、ggmaps
D、animation
正確答案:


第3題,下列不屬于Google云計算平臺技術架構的是()
A、并行數據處理MapReduce
B、分布式鎖Chubby
C、結構化數據表BigTable
D、彈性云計算EC2
正確答案:


第4題,基礎設施即服務的英文簡稱是
A、IaaS
B、PaaS
C、SaaS
正確答案:


答案來源:(www.),PaaS是()的簡稱
A、軟件即服務
B、平臺即服務
C、基礎設施即服務
D、硬件即服務
正確答案:


第6題,MapReduce中的Map和Reduce函數使用()進行輸入輸出
A、key/value對
B、隨機數值
C、其他計算結果
正確答案:


第7題,用于描述相等時間間隔下連續(xù)數據隨時間變化趨勢的是()
A、折線圖
B、散點圖
C、條形圖
D、餅圖
正確答案:


第8題,GFS中的文件切分成()的塊進行存儲
A、32MB
B、64MB
C、128MB
D、1G
正確答案:


第9題,以下不是數據倉庫基本特征的是()
A、數據倉庫是面向主題的
B、數據倉庫是面向事務的
C、數據倉庫的數據是相對穩(wěn)定的
D、數據倉庫的數據是反映歷史變化的
正確答案:


答案來源:(www.),下面哪一項不是中國發(fā)展大數據產業(yè)的基礎()。
A、信息化積累了豐富的數據資源
B、大數據技術創(chuàng)新取得明顯突破
C、大數據應用推動勢頭良好
D、大數據產業(yè)支撐薄弱
正確答案:


第11題,IaaS是()的簡稱
A、軟件即服務
B、平臺即服務
C、基礎設施即服務
D、硬件即服務
正確答案:


答案來源:(www.),下列哪個工具常用來開發(fā)移動友好地交互地圖()
A、Leaflet
B、Visual.ly
C、BPizza Pie Charts
D、Gephi
正確答案:


第13題,數據清洗的方法不包括
A、缺失值處理
B、噪聲數據清除
C、一致性檢查
D、重復數據記錄處理
正確答案:


第14題,數據倉庫是隨著時間變化的,下列不正確的是()
A、數據倉庫隨時間變化不斷增加新內容
B、捕捉到的新數據會覆蓋原來的快照
C、數據倉庫隨事件變化不斷刪去舊的數據內容
D、數據倉庫中包含大量的綜合數據,這些綜合數據會隨時間的變化不斷進行重新綜合
正確答案:


答案來源:(www.),下列不屬于商業(yè)大數據類型的是
A、傳統(tǒng)企業(yè)數據
B、機器和傳感器數據
C、社交數據
D、電子商務數據
正確答案:


第16題,主流分布式計算平臺有()
A、google
B、IBM
C、baidu
D、Amazon
正確答案:,B,D


第17題,一個HDFS集群由一個##和##構成。此外,還有與這兩個角色之間作為溝通橋梁的客戶端(Client)。
A、一個名字節(jié)點
B、若干個名字節(jié)點
C、一個數據節(jié)點
D、若干個數據節(jié)點
正確答案:,D


第18題,關于R語言擴展包下列正確的是()
A、network可創(chuàng)建帶有點和邊的網絡圖
B、animation可制作一系列的圖像并將它們串聯起來做成動畫
C、ggmaps通過樹圖來可視化層次型數據
D、protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數據可視化工具
正確答案:,B


第19題,大數據在電信中的應用有
A、基于用戶、業(yè)務及流量分級的多維管控機制
B、精準的客戶分析及營銷
C、利用位置和軌跡信息服務社會
正確答案:,B,C


答案來源:(www.),去除噪聲使得數據光滑的技術主要有:
A、分箱
B、回歸
C、離群點分析
正確答案:,B,C


第21題,大數據在醫(yī)療中的應用有()
A、流行性疾病預防
B、慢性病健康管理
C、臨床決策支持
D、醫(yī)療器械研發(fā)
正確答案:,B,C,D


第22題,醫(yī)療大數據的來源主要包括()
A、制藥企業(yè)/生命科學
B、臨床醫(yī)療/實驗室數據
C、費用報銷/利用率
D、健康管理/社交網絡
正確答案:,B,C,D


第23題,下列正確的是()
A、D3是數據驅動文件的縮寫,是最流行的可視化庫之一,它被很多其他的表格插件所使用
B、D3也可以通過一些自定義模塊來根據需求增添需要的(非DOM)特性,并在WebWorker上運行
C、D3采用的是Selectors API的第一級標準
D、基礎R已經包含支撐包括協(xié)同圖(Coplot)、拼接圖(Mosaic Plot)和雙標圖等多類圖形的功能。
正確答案:


第24題,按照數據量的大小,可將數據分析分為()
A、內存級數據分析
B、Bl級數據分析
C、海量級數據分析
D、巨量級數據分析
正確答案:,B,C


答案來源:(www.),基于大數據的臨床決策支持系統(tǒng)的架構包括
A、支撐層
B、大數據分析層
C、網絡層
D、應用層
正確答案:,B,D


第26題,常見的非結構化數據有()
A、web網頁
B、即時消息
C、富文本文檔
D、實時多媒體數據
正確答案:,B,C,D


第27題,統(tǒng)計圖表的可視化方法主要包括()
A、散點圖
B、折線圖
C、條形圖
D、餅圖
正確答案:


第28題,離群點檢測的應用包括()等。
A、欺詐檢測
B、入侵檢測
C、故障檢測
D、疾病的不尋常模式
正確答案:,B,C,D


第29題,層次方法可以分為()
A、K均值算法
B、K中心點算法
C、凝聚法
D、分裂法
正確答案:,D


答案來源:(www.),常見的分類方法有
A、決策樹
B、貝葉斯網絡
C、遺傳算法
D、FP算法
正確答案:,B,C


第31題,廣義的Spark是指Spark生態(tài)系統(tǒng),采用了四層架構。
T、對
F、錯
更多答案下載:(www.)


第32題,數據挖掘方法側重于從數據驅動的角度出發(fā)獲取模式或規(guī)律。因此,針對海量人類移動數據,數據挖掘方法可以發(fā)揮其挖掘模式或規(guī)律的長處。
T、對
F、錯
正確答案:


第33題,數據會吸引更多的潛在攻擊者,成為更具吸引力的目標。
T、對
F、錯
正確答案:


第34題,數據規(guī)約是在盡可能保持數據原貌的前提下,最大限度地精簡數據量
T、對
F、錯
更多答案下載:(www.)


第35題,FP是一種最有影響的挖掘布爾關聯規(guī)則頻繁項集的算法
T、對
F、錯
正確答案:


第36題,百度地圖春節(jié)人口迂徙大數據.在業(yè)界首次實現了全程、動態(tài)、即時直觀地展現中國春節(jié)前后人口大遷徙的軌跡與特征。
T、對
F、錯
更多答案下載:(www.)


第37題,空間視圖提供了交通堵塞的概覽
T、對
F、錯
更多答案下載:(www.)


第38題,基于大數據的智慧醫(yī)療系統(tǒng)的建立,能顯著的提高醫(yī)療機構的信息化水平,為醫(yī)院、患者帶去更多的利益。
T、對
F、錯
更多答案下載:(www.)


第39題,通常將統(tǒng)計指標的數值按時間順序排列所形成的數列,稱為時間序列。
T、對
F、錯
更多答案下載:(www.)


第40題,數據采集,又稱數據獲取,是大數據生命周期的第一個環(huán)節(jié),通過RFID射頻識別技術、傳感器、交互型社交網絡以及移動互聯網等方式獲得的各種類型的結構化、半結構化及非結構化的海量數據。
T、對
F、錯
更多答案下載:(www.)


第41題,HDFS為海量的數據提供了存儲;
T、對
F、錯
更多答案下載:(www.)


第42題,美國《自然》(Nature)雜志???-The next google,第一次正式提出"大數據"概念。
T、對
F、錯
更多答案下載:(www.)


第43題,彈性是指有容錯的機制,若一個RDD分片去失,Spark可以根據粗粒度的日志數據更新記錄的信息重構它。
T、對
F、錯
正確答案:


第44題,云存儲中用戶需要按需付費并使用存儲服務
T、對
F、錯
更多答案下載:(www.)


第45題,寧家駿委員指出,我國發(fā)展醫(yī)療服務業(yè),同時發(fā)展智慧養(yǎng)老。
T、對
F、錯
正確答案:


第46題,非結構化數據是指非純文本類數據,沒有標準格式,無法直接解析出相應的值
T、對
F、錯
更多答案下載:(www.)


第47題,內存分析數據量比BI分析數據量大
T、對
F、錯
正確答案:F


第48題,數據存儲要表現出靜態(tài)數據的特征,反映的是系統(tǒng)中靜止的數據。
T、對
F、錯
更多答案下載:(www.)


第49題,屬性或維命名的不一致也可能導致結果數據集中的數據冗余。
T、對
F、錯
正確答案:


答案來源:(www.),多元線性回歸是線性回歸的擴充,其中涉及的屬性多于兩個,并且數據擬合到一個多維曲面
T、對
F、錯
正確答案:














  • 上一篇:
  • 下一篇:
  • 作業(yè)咨詢 論文咨詢
    微信客服掃一掃

    回到頂部