可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請(qǐng)?zhí)砑観Q:3230981406 微信:aopopenfd777
[南開(kāi)大學(xué)]20秋學(xué)期(1709、1803、1809、1903、1909、2003、2009 )《數(shù)據(jù)分析》在線作業(yè)
試卷總分:100 得分:100
第1題,()反映了學(xué)習(xí)方法對(duì)未知的測(cè)試數(shù)據(jù)集的預(yù)測(cè)能力,是學(xué)習(xí)中的重要概念
A、訓(xùn)練誤差
B、測(cè)試誤差
C、統(tǒng)計(jì)誤差
D、平均誤差
正確答案:
第2題,支持向量機(jī)的MapReduce實(shí)現(xiàn)要進(jìn)行幾輪MapReduce()
A、1
B、2
C、3
D、自行規(guī)定
正確答案:
第3題,類的R型聚類是指()
A、對(duì)樣本個(gè)體進(jìn)行聚類
B、對(duì)指標(biāo)變量進(jìn)行聚類。
正確答案:
第4題,在估計(jì)PLSA生成模型的參數(shù)時(shí),使用()
A、極大似然估計(jì)
B、對(duì)數(shù)似然函數(shù)
C、特征獨(dú)立假設(shè)
D、貝葉斯定理
正確答案:
答案來(lái)源:(www.),在鏈接作弊的垃圾農(nóng)場(chǎng)中,作弊者擁有并完全控制的網(wǎng)頁(yè)稱為()
A、不可達(dá)網(wǎng)頁(yè)
B、可達(dá)網(wǎng)頁(yè)
C、自有網(wǎng)頁(yè)
正確答案:
第6題,潛在語(yǔ)義分析創(chuàng)新地引入了()
A、單詞維度
B、文本維度
C、話題維度
正確答案:
第7題,非頻繁模式( )
A、其置信度小于閾值
B、令人不感興趣
C、包含負(fù)模式和負(fù)相關(guān)模式
D、對(duì)異常數(shù)據(jù)項(xiàng)敏感
正確答案:
第8題,置信度(confidence)是衡量興趣度度量( )的指標(biāo)
A、簡(jiǎn)潔性
B、確定性
C、實(shí)用性
D、新穎性
正確答案:
第9題,決策樹(shù)中的葉結(jié)點(diǎn)表示()
A、特征
B、類
C、屬性
D、值域輸出
正確答案:
答案來(lái)源:(www.),數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是主動(dòng)的主要是來(lái)自哪個(gè)階段( )。
A、運(yùn)營(yíng)式系統(tǒng)階段
B、用戶原創(chuàng)內(nèi)容階段
C、感知式系統(tǒng)階段
正確答案:
第11題,文本中所有單詞的出現(xiàn)情況表示了文本的()
A、種類
B、特征
C、語(yǔ)義內(nèi)容
D、語(yǔ)義結(jié)構(gòu)
正確答案:
答案來(lái)源:(www.),閔式距離參數(shù)是()時(shí)代表曼哈頓距離
A、0
B、1
C、2
D、無(wú)窮
正確答案:
第13題,為了計(jì)算中介度,必須計(jì)算所有邊上()的數(shù)目。
A、所有路徑
B、最短路徑
C、結(jié)點(diǎn)入度
D、節(jié)點(diǎn)出度
正確答案:
第14題,聚類屬于()
A、有監(jiān)督學(xué)習(xí)
B、無(wú)監(jiān)督學(xué)習(xí)
C、強(qiáng)化學(xué)習(xí)
D、對(duì)抗學(xué)習(xí)
正確答案:
答案來(lái)源:(www.),評(píng)價(jià)分類器效果時(shí),表示正確分類的樣本數(shù)與總樣本數(shù)之比的指標(biāo)是()。
A、準(zhǔn)確率
B、精確率
C、召回率
D、F1值
正確答案:
第16題,邏輯斯諦分布的分布函數(shù)范圍在()
A、(-∞,+∞)
B、(0,1)
C、(-1/2,1/2)
D、(-1,1)
正確答案:
第17題,Apriori算法的加速過(guò)程依賴于以下哪個(gè)策略( )
A、抽樣
B、剪枝
C、緩沖
D、并行
正確答案:
第18題,向量空間模型中,將單詞在文本中出現(xiàn)的數(shù)據(jù)用一個(gè)()表示
A、單詞-文本矩陣
B、單詞-向量矩陣
C、距離矩陣
D、權(quán)重矩陣
正確答案:
第19題,潛在語(yǔ)義分析中,以()表示文本的語(yǔ)義內(nèi)容
A、話題
B、話題向量
C、語(yǔ)義向量
D、距離向量
正確答案:
答案來(lái)源:(www.),KNN算法用MapReduce實(shí)現(xiàn),要進(jìn)行幾輪MapReduce()
A、1
B、2
C、3
D、4
正確答案:
第21題,按社團(tuán)形成機(jī)制分類,社團(tuán)包括()
A、明顯的社團(tuán)
B、預(yù)定義社團(tuán)
C、自組織社團(tuán)
D、隱含的社團(tuán)
正確答案:,C
第22題,決策樹(shù)的生成過(guò)程是()
A、遞歸地進(jìn)行下去,直至所有訓(xùn)練據(jù)子集被基本正確分類,或者沒(méi)有合適的特征為止,最后每個(gè)子集都被分到葉結(jié)點(diǎn)上,即都有了明確的類
B、如果這些子集已經(jīng)能夠被基本正確分類,那么構(gòu)建葉結(jié)點(diǎn),并將這些子集分到所對(duì)應(yīng)的葉結(jié)點(diǎn)中去
C、構(gòu)建根結(jié)點(diǎn),將所有訓(xùn)練數(shù)據(jù)都放在根結(jié)點(diǎn)
D、選擇一個(gè)最優(yōu)特征,按照這一特征將訓(xùn)練數(shù)據(jù)集分割成子集,使得各個(gè)子集有一個(gè)在當(dāng)前條件下最好的分類
E、如果還有子集不能被基本正確分類,那么就對(duì)這些子集選擇新的最優(yōu)特征,繼續(xù)對(duì)其進(jìn)行分割,構(gòu)建相應(yīng)的結(jié)點(diǎn)
正確答案:
第23題,回歸分析方法中,按照輸入變量個(gè)數(shù)分類,可分為
A、一元回歸
B、多元回歸
C、線性回歸
D、非線性回歸
正確答案:
第24題,下列哪些任務(wù)適合構(gòu)建分類模型()
A、銀行業(yè)務(wù)中,客戶申請(qǐng)貸款,根據(jù)客戶的相關(guān)數(shù)據(jù)分析他是屬于"誠(chéng)信"類還是"失信"類
B、郵件系統(tǒng)可以根據(jù)email標(biāo)題和內(nèi)容區(qū)分出垃圾郵件
C、醫(yī)學(xué)研究人員根據(jù)病理數(shù)據(jù),合理辨識(shí)病情狀況,采取合理治療手段
D、房?jī)r(jià)預(yù)測(cè)
正確答案:
答案來(lái)源:(www.),ID3算法流程為()
A、從根結(jié)點(diǎn)開(kāi)始,對(duì)結(jié)點(diǎn)計(jì)算所有可能的特征的信息增益,選擇信息增益最大的特征作為結(jié)點(diǎn)的特征,由該特征的不同取值建立子結(jié)點(diǎn)
B、所有特征的信息增益均很小或沒(méi)有特征可以選擇
C、得到一個(gè)決策樹(shù)
D、對(duì)子結(jié)點(diǎn)遞歸地調(diào)用,構(gòu)建決策樹(shù)
正確答案:
第26題,大數(shù)據(jù)在電信中的應(yīng)用有
A、基于用戶、業(yè)務(wù)及流量分級(jí)的多維管控機(jī)制
B、精準(zhǔn)的客戶分析及營(yíng)銷
C、利用位置和軌跡信息服務(wù)社會(huì)
正確答案:,B,C
第27題,統(tǒng)計(jì)學(xué)習(xí)方法的組成
A、監(jiān)督學(xué)習(xí)
B、無(wú)監(jiān)督學(xué)習(xí)
C、強(qiáng)化學(xué)習(xí)
正確答案:
第28題,大數(shù)據(jù)在教育中的應(yīng)用
A、網(wǎng)上公開(kāi)課
B、慕課
C、智慧校園
D、翻轉(zhuǎn)課堂
正確答案:,B,C,D
第29題,下列屬于樸素貝葉斯缺點(diǎn)的是()
A、分類效果不穩(wěn)定
B、不適合增量式訓(xùn)練
C、先驗(yàn)?zāi)P涂赡軐?dǎo)致結(jié)果不佳
D、對(duì)缺失數(shù)據(jù)不太敏感
正確答案:,D
答案來(lái)源:(www.),基于分類對(duì)象的分類有()
A、Q型聚類
B、凝聚方式
C、R型聚類
D、分解方式
正確答案:
第31題,kNN算法中,選擇較大的k值"學(xué)習(xí)"的估計(jì)誤差會(huì)減小。()
T、對(duì)
F、錯(cuò)
正確答案:
第32題,SVM是在特征空間上的間隔最大的線性分類器。()
T、對(duì)
F、錯(cuò)
正確答案:
第33題,可信度是對(duì)關(guān)聯(lián)規(guī)則的準(zhǔn)確度的衡量。
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第34題,要防止過(guò)擬合,進(jìn)行最優(yōu)的模型選擇,即選擇復(fù)雜度最適當(dāng)?shù)哪P?,以達(dá)到使測(cè)試誤差最小的學(xué)習(xí)目的
T、對(duì)
F、錯(cuò)
正確答案:
第35題,如果一個(gè)網(wǎng)頁(yè)被很多網(wǎng)頁(yè)所指向,那么該網(wǎng)頁(yè)很可能是重要的。()
T、對(duì)
F、錯(cuò)
正確答案:
第36題,FP-growth算法可以避免冗余的IO讀寫(xiě)
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第37題,通過(guò)分析已知訓(xùn)練樣本類別的數(shù)據(jù)集屬性,通過(guò)訓(xùn)練建立相應(yīng)分類模型,是監(jiān)督學(xué)習(xí)。()
T、對(duì)
F、錯(cuò)
正確答案:
第38題,大數(shù)據(jù)的速度快體現(xiàn)在數(shù)據(jù)產(chǎn)生速度快和要求分析處理速度快
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第39題,ID3算法的核心是在決策樹(shù)葉結(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn)則選擇特征,遞歸地構(gòu)建決策樹(shù)。
T、對(duì)
F、錯(cuò)
正確答案:
第40題,數(shù)據(jù)采集,又稱數(shù)據(jù)獲取,是大數(shù)據(jù)生命周期的第一個(gè)環(huán)節(jié),通過(guò)RFID射頻識(shí)別技術(shù)、傳感器、交互型社交網(wǎng)絡(luò)以及移動(dòng)互聯(lián)網(wǎng)等方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù)。
T、對(duì)
F、錯(cuò)
正確答案:
第41題,TrustRank算法中,創(chuàng)建優(yōu)質(zhì)網(wǎng)頁(yè)集合時(shí),不會(huì)選擇成員受限的域名。
T、對(duì)
F、錯(cuò)
正確答案:
第42題,聚類分析中,一個(gè)類是樣本的一個(gè)子集。
T、對(duì)
F、錯(cuò)
正確答案:
第43題,決策樹(shù)中為了防止過(guò)擬合現(xiàn)象可以對(duì)已生成的樹(shù)自上而下剪枝。()
T、對(duì)
F、錯(cuò)
正確答案:
第44題,k均值聚類是硬聚類。()
T、對(duì)
F、錯(cuò)
正確答案:
第45題,關(guān)聯(lián)規(guī)則可以用枚舉的方法產(chǎn)生。
T、對(duì)
F、錯(cuò)
更多答案下載:(www.)
第46題,DAG中的父節(jié)點(diǎn)是唯一的。
T、對(duì)
F、錯(cuò)
正確答案:F
第47題,PageRank算法是圖數(shù)據(jù)上的無(wú)監(jiān)督學(xué)習(xí)方法。()
T、對(duì)
F、錯(cuò)
正確答案:
第48題,TF-IDF算法中,IDF指的是文檔頻率
T、對(duì)
F、錯(cuò)
正確答案:
第49題,監(jiān)督學(xué)習(xí)是從標(biāo)注數(shù)據(jù)中學(xué)習(xí)預(yù)測(cè)模型的機(jī)器學(xué)習(xí)問(wèn)題
T、對(duì)
F、錯(cuò)
正確答案:
答案來(lái)源:(www.),樸素貝葉斯等價(jià)于期望風(fēng)險(xiǎn)最小化。()
T、對(duì)
F、錯(cuò)
正確答案:

