23秋《大數據技術與應用》作業(yè)1-00001
試卷總分:100 得分:100
一、單選題 (共 15 道試題,共 60 分)
1.數據集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位數為
A.2
B.4
C.6
D.8
2.在pandas中臟數據的典型表示有()
A.np.nan
B.*
C.?
D.no
3.利用pandas處理數據缺失值時,用于丟棄缺失值的函數為
A.isnull
B.head
C.tail
D.dropna
4.數據集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位數為
A.2
B.4
C.6
D.8
5.數據集{1,2,3,5,7,8,9}的中位數是
A.3
B.5
C.7
D.4
6.用訓練好的LOF實例對數據進行LOF分數計算并排序的語句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
7.利用pandas處理數據缺失值時,用于發(fā)現重復值的函數為
A.isnull
B.duplicated
C.fillna
D.dropna
8.分類的目標是
A.將一組對象分組以發(fā)現它們之間是否存在某種關系
B.從一組預定義的類中查找新對象所屬的類
C.提高數據標簽利用效率
D.以上都不對
9.項集 S ={ },則項集S稱為
A.1項集
B.2項集
C.3項集
D.空集
10.訓練隨機森林模型實例的語句是
A.from sklearn.tree import DecisionTreetClassifier
B.clf=DecisionTreetClassifier()
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代碼第4行中Xtest表示
A.訓練數據集
B.測試數據集
C.訓練數據的類別標簽數組
D.測試數據的類別標簽數組
12.數據集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位數為
A.20
B.22
C.20.5
D.28
13.關聯規(guī)則 X→Y 表示中Y稱為
A.前件
B.后件
C.中間件
D.以上都不對
14.數據集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差為
A.20
B.22
C.20.5
D.18.5
15.用訓練好的LOF實例判斷數據是否異常,正常樣本用1表示,異常樣本用-1表示的語句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
二、多選題 (共 5 道試題,共 20 分)
16.常用的描述統(tǒng)計分析方法包括
A.對比分析法
B.平均分析法
C.交叉分析法
D.以上都不對
17.關聯規(guī)則反映的是
A.可分類性
B.可分割性
C.事物之間相互依存性
D.事物之間相互關聯性
18.數據集中趨勢分析的常用指標包括
A.平均值
B.中位數
C.眾數
D.四分位數
19.數據挖掘是適應信息社會從海量數據中提取信息的需要而產生的新學科,也是交叉學科,包括
A.統(tǒng)計學
B.機器學習
C.數據庫
D.模式識別
20.常用的分類方法包括
A.樸素貝葉斯分類器
B.決策樹
C.KNN
D.以上都不對
三、判斷題 (共 5 道試題,共 20 分)
21.分箱法是針對連續(xù)的數值型數據中噪聲進行處理
22.因為 Bayes 理論能夠幫助理解基于概率估計的復雜現況,所以它成為了數據挖掘和概率論的基礎
23.數據類型等級最高的是定類數據
24.分類算法的目的是找到數據的最優(yōu)擬合
25.數據類型等級最低的是定比數據
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

