22秋學期(高起本1709-1803、全層次1809-2103)《并行程序設計》在線作業(yè)-00001
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.SSE intrinsics _mm_load_sd命令的功能是____。
A.對齊標量讀取單精度浮點數(shù)
B.未對齊標量讀取單精度浮點數(shù)
C.對齊標量讀取雙精度浮點數(shù)
D.未對齊標量讀取雙精度浮點數(shù)
2.在使用信號量之后必須對其進行____。
A.初始化
B.解鎖
C.減1
D.銷毀
3.下列哪門課程不是并行程序設計的先導課?
A.計算機概論
B.高級語言程序設計
C.計算機體系結構
D.數(shù)據(jù)庫系統(tǒng)
4.SIMD并行架構的優(yōu)點不包括____。
A.輔助提供更大并發(fā)度
B.設計簡單
C.編程簡單
D.更小的芯片尺寸
5.在矩陣乘法的串行程序中,對____部分進行向量化收益最大。
A.初始化
B.第二個矩陣轉置循環(huán)
C.矩陣元素乘—加計算的循環(huán)
D.結果輸出
6.pthread_join的第二個參數(shù)的作用是____。
A.設置指定線程屬性
B.獲取指定線程屬性
C.向指定線程傳遞參數(shù)
D.獲取指定線程函數(shù)返回結果
7.如果運算結果要保存到獨立無關的變量,則在向量運算之后需要進行的一個操作是____。
A.對齊
B.打包
C.解包
D.以上皆錯
8.對兩個互斥量a、b,線程1執(zhí)行l(wèi)ock(a); lock(b);,線程2執(zhí)行l(wèi)ock(b); lock(a),則兩個線程間會發(fā)生____。
A.競爭條件
B.數(shù)據(jù)依賴
C.資源泄漏
D.死鎖
9.SSE寄存器A和B中元素分別為A1 A2 A3 A4和B1 B2 B3 B4(均為由低到高),則執(zhí)行C=blend(A, B, 0x05)后,C中元素為
A.A1 A2 B3 B4
B.B1 B2 A3 A4
C.A1 B2 A3 B4
D.B1 A2 B3 A4
10.C/C++語言存儲二維數(shù)組采取____。
A.行主次序存儲
B.列主次序存儲
C.交錯式存儲
D.對角線存儲
11.單精度浮點數(shù)矩陣乘法進行AVX并行,期望的加速比為____.
A.等于8
B.小于8
C.4到8之間
D.等于4
12.SIMD架構中,_____。
A.唯一控制單元控制所有計算單元
B.每個計算單元獨有控制單元
C.一組計算單元共享一個控制單元
D.以上皆錯
13.編寫n個數(shù)求和的OpenMP程序,最高效的方法是____。
A.多線程直接并發(fā)累加到共享變量
B.將累加操作設置為臨界區(qū)
C.在累加操作前設置障礙
D.采用歸約指令
14.每個SSE寄存器寬度為____位。
A.32
B.64
C.128
D.256
15.互斥量是一種____同步機制。
A.一元狀態(tài)
B.二元狀態(tài)
C.多元狀態(tài)
D.以上皆錯
16.四位助教幫助教授批改300份試卷,試卷共16道題,每位助教負責批改75份試卷,這是一種____任務劃分方法。
A.數(shù)據(jù)并行
B.任務并行
C.搜索并行
D.預測并行
17.Pthread是_____線程接口標準。
A.Linux
B.POSIX
C.Windows
D.IOS
18.在SSE intrinsics程序中整數(shù)數(shù)據(jù)類型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
19.pthread_rwlock_rdlock是對讀寫鎖進行____操作。
A.加鎖
B.解鎖
C.加讀瑣
D.加寫鎖
20.n個數(shù)求和的串行程序,通過一個循環(huán)將每個數(shù)累加到全局變量sum中,其多線程版本簡單將循環(huán)范圍改變?yōu)槊總€線程負載的范圍,存在的問題是____。
A.負載不均
B.通信開銷大
C.CPU空閑等待嚴重
D.sum累加產(chǎn)生競爭條件,導致結果錯誤
21.數(shù)據(jù)依賴是指必須保持兩個內存操作的____才能保證程序結果正確。
A.大小
B.時序
C.時長
D.cache局部性
22.OpenMP并行模型是一種____編程模型。
A.靜態(tài)線程
B.動態(tài)線程
C.混合線程
D.眾核
23.關于pthread_create的第一個pthread_t參數(shù),下列說法錯誤的是____。
A.它是輸出參數(shù)
B.它返回線程系統(tǒng)ID
C.它返回線程的pthread ID
D.需要為它預先分配內存
24.并行算法運行時間是指____。
A.最快進程花費時間
B.所有進程平均花費時間
C.所有進程花費總時間
D.最慢進程花費時間
25.下面哪個問題相對而言更不適合進行數(shù)據(jù)并行____。
A.求和
B.排序
C.向量加法
D.矩陣乘法
26.AVX_512有____個專用寄存器。
A.4
B.8
C.16
D.32
27.在使用條件變量之后必須對其進行____。
A.初始化
B.加鎖
C.解鎖
D.銷毀
28.當問題規(guī)模不變時,隨著處理器數(shù)量增大,加速比____。
A.必然增大
B.必然減小
C.必然不變
D.以上皆錯
29.一個Neon寄存器最多存放____個短整型數(shù)。
A.2
B.4
C.8
D.16
30.動態(tài)任務劃分相對于靜態(tài)任務劃分的優(yōu)點是____。
A.確保負載均衡
B.通信開銷低
C.實現(xiàn)簡單
D.計算復雜度低
31.現(xiàn)代CPU中都具有指令亂序執(zhí)行功能,其目的不包括____。
A.消除指令依賴,更充分利用多流水線
B.提高cache效率
C.改變計算結果
D.消除資源沖突
32.在共享內存架構編程中,線程間不能通過____進行通信
A.全局變量
B.局部變量
C.靜態(tài)變量
D.全局堆中變量
33.OpenMP程序和Pthread程序中線程獲得自身編號的方式分別是____。
A.兩者均為創(chuàng)建線程時傳遞參數(shù)
B.兩者均通過特定API
C.前者創(chuàng)建線程時傳遞參數(shù),后者通過特定API
D.前者通過特定API,后者創(chuàng)建線程時傳遞參數(shù)
34.for (i=0; i<16; i+=1) { L = A[i+0] – B[i+0]; D = D + abs(L); },此循環(huán)____。
A.可完全向量化
B.不可向量化
C.不確定
D.可部分向量化
35.單程序多數(shù)據(jù)流模式是針對____架構的。
A.SISD
B.SIMD
C.MISD
D.MIMD
36.在使用條件變量時,還需配套使用一個____。
A.互斥量
B.信號量
C.障礙
D.自旋鎖
37.全球500強超算在CPU、網(wǎng)絡等硬件上越來越體現(xiàn)出采用____的趨勢。
A.特殊硬件
B.通用硬件
C.非公開硬件
D.廉價硬件
38.OpenMP中多線程間是一種____關系。
A.主從
B.分組
C.對等
D.競爭
39.SSE是____平臺的SIMD架構。
A.x86
B.POWER
C.SPARC
D.ARM
40.多個線程進行并行求和,每個線程將自己負責的值依次讀入局部變量x,累加到全局變量sum上,sum+=x,對此,下面說法正確的是
A.讀取x存在數(shù)據(jù)依賴,不能并發(fā)進行
B.累加順序被改變,結果是錯誤的
C.加法操作是簡單運算,無需同步
D.加法操作不是原子操作,需要同步保證數(shù)據(jù)依賴
41.我們不能通過____指定OpenMP循環(huán)劃分策略。
A.使用編譯指示
B.設置環(huán)境變量
C.調用庫函數(shù)
D.采用默認設置
42.以下說法錯誤的是____。
A.全歸約的高效算法基于多對多廣播的高效算法
B.全歸約高效算法基于一對多廣播的高效算法
C.前綴和的高效算法基于多對多廣播的高效算法
D.前綴和的高效算法中的通信模式于全歸約的高效算法相似
43.編寫矩陣乘法的Neon程序,若矩陣元素為雙精度浮點數(shù),則應對矩陣乘—加計算的循環(huán)進行____路循環(huán)展開。
A.2
B.4
C.8
D.16
44.CUDA的優(yōu)點不包括____。
A.可移植性
B.入門簡單
C.標準的SPMD模式
D.不再需要圖形API
45.1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 這兩個程序片段哪個進行向量化效率更高?
A.1)
B.2)
C.不確定
D.以上皆錯
46.編寫矩陣乘法的AVX程序,若矩陣元素為單精度浮點數(shù),則應對矩陣乘—加計算的循環(huán)進行____路循環(huán)展開。
A.2
B.4
C.8
D.16
47.OpenMP編譯指示中說明共享變量是用____子句。
A.private
B.shared
C.schedule
D.nowait
48.動態(tài)任務劃分相對于靜態(tài)任務劃分的缺點是____。
A.可能導致負載不均
B.通信開銷高
C.任務粒度粗
D.計算復雜度高
49.SSE intrinsics _mm_loadu_pd命令的功能是____。
A.對齊向量讀取單精度浮點數(shù)
B.未對齊向量讀取單精度浮點數(shù)
C.對齊向量讀取雙精度浮點數(shù)
D.未對齊向量讀取雙精度浮點數(shù)
50.互斥量mutex機制,在任何時刻____進入它保護的區(qū)域。
A.允許任意數(shù)量任意類型的線程
B.允許一個讀線程任意個寫線程
C.允許一個寫線程任意個讀線程
D.只允許一個線程
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

