22秋學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計(jì)》在線作業(yè)
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.現(xiàn)代CPU中都具有指令亂序執(zhí)行功能,其目的不包括____。
A.消除指令依賴,更充分利用多流水線
B.提高cache效率
C.改變計(jì)算結(jié)果
D.消除資源沖突
2.編寫(xiě)矩陣乘法的Neon程序,若矩陣元素為雙精度浮點(diǎn)數(shù),則應(yīng)對(duì)矩陣乘—加計(jì)算的循環(huán)進(jìn)行____路循環(huán)展開(kāi)。
A.2
B.4
C.8
D.16
3.C/C++語(yǔ)言存儲(chǔ)二維數(shù)組采取____。
A.行主次序存儲(chǔ)
B.列主次序存儲(chǔ)
C.交錯(cuò)式存儲(chǔ)
D.對(duì)角線存儲(chǔ)
4.MPI收發(fā)各一條消息的API是_____。
A.MPI_Sendrecv
B.MPI_Send
C.MPI_Recv
D.MPI_Replace
5.以下____是MPI基本原語(yǔ)。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
6.MPI是用于____系統(tǒng)的并行編程模型。
A.SIMD
B.MISD
C.共享內(nèi)存
D.分布式內(nèi)存
7.SSE的blend指令的8位二進(jìn)制整數(shù)參數(shù)被用做8個(gè)掩碼imm8[0:7],若imm8[j]=1則表示___。
A.將第一個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置1
B.將第二個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置1
C.將第一個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置j
D.將第二個(gè)源寄存器的第j個(gè)元素放在目標(biāo)寄存器位置j
8.在矩陣乘法之前將第二個(gè)矩陣轉(zhuǎn)置,其作用不包括____。
A.增大訪存空間局部性
B.減少運(yùn)算次數(shù)
C.優(yōu)化SIMD訪存
D.以上皆錯(cuò)
9.一個(gè)Neon寄存器最多存放_(tái)___個(gè)整型數(shù)。
A.2
B.4
C.8
D.16
10.OpenMP歸約指令采用的是一種____算法。
A.分治
B.貪心
C.動(dòng)態(tài)規(guī)劃
D.排序
11.任務(wù)依賴圖中頂點(diǎn)權(quán)重之和表示____。
A.任務(wù)數(shù)
B.任務(wù)難度
C.串行執(zhí)行時(shí)間
D.并行執(zhí)行時(shí)間
12.當(dāng)處理器數(shù)量不變時(shí),隨著問(wèn)題規(guī)模增大,加速比____。
A.所有算法都增大
B.所有算法都減小
C.代價(jià)最優(yōu)算法都增大
D.代價(jià)最優(yōu)算法都減小
13.在下面問(wèn)題中,SIMD并行最不適合____。
A.向量加法
B.向量中元素排序
C.矩陣向量乘法
D.矩陣加法
14.在128位的SIMD寄存器中,我們不能保存____。
A.16個(gè)8位整數(shù)
B.8個(gè)16位短整型
C.4個(gè)32位整型
D.16個(gè)字符的字符串
15.在超市的顧客購(gòu)買商品記錄中統(tǒng)計(jì)一些商品組合的購(gòu)買頻率,將購(gòu)買頻率(商品組合)劃分給不同進(jìn)程,這是一種劃分____的數(shù)據(jù)并行策略。
A.輸入數(shù)據(jù)
B.中間結(jié)果
C.輸出數(shù)據(jù)
D.臨時(shí)數(shù)據(jù)
16.SIMD并行化時(shí)遇到對(duì)齊問(wèn)題,高效的處理方法是____。
A.直接使用SIMD不對(duì)齊訪存指令
B.將數(shù)據(jù)拷貝到對(duì)齊的內(nèi)存地址
C.重寫(xiě)算法保證對(duì)齊訪問(wèn)
D.串行處理到對(duì)齊邊界,然后進(jìn)行SIMD對(duì)齊訪存
17.采用MPI主從模型解決矩陣每行排序問(wèn)題,主進(jìn)程每次向一個(gè)從進(jìn)程發(fā)送10行作為一個(gè)任務(wù)相對(duì)于每次發(fā)送1行的優(yōu)點(diǎn)是____。
A.更有利于負(fù)載均衡
B.減少了通信開(kāi)銷
C.降低了計(jì)算次數(shù)
D.減少了從進(jìn)程空閑
18.對(duì)于障礙同步機(jī)制,以下說(shuō)法錯(cuò)誤的是____。
A.SIMD架構(gòu)無(wú)需障礙機(jī)制
B.是一種群體同步機(jī)制
C.可用信號(hào)量實(shí)現(xiàn)
D.無(wú)法用其他同步機(jī)制實(shí)現(xiàn)
19.OpenMP編譯指示中說(shuō)明私有變量是用____子句。
A.private
B.shared
C.schedule
D.nowait
20.靜態(tài)線程編程模式的優(yōu)點(diǎn)是____。
A.線程負(fù)載均衡
B.線程通信效率高
C.線程管理開(kāi)銷低
D.系統(tǒng)資源利用率高
21.指定線程間劃分循環(huán)策略的OpenMP子句是____。
A.shared
B.reduction
C.schedule
D.nowait
22.一個(gè)Neon寄存器最多存放_(tái)___個(gè)單精度浮點(diǎn)數(shù)。
A.2
B.4
C.8
D.16
23.對(duì)于加速比S和處理器數(shù)量p,下列說(shuō)法正確的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.兩者無(wú)關(guān)聯(lián)
24.Pthread是_____線程接口標(biāo)準(zhǔn)。
A.Linux
B.POSIX
C.Windows
D.IOS
25.OpenMP默認(rèn)采用____循環(huán)劃分策略。
A.靜態(tài)
B.固定
C.動(dòng)態(tài)
D.自適應(yīng)
26.動(dòng)態(tài)任務(wù)劃分相對(duì)于靜態(tài)任務(wù)劃分的優(yōu)點(diǎn)是____。
A.確保負(fù)載均衡
B.通信開(kāi)銷低
C.實(shí)現(xiàn)簡(jiǎn)單
D.計(jì)算復(fù)雜度低
27.Pthread不支持____。
A.創(chuàng)建并發(fā)執(zhí)行線程
B.同步
C.非顯式通信
D.自動(dòng)并行化
28.在用pthread_mutex_trylock對(duì)互斥量進(jìn)行加鎖時(shí),若其已上鎖,則線程進(jìn)入____狀態(tài)。
A.初始化
B.阻塞
C.繼續(xù)執(zhí)行
D.銷毀
29.對(duì)于搜索分解,下面哪個(gè)說(shuō)法是錯(cuò)誤的_____。
A.所有子樹(shù)搜索任務(wù)都必須全部完成
B.工作量可能大于串行計(jì)算
C.工作量可能小于串行計(jì)算
D.可能產(chǎn)生超線性加速比
30.兩個(gè)矩陣相乘,當(dāng)矩陣規(guī)模大于cache大小時(shí),平凡算法的問(wèn)題是____。
A.第一個(gè)矩陣訪存時(shí)間局部性差
B.第一個(gè)矩陣訪存空間局部性差
C.第二個(gè)矩陣訪存時(shí)間局部性差
D.第二個(gè)矩陣訪存空間局部性差
31.起泡排序改為奇偶轉(zhuǎn)置排序,消除了循環(huán)步間的數(shù)據(jù)依賴的原因是____。
A.增大了元素比較距離
B.減小了元素比較距離
C.改為元素兩兩分組比較
D.消除了元素比較
32.利用cache line一次讀取多個(gè)數(shù)據(jù)字的機(jī)制優(yōu)化程序訪存性能,其機(jī)理是____。
A.降低了訪存延遲
B.隱藏了訪存延遲
C.利用了cache空間局部性
D.利用了cache時(shí)間局部性
33.多對(duì)多廣播/歸約高效算法基于____。
A.遞歸思想
B.流水線思想
C.分治思想
D.貪心思想
34.并行算法加速比的定義是____。
A.并行時(shí)間/串行時(shí)間
B.串行時(shí)間/并行時(shí)間
C.串行時(shí)間-并行時(shí)間
D.(串行時(shí)間-并行時(shí)間)/并行時(shí)間
35.在條件成立時(shí)使用pthread_cond_signal____。
A.喚醒等待線程
B.解鎖互斥量
C.加鎖互斥量
D.喚醒等待線程,該線程重新加鎖互斥量
36.下面說(shuō)法錯(cuò)誤的是____。
A.不存在權(quán)威的并行體系結(jié)構(gòu)
B.學(xué)習(xí)并行程序設(shè)計(jì)只關(guān)心軟件即可
C.并行體系結(jié)構(gòu)對(duì)性能有巨大影響
D.很多并行體系結(jié)構(gòu)未來(lái)發(fā)展不明了
37.編寫(xiě)n個(gè)數(shù)求和的OpenMP程序,最高效的方法是____。
A.多線程直接并發(fā)累加到共享變量
B.將累加操作設(shè)置為臨界區(qū)
C.在累加操作前設(shè)置障礙
D.采用歸約指令
38.對(duì)矩陣乘法串行程序的主體三重循環(huán),我們選擇最內(nèi)層循環(huán)進(jìn)行向量化的原因是____。
A.它最后執(zhí)行
B.外層循環(huán)中沒(méi)有計(jì)算操作
C.是隨意選擇的
D.它的連續(xù)循環(huán)步是對(duì)不同元素進(jìn)行相同運(yùn)算
39.SSE寄存器A中元素為A1 A2 A3 A4(均為由低到高),則執(zhí)行C=shuffle(A, A, 0x1B)后,C中元素為
A.A1 A2 A3 A4
B.A2 A1 A4 A3
C.A3 A4 A1 A2
D.A4 A3 A2 A1
40.SSE是____平臺(tái)的SIMD架構(gòu)。
A.x86
B.POWER
C.SPARC
D.ARM
41.如果運(yùn)算結(jié)果要保存到獨(dú)立無(wú)關(guān)的變量,則在向量運(yùn)算之后需要進(jìn)行的一個(gè)操作是____。
A.對(duì)齊
B.打包
C.解包
D.以上皆錯(cuò)
42.對(duì)于條件變量,下列說(shuō)法錯(cuò)誤的是____。
A.可以用互斥量實(shí)現(xiàn)相同功能
B.不能用互斥量實(shí)現(xiàn)相同功能
C.較之互斥量方案節(jié)省資源
D.較之互斥量方案代碼更簡(jiǎn)潔
43.記并行時(shí)間為T(mén),串行時(shí)間為T(mén)’,處理器數(shù)量為p,并行代價(jià)的定義是____。
A.pT
B.T’+T
C.p(T’-T)
D.pT-T’
44.采用多核、眾核技術(shù)提升CPU性能,相對(duì)于單核的優(yōu)勢(shì)不包括____。
A.架構(gòu)設(shè)計(jì)更容易
B.更易突破物理極限
C.能更充分利用現(xiàn)有資源
D.功耗優(yōu)勢(shì)明顯
45.SSE intrinsics _mm_store_sd命令的功能是____。
A.對(duì)齊向量存單精度浮點(diǎn)數(shù)
B.未對(duì)齊向量存單精度浮點(diǎn)數(shù)
C.對(duì)齊標(biāo)量存雙精度浮點(diǎn)數(shù)
D.未對(duì)齊標(biāo)量存雙精度浮點(diǎn)數(shù)
46.使用____無(wú)法直接實(shí)現(xiàn)“主線程喚醒4個(gè)從線程去執(zhí)行任務(wù)”。
A.1個(gè)信號(hào)量
B.障礙
C.1個(gè)互斥量
D.4個(gè)互斥量
47.n個(gè)節(jié)點(diǎn)的線性陣列中,節(jié)點(diǎn)最遠(yuǎn)通信距離為_(kāi)___。
A.1
B.O(logn)
C.O(sqrt(n))
D.O(n)
48.對(duì)矩陣乘法串行程序主體三重循環(huán)的最內(nèi)層循環(huán)進(jìn)行向量化,則該循環(huán)執(zhí)行完畢后,就計(jì)算出了結(jié)果矩陣的一個(gè)元素,這種說(shuō)法是____。
A.正確的
B.錯(cuò)誤的
49.數(shù)據(jù)依賴是指必須保持兩個(gè)內(nèi)存操作的____才能保證程序結(jié)果正確。
A.大小
B.時(shí)序
C.時(shí)長(zhǎng)
D.cache局部性
50.OpenMP并行模型是一種____模式。
A.SISD
B.SIMD
C.MISD
D.SPMD
奧鵬,國(guó)開(kāi),廣開(kāi),電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777

