南開22秋學期(全層次1809-2103)《并行程序設計》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時間:2022/12/24 20:26:09來源:admin瀏覽: 0 次

22秋學期(高起本1709-1803、全層次1809-2103)《并行程序設計》在線作業(yè)-00001

試卷總分:100  得分:100

一、單選題 (共 50 道試題,共 100 分)

1.SSE intrinsics _mm_load_sd命令的功能是____。

A.對齊標量讀取單精度浮點數(shù)

B.未對齊標量讀取單精度浮點數(shù)

C.對齊標量讀取雙精度浮點數(shù)

D.未對齊標量讀取雙精度浮點數(shù)


2.在使用信號量之后必須對其進行____。

A.初始化

B.解鎖

C.減1

D.銷毀


3.下列哪門課程不是并行程序設計的先導課?

A.計算機概論

B.高級語言程序設計

C.計算機體系結構

D.數(shù)據(jù)庫系統(tǒng)


4.SIMD并行架構的優(yōu)點不包括____。

A.輔助提供更大并發(fā)度

B.設計簡單

C.編程簡單

D.更小的芯片尺寸


5.在矩陣乘法的串行程序中,對____部分進行向量化收益最大。

A.初始化

B.第二個矩陣轉置循環(huán)

C.矩陣元素乘—加計算的循環(huán)

D.結果輸出


6.pthread_join的第二個參數(shù)的作用是____。

A.設置指定線程屬性

B.獲取指定線程屬性

C.向指定線程傳遞參數(shù)

D.獲取指定線程函數(shù)返回結果


7.如果運算結果要保存到獨立無關的變量,則在向量運算之后需要進行的一個操作是____。

A.對齊

B.打包

C.解包

D.以上皆錯


8.對兩個互斥量a、b,線程1執(zhí)行l(wèi)ock(a); lock(b);,線程2執(zhí)行l(wèi)ock(b); lock(a),則兩個線程間會發(fā)生____。

A.競爭條件

B.數(shù)據(jù)依賴

C.資源泄漏

D.死鎖


9.SSE寄存器A和B中元素分別為A1 A2 A3 A4和B1 B2 B3 B4(均為由低到高),則執(zhí)行C=blend(A, B, 0x05)后,C中元素為

A.A1 A2 B3 B4

B.B1 B2 A3 A4

C.A1 B2 A3 B4

D.B1 A2 B3 A4


10.C/C++語言存儲二維數(shù)組采取____。

A.行主次序存儲

B.列主次序存儲

C.交錯式存儲

D.對角線存儲


11.單精度浮點數(shù)矩陣乘法進行AVX并行,期望的加速比為____.

A.等于8

B.小于8

C.4到8之間

D.等于4


12.SIMD架構中,_____。

A.唯一控制單元控制所有計算單元

B.每個計算單元獨有控制單元

C.一組計算單元共享一個控制單元

D.以上皆錯


13.編寫n個數(shù)求和的OpenMP程序,最高效的方法是____。

A.多線程直接并發(fā)累加到共享變量

B.將累加操作設置為臨界區(qū)

C.在累加操作前設置障礙

D.采用歸約指令


14.每個SSE寄存器寬度為____位。

A.32

B.64

C.128

D.256


15.互斥量是一種____同步機制。

A.一元狀態(tài)

B.二元狀態(tài)

C.多元狀態(tài)

D.以上皆錯


16.四位助教幫助教授批改300份試卷,試卷共16道題,每位助教負責批改75份試卷,這是一種____任務劃分方法。

A.數(shù)據(jù)并行

B.任務并行

C.搜索并行

D.預測并行


17.Pthread是_____線程接口標準。

A.Linux

B.POSIX

C.Windows

D.IOS


18.在SSE intrinsics程序中整數(shù)數(shù)據(jù)類型是____。

A.__m128

B.__m128f

C.__m128d

D.__m128i


19.pthread_rwlock_rdlock是對讀寫鎖進行____操作。

A.加鎖

B.解鎖

C.加讀瑣

D.加寫鎖


20.n個數(shù)求和的串行程序,通過一個循環(huán)將每個數(shù)累加到全局變量sum中,其多線程版本簡單將循環(huán)范圍改變?yōu)槊總€線程負載的范圍,存在的問題是____。

A.負載不均

B.通信開銷大

C.CPU空閑等待嚴重

D.sum累加產(chǎn)生競爭條件,導致結果錯誤


21.數(shù)據(jù)依賴是指必須保持兩個內存操作的____才能保證程序結果正確。

A.大小

B.時序

C.時長

D.cache局部性


22.OpenMP并行模型是一種____編程模型。

A.靜態(tài)線程

B.動態(tài)線程

C.混合線程

D.眾核


23.關于pthread_create的第一個pthread_t參數(shù),下列說法錯誤的是____。

A.它是輸出參數(shù)

B.它返回線程系統(tǒng)ID

C.它返回線程的pthread ID

D.需要為它預先分配內存


24.并行算法運行時間是指____。

A.最快進程花費時間

B.所有進程平均花費時間

C.所有進程花費總時間

D.最慢進程花費時間


25.下面哪個問題相對而言更不適合進行數(shù)據(jù)并行____。

A.求和

B.排序

C.向量加法

D.矩陣乘法


26.AVX_512有____個專用寄存器。

A.4

B.8

C.16

D.32


27.在使用條件變量之后必須對其進行____。

A.初始化

B.加鎖

C.解鎖

D.銷毀


28.當問題規(guī)模不變時,隨著處理器數(shù)量增大,加速比____。

A.必然增大

B.必然減小

C.必然不變

D.以上皆錯


29.一個Neon寄存器最多存放____個短整型數(shù)。

A.2

B.4

C.8

D.16


30.動態(tài)任務劃分相對于靜態(tài)任務劃分的優(yōu)點是____。

A.確保負載均衡

B.通信開銷低

C.實現(xiàn)簡單

D.計算復雜度低


31.現(xiàn)代CPU中都具有指令亂序執(zhí)行功能,其目的不包括____。

A.消除指令依賴,更充分利用多流水線

B.提高cache效率

C.改變計算結果

D.消除資源沖突


32.在共享內存架構編程中,線程間不能通過____進行通信

A.全局變量

B.局部變量

C.靜態(tài)變量

D.全局堆中變量


33.OpenMP程序和Pthread程序中線程獲得自身編號的方式分別是____。

A.兩者均為創(chuàng)建線程時傳遞參數(shù)

B.兩者均通過特定API

C.前者創(chuàng)建線程時傳遞參數(shù),后者通過特定API

D.前者通過特定API,后者創(chuàng)建線程時傳遞參數(shù)


34.for (i=0; i<16; i+=1) { L = A[i+0] – B[i+0]; D = D + abs(L); },此循環(huán)____。

A.可完全向量化

B.不可向量化

C.不確定

D.可部分向量化


35.單程序多數(shù)據(jù)流模式是針對____架構的。

A.SISD

B.SIMD

C.MISD

D.MIMD


36.在使用條件變量時,還需配套使用一個____。

A.互斥量

B.信號量

C.障礙

D.自旋鎖


37.全球500強超算在CPU、網(wǎng)絡等硬件上越來越體現(xiàn)出采用____的趨勢。

A.特殊硬件

B.通用硬件

C.非公開硬件

D.廉價硬件


38.OpenMP中多線程間是一種____關系。

A.主從

B.分組

C.對等

D.競爭


39.SSE是____平臺的SIMD架構。

A.x86

B.POWER

C.SPARC

D.ARM


40.多個線程進行并行求和,每個線程將自己負責的值依次讀入局部變量x,累加到全局變量sum上,sum+=x,對此,下面說法正確的是

A.讀取x存在數(shù)據(jù)依賴,不能并發(fā)進行

B.累加順序被改變,結果是錯誤的

C.加法操作是簡單運算,無需同步

D.加法操作不是原子操作,需要同步保證數(shù)據(jù)依賴


41.我們不能通過____指定OpenMP循環(huán)劃分策略。

A.使用編譯指示

B.設置環(huán)境變量

C.調用庫函數(shù)

D.采用默認設置


42.以下說法錯誤的是____。

A.全歸約的高效算法基于多對多廣播的高效算法

B.全歸約高效算法基于一對多廣播的高效算法

C.前綴和的高效算法基于多對多廣播的高效算法

D.前綴和的高效算法中的通信模式于全歸約的高效算法相似


43.編寫矩陣乘法的Neon程序,若矩陣元素為雙精度浮點數(shù),則應對矩陣乘—加計算的循環(huán)進行____路循環(huán)展開。

A.2

B.4

C.8

D.16


44.CUDA的優(yōu)點不包括____。

A.可移植性

B.入門簡單

C.標準的SPMD模式

D.不再需要圖形API


45.1) R=XR*1.3;G=XG*1.8;B=XB*1.1; 2) R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1; 這兩個程序片段哪個進行向量化效率更高?

A.1)

B.2)

C.不確定

D.以上皆錯


46.編寫矩陣乘法的AVX程序,若矩陣元素為單精度浮點數(shù),則應對矩陣乘—加計算的循環(huán)進行____路循環(huán)展開。

A.2

B.4

C.8

D.16


47.OpenMP編譯指示中說明共享變量是用____子句。

A.private

B.shared

C.schedule

D.nowait


48.動態(tài)任務劃分相對于靜態(tài)任務劃分的缺點是____。

A.可能導致負載不均

B.通信開銷高

C.任務粒度粗

D.計算復雜度高


49.SSE intrinsics _mm_loadu_pd命令的功能是____。

A.對齊向量讀取單精度浮點數(shù)

B.未對齊向量讀取單精度浮點數(shù)

C.對齊向量讀取雙精度浮點數(shù)

D.未對齊向量讀取雙精度浮點數(shù)


50.互斥量mutex機制,在任何時刻____進入它保護的區(qū)域。

A.允許任意數(shù)量任意類型的線程

B.允許一個讀線程任意個寫線程

C.允許一個寫線程任意個讀線程

D.只允許一個線程



奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

  • 上一篇:
  • 下一篇:
  • 作業(yè)咨詢 論文咨詢
    微信客服掃一掃

    回到頂部