22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計(jì)》在線作業(yè)【資料答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時(shí)間:2022-08-27 19:21:26來源:admin瀏覽: 53 次

22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計(jì)》在線作業(yè)-00002

試卷總分:100  得分:100

一、單選題 (共 50 道試題,共 100 分)

1.對(duì)單精度浮點(diǎn)計(jì)算,MMX最高實(shí)現(xiàn)____路并行。

A.2

B.4

C.8

D.16


2.從線程檢查主線程是否要求它退出應(yīng)采用____。

A.pthread_join

B.pthread_cancel

C.pthread_testcancel

D.pthread_exit


3.條件變量相對(duì)于互斥量的優(yōu)點(diǎn)是____。

A.是多源狀態(tài)

B.加鎖解鎖開銷低

C.條件不成立時(shí)阻塞線程并自動(dòng)解鎖加鎖

D.以上皆錯(cuò)


4.編寫矩陣乘法的SSE程序,若矩陣元素為單精度浮點(diǎn)數(shù),則應(yīng)對(duì)矩陣乘—加計(jì)算的循環(huán)進(jìn)行____路循環(huán)展開。

A.2

B.4

C.8

D.16


5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系統(tǒng)向量化訪存是按16字節(jié)對(duì)齊的,則此向量化程序每個(gè)循環(huán)步產(chǎn)生____個(gè)內(nèi)存訪問操作。

A.1

B.2

C.3

D.4


6.全球500強(qiáng)超算在CPU、網(wǎng)絡(luò)等硬件上越來越體現(xiàn)出采用____的趨勢(shì)。

A.特殊硬件

B.通用硬件

C.非公開硬件

D.廉價(jià)硬件


7.并行算法設(shè)計(jì)所做的事情不包括____。

A.分解計(jì)算工作分配給多個(gè)處理器

B.保持?jǐn)?shù)據(jù)依賴保證結(jié)果正確

C.確保不能產(chǎn)生重復(fù)計(jì)算

D.盡量降低通信等額外開銷


8.CPU cache大小為32KB,64*64的兩個(gè)矩陣進(jìn)行加法計(jì)算,下面說法正確的是____。

A.可利用cache時(shí)間局部性優(yōu)化性能

B.可利用cache空間局部性優(yōu)化性能

C.可通過矩陣分片優(yōu)化性能

D.訪存方面無優(yōu)化可能


9.pthread_join的作用是____。

A.強(qiáng)制終止指定線程

B.檢測(cè)指定線程是否結(jié)束

C.等待指定線程結(jié)束才返回

D.向指定線程發(fā)送數(shù)據(jù)


10.使用____無法直接實(shí)現(xiàn)“主線程等待4個(gè)從線程完成任務(wù)”。

A.1個(gè)信號(hào)量

B.障礙

C.1個(gè)互斥量

D.4個(gè)互斥量


11.OpenMP并行模型是一種____編程模型。

A.靜態(tài)線程

B.動(dòng)態(tài)線程

C.混合線程

D.眾核


12.關(guān)于MPI_recv對(duì)消息的區(qū)分,下列說法正確的是____。

A.只能使用消息標(biāo)簽

B.可以使用MPI_ANY_TAG

C.可以使用消息名

D.可以使用端口號(hào)


13.推動(dòng)GPU應(yīng)用于通用高性能計(jì)算爆發(fā)式增長(zhǎng)的開發(fā)工具是____。

A.OpenGL

B.OpenCL

C.DirectX

D.CUDA


14.OpenMP是___的一個(gè)常見替代。

A.SSE

B.MPI

C.Pthread

D.CUDA


15.一個(gè)AVX寄存器最多存放_(tái)___個(gè)整型數(shù)。

A.2

B.4

C.8

D.16


16.一個(gè)Neon寄存器最多存放_(tái)___個(gè)整型數(shù)。

A.2

B.4

C.8

D.16


17.每個(gè)AVX寄存器寬度為____位。

A.64

B.128

C.256

D.512


18.以下____是MPI基本原語。

A.MPI_barrier

B.MPI_Comm_numprocs

C.MPI_Comm_rank

D.MPI_Comm_Send


19.天河1號(hào)、天河2號(hào)、神威.太湖之光總體上都是____架構(gòu)

A.單核

B.多核

C.眾核

D.集群


20.編寫矩陣乘法的Neon程序,若矩陣元素為單精度浮點(diǎn)數(shù),則應(yīng)對(duì)矩陣乘—加計(jì)算的循環(huán)進(jìn)行____路循環(huán)展開。

A.2

B.4

C.8

D.16


21.執(zhí)行pthread_rwlock_rdlock時(shí),____的情況下加鎖成功。

A.已有一個(gè)線程上了寫鎖

B.已有多個(gè)線程上了寫鎖

C.已有多個(gè)線程上了讀鎖

D.已有多個(gè)線程上了讀鎖和寫鎖


22.AVX是____平臺(tái)的SIMD架構(gòu)。

A.x86

B.POWER

C.SPARC

D.ARM


23.和一對(duì)多廣播對(duì)應(yīng)的組通信操作是____。

A.多對(duì)一收集

B.多對(duì)多收集

C.多對(duì)一歸約

D.多對(duì)多歸約


24.兩個(gè)n*n的矩陣相乘,將所有n^2個(gè)乘法計(jì)算劃分給不同進(jìn)程,再將對(duì)應(yīng)某行某列的n個(gè)乘法結(jié)果累加得到結(jié)果矩陣對(duì)應(yīng)元素,這是一種劃分____的數(shù)據(jù)并行。

A.輸入數(shù)據(jù)

B.中間結(jié)果

C.輸出數(shù)據(jù)

D.臨時(shí)數(shù)據(jù)


25.為防止編譯器不支持OpenMP,應(yīng)使用____實(shí)現(xiàn)OpenMP代碼和普通代碼的條件編譯。

A."#include "

B."#pragma omp parallel"

C."#ifdef _OPENMP"

D."#define _OPENMP"


26.對(duì)矩陣每行排序的程序進(jìn)行多線程并行化,對(duì)矩陣采用____。

A.簡(jiǎn)單均勻塊劃分即可保證負(fù)載均衡

B.循環(huán)劃分才能實(shí)現(xiàn)負(fù)載均衡

C.動(dòng)態(tài)劃分才能實(shí)現(xiàn)負(fù)載均衡

D.隨機(jī)劃分才能實(shí)現(xiàn)負(fù)載均衡


27.加速比計(jì)算中串行時(shí)間應(yīng)該取求解同一問題的哪個(gè)串行算法的時(shí)間____。

A.任意一個(gè)串行算法

B.作為并行算法基礎(chǔ)的那個(gè)串行算法

C.已知最優(yōu)的串行算法

D.所有串行算法的平均時(shí)間


28.當(dāng)處理器數(shù)量不變時(shí),隨著問題規(guī)模增大,效率增大對(duì)____成立。

A.部分并行算法

B.所有并行算法

C.所有并行算法都不

D.以上皆錯(cuò)


29.使用一個(gè)信號(hào)量實(shí)現(xiàn)“主線程等待4個(gè)從線程完成任務(wù)”,信號(hào)量初始值應(yīng)設(shè)置為____。

A.0

B.1

C.2

D.4


30.OpenMP循環(huán)劃分策略不包括____。

A.static

B.fixed

C.dynamic

D.guided


31.矩陣乘法問題更適合使用MPI的____編程模型。

A.阻塞的

B.非阻塞的

C.對(duì)等的

D.主從的


32.將寄存器設(shè)置為4個(gè)給定單精度浮點(diǎn)數(shù)的SSE intrinsics指令是____。

A._mm_set_ps

B._mm_set1_ss

C._mm_setzero_ss

D._mm_setzero_ps


33.控制流語句進(jìn)行SIMD并行化很困難的原因是控制流語句導(dǎo)致____。

A.連續(xù)數(shù)據(jù)執(zhí)行不同指令

B.連續(xù)數(shù)據(jù)執(zhí)行相同指令

C.同一數(shù)據(jù)執(zhí)行不同指令

D.同一數(shù)據(jù)執(zhí)行相同指令


34.n個(gè)節(jié)點(diǎn)的超立方構(gòu)造成本為____。

A.O(logn)

B.O(sqrt(n))

C.O(n)

D.O(nlogn)


35.MMX有____個(gè)專用寄存器。

A.4

B.8

C.16

D.32


36.pthread_rwlock_rdlock是對(duì)讀寫鎖進(jìn)行____操作。

A.加鎖

B.解鎖

C.加讀瑣

D.加寫鎖


37.對(duì)下面程序,說法正確的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }

A.破壞了數(shù)據(jù)依賴

B.未破壞數(shù)據(jù)依賴

C.取決于變量聲明

D.比臨界區(qū)方式性能差


38.以下說法正確的是____。

A.多對(duì)多廣播的高效算法基于一對(duì)多廣播的高效算法

B.多對(duì)多歸約的高效算法基于多對(duì)一歸約的高效算法

C.多對(duì)多廣播的高效算法基于串行的一對(duì)多廣播算法

D.以上皆錯(cuò)


39.為了實(shí)現(xiàn)向量計(jì)算,SIMD架構(gòu)還需提供____。

A.更大的內(nèi)存容量

B.更快的內(nèi)存?zhèn)鬏?/p>

C.更寬的寄存器

D.更快的網(wǎng)絡(luò)傳輸


40.Pthread不支持____。

A.創(chuàng)建并發(fā)執(zhí)行線程

B.同步

C.非顯式通信

D.自動(dòng)并行化


41.一個(gè)AVX寄存器最多存放_(tái)___個(gè)單精度浮點(diǎn)數(shù)。

A.2

B.4

C.8

D.16


42.SSE intrinsics _mm_storeu_pd命令的功能是____。

A.對(duì)齊標(biāo)量存單精度浮點(diǎn)數(shù)

B.未對(duì)齊標(biāo)量存單精度浮點(diǎn)數(shù)

C.對(duì)齊向量存雙精度浮點(diǎn)數(shù)

D.未對(duì)齊向量存雙精度浮點(diǎn)數(shù)


43.一個(gè)Neon寄存器最多存放_(tái)___個(gè)單精度浮點(diǎn)數(shù)。

A.2

B.4

C.8

D.16


44.在用pthread_mutex_lock對(duì)互斥量進(jìn)行加鎖時(shí),若其已上鎖,則線程進(jìn)入____狀態(tài)。

A.初始化

B.阻塞

C.繼續(xù)執(zhí)行

D.銷毀


45.對(duì)單精度浮點(diǎn)計(jì)算,SSE最高實(shí)現(xiàn)____路并行。

A.2

B.4

C.8

D.16


46.SSE intrinsics _mm_hadd_ps命令的功能是____。

A.寄存器間單精度浮點(diǎn)數(shù)向量加法

B.寄存器間雙精度浮點(diǎn)數(shù)向量加法

C.寄存器內(nèi)單精度浮點(diǎn)數(shù)加法

D.寄存器內(nèi)雙精度浮點(diǎn)數(shù)加法


47.有大量分支指令的程序不適合下面哪種體系結(jié)構(gòu)上進(jìn)行并行化?

A.SISD

B.SIMD

C.SPMD

D.MIMD


48.對(duì)于加速比S和處理器數(shù)量p,下列說法正確的是____。

A.有可能S>p

B.必然S<p

C.不可能S=p

D.兩者無關(guān)聯(lián)


49.在編寫使用n個(gè)線程進(jìn)行n個(gè)數(shù)求和的OpenMP的程序時(shí)采用臨界區(qū)技術(shù),則多線程版本____串行版本。

A.肯定快于

B.肯定慢于

C.可能快于

D.以上皆錯(cuò)


50.兩個(gè)矩陣相乘,若矩陣總規(guī)模小于cache大小,則優(yōu)化訪存的最佳方法是____。

A.先將兩個(gè)矩陣讀入cache再進(jìn)行乘法

B.先轉(zhuǎn)置第一個(gè)矩陣再進(jìn)行乘法

C.先轉(zhuǎn)置第二個(gè)矩陣再進(jìn)行乘法

D.以上皆錯(cuò)



奧鵬,國(guó)開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777


作業(yè)咨詢 論文咨詢
微信客服掃一掃

回到頂部