22春學(xué)期(高起本1709-1803、全層次1809-2103)《并行程序設(shè)計(jì)》在線作業(yè)-00002
試卷總分:100 得分:100
一、單選題 (共 50 道試題,共 100 分)
1.對(duì)單精度浮點(diǎn)計(jì)算,MMX最高實(shí)現(xiàn)____路并行。
A.2
B.4
C.8
D.16
2.從線程檢查主線程是否要求它退出應(yīng)采用____。
A.pthread_join
B.pthread_cancel
C.pthread_testcancel
D.pthread_exit
3.條件變量相對(duì)于互斥量的優(yōu)點(diǎn)是____。
A.是多源狀態(tài)
B.加鎖解鎖開銷低
C.條件不成立時(shí)阻塞線程并自動(dòng)解鎖加鎖
D.以上皆錯(cuò)
4.編寫矩陣乘法的SSE程序,若矩陣元素為單精度浮點(diǎn)數(shù),則應(yīng)對(duì)矩陣乘—加計(jì)算的循環(huán)進(jìn)行____路循環(huán)展開。
A.2
B.4
C.8
D.16
5.float a[64]; for (i=0; i<60; i+=4) Va = a[i+2:i+5]; 系統(tǒng)向量化訪存是按16字節(jié)對(duì)齊的,則此向量化程序每個(gè)循環(huán)步產(chǎn)生____個(gè)內(nèi)存訪問操作。
A.1
B.2
C.3
D.4
6.全球500強(qiáng)超算在CPU、網(wǎng)絡(luò)等硬件上越來越體現(xiàn)出采用____的趨勢(shì)。
A.特殊硬件
B.通用硬件
C.非公開硬件
D.廉價(jià)硬件
7.并行算法設(shè)計(jì)所做的事情不包括____。
A.分解計(jì)算工作分配給多個(gè)處理器
B.保持?jǐn)?shù)據(jù)依賴保證結(jié)果正確
C.確保不能產(chǎn)生重復(fù)計(jì)算
D.盡量降低通信等額外開銷
8.CPU cache大小為32KB,64*64的兩個(gè)矩陣進(jìn)行加法計(jì)算,下面說法正確的是____。
A.可利用cache時(shí)間局部性優(yōu)化性能
B.可利用cache空間局部性優(yōu)化性能
C.可通過矩陣分片優(yōu)化性能
D.訪存方面無優(yōu)化可能
9.pthread_join的作用是____。
A.強(qiáng)制終止指定線程
B.檢測(cè)指定線程是否結(jié)束
C.等待指定線程結(jié)束才返回
D.向指定線程發(fā)送數(shù)據(jù)
10.使用____無法直接實(shí)現(xiàn)“主線程等待4個(gè)從線程完成任務(wù)”。
A.1個(gè)信號(hào)量
B.障礙
C.1個(gè)互斥量
D.4個(gè)互斥量
11.OpenMP并行模型是一種____編程模型。
A.靜態(tài)線程
B.動(dòng)態(tài)線程
C.混合線程
D.眾核
12.關(guān)于MPI_recv對(duì)消息的區(qū)分,下列說法正確的是____。
A.只能使用消息標(biāo)簽
B.可以使用MPI_ANY_TAG
C.可以使用消息名
D.可以使用端口號(hào)
13.推動(dòng)GPU應(yīng)用于通用高性能計(jì)算爆發(fā)式增長(zhǎng)的開發(fā)工具是____。
A.OpenGL
B.OpenCL
C.DirectX
D.CUDA
14.OpenMP是___的一個(gè)常見替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
15.一個(gè)AVX寄存器最多存放_(tái)___個(gè)整型數(shù)。
A.2
B.4
C.8
D.16
16.一個(gè)Neon寄存器最多存放_(tái)___個(gè)整型數(shù)。
A.2
B.4
C.8
D.16
17.每個(gè)AVX寄存器寬度為____位。
A.64
B.128
C.256
D.512
18.以下____是MPI基本原語。
A.MPI_barrier
B.MPI_Comm_numprocs
C.MPI_Comm_rank
D.MPI_Comm_Send
19.天河1號(hào)、天河2號(hào)、神威.太湖之光總體上都是____架構(gòu)
A.單核
B.多核
C.眾核
D.集群
20.編寫矩陣乘法的Neon程序,若矩陣元素為單精度浮點(diǎn)數(shù),則應(yīng)對(duì)矩陣乘—加計(jì)算的循環(huán)進(jìn)行____路循環(huán)展開。
A.2
B.4
C.8
D.16
21.執(zhí)行pthread_rwlock_rdlock時(shí),____的情況下加鎖成功。
A.已有一個(gè)線程上了寫鎖
B.已有多個(gè)線程上了寫鎖
C.已有多個(gè)線程上了讀鎖
D.已有多個(gè)線程上了讀鎖和寫鎖
22.AVX是____平臺(tái)的SIMD架構(gòu)。
A.x86
B.POWER
C.SPARC
D.ARM
23.和一對(duì)多廣播對(duì)應(yīng)的組通信操作是____。
A.多對(duì)一收集
B.多對(duì)多收集
C.多對(duì)一歸約
D.多對(duì)多歸約
24.兩個(gè)n*n的矩陣相乘,將所有n^2個(gè)乘法計(jì)算劃分給不同進(jìn)程,再將對(duì)應(yīng)某行某列的n個(gè)乘法結(jié)果累加得到結(jié)果矩陣對(duì)應(yīng)元素,這是一種劃分____的數(shù)據(jù)并行。
A.輸入數(shù)據(jù)
B.中間結(jié)果
C.輸出數(shù)據(jù)
D.臨時(shí)數(shù)據(jù)
25.為防止編譯器不支持OpenMP,應(yīng)使用____實(shí)現(xiàn)OpenMP代碼和普通代碼的條件編譯。
A."#include "
B."#pragma omp parallel"
C."#ifdef _OPENMP"
D."#define _OPENMP"
26.對(duì)矩陣每行排序的程序進(jìn)行多線程并行化,對(duì)矩陣采用____。
A.簡(jiǎn)單均勻塊劃分即可保證負(fù)載均衡
B.循環(huán)劃分才能實(shí)現(xiàn)負(fù)載均衡
C.動(dòng)態(tài)劃分才能實(shí)現(xiàn)負(fù)載均衡
D.隨機(jī)劃分才能實(shí)現(xiàn)負(fù)載均衡
27.加速比計(jì)算中串行時(shí)間應(yīng)該取求解同一問題的哪個(gè)串行算法的時(shí)間____。
A.任意一個(gè)串行算法
B.作為并行算法基礎(chǔ)的那個(gè)串行算法
C.已知最優(yōu)的串行算法
D.所有串行算法的平均時(shí)間
28.當(dāng)處理器數(shù)量不變時(shí),隨著問題規(guī)模增大,效率增大對(duì)____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆錯(cuò)
29.使用一個(gè)信號(hào)量實(shí)現(xiàn)“主線程等待4個(gè)從線程完成任務(wù)”,信號(hào)量初始值應(yīng)設(shè)置為____。
A.0
B.1
C.2
D.4
30.OpenMP循環(huán)劃分策略不包括____。
A.static
B.fixed
C.dynamic
D.guided
31.矩陣乘法問題更適合使用MPI的____編程模型。
A.阻塞的
B.非阻塞的
C.對(duì)等的
D.主從的
32.將寄存器設(shè)置為4個(gè)給定單精度浮點(diǎn)數(shù)的SSE intrinsics指令是____。
A._mm_set_ps
B._mm_set1_ss
C._mm_setzero_ss
D._mm_setzero_ps
33.控制流語句進(jìn)行SIMD并行化很困難的原因是控制流語句導(dǎo)致____。
A.連續(xù)數(shù)據(jù)執(zhí)行不同指令
B.連續(xù)數(shù)據(jù)執(zhí)行相同指令
C.同一數(shù)據(jù)執(zhí)行不同指令
D.同一數(shù)據(jù)執(zhí)行相同指令
34.n個(gè)節(jié)點(diǎn)的超立方構(gòu)造成本為____。
A.O(logn)
B.O(sqrt(n))
C.O(n)
D.O(nlogn)
35.MMX有____個(gè)專用寄存器。
A.4
B.8
C.16
D.32
36.pthread_rwlock_rdlock是對(duì)讀寫鎖進(jìn)行____操作。
A.加鎖
B.解鎖
C.加讀瑣
D.加寫鎖
37.對(duì)下面程序,說法正確的是 # pragma omp parallel for num_threads(thread_count) \ reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }
A.破壞了數(shù)據(jù)依賴
B.未破壞數(shù)據(jù)依賴
C.取決于變量聲明
D.比臨界區(qū)方式性能差
38.以下說法正確的是____。
A.多對(duì)多廣播的高效算法基于一對(duì)多廣播的高效算法
B.多對(duì)多歸約的高效算法基于多對(duì)一歸約的高效算法
C.多對(duì)多廣播的高效算法基于串行的一對(duì)多廣播算法
D.以上皆錯(cuò)
39.為了實(shí)現(xiàn)向量計(jì)算,SIMD架構(gòu)還需提供____。
A.更大的內(nèi)存容量
B.更快的內(nèi)存?zhèn)鬏?/p>
C.更寬的寄存器
D.更快的網(wǎng)絡(luò)傳輸
40.Pthread不支持____。
A.創(chuàng)建并發(fā)執(zhí)行線程
B.同步
C.非顯式通信
D.自動(dòng)并行化
41.一個(gè)AVX寄存器最多存放_(tái)___個(gè)單精度浮點(diǎn)數(shù)。
A.2
B.4
C.8
D.16
42.SSE intrinsics _mm_storeu_pd命令的功能是____。
A.對(duì)齊標(biāo)量存單精度浮點(diǎn)數(shù)
B.未對(duì)齊標(biāo)量存單精度浮點(diǎn)數(shù)
C.對(duì)齊向量存雙精度浮點(diǎn)數(shù)
D.未對(duì)齊向量存雙精度浮點(diǎn)數(shù)
43.一個(gè)Neon寄存器最多存放_(tái)___個(gè)單精度浮點(diǎn)數(shù)。
A.2
B.4
C.8
D.16
44.在用pthread_mutex_lock對(duì)互斥量進(jìn)行加鎖時(shí),若其已上鎖,則線程進(jìn)入____狀態(tài)。
A.初始化
B.阻塞
C.繼續(xù)執(zhí)行
D.銷毀
45.對(duì)單精度浮點(diǎn)計(jì)算,SSE最高實(shí)現(xiàn)____路并行。
A.2
B.4
C.8
D.16
46.SSE intrinsics _mm_hadd_ps命令的功能是____。
A.寄存器間單精度浮點(diǎn)數(shù)向量加法
B.寄存器間雙精度浮點(diǎn)數(shù)向量加法
C.寄存器內(nèi)單精度浮點(diǎn)數(shù)加法
D.寄存器內(nèi)雙精度浮點(diǎn)數(shù)加法
47.有大量分支指令的程序不適合下面哪種體系結(jié)構(gòu)上進(jìn)行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
48.對(duì)于加速比S和處理器數(shù)量p,下列說法正確的是____。
A.有可能S>p
B.必然S<p
C.不可能S=p
D.兩者無關(guān)聯(lián)
49.在編寫使用n個(gè)線程進(jìn)行n個(gè)數(shù)求和的OpenMP的程序時(shí)采用臨界區(qū)技術(shù),則多線程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆錯(cuò)
50.兩個(gè)矩陣相乘,若矩陣總規(guī)模小于cache大小,則優(yōu)化訪存的最佳方法是____。
A.先將兩個(gè)矩陣讀入cache再進(jìn)行乘法
B.先轉(zhuǎn)置第一個(gè)矩陣再進(jìn)行乘法
C.先轉(zhuǎn)置第二個(gè)矩陣再進(jìn)行乘法
D.以上皆錯(cuò)
奧鵬,國(guó)開,廣開,電大在線,各省平臺(tái),新疆一體化等平臺(tái)學(xué)習(xí)
詳情請(qǐng)咨詢QQ : 3230981406或微信:aopopenfd777