Программирование многоядерных архитектур презентация

Август 5, 2022

Главная
Информатика
Программирование многоядерных архитектур

Содержание

2. План презентации кратко о параллельных ЭВМ; введение в многопоточность; интерфейсы работы с потоками; OpenMP: организация многопоточности,
3. Кратко о параллельных ЭВМ
4. Основные классы параллельных ЭВМ SMP MPP PVP COW GPGPU FPGA NOW Xilinx, Altera NVIDIA, ATI, S3
5. Основные виды параллельных ЭВМ Мультикомпьютеры Мультипроцессоры
6. Многоядерность
7. Примеры многоядерных процессоров Intel XEON Phi 60 ядер Tilera TILE-Gx8072 72 ядра GreenArrays GA144A12 144 ядра
8. Процессор Tilera TILE-Gx8072
9. Введение в многопоточность процесс, поток, многозадачность, многопоточная программа.
10. Процесс Процесс - экземпляр запущенной на исполнение программы. Имеет собственные: состояние, код возврата, переменные окружения, идентификаторы
11. Поток Разделяет общие: адресное пространство/ память, данные в памяти, исполняемый код. Имеет собственные: ID, приоритет; Регистры:
12. Многозадачность Формы многозадачности: разделение времени; параллельное исполнение. Виды планирования многозадачности: вытесняющая (Win32, Win64, Linux); кооперативная (Win16).
13. Интерфейсы по работе с потоками
14. OpenMP организация многопоточности; синхронизация; что замедляет вычисления.
15. Что такое OpenMP? Стандарт OpenMP определяет: интерфейс (API); набор прагм компилятора; переменные окружения для построения многопоточных
16. Архитектура OpenMP
17. Модель исполнения Fork-join
18. OpenMP программа 1 Напишем многопоточную программу, в которой: каждый поток печатает свой номер, один поток печатает
19. Шаги создания OpenMP программы Подключение заголовочного файла: #include 2. Создание параллельно исполняемого блока в функции main():
20. Шаги создания OpenMP программы 3. Декларация переменной, собственную копию которой имеет каждый поток: #include void main(){
21. Шаги создания OpenMP программы 3. Получение и печать номера потока: void main(){ int tid; #pragma omp
22. Шаги создания OpenMP программы 4. Декларация переменной, общей для всех потоков. 5. Получение и печать количества
23. Шаги создания OpenMP программы 6. Исполнение кода только одним потоком: #pragma omp parallel private(tid) { tid
24. Шаги создания OpenMP программы 7. Компиляция OpenMP программы: В Windows + Microsoft Visual C++: cl.exe myprog.c
25. OpenMP программа 2 Напишем многопоточную программу, для поэлементного суммирования двух векторов способами: используя конструкцию распределения работы,
26. OpenMP программа 2 1. Пишем общую часть #include void main () { int i; float a[N],
27. Способ 1. Распределение работы между потоками 2. Добавляем параллельную часть #pragma omp parallel shared(a,b,c) private(i) {
28. Ограничения в for число итераций известно до входа в цикл, итерации независимы Индекс меняется только следующим
29. Способ 2. С использованием секций 2. Добавляем параллельную часть #pragma omp parallel shared(a,b,c) private(i) { #pragma
30. OpenMP программа 3 Напишем многопоточную программу вычисления скалярного произведения векторов.
31. OpenMP программа 3 1. Напишем последовательную часть. #include #define N 1000 void main() { int i;
32. OpenMP программа 3 1. Напишем параллельную часть. #pragma omp parallel for \ default(shared) private(i) \ schedule(static,
33. OpenMP программа 4 Напишем многопоточную программу, для увеличения счетчика на единицу: наивно; с синхронизацией.
34. Вариант 1. Наивный #include void main(){ int x; x = 0; #pragma omp parallel for shared(x)
35. Вариант 1. Наивный $ ./plus1 x=977177 $ ./plus1 x=975883 $ ./plus1 x=980608 $ ./plus1 x=979246 Получился
36. Вариант 1. Наивный
37. Вариант 2. С синхронизацией #include void main() { int x; x = 0; #pragma omp parallel
38. Вариант 2. С синхронизацией $ ./plus2 x=1000000
39. Вариант 2. С синхронизацией
40. Что замедляет вычисления? избыточное число порождений потока -> если можно, выносим параллельный блок из цикла; одновременный
41. Цель работы Написание многопоточного приложения с использованием интерфейса OpenMP.
43. Скачать презентацию

Слайд 2

План презентации
кратко о параллельных ЭВМ;
введение в многопоточность;
интерфейсы работы с потоками;
OpenMP:
организация многопоточности,
синхронизация,
что

замедляет вычисления;
цель работы, задание.

Слайд 3

Кратко о параллельных ЭВМ

Слайд 4

Основные классы параллельных ЭВМ
SMP
MPP
PVP
COW
GPGPU
FPGA
NOW
Xilinx, Altera
NVIDIA, ATI, S3
Sequent (1991), HP 9000 V-class

Tilera (2010)

IBM RS/6000 SP2
CRAY T3E

NUMA

CRAY-1, CRAY X1,
Fujitsu VPP

SGI Origin2000

Beowulf

Слайд 5

Основные виды параллельных ЭВМ
Мультикомпьютеры
Мультипроцессоры

Слайд 6

Многоядерность

Слайд 7

Примеры многоядерных процессоров
Intel XEON Phi 60 ядер
Tilera TILE-Gx8072 72 ядра
GreenArrays GA144A12

144 ядра

Слайд 8

Процессор Tilera TILE-Gx8072

Слайд 9

Введение в многопоточность
процесс,
поток,
многозадачность,
многопоточная программа.

Слайд 10

Процесс
Процесс - экземпляр запущенной на исполнение программы.
Имеет собственные:
состояние, код возврата, переменные

окружения, идентификаторы себя, владельца и родителя, приоритет;
отдельное адресное пространство/виртуальная память и/или физическая память;
данные в памяти; исполняемый код в памяти;
один или несколько потоков исполнения команд.

Слайд 11

Поток
Разделяет общие:
адресное пространство/
память,
данные в памяти,
исполняемый код.
Имеет собственные:
ID, приоритет;
Регистры:
поток команд,
стек,
TLS.

Слайд 12

Многозадачность
Формы многозадачности:
разделение времени;
параллельное исполнение.
Виды планирования многозадачности:
вытесняющая (Win32, Win64, Linux);
кооперативная (Win16).

Слайд 13

Интерфейсы по работе с потоками

Слайд 14

OpenMP
организация многопоточности;
синхронизация;
что замедляет вычисления.

Слайд 15

Что такое OpenMP?
Стандарт OpenMP определяет:
интерфейс (API);
набор прагм компилятора;
переменные окружения
для построения многопоточных

приложений на мультипроцессорных системах в модели общей памяти.

Слайд 16

Архитектура OpenMP

Слайд 17

Модель исполнения Fork-join

Слайд 18

OpenMP программа 1
Напишем многопоточную программу, в которой:
каждый поток печатает свой

номер,
один поток печатает количество запущенных потоков в программе.

Слайд 19

Шаги создания OpenMP программы
Подключение заголовочного файла:
#include
2. Создание параллельно исполняемого блока

в функции main():
void main(){
#pragma omp parallel
{
}
}

Слайд 20

Шаги создания OpenMP программы
3. Декларация переменной, собственную копию которой имеет каждый

поток:
#include
void main(){
int tid;
#pragma omp parallel private(tid)
{
}
}

Слайд 21

Шаги создания OpenMP программы
3. Получение и печать номера потока:
void main(){
int tid;
#pragma

omp parallel private(tid)
{
tid = omp_get_thread_num();
printf(“thread num=%d\n”, tid);
}
}

Слайд 22

Шаги создания OpenMP программы
4. Декларация переменной, общей для всех потоков.
5. Получение

и печать количества потоков:
void main(){
int tid, tnum;
#pragma omp parallel private(tid)
{ tid = omp_get_thread_num();
printf(“thread num=%d\n”, tid);
tnum= omp_get_num_threads();
printf(“number of threads=%d\n”, tnum);
}
}

Слайд 23

Шаги создания OpenMP программы
6. Исполнение кода только одним потоком:
#pragma omp parallel

private(tid)
{
tid = omp_get_thread_num();
printf(“thread num=%d\n”, tid);
if(tid == 0){
tnum= omp_get_num_threads();
printf(“number of threads=%d\n”, tnum);
}
}

Слайд 24

Шаги создания OpenMP программы
7. Компиляция OpenMP программы:
В Windows + Microsoft Visual

C++:
cl.exe myprog.c /openmp
В UNIX, Linux, Windows+MinGW, Windows+CygWin
gcc –o myprog myprog.c –fopenmp

Слайд 25

OpenMP программа 2
Напишем многопоточную программу, для поэлементного суммирования двух векторов способами:
используя

конструкцию распределения работы,
используя секции.

Слайд 26

OpenMP программа 2
1. Пишем общую часть
#include
void main ()
{ int i;
float

a[N], b[N], c[N];
for (i=0; i < N; i++)
a[i] = b[i] = 1.0;
}

Слайд 27

Способ 1. Распределение работы между потоками
2. Добавляем параллельную часть
#pragma omp parallel

shared(a,b,c) private(i)
{
#pragma omp for schedule(dynamic, 100) nowait
for (i=0; i < N; i++)
c[i] = a[i] + b[i];
}

Слайд 28

Ограничения в for
число итераций известно до входа в цикл,
итерации независимы
Индекс меняется

только следующим образом:
i++, i--, i += c, i -= c.

Слайд 29

Способ 2. С использованием секций
2. Добавляем параллельную часть
#pragma omp parallel shared(a,b,c)

private(i)
{
#pragma omp sections nowait
{
#pragma omp section
for (i=0; i < N/2; i++)c[i] = a[i] + b[i];
#pragma omp section
for (i=N/2; i < N; i++) c[i] = a[i] + b[i];
}
}

Слайд 30

OpenMP программа 3
Напишем многопоточную программу вычисления скалярного произведения векторов.

Слайд 31

OpenMP программа 3
1. Напишем последовательную часть.
#include
#define N 1000
void main()
{ int i;
float

a[N], b[N], res;
for (i=0; i < N; i++){a[i] = 2.0l; b[i] = 1.0l;}
res = 0.0l;
}

Слайд 32

OpenMP программа 3
1. Напишем параллельную часть.
#pragma omp parallel for \
default(shared) private(i)

\
schedule(static, 100) reduction(+:res)
for(i = 0; i < N; i++)
res = res + (a[i] * b[i]);

Слайд 33

OpenMP программа 4
Напишем многопоточную программу, для увеличения счетчика на единицу:
наивно;
с синхронизацией.

Слайд 34

Вариант 1. Наивный
#include
void main(){
int x; x = 0;
#pragma omp parallel

for shared(x)
for(int i = 0; i < 1000000; i++){
x = x + 1;
}
printf(“x=%d\n”, x);
}

Слайд 35

Вариант 1. Наивный
$ ./plus1
x=977177
$ ./plus1
x=975883
$ ./plus1
x=980608
$ ./plus1
x=979246
Получился

неверный результат. Почему?

Слайд 36

Вариант 1. Наивный

Слайд 37

Вариант 2. С синхронизацией
#include
void main()
{ int x;
x = 0;
#pragma omp

parallel for shared(x)
for(int I = 0; I < 1000000; i++){
#pragma omp critical
x = x + 1;
}
printf(“x=%d”, x)
}

Слайд 38

Вариант 2. С синхронизацией
$ ./plus2
x=1000000

Слайд 39

Вариант 2. С синхронизацией

Слайд 40

Что замедляет вычисления?
избыточное число порождений потока -> если можно, выносим параллельный

блок из цикла;
одновременный доступ двух потоков к одному участку памяти;
излишняя синхронизация.

Слайд 41

Программирование многоядерных архитектур презентация

Содержание

План презентациикратко о параллельных ЭВМ;введение в многопоточность;интерфейсы работы с потоками;OpenMP:организация многопоточности,синхронизация,что

Кратко о параллельных ЭВМ

Основные классы параллельных ЭВМSMPMPPPVPCOWGPGPUFPGANOWXilinx, AlteraNVIDIA, ATI, S3Sequent (1991), HP 9000 V-class

Основные виды параллельных ЭВММультикомпьютеры Мультипроцессоры

Многоядерность

Примеры многоядерных процессоровIntel XEON Phi 60 ядерTilera TILE-Gx8072 72 ядраGreenArrays GA144A12

Процессор Tilera TILE-Gx8072

Введение в многопоточностьпроцесс,поток,многозадачность,многопоточная программа.

Процесс Процесс - экземпляр запущенной на исполнение программы.Имеет собственные:состояние, код возврата, переменные

ПотокРазделяет общие:адресное пространство/ память,данные в памяти,исполняемый код.Имеет собственные:ID, приоритет;Регистры:поток команд,стек,TLS.

МногозадачностьФормы многозадачности:разделение времени;параллельное исполнение.Виды планирования многозадачности:вытесняющая (Win32, Win64, Linux);кооперативная (Win16).

Интерфейсы по работе с потоками

OpenMPорганизация многопоточности;синхронизация;что замедляет вычисления.

Что такое OpenMP?Стандарт OpenMP определяет:интерфейс (API);набор прагм компилятора;переменные окружениядля построения многопоточных

Архитектура OpenMP

Модель исполнения Fork-join

OpenMP программа 1Напишем многопоточную программу, в которой: каждый поток печатает свой

Шаги создания OpenMP программыПодключение заголовочного файла: #include 2. Создание параллельно исполняемого блока

Шаги создания OpenMP программы3. Декларация переменной, собственную копию которой имеет каждый

Шаги создания OpenMP программы3. Получение и печать номера потока: void main(){ int tid; #pragma

Шаги создания OpenMP программы4. Декларация переменной, общей для всех потоков.5. Получение

Шаги создания OpenMP программы6. Исполнение кода только одним потоком: #pragma omp parallel

Шаги создания OpenMP программы7. Компиляция OpenMP программы:В Windows + Microsoft Visual

OpenMP программа 2Напишем многопоточную программу, для поэлементного суммирования двух векторов способами:используя

OpenMP программа 21. Пишем общую часть#include void main () { int i; float

Способ 1. Распределение работы между потоками2. Добавляем параллельную часть#pragma omp parallel

Ограничения в forчисло итераций известно до входа в цикл,итерации независимыИндекс меняется

Способ 2. С использованием секций2. Добавляем параллельную часть#pragma omp parallel shared(a,b,c)

OpenMP программа 3 Напишем многопоточную программу вычисления скалярного произведения векторов.

OpenMP программа 31. Напишем последовательную часть.#include #define N 1000void main(){ int i; float

OpenMP программа 31. Напишем параллельную часть.#pragma omp parallel for \ default(shared) private(i)

OpenMP программа 4Напишем многопоточную программу, для увеличения счетчика на единицу:наивно;с синхронизацией.

Вариант 1. Наивный#include void main(){ int x; x = 0; #pragma omp parallel

Вариант 1. Наивный$ ./plus1 x=977177$ ./plus1 x=975883$ ./plus1 x=980608$ ./plus1 x=979246Получился