Параллельное программирование для ресурсоёмких задач численного моделирования в физике. Лекция 3 презентация

Октябрь 28, 2021

Главная
Информатика
Параллельное программирование для ресурсоёмких задач численного моделирования в физике. Лекция 3

Содержание

2. Лекция № 3
3. Физический факультет МГУ им М.В.Ломоносова Содержание лекции Структура, области применения, этапы разработки и характеристики производительности параллельной
4. Параллельная программа Физический факультет МГУ им М.В.Ломоносова процесс Последовательная программа один поток управления несколько потоков управления
5. Взаимодействие процессов Физический факультет МГУ им М.В.Ломоносова Разделяемые переменные один процесс осуществляет запись в переменную, считываемую
6. Классы приложений Физический факультет МГУ им М.В.Ломоносова Многопоточные системы Распределенные системы Синхронные параллельные вычисления
7. Многопоточные системы Физический факультет МГУ им М.В.Ломоносова Примеры приложений оконные системы на персональных компьютерах или рабочих
8. Распределенные системы Физический факультет МГУ им М.В.Ломоносова Примеры приложений файловые серверы в сети системы баз данных
9. Синхронные параллельные вычисления Физический факультет МГУ им М.В.Ломоносова Примеры приложений научные вычисления, которые моделируют и имитируют
10. Основные классы научных приложений Сеточные вычисления для приближенных решений дифференциальных уравнений в частных производных Точечные вычисления
11. Этапы разработки параллельной программы Последовательная программа выбор наилучшего алгоритма оптимизация Параллельная программа коррекция алгоритма (наилучший параллельный
12. Закон Амдала – время выполнения последовательной программы – время выполнения параллельной программы на n процессорах –
13. Закон Амдала Физический факультет МГУ им М.В.Ломоносова
14. Сетевой закон Амдала – время затрачиваемое на создание процессов и их диспетчеризацию взаимодействие процессов синхронизацию –
15. OpenMP Физический факультет МГУ им М.В.Ломоносова
16. SMP – архитектура SMP ccNUMA – архитектура Обмен данными между процессами через обмен сообщениями (Message Passing
17. Основные принципы OpenMP OpenMP – это интерфейс прикладного программирования для создания многопоточных приложений в вычислительных системах
18. Стандарт OpenMP директивы процедуры переменные среды OpenMP ARB (ARchitecture Board) www.openmp.org для языков Fortran и C/C++
19. Стандарт OpenMP Версии 1.0-2.5 (1997 – 2005) внедрение и развитие потокового распараллеливания циклов Версии 3.0, 3.1
20. Достоинства OpenMP инкрементальное распараллеливание гибкость контроля и единственность разрабатываемого кода эффективность стандартизованность Single Program Multiple Data
21. Модель с разделяемой (общей) памятью Физический факультет МГУ им М.В.Ломоносова
22. Начала программирования в OpenMP В моделях с общей памятью для обмена данными между потоками следует использовать
23. Структура параллельной программы Набор директив компилятора определение параллельной области разделение работы синхронизация Библиотека функций Набор переменных
24. Формат записи директив Формат C/C++ #pragma omp имя_директивы [clause,…] FORTRAN c$omp имя_директивы [clause,…] !$omp имя_директивы [clause,…]
25. Основные конструкции OpenMP Большинство директив OpenMP применяется к структурным блокам. Структурные блоки – это последовательность операторов
26. Порождение нитей PARALLEL [clause,…] ... END PARALLEL (основная директива OpenMP) создается набор (team) из N потоков
27. Порождение нитей FORTRAN C/C++ Физический факультет МГУ им М.В.Ломоносова
28. Определение параллельной области Количество потоков определяется переменной окружения OMP_NUM_THREADS функцией omp_set_num_threads() Каждый поток имеет свой номер
29. Модель выполнения Физический факультет МГУ им М.В.Ломоносова
30. Определение параллельной области Режимы выполнения (Execution Mode) параллельных блоков динамический (Dynamic Mode) – количество потоков определяется
31. Модель памяти Физический факультет МГУ им М.В.Ломоносова *Технология параллельного программирования OpenMP. © Бахтин В.А
32. Директивные предложения (clauses) OpenMP shared(var1, var2, …) переменные var1,… являются общими для всех потоков и относятся
33. Примеры реализации предложений Каждый поток имеет свою собственную копию переменных “x” и “myid” Значение “x” будет
34. Пример реализации предложения firstprivate В каждом параллельном потоке используется своя переменная “c”, но значение этой переменной
35. Пример реализации предложения lastprivate В этом случае переменная “i” определена для каждого потока в параллельном блоке
36. Пример реализации предложения if В этом примере цикл распараллеливается только в том случае ( n>2000 ),
37. Разделение работы (work-sharing constructs) Do/for - распараллеливание циклов (параллелизм данных) Sections - функциональное распараллеливание Single -
38. Конструкции разделения работы to be continued Физический факультет МГУ им М.В.Ломоносова
39. Переменные окружения OpenMP OMP_NUM_THREADS - определяет число нитей для исполнения параллельных областей приложения. OMP_SCHEDULE - определяет
40. Некоторые функции OpenMP (void) omp_set_num_threads(int num_threads) – задает число потоков в области параллельных вычислений int omp_get_num_threads()
41. Пример разделения работы Физический факультет МГУ им М.В.Ломоносова int sum_openmp (int *data, int n) { int
43. Скачать презентацию

Слайд 2

Лекция № 3

Слайд 3

Физический факультет МГУ им М.В.Ломоносова
Содержание лекции
Структура, области применения, этапы разработки и

характеристики производительности параллельной программы
Основные принципы OpenMP

Слайд 4

Параллельная программа
Физический факультет МГУ им М.В.Ломоносова
процесс
Последовательная
программа
один поток управления
несколько потоков управления
Процесс =

последовательная программа
= последовательность операторов

Параллельная
программа

процесс

Слайд 5

Взаимодействие процессов
Физический факультет МГУ им М.В.Ломоносова
Разделяемые переменные
один процесс осуществляет запись в

переменную, считываемую другим процессом
Пересылка сообщений
один процесс отправляет сообщение, которое получает другой

Слайд 6

Классы приложений
Физический факультет МГУ им М.В.Ломоносова
Многопоточные системы
Распределенные системы
Синхронные параллельные вычисления

Слайд 7

Многопоточные системы
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
оконные системы на персональных компьютерах

или рабочих станциях
многопроцессорные операционные системы и системы с разделением времени
системы реального времени, управляющие электростанциями, космическими аппаратами и т.д.
Признаки
число процессов (потоков) больше числа процессоров

Слайд 8

Распределенные системы
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
файловые серверы в сети
системы баз

данных для банков, заказа авиабилетов и т.д.
Web-серверы сети Internet
предпринимательские системы, объединяющие компоненты производства
отказоустойчивые системы, которые продолжают работать независимо от сбоя в компонентах
Признаки
компоненты выполняются на машинах, связанных локальной или глобальной сетью

Слайд 9

Синхронные параллельные вычисления
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
научные вычисления, которые моделируют

и имитируют такие явления, как глобальный климат, эволюция солнечной системы или результат действия нового лекарства
графика и обработка изображений, включая создание спецэффектов в кино
крупные комбинаторные или оптимизационные задачи, например, планирование авиаперелетов или экономическое моделирование
Признаки
количество процессов (потоков) равно числу процессоров
процессы выполняют одни и те же действия, но с собственной частью данных (параллельность по данным), или решают различные задачи (параллельность по задачам)

Слайд 10

Основные классы научных приложений
Сеточные вычисления для приближенных решений дифференциальных уравнений в

частных производных
Точечные вычисления для моделирования систем взаимодействующих тел
Матричные вычисления для решения систем линейных уравнений

Физический факультет МГУ им М.В.Ломоносова

Слайд 11

Этапы разработки параллельной программы
Последовательная программа
выбор наилучшего алгоритма
оптимизация
Параллельная программа
коррекция алгоритма
(наилучший параллельный алгоритм

≠ наилучший последовательный алгоритм)
распределение вычислений между процессами
(производительность определяться временем работы наиболее загруженного процессора)
дизайн взаимодействий и синхронизации между процессами
(необходимо избегать состояния гонок и взаимных блокировок)

Физический факультет МГУ им М.В.Ломоносова

Слайд 12

Закон Амдала
– время выполнения последовательной программы
– время выполнения параллельной программы на

n процессорах

– ускорение параллельной программы

– время выполнения последовательной части алгоритма

– время выполнения параллельной части алгоритма

– доля последовательной части алгоритма

– доля параллельной части алгоритма

Физический факультет МГУ им М.В.Ломоносова

Слайд 13

Закон Амдала
Физический факультет МГУ им М.В.Ломоносова

Слайд 14

Сетевой закон Амдала
– время затрачиваемое на
создание процессов и их диспетчеризацию

взаимодействие процессов
синхронизацию

– доля времени приходящегося на обслуживание
параллельной программы

– время выполнения параллельной программы
на n процессорах

Физический факультет МГУ им М.В.Ломоносова

Слайд 15

OpenMP
Физический факультет МГУ им М.В.Ломоносова

Слайд 16

SMP – архитектура
SMP ccNUMA – архитектура
Обмен данными между процессами через обмен

сообщениями (Message Passing Interface - MPI)
Библиотеки обмена сообщениями (Message Passing Libraries - MPL):
Message Passing Interface – MPI
Parallel Virtual Machine – PVM
Shmem от Cray и SGI

Многопоточное программирование с помощью нитей (threads)
OpenMP – организация нитей с помощью директив компилятора
Обмен данными между процессами через обмен сообщениями (Message Passing Interface - MPI)

MPP – архитектура

Системы с распределенной памятью

Системы с общей памятью

Параллельные архитектуры

Физический факультет МГУ им М.В.Ломоносова

Слайд 17

Основные принципы OpenMP
OpenMP – это интерфейс прикладного программирования для создания многопоточных

приложений в вычислительных системах с общей памятью
OpenMP состоит из набора директив компиляторов и библиотек специальных функций
OpenMP позволяет легко и быстро создавать многопоточные приложения на алгоритмических языках FORTRAN, C, C++
Стандарты OpenMP разрабатывались в течении последних 15 лет, применительно к архитектурам с общей памятью
OpenMP поддерживается следующими основными разработчиками
Оборудования: Intel, HP, SGI, Sun, IBM, …
Системного программного обеспечения: Intel, KAI, PGI, PSR, APR, ...
Прикладного программного обеспечения: ANSYS, Fluent, Oxford Molecular, NAG, DOE ASCI, Dash, Livermore Software, ТЕСИС, ЦГЭ, …

Физический факультет МГУ им М.В.Ломоносова

Слайд 18

Стандарт OpenMP
директивы
процедуры
переменные среды
OpenMP ARB (ARchitecture Board)
www.openmp.org
для языков Fortran и C/C++

- 1997/98 гг.
концепции
X3H5 (ANSI стандарт, 1993) - MPP
POSIX Threads (Ptheads), IEEE 1003.1c, 1995 – Unix

Физический факультет МГУ им М.В.Ломоносова

Слайд 19

Стандарт OpenMP
Версии 1.0-2.5 (1997 – 2005)
внедрение и развитие потокового распараллеливания циклов
Версии

3.0, 3.1 (2008 – 2011)
добавление и развитие поддержки независимых задач
Версия 4.0 (2013), 4.5 (2015)
векторизация циклов (SIMD), поддержка ускорителей (target), …
Версия 5.0 (2018)
task reductions, != в циклах,
полная поддержка специализированных аппаратных ускорителей
поддержка C++11, C++14, and C++17 features
…

Физический факультет МГУ им М.В.Ломоносова

Слайд 20

Достоинства OpenMP
инкрементальное распараллеливание
гибкость контроля и единственность разрабатываемого кода
эффективность
стандартизованность
Single Program Multiple

Data
program parallel
…
if (процесс=мастер) then
master
else
slave
end if
…
end

Физический факультет МГУ им М.В.Ломоносова

Слайд 21

Модель с разделяемой (общей) памятью
Физический факультет МГУ им М.В.Ломоносова

Слайд 22

Начала программирования в OpenMP
В моделях с общей памятью для обмена данными

между потоками следует использовать общие переменные
При этом возможен конфликт при доступе к данным
Для предотвращения таких конфликтов следует использовать процедуру синхронизации (synchronization)
Следует иметь ввиду, что процедура синхронизации очень дорогая операция и ее желательно избегать или применять как можно реже

Физический факультет МГУ им М.В.Ломоносова

Слайд 23

Структура параллельной программы
Набор директив компилятора
определение параллельной области
разделение работы
синхронизация
Библиотека функций
Набор переменных окружения
Физический

факультет МГУ им М.В.Ломоносова

Слайд 24

Формат записи директив
Формат
C/C++
#pragma omp имя_директивы [clause,…]
FORTRAN
c$omp имя_директивы [clause,…]
!$omp имя_директивы [clause,…]
*$omp имя_директивы

[clause,…]
Пример
#pragma omp parallel default(shared) private(beta,pi)

Физический факультет МГУ им М.В.Ломоносова

Слайд 25

Основные конструкции OpenMP
Большинство директив OpenMP применяется к структурным блокам. Структурные блоки

– это последовательность операторов с одной точкой входа в начале блока и одной точкой выхода в конце блока.

Физический факультет МГУ им М.В.Ломоносова

Структурный блок

Неструктурный блок

Слайд 26

Порождение нитей
PARALLEL [clause,…] ... END PARALLEL (основная директива OpenMP)
создается набор

(team) из N потоков (входной поток является основным потоком этого набора (master thread) и имеет номер 0)
Код области дублируется или разделяется между потоками для параллельного выполнения
в конце области синхронизация потоков – выполняется ожидание завершения вычислений всех потоков; дальнейшие вычисления продолжает выполнять только основной поток.

Физический факультет МГУ им М.В.Ломоносова

master

team

fork

join

master

Слайд 27

Порождение нитей
FORTRAN
C/C++
Физический факультет МГУ им М.В.Ломоносова

Слайд 28

Определение параллельной области
Количество потоков определяется
переменной окружения OMP_NUM_THREADS
функцией omp_set_num_threads()
Каждый поток имеет

свой номер thread_number
определяется функцией omp_get_thread_num() - от нуля (главный поток) и до OMP_NUM_THREADS-1)
Каждый поток выполняет структурный блок программы, включенный в параллельный регион
В общем случае синхронизации между потоками нет. После завершения параллельного блока все потоки за исключением главного прекращают свое существование

Физический факультет МГУ им М.В.Ломоносова

Слайд 29

Модель выполнения
Физический факультет МГУ им М.В.Ломоносова

Слайд 30

Определение параллельной области
Режимы выполнения (Execution Mode) параллельных блоков
динамический (Dynamic Mode) –

количество потоков определяется ОС
переменная окружения OMP_DYNAMIC
функция omp_set_dynamic()
статический (Static Mode) – количество потоков определяется программистом
переменная окружения OMP_STATIC
функция omp_set_static()
Возможна вложенность параллельных структурных блоков (во многих реализациях не обеспечивается)
по умолчанию во вложенной области создается один поток
управление - функция omp_set_nested() или переменная OMP_NESTED

Физический факультет МГУ им М.В.Ломоносова

Слайд 31

Слайд 32

Директивные предложения (clauses) OpenMP
shared(var1, var2, …)
переменные var1,… являются общими для всех

потоков и относятся к одной области памяти
private(var1, var2, …)
переменные var1, var2,… имеют собственные значения внутри каждого потока и относятся к разным областям памяти
firstprivate(var1, var2, …)
переменные имеют тип private и инициализируются в начале структурного блока
lastprivate(var1, var2, …)
переменные имеют тип private и сохраняют свои значения при выходе из структурного блока
if(condition)
следующий параллельный блок выполняется только в том случае, если condition=TRUE
default(shared|private|none)
определяет по умолчанию тип всех переменных определяемых по умолчанию в следующем параллельном структурном блоке
schedule (type [,chunk])
определяет распределение петель циклов по потокам
reduction (operator | intrinsic: var1, var2, …)
гарантирует безопасное вычисление разностей, сумм, произведений и т.д. (operator задает операцию) по петлям циклов

Физический факультет МГУ им М.В.Ломоносова

Слайд 33

Примеры реализации предложений
Каждый поток имеет свою собственную копию переменных “x” и

“myid”
Значение “x” будет неопределенным, если не определить “x” как private
Значения private-переменных не определены до и после блока параллельных вычислений
Описание default автоматически определяет переменные “x” и “myid” как private

Физический факультет МГУ им М.В.Ломоносова

private

default

Слайд 34

Пример реализации предложения firstprivate
В каждом параллельном потоке используется своя переменная “c”,

но значение этой переменной перед входом в параллельный блок программы берется из предшествующего последовательного блока

Физический факультет МГУ им М.В.Ломоносова

Слайд 35

Пример реализации предложения lastprivate
В этом случае переменная “i” определена для каждого

потока в параллельном блоке
После завершения параллельного блока переменная “i” сохраняет последнее значение, полученное в параллельном блоке, при условии его последовательного выполнения, т.е. n=N+1

Физический факультет МГУ им М.В.Ломоносова

Слайд 36

Пример реализации предложения if
В этом примере цикл распараллеливается только в том

случае ( n>2000 ), когда параллельная версия будет заведомо быстрее последовательной !!!
Трудоемкость образования потоков ~ 1000 операций деления!!!

Физический факультет МГУ им М.В.Ломоносова

Слайд 37

Разделение работы (work-sharing constructs)
Do/for - распараллеливание циклов (параллелизм данных)
Sections -

функциональное распараллеливание
Single - директива для указания последовательного выполнения кода

Физический факультет МГУ им М.В.Ломоносова

Слайд 38

Конструкции разделения работы
to be continued
Физический факультет МГУ им М.В.Ломоносова

Слайд 39

Переменные окружения OpenMP
OMP_NUM_THREADS - определяет число нитей для исполнения параллельных областей

приложения.
OMP_SCHEDULE - определяет способ распределения итераций в цикле, если в директиве DO использовано предложение SCHEDULE(RUNTIME).
OMP_DYNAMIC - разрешает или запрещает динамическое изменение числа нитей.
OMP_NESTED - разрешает или запрещает вложенный параллелизм.

Пример

Физический факультет МГУ им М.В.Ломоносова

Слайд 40

Некоторые функции OpenMP
(void) omp_set_num_threads(int num_threads) – задает число потоков в области

параллельных вычислений
int omp_get_num_threads() – возвращает количество потоков в текущий момент
int omp_get_max_threads() – возвращает максимальное количество потоков, которое может быть возвращено функцией omp_get_num_threads
int omp_get_thread_num() – возвращает номер потока от 0 до количество потоков - 1
int omp_get_num_procs() – возвращает количество процессоров доступных программе
(int/logical) omp_in_parallel() – возвращает TRUE из параллельной области программы и FALSE из последовательной
(void) omp_set_dynamic( TRUE | FALSE ) – определяет или отменяет динамический режим
(int/logical) omp_get_dynamic() – возвращает TRUE, если режим динамический, и FALSE в противном случае
(void) omp_set_nested( TRUE | FALSE ) – определяет или отменяет вложенный режим для параллельной обработки
(int/logical) omp_get_nested() – возвращает TRUE, если режим вложенный, и FALSE в противном случае
http://www.openmp.org/specifications/

Физический факультет МГУ им М.В.Ломоносова

Слайд 41

Пример разделения работы
Физический факультет МГУ им М.В.Ломоносова
int sum_openmp (int *data, int

n)
{
int res = 0; // результат
int max_num_th = omp_get_max_threads(); // максимальное число потоков
int* sub_sum = new int[max_num_th](); // массив частичных сумм
int id = 0;
#pragma omp parallel shared(sub_sum, n) private (id)
{
id = omp_get_thread_num(); // уникальный номер
int num_th = omp_get_num_threads(); //реальное число потоков
int portion = n/num_th; // порция на поток
int i_start= portion *id, i_end = i_start + portion;
int modulus = n%num_th;
// коррекция порции
if (id < modulus ) {
i_start += id, i_end += id + 1;
} else {
i_start += modulus , i_end += modulus ;
}
// расчёт частичных сумм
for (int i = i_start; i < i_end; i++) sub_sum[id] += data[i];
}
// расчёт полной суммы
for (id = 0; id < max_num_th; id++) res += sub_sum[id] ;
delete[] sub_sum;
return res;
}

6 threads

data[94]

Параллельное программирование для ресурсоёмких задач численного моделирования в физике. Лекция 3 презентация

Содержание

Лекция № 3

Физический факультет МГУ им М.В.ЛомоносоваСодержание лекцииСтруктура, области применения, этапы разработки и

Параллельная программаФизический факультет МГУ им М.В.ЛомоносовапроцессПоследовательнаяпрограммаодин поток управлениянесколько потоков управленияПроцесс =

Взаимодействие процессовФизический факультет МГУ им М.В.ЛомоносоваРазделяемые переменные один процесс осуществляет запись в

Классы приложенийФизический факультет МГУ им М.В.ЛомоносоваМногопоточные системыРаспределенные системыСинхронные параллельные вычисления

Многопоточные системыФизический факультет МГУ им М.В.ЛомоносоваПримеры приложенийоконные системы на персональных компьютерах

Распределенные системыФизический факультет МГУ им М.В.ЛомоносоваПримеры приложенийфайловые серверы в сетисистемы баз

Синхронные параллельные вычисленияФизический факультет МГУ им М.В.ЛомоносоваПримеры приложенийнаучные вычисления, которые моделируют

Основные классы научных приложенийСеточные вычисления для приближенных решений дифференциальных уравнений в

Закон Амдала– время выполнения последовательной программы– время выполнения параллельной программы на

Закон АмдалаФизический факультет МГУ им М.В.Ломоносова

Сетевой закон Амдала– время затрачиваемое на создание процессов и их диспетчеризацию

OpenMP Физический факультет МГУ им М.В.Ломоносова

SMP – архитектураSMP ccNUMA – архитектураОбмен данными между процессами через обмен

Основные принципы OpenMPOpenMP – это интерфейс прикладного программирования для создания многопоточных

Стандарт OpenMPдирективыпроцедурыпеременные средыOpenMP ARB (ARchitecture Board) www.openmp.orgдля языков Fortran и C/C++

Стандарт OpenMPВерсии 1.0-2.5 (1997 – 2005)внедрение и развитие потокового распараллеливания цикловВерсии

Достоинства OpenMPинкрементальное распараллеливание гибкость контроля и единственность разрабатываемого кодаэффективностьстандартизованностьSingle Program Multiple

Модель с разделяемой (общей) памятьюФизический факультет МГУ им М.В.Ломоносова

Начала программирования в OpenMPВ моделях с общей памятью для обмена данными

Формат записи директивФорматC/C++ #pragma omp имя_директивы [clause,…]FORTRANc$omp имя_директивы [clause,…]!$omp имя_директивы [clause,…]*$omp имя_директивы

Основные конструкции OpenMPБольшинство директив OpenMP применяется к структурным блокам. Структурные блоки

Порождение нитей PARALLEL [clause,…] ... END PARALLEL (основная директива OpenMP)создается набор

Порождение нитей FORTRANC/C++Физический факультет МГУ им М.В.Ломоносова

Определение параллельной областиКоличество потоков определяется переменной окружения OMP_NUM_THREADS функцией omp_set_num_threads()Каждый поток имеет

Модель выполненияФизический факультет МГУ им М.В.Ломоносова

Определение параллельной областиРежимы выполнения (Execution Mode) параллельных блоковдинамический (Dynamic Mode) –

Модель памятиФизический факультет МГУ им М.В.Ломоносова*Технология параллельного программирования OpenMP. © Бахтин В.А

Директивные предложения (clauses) OpenMPshared(var1, var2, …) переменные var1,… являются общими для всех

Примеры реализации предложенийКаждый поток имеет свою собственную копию переменных “x” и

Пример реализации предложения firstprivate В каждом параллельном потоке используется своя переменная “c”,

Пример реализации предложения lastprivateВ этом случае переменная “i” определена для каждого

Пример реализации предложения ifВ этом примере цикл распараллеливается только в том

Разделение работы (work-sharing constructs)Do/for - распараллеливание циклов (параллелизм данных) Sections -

Конструкции разделения работыto be continuedФизический факультет МГУ им М.В.Ломоносова

Переменные окружения OpenMPOMP_NUM_THREADS - определяет число нитей для исполнения параллельных областей

Некоторые функции OpenMP(void) omp_set_num_threads(int num_threads) – задает число потоков в области

Пример разделения работыФизический факультет МГУ им М.В.Ломоносоваint sum_openmp (int *data, int

Похожие презентации

Физический факультет МГУ им М.В.Ломоносова
Содержание лекции
Структура, области применения, этапы разработки и

Взаимодействие процессов
Физический факультет МГУ им М.В.Ломоносова
Разделяемые переменные
один процесс осуществляет запись в

Классы приложений
Физический факультет МГУ им М.В.Ломоносова
Многопоточные системы
Распределенные системы
Синхронные параллельные вычисления

Многопоточные системы
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
оконные системы на персональных компьютерах

Распределенные системы
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
файловые серверы в сети
системы баз

Синхронные параллельные вычисления
Физический факультет МГУ им М.В.Ломоносова
Примеры приложений
научные вычисления, которые моделируют

Основные классы научных приложений
Сеточные вычисления для приближенных решений дифференциальных уравнений в

Закон Амдала
– время выполнения последовательной программы
– время выполнения параллельной программы на

Закон Амдала
Физический факультет МГУ им М.В.Ломоносова

Сетевой закон Амдала
– время затрачиваемое на
создание процессов и их диспетчеризацию

OpenMP
Физический факультет МГУ им М.В.Ломоносова

SMP – архитектура
SMP ccNUMA – архитектура
Обмен данными между процессами через обмен

Основные принципы OpenMP
OpenMP – это интерфейс прикладного программирования для создания многопоточных

Стандарт OpenMP
директивы
процедуры
переменные среды
OpenMP ARB (ARchitecture Board)
www.openmp.org
для языков Fortran и C/C++

Стандарт OpenMP
Версии 1.0-2.5 (1997 – 2005)
внедрение и развитие потокового распараллеливания циклов
Версии

Достоинства OpenMP
инкрементальное распараллеливание
гибкость контроля и единственность разрабатываемого кода
эффективность
стандартизованность
Single Program Multiple

Модель с разделяемой (общей) памятью
Физический факультет МГУ им М.В.Ломоносова

Начала программирования в OpenMP
В моделях с общей памятью для обмена данными

Формат записи директив
Формат
C/C++
#pragma omp имя_директивы [clause,…]
FORTRAN
c$omp имя_директивы [clause,…]
!$omp имя_директивы [clause,…]
*$omp имя_директивы

Основные конструкции OpenMP
Большинство директив OpenMP применяется к структурным блокам. Структурные блоки

Порождение нитей
PARALLEL [clause,…] ... END PARALLEL (основная директива OpenMP)
создается набор

Порождение нитей
FORTRAN
C/C++
Физический факультет МГУ им М.В.Ломоносова

Определение параллельной области
Количество потоков определяется
переменной окружения OMP_NUM_THREADS
функцией omp_set_num_threads()
Каждый поток имеет

Модель выполнения
Физический факультет МГУ им М.В.Ломоносова

Определение параллельной области
Режимы выполнения (Execution Mode) параллельных блоков
динамический (Dynamic Mode) –

Модель памяти
Физический факультет МГУ им М.В.Ломоносова
*Технология параллельного программирования OpenMP. © Бахтин В.А

Директивные предложения (clauses) OpenMP
shared(var1, var2, …)
переменные var1,… являются общими для всех

Примеры реализации предложений
Каждый поток имеет свою собственную копию переменных “x” и

Пример реализации предложения firstprivate
В каждом параллельном потоке используется своя переменная “c”,

Пример реализации предложения lastprivate
В этом случае переменная “i” определена для каждого

Пример реализации предложения if
В этом примере цикл распараллеливается только в том

Разделение работы (work-sharing constructs)
Do/for - распараллеливание циклов (параллелизм данных)
Sections -

Конструкции разделения работы
to be continued
Физический факультет МГУ им М.В.Ломоносова

Переменные окружения OpenMP
OMP_NUM_THREADS - определяет число нитей для исполнения параллельных областей

Некоторые функции OpenMP
(void) omp_set_num_threads(int num_threads) – задает число потоков в области

Пример разделения работы
Физический факультет МГУ им М.В.Ломоносова
int sum_openmp (int *data, int