OpenMP. Параллельное программирование для многоядерных систем презентация

Ноябрь 20, 2021

Главная
Информатика
OpenMP. Параллельное программирование для многоядерных систем

Содержание

2. Концепция OpenMP Интерфейс OpenMP задуман как стандарт параллельного программирования для многопроцессорных систем с общей памятью
3. Положительные качества OpenMP Поэтапное распараллеливание Можно распараллеливать последовательные программы поэтапно, не меняя их структуру Единственность разрабатываемого
4. Принципы организации параллелизма Использование потоков на общем адресном пространстве Пульсирующий (fork-join) параллелизм
5. Принципы организации параллелизма При выполнении обычного кода (вне параллельных областей) программа исполняется одним потоком (master thread)
6. Когда следует использовать технологию Open MP Целевая платформа является многопроцессорной или многоядерной Выполнение циклов нужно распараллелить
7. Когда эффективно использовать технологию Open MP Параллельная версия настигает по быстродействию последовательную или при большом количестве
8. Настройки компилятора Microsoft Visual Studio Project ? ?Property Pages ? C/C++ ? Language ?OpenMP Support ?Yes
9. Средства openMP Категории: Функции времени выполнения Функции инициализации/завершения Переменные среды окружения Параллельные регионы Распределение работ и
10. Структура программы #include int main(){ // по умолчанию кол-во потоков: int numTh = omp_get_num_threads(); // сами
11. Простейшая программа #include #include int main (int argc, char * argv[]) { #pragma omp parallel {
12. Простейшая программа – результат работы
13. Простейшие директивы OpenMP #pragma omp parallel { } // выполнится столько раз, сколько потоков #pragma omp
14. Ограничения на оператор for OpenMP 1. Переменная цикла должна иметь тип integer. 2. Цикл должен являться
15. Пример 1 #pragma omp parallel num_threads(2) for (int i = 0; i myFunc(); // при запуске
16. Пример 1-а (parallel без указания количества потоков) #pragma omp parallel for (int i = 0; i
17. Пример 2 (ошибка!) #pragma omp parallel num_threads(2) { ... // N строк кода #pragma omp parallel
18. Пример 2 - правильно #pragma omp parallel num_threads(2) { ... // N строк кода #pragma omp
19. Ограничение на переопределение количества потоков Количество потоков нельзя переопределять внутри параллельной секции. Это приводит к ошибкам
20. Планирование и разбиение циклов Static scheduling – цикл делится на фрагменты одинакового размера Dynamic scheduling –
21. Планирование и разбиение циклов (Static scheduling - пример работы) int s; #pragma omp parallel for private
22. Планирование и разбиение циклов (Static scheduling - пример работы)
23. Планирование и разбиение циклов (Dinamic scheduling - пример работы) int s; #pragma omp parallel for private
24. Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 2)
25. Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 1)
26. Dinamic scheduling - пример работы для быстрых операций во втором потоке и медленных в первом
27. Вывод данных в консоль в параллельных потоках - операция ОЧЕНЬ опасная!!! Операция вывода строки на экран
28. Вывод данных в консоль в параллельных потоках надо оградить блокировкой #pragma omp parallel num_threads(2) { #pragma
29. Гонки данных Незащищенный доступ к общей памяти double data; #pragma omp parallel for for (int i
30. ПРИЧИНА: все глобальные переменные в OpenMP считаются shared по умолчанию/ РЕШЕНИЕ (первый вариант): просто объявлять соответствующие
31. Приватные переменные - метод борьбы с гонками данных double data; #pragma omp parallel for for (int
32. Локальные переменные становятся приватными – первый вариант решения // double data; // удалили внешнее объявление! #pragma
33. Явно указанные приватные переменные – решение, эквивалентное по результату double data; #pragma omp parallel for private(data)
34. Приватные переменные – возможные ошибки 1. При входе в поток для переменных, являющиеся параметрами выражений private,
35. Приватные переменные – ограничения Переменная в выражении private не должна иметь ссылочный тип. Причина ограничения очевидна
36. Правила разделения переменных (1) Неявное правило 1: Все переменные, определенные вне omp parallel, являются глобальными для
37. Правила разделения переменных (2) Явное правило 1: Переменные, приведенные в shared(), являются глобальными для всех потоков
38. Параллельные секции #pragma omp parallel sections // создан параллельный регион секций { #pragma omp section #pragma
39. Параллельные секции Директива sections – распределение вычислений для раздельных фрагментов кода Фрагменты выделяются при помощи директивы
40. Редукции в циклах int sum =0; #pragma omp parallel for reduction (+ sum) { for (int
41. Редукции в циклах Параметр reduction определяет список переменных, для которых выполняется операция редукции перед выполнением параллельной
42. Барьеры int sum =0; #pragma omp parallel for reduction (+ sum) { for (int i=0; i
43. Барьеры и nowait В некоторых случаях возникает потребность отключать синхронизацию, Для этого существует оператор nowait Это
44. Барьеры и nowait #pragma omp parallel { #pragma omp for nowait for(int i = 0; i
45. Барьеры и nowait В рассмотренном примере потоки, которые освободились после обработки первого цикла, переходят к обработке
46. Критические секции С помощью критических разделов можно предотвратить одновременный доступ к одному сегменту кода из нескольких
47. Критические секции Применение критических секций там, где они не нужны, нежелательно : из-за критических секций потокам
48. Выполнение в одном потоке внутри параллельного фрагмента #pragma omp parallel num_threads(4) { … // что-то выполняем
49. Выполнение в одном потоке внутри параллельного фрагмента Потоков 4, но сообщение выдано только одним потоком !
50. Два базовых типа конструкций OpenMP Директивы #pragma Функции исполняющей среды OpenMP Функции OpenMP служат в основном
51. Прагмы синхронизации #pragma omp single – исполняет следующую команду только с помощью одного (случайного) потока #pragma
52. Критическая секция #pragma omp parallel for schedule(static) for (int i = 0; i PerformSomeComputation(i); // внутри
53. Критическая секция Избежать ситуацию возникновения гонки за ресурсами позволяет использование критических секций: void PerformSomeComputation(int i) {
54. Критическая секция #pragma omp critical позволяет только одному потоку выполнить операцию даже внутри параллельного фрагмента int
55. Библиотека функций void omp_set_num_threads(int numThreads) Позволяет назначить максимальное число потоков для использования в следующей параллельной области
56. Библиотека функций int omp_get_max_threads() Возвращает максимальное число потоков int omp_get_num_threads() Возвращает фактическое число потоков в параллельной
57. Библиотека функций int omp_get_thread_num() Возвращает номер потока int omp_get_num_procs() Возвращает число процессоров, доступных приложению
58. Библиотека функций int omp_in_parallel() Возвращает true, если вызвана из параллельной области программы
59. Библиотека функций Блокировки omp_lock_t myLock; omp_init_lock( &myLock ); omp_set_lock( &myLock ); omp_unset_lock( &myLock ); omp_test_lock (
60. Правильный код блокировки omp_lock_t myLock; omp_init_lock(&myLock); #pragma omp parallel sections { #pragma omp section { ...
62. Скачать презентацию

Слайд 2

Концепция OpenMP
Интерфейс OpenMP задуман как стандарт параллельного программирования для многопроцессорных систем

с общей памятью

Слайд 3

Положительные качества OpenMP
Поэтапное распараллеливание
Можно распараллеливать последовательные программы поэтапно, не меняя их

структуру
Единственность разрабатываемого кода
Нет необходимости поддерживать последовательный и параллельный вариант программы, поскольку директивы игнорируются обычными компиляторами (в общем случае)
Переносимость
Поддержка большим числом компиляторов под разные платформы и ОС, стандарт для распространенных языков C/C++, Fortran

Слайд 4

Принципы организации параллелизма
Использование потоков на общем адресном пространстве
Пульсирующий (fork-join) параллелизм

Слайд 5

Принципы организации параллелизма
При выполнении обычного кода (вне параллельных областей) программа исполняется

одним потоком (master thread)
При появлении директивы #parallel происходит создание “команды” потоков для параллельного выполнения вычислений
После выхода из области действия директивы #parallel происходит синхронизация, все потоки, кроме master, уничтожаются
Продолжается последовательное выполнение кода (до очередного появления директивы #parallel)

Слайд 6

Когда следует использовать технологию Open MP
Целевая платформа является многопроцессорной или

многоядерной
Выполнение циклов нужно распараллелить
Перед выпуском приложения нужно повысить его быстродействие
Параллельное приложение должно быть кроссплатформенным

Слайд 7

Когда эффективно использовать технологию Open MP
Параллельная версия настигает по быстродействию последовательную

или при большом количестве итераций или при большом объеме вычислений внутри параллельных фрагментов кода

Слайд 8

Настройки компилятора Microsoft Visual Studio
Project ?
?Property Pages
? C/C++
? Language
?OpenMP Support
?Yes

Слайд 9

Средства openMP
Категории:
Функции времени выполнения
Функции инициализации/завершения
Переменные среды окружения
Параллельные регионы
Распределение работ и диспетчеризация
Синхронизация

и блокировка

Слайд 10

Структура программы
#include
int main(){
// по умолчанию кол-во потоков:
int numTh

= omp_get_num_threads();
// сами ставим кол-во потоков
omp_set_num_threads(4);
#pragma omp parallel
…
return 0;
}

Слайд 11

Простейшая программа
#include
#include
int main (int argc, char * argv[]) {

#pragma omp parallel
{
printf("Hello world\n");
}
printf("\nset num_threads=16\n");
omp_set_num_threads(16);
#pragma omp parallel
{
printf("Hello world\n");
}
return 0;
}

Слайд 12

Простейшая программа – результат работы

Слайд 13

Простейшие директивы OpenMP
#pragma omp parallel
{
<код>
}
// выполнится столько раз, сколько потоков
#pragma

omp parallel for
for (int i=0; i <код>
}
// выполнится n раз с разделением нагрузки между потокам

Слайд 14

Ограничения на оператор for OpenMP
1. Переменная цикла должна иметь тип integer.

2. Цикл должен являться базовым блоком и не может использовать goto и break (за исключением оператора exit, который завершает все приложение). 3. Инкрементная часть цикла for должна являться либо целочисленным сложением, либо целочисленным вычитанием. 4. Если используется операция сравнения < или <=, переменная цикла должна увеличиваться при каждой итерации, а при использовании операции > или >= переменная цикла должна уменьшаться.

Слайд 15

Пример 1
#pragma omp parallel num_threads(2)
for (int i = 0; i <

10; i++)
     myFunc();
// при запуске будет выполняться по одному разу в
// каждом потоке, и вместо ожидаемых 10 раз
// функция myFunc будет вызвана 20 раз.
#pragma omp parallel for num_threads(2)
  for (int i = 0; i < 10; i++)
    myFunc();
// цикл будет выполнен 10 раз, разделенный
// между двумя потоками

Слайд 16

Пример 1-а (parallel без указания количества потоков)
#pragma omp parallel
for (int i

= 0; i < 10; i++)
     myFunc();
// при запуске будет выполняться по одному разу в
// каждом потоке, и вместо ожидаемых 10 раз
// функция myFunc будет вызвана 20 раз при двух процессорах
#pragma omp parallel for
  for (int i = 0; i < 10; i++)
    myFunc();
// цикл будет выполнен 10 раз, разделенный
// между двумя потоками на двухпроцессорном компьютере

Слайд 17

$Пример 2 (ошибка!) #pragma omp parallel num_threads(2) { ... //$

Пример 2 (ошибка!)
#pragma omp parallel num_threads(2)
{
    ... // N строк кода
    #pragma omp

parallel for
    for (int i = 0; i < 10; i++)    {
                    myFunc();
    }
  }
// в двух потоках выполнятся два
// параллельных цикла
// функция myFunc будет вызвана 20 раз.

Слайд 18

$Пример 2 - правильно #pragma omp parallel num_threads(2) { ...$

Пример 2 - правильно
#pragma omp parallel num_threads(2)
{
    ... // N строк кода
    #pragma

omp for
    for (int i = 0; i < 10; i++)    {
                    myFunc();
    }
  }

Слайд 19

Ограничение на переопределение количества потоков
Количество потоков нельзя переопределять внутри параллельной секции.

Это приводит к ошибкам во время выполнения программы и ее аварийному завершению.
#pragma omp parallel
  {
    omp_set_num_threads(2); // ощибка !!!!
    #pragma omp for
    for (int i = 0; i < 10; i++)
                    myFunc();
  }

Слайд 20

Планирование и разбиение циклов
Static scheduling – цикл делится на фрагменты
одинакового

размера
Dynamic scheduling – фрагменты помещаются
в очередь, освободившийся
поток будет брать
следующую «порцию».
Guided scheduling == Dynamic scheduling
с изменяемым размером
фрагмента в процессе выполнения

Слайд 21

Планирование и разбиение циклов (Static scheduling - пример работы)
int s;
#pragma omp parallel

for private (s)
for (int i=0; i<10; i++){
s = omp_get_thread_num();
Sleep(1000*i);
printf("Hello world from thread = %d\n",s);
}

Слайд 22

Планирование и разбиение циклов (Static scheduling - пример работы)

Слайд 23

Планирование и разбиение циклов (Dinamic scheduling - пример работы)
int s;
#pragma omp parallel

for private (s)schedule(dynamic, 2)
for (int i=0; i<10; i++){
s = omp_get_thread_num();
Sleep(1000*i);
printf("Hello world from thread = %d\n",s);
}

Слайд 24

Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 2)

Слайд 25

Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 1)

Слайд 26

Dinamic scheduling - пример работы для быстрых операций во втором потоке

и медленных в первом

Слайд 27

Вывод данных в консоль в параллельных потоках - операция ОЧЕНЬ опасная!!! Операция

вывода строки на экран не является атомарной. Следовательно, два потока будут выводить свои символы одновременно. Возможны гонки данных

Слайд 28

Вывод данных в консоль в параллельных потоках надо оградить блокировкой
#pragma

omp parallel num_threads(2) { #pragma omp critical { printf("Hello World \n"); }

Слайд 29

Гонки данных Незащищенный доступ к общей памяти
double data;
#pragma omp parallel for

     for (int i = 0; i < 10; i++)    {
data=array[i];
                   array[i] = func(data);
// гонки данных!!
// переменная data одна для всех потоков
    }

Слайд 30

ПРИЧИНА:
все глобальные переменные в OpenMP
считаются shared по умолчанию/
РЕШЕНИЕ (первый вариант):
просто

объявлять соответствующие переменные как локальные переменные в параллельных секциях.

Гонки данных Незащищенный доступ к общей памяти

Слайд 31

Приватные переменные - метод борьбы с гонками данных
double data;
#pragma omp parallel for

     for (int i = 0; i < 10; i++)    {
data=array[i]; ? заменим код
                   array[i] = func(data);
// гонки данных!!
    }

Слайд 32

Локальные переменные становятся приватными – первый вариант решения
// double data; //

удалили внешнее объявление!
#pragma omp parallel for
     for (int i = 0; i < 10; i++)    {
double data=array[i];
                   array[i] = func(data);
// переменная, объявленная внутри
// параллельной конструкции – приватная
}

Слайд 33

Явно указанные приватные переменные – решение, эквивалентное по результату
double data;
#pragma omp

parallel for private(data)
     for (int i = 0; i < 10; i++)    {
data=array[i];
// переменная объявлена приватной в потоке
// гонки данных отсутствуют!!
                   array[i] = func(data);
    }

Слайд 34

Приватные переменные – возможные ошибки
1. При входе в поток для переменных,

являющиеся параметрами выражений private, создаются локальные копии. Эти копии являются неинициализированными по умолчанию. Следовательно, любая попытка работы с ними без предварительной инициализации приведет к ошибке во время выполнения программы.
2. Забытое выражение private и работа с переменной вне параллельной секции. Значения таких переменных после соответствующей параллельной секции являются непредсказуемыми.

Слайд 35

Приватные переменные – ограничения
Переменная в выражении private не должна иметь ссылочный

тип.
Причина ограничения очевидна – если переменная будет указателем, то каждый поток получит по локальной копии этого указателя, и в результате все потоки будут работать через него с общей памятью.

Слайд 36

Правила разделения переменных (1)
Неявное правило 1: Все переменные, определенные вне omp

parallel, являются глобальными для всех потоков
Неявное правило 2: Все переменные, определенные внутри omp parallel, являются локальными для каждого потока
Неявное исключение: В прагме omp for, счетчик цикла всегда локален для каждого потока

Слайд 37

Правила разделения переменных (2)
Явное правило 1: Переменные, приведенные в shared(), являются

глобальными для всех потоков
Явное правило 2: Переменные, приведенные в private(), являются локальными для каждого потока

Слайд 38

Параллельные секции
#pragma omp parallel sections
// создан параллельный регион секций
{
#pragma omp section
<код>
#pragma

omp section
<код>
}
// все секции выполняются одновременно в
// разных потоках

Слайд 39

Параллельные секции
Директива sections – распределение вычислений для раздельных фрагментов кода

Фрагменты выделяются при помощи директивы section
Каждый фрагмент выполняется однократно
Разные фрагменты выполняются разными потоками
Завершение директивы по умолчанию синхронизируется
Директивы section должны использоваться только в статическом контексте

Слайд 40

Редукции в циклах
int sum =0;
#pragma omp parallel for reduction (+ sum)
{
for

(int i=0; i<1000; i++)
sum = sum + func(i);
}
// reduction означает:
// -- создание приватной копии sum в
// каждом потоке
// -- после завершения цикла сложение
// значений всех приватных копий в sum

Слайд 41

Редукции в циклах
Параметр reduction определяет список переменных, для которых выполняется операция

редукции
перед выполнением параллельной области для каждого потока создаются копии этих переменных,
потоки формируют значения в своих локальных переменных
при завершении параллельной области над всеми локальными значениями выполняются необходимые операции редукции, результаты которых запоминаются в исходных (глобальных) переменных

Слайд 42

Барьеры
int sum =0;
#pragma omp parallel for reduction (+ sum)
{
for (int i=0;

i<1000; i++)
sum = sum + func(i);
}
// продолжение работы возможно только
// только при завершении всех потоков
// барьер == конец parallel for
// барьер == конец parallel sections

Слайд 43

Барьеры и nowait
В некоторых случаях возникает потребность отключать синхронизацию,
Для этого

существует оператор nowait
Это может быть выгодно, если за циклом следует второй цикл, данные в котором НЕ ЗАВИСЯТ от результатов первого цикла.

Слайд 44

Барьеры и nowait
#pragma omp parallel { #pragma omp for nowait for(int i =

0; i < 5000; i++) { // … } #pragma omp for for(int j = 0; j < 1000; j++) { // … } #pragma omp barrier // здесь ждем завершения some_func(); // код после барьера
}

Слайд 45

Барьеры и nowait
В рассмотренном примере потоки, которые освободились после обработки первого

цикла, переходят к обработке второго цикла без ожидания остальных потоков.
В некоторых случаях это может повысить производительность, поскольку уменьшается время простоя потоков.
#pragma omp barrier
Создание барьера после nowait

Слайд 46

Критические секции
С помощью критических разделов можно предотвратить одновременный доступ к одному

сегменту кода из нескольких потоков. Один поток получает доступ только тогда, когда другие не обрабатывают данный код. Конструкция имеет следующий вид:
#pragma omp critical { … }

Слайд 47

Критические секции
Применение критических секций там, где они не нужны, нежелательно

:
из-за критических секций потокам приходится ждать друг друга, а это уменьшает приращение производительности, достигнутое благодаря распараллеливанию кода,
на вход в критические секции и на выход из них также затрачивается некоторое время.

Слайд 48

Выполнение в одном потоке внутри параллельного фрагмента
#pragma omp parallel num_threads(4)

{ … // что-то выполняем параллельно в 4 потоках
#pragma omp single {
int numTh = omp_get_num_threads();
cout <<"\n”< }
} //Директива single означает, что соответствующая секция должна быть выполнена одним потоком. Этим потоком с равной вероятностью может оказаться любой из существующих

Слайд 49

Выполнение в одном потоке внутри параллельного фрагмента
Потоков 4, но сообщение выдано

только одним потоком !

Слайд 50

Два базовых типа конструкций OpenMP
Директивы #pragma
Функции исполняющей среды

OpenMP
Функции OpenMP служат в основном для изменения и получения параметров среды. Кроме того, OpenMP включает API-функции для поддержки некоторых типов синхронизации.

Слайд 51

Прагмы синхронизации
#pragma omp single – исполняет следующую команду только с помощью

одного (случайного) потока
#pragma omp barrier – удерживает потоки в этом месте, пока все потоки не дойдут до него
#pragma omp atomic – атомарно исполняет следующую операцию доступа к памяти (т.е. без прерывания от других ветвей)
#pragma omp critical [имя потока] – позволяет только одному потоку перейти к исполнению следующей команды

Слайд 52

Критическая секция
#pragma omp parallel for schedule(static)
for (int i = 0; i

< N; i++)
PerformSomeComputation(i);
// внутри этой функции плохой код
ОШИБКА!
Функция PerformSomeComputation изменяет значение глобальной переменной – гонка данных
int global = 0;
void PerformSomeComputation(int i) {
global += i;
}

Слайд 53

Критическая секция
Избежать ситуацию возникновения гонки за ресурсами позволяет использование критических секций:
void

PerformSomeComputation(int i) {
#pragma omp critical
{
global += i;
}
}

Слайд 54

Критическая секция
#pragma omp critical позволяет только одному потоку выполнить операцию даже

внутри параллельного фрагмента
int a[MAXN], sum=0;
#pragma omp parallel for
for (int i = 0; i < N; i++)
{
#pragma omp critical
sum +- a[i];
}

Слайд 55

Библиотека функций
void omp_set_num_threads(int numThreads)
Позволяет назначить максимальное число потоков для использования в

следующей параллельной области (если это число разрешено менять динамически). Вызывается из последовательной области программы

Слайд 56

Библиотека функций
int omp_get_max_threads()
Возвращает максимальное число потоков
int omp_get_num_threads()
Возвращает фактическое число потоков в

параллельной области программы

Слайд 57

Библиотека функций
int omp_get_thread_num()
Возвращает номер потока
int omp_get_num_procs()
Возвращает число процессоров, доступных приложению

Слайд 58

Библиотека функций
int omp_in_parallel()
Возвращает true, если вызвана из параллельной области программы

Слайд 59

Библиотека функций

Блокировки
omp_lock_t myLock;
omp_init_lock( &myLock );
omp_set_lock( &myLock );
omp_unset_lock(

&myLock );
omp_test_lock ( &myLock );
...

Слайд 60

Правильный код блокировки
omp_lock_t myLock;
omp_init_lock(&myLock);
#pragma omp parallel sections
  {
    #pragma omp section
    {        ...
        omp_set_lock(&myLock);        ...
        omp_unset_lock(&myLock);        ...
    }
    #pragma omp

section
    {        ...
        omp_set_lock(&myLock);        ...
        omp_unset_lock(&myLock);        ...
    }
  }

OpenMP. Параллельное программирование для многоядерных систем презентация

Содержание

Концепция OpenMPИнтерфейс OpenMP задуман как стандарт параллельного программирования для многопроцессорных систем

Положительные качества OpenMPПоэтапное распараллеливаниеМожно распараллеливать последовательные программы поэтапно, не меняя их

Принципы организации параллелизмаИспользование потоков на общем адресном пространствеПульсирующий (fork-join) параллелизм

Принципы организации параллелизмаПри выполнении обычного кода (вне параллельных областей) программа исполняется

Когда следует использовать технологию Open MP Целевая платформа является многопроцессорной или

Когда эффективно использовать технологию Open MP Параллельная версия настигает по быстродействию последовательную

Настройки компилятора Microsoft Visual StudioProject ? ?Property Pages ? C/C++ ? Language ?OpenMP Support ?Yes

Структура программы#include int main(){ // по умолчанию кол-во потоков:int numTh

Простейшая программа#include #include int main (int argc, char * argv[]) {

Простейшая программа – результат работы

Простейшие директивы OpenMP#pragma omp parallel{ <код>}// выполнится столько раз, сколько потоков#pragma

Ограничения на оператор for OpenMP1. Переменная цикла должна иметь тип integer.

Пример 1#pragma omp parallel num_threads(2) for (int i = 0; i <

Пример 1-а (parallel без указания количества потоков)#pragma omp parallel for (int i

Пример 2 (ошибка!)#pragma omp parallel num_threads(2) { ... // N строк кода #pragma omp

Пример 2 - правильно#pragma omp parallel num_threads(2) { ... // N строк кода #pragma

Ограничение на переопределение количества потоковКоличество потоков нельзя переопределять внутри параллельной секции.

Планирование и разбиение цикловStatic scheduling – цикл делится на фрагменты одинакового

Планирование и разбиение циклов (Static scheduling - пример работы)int s;#pragma omp parallel

Планирование и разбиение циклов (Static scheduling - пример работы)

Планирование и разбиение циклов (Dinamic scheduling - пример работы)int s;#pragma omp parallel

Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 2)

Планирование и разбиение циклов Dinamic scheduling - пример работы schedule(dynamic, 1)

Dinamic scheduling - пример работы для быстрых операций во втором потоке

Вывод данных в консоль в параллельных потоках - операция ОЧЕНЬ опасная!!! Операция

Вывод данных в консоль в параллельных потоках надо оградить блокировкой #pragma

Гонки данных Незащищенный доступ к общей памятиdouble data;#pragma omp parallel for

ПРИЧИНА:все глобальные переменные в OpenMP считаются shared по умолчанию/РЕШЕНИЕ (первый вариант):просто

Приватные переменные - метод борьбы с гонками данныхdouble data;#pragma omp parallel for

Локальные переменные становятся приватными – первый вариант решения // double data; //

Явно указанные приватные переменные – решение, эквивалентное по результатуdouble data;#pragma omp

Приватные переменные – возможные ошибки1. При входе в поток для переменных,

Приватные переменные – ограниченияПеременная в выражении private не должна иметь ссылочный

Правила разделения переменных (1)Неявное правило 1: Все переменные, определенные вне omp

Правила разделения переменных (2)Явное правило 1: Переменные, приведенные в shared(), являются

Параллельные секции#pragma omp parallel sections// создан параллельный регион секций {#pragma omp section <код> #pragma

Параллельные секции Директива sections – распределение вычислений для раздельных фрагментов кода

Редукции в циклахint sum =0;#pragma omp parallel for reduction (+ sum) {for

Редукции в циклахПараметр reduction определяет список переменных, для которых выполняется операция

Барьерыint sum =0;#pragma omp parallel for reduction (+ sum) {for (int i=0;

Барьеры и nowaitВ некоторых случаях возникает потребность отключать синхронизацию, Для этого

Барьеры и nowait#pragma omp parallel { #pragma omp for nowait for(int i =

Барьеры и nowaitВ рассмотренном примере потоки, которые освободились после обработки первого

Критические секцииС помощью критических разделов можно предотвратить одновременный доступ к одному

Критические секции Применение критических секций там, где они не нужны, нежелательно

Выполнение в одном потоке внутри параллельного фрагмента #pragma omp parallel num_threads(4)

Выполнение в одном потоке внутри параллельного фрагментаПотоков 4, но сообщение выдано

Два базовых типа конструкций OpenMP Директивы #pragma Функции исполняющей среды

Прагмы синхронизации#pragma omp single – исполняет следующую команду только с помощью

Критическая секция#pragma omp parallel for schedule(static) for (int i = 0; i

Критическая секцияИзбежать ситуацию возникновения гонки за ресурсами позволяет использование критических секций: void

Критическая секция #pragma omp critical позволяет только одному потоку выполнить операцию даже

Библиотека функцийvoid omp_set_num_threads(int numThreads)Позволяет назначить максимальное число потоков для использования в

Библиотека функцийint omp_get_max_threads()Возвращает максимальное число потоковint omp_get_num_threads()Возвращает фактическое число потоков в

Библиотека функцийint omp_get_thread_num()Возвращает номер потокаint omp_get_num_procs()Возвращает число процессоров, доступных приложению

Библиотека функцийint omp_in_parallel()Возвращает true, если вызвана из параллельной области программы

Библиотека функций Блокировки omp_lock_t myLock; omp_init_lock( &myLock ); omp_set_lock( &myLock ); omp_unset_lock(

Правильный код блокировки omp_lock_t myLock; omp_init_lock(&myLock); #pragma omp parallel sections { #pragma omp section { ... omp_set_lock(&myLock); ... omp_unset_lock(&myLock); ... } #pragma omp

Похожие презентации