Современные сети презентация

Август 1, 2021

Главная
Информатика
Современные сети

Содержание

2. ML => DL Классика Машинного Обучения = Выделение признаков + модель для обучения Classic Machine Learning
3. LSTM Юрген Шмидхубер 1997
7. AlexNet DropOut (RIP), Data Augmentation и ReLu.
8. AlexNet DropOut (RIP), Data Augmentation и ReLu. 1 неделя обучения на 2 GPUs
9. VGG16 16 слоев Вход: изображение размером 224х224 пиксела, 3 канала цвета 2 раза : свертка-свертка-подвыборка, 3
10. VGG16
11. VGG16 Очень медленная скорость обучения. Cеть слишком большая (появляются проблемы с диском и пропускной способностью)
12. VGG19 19 слоев Вход: изображение размером 224х224 пиксела, 3 канала цвета 2 раза : свертка-свертка-подвыборка, 3
13. VGG19 Не обучается целиком (затухает градиент) Несколько стадий обучения разной глубины Обучение 4 Titan Black GPUs
14. VGG16- VGG16 Задача(https://www.kaggle.com/c/imagenet-object-localization-challenge/data) ImageNet (1000 классов) ≈ 7 % K. Simonyan, A. Zisserman Very Deep Convolutional
15. GoogleNet - Inception 144 миллионa параметров Стек сверток (nхn по 3х3) Cascade Cross Chanel Parametric Pooling
16. GoogleNet - Inception
17. Rethinking the Inception Architecture for Computer Vision (11 Dec 2015) // https://arxiv.org/pdf/1512.00567v3.pdf GoogleNet - Inception
18. Макс. глубина: 22 слоя с параметрами Нет полносвязных слоев В 12 раз меньше параметров чем в
19. GoogleNet GoogleNet — первая известная сеть с ациклической архитектурой
20. ResNet
21. residual-функция остаточная функция: Можно обучить на эту функцию
22. ResNet
23. ResNet - задача ImageNet 3.57% - top5 на Imagenet. 2014 152 слоя
24. ResNet+Inception: Inception 4v
25. ResNet+Inception Очень глубокая сеть(более 550 слоев) , целиком не обучается (55M параметров) Один и тот же
26. DenseNet https://arxiv.org/pdf/1608.06993.pdf
27. SqueezeNet convolution layer (conv1), 8 Fire modules (fire2-9), conv layer (conv10)
28. SSD
29. YOLO Вход: 448x448х3 Почти GoogleNet
30. Сиамская сеть
31. Сегментация и рисование
32. U-net - сегментация
33. R-CNN (region CNN)
34. принципы построения DCNN для CV Избегайте representational bottlenecks: не стоит резко снижать размерность представления данных, это
35. YOLOv2 для генерации изображений Сснижающих качество распознавания
37. Резюме https://keras.io/applications/
39. Скачать презентацию

Слайд 2

ML => DL
Классика Машинного Обучения = Выделение признаков + модель для

обучения
Classic Machine Learning = feature extraction + model
Глубокое обучение = сырые данные + глубокая модель для обучения
Deep Learning = raw data + deep model

Х=(х1,х2, …, «усы - длинные», «уши - большие», «глаза - желтые»)=КОТ

= КОТ

Слайд 3

LSTM
Юрген Шмидхубер 1997

Слайд 4

Слайд 5

Слайд 6

Слайд 7

AlexNet
DropOut (RIP), Data Augmentation и ReLu.

Слайд 8

AlexNet
DropOut (RIP), Data Augmentation и ReLu.
1 неделя обучения на 2 GPUs

Слайд 9

VGG16
16 слоев
Вход: изображение размером 224х224 пиксела, 3 канала цвета
2 раза :

свертка-свертка-подвыборка,
3 раза: свертка-свертка-свертка-подвыборка
Ядро 3х3
Пулинг (подвыборка)2х2
3 полносвязных слоя:
4096 нейронов, 4096 нейронов , 1000 нейронов
1000 классов объектов.
Выход: вероятность (one hot encoding) класса объекта

Слайд 10

VGG16

Слайд 11

VGG16
Очень медленная скорость обучения.
Cеть слишком большая (появляются проблемы с диском и

пропускной способностью)

Слайд 12

VGG19
19 слоев
Вход: изображение размером 224х224 пиксела, 3 канала цвета
2 раза :

свертка-свертка-подвыборка,
3 раза: свертка-свертка-свертка-свертка - подвыборка
Ядро 3х3
Пулинг (подвыборка)2х2
3 полносвязных слоя:
4096 нейронов, 4096 нейронов , 1000 нейронов
1000 классов объектов.
Выход: вероятность (one hot encoding) класса объекта

Слайд 13

VGG19
Не обучается целиком (затухает градиент)
Несколько стадий обучения разной глубины
Обучение 4

Titan Black GPUs 2-3 недели

Слайд 14

VGG16- VGG16
Задача(https://www.kaggle.com/c/imagenet-object-localization-challenge/data)
ImageNet (1000 классов) ≈ 7 %
K. Simonyan, A. Zisserman
Very Deep

Convolutional Networks for Large-Scale Image Recognition
arXiv technical report, 2014

Слайд 15

GoogleNet - Inception
144 миллионa параметров
Стек сверток (nхn по 3х3)
Cascade Cross Chanel

Parametric Pooling
Анализ корреляции нейронов предыдущего слоя и объединение коррелированных нейронов в группы, которые будут нейронами следующего слоя.
Конкатенация фильтров
ИНСЕПТРОН

Слайд 16

GoogleNet - Inception

Слайд 17

Rethinking the Inception Architecture for Computer Vision (11 Dec 2015)
// https://arxiv.org/pdf/1512.00567v3.pdf
GoogleNet -

Inception

Слайд 18

Макс. глубина: 22 слоя с параметрами
Нет полносвязных слоев
В 12 раз меньше

параметров чем в AlexNet
Основной блок – Inception module (9 штук)
1x1 свёртки – уменьшение размерности

Rethinking the Inception Architecture for Computer Vision (11 Dec 2015)
// https://arxiv.org/pdf/1512.00567v3.pdf

GoogleNet - Inception

Слайд 19

GoogleNet
GoogleNet — первая известная сеть с ациклической архитектурой

Слайд 20

ResNet

Слайд 21

residual-функция
остаточная функция:
Можно обучить на эту функцию

Слайд 22

ResNet

Слайд 23

ResNet - задача
ImageNet
3.57% - top5 на Imagenet. 2014
152 слоя

Слайд 24

ResNet+Inception: Inception 4v

Слайд 25

ResNet+Inception
Очень глубокая сеть(более 550 слоев) , целиком не обучается (55M параметров)
Один

и тот же блок с функций потерь в нескольких местах
«Проталкивает» градиент внутрь сети
Обучалось на облаке CPU
Добавился BatchNorm, Residual blocks и т.д. (Inception-v4)
ImageNet : 3.08% 2016
https://arxiv.org/pdf/1602.07261.pdf

Слайд 26

DenseNet
https://arxiv.org/pdf/1608.06993.pdf

Слайд 27

SqueezeNet
convolution layer (conv1),
8 Fire modules (fire2-9),
conv layer (conv10)

Слайд 28

SSD

Слайд 29

YOLO
Вход: 448x448х3
Почти GoogleNet

Слайд 30

Сиамская сеть

Слайд 31

Сегментация и рисование

Слайд 32

U-net - сегментация

Слайд 33

R-CNN (region CNN)

Слайд 34

принципы построения DCNN для CV
Избегайте representational bottlenecks: не стоит резко снижать

размерность представления данных, это нужно делать плавно от начала сети и до классификатора на выходе.
Высокоразмерные представления следует обрабатывать локально, увеличивая размерность: недостаточно плавно снижать размерность, стоит использовать принципы, описанные в предыдущей статье, для анализа и группировки коррелированных участков.
Пространственные сверки можно и нужно факторизовывать на еще более мелкие: это позволит сэкономить ресурсы и пустить их на увеличение размера сети.
Необходимо соблюдать баланс между глубиной и шириной сети: не стоит резко увеличивать глубину сети отдельно от ширины, и наоборот; следует равномерно увеличивать или уменьшать обе размерности.

Слайд 35

YOLOv2 для генерации изображений
Сснижающих качество распознавания

Слайд 36

Слайд 37

Современные сети презентация

Содержание

ML => DLКлассика Машинного Обучения = Выделение признаков + модель для

LSTMЮрген Шмидхубер 1997

AlexNetDropOut (RIP), Data Augmentation и ReLu.

AlexNetDropOut (RIP), Data Augmentation и ReLu.1 неделя обучения на 2 GPUs

VGG1616 слоевВход: изображение размером 224х224 пиксела, 3 канала цвета 2 раза :

VGG16

VGG16Очень медленная скорость обучения.Cеть слишком большая (появляются проблемы с диском и

VGG1919 слоевВход: изображение размером 224х224 пиксела, 3 канала цвета 2 раза :

VGG19Не обучается целиком (затухает градиент) Несколько стадий обучения разной глубиныОбучение 4

VGG16- VGG16Задача(https://www.kaggle.com/c/imagenet-object-localization-challenge/data)ImageNet (1000 классов) ≈ 7 %K. Simonyan, A. ZissermanVery Deep

GoogleNet - Inception 144 миллионa параметровСтек сверток (nхn по 3х3)Cascade Cross Chanel

GoogleNet - Inception

Rethinking the Inception Architecture for Computer Vision (11 Dec 2015)// https://arxiv.org/pdf/1512.00567v3.pdfGoogleNet -

Макс. глубина: 22 слоя с параметрамиНет полносвязных слоевВ 12 раз меньше

GoogleNet GoogleNet — первая известная сеть с ациклической архитектурой

ResNet

residual-функцияостаточная функция: Можно обучить на эту функцию

ResNet

ResNet - задачаImageNet3.57% - top5 на Imagenet. 2014152 слоя

ResNet+Inception: Inception 4v

ResNet+InceptionОчень глубокая сеть(более 550 слоев) , целиком не обучается (55M параметров)Один

DenseNethttps://arxiv.org/pdf/1608.06993.pdf

SqueezeNetconvolution layer (conv1), 8 Fire modules (fire2-9), conv layer (conv10)

SSD

YOLOВход: 448x448х3Почти GoogleNet

Сиамская сеть

Сегментация и рисование

U-net - сегментация

R-CNN (region CNN)

принципы построения DCNN для CVИзбегайте representational bottlenecks: не стоит резко снижать

YOLOv2 для генерации изображений Сснижающих качество распознавания

Резюмеhttps://keras.io/applications/

Похожие презентации

ML => DL
Классика Машинного Обучения = Выделение признаков + модель для

LSTM
Юрген Шмидхубер 1997

AlexNet
DropOut (RIP), Data Augmentation и ReLu.

AlexNet
DropOut (RIP), Data Augmentation и ReLu.
1 неделя обучения на 2 GPUs

VGG16
16 слоев
Вход: изображение размером 224х224 пиксела, 3 канала цвета
2 раза :

VGG16
Очень медленная скорость обучения.
Cеть слишком большая (появляются проблемы с диском и

VGG19
19 слоев
Вход: изображение размером 224х224 пиксела, 3 канала цвета
2 раза :

VGG19
Не обучается целиком (затухает градиент)
Несколько стадий обучения разной глубины
Обучение 4

VGG16- VGG16
Задача(https://www.kaggle.com/c/imagenet-object-localization-challenge/data)
ImageNet (1000 классов) ≈ 7 %
K. Simonyan, A. Zisserman
Very Deep

GoogleNet - Inception
144 миллионa параметров
Стек сверток (nхn по 3х3)
Cascade Cross Chanel

Rethinking the Inception Architecture for Computer Vision (11 Dec 2015)
// https://arxiv.org/pdf/1512.00567v3.pdf
GoogleNet -

Макс. глубина: 22 слоя с параметрами
Нет полносвязных слоев
В 12 раз меньше

GoogleNet
GoogleNet — первая известная сеть с ациклической архитектурой

residual-функция
остаточная функция:
Можно обучить на эту функцию

ResNet - задача
ImageNet
3.57% - top5 на Imagenet. 2014
152 слоя

ResNet+Inception
Очень глубокая сеть(более 550 слоев) , целиком не обучается (55M параметров)
Один

DenseNet
https://arxiv.org/pdf/1608.06993.pdf

SqueezeNet
convolution layer (conv1),
8 Fire modules (fire2-9),
conv layer (conv10)

YOLO
Вход: 448x448х3
Почти GoogleNet

принципы построения DCNN для CV
Избегайте representational bottlenecks: не стоит резко снижать

YOLOv2 для генерации изображений
Сснижающих качество распознавания

Резюме
https://keras.io/applications/