Машинное обучение в электронной коммерции – практика использования и подводные камни презентация

Ноябрь 14, 2021

Главная
Менеджмент
Машинное обучение в электронной коммерции – практика использования и подводные камни

Содержание

2. Карл… Карл, я открыл страшную тайну нейронных сетей Это очень интересно, пап!
3. Карл… Карл, я специалист по BigData…. Это очень круто, пап! Большая часть населения земли знают математику
4. О чем хочется поговорить Ввести в исторический контекст проблемы. Разобраться в причинах. Кратко вспомнить нужную теорию
5. О ЧЕМ ПОГОВОРИМ Для менеджеров, без математики! Понятные алгоритмы и техники Полезные для электронной торговли В
6. «Золотая» лихорадка Была бигдата Теперь нейронки Завтра будет вторжение инопланетян ☺ Что происходит, успеть или забИть?
7. Только правда, только хардкор Клянусь говорить только правду Верьте! Проверить оооочень трудно…
8. Что такое бигдата на самом деле? Данные хранят ценную информацию. На данных можно обучать алгоритмы. Как
9. Бигдата и веб-студия Чем занимаются в веб-студии. Партнеры Битрикс, фреймворки. Близость к клиенту. Разработка «на бою».
10. Наука и (веб) разработка Программирование и теория, computer science Нужно ли писать тесты к коду? На
11. Третья волна… www.deeplearningbook.org
12. Датасеты становятся больше… www.deeplearningbook.org
13. Нейронки гораздо точнее… www.deeplearningbook.org
14. Нейронки становятся больше… www.deeplearningbook.org
15. Бигдата и нейронки – созданы друг для друга Машины опорных векторов Факторизация слоев Нелинейность
16. А если данных все таки собрано мало? Сколько нужно данных? Простые классические алгоритимы: naïve bayes, logistic
17. В чем же принципиальная разница нейронок и традиционных алгоритмов? Иерархия концепций/слоев в нейронке Прорывные результаты в
18. Подтянулись GPU и железо Универсальные GPU CUDA Работа с тензорами Диски, кластера: Spark, Hadoop/HDFS, Amazon s3
19. Парад бесплатных фреймворков TensorFlow (Google) Torch Theano Keras Deeplearning4j CNTK (Microsoft) DSSTNE (Amazon) Caffe
20. Вендоры скупают ученых Facebook (Yann LeCun) Baidu (Andrew Ng, уже правда уходит, достали тупить ☺ )
21. Как работает нейронка? Все просто – почти как наш мозг ☺ Вспомните школьные годы – и
22. Потрясающие возможности нейросетей
23. GAN (generative adversarial networks) Две сети «мочат» друг друга ☺ InfoGAN, CGAN Слайд
24. Восстановление деталей изображения https://arxiv.org/abs/1609.04802
25. Восстановление деталей изображения https://arxiv.org/abs/1609.04802
26. Восстановление деталей изображения https://arxiv.org/abs/1609.04802
27. Фантастические интерьеры https://habrahabr.ru/company/mailru/blog/338248/
28. Изменение возраста https://habrahabr.ru/company/mailru/blog/338248/
29. Картинка по эскизу Слайд https://habrahabr.ru/company/mailru/blog/338248/
30. Восстановление частей изображения Слайд
31. Распознавание лиц в Битрикс24
32. Распознавание лиц в Битрикс24 Face-карт Bitrix24.Time
33. Верстка по дизайну pix2code
34. Борьба с заболеваниями https://habrahabr.ru/company/mailru/blog/325908/
35. Рекуррентные нейросети Последовательности событий, модели Маркова http://karpathy.github.io/2015/05/21/rnn-effectiveness/
36. Google Neural Machine Translation https://habrahabr.ru/company/mailru/blog/338248/
37. Google Neural Machine Translation https://habrahabr.ru/company/mailru/blog/338248/
38. Чтение по губам Сеть без звука читает по губам – уже 2 раза лучше человека https://habrahabr.ru/company/mailru/blog/338248/
39. Ответы на вопросы по картинке В некоторых случаях и датасетах сеть – опережает человека https://habrahabr.ru/company/mailru/blog/338248/
40. Обучение с подкреплением Deepmind.com http://karpathy.github.io/2015/05/21/rnn-effectiveness/
41. Обучение с подкреплением - суть http://karpathy.github.io/2015/05/21/rnn-effectiveness/
42. Другие кейсы применения нейронок Предсказание следующего действия (RNN, …) Кластеризация (autoencoders) Кто из клиентов уйдет, кто
43. Где же подвох? ☺
44. А они то есть!!! И не один. ☺
45. Подвох 1 Нужна бигдата Только конкретная, ваша, а не общедоступная Сможете собрать/купить?
46. Трус не играет в хоккей
47. Подвох 2 – семантический разрыв Классификация Регрессия Кластеризация Анализ скрытых факторов в ином измерении Как увеличить
48. Машина Тьюринга и … GTA Нужно создавать новые абстракции, нужны «нейронные» программисты, менеджеры и прОдукты
49. Подвох 3 – всем тут все понятно? ☺
50. Подвох 3 – а тут? ☺
51. Подвох 3 – нужно долго учиться Хорошая матподготовка выше среднего Уметь писать код Исследовательский дух, много
52. Подвох 4 – никаких гарантий В интернете -работает На ваших данных – нет Где ошибка? В
53. Подвох 5: полная цепочка - сложна Сбор данных Фильтрация, валидация Обучение модели Раздача предсказаний Контроль качества
54. Делаем глубокий вдох…. и улыбаемся!
55. Ражнирование товаров (Google Play) arxiv.org/abs/1606.07792
56. arxiv.org/abs/1606.07792 Ражнирование товаров (Google Play)
57. arxiv.org/abs/1606.07792 Собирается все что есть… Засовывается в нейронку Нейронка предсказывает вероятность клика/покупки приложения – для каждого
58. Где брать людей в команду? Бигдата: хорошие программисты и опытные сисадмины – 1 штука на проект
59. Ну что, нырнем поглубже? Может заболеть голова ☺
60. Абстрактные знания и фундаментальная наука Логика, реляционная алгебра Дискретная математика, теория графов, теория автоматов, комбинаторика, теория
61. Восьмая проблема Гильберта и другие штучки До сих пор неясно распределение простых чисел (Гипотеза Римана) Эффективные
62. Когда заканчивается наука, «начинается машинное обучение» Четкая кластеризация: K-means (EM) Нечеткая кластеризация: Latent dirichlet allocation Модели
63. Машинное обучение и … где-то в конце, нейронки (scikit-learn)
64. Рассмотрим кусочек нейронки - нейрон Линейная регрессия Логистическая регрессия Сигмоид Здравствуй, линейная алгебра! Чмоки чмоки
65. Вектор, косинус угла между векторами Вектор – точка в N-мерном пространстве. Размер вектора. Косинус угла между
66. Уравнение плоскости через точку и нормаль Плоскость: косинус угла между нормалью и MP = 0 Если
67. Сигмоид, логистическая регрессия Зачем нужен сигмоид? Визуализация Нелинейная активация, виды
68. Другие функции активации
69. 25 кадр Твою ж мать, сколько еще это будет продолжаться? ☺
70. Активация нейронки, матрицы
71. Умножаем матрицы «в уме» 2 входных вектора, размером 3 => матрица B(3,2) Ширина слоя сети =
72. Производная, ее за ногу Отношение приращения функции F(x) к приращению ее аргумента, когда приращение стремиться к
73. Jacobian/Hessian матрицы Jacobian – производные первого порядка Hessian – производные второго порядка Это все долго ☺
74. Обратное распространение ошибки Chain rule, здравствуй дифференциальное исчисление! Чмоки чмоки. На самом деле тут все просто!
75. Cost - функции mean squared error entropy, cross-entropy (binary/multiclass), здравствуй теория информации и тервер!
76. Cost – функции, Keras
77. Автоматическое/ручное дифференцирование Torch7 – ручное, afaik Theano – автоматическое Tensorflow – автоматическое Deeplearning4j – ручное Keras
78. Методы градиентного спуска (SGD) Stochastic gradient descent Mini-batch gradient descent Momentum: Nesterov accelerated gradient Adagrad Adadelta
79. Тензоры. Проще SQL. В терминологии нейронок – это многомерные массивы элементов одного типа. Требуется их складывать,
80. Тензоры Песочница на python, 15 минут и результат
81. Тензоры nd4j, примерно тоже самое
82. Тензоры keras/tf, примерно тоже самое
83. Простой классификатор Зачем нужна нелинейность? Зачем нужны слои?
84. Врач никому не нужен? ☺ Ныряем в прикладные кейсы
85. Полезные (готовые) инструменты Rapidminer SAS SPSS … Готовые блоки, серверные редакции (hadoop), графики
86. Полезные библиотеки (бесплатные) Spark MLlib (scala/java/python) – много данных scikit-learn.org (python) – мало данных R
87. Рабочее место аналитика
88. Аналитик Организовать сбор данных Минимум программирования Работа в инструментах (Rapidminer, R, SAS, SPSS) Bigdata – как
89. Война систем хранения Слайд SQL на MapReduce: Hive, Pig, Spark SQL SQL на MPP (massive parallel
90. Визуализация
91. Визуализация!
92. Визуализация! Кто мои клиенты (возраст, средний чек, интересы)? Тренды, графы Корреляция значений 2-3, иногда больше измерений
93. Визуализация! Гистограмма: - Время пребывания клиента в разделе сайта - Число платных подписок в зависимости от
94. Кластерный анализ
95. Кластерный анализ Когда измерений много Если «повезет» Четкая/нечеткая Иерархическая Графы Данных много/мало Интерпретация
96. Кластерный анализ Иерархическая K-means C-means Spectral Density-based (DBSCAN) Вероятностные Для «больших данных»
97. Кластерный анализ – бизнес-кейсы Сегментация клиентов, типов использования сервиса, … Кластеризация «общего» товарного каталога Кластеризация графа
98. Кластерный анализ – оценки на программирование Данные должны быть уже собраны Анализ в Rapidminer (0.1-2 часа)
99. Кластерный анализ – риски Много данных – медленно! Тексты, каталоги товаров … Как интерпретировать? Рецепты: Spark
100. Персонализация
101. Персонализация Релевантный контент – «угадываем мысли» Релевантный поиск Предлагаем то, что клиенту нужно как раз сейчас
102. Объем продаж товаров Best-sellers Топ-продаж… С этим товаром покупают Персональные рекомендации «Mining of Massive Datasets», 9.1.2:
103. Коллаборативная фильтрация Предложи Товары/Услуги, которые есть у твоих друзей (User-User) Предложи к твоим Товарам другие связанные
104. Как работает коллаборативная фильтрация Матрица: Пользователь Товар Похожие Пользователи Похожие Товары
105. Возможности коллаборативной фильтрации (Item-Item) Персональная рекомендация (рекомендуем посмотреть эти Товары) С этим Товаром покупают/смотрят/… (глобальная) Топ
106. Коллаборативная фильтрация (Item-Item) – сроки, риски Apache Spark MLlib (als), Apache Mahout (Taste) + неделька Объем
107. Content-based рекомендации Купил пластиковые окна – теперь их предлагают на всех сайтах и смартфоне. Купил Toyota,
108. Content-based рекомендации – реализация, риски Поисковый «движок»: Sphinx, Lucene (Solr) «Обвязка» для данных Хранение профиля Клиента
109. Content-based, collaborative рекомендации - разумно Рекомендовать постоянно «возобновляемые» Товары (молоко, носки, …) Рекомендовать фильм/телевизор – один
110. Классификация
111. Классификация – это не кластеризация! Не путать! Кластеризация – автоматическая и если повезет Классификация – учим
112. Классификация Разбиваем по группам, обучение Бинарная Мультиклассовая
113. Классификация – бизнес-кейсы Удержание: найти клиентов, которые скоро уйдут (churn-rate) Найти клиентов, готовых стать платными Найти
114. Классификация – тонкости А как/чем удержать клиентов? Определение релевантных групп – зондирование (рассылки, опросы), база моделей
115. Классификация – реализация, риски Определение, нормализация атрибутов Feature engineering Выбор алгоритма, kernel Spark MLlib, scikit-learn –
116. Классификация – качество Confusion matrix Recall/precision Kappa AUC > 0.5
117. Регрессия
118. Регрессия Предсказать «циферку» Стоимость квартиры, автомобиля на рынке Ценность клиента для магазина Зарплата на данную вакансию
119. Регрессия – customer lifetime value (CLV) Пришел клиент, а он потенциально прибыльный! Система лояльности, удержания Подарки,
120. Регрессия – реализация, риски Выявление атрибутов Выбор алгоритма Spark MLlib – не работает, scikit-learn – 1-2
121. Reinforcement learning
122. Автоматическое A/B-тестирование Создаем наборы: главной, баннеров, корзины, мастера заказа Ставим цель – оформление заказа Клиенты обучают
123. Reinforcement learning
124. Обучение с подкреплением Deepmind.com http://karpathy.github.io/2015/05/21/rnn-effectiveness/
125. Обучение с подкреплением - суть http://karpathy.github.io/2015/05/21/rnn-effectiveness/
126. А что влияет на конверсию в …? Собираем данные (хиты, логи, анкетирование) Строим дерево решений В
127. Стратегии увеличения прибыли
128. Стратегии Изучаем клиентов (кластерный анализ, зондирование) Привлечь нового дороже чем удержать старого? Высокий churn-rate и CLV
129. Типы нейросетей в 1С-Битрикс
130. Классификатор обращений техподдержки Глубокий классификатор, использующий ngrams3 векторизатор и сжимающее хэширование входного вектора. Используем взвешенную cost-функцию
131. 1D свертка для классификации текстов Глубокий аналог ngrams, очень быстрое обучение на GPU Word/char-based 1D convolution
132. Классификатор обращений техподдержки Битрикс24
133. «Нейробот» Кластер веб-серверов, Кэширование, REST-API GPUs (TitanX) Глубокая нейронная сеть с двумя входами и одним выходом
134. Наши эксперименты Наши эксперименты: Ф.М. Достоевский, "Преступление и наказание“ Число слоев сети: 2 Число нейронов в
135. Наши эксперименты: Л.Н. Толстой, "Война и мир" Число слоев сети: 3 Число нейронов в каждом слое:
136. Наши эксперименты: Код ядра Битрикс 3-х слойная сеть, размер слоя: 400 нейронов, несколько миллионов параметров, память:
137. Интересные тренды и техники Semi-supervised learning. Когда данных мало… One-shot learning Переобучение Neural turing machine/memory networks
138. Выводы Можно брать готовые модели в фреймворках и применять в различных бизнес-задачах уже сейчас Собирать данные
140. Скачать презентацию

Слайд 2

Карл…
Карл, я открыл страшную тайну нейронных сетей
Это очень интересно, пап!

Слайд 3

Карл…
Карл, я специалист по BigData….
Это очень круто, пап!
Большая часть населения земли

знают математику на уровне рабов в Египте. А для понимания нейросетей полезно помнить «вышку».

Слайд 4

О чем хочется поговорить
Ввести в исторический контекст проблемы. Разобраться в причинах.
Кратко

вспомнить нужную теорию
Перечислить актуальные, интересные бизнес-задачи в электронной коммерции и не только
Рассмотреть популярные архитектуры нейронок для решения бизнес-задач

Слайд 5

О ЧЕМ ПОГОВОРИМ
Для менеджеров, без математики!
Понятные алгоритмы и техники
Полезные для электронной

торговли
В рамках Bigdata

Слайд

Слайд 6

«Золотая» лихорадка
Была бигдата
Теперь нейронки
Завтра будет вторжение инопланетян ☺
Что происходит, успеть или

забИть?

Слайд 7

Только правда, только хардкор
Клянусь говорить только правду
Верьте!
Проверить оооочень трудно…

Слайд 8

Что такое бигдата на самом деле?
Данные хранят ценную информацию. На данных

можно обучать алгоритмы.
Как собрать данные правильно? MySQL или Hadoop?
Сколько нужно данных? Алгоритмы и объем данных
Инженерная культура в компании
Что нужно знать, чтобы извлечь пользу из данных (аналитика, матстатистика, машинное обучение)

Слайд 9

Бигдата и веб-студия
Чем занимаются в веб-студии. Партнеры Битрикс, фреймворки. Близость к

клиенту.
Разработка «на бою». Минусы и плюсы.
Чатбот-платформа Битрикс. Возможности.
Маркетплейсы Битрикс и Битрикс24. Возможности.
Техники сбора бигдаты. Много ли нужно бигдаты.
Бигдата как актив. Системы аналитики и мониторинга.

Слайд 10

Наука и (веб) разработка
Программирование и теория, computer science
Нужно ли писать тесты

к коду?
На каком языке/фреймворке делать сайт?
Парадокс верстальщиков, python и javascript
Парадокс php и mysql
Почему до сих пор жив unix и во веки веков, аминь
Как правильно относиться к новым алгоритмам и применять их в боевых проектах?

Слайд 11

Третья волна…
www.deeplearningbook.org

Слайд 12

Датасеты становятся больше…
www.deeplearningbook.org

Слайд 13

Нейронки гораздо точнее…
www.deeplearningbook.org

Слайд 14

Нейронки становятся больше…
www.deeplearningbook.org

Слайд 15

Бигдата и нейронки – созданы друг для друга
Машины опорных векторов
Факторизация слоев
Нелинейность

Слайд 16

А если данных все таки собрано мало?
Сколько нужно данных?
Простые классические алгоритимы:

naïve bayes, logistic regression, support vector machine (SVM), decision tree, gbt/random forest (https://tech.yandex.ru/catboost/)

Слайд 17

В чем же принципиальная разница нейронок и традиционных алгоритмов?
Иерархия концепций/слоев в

нейронке
Прорывные результаты в последние годы
Способность «впитать» в себя информацию из большого объема данных, нелинейность и факторизация
Сложные связи между атрибутами данных
Плоские модели

Слайд 18

Подтянулись GPU и железо
Универсальные GPU
CUDA
Работа с тензорами
Диски, кластера: Spark, Hadoop/HDFS, Amazon

s3
Языки: Scala

Слайд 19

Парад бесплатных фреймворков
TensorFlow (Google)
Torch
Theano
Keras
Deeplearning4j
CNTK (Microsoft)
DSSTNE (Amazon)
Caffe

Слайд 20

Вендоры скупают ученых
Facebook (Yann LeCun)
Baidu (Andrew Ng, уже правда уходит, достали

тупить ☺ )
Google (Ian Goodfellow)
SalesForce (Richard Socher)
openai.com …

Слайд 21

Как работает нейронка?
Все просто – почти как наш мозг ☺
Вспомните школьные

годы – и все станет понятно

www.deeplearningbook.org

Слайд 22

Потрясающие возможности нейросетей

Слайд 23

GAN (generative adversarial networks)
Две сети «мочат» друг друга ☺
InfoGAN, CGAN
Слайд

Слайд 24

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Слайд 25

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Слайд 26

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Слайд 27

Фантастические интерьеры
https://habrahabr.ru/company/mailru/blog/338248/

Слайд 28

Изменение возраста
https://habrahabr.ru/company/mailru/blog/338248/

Слайд 29

Картинка по эскизу
Слайд
https://habrahabr.ru/company/mailru/blog/338248/

Слайд 30

Восстановление частей изображения
Слайд

Слайд 31

Распознавание лиц в Битрикс24

Слайд 32

Распознавание лиц в Битрикс24
Face-карт
Bitrix24.Time

Слайд 33

Верстка по дизайну
pix2code

Слайд 34

Борьба с заболеваниями
https://habrahabr.ru/company/mailru/blog/325908/

Слайд 35

Рекуррентные нейросети
Последовательности событий, модели Маркова
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Слайд 36

Google Neural Machine Translation
https://habrahabr.ru/company/mailru/blog/338248/

Слайд 37

Google Neural Machine Translation
https://habrahabr.ru/company/mailru/blog/338248/

Слайд 38

Чтение по губам
Сеть без звука читает по губам – уже 2

раза лучше человека

https://habrahabr.ru/company/mailru/blog/338248/

Слайд 39

Ответы на вопросы по картинке
В некоторых случаях и датасетах сеть –

опережает человека

https://habrahabr.ru/company/mailru/blog/338248/

Слайд 40

Обучение с подкреплением
Deepmind.com
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Слайд 41

Обучение с подкреплением - суть
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Слайд 42

Другие кейсы применения нейронок
Предсказание следующего действия (RNN, …)
Кластеризация (autoencoders)
Кто из клиентов

уйдет, кто из сотрудников уволится (churn rate: FFN, CNN)
Сколько стоит квартирка (regression)
Анализ причин (InfoGANs)
Персонализация

Слайд 43

Где же подвох? ☺

Слайд 44

А они то есть!!! И не один. ☺

Слайд 45

Подвох 1
Нужна бигдата
Только конкретная, ваша, а не общедоступная
Сможете собрать/купить?

Слайд 46

Трус не играет в хоккей

Слайд 47

Подвох 2 – семантический разрыв
Классификация
Регрессия
Кластеризация
Анализ скрытых факторов в ином измерении
Как увеличить

прибыль?
Как удержать клиента?
Как предложить самое нужное?

Слайд 48

Машина Тьюринга и … GTA
Нужно создавать новые абстракции, нужны «нейронные» программисты,

менеджеры и прОдукты

Слайд 49

Подвох 3 – всем тут все понятно? ☺

Слайд 50

Подвох 3 – а тут? ☺

Слайд 51

Подвох 3 – нужно долго учиться
Хорошая матподготовка выше среднего
Уметь писать код
Исследовательский

дух, много читать
Опыт и интуиция

Слайд 52

Подвох 4 – никаких гарантий
В интернете -работает
На ваших данных – нет
Где

ошибка? В данных, в модели, в коэффициентах, в коде, в голове??

Слайд 53

Подвох 5: полная цепочка - сложна
Сбор данных
Фильтрация, валидация
Обучение модели
Раздача предсказаний
Контроль качества

Слайд 54

Делаем глубокий вдох…. и улыбаемся!

Слайд 55

Ражнирование товаров (Google Play)
arxiv.org/abs/1606.07792

Слайд 56

arxiv.org/abs/1606.07792
Ражнирование товаров (Google Play)

Слайд 57

arxiv.org/abs/1606.07792
Собирается все что есть…
Засовывается в нейронку
Нейронка предсказывает вероятность клика/покупки приложения –

для каждого приложения из отобранных
Приложения сортируются и отображаются. Все! ☺

Ражнирование товаров (Google Play)

Слайд 58

Где брать людей в команду?
Бигдата: хорошие программисты и опытные сисадмины –

1 штука на проект
Создание/тюнинг моделей: физматы – 1 штука на отдел
Product owner с обновленным мозгом – 1 штука на проект(ы)
Менеджеры – 1024 килограмм ☺
python, java, unix, spark, scala

Слайд 59

Ну что, нырнем поглубже? Может заболеть голова ☺

Слайд 60

Абстрактные знания и фундаментальная наука
Логика, реляционная алгебра
Дискретная математика,

теория графов, теория автоматов, комбинаторика, теория кодирования
Теория алгоритмов
Линейная алгебра
Интегральное и дифф. исчисление
Теория вероятностей
Теория оптимизации и численные методы
*времени на это практически нет

Слайд 61

Восьмая проблема Гильберта и другие штучки
До сих пор неясно распределение

простых чисел (Гипотеза Римана)
Эффективные алгоритмы нередко находят методом «тыка», многие мало изучены
Нейронные сети не должны … сходиться, но сходятся. И плохо-плохо изучены.
Наука только открывает ящик Пандоры!

Слайд 62

Когда заканчивается наука, «начинается машинное обучение»
Четкая кластеризация: K-means (EM)
Нечеткая

кластеризация: Latent dirichlet allocation
Модели Маркова
Google Page Rank
Monte Carlo алгоритмы
Las Vegas алгоритмы (в т.ч. «обезьянья сортировка»)

Слайд 63

Машинное обучение и … где-то в конце, нейронки (scikit-learn)

Слайд 64

Рассмотрим кусочек нейронки - нейрон
Линейная регрессия
Логистическая регрессия
Сигмоид
Здравствуй,

линейная алгебра! Чмоки чмоки

Слайд 65

Вектор, косинус угла между векторами
Вектор – точка в N-мерном пространстве.

Размер вектора.
Косинус угла между векторами

Слайд 66

Уравнение плоскости через точку и нормаль
Плоскость: косинус угла между нормалью

и MP = 0
Если угол меньше 90, косинус >0, иначе – косинус <0.

Слайд 67

Сигмоид, логистическая регрессия
Зачем нужен сигмоид?
Визуализация
Нелинейная активация, виды

Слайд 68

Другие функции активации

Слайд 69

25 кадр
Твою ж мать, сколько еще это будет продолжаться? ☺

Слайд 70

Активация нейронки, матрицы

Слайд 71

Умножаем матрицы «в уме»
2 входных вектора, размером 3 => матрица

B(3,2)
Ширина слоя сети = 2
Веса сети => матрица A(2,3)
Получаем активации слоя для каждого вх. вектора: (2, 2).

Слайд 72

Производная, ее за ногу
Отношение приращения функции F(x) к приращению ее

аргумента, когда приращение стремиться к нулю!
Производная функции пути от времени – есть скорость. Вторая производная – ускорение.
Для обучения нейронки производные играют ключевую роль

Слайд 73

Jacobian/Hessian матрицы
Jacobian – производные первого порядка
Hessian – производные второго

порядка
Это все долго ☺ Аппроксимируется с SGD + momentum

Слайд 74

Обратное распространение ошибки
Chain rule, здравствуй дифференциальное исчисление! Чмоки чмоки.
На

самом деле тут все просто!

Слайд 75

Cost - функции
mean squared error
entropy, cross-entropy (binary/multiclass), здравствуй теория

информации и тервер!

Слайд 76

Cost – функции, Keras

Слайд 77

Автоматическое/ручное
дифференцирование
Torch7 – ручное, afaik
Theano – автоматическое
Tensorflow – автоматическое

Deeplearning4j – ручное
Keras (Theano/Tensorflow)

Слайд 78

Методы градиентного спуска (SGD)
Stochastic gradient descent
Mini-batch gradient descent
Momentum:
Nesterov

accelerated gradient
Adagrad
Adadelta
RMSprop
Adam

Слайд 79

Тензоры. Проще SQL.
В терминологии нейронок – это многомерные массивы элементов

одного типа.
Требуется их складывать, умножать, делить и выполнять статистические операции: Basic Linear Algebra Subprograms (BLAS)
numpy (python)
nd4j (java)
Tensor (torch/lua)
CUDA, GPU

Слайд 80

Тензоры
Песочница на python, 15 минут и результат

Слайд 81

Тензоры
nd4j, примерно тоже самое

Слайд 82

Тензоры
keras/tf, примерно тоже самое

Слайд 83

Простой классификатор
Зачем нужна нелинейность?
Зачем нужны слои?

Слайд 84

Врач никому не нужен? ☺ Ныряем в прикладные кейсы

Слайд 85

Полезные (готовые) инструменты
Rapidminer
SAS
SPSS
…
Готовые блоки, серверные редакции (hadoop), графики

Слайд 86

Полезные библиотеки (бесплатные)
Spark MLlib (scala/java/python) – много данных
scikit-learn.org (python) – мало

данных
R

Слайд 87

Рабочее место аналитика

Слайд 88

Аналитик
Организовать сбор данных
Минимум программирования
Работа в инструментах (Rapidminer, R, SAS, SPSS)
Bigdata –

как SQL

Слайд 89

Война систем хранения
Слайд
SQL на MapReduce: Hive, Pig, Spark SQL
SQL на

MPP (massive parallel processing):
Impala, Presto, Amazon RedShift, Vertica
NoSQL: Cassandra, Hbase, Amazon DynamoDB
Классика: MySQL, MS SQL, Oracle, …

Слайд 90

Визуализация

Слайд 91

Визуализация!

Слайд 92

Визуализация!
Кто мои клиенты (возраст, средний чек, интересы)?
Тренды, графы
Корреляция значений
2-3, иногда больше

измерений
«Дешевле/проще» кластеризации

Слайд 93

Визуализация!
Гистограмма:
- Время пребывания клиента в разделе сайта
- Число платных подписок в

зависимости от числа пользователей услуги

Слайд 94

Кластерный анализ

Слайд 95

Кластерный анализ
Когда измерений много
Если «повезет»
Четкая/нечеткая
Иерархическая
Графы
Данных много/мало
Интерпретация

Слайд 96

Кластерный анализ
Иерархическая
K-means
C-means
Spectral
Density-based (DBSCAN)
Вероятностные
Для «больших данных»

Слайд 97

Кластерный анализ – бизнес-кейсы
Сегментация клиентов, типов использования сервиса, …
Кластеризация «общего» товарного

каталога
Кластеризация графа связей сайтов (пересечение аудитории)
Маркетинг работает с целевыми группами, информация разбита на «смысловые облака».

Слайд 98

Кластерный анализ – оценки на программирование
Данные должны быть уже собраны
Анализ в

Rapidminer (0.1-2 часа)
Анализ в Spark Mllib (1-2 дня, много данных)
Анализ в scikit-learn – аналогично (мало данных)
На выходе: список кластерных групп, иногда визуализация.
Метрики качества кластеризации.

Слайд 99

Кластерный анализ – риски
Много данных – медленно!
Тексты, каталоги товаров …
Как интерпретировать?
Рецепты:
Spark

MLlib, векторизация текста, LSH (locality sensetive hashing), word2vec

Слайд 100

Персонализация

Слайд 101

Персонализация
Релевантный контент – «угадываем мысли»
Релевантный поиск
Предлагаем то, что клиенту нужно как

раз сейчас
Увеличение лояльности, конверсии

Слайд 102

Объем продаж товаров
Best-sellers
Топ-продаж…
С этим товаром покупают
Персональные рекомендации
«Mining of Massive Datasets», 9.1.2:

Leskovec, Rajaraman, Ullman (Stanford University)

Слайд 103

Коллаборативная фильтрация
Предложи Товары/Услуги, которые есть у твоих друзей (User-User)
Предложи к твоим

Товарам другие связанные с ними Товары (Item-Item): «сухарики к пиву»

Слайд 104

Как работает коллаборативная фильтрация
Матрица:
Пользователь
Товар
Похожие Пользователи
Похожие Товары

Слайд 105

Возможности коллаборативной фильтрации (Item-Item)
Персональная рекомендация (рекомендуем посмотреть эти Товары)
С этим Товаром

покупают/смотрят/… (глобальная)
Топ Товаров на сайте

Слайд 106

Коллаборативная фильтрация (Item-Item) – сроки, риски
Apache Spark MLlib (als), Apache Mahout

(Taste) + неделька
Объем данных
Объем модели, требования к «железу»

Слайд

Слайд 107

Content-based рекомендации
Купил пластиковые окна – теперь их предлагают на всех сайтах

и смартфоне.
Купил Toyota, ищу шины, предлагают шины к Toyota

Слайд 108

Content-based рекомендации – реализация, риски
Поисковый «движок»: Sphinx, Lucene (Solr)
«Обвязка» для данных
Хранение

профиля Клиента
Реализация: неделька. Риски – объем данных, языки.

Слайд 109

Content-based, collaborative рекомендации - разумно
Рекомендовать постоянно «возобновляемые» Товары (молоко, носки, …)
Рекомендовать

фильм/телевизор – один раз до покупки
Учет пола, возраста, размера, …

Слайд 110

Классификация

Слайд 111

Классификация – это не кластеризация!
Не путать!
Кластеризация – автоматическая и если повезет
Классификация

– учим компьютер сами и «везет» чаще
Пример: фильтрация спама, которую доучиваем

Слайд 112

Классификация
Разбиваем по группам, обучение
Бинарная
Мультиклассовая

Слайд 113

Классификация – бизнес-кейсы
Удержание: найти клиентов, которые скоро уйдут (churn-rate)
Найти клиентов, готовых

стать платными
Найти клиентов, которые готовы купить новую услугу
Найти готовых уволиться
Определить у клиента – пол!

Слайд 114

Классификация – тонкости
А как/чем удержать клиентов?
Определение релевантных групп – зондирование (рассылки,

опросы), база моделей
Оценка качества моделей

Слайд 115

Классификация – реализация, риски
Определение, нормализация атрибутов
Feature engineering
Выбор алгоритма, kernel
Spark MLlib, scikit-learn

– 2-3 дня
Rapidminer – полчаса

Слайд 116

Классификация – качество
Confusion matrix
Recall/precision
Kappa
AUC > 0.5

Слайд 117

Регрессия

Слайд 118

Регрессия
Предсказать «циферку»
Стоимость квартиры, автомобиля на рынке
Ценность клиента для магазина
Зарплата на данную

вакансию
и т.д.

Слайд 119

Регрессия – customer lifetime value (CLV)
Пришел клиент, а он потенциально прибыльный!
Система

лояльности, удержания
Подарки, скидки, …

Слайд 120

Регрессия – реализация, риски
Выявление атрибутов
Выбор алгоритма
Spark MLlib – не работает, scikit-learn

– 1-2 дня

Слайд 121

Reinforcement learning

Слайд 122

Автоматическое A/B-тестирование
Создаем наборы: главной, баннеров, корзины, мастера заказа
Ставим цель – оформление

заказа
Клиенты обучают систему - автоматически
Система отображает самые эффективные элементы интерфейса

Слайд 123

Reinforcement learning

Слайд 124

Обучение с подкреплением
Deepmind.com
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Слайд 125

Обучение с подкреплением - суть
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Слайд 126

А что влияет на конверсию в …?
Собираем данные (хиты, логи, анкетирование)
Строим

дерево решений
В Rapidminer – полчаса
В Spark MLlib – чуть больше.

Слайд 127

Стратегии увеличения прибыли

Слайд 128

Стратегии
Изучаем клиентов (кластерный анализ, зондирование)
Привлечь нового дороже чем удержать старого?
Высокий churn-rate

и CLV – удерживаем релевантным предложением
Меньше «тупого» спама - больше лояльность
Персонализированный контент
Ранжирование лидов и просчет рисков в CRM

Слайд 129

Типы нейросетей в 1С-Битрикс

Слайд 130

Классификатор обращений техподдержки
Глубокий классификатор, использующий ngrams3 векторизатор и сжимающее хэширование входного

вектора.
Используем взвешенную cost-функцию для балансирования неравномерного числа примеров в категориях. Иногда добавляем сверточные слои. Иногда лучше работают рекуррентные слои.
Drop out: 0.85, l2: 0.001, learning rate: 0.1, adam, batch=128. В обученной сети: 1-3 миллиона параметров.

Фреймворк: deeplearning4j
Веб-сервер: jetty.
Нейронная сеть –
набор файлов на диске (10-20 МБ).
Кеширование сетей в памяти.

Слайд 131

1D свертка для классификации текстов
Глубокий аналог ngrams, очень быстрое обучение на

GPU
Word/char-based 1D convolution
Пилотная сеть для техподдержки в Битрикс. Увеличение качества на 30%.

Слайд 132

Классификатор обращений техподдержки Битрикс24

Слайд 133

«Нейробот»
Кластер веб-серверов,
Кэширование, REST-API
GPUs (TitanX)
Глубокая нейронная сеть
с двумя входами и одним выходом

с адаптивной архитектурой.
Внутри сети происходит совмещение
семантических пространств вопросов и ответов.
В 2017 году – сделали совместный пилот с мэрией Москвы

Слайд 134

Наши эксперименты
Наши эксперименты:
Ф.М. Достоевский, "Преступление и наказание“
Число слоев сети: 2
Число

нейронов в каждом слое: 400
Коэффициент встряхивания "мозгов" (dropout): чуть больше единицы
Память сети: 50 символов назад
Число параметров, которые мы учим - меньше миллиона.

Слайд 135

Наши эксперименты:
Л.Н. Толстой, "Война и мир"
Число слоев сети: 3
Число

нейронов в каждом слое: 400
Коэффициент встряхивания "мозгов" (dropout): чуть больше единицы
Память сети: 150 символов назад
Число параметров, которые мы учим - несколько миллионов

Наши эксперименты

Слайд 136

Наши эксперименты:
Код ядра Битрикс
3-х слойная сеть, размер слоя: 400 нейронов,

несколько миллионов параметров, память: 150 символов назад, обучение - ночь

Наши эксперименты

Слайд 137

Интересные тренды и техники
Semi-supervised learning. Когда данных мало…
One-shot learning
Переобучение
Neural turing machine/memory

networks
Attention

Слайд 138

Выводы
Можно брать готовые модели в фреймворках и применять в различных бизнес-задачах

уже сейчас
Собирать данные не сложно – главное аккуратно ☺
Все быстро меняется, нужно учиться
Инженерные практики в компании – очень важны

Машинное обучение в электронной коммерции – практика использования и подводные камни презентация

Содержание

Карл…Карл, я открыл страшную тайну нейронных сетейЭто очень интересно, пап!

Карл…Карл, я специалист по BigData….Это очень круто, пап!Большая часть населения земли

О чем хочется поговоритьВвести в исторический контекст проблемы. Разобраться в причинах.Кратко

О ЧЕМ ПОГОВОРИМДля менеджеров, без математики!Понятные алгоритмы и техникиПолезные для электронной

«Золотая» лихорадкаБыла бигдатаТеперь нейронкиЗавтра будет вторжение инопланетян ☺Что происходит, успеть или

Только правда, только хардкорКлянусь говорить только правдуВерьте!Проверить оооочень трудно…

Что такое бигдата на самом деле?Данные хранят ценную информацию. На данных

Бигдата и веб-студияЧем занимаются в веб-студии. Партнеры Битрикс, фреймворки. Близость к

Наука и (веб) разработкаПрограммирование и теория, computer scienceНужно ли писать тесты

Третья волна…www.deeplearningbook.org

Датасеты становятся больше…www.deeplearningbook.org

Нейронки гораздо точнее…www.deeplearningbook.org

Нейронки становятся больше…www.deeplearningbook.org

Бигдата и нейронки – созданы друг для другаМашины опорных векторовФакторизация слоевНелинейность

А если данных все таки собрано мало?Сколько нужно данных?Простые классические алгоритимы:

В чем же принципиальная разница нейронок и традиционных алгоритмов?Иерархия концепций/слоев в

Подтянулись GPU и железоУниверсальные GPUCUDAРабота с тензорамиДиски, кластера: Spark, Hadoop/HDFS, Amazon

Парад бесплатных фреймворковTensorFlow (Google)TorchTheanoKerasDeeplearning4jCNTK (Microsoft)DSSTNE (Amazon)Caffe

Вендоры скупают ученыхFacebook (Yann LeCun)Baidu (Andrew Ng, уже правда уходит, достали

Как работает нейронка?Все просто – почти как наш мозг ☺Вспомните школьные

Потрясающие возможности нейросетей

GAN (generative adversarial networks)Две сети «мочат» друг друга ☺InfoGAN, CGANСлайд

Восстановление деталей изображенияhttps://arxiv.org/abs/1609.04802

Восстановление деталей изображенияhttps://arxiv.org/abs/1609.04802

Восстановление деталей изображенияhttps://arxiv.org/abs/1609.04802

Фантастические интерьерыhttps://habrahabr.ru/company/mailru/blog/338248/

Изменение возрастаhttps://habrahabr.ru/company/mailru/blog/338248/

Картинка по эскизуСлайд https://habrahabr.ru/company/mailru/blog/338248/

Восстановление частей изображенияСлайд

Распознавание лиц в Битрикс24

Распознавание лиц в Битрикс24Face-картBitrix24.Time

Верстка по дизайнуpix2code

Борьба с заболеваниямиhttps://habrahabr.ru/company/mailru/blog/325908/

Рекуррентные нейросетиПоследовательности событий, модели Марковаhttp://karpathy.github.io/2015/05/21/rnn-effectiveness/

Google Neural Machine Translationhttps://habrahabr.ru/company/mailru/blog/338248/

Google Neural Machine Translationhttps://habrahabr.ru/company/mailru/blog/338248/

Чтение по губамСеть без звука читает по губам – уже 2

Ответы на вопросы по картинкеВ некоторых случаях и датасетах сеть –

Обучение с подкреплениемDeepmind.comhttp://karpathy.github.io/2015/05/21/rnn-effectiveness/

Обучение с подкреплением - сутьhttp://karpathy.github.io/2015/05/21/rnn-effectiveness/

Другие кейсы применения нейронокПредсказание следующего действия (RNN, …)Кластеризация (autoencoders)Кто из клиентов

Где же подвох? ☺

А они то есть!!! И не один. ☺

Подвох 1Нужна бигдатаТолько конкретная, ваша, а не общедоступнаяСможете собрать/купить?

Трус не играет в хоккей

Подвох 2 – семантический разрывКлассификацияРегрессияКластеризацияАнализ скрытых факторов в ином измеренииКак увеличить

Машина Тьюринга и … GTAНужно создавать новые абстракции, нужны «нейронные» программисты,

Подвох 3 – всем тут все понятно? ☺

Подвох 3 – а тут? ☺

Подвох 3 – нужно долго учитьсяХорошая матподготовка выше среднегоУметь писать кодИсследовательский

Подвох 4 – никаких гарантийВ интернете -работаетНа ваших данных – нетГде

Подвох 5: полная цепочка - сложнаСбор данныхФильтрация, валидацияОбучение моделиРаздача предсказанийКонтроль качества

Делаем глубокий вдох…. и улыбаемся!

Ражнирование товаров (Google Play)arxiv.org/abs/1606.07792

arxiv.org/abs/1606.07792Ражнирование товаров (Google Play)

arxiv.org/abs/1606.07792Собирается все что есть…Засовывается в нейронкуНейронка предсказывает вероятность клика/покупки приложения –

Где брать людей в команду?Бигдата: хорошие программисты и опытные сисадмины –

Ну что, нырнем поглубже? Может заболеть голова ☺

Абстрактные знания и фундаментальная наука Логика, реляционная алгебра Дискретная математика,

Восьмая проблема Гильберта и другие штучки До сих пор неясно распределение

Когда заканчивается наука, «начинается машинное обучение» Четкая кластеризация: K-means (EM) Нечеткая

Машинное обучение и … где-то в конце, нейронки (scikit-learn)

Рассмотрим кусочек нейронки - нейрон Линейная регрессия Логистическая регрессия Сигмоид Здравствуй,

Вектор, косинус угла между векторами Вектор – точка в N-мерном пространстве.

Уравнение плоскости через точку и нормаль Плоскость: косинус угла между нормалью

Сигмоид, логистическая регрессия Зачем нужен сигмоид? Визуализация Нелинейная активация, виды

Другие функции активации

25 кадрТвою ж мать, сколько еще это будет продолжаться? ☺

Активация нейронки, матрицы

Умножаем матрицы «в уме» 2 входных вектора, размером 3 => матрица

Производная, ее за ногу Отношение приращения функции F(x) к приращению ее

Jacobian/Hessian матрицы Jacobian – производные первого порядка Hessian – производные второго

Обратное распространение ошибки Chain rule, здравствуй дифференциальное исчисление! Чмоки чмоки. На

Cost - функции mean squared error entropy, cross-entropy (binary/multiclass), здравствуй теория

Карл…
Карл, я открыл страшную тайну нейронных сетей
Это очень интересно, пап!

Карл…
Карл, я специалист по BigData….
Это очень круто, пап!
Большая часть населения земли

О чем хочется поговорить
Ввести в исторический контекст проблемы. Разобраться в причинах.
Кратко

О ЧЕМ ПОГОВОРИМ
Для менеджеров, без математики!
Понятные алгоритмы и техники
Полезные для электронной

«Золотая» лихорадка
Была бигдата
Теперь нейронки
Завтра будет вторжение инопланетян ☺
Что происходит, успеть или

Только правда, только хардкор
Клянусь говорить только правду
Верьте!
Проверить оооочень трудно…

Что такое бигдата на самом деле?
Данные хранят ценную информацию. На данных

Бигдата и веб-студия
Чем занимаются в веб-студии. Партнеры Битрикс, фреймворки. Близость к

Наука и (веб) разработка
Программирование и теория, computer science
Нужно ли писать тесты

Третья волна…
www.deeplearningbook.org

Датасеты становятся больше…
www.deeplearningbook.org

Нейронки гораздо точнее…
www.deeplearningbook.org

Нейронки становятся больше…
www.deeplearningbook.org

Бигдата и нейронки – созданы друг для друга
Машины опорных векторов
Факторизация слоев
Нелинейность

А если данных все таки собрано мало?
Сколько нужно данных?
Простые классические алгоритимы:

В чем же принципиальная разница нейронок и традиционных алгоритмов?
Иерархия концепций/слоев в

Подтянулись GPU и железо
Универсальные GPU
CUDA
Работа с тензорами
Диски, кластера: Spark, Hadoop/HDFS, Amazon

Парад бесплатных фреймворков
TensorFlow (Google)
Torch
Theano
Keras
Deeplearning4j
CNTK (Microsoft)
DSSTNE (Amazon)
Caffe

Вендоры скупают ученых
Facebook (Yann LeCun)
Baidu (Andrew Ng, уже правда уходит, достали

Как работает нейронка?
Все просто – почти как наш мозг ☺
Вспомните школьные

GAN (generative adversarial networks)
Две сети «мочат» друг друга ☺
InfoGAN, CGAN
Слайд

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Восстановление деталей изображения
https://arxiv.org/abs/1609.04802

Фантастические интерьеры
https://habrahabr.ru/company/mailru/blog/338248/

Изменение возраста
https://habrahabr.ru/company/mailru/blog/338248/

Картинка по эскизу
Слайд
https://habrahabr.ru/company/mailru/blog/338248/

Восстановление частей изображения
Слайд

Распознавание лиц в Битрикс24
Face-карт
Bitrix24.Time

Верстка по дизайну
pix2code

Борьба с заболеваниями
https://habrahabr.ru/company/mailru/blog/325908/

Рекуррентные нейросети
Последовательности событий, модели Маркова
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Google Neural Machine Translation
https://habrahabr.ru/company/mailru/blog/338248/

Google Neural Machine Translation
https://habrahabr.ru/company/mailru/blog/338248/

Чтение по губам
Сеть без звука читает по губам – уже 2

Ответы на вопросы по картинке
В некоторых случаях и датасетах сеть –

Обучение с подкреплением
Deepmind.com
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Обучение с подкреплением - суть
http://karpathy.github.io/2015/05/21/rnn-effectiveness/

Другие кейсы применения нейронок
Предсказание следующего действия (RNN, …)
Кластеризация (autoencoders)
Кто из клиентов

Подвох 1
Нужна бигдата
Только конкретная, ваша, а не общедоступная
Сможете собрать/купить?

Подвох 2 – семантический разрыв
Классификация
Регрессия
Кластеризация
Анализ скрытых факторов в ином измерении
Как увеличить

Машина Тьюринга и … GTA
Нужно создавать новые абстракции, нужны «нейронные» программисты,

Подвох 3 – нужно долго учиться
Хорошая матподготовка выше среднего
Уметь писать код
Исследовательский

Подвох 4 – никаких гарантий
В интернете -работает
На ваших данных – нет
Где

Подвох 5: полная цепочка - сложна
Сбор данных
Фильтрация, валидация
Обучение модели
Раздача предсказаний
Контроль качества

Ражнирование товаров (Google Play)
arxiv.org/abs/1606.07792

arxiv.org/abs/1606.07792
Ражнирование товаров (Google Play)

arxiv.org/abs/1606.07792
Собирается все что есть…
Засовывается в нейронку
Нейронка предсказывает вероятность клика/покупки приложения –

Где брать людей в команду?
Бигдата: хорошие программисты и опытные сисадмины –

Абстрактные знания и фундаментальная наука
Логика, реляционная алгебра
Дискретная математика,

Восьмая проблема Гильберта и другие штучки
До сих пор неясно распределение

Когда заканчивается наука, «начинается машинное обучение»
Четкая кластеризация: K-means (EM)
Нечеткая

Рассмотрим кусочек нейронки - нейрон
Линейная регрессия
Логистическая регрессия
Сигмоид
Здравствуй,

Вектор, косинус угла между векторами
Вектор – точка в N-мерном пространстве.

Уравнение плоскости через точку и нормаль
Плоскость: косинус угла между нормалью

Сигмоид, логистическая регрессия
Зачем нужен сигмоид?
Визуализация
Нелинейная активация, виды

25 кадр
Твою ж мать, сколько еще это будет продолжаться? ☺

Умножаем матрицы «в уме»
2 входных вектора, размером 3 => матрица

Производная, ее за ногу
Отношение приращения функции F(x) к приращению ее

Jacobian/Hessian матрицы
Jacobian – производные первого порядка
Hessian – производные второго

Обратное распространение ошибки
Chain rule, здравствуй дифференциальное исчисление! Чмоки чмоки.
На

Cost - функции
mean squared error
entropy, cross-entropy (binary/multiclass), здравствуй теория