Подготовка данных к анализу с помощью запросов презентация

Содержание

Слайд 2

Цели занятия

Слайд 3

В конце занятия вы сможете:

Преобразовывать исходные данные, приводя их к нужному виду

Цели занятия

Слайд 4

О чём поговорим, что сделаем

Слайд 5

План занятия

Слайд 6

Вспомним, о чем мы говорили на прошлом занятии

Слайд 7

Что такое «табличный вид»

Слайд 8

Какие преобразования доступны в Power Query

Слайд 9

Преобразования таблицы «в целом»

Слайд 10

На прошлом занятии мы видели несколько «нетаблиц». Пришло время сделать из них нормальные

таблицы
Для этого подключимся к файлу Excel «Исправляем нетаблицы.xlsx»

Задача

Слайд 11

Исправляем нетаблицу1

Нетаблица 1. Что в ней нужно исправить:
В столбце [Продажи] заменить:
«Мруб.» на «000000»;
«

тыс. шт.» на «000»;
[Продажи] разбить на 2 столбца
Строки с несколькими месяцами разбить по кол-ву месяцев

Слайд 12

Исправляем нетаблицу2

Нетаблица 2. Пусть нам нужны только суммарные показатели по типам. Что в

ней нужно исправить.
Сгруппировать по [Тип], с суммой по [Выручка] и [Количество]
Отфильтровать [Тип]<> «Все типы»

Слайд 13

Исправляем нетаблицу3

Нетаблица 3. Что в ней нужно исправить.
Превратить матрицу в таблицу

Слайд 14

Как матрица превращается в таблицу

Слайд 15

Исправляем нетаблицу4

Нетаблица 4. Что в ней нужно исправить.
Разнести значения из [Значение] по

двум столбцам – [Выручка] и [Кол-во]

Слайд 16

Исправляем нетаблицу5

Нетаблица 5. Как будем исправлять.
Объединим столбцы [Филиал] и [Тип]
Транспонируем таблицу
Заполним пропуске

в столбце с годами
Первую строку превратим в заголовок столбцов
Разнесем значения по отдельным столбцам выручку и количество
Разобьем обратно столбец из п. 1
Присвоим нужные имена столбцам

Слайд 17

Преобразования существующих столбцов и добавление новых

Слайд 18

Мы – аналитики в магазине, продающем расходные материалы через интернет. Нам нужно подготовить

данные по продажам для дальнейшего анализа.
Файл «Данные магазина по продажам.xlsx»

Задача

Слайд 19

Данные по продажам магазина расходных материалов

Что должно быть в результате:
1. Имена написаны правильно;
2.

Данные нужны только по женщинам-ИП, разместившим заявки более 100 дней назад в выходные;
3. Нужен дополнительный столбец с ценой 1 единицы товара без НДС с точностью до копейки с указанием размерности (т.е. «ХХХ руб. за шт.»);
4. Оставшиеся строки должны быть пронумерованы с шагом 10 с 10;
5. Все покупательницы должны быть разбиты на 3 группы:
- VIP: те, у кого цена за единицу не меньше 2000 руб.
- Стандартные: те, у кого цена за единицу не меньше 1000, но не VIP
- Остальные

Слайд 20

Чему мы сегодня научились

Слайд 21

Делать разнообразные манипуляции с данными
И даже чуть-чуть анализировать данные

Резюме

Слайд 22

Но, чего мы еще пока не умеем:
Делать сложные преобразования, включающие в себя одновременно

разные запросы
Но через неделю уже будем иметь!

Резюме

Слайд 23

Полезные материалы

Слайд 24

Документация по Power BI Desktop
Сообщество (англ.)
Блог Microsoft Power BI

Полезные материалы

Слайд 25

Про домашние задания

Слайд 26

Читайте, пожалуйста, внимательно задание. Очень внимательно;
Выполняйте, пожалуйста, все условия задания в точности так,

как они сформулированы. Не срезайте углы;
Если что-то непонятно как делать – пересмотрите материалы занятия. Для выполнения задания не требуется ничего, чего нет в материалах занятия;
Домашние задания нужно делать. Это самая главная часть обучения. Можно научиться только делая задания и не просматривая материалы. Но нельзя научиться только просматривая материалы;
После задания почти всегда есть скриншот с требуемым результатом. Если Ваш результат отличается от скриншота – доработайте свой результат;
Если Вы не укладываетесь в срок сдачи, можно запросить продление срока. Но лучше укладываться в срок;
Срок решения – не оценивается. Качество решения – оценивается. Поэтому лучше сдать решение позже, но качественное;
При поиске решения помните, что решение должно быть универсальным: оно должно правильно работать и с другими исходными данными.

Про домашние задания

Слайд 27

Домашнее задание 1
Установить истину в вопросе дорог в России

Слайд 28

Задача
Вы обсуждаете с другими пользователями в группе FB состояние дорог в РФ. В

группе не могут прийти к согласию о том, в каком регионе больше всего перекрытых дорог (по длине). Вы решили исследовать этот вопрос. Для этого Вы нашли на сайте Росавдора таблицу о перекрытии дорог.
Постройте рейтинг регионов по убыванию длины перекрытых дорог.
Примечания: 1. Если при открытии файла будут непонятные символы, используйте кодировку 1251: Кириллическая (Windows)
2. Строки, где начало или конец перекрытого участка не указан (стоит прочерк) в рейтинге, не используем;
3. Будьте внимательны ближе к концу запроса.

Домашнее задание 1

Домашнее задание 1

Слайд 29

Домашнее задание 1, результат

Слайд 30

Замечания к домашнему заданию 1
В качестве источника данных нужно использовать именно ту ссылку,

которая приведена в условии. Выгружать страницу Википедии в файл и затем подключаться к этому файлу – не нужно;
Длина дороги – это разность между ее концом и началом (либо, наоборот, между началом и концом);
Избавиться от знака минуса перед числом можно разными способами. Лучше всего это делать с помощью преобразования «Абсолютное значение». Это преобразование меняет знак у отрицательного числа и оставляет неизменным положительное число;
Чтобы посчитать какой-то обобщающий показатель (сумму, среднее и т.п.) для нескольких строк, нужно сделать группировку по столбцу, содержащему одно и то же значение для всех этих строк, и выбрать по какому столбцу и какой именно показатель считать.

Домашнее задание 1

Слайд 31

Домашнее задание 2
Закрепляем наши умения по манипулированию с данными

Слайд 32

Задача
Вы работаете в компании, разрабатывающей мобильные приложения. Ваш коллега прислали вам файл «Отчет

по приложению.xlsx». К сожалению, формат данных в этом файле не позволяет сразу начать работу с этим отчетом. Вам нужно привести данные к правильному формату.
Что нужно сделать?
Привести исходные данные к виду таблицы
Сделать цифровые показатели считаемыми

Домашнее задание 2

Слайд 33

Домашнее задание 2, результат

Слайд 34

Замечания к домашнему заданию 2
Запись «1,014М» означает число 1 014 000. Фактически, буква

«М» означает, что число перед буквой нужно умножить на 1 000 000;
Запись «1,585k» означает число 1 585. Фактически, буква «k» означает, что число перед буквой нужно умножить на 1 000.

Домашнее задание 2

Имя файла: Подготовка-данных-к-анализу-с-помощью-запросов.pptx
Количество просмотров: 42
Количество скачиваний: 0