Содержание
- 2. Введение в визуализацию данных; Особенности визуализации больших данных; Kibana; Matplotlib. На этой лекции будут рассмотрены
- 3. Визуализация данных является ключевой частью любого рабочего процесса в науке о данных, но ее часто рассматривают
- 4. Чтобы четко и эффективно донести информацию до пользователей; Чтобы помочь пользователям анализировать и рассуждать о данных
- 5. Квартет Энскомба
- 6. 2 оси Единицы измерения для каждой оси Координатная сетка Легенда Декартовы координаты
- 7. Декартовы координаты
- 8. Декартовы координаты Обращайте внимание на единицы изменения данных, особенно при использовании логарифмической шкалы.
- 9. Логарифмические шкалы часто используются, когда набор данных содержит числа очень разных величин. В округах Техаса, показанных
- 10. Мы часто используем цвет как средство для различения отдельных предметов или групп, которые не имеют внутреннего
- 11. Цвет также можно использовать для представления численных данных, таких как доход, температура или скорость. В этом
- 12. В некоторых случаях нам нужно визуализировать отклонение значений данных в одном из двух направлений относительно нейтральной
- 13. Цвет также может быть эффективным инструментом для выделения определенных элементов в данных. В наборе данных могут
- 14. Визуализация численных величин: столбчатые диаграммы
- 15. Визуализация численных величин: столбчатые диаграммы
- 16. Визуализация численных величин: столбчатые диаграммы
- 17. Визуализация численных величин: столбчатые диаграммы
- 18. Визуализация численных величин: столбчатые диаграммы
- 19. Комбинации столбчатых диаграмм Столбчатые диаграммы с группировкой позволяют показать множество данных за раз, но их труднее
- 20. Комбинации столбчатых диаграмм Иногда проще воспринять несколько столбчатых диаграмм, чем одну сгруппированную. Вместо того, чтобы рисовать
- 21. Точечные графики
- 22. Тепловые карты Тепловые карты позволяют отобразить динамику развития данных, подобно множеству графиков, но с сохранением читаемости.
- 23. Гистограммы При создании гистограммы всегда нужно попробовать несколько возможных значений ширины столбца (bin).
- 24. Диаграмма плотности На графике плотности мы пытаемся визуализировать базовое распределение вероятности данных, рисуя соответствующую непрерывную кривую.
- 25. Диаграмма плотности При создании диаграмм плотности всегда нужно попробовать несколько возможных значений полосы пропускания (bandwith).
- 26. Диаграмма плотности Оценки плотности ядра имеют тенденцию приводить к появлению данных там, где их нет, особенно
- 27. Несколько распределений на одной визуализации Гистограмма возрастов пассажиров Титаника с разделением по полу. Гистограммы с накоплением
- 28. Несколько распределений на одной визуализации Теперь кажется, что на самом деле есть три разные группы, а
- 29. Несколько распределений на одной визуализации
- 30. Несколько распределений на одной визуализации Решение, которое хорошо работает для этого набора данных, состоит в том,
- 31. Несколько распределений на одной визуализации Наконец, когда мы хотим визуализировать ровно два распределения, мы также можем
- 32. Круговые диаграммы Круговая диаграмма разбивает круг на срезы, так что площадь каждого среза пропорциональна доле итога,
- 33. Круговые диаграммы Для сравнения, столбчатая диаграмма облегчает прямое сравнение трех групп, хотя и затеняет другие аспекты.
- 34. Круговые диаграммы с подкатегориями Круговые диаграммы можно делать с разбиением частей на ещё более мелкие части,
- 35. Диаграммы рассеяния Многие наборы данных содержат две или более количественных переменных, и нас может интересовать, как
- 36. Пузырьковые диаграммы Главный недостаток пузырьковых диаграмм в том, что они показывают одинаковые типы переменных, количественные переменные,
- 37. Временные ряды Важная особенность временных рядов: у каждой точки есть строго заданные левый и правый соседи,
- 38. Тренды Акт сглаживания создает функцию, которая сохраняет важные закономерности в данных, удаляя ненужные незначительные детали или
- 39. 2D-гистограммы 2D-гистограмма концептуально похожа на одномерную гистограмму, как обсуждалось в главе 7, но теперь мы объединяем
- 40. Визуализация должна содержать историю Большая часть визуализации данных делается с целью общения. У нас есть представление
- 41. Частые ошибки использования цвета Используйте прямую маркировку вместо цветов, когда нужно различать более восьми категорий.
- 42. Частые ошибки использования цвета Избегайте больших заполненных областей чрезмерно насыщенных цветов. Они мешают вашему читателю воспринимать
- 43. Частые ошибки использования цвета Цветовая гамма радуги очень немонотонна. Это становится ясно видимым путем преобразования цветов
- 44. Частые ошибки использования цвета
- 45. Частые ошибки использования цвета: дальтонизм По первым двум примерам может показаться, что почти невозможно найти два
- 46. Частые ошибки композиции: легенда
- 47. Частые ошибки композиции: шкалы
- 48. Частые ошибки композиции: 3D
- 49. Частые ошибки композиции: 3D
- 50. Частые ошибки композиции: 3D
- 51. Частые ошибки композиции: нагроможденность
- 52. Частые ошибки композиции: нагроможденность
- 53. Примеры реальных диаграмм
- 54. Визуализация больших данных Отображение миллионов точек данных в одной визуализации почти всегда делает визуализацию загроможденной до
- 55. Matplotlib Matplotlib это самая большая и мощная из библиотек визуализации, доступных в Python. Она мощная, гибкая,
- 56. Matplotlib
- 57. Matplotlib: 2-мерная гистограмма
- 58. Matplotlib: диаграмма рассеяния
- 59. Matplotlib: 2 миллиона элементов на 2d-гистограмме
- 60. Matplotlib: интересные закономерности поведения задач WLCG
- 61. Matplotlib: гистограмма
- 62. Matplotlib: диаграмма рассеяния
- 63. Kibana Веб-приложение для исследования и визуализации данных Современный браузерный интерфейс (HTML5 + JavaScript) Поставляется с собственным
- 64. Kibana: обнаружение данных
- 65. Kibana: создание визуализаций
- 66. Kibana: разные типы визуализаций
- 67. Kibana Dashboard
- 68. Kibana: основные элементы интерфейса
- 69. Заключение Помните: большинство всех возможных визуализаций больших данных на самом деле не делаются с самими большими
- 71. Скачать презентацию