Содержание
- 2. Хранилище – компонент BI Слайд 1
- 3. Слайд 2 Место хранилища в информационной технологии поддержки принятия решений Системы поддержки принятия решений Спец. Отчеты
- 4. Слайд 3
- 5. Слайд 4 Продолжение таблицы
- 6. Слайд 5 Появление хранилищ вызвано, двумя причинами: аналитическая работа с данными в ХД (специализированных БД) не
- 7. Слайд 6 Почему нельзя использовать традиционные БД в процессе принятия решений? недостоверность данных; низкая производительность при
- 8. Слайд 7 Опыт использования БД Подводя итоги, можно отметить, что, несмотря на обилие данных, возможностей их
- 9. Слайд 8 Вывод из опыта использования БД Возникает необходимость в технологиях, позволяющих автоматически собирать данные из
- 10. Слайд 9 Требования к Хранилищам данных для руководящего состава и аналитиков ХД должно быть предметно-ориентированным, интегрированным,
- 11. Слайд 10 Основные свойства Хранилища данных: предметная ориентированность; интегрированность (целостность и внутренняя взаимосвязь); временная привязка; неразрушаемая
- 12. Слайд 11 Предметная ориентированность: Локальные базы данных содержат мегабайты информации, абсолютно не нужной для анализа (адреса,
- 13. Слайд 12 Интегрированность (целостность и внутренняя взаимосвязь): Несмотря на то что данные погружаются из различных источников,
- 14. Слайд 13 Временная привязка: Оперативные системы охватывают небольшой интервал времени, что достигается за счет периодического архивирования
- 15. Слайд 14 Неразрушаемая совокупность данных : Модификация данных не производится, поскольку может привести к нарушению их
- 16. Слайд 15 Особенности хранилищ данных: Хранилища данных содержат информацию, собранную из нескольких оперативных баз данных. Хранилища,
- 17. Слайд 16 Разновидности хранилищ – витрины данных: Поскольку конструирование хранилища данных — сложный процесс, который может
- 18. Слайд 17 Средства извлечения, преобразования и загрузки данных: этап извлечения и преобразования; этап очистки данных; этап
- 19. Слайд 18 Этап извлечения и преобразования Цель этапа извлечения данных — перенести данные из разнородных источников
- 20. Слайд 19 Этап очистки данных Ошибки при вводе данных и различия в схемах могут привести к
- 21. Слайд 20 Этап загрузки После того, как данные извлечены и преобразованы, возможно, что их еще необходимо
- 22. Слайд 21 Этап обновления Должны быть рассмотрены два вопроса: когда обновлять и как обновлять: 1. Обычно
- 23. Слайд 22 Управление метаданными Метаданные — информация любого рода, которая требуется для управления хранилищем данных, а
- 24. Слайд 23 Технологии хранения данных
- 25. Слайд 24 Денормализованные, пространственные базы данных Одним из направлений развития РБД в интересах систем принятия решений
- 26. Слайд 25 Методология Dimensional Нормализация данных в реляционных СУБД приводит к созданию множества связанных между собой
- 27. Слайд 26 Как проектировать ненормализованную БД? Большинство Case – средств проектирования БД поддерживает методологию моделирования хранилищ
- 28. Слайд 27 Особенности проектирования Dimensional Моделирование Dimensional сходно с моделированием связей и сущностей для реляционной модели,
- 29. Слайд 28 О схеме звезда В размерном моделировании принят стандарт модели, называемый схемой звезда (star schema),
- 30. Слайд 29 Основные составляющие структуры хранилищ данных Схема звезда обычно содержит одну большую таблицу, называемую таблицей
- 31. Слайд 30 Структура ХД - звезда
- 32. Слайд 31 Структура ХД - снежинка
- 33. Слайд 32 Обозначения таблиц в схеме “звезда”
- 34. Слайд 33 Таблица(ы) фактов Прежде чем создать DW со схемой типа звезда, необходимо проанализировать бизнес-правила предметной
- 35. Слайд 34 О связи таблицы фактов с таблицами измерений Таблица факта является центральной таблицей в схеме
- 36. Слайд 35 Первичный ключ (таблица факта “REVENUE”) составлен из четырех внешних ключей: movie_key, market_key, customer_key и
- 37. Слайд 36 Наиболее часто встречающихся типы фактов факты, связанные с транзакциями (Transaction facts). Они основаны на
- 38. Слайд 37 О детализации фактов Для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные
- 39. Слайд 38 Правила агрегации данных В таблице фактов нет никаких сведений о том, как группировать записи
- 40. Слайд 39 Таблицы измерений Таблицы измерений содержат неизменяемые либо редко изменяемые данные (типа справочник). В подавляющем
- 41. Слайд 40 Отличие от схемы «звезда» Если хотя бы одно измерение содержится в нескольких связанных таблицах,
- 42. Слайд 41 Связи консольных таблиц Консольные таблицы могут быть связаны только таблицами размерности, причем консольная таблица
- 43. Слайд 42 Закладка Dimensional диалога Table Editor В диалоге описания свойств таблицы Table Editor имеется закладка
- 44. Слайд 43 Правила хранения данных (Data Warehouse Rules) Для каждой таблицы можно задать шесть типов правил
- 45. Слайд 44 2. Кубы данных (многомерная модель данных)
- 46. Слайд 45 Понятие о кубах Куб OLAP - это структура, в которой хранятся совокупности данных, полученные
- 47. Слайд 46 Вид трехмерного куба
- 48. Слайд 47 Основными понятиями многомерной модели данных являются: Показатель - это величина (обычно числового типа), которая
- 49. Слайд 48 Роль измерений в кубе Измерения играют роль индексов, используемых для идентификации значений показателей, находящихся
- 50. Слайд 49 Иерархии в измерениях необходимы для возможности агрегации и детализации значений показателей Существуют следующие типы
- 51. Слайд 50 Сбалансированные иерархии Это - иерархии, в которых число уровней определено её структурой и неизменно,
- 52. Слайд 51 Несбалансированные иерархии Это - иерархии, в которых число уровней может быть изменено, и каждая
- 53. Слайд 52 Неровные иерархии Это- иерархии, в которых число уровней определено её структурой и постоянно, однако
- 54. Слайд 53 Агрегаты Агрегатами называют агрегированные по определенным условиям исходные значения показателей. Обычно под агрегацией понимается
- 55. Слайд 54 DW с витринами данных
- 56. Слайд 55 Многомерный куб с несколькими таблицами фактов
- 57. Слайд 56 Варианты реализации хранилищ данных: Виртуальное хранилище данных Концепция CIF Концепция Data Warehouse Bus Гибридная
- 58. Слайд 57 Виртуальное хранилище данных В данном случае в отличие от классического (физического) ХД данные из
- 59. Слайд 58 Основными достоинствами виртуального ХД являются: минимизация объема памяти, занимаемой на носителе информации; работа с
- 60. Слайд 59 Недостатки технологии виртуального хранилища Время обработки запросов к виртуальному ХД значительно превышает соответствующие показатели
- 61. Слайд 60 Концепция Corporate Information Factory, (сокр. СIF) Билла Инмона Концепция CIF объединила оперативные приложения, накопители
- 62. Слайд 61 Работа Хранилища СIF состоит из следующих этапов: скоординированное извлечение данных из источников. загрузка реляционной
- 63. Слайд 62 Концепция Data Warehouse Bus Использование пространственной модели организации данных с архитектурой "звезда" (star scheme).
- 64. Слайд 63 Гибридное хранилище данных В последнее время все более популярной становится идея совместить концепции хранилища
- 65. Слайд 64 Гибрид нормализованного и пространственного Хранилищ данных
- 66. Слайд 65 Первый уровень гибридного хранилища На первом уровне реализуется корпоративное хранилище данных на основе одной
- 67. Слайд 66 Второй уровень гибридного хранилища На втором уровне поддерживаются витрины данных на основе многомерной системы
- 68. Слайд 67 Третий уровень гибридного хранилища На третьем уровне находятся клиентские рабочие места конечных пользователей, на
- 69. Слайд 68 Форматы хранения данных в OLAP кубах
- 70. Слайд 69 Данные форматы различаются методами хранения кубов данных многомерный OLAP-формат (Multi-dimensional OLAP - MOLAP); реляционный
- 71. Слайд 70 MOLAP MOLAP является многомерным форматом хранения данных, который отличается высоким быстродействием. Помимо поддержки OLAP
- 72. Слайд 71 Преимущества и недостатки MOLAP Поскольку MOLAP требует копирования и преобразования всех данных в надлежащий
- 73. Слайд 72 Область применения MOLAP объем исходных данных для анализа не слишком велик (не более нескольких
- 74. Слайд 73 ROLAP Реляционные хранилища OLAP содержат данные, передаваемые в кубы данных, вместе с агрегациями данных
- 75. Слайд 74 Преимущества ROLAP: в большинстве случаев корпоративные хранилища данных реализуются средствами реляционных СУБД, и инструменты
- 76. Слайд 75 Недостатки ROLAP Главный недостаток ROLAP по сравнению с MOLAP — меньшая производительность. Для обеспечения
- 77. Слайд 76 HOLAP Гибридная архитектура, которая объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая
- 78. Слайд 77 Преимущества и недостатки HOLAP Преимуществом данной системы является обеспечение возможности связи с огромными наборами
- 79. Слайд 78
- 80. Слайд 79
- 82. Скачать презентацию