|
Лекция №1:
|
Технологии анализа данных.
|
Краткое содержание лекции:
Введение в анализ.
Принципы анализа данных.
Структурированные данные.
Подготовка данных к анализу.
Технологии KDD и Data Mining.
Аналитические платформы.
|
|
|
|
Лекция №2:
|
Консолидация данных.
|
Краткое содержание лекции:
Консолидация данных.
Введение в хранилища данных.
Основные концепции хранилищ данных.
Многомерные хранилища данных.
Реляционные хранилища данных.
Гибридные хранилища данных.
Виртуальные хранилища данных.
|
|
|
|
Лекция №3:
|
Технология ETL.
|
Краткое содержание лекции:
Введение в ETL.
Извлечение данных в ETL.
Очистка данных в ETL.
Преобразование данных в ETL.
Загрузка данных в хранилище.
Загрузка данных из локальных источников.
Обогащение данных.
|
|
|
|
Лекция №4:
|
Трансформация данных.
|
Краткое содержание лекции:
Введение в трансформацию данных.
Трансформация упорядоченных данных.
Группировка данных.
Слияние данных.
Квантование.
Транспонирование.
Нормализация и кодирование данных.
|
|
|
|
Лекция №5:
|
Визуализация данных.
|
Краткое содержание лекции:
Введение в визуализацию.
Визуализаторы общего назначения.
OLAP-анализ.
Визуализаторы для оценки качества моделей.
Визаулизаторы для интерпретации результатов анализа.
|
|
|
|
Лекция №6:
|
Очистка и предобработка данных.
|
Краткое содержание лекции:
Оценка качества данных;
Технологии и методы оценки качества данных;
Очистка и предобработка данных;
Фильтрация данных;
Обработка дубликатов и противоречий;
Выявление аномальных значений;
Восстановление пропущенных значений;
Введение в сокращение размерности;
Сокращение числа признаков;
Сокращение числа значений признаков и записей;
Сэмплинг.
|
|
|