BANG
MARKET
GO SHOPPING
!
ПОИСК
(
0
)
Главная
KARPOV.COURSES
Аналитика
Работа с данными
ФИЛЬТРЫ КАТЕГОРИИ
сбросить фильтры
СОРТИРОВАТЬ
не выбрано
Цена: сначала дешевле
Цена: сначала дороже
Название: А-Я
Название: Я-А
ЦЕНА
от (min)
до (max)
ПРИМЕНИТЬ
ПЛАН
в работе инженеры часто сталкиваются с подготовкой данных для обучения ml-моделей. рассмотрим инструменты для построения ml-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.
на практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.
начнём погружение в инженерию данных со знакомства с реляционными и mpp базами данных. рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях mpp субд оказываются лучше традиционных. научимся готовить postgresql и mpp базы данных на примере greenplum.
познакомимся с механизмами распределённого хранения больших данных на базе hadoop, разберём основные паттерны реализации их распределённой обработки. рассмотрим вопросы отказоустойчивости и восстановления после сбоев. поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий spark.
познакомимся с теорией распределённого машинного обучения. научимся работать с популярным модулем spark ml и рассмотрим подходы к обучению и применению моделей на больших данных.
рассмотрим облачные решения и инструменты для построения dwh и data lake. познакомимся с kubernetes и научимся применять его для работы с данными. поработаем с облаком на практике, рассмотрим процесс установки и настройки jupyterhub и spark в kubernetes.
рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. познакомимся с tableau — гибким и мощным bi-инструментом. узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга dwh платформы.
data warehouse — централизованное хранилище данных из разных источников. познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя dwh.
etl — ключевой процесс в управлении хранилищами данных. рассмотрим принципы и основные этапы его построения. познакомимся с популярным инструментом airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать etl-пайплайны.
Работа с данными
Инженер данных
104 000
₽
ПОДРОБНЕЕ