5 марта 2025 г.
Что делать: Разрабатывать трансформации данных с использованием PySpark на основе логики существующего Python/T-SQL кода (MS SQL), организовывать ETL-процессы выгрузки данных Apache Hudi-таблиц из S3 в ODS-слой на Greenplum, реализовывать CDC-методы в соответствии с описанием от архитектора.
О компании: Robusta — IT-холдинг, внедряющий инструменты для повышения эффективности бизнес-процессов и работающий по всему миру. Компания вывела на рынок несколько успешных IT-проектов и собрала их в единую экосистему.