Всем привет!
Мир больших данных постоянно развивается, и вместе с ним появляются новые понятия. Чтобы помочь вам разобраться, мы подготовили краткий обзор по ключевым из них: Lakehouse, Data Lineage, Дата-контракты и Дата-продукты.
🌟 Lakehouse – это современная архитектура хранения и обработки данных, которая объединяет в себе ключевые преимущества двух классических подходов: Data Lake (озеро данных, которое предназначено для хранения неструктурированных данных) и Data Warehouse (хранилище данных). Такой подход позволяет эффективно обрабатывать различные типы данных и решать задачи от BI (бизнес-аналитики) до ML и AI.
🌟Data Lineage – это история жизни данных от источника до конечного результата. Это как след, который оставляют данные на своем пути, позволяющий отследить их преобразования и понять их происхождение: источник данных (база данных, файл, API и т.д.), все этапы обработки, очистки, агрегации и трансформации данных, кто и когда использовал данные (пользователи, приложения, процессы).
Авто-репост. Читать в блоге >>>

Финаме
БКС Мир Инвестиций



