Knowledge Base

Slovník datových pojmů

Srozumitelné vysvětlení klíčových termínů z datového inženýrství, umělé inteligence, cloud computingu a automatizace procesů.

D

Data Catalog

Centrální inventář datových zdrojů s metadaty, vlastnictvím a lineage pro vyhledávání a governance.

Data Engineering

Data Governance

Sada pravidel, procesů a standardů pro správu datových aktiv v organizaci.

Data Engineering

Data Lake

Centrální úložiště pro surová data v libovolném formátu — strukturovaná i nestrukturovaná.

Data Engineering

Data Lakehouse

Hybridní architektura kombinující flexibilitu data lake a výkon datového skladu nad otevřenými formáty.

Data Engineering

Data Mesh

Decentralizovaná architektura pro správu dat, kde za data odpovídají doménové týmy.

Data Engineering

Data Observability

Monitoring zdraví datových pipeline pomocí pěti pilířů: freshness, volume, schema, distribution, lineage.

Data Engineering

Data Pipeline

Automatizovaný tok dat od zdroje přes transformace k cílovému systému.

Data Engineering

Data Quality (Kvalita dat)

Soubor procesů a metrik zajišťujících přesnost, úplnost, konzistenci a aktuálnost dat.

Data Engineering

Data Vault 2.0

Metodika modelování datového skladu zaměřená na auditovatelnost, historizaci a snadné rozšiřování.

Data Engineering

Data Warehouse (Datový sklad)

Centrální úložiště strukturovaných dat optimalizované pro analytické dotazy a reporting.

Data Engineering

Databricks

Sjednocená data + AI platforma postavená na Apache Spark a Delta Lake, optimalizovaná pro lakehouse architekturu.

Cloud

DataOps

Metodologie kombinující DevOps praktiky s datovým inženýrstvím pro rychlejší a spolehlivější datové dodávky.

Data Engineering

Datová orchestrace

Koordinace a řízení datových pipeline a workflow napříč systémy.

Data Engineering

dbt (Data Build Tool)

Open-source nástroj pro transformaci dat v cloudových DWH pomocí SQL, verzování a testů.

Data Engineering

Delta Lake

Open-source storage layer přinášející ACID transakce, time travel a schema enforcement nad parquet soubory.

Data Engineering