Slovník datových pojmů
Srozumitelné vysvětlení klíčových termínů z datového inženýrství, umělé inteligence, cloud computingu a automatizace procesů.
Apache Airflow
Open-source platforma pro orchestraci datových pipeline definovaných v Pythonu jako DAG.
Apache Iceberg
Open table format pro analytické tabulky, navržený pro velké datasety s ACID, hidden partitioning a evolucí schématu.
Apache Kafka
Distribuovaná streamingová platforma pro publish/subscribe zpracování událostí v reálném čase.
Data Catalog
Centrální inventář datových zdrojů s metadaty, vlastnictvím a lineage pro vyhledávání a governance.
Data Governance
Sada pravidel, procesů a standardů pro správu datových aktiv v organizaci.
Data Lake
Centrální úložiště pro surová data v libovolném formátu — strukturovaná i nestrukturovaná.
Data Lakehouse
Hybridní architektura kombinující flexibilitu data lake a výkon datového skladu nad otevřenými formáty.
Data Mesh
Decentralizovaná architektura pro správu dat, kde za data odpovídají doménové týmy.
Data Observability
Monitoring zdraví datových pipeline pomocí pěti pilířů: freshness, volume, schema, distribution, lineage.
Data Pipeline
Automatizovaný tok dat od zdroje přes transformace k cílovému systému.
Data Quality (Kvalita dat)
Soubor procesů a metrik zajišťujících přesnost, úplnost, konzistenci a aktuálnost dat.
Data Vault 2.0
Metodika modelování datového skladu zaměřená na auditovatelnost, historizaci a snadné rozšiřování.
Data Warehouse (Datový sklad)
Centrální úložiště strukturovaných dat optimalizované pro analytické dotazy a reporting.
Databricks
Sjednocená data + AI platforma postavená na Apache Spark a Delta Lake, optimalizovaná pro lakehouse architekturu.
DataOps
Metodologie kombinující DevOps praktiky s datovým inženýrstvím pro rychlejší a spolehlivější datové dodávky.
Datová orchestrace
Koordinace a řízení datových pipeline a workflow napříč systémy.
dbt (Data Build Tool)
Open-source nástroj pro transformaci dat v cloudových DWH pomocí SQL, verzování a testů.
Delta Lake
Open-source storage layer přinášející ACID transakce, time travel a schema enforcement nad parquet soubory.