Flink + StarRocks 实时数仓分层架构
重点: CDC/Kafka -> ODS/DWD/DWS -> OLAP Serving -> 实时大屏. 关键要素: MySQL 8.0, ROW Binlog, GTID(可选).
Use this as a block diagram of the system when explaining architecture.
Preview
Prompt
基于 Flink 和 StarRocks 的实时数仓分层架构图。数据源层通过 CDC 采集 MySQL 业务数据和 Nginx 日志写入 Kafka;计算层使用 Flink 引擎进行流式处理,构建实时 ODS 层、DWD 明细层和 DWS 汇总层;存储服务层使用 StarRocks/ClickHouse 承接高并发聚合查询,最终对接 DataV 或 ECharts 实时大屏进行可视化展示。
Highlights
- Layer details · 数据源层(Source Systems): Modules include MySQL 业务库, Nginx 访问日志.
- Module responsibilities · 数据源层(Source Systems) / Nginx 访问日志: 产出行为与流量日志; 支撑实时监控与用户行为分析
- Module responsibilities · 数据源层(Source Systems) / MySQL 业务库: 产出业务事实与维度数据; 通过 Binlog 输出增量变更供 CDC 捕获
Overview
Flink + StarRocks 实时数仓分层架构(CDC/Kafka -> ODS/DWD/DWS -> OLAP Serving -> 实时大屏) has 5 layers: 数据源层(Source Systems), 采集与消息层(CDC + Kafka Bus), 实时计算层(Flink Warehouse), 存储服务层(OLAP Serving), 可视化展示层(Realtime BI).