导读:本次分享题目为 58 敏捷 BI 系统的设计与实践,由来自 58 同城负责星火可视化分析产品自研团队的张自博老师带来经验分享,主要围绕四个方面展开介绍:
背景介绍:敏捷 BI 平台介绍
架构设计:敏捷 BI 技术架构介绍
难点攻关:核心功能技术探究
未来展望:敏捷BI平台迭代方向
分享嘉宾|张自博 58同城 资深研发工程师
编辑整理|李挺 上海琢学
出品社区|DataFun

1. 星火功能介绍


2. 敏捷 BI 行业背景

3. 星火功能架构


4. 星火推广效果

架构设计

难点攻关









2. 高性能 BI 查询引擎
问题1:查询慢
问题2:语法多样性
问题3:异构数据查询
问题4:二次计算




3. MPP 缓存加速
针对 Hive 数据表,原生的查询性能比较差,不适合 OLAP 分析。从而需要将数据抽取进入中间数据库; 针对 Excel、CSV 等数据源,无法通过 SQL 查询取数; 另外针对内部的云窗文档系统,需要提供数据抽取的能力。





ClickHouse 是一个非常高性能的 MPP 数据库,在单表查询方面性能优越; 基于 Zookeeper 提供的分布式协调能力,也支持分布式表。
星火使用了副本合并数的表引擎,实现了副本能力;通过创建分布式表,实现了分片能力。通过两种技术方案的融合,保障了集群的高可用和高性能。
基于分布式表,星火的读写逻辑做了差异化设计实现
随着业务增长,不可避免的引出磁盘空间不足的问题
进一步降低星火运行风险






5. 星火开发者服务


04
更多样的数据源:支持 API 数据源、流式数据、非 SQL 语法数据源等的接入; 更方便的数据处理:轻量化的 ETL 能力、电子表格能力; 更强大的可视化组件:图形语法组件、自定义数据门户; 更智能的星火:包括智能预警、指标归因分析等。
