dbt Core(data build tool)是一款专为现代数据分析团队打造的开源数据转换工具。它让数据分析师和工程师能像开发软件一样,用版本可控、可测试、可复用的SQL代码来构建数据模型,彻底告别手工写脚本、散落各处的SQL文件和难以维护的数据管道。简单说:它把“数据加工”变成一门真正的工程实践,而不是临时救火的运维任务。
核心功能
- 声明式建模:用纯SQL定义数据模型(如视图、表、增量表),dbt自动解析依赖关系、生成执行顺序,无需手动写调度逻辑
- 版本化与协作:所有模型代码存于Git仓库,支持Code Review、分支开发、回滚发布——真正实现数据开发的DevOps流程
- 自动化测试与质量保障:内置唯一性、非空、关系一致性等通用测试,也支持自定义SQL断言,让数据质量内嵌在开发流程中
- 文档一键生成:运行
dbt docs generate即可自动生成交互式数据字典,包含字段说明、血缘关系、模型描述,告别Wiki式文档维护 - 跨平台兼容性强:原生支持Snowflake、BigQuery、Redshift、PostgreSQL、Databricks等主流数仓/湖仓,一套模型代码轻松迁移
- v2.0 Rust重构带来质变性能:新Alpha版采用Rust重写核心引擎(Fusion),大型项目编译速度提升3–5倍,万级模型秒级解析,显著缩短开发反馈周期
适合哪些人用
如果你是以下角色之一,dbt Core值得立刻纳入技术栈:
✅ 数据分析师:想摆脱Excel公式和零散SQL,用工程化方式沉淀分析逻辑;
✅ 数据工程师:厌倦维护Airflow DAG和Shell脚本,渴望统一、可扩展的数据转换层;
✅ BI工程师:需要稳定、语义清晰的下游数据源,让看板开发不再反复找数、修口径;
✅ 数据平台团队:正推动数据治理、血缘追踪、模型标准化,dbt天然提供元数据基础。
快速上手
当前生产推荐使用Python版dbt-core==1.8.x(稳定成熟);若想尝鲜高性能未来架构,可试用Rust版v2.0 Alpha:
• 安装v1(Python):pip install dbt-core dbt-snowflake(根据目标平台选适配器)
• 初始化项目:dbt init my_project,然后在models/下编写.sql文件
• 运行转换:dbt run;生成文档:dbt docs serve
• v2.0 Alpha暂未发布PyPI包,需从GitHub 1.latest分支克隆Python版,或关注Fusion引擎文档获取Rust构建指南
项目信息
dbt-labs/dbt-core
GitHub
dbt enables data analysts and engineers to transform their data using the same practices that software engineers use to build applications.
13.2k
今日 +45 stars today
Stars
2.4k
Forks
Rust
Apache-2.0
编程语言:Rust(v2.0核心) + Python(v1.x主力)| Star 数:13201| 开源协议:Apache-2.0| GitHub 项目地址
dbt Core不是又一个ETL工具,而是数据团队走向工程化、规模化协作的关键基础设施——当你开始用Git管理SQL,用CI跑数据测试,用文档看血缘,你就已经走在现代数据栈的正确路上。




