Tất cả tài liệu

FPT Data Platform

    DBT
    DBT
    Updated on 24 Jul 2025

    Để chạy dbt project trên môi trường notebooks, thực hiện theo các bước sau:

    Bước 1: Khởi tạo project dbt GIT với thư mục thuộc Workspace của người dùng trên Jupyterhub (Tham khảo tài liệu Orchestration service mục 5.3.3)

    Để chạy với Spark session, tệp profiles.yml trong dbt project cấu hình như sau:

    <​PROJECT-NAME>:
    
        target: dev
    
        outputs:
    
            dev:
    
              type: spark
    
              method: session
    
              schema: <​SCHEMA-NAME>
    
              database: <​DATABASE-NAME>
    
              catalog: iceberg
    
              host: NA
    
              server_side_parameters:
    
                spark.jars: /opt/spark/jars/iceberg-spark-runtime-3.5_2.12-1.5.0.jar,/opt/spark/jars/iceberg-aws-bundle-1.5.0.jar,/opt/spark/jars/hadoop-auth-3.3.4.jar,/opt/spark/jars/hadoop-aws-3.3.4.jar,/opt/spark/jars/nessie-spark-extensions-3.5_2.12-0.104.2.jar,/opt/spark/jars/hadoop-common-3.3.4.jar,/opt/spark/jars/aws-java-sdk-bundle-1.12.787.jar,/opt/spark/jars/openmetadata-spark-agent-1.0-beta.jar

    Bước 2: Trong giao diện làm việc với Jupyter Notebooks, chọn Other/Terminal

    Hình ảnh

    Bước 3: Tại giao diện Terminal, truy cập đến thư mục chứa nội dung dbt project và sử dụng dbt command để thực thi

    Hình ảnh