FPT Cloud Data Platform – Nền tảng xử lý dữ liệu đầu tiên dành riêng cho doanh nghiệp Việt

FPT Cloud Data Platform – Nền tảng xử lý dữ liệu đầu tiên dành riêng cho doanh nghiệp Việt

Tác giả: [email protected]
11:09 22/08/2024
Data Platform ra mat dich vi

FPT Cloud Data Platform là một giải pháp công nghệ toàn diện được triển khai trên cơ sở hạ tầng đám mây để quản lý, lưu trữ, xử lý và phân tích dữ liệu. Đây là một môi trường tích hợp cho phép các doanh nghiệp dễ dàng làm việc với dữ liệu từ nhiều nguồn khác nhau, cung cấp khả năng mở rộng linh hoạt và truy cập từ bất kỳ đâu. FPT Cloud Data Platform có khả năng bao quát các bài toán lớn về dữ liệu của các cơ quan, tổ chức với 4 giải pháp chính từ: Kết nối và tổng hợp dữ liệu nhiều nguồn; Lưu trữ dữ liệu, xử lý dữ liệu; Khai phá và trực quan hóa dữ liệu.

FPT Cloud Data Platform với bộ công cụ cho phép cài đặt trực tiếp trên VPC và khách hàng có thể sử dụng các dịch vụ như CDC(Change Data Capture) từ database nguồn tới đích thông qua dịch vụ Kafka, trực quan hóa dữ liệu với Apache Superset và Data Processing với Apache Spark

FPT CDC - Change Data Capture

FPT CDC cho phép bạn nắm bắt các thay đổi dữ liệu trong cơ sở dữ liệu nguồn. FPT CDC dễ dàng sao chép, nhân bản (replicate) hoặc chuyển đổi (migrate) dữ liệu giữa nhiều database khác nhau theo thời gian thực.

FPT Cloud Data Platform cung cấp dịch vụ FPT CDC với nguồn là MongoDB và PostgreSQL, sink là MongDB và ClickHouse:

FPT CDC cho phép người dùng có thể cấu hình và cài đặt trực tiếp Kafka-Connect, Connector trực tiếp trên UI.

CDC từ Postgres sang ClickHouse

Postgre Source connector

Quản lý, cấu hình, cài đặt Postgre Source connector để thu thập dữ liệu từ Postgres database vào trong Kafka topic.

image 1

ClickHouse Sink connector

Quản lý, cấu hình, cài đặt ClickHouse sink connector để cung cấp dữ liệu từ các Kafka topic vào ClickHouse database.

image 2

CDC từ MongoDB sang MongoDB

Mongo source connector

Quản lý, cấu hình, cài đặt Mongo Source connector để thu thập dữ liệu từ Mongo database vào trong Kafka topic.

image 3

Mongo sink connector

Quản lý, cấu hình và cài đặt Mongo sink connector để cung cấp dữ liệu từ các Kafka topic vào Mongo database.

image 4

CDC từ Postgres sang MongoDB

Postgres source connector

Quản lý, cấu hình và cài đặt Mongo Source connector để thu thập dữ liệu từ Mongo database vào trong Kafka topic.

image 5

Mongo sink connector

Quản lý, cấu hình và cài đặt Mongo sink connector để cung cấp dữ liệu từ các Kafka topic vào Mongo database.

image 6

Spark Cluster Services

Dịch vụ Spark Cluster – cung cấp Apache Spark, nền tảng giúp xử lý và phân tích dữ liệu lớn một cách dễ dàng và hiệu quả.

Spark Cluster services cho phép người dùng có thể:

Apache Airflow

Cài đặt Apache Airflow: cho phép người dùng viết job spark8A2Z+h6S7Jb3sAAAAASUVORK5CYII=

Cấu hình, tích hợp Airflow với SSO (fptcloud, keycloak và google authentication)

image 8

Tích hợp mount S3 vào VPC khách hàng

image 10

Spark History Server

Quản lý, cấu hình, cài đặt Spark History Server cho phép người dùng giám sát theo dõi logs chạy jobs

image 11

Trực quan hóa dữ liệu với Apache Superset

Người dùng có thể:

Cấu hình và cài đặt Apache Superset trên UI

image 13

Tích hợp sẵn SSO (fptcloud, keycloak và google authentication).

image 14
FPT Cloud Data Platform – Nền tảng xử lý dữ liệu đầu tiên dành riêng cho doanh nghiệp Việt