FPT Cloud Data Platform – Nền tảng xử lý dữ liệu đầu tiên dành riêng cho doanh nghiệp Việt
Xem nhanh
FPT Cloud Data Platform là một giải pháp công nghệ toàn diện được triển khai trên cơ sở hạ tầng đám mây để quản lý, lưu trữ, xử lý và phân tích dữ liệu. Đây là một môi trường tích hợp cho phép các doanh nghiệp dễ dàng làm việc với dữ liệu từ nhiều nguồn khác nhau, cung cấp khả năng mở rộng linh hoạt và truy cập từ bất kỳ đâu. FPT Cloud Data Platform có khả năng bao quát các bài toán lớn về dữ liệu của các cơ quan, tổ chức với 4 giải pháp chính từ: Kết nối và tổng hợp dữ liệu nhiều nguồn; Lưu trữ dữ liệu, xử lý dữ liệu; Khai phá và trực quan hóa dữ liệu.
FPT Cloud Data Platform với bộ công cụ cho phép cài đặt trực tiếp trên VPC và khách hàng có thể sử dụng các dịch vụ như CDC(Change Data Capture) từ database nguồn tới đích thông qua dịch vụ Kafka, trực quan hóa dữ liệu với Apache Superset và Data Processing với Apache Spark
FPT CDC cho phép bạn nắm bắt các thay đổi dữ liệu trong cơ sở dữ liệu nguồn. FPT CDC dễ dàng sao chép, nhân bản (replicate) hoặc chuyển đổi (migrate) dữ liệu giữa nhiều database khác nhau theo thời gian thực.
FPT Cloud Data Platform cung cấp dịch vụ FPT CDC với nguồn là MongoDB và PostgreSQL, sink là MongDB và ClickHouse:
FPT CDC cho phép người dùng có thể cấu hình và cài đặt trực tiếp Kafka-Connect, Connector trực tiếp trên UI.
Postgre Source connector
Quản lý, cấu hình, cài đặt Postgre Source connector để thu thập dữ liệu từ Postgres database vào trong Kafka topic.
ClickHouse Sink connector
Quản lý, cấu hình, cài đặt ClickHouse sink connector để cung cấp dữ liệu từ các Kafka topic vào ClickHouse database.
Mongo source connector
Quản lý, cấu hình, cài đặt Mongo Source connector để thu thập dữ liệu từ Mongo database vào trong Kafka topic.
Mongo sink connector
Quản lý, cấu hình và cài đặt Mongo sink connector để cung cấp dữ liệu từ các Kafka topic vào Mongo database.
Postgres source connector
Quản lý, cấu hình và cài đặt Mongo Source connector để thu thập dữ liệu từ Mongo database vào trong Kafka topic.
Mongo sink connector
Quản lý, cấu hình và cài đặt Mongo sink connector để cung cấp dữ liệu từ các Kafka topic vào Mongo database.
Dịch vụ Spark Cluster – cung cấp Apache Spark, nền tảng giúp xử lý và phân tích dữ liệu lớn một cách dễ dàng và hiệu quả.
Spark Cluster services cho phép người dùng có thể:
Cài đặt Apache Airflow: cho phép người dùng viết job spark
Cấu hình, tích hợp Airflow với SSO (fptcloud, keycloak và google authentication)
Tích hợp mount S3 vào VPC khách hàng
Quản lý, cấu hình, cài đặt Spark History Server cho phép người dùng giám sát theo dõi logs chạy jobs
Người dùng có thể:
Cấu hình và cài đặt Apache Superset trên UI
Tích hợp sẵn SSO (fptcloud, keycloak và google authentication).