Nằm trong lộ trình phát triển sản phẩm nhằm tối ưu trải nghiệm người dùng, FPT Cloud chính thức ra mắt 04 dịch vụ hoàn toàn mới trên FPT Data Platform gồm FPT Ingestion, FPT Processing, FPT Lakehouse Analytics và FPT Data Governance & Security giúp doanh nghiệp tổ chức khai thác, quản lý và bảo mật dữ liệu một cách linh hoạt, chính xác và hiệu quả.
1. FPT Ingestion – Quản lý dữ liệu liên mạch & toàn diện
FPT Ingestion là giải pháp tối ưu hóa việc thu thập, xử lý và truyền tải dữ liệu theo thời gian thực được tích hợp công nghệ CDC (Change Data Capture) và Apache NiFi trên nền tảng điện toán đám mây giúp đơn giản hoá quy trình quản lý dữ liệu, đảm bảo hiệu suất cao và khả năng mở rộng linh hoạt.
Với CDC (Change Data Capture), FPT Ingestion có khả năng ghi nhận và đồng bộ hoá mọi thay đổi dữ liệu từ các nguồn cơ sở dữ liệu(như MySQL, Oracle, SQL Server) theo thời gian thực mà không cần sao chép toàn bộ dữ liệu, hệ thống giúp giảm tải, tối ưu hiệu suất và đảm bảo dữ liệu luôn được cập nhật tức thời.
Với Apache NiFi – công cụ mã nguồn mở mạnh mẽ, người dùng có thể thiết kế luồng dữ liệu trực quan, xử lý từ nhiều nguồn (cơ sở dữ liệu, IoT, API...) và đưa vào các hệ thống đích như Data Lake hoặc kho dữ liệu phân tích.
FPT Ingestion mang đến giao diện thân thiện, khả năng tự động hoá và tích hợp liền mạch giúp doanh nghiệp xử lý dữ liệu lớn (Big Data) một cách hiệu quả, đảm bảo dữ liệu luôn sẵn sàng cho các nhu cầu phân tích và ra quyết định.
Một số đặc điểm nổi bật của FPT Ingestion:
- Tích hợp đa dạng: FPT Ingestion hỗ trợ kết nối liền mạch với nhiều loại nguồn dữ liệu khác nhau như cơ sở dữ liệu, API, thiết bị IoT, đồng thời dễ dàng chuyển đổi dữ liệu đến các nền tảng đích như Data Warehouse hay Data Lake.
- Cập nhật theo thời gian thực và chính xác: Với cơ chế cập nhật tức thì mỗi khi có sự thay đổi và sự kết hợp mạnh mẽ cùng Apache NiFi trong xử lý luồng dữ liệu liên tục, FPT Ingestion mang đến nguồn thông tin chính xác, kịp thời và đáng tin cậy cho mọi quyết định kinh doanh.
- Dễ dàng quản lý: Giao diện trực quan thân thiện của NiFi cùng tính năng tự động hóa cao giúp giảm thiểu tối đa công sức vận hành và quản lý dữ liệu, đồng thời nâng cao hiệu suất làm việc của đội ngũ kỹ thuật.
- Khả năng mở rộng linh hoạt: FPT Ingestion dễ dàng điều chỉnh tài nguyên theo quy mô và nhu cầu của doanh nghiệp, từ các startup nhỏ đến các tập đoàn đa quốc gia, mà không đòi hỏi đầu tư ban đầu lớn, đảm bảo tối ưu hiệu quả vận hành và chi phí.
FPT Ingestion hỗ trợ doanh nghiệp:
- Phân tích dữ liệu thời gian thực: Tích hợp CDC và Apache NiFi giúp ghi nhận và đồng bộ mọi thay đổi dữ liệu ngay khi phát sinh, đảm bảo dashboard và báo cáo luôn cập nhật, phục vụ quyết định nhanh chóng.
- Tích hợp dữ liệu từ nhiều hệ thống dễ dàng, không gián đoạn: Hỗ trợ nhiều hệ thống (MySQL, MongoDB, Kafka, API, IoT) và đích đến như Data Lake, với giao diện kéo – thả đơn giản, tự động hóa xử lý dữ liệu mà không làm gián đoạn vận hành.
- Mở rộng quy mô với nền tảng linh hoạt & bền vững: FPT Ingestion giúp tổ chức, doanh nghiệp dễ dàng mở rộng quy mô xử lý nhờ kiến trúc phân tán, hỗ trợ scaling tài nguyên linh hoạt theo thời điểm.
2. FPT Processing - Tăng tốc độ xử lý, đảm bảo tính nhất quán cho ứng dụng
FPT Processing là giải pháp xử lý dữ liệu mạnh mẽ trên nền tảng điện toán đám mây. Dịch vụ tích hợp Apache Spark, Apache Flink, cho phép xử lý luồng dữ liệu lớn theo thời gian thực, phân tích dữ liệu phức tạp và tối ưu hóa quy trình kinh doanh với hiệu suất vượt trội.
Apache Spark là công cụ xử lý dữ liệu phân tán với tốc độ cao, phù hợp cho phân tích dữ liệu lớn (Big Data), học máy (Machine Learning) và xử lý hàng loạt (batch processing). Bên cạnh đó, Apache Spark còn cung cấp khả năng tính toán trong bộ nhớ (in-memory), giúp tăng tốc độ xử lý gấp nhiều lần so với các công cụ truyền thống.
Apache Flink là nền tảng xử lý luồng dữ liệu (stream processing) theo thời gian thực với độ trễ thấp, phù hợp cho các ứng dụng cần xử lý liên tục và phân tích dữ liệu ngay lập tức; đảm bảo tính nhất quán và khả năng chịu lỗi vượt trội cho ứng dụng.
Một số đặc điểm nổi bật của FPT Processing:
- Xử lý đồng thời theo thời gian thực: FPT Processing kết hợp Flink cho luồng dữ liệu liên tục và Spark cho xử lý hàng loạt, đáp ứng mọi nhu cầu phân tích dữ liệu của doanh nghiệp.
- Hiệu suất vượt trội: Tăng tốc độ xử lý với tính toán trong bộ nhớ, đảm bảo độ trễ thấp và xử lý chính xác dữ liệu thời gian thực.
- Tối ưu chi phí: FPT Processing tối ưu hóa việc sử dụng tài nguyên thông qua việc quản lý tài nguyên cụm (cluster) thông minh, giúp các tổ chức có thể đạt được hiệu suất tối ưu mà không cần đầu tư nhiều vào phần cứng.
- Khả năng mở rộng linh hoạt: Dễ dàng điều chỉnh tài nguyên theo khối lượng dữ liệu, phù hợp với mọi quy mô doanh nghiệp.
FPT Processing có khả năng hỗ trợ các doanh nghiệp:
- Xử lý dữ liệu theo thời gian thực hỗ trợ doanh nghiệp đưa ra quyết định nhanh chóng và chính xác: Với Apache Flink, FPT Processing giúp phân tích luồng dữ liệu theo thời gian thực, từ đó phát hiện các dấu hiệu gian lận, vi phạm hoặc rủi ro tức thời. Đồng thời, Apache Spark hỗ trợ tổng hợp và phân tích dữ liệu lịch sử để huấn luyện mô hình Machine Learning dự đoán rủi ro.
- Cá nhân hóa trải nghiệm mua sắm với dữ liệu realtime: FPT Processing kết hợp Flink (streaming) để xử lý clickstream và Spark (batch) để phân tích xu hướng mua sắm giúp cá nhân hóa trải nghiệm và nâng cao tỷ lệ chuyển đổi.
- Sản xuất & IoT – Giám sát thiết bị và tối ưu hóa quy trình vận hành:Trong môi trường sản xuất thông minh, các cảm biến IoT liên tục gửi dữ liệu về tình trạng thiết bị, nhiệt độ, độ rung, tốc độ… Apache Flink giúp xử lý những dữ liệu này theo thời gian thực để phát hiện bất thường, cảnh báo sự cố, trong khi Apache Spark hỗ trợ phân tích dữ liệu lịch sử để lên lịch bảo trì tối ưu.
3. FPT Lakehouse Analytics - Truy vấn, quản lý, trực quan hóa dữ liệu hiệu quả
FPT Lakehouse Analytics là giải pháp phân tích dữ liệu toàn diện nhờ tận dụng sức mạnh của các công nghệ mã nguồn mở hàng đầu để xây dựng một hệ sinh thái dữ liệu hiện đại. Trong đó Trino đóng vai trò là engine truy vấn phân tán tốc độ cao, cho phép thực thi các truy vấn SQL phức tạp trên dữ liệu đa nguồn mà không cần di chuyển. Trino hỗ trợ federated queries và tối ưu hóa hiệu năng ở quy mô lớn, mở ra khả năng phân tích tức thời và toàn diện cho doanh nghiệp.
Đồng bộ cùng Trino, Hive Metastore cung cấp metadata tập trung, tổ chức và quản lý thông tin cấu trúc dữ liệu một cách nhất quán, đảm bảo khả năng truy cập hiệu quả trong kiến trúc Lakehouse. Nessie, với cơ chế quản lý phiên bản dữ liệu theo mô hình Git, giúp kiểm soát lịch sử thay đổi, thực hiện sao chép tức thời (zero-copy cloning) và khôi phục dữ liệu linh hoạt – mang lại độ tin cậy cao trong môi trường data lake hiện đại. Cuối cùng, Apache Superset đóng vai trò là lớp trực quan hóa mạnh mẽ, cho phép người dùng tạo dashboard tương tác, thực hiện phân tích dữ liệu trực tiếp trên Trino với giao diện trực quan, dễ sử dụng. Tất cả kết hợp tạo nên một nền tảng analytics toàn diện, mở rộng và tối ưu cho doanh nghiệp chuyển đổi số.
Một số đặc điểm nổi bật của FPT Lakehouse Analytics:
- Hiệu suất truy vấn vượt trội: FPT Lakehouse Analytics cung cấp khả năng xử lý truy vấn song song trên dữ liệu lớn, giảm thời gian chờ đợi cho các phân tích phức tạp.
- Quản lý metadata tập trung: Đảm bảo dữ liệu được tổ chức rõ ràng, dễ dàng truy cập bởi nhiều công cụ trong hệ sinh thái.
- Kiểm soát phiên bản linh hoạt: Mang lại khả năng theo dõi và quản lý thay đổi dữ liệu, giúp giảm rủi ro và hỗ trợ thử nghiệm dữ liệu an toàn.
- Trực quan hóa dữ liệu dễ dàng: Cho phép người dùng tạo ra các báo cáo và dashboard chi tiết mà không cần viết mã phức tạp.
FPT Lakehouse Analytics hỗ trợ doanh nghiệp:
- Truy vấn nhanh trên nhiều nguồn dữ liệu: Với Trino – công cụ truy vấn phân tán tốc độ cao, FPT Lakehouse Analytics cho phép chạy truy vấn SQL trực tiếp trên nhiều nguồn mà không cần di chuyển dữ liệu, tiết kiệm thời gian và chi phí xử lý.
- Kiểm soát chất lượng & phiên bản dữ liệu – Giảm rủi ro phân tích sai lệch: Với Nessie, FPT Lakehouse Analytics giúp bạn theo dõi toàn bộ lịch sử thay đổi, sao chép dữ liệu tức thì mà không mất dung lượng (zero-copy clone), và dễ dàng phục hồi khi có sự cố hoặc cần kiểm thử mô hình.
- Trực quan hóa dữ liệu dễ hiểu cho người không chuyên: Với Apache Superset tích hợp trong FPT Lakehouse Analytics, người dùng có thể kéo – thả để tạo dashboard, báo cáo, biểu đồ tương tác mà không cần kỹ thuật cao. Kết nối trực tiếp với Trino giúp dữ liệu luôn “tươi mới” và chính xác.
4. FPT Data Governance & Security - Tăng cường khả năng quản lý tài sản dữ liệu doanh nghiệp
FPT Data Governance & Security là giải pháp quản trị và bảo mật dữ liệu toàn diện, giúp doanh nghiệp kiểm soát hiệu quả tài sản dữ liệu trong môi trường phân tán và phức tạp. Giải pháp tích hợp Apache Ranger – nền tảng bảo mật mã nguồn mở cho phép thiết lập các chính sách truy cập chi tiết (fine-grained access control), quản lý quyền truy cập tập trung, giám sát hành vi người dùng và ghi nhật ký hoạt động nhằm đáp ứng các yêu cầu tuân thủ và bảo vệ dữ liệu quan trọng trên nhiều hệ thống như Hadoop, Data Lake, cơ sở dữ liệu...
Song song đó, OpenMetadata đóng vai trò là hệ thống quản lý metadata hiện đại, cung cấp catalog dữ liệu tập trung, hỗ trợ khám phá, phân loại và theo dõi nguồn gốc dữ liệu (data lineage). Với khả năng tích hợp sâu và tự động hóa cao, OpenMetadata giúp doanh nghiệp xây dựng bản đồ dữ liệu thống nhất, nâng cao khả năng quản trị, hiểu rõ luồng dữ liệu và tối ưu hiệu quả khai thác dữ liệu trên toàn tổ chức.
Một số đặc điểm nổi bật của FPT Data Governance & Security:
- Bảo mật dữ liệu tối ưu: Cung cấp khả năng kiểm soát truy cập chi tiết và giám sát hoạt động, đảm bảo dữ liệu nhạy cảm được bảo vệ trước các truy cập trái phép.
- Quản lý metadata hiệu quả: FPT Data Governance & Security giúp tổ chức, phân loại và theo dõi nguồn gốc dữ liệu, tăng cường khả năng khám phá và sử dụng dữ liệu trong doanh nghiệp.
- Tuân thủ quy định: Với khả năng ghi nhật ký chi tiết từ Ranger và khả năng quản lý dữ liệu của OpenMetadata, FPT Data Governance & Security giúp đáp ứng các yêu cầu pháp lý và kiểm toán dễ dàng.
- Tăng cường tính minh bạch: Cung cấp cái nhìn rõ ràng về ai truy cập dữ liệu, dữ liệu đến từ đâu và được sử dụng như thế nào, cải thiện quản trị nội bộ.
FPT Lakehouse Analytics hỗ trợ doanh nghiệp:
- Bảo vệ dữ liệu ngay từ cốt lõi: FPT Data Governance & Security giúp thiết lập chính sách kiểm soát truy cập chi tiết với Apache Ranger, cho phép phân quyền truy cập đến từng bảng, cột hoặc người dùng cụ thể. Tất cả hành vi truy cập đều được ghi lại (audit logging) nhằm đảm bảo minh bạch và dễ dàng truy vết khi cần.
- Quản lý metadata tập trung, dễ dàng truy xuất: OpenMetadata trong FPT Data Governance & Security mang đến một catalog dữ liệu tập trung, giúp tổ chức theo dõi data lineage, phân loại dữ liệu và khám phá nhanh chóng những gì đang có và ai đang sử dụng.
- Đảm bảo khả năng audit bất cứ lúc nào: FPT Data Governance & Security giúp kết hợp kiểm soát truy cập (Apache Ranger) và quản lý metadata, phân loại nhạy cảm (OpenMetadata), sẵn sàng hỗ trợ kiểm toán nội bộ hoặc bên ngoài.
Liên hệ với chúng tôi để được tư vấn chi tiết về các giải pháp, dịch vụ của FPT Cloud