Trong quá trình hiện đại hóa nền tảng dữ liệu, thách thức của doanh nghiệp không chỉ nằm ở việc khai thác dữ liệu nhanh hơn, mà còn ở khả năng kiểm soát dữ liệu một cách nhất quán và an toàn. Khi dữ liệu phân tán trên nhiều hệ thống, các vấn đề như phân quyền rời rạc, khó kiểm toán, thiếu chuẩn hóa thông tin và rủi ro với dữ liệu nhạy cảm ngày càng trở nên rõ rệt. Trước bài toán đó, FPT Data Governance & Security là lời giải giúp doanh nghiệp xây dựng giải pháp quản trị và bảo mật dữ liệu tập trung, thống nhất hơn trong toàn hệ thống.
FPT Data Governance & Security là gì?
FPT Data Governance & Security là giải pháp quản trị và bảo mật dữ liệu tập trung trong FPT Data Platform, được xây dựng trên các nền tảng mở gồm Apache Ranger, OpenMetadata và cung cấp hoàn toàn trên nền tảng đám mây (cloud-native) của FPT Cloud. Giải pháp phù hợp với các kiến trúc dữ liệu đa dạng như Lakehouse, Data Warehouse, và các nguồn dữ liệu được truy cập qua SQL layer.
Kiến trúc FPT Data Governance & Security được thiết kế xoay quanh hai luồng chính: luồng thực thi và luồng quản trị dữ liệu.
Luồng thực thi: người dùng truy vấn qua Trino; Ranger kiểm tra policy trước khi dữ liệu được trả về.
Luồng quản trị: OpenMetadata quản lý metadata và tag; tag được đồng bộ sang Ranger để tạo chính sách theo ngữ cảnh nghiệp vụ.
Các thành phần này tạo thành một Data Governance & Security Control Plane, giúp doanh nghiệp quản trị metadata, chính sách truy cập và luồng thực thi dữ liệu phân tích trên một lớp thống nhất.
Mô hình kiến trúc tổng quát FPT Data Governance & Security
FPT Data Governance & Security giúp doanh nghiệp kiến tạo nền tảng quản trị và bảo mật dữ liệu toàn diện, với những lợi ích vượt trội:
Quản lý quyền truy cập dữ liệu tập trung: Thiết lập cơ chế kiểm soát chặt chẽ, cho phép doanh nghiệp xác định chính xác đối tượng, phạm vi và mục đích khai thác dữ liệu.
Dễ tìm kiếm và dễ khai thác dữ liệu: Người dùng có thể hiểu dữ liệu nhanh hơn nhờ thông tin được mô tả rõ ràng, có người phụ trách, có luồng dữ liệu, bộ thuật ngữ nghiệp vụ và các đặc điểm dữ liệu khác.
Tăng độ tin cậy khi sử dụng dữ liệu: Dữ liệu được chuẩn hóa tốt hơn, hỗ trợ hiệu quả cho báo cáo, phân tích và các mô hình Data Product/Data Mesh.
Bảo vệ dữ liệu nhạy cảm: Các chính sách như masking và row filter giúp giới hạn dữ liệu hiển thị theo vai trò hoặc ngữ cảnh sử dụng.
Hỗ trợ giám sát, kiểm toán và tuân thủ: Lịch sử truy cập dữ liệu qua Trino được ghi nhận đầy đủ, giúp doanh nghiệp dễ dàng theo dõi, kiểm tra và đáp ứng các yêu cầu compliance.
Các nhóm tính năng chính
FPT Data Governance & Security được thiết kế với hai nhóm tính năng chính: Governance và Security. Trong đó, nhóm Governance giúp doanh nghiệp hiểu, chuẩn hóa và quản lý dữ liệu một cách rõ ràng hơn; còn nhóm Security tập trung vào kiểm soát quyền truy cập, bảo vệ dữ liệu nhạy cảm và hỗ trợ các yêu cầu giám sát, kiểm toán, tuân thủ.
Nhóm Governance
Nhóm tính năng Governance hỗ trợ doanh nghiệp minh bạch hóa tài sản dữ liệu, giúp xác định chính xác quyền sở hữu, lộ trình sử dụng và kiểm chứng độ tin cậy trước khi đưa vào khai thác thực tế. Các năng lực chính gồm:
Data Catalog (Danh mục dữ liệu): Quản lý danh sách database, schema, table, column cùng mô tả và thông tin liên quan. Tính năng này giúp người dùng tìm đúng dữ liệu nhanh hơn, giảm phụ thuộc vào việc hỏi đáp thủ công giữa các team.
Business Glossary (Bộ thuật ngữ nghiệp vụ): Chuẩn hóa các khái niệm, nhờ đó, các phòng ban có cùng cách hiểu về dữ liệu, hạn chế tình trạng cùng một chỉ số nhưng mỗi team diễn giải theo một cách khác nhau.
Ownership & Stewardship (Chủ sở hữu và người phụ trách dữ liệu): Gắn người phụ trách cho từng dataset hoặc data product. Đây là cơ sở để xác định ai chịu trách nhiệm với dữ liệu, ai xử lý yêu cầu truy cập và ai theo dõi các vấn đề liên quan đến chất lượng dữ liệu.
Classification & Tagging (Phân loại và gắn nhãn dữ liệu): Hỗ trợ gắn nhãn cho dataset hoặc column. Việc phân loại này giúp doanh nghiệp nhận diện dữ liệu quan trọng, dữ liệu nhạy cảm và tạo cơ sở để áp dụng chính bảo mật phù hợp, đồng thời giảm việc phân quyền thủ công theo từng bảng.
Lineage (Luồng dữ liệu): Theo dõi dữ liệu đi từ nguồn nào, qua các bước xử lý nào và tạo ra bảng hoặc dataset nào. Tính năng này giúp doanh nghiệp đánh giá tác động khi có thay đổi, phục vụ kiểm toán và xác định nguyên nhân khi dữ liệu phát sinh sai lệch.
Data Profiling (Phân tích đặc điểm dữ liệu): Thống kê các đặc điểm như số dòng, giá trị nhỏ nhất/lớn nhất hoặc phân bố dữ liệu... Nhờ đó, người dùng có thêm cơ sở đánh giá mức độ tin cậy của dữ liệu trước khi sử dụng cho báo cáo, AI hoặc phân tích.
Data Product/ Domain (Dữ liệu sản phẩm/ Miền dữ liệu): Hỗ trợ quản lý dữ liệu theo domain như Sales, Finance, Risk, Customer hoặc Operation. Cách tiếp cận này phù hợp với mô hình Data Mesh, trong đó từng domain có thể sở hữu, quản lý và áp dụng chính sách cho dữ liệu của mình.
Nhóm Security
Nhóm tính năng Security tập trung vào việc thực thi chính sách bảo mật dữ liệu tập trung, đặc biệt với các dữ liệu nhạy cảm hoặc cần đáp ứng yêu cầu tuân thủ. Đây là lớp giúp doanh nghiệp đảm bảo người dùng chỉ được truy cập đúng dữ liệu, đúng phạm vi và đúng quyền được cấp.
Các năng lực chính gồm:
RBAC (Phân quyền theo vai trò): Kiểm soát quyền truy cập dữ liệu theo user, group hoặc role, giúp doanh nghiệp quản lý rõ nhóm người dùng nào được xem, chỉnh sửa hoặc quản trị dữ liệu.
ABAC/ Tag-based Policy (Chính sách theo thuộc tính hoặc nhãn dữ liệu): Áp dụng chính sách truy cập dựa trên các tag dữ liệu được đồng bộ từ OpenMetadata sang Ranger. Nhờ đó, doanh nghiệp có thể kiểm soát truy cập theo ngữ cảnh dữ liệu, ví dụ dữ liệu PII chỉ cho nhóm Compliance truy cập, hoặc dữ liệu Finance chỉ mở cho nhóm tài chính và kiểm toán.
Column-level Security (Bảo mật theo cột dữ liệu): Giới hạn quyền truy cập với một số cột dữ liệu nhạy cảm, ví dụ các trường liên quan đến thông tin cá nhân, số điện thoại, lương hoặc mã định danh.
Dynamic Data Masking (Che dữ liệu động): Tự động che hoặc ẩn một phần dữ liệu nhạy cảm khi người dùng truy vấn, giúp giảm rủi ro lộ thông tin nhưng vẫn cho phép khai thác dữ liệu, đảm bảo quy định PII, Nghị định 85.
Row-level Security (Bảo mật theo dòng dữ liệu): Giới hạn phạm vi dữ liệu người dùng được nhìn thấy theo nhóm, vai trò, khu vực, chi nhánh hoặc domain được phân quyền.
Audit (Ghi nhận lịch sử truy cập): Bao gồm người truy cập, dữ liệu được truy cập, thời điểm và trạng thái truy vấn nhằm hỗ trợ giám sát, kiểm toán và điều tra khi cần.
Policy Centralization (Tập trung hóa chính sách): Quản lý policy tại một điểm thống nhất thay vì cấu hình rời rạc ở từng nguồn dữ liệu. Cách làm này giúp giảm thao tác thủ công và đảm bảo tính nhất quán trong kiểm soát truy cập.
FPT Data Governance & Security cung cấp lớp quản trị và bảo mật dữ liệu xuyên suốt Data Lakehouse. Sự kết hợp này giúp FPT Data Platform hỗ trợ doanh nghiệp khai thác dữ liệu linh hoạt hơn, đồng thời tăng cường khả năng kiểm soát truy cập, bảo vệ dữ liệu nhạy cảm và đáp ứng các yêu cầu về tuân thủ trong quá trình hiện đại hóa nền tảng dữ liệu.
Liên hệ với chúng tôi để được tư vấn chi tiết về các giải pháp, dịch vụ của FPT Cloud:
Hotline: 1900 638 399
Email: support@fptcloud.com
Support: m.me/fptsmartcloud