Khi Cloud không còn là nút thắt cổ chai: Hành trình tái kiến trúc hạ tầng cho workload hiệu năng cao

Khi Cloud không còn là nút thắt cổ chai: Hành trình tái kiến trúc hạ tầng cho workload hiệu năng cao

Tác giả: FPT Cloud
13:33 25/06/2026

Whitepaper “High-Performance OpenStack: Khi hạ tầng cloud Việt Nam không còn là bottleneck” do FPT Smart Cloud thực hiện là tài liệu tổng hợp quá trình nghiên cứu, phát triển và vận hành một kiến trúc hạ tầng tính toán hiệu năng cao được tối ưu từ nhân hệ điều hành (kernel) đến tầng xử lý dữ liệu mạng. Bài viết này điểm lại những luận điểm chính và các kết quả đo kiểm nổi bật trong whitepaper, giúp người đọc có cái nhìn tổng quan trước khi tìm hiểu chi tiết tài liệu gốc.

Trong nhiều năm, tồn tại một quan niệm phổ biến trong ngành công nghệ rằng nếu cần độ trễ cực thấp, băng thông lớn và khả năng xử lý hàng triệu gói tin mỗi giây, doanh nghiệp sẽ phải lựa chọn hạ tầng vật lý thay vì điện toán đám mây.

Quan điểm này từng hoàn toàn có cơ sở khi các kiến trúc cloud truyền thống vẫn phải đi qua nhiều lớp xử lý trung gian, khiến hiệu năng bị ảnh hưởng đáng kể. Tuy nhiên, sự phát triển của nhà máy AI (AI Factory), mạng lõi 5G (5G Core), ảo hóa chức năng mạng (NFV) và các ứng dụng xử lý thời gian thực đang đặt ra một yêu cầu mới: cloud không chỉ cần linh hoạt và dễ mở rộng, mà còn phải đạt hiệu năng đủ cao để đáp ứng những workload vốn trước đây chỉ phù hợp với hạ tầng chuyên dụng.

Cloud hiệu năng cao: Yêu cầu mới của hạ tầng số 

Ngày nay, hiệu năng hạ tầng không còn được đo đơn thuần bằng số lượng CPU hay dung lượng RAM. 

Một hệ thống nhà máy AI (AI Factory) cần kết nối tốc độ cao giữa các cụm GPU để huấn luyện mô hình. Một nhà mạng triển khai mạng lõi 5G (5G Core) cần khả năng xử lý hàng triệu gói tin (packet) mỗi giây với độ trễ cực thấp. Trong khi đó, các hệ thống tài chính hay truyền phát dữ liệu thời gian thực (streaming) lại yêu cầu sự ổn định tuyệt đối về độ trễ (latency) và độ dao động độ trễ (jitter). 

Đây đều là những workload mà trước đây thường được triển khai trên hạ tầng vật lý chuyên dụng. Tuy nhiên, nhu cầu tối ưu chi phí, tăng khả năng mở rộng và tự động hóa vận hành đang khiến doanh nghiệp tìm kiếm những nền tảng cloud có thể đáp ứng đồng thời cả hai yếu tố: hiệu năng và tính linh hoạt. 

Vì sao cloud truyền thống trở thành bottleneck? 

Một trong những nguyên nhân lớn nhất nằm ở cách gói tin (packet) được xử lý trong môi trường cloud truyền thống. 

Một gói tin (packet) phải đi qua nhiều lớp: NIC→ Kernel → Netfilter → Open vSwitch → Hypervisor → Kernel của VM → Ứng dụng 

Mỗi lần xử lý dữ liệu chỉ mất một khoảng thời gian rất nhỏ, gần như không đáng kể. Tuy nhiên, khi hệ thống phải xử lý hàng triệu gói dữ liệu mỗi giây, những khoảng thời gian nhỏ đó sẽ cộng dồn lại và ảnh hưởng đáng kể đến hiệu năng tổng thể. 

Bên cạnh đó, cơ chế phân bổ tài nguyên của hệ điều hành Linux được thiết kế để phục vụ nhiều tác vụ cùng lúc. Vì vậy, bộ xử lý có thể bị tạm ngắt để thực hiện các công việc nền hoặc xử lý các yêu cầu từ hệ thống. Điều này khiến thời gian phản hồi không hoàn toàn đồng đều, tạo ra những dao động nhỏ và ảnh hưởng đến các ứng dụng yêu cầu độ ổn định cao hoặc phản hồi theo thời gian thực. 

Một điểm hạn chế khác nằm ở tầng chuyển tiếp dữ liệu của mạng ảo. Trong một số trường hợp, dữ liệu phải di chuyển qua lại giữa các lớp xử lý khác nhau của hệ điều hành trước khi được gửi đi. Quá trình này làm phát sinh thêm các bước trung gian, khiến thời gian xử lý tăng lên và làm giảm hiệu quả khai thác phần cứng. 

Từ góc độ kiến trúc, có thể thấy, thách thức không nằm ở phần cứng, mà nằm ở cách phần mềm khai thác phần cứng. 

Anh man hinh 2026 06 25 luc 11.48.54

So sánh Kernel Stack truyền thống và Đường dẫn DPDK 

Tư duy mới: Tách biệt tầng xử lý dữ liệu (dataplane) để giải phóng hiệu năng 

Để giải quyết các giới hạn trên, Whitepaper High-Performance OpenStack được xây dựng dựa trên nguyên tắc: Tách biệt hoàn toàn tầng dữ liệu khỏi mọi tác vụ khác của hệ điều hành, và đẩy nó lên một con đường được tối ưu riêng từ đầu đến cuối. 

Các thành phần điều khiển và vận hành vẫn hoạt động như một môi trường OpenStack tiêu chuẩn. Tuy nhiên, tầng xử lý dữ liệu (dataplane) được đưa vào một "fast path" riêng, nơi tài nguyên được tối ưu hóa dành riêng cho xử lý lưu lượng. 

Kiến trúc này được xây dựng dựa trên bốn trụ cột chính. Cụ thể như sau:  

Anh man hinh 2026 06 25 luc 11.49.45

Bốn trụ cột của kiến trúc High-Performance OpenStack. 

Trụ cột thứ nhất - Tái thiết kế kernel cho workload thời gian thực 

Một trong những thay đổi quan trọng nhất của kiến trúc High-Performance OpenStack là tái thiết kế cách hệ điều hành sử dụng tài nguyên CPU. Thay vì để tất cả các tiến trình cùng chia sẻ một tập CPU chung, hệ thống phân tách CPU thành các nhóm chức năng riêng biệt dành cho kernel, hypervisor, Open vSwitch DPDK và các workload của khách hàng. 

Bên cạnh đó, các vCPU của máy ảo được gán cố định vào những lõi CPU chuyên dụng (CPU pinning), giúp hạn chế tối đa sự can thiệp của hệ điều hành Linux (Linux scheduler). Cách tiếp cận này giúp giảm hiện tượng dao động độ trễ (jitter), hạn chế các độ trễ phát sinh không mong muốn và mang lại khả năng phản hồi ổn định hơn cho các ứng dụng yêu cầu xử lý theo thời gian thực như mạng lõi 5G (5G Core), suy luận AI (AI Inference) hay các hệ thống tài chính. 

Trụ cột thứ hai - Tối ưu bộ nhớ với Hugepage và NUMA Locality 

Bộ nhớ cũng là một yếu tố ảnh hưởng trực tiếp đến hiệu năng của hệ thống. Trong môi trường thông thường, bộ nhớ được chia thành các page có kích thước nhỏ, khiến CPU phải quản lý số lượng lớn page và dễ phát sinh chi phí truy xuất bộ nhớ. 

Để giải quyết vấn đề này, kiến trúc High-Performance OpenStack sử dụng Hugepage kích thước lớn nhằm giảm đáng kể số lượng page cần quản lý. Nhờ đó, hệ thống hạn chế được các chi phí phát sinh trong quá trình truy xuất bộ nhớ và tối ưu hiệu quả sử dụng CPU. 

Song song với đó, toàn bộ các thành phần liên quan đến xử lý lưu lượng như CPU, bộ nhớ, cơ chế xử lý chủ động (Poll Mode Driver - PMD) và card mạng (NIC) được bố trí trên cùng một NUMA node. Việc duy trì tính cục bộ của tài nguyên giúp tránh các truy cập chéo giữa các socket vật lý, từ đó giảm độ trễ và cải thiện hiệu năng tổng thể của hệ thống. 

Trụ cột thứ ba - Tầng chuyển mạch trên không gian người dùng 

Một thay đổi mang tính nền tảng khác là việc chuyển Open vSwitch từ kernel datapath truyền thống sang userspace datapath dựa trên DPDK. 

Trong kiến trúc thông thường, mỗi khi có gói tin đi qua, hệ thống phải xử lý interrupt và thực hiện nhiều lần chuyển đổi ngữ cảnh (context switching), tạo ra chi phí đáng kể khi lưu lượng tăng cao. Với DPDK, Open vSwitch sử dụng cơ chế xử lý chủ động (Poll Mode Driver - PMD), cho phép các lõi CPU chuyên dụng liên tục thăm dò lưu lượng từ card mạng thay vì chờ tín hiệu ngắt  (interrupt) từ hệ điều hành. 

Cách tiếp cận này giúp loại bỏ phần lớn chi phí xử lý phát sinh từ cơ chế ngắt của hệ thống và chuyển đổi ngữ cảnh (context switching), từ đó giảm độ trễ, tăng khả năng xử lý gói tin (packet) và tạo ra một tầng xử lý dữ liệu (dataplane) hiệu năng cao hơn đáng kể so với mô hình truyền thống. 

Trụ cột thứ tư - Đẩy việc xuống chip mạng 

Sau khi tối ưu tầng phần mềm, bước tiếp theo là khai thác tối đa các tính năng tăng tốc sẵn có trên phần cứng hiện đại. Các card mạng như NVIDIA Mellanox ConnectX-6 được trang bị nhiều cơ chế chuyển tải xử lý xuống phần cứng (offload), cho phép đảm nhiệm một phần công việc xử lý gói tin (packet) thay cho CPU. 

Các công việc như xử lý thông tin điều khiển của gói tin, quản lý luồng dữ liệu nhận vào hay giảm lượng dữ liệu cần chuyển qua CPU đều có thể được thực hiện trực tiếp trên card mạng thay vì bộ xử lý trung tâm. Nhờ đó, CPU được giải phóng khỏi các tác vụ xử lý lặp lại, tập trung nhiều hơn vào workload chính và nâng cao hiệu quả sử dụng tài nguyên của toàn hệ thống. 

Khi kết hợp với các tối ưu về CPU, bộ nhớ và tầng xử lý dữ liệu (dataplane), khả năng chuyển tải xử lý xuống phần cứng (offload) đóng vai trò quan trọng trong việc đưa hiệu năng của môi trường điện toán đám mây tiến gần hơn tới giới hạn của hạ tầng vật lý. 

Cloud hiệu năng cao đang trở thành nền tảng cho thế hệ hạ tầng mới 

Khi AI, 5G, các hệ thống tài chính thời gian thực và những ứng dụng yêu cầu độ trễ thấp tiếp tục phát triển, hiệu năng hạ tầng không còn là một yêu cầu riêng biệt của một số ngành đặc thù mà đang trở thành yếu tố cốt lõi trong chiến lược chuyển đổi số của doanh nghiệp. Trong bối cảnh đó, khả năng kết hợp giữa hiệu năng gần với hạ tầng vật lý và sự linh hoạt của môi trường cloud sẽ trở thành lợi thế cạnh tranh quan trọng. 

High-Performance OpenStack mang đến một cách tiếp cận mới cho hạ tầng cloud, nơi các giới hạn truyền thống về độ trễ, thông lượng hay khả năng xử lý gói tin (packet) được giải quyết ngay từ tầng kiến trúc. Thông qua việc tối ưu toàn diện từ CPU, bộ nhớ, mạng đến phần cứng tăng tốc, doanh nghiệp có thể xây dựng những nền tảng sẵn sàng cho các workload thế hệ mới mà vẫn duy trì đầy đủ các lợi ích vốn có của cloud. 

Whitepaper "High-Performance OpenStack: Khi hạ tầng cloud Việt Nam không còn là bottleneck" không chỉ trình bày các kỹ thuật tối ưu hiệu năng, mà còn mang đến góc nhìn toàn diện về cách xây dựng và vận hành hạ tầng cloud hiệu năng cao trong kỷ nguyên AI và dữ liệu thời gian thực. Đây là bước đi quan trọng giúp doanh nghiệp chuẩn bị cho tương lai, nơi khả năng khai thác tối đa tài nguyên hạ tầng sẽ quyết định tốc độ đổi mới và năng lực cạnh tranh. 

Khám phá cách FPT Smart Cloud tái kiến trúc hạ tầng OpenStack để đưa cloud tiến gần hơn đến hiệu năng của hệ thống vật lý, đồng thời đáp ứng những yêu cầu khắt khe của các workload hiệu năng cao tại đây. 

Liên hệ với chúng tôi để được tư vấn chi tiết về các giải pháp, dịch vụ của FPT Cloud: 

block right