Chưa phân loại - FPT Smart Cloud

Giới thiệu
Nổi bật FPT Cloud Server FPT Cloud Backup & DR FPT Storage FPT Network FPT Security FPT Container FPT Database FPT Cloud Monitoring FPT Devsecops FPT Security Platform FPT Data Platform FPT Data Suite FPT AI Factory FPT.AI

Xem tất cả

FPT Object Storage

Lưu trữ dữ liệu đối tượng không giới hạn và truy xuất dữ liệu liên tục

FPT GPU Server

Tích hợp với máy chủ ảo dành cho 3D Rendering, AI hay ML

FPT Data Suite

Nền tảng phân tích dữ liệu đáng tin cậy cho doanh nghiệp và chuyên gia, giúp tối ưu chi phí vận hành lên đến 40% so với giải pháp BI khác.

FPT Cloud WAF

Sản phẩm hợp tác giữa FPT Cloud và CyRadar, cung cấp dịch vụ tường lửa với khả năng bảo vệ mạnh mẽ cho các ứng dụng web

FPT Cloud VA

Sản phẩm hợp tác giữa FPT Cloud và CyRadar, dịch vụ cung cấp khả năng rà quét toàn diện, phân tích chi tiết và đánh giá lỗ hổng bảo mật để tăng cường an ninh thông tin cho hệ thống ứng dụng doanh nghiệp

FPT Backup

Sao lưu và khôi phục dữ liệu tức thời, an toàn và toàn vẹn dữ liệu

FPT AI Factory

Trở thành doanh nghiệp đầu tiên trải nghiệm bộ giải pháp phát triển AI toàn diện, được phát triển trên công nghệ mạnh mẽ bậc nhất từ NVIDIA!

FPT Cloud Desktop

Giải pháp làm việc từ xa hiệu quả và an toàn cho doanh nghiệp

FPT Cloud Server

Dịch vụ máy chủ ảo tiên tiến với khả năng mở rộng nhanh chóng

FPT Dedicated Server

Hiệu năng mạnh mẽ với hạ tầng riêng biệt

FPT GPU Server

Tích hợp với máy chủ ảo dành cho 3D Rendering, AI hay ML

FPT Spot Instances

Dịch vụ máy chủ ảo tiết kiệm đến 90% chi phí cho doanh nghiệp

FPT Backup

Sao lưu và khôi phục dữ liệu tức thời, an toàn và toàn vẹn dữ liệu

FPT Disaster Recovery

Dịch vụ dự phòng & khôi phục hệ thống nhanh chóng

FPT Block Storage

Lưu trữ khối đa dạng thông lượng và dung lượng cho mọi nhu cầu

FPT Object Storage

Lưu trữ dữ liệu đối tượng không giới hạn và truy xuất dữ liệu liên tục

FPT Load Balancing

Nâng cao năng lực, tính sẵn sàng của ứng dụng

FPT Cloud VA

Sản phẩm hợp tác giữa FPT Cloud và CyRadar, dịch vụ cung cấp khả năng rà quét toàn diện, phân tích chi tiết và đánh giá lỗ hổng bảo mật để tăng cường an ninh thông tin cho hệ thống ứng dụng doanh nghiệp

FPT Cloud WAF

Sản phẩm hợp tác giữa FPT Cloud và CyRadar, cung cấp dịch vụ tường lửa với khả năng bảo vệ mạnh mẽ cho các ứng dụng web

FPT Cloud WAPPLES

Dịch vụ tường lửa thông minh cho các ứng dụng web - Giải pháp bảo mật đột phá với sự hợp tác giữa FPT Cloud và Penta Security.

FPT Next-Gen Firewall

Dịch vụ bảo mật tường lửa thế hệ mới

FPT Container Registry

Lưu trữ, quản lý, và bảo mật các Docker Images

FPT Kubernetes Engine

Nền tảng Kubernetes an toàn, bảo mật, ổn định, hiệu năng cao

FPT Kubernetes Engine with GPU

Tăng tốc phát triển ứng dụng yêu cầu hiệu năng cao bằng dịch vụ Kubernetes tích hợp với vi xử lý cao cấp GPU

FPT Data Streaming Engine

Giám sát và triển khai cơ sở dữ liệu như Kafka,..

FPT Non-Relational Database Engine

Giám sát và triển khai cơ sở dữ liệu Redis, Cassandra, ...

FPT OLAP Database Engine

Giám sát và triển khai cơ sở dữ liệu xử lý phân tích trực tuyến

FPT Relational Database engine

Giám sát và triển khai cơ sở dữ liệu MySQL, Postgres, SQLserver, MariaDB,...

FPT Search Engine Databases

Giám sát và triển khai cơ sở dữ liệu truy vấn thông tin

FPT Timeseries Database Engine

Giám sát và triển khai cơ sở dữ liệu chuỗi thời gian

FPT Cloud Monitoring

Giám sát hệ thống và tài nguyên toàn diện trên mọi nền tảng

FPT Incident Management

Giải pháp quản lý sự cố thông minh

FPT ArgoCD

Dịch vụ cung cấp giải pháp khởi tạo và quản lý FPT ArgoCD được tạo ra từ dự án mã nguồn mở Argo

FPT AppSec

Nền tảng tự động hoá bảo mật trong quy trình phát triển phần mềm

FPT Data Governance & Security

Tăng cường khả năng quản lý tài sản dữ liệu doanh nghiệp

FPT Ingestion

Quản lý dữ liệu liền mạch & toàn diện

FPT Lakehouse Analytics

Truy vấn, quản lý, trực quan hóa dữ liệu hiệu quả

FPT Processing

Tăng tốc độ xử lý, đảm bảo tính nhất quán cho ứng dụng

FPT Data Suite

Nền tảng phân tích dữ liệu đáng tin cậy cho doanh nghiệp và chuyên gia, giúp tối ưu chi phí vận hành lên đến 40% so với giải pháp BI khác.

FPT AI Factory

Trở thành doanh nghiệp đầu tiên trải nghiệm bộ giải pháp phát triển AI toàn diện, được phát triển trên công nghệ mạnh mẽ bậc nhất từ NVIDIA!

FPT AI Chat

Nền tảng hội thoại thông minh gắn kết khách hàng trên mọi nền tảng

FPT AI eKYC

Xác thực nhanh chóng, dễ dàng, tối ưu chi phí

FPT AI Engage

Nâng tầm trải nghiệm khách hàng

FPT AI Read

Trích xuất dữ liệu vượt mọi giới hạn

FPT AI Text to Speech

Chuyển văn bản thành giọng nói tiếng Việt với ngữ điệu tự nhiên.
Bảng giá
- Đối tác FPT Cloud
- Startup Program
Sự kiện

Dịch vụ

FPT Load Balancing

FPT ArgoCD

FPT AppSec

FPT Data Suite

FPT AI Factory

Đối tác

Thông tin

VIE

Tiếng Việt English 中文 (中国) 日本語

Blogs Tech

Danh mục

Tin tức

Hướng dẫn tích hợp FPT AI Marketplace API key vào Cursor IDE để Sinh code nhanh chóng

17:03 18/11/2025

Trong kỷ nguyên AI, việc tận dụng mô hình ngôn ngữ lớn (LLM) để hỗ trợ lập trình ngày càng phổ biến. Tuy nhiên, thay vì dùng các dịch vụ quốc tế chi phí cao, bạn hoàn toàn có thể khai thác FPT AI Marketplace — nền tảng AI Inference nội địa với chi phí cạnh tranh, độ ổn định cao, và data locality ưu việt. Bài viết này sẽ hướng dẫn bạn cách tích hợp AI Model API từ FPT AI Marketplace vào Cursor IDE để sử dụng các mô hình sinh code mạnh mẽ. 1. Tạo Tài Khoản FPT AI Marketplace Truy cập trang https://marketplace.fptcloud.com/ và đăng ký tài khoản. Ưu đãi: Tài khoản mới sẽ được tặng 1 USD miễn phí để trải nghiệm các dịch vụ AI Inference ! 2. Xem Danh Sách Model Khả Dụng Sau khi đăng nhập, bạn có thể xem các mô hình khả dụng trên FPT Marketplace [Hình 1: Danh sách model trên FPT AI Marketplace] Bạn nên chọn những model như Qwen-32B Coder, Llama-8B, hoặc DeepSeek để có kết quả sinh code tối ưu. 3. Tạo API Key Bạn vui lòng đăng nhập & truy cập https://marketplace.fptcloud.com/en/my-account#my-api-key Click “Create new API Key” và chọn models, điền tên API Key và ấn “Create” [Hình 2: Giao diện tạo API Key] Xác nhận và lấy API Key mới tạo [Hình 3: Giao diện hoàn thành tạo API Key] 4. Cấu Hình Cursor IDE Với API Key trên FPT AI Marketplace Các bước thực hiện: 1. Mở Cursor IDE -> Vào Cursor Settings -> Models. Thêm Model: Nhấn Add model Thêm tên model (ví dụ: qwen_coder, deepseek_r1). 3. Điền API Key: Trong phần OpenAI API Key, dán API Key bạn vừa tạo từ FPT AI Marketplace. 4. Cấu hình URL FPT AI: Bật Override OpenAI Base URL. Điền URL: https://mkp-api.fptcloud.com [Hình 4: Cấu hình API Key và URL trong Cursor] 5. Xác nhận: Nhấn nút Verify. Nếu hiện Verified Successfully, bạn đã sẵn sàng sử dụng mô hình! 5. Sử Dụng Model Sinh Code Trong Cursor Bây giờ, bạn có thể: Dùng AI Assistant ngay trong IDE để sinh code. Yêu cầu AI refactor, tối ưu, hoặc giải thích code hiện có. Chọn model muốn sử dụng. [Hình 5: Sử dụng model Llama-3.3-70B-Instruction của FPT AI Marketplace để refactor code] 6. Theo Dõi Lượng Token Đã Dùng Để quản lý chi phí: Vào My Usage trong FPT AI Marketplace. Xem số lượng requests, tokens input/output, và tổng lượng usage. Bạn sẽ biết mình đã dùng bao nhiêu tokens, từ đó kiểm soát được chi phí tốt hơn. Kết Luận Chỉ với vài thao tác đơn giản, bạn có thể khai thác trọn vẹn sức mạnh từ FPT AI Marketplace. Từ việc sinh code nguồn nhanh chóng, review thông minh, tối ưu hiệu suất cho đến hỗ trợ debug tự động, tất cả đều được thiết kế để giúp người dùng tăng tốc quy trình làm việc. Đồng thời, các mô hình AI tiên tiến được cung cấp với chi phí hợp lý, đi kèm khả năng theo dõi và quản lý mức sử dụng một cách rõ ràng, minh bạch.

FPT Data Platform: Linh hoạt hơn, bảo mật hơn, vận hành mạnh mẽ hơn

11:32 06/11/2025

Bản nâng cấp mới cho FPT Data Platform – nền tảng dữ liệu toàn diện dành cho doanh nghiệp trên nền tảng đám mây. Với sự nâng cấp lần này, doanh nghiệp sẽ có thêm nhiều công cụ mạnh mẽ hơn để quản lý dữ liệu, phân tích, vận hành và bảo mật. Dưới đây là chi tiết những điểm nổi bật của bản cập nhật. 1. Tính năng chung – Cho toàn bộ nền tảng Tuỳ chỉnh tên miền riêng Người dùng giờ đây có thể sử dụng tên miền riêng (custom domain) để truy cập các dịch vụ trên nền tảng, thay vì chỉ sử dụng tên miền mặc định. Điều này giúp tăng nhận diện thương hiệu, tạo sự chuyên nghiệp và dễ dàng tích hợp với hệ thống IT hiện có. Quản lý Certificate tập trung cho Workspace Một phân hệ quản lý certificate đã được bổ sung: cho phép thêm, xóa, import và gia hạn (renew) certificate cho các dịch vụ bên trong Workspace. Việc này giúp việc quản lý kết nối bảo mật (HTTPS, TLS) trở nên đơn giản và tập trung hơn – giúp doanh nghiệp yên tâm hơn về mặt bảo mật. 2. Processing Service (v1.2.1) – Nâng cấp cho môi trường xử lý & phân tích dữ liệu JupyterHub – Kết nối cơ sở dữ liệu ngoài ngay khi khởi tạo Trong phiên bản mới, khi tạo dịch vụ JupyterHub, người dùng có thể kết nối và sử dụng cơ sở dữ liệu bên ngoài (external DB) ngay từ khâu khởi tạo. Điều này giúp tận dụng hạ tầng dữ liệu sẵn có, tăng tính linh hoạt trong cấu hình môi trường, đảm bảo dữ liệu có thể lưu trữ và chia sẻ ổn định giữa các phiên làm việc. Mã hoá dữ liệu nhạy cảm trong lúc provision Hệ thống được bổ sung khả năng cho phép người dùng nhập khoá mã hoá ngay trong luồng provision dịch vụ. Khoá này sẽ được dùng để mã hoá các dữ liệu nhạy cảm trước khi lưu trữ vào cơ sở dữ liệu.→ Tính năng này giúp tăng cường bảo mật, đảm bảo thông tin quan trọng được mã hoá riêng cho từng phiên triển khai, giảm thiểu rủi ro rò rỉ thông tin và đáp ứng yêu cầu tuân thủ bảo mật nội bộ. 3. Orchestration Service – Quản lý và vận hành luồng dữ liệu, công việc tự động Apache Airflow – Cấu hình Secret Backend khi khởi tạo Bổ sung tính năng cho phép người dùng nhập secret ngay trong luồng khởi tạo dịch vụ Airflow. Các secret này được sử dụng để cấu hình “Secret Backend” – nơi lưu trữ và quản lý thông tin nhạy cảm như token, password hoặc credential một cách bảo mật.→ Nhờ đó, doanh nghiệp có thể tự quản lý khóa và thông tin nhạy cảm theo từng phiên bản dịch vụ, đồng thời đơn giản hóa quá trình tích hợp với các nguồn dữ liệu hoặc hệ thống bên ngoài. Governance & Security – Quản trị dữ liệu & bảo mật ở cấp doanh nghiệp • Ra mắt dịch vụ OpenMetadata (v1.0.0) OpenMetadata là nền tảng quản lý siêu dữ liệu (metadata) giúp doanh nghiệp chuẩn hoá, khám phá, giám sát và quản trị tài sản dữ liệu một cách tập trung, hiệu quả. Các tính năng chính: Central Metadata Catalog: quản lý metadata ở một kho trung tâm. Data Lineage & Impact Analysis: hiển thị từ upstream → downstream, dễ kiểm soát thay đổi. Data Quality & Profiler: kiểm tra chất lượng dữ liệu theo rule-based validation. Glossary & Tagging: định nghĩa thuật ngữ chung, gắn tag phân loại như PII, Confidential. Collaboration & Search: tìm kiếm, comment, đánh giá, phân quyền ownership.Tác động: giúp doanh nghiệp có cái nhìn toàn diện về dữ liệu, kiểm soát được nguồn gốc, chất lượng và phân quyền sử dụng – hỗ trợ tốt cho tuân thủ quy định và vận hành dữ liệu doanh nghiệp. 5. Lakehouse Analytics – Truy vấn dữ liệu mạnh mẽ & linh hoạt Trino (v1.4.4) – Auto Scaling worker node Hệ thống bật hỗ trợ tự động mở rộng (Auto Scale) cho dịch vụ Trino. Số lượng worker node sẽ được điều chỉnh linh hoạt theo tải truy vấn và mức tiêu thụ tài nguyên thực tế. → Tính năng giúp tối ưu hiệu năng xử lý truy vấn, giảm chi phí vận hành khi hệ thống ở trạng thái tải thấp, đồng thời đảm bảo hiệu suất cao và độ ổn định khi có nhiều yêu cầu truy cập đồng thời.→ Doanh nghiệp được hưởng lợi lớn khi triển khai phân tích dữ liệu lớn (big data), truy vấn đa nguồn, hoặc môi trường có nhiều người dùng truy cập song song. Bản cập nhật mới của FPT Data Platform mang đến cho doanh nghiệp: Bảo mật được nâng cấp, đặc biệt với khả năng mã hoá dữ liệu và quản lý secret tập trung. Khả năng vận hành và cấu hình linh hoạt hơn: từ kết nối DB ngoài đến tuỳ chỉnh tên miền riêng. Hiệu năng phân tích dữ liệu được cải thiện thông qua auto scaling và nền tảng metadata quản trị tốt. Quản trị dữ liệu bài bản hơn – phục vụ nhu cầu doanh nghiệp lớn hoặc tổ chức cần tuân thủ cao. FPT Cloud khuyến khích doanh nghiệp và đội ngũ trải nghiệm ngay bản cập nhật này để tận dụng tốt nhất các tính năng mới. Liên hệ với chúng tôi để được tư vấn chi tiết về các giải pháp, dịch vụ của FPT Cloud Hotline: 1900 638 399 Email: [email protected] Support: m.me/fptsmartcloud

FPT đón tiếp đoàn lãnh đạo DAIWA Institute & Research, thúc đẩy cơ hội hợp tác

10:34 22/10/2025

Tuần vừa qua, FPT vinh dự đón tiếp đoàn lãnh đạo cấp cao của DAIWA Institute & Research (Nhật Bản) đến tham quan và làm việc tại FPT Tower, Hà Nội. Buổi gặp gỡ góp phần thắt chặt mối quan hệ hợp tác bền vững, đồng thời mở ra nhiều hướng hợp tác mới trong lĩnh vực trí tuệ nhân tạo (AI), hạ tầng tính toán hiệu năng cao (HPC) và chuyển đổi số toàn diện. Củng cố mối quan hệ hợp tác bền vững dựa trên đổi mới sáng tạo Tại buổi làm việc, ông Atsushi Mochizuki – Chủ tịch DAIWA Institute & Research, bày tỏ sự quan tâm đặc biệt đến năng lực phát triển AI, hạ tầng GPU tiên tiến và khả năng mở rộng quy mô công nghệ của FPT. Ông đánh giá cao những bước tiến mạnh mẽ của Tập đoàn trong việc triển khai các giải pháp AI ở cấp độ doanh nghiệp và khả năng vận hành hệ thống phức tạp cho các khách hàng toàn cầu. Các cuộc thảo luận tập trung vào việc khai thác sức mạnh của FPT AI Factory và nền tảng hạ tầng đám mây AI nhằm cùng nghiên cứu và phát triển các giải pháp đổi mới cho lĩnh vực tài chính, phân tích dữ liệu và AI doanh nghiệp tại Nhật Bản cũng như khu vực châu Á – Thái Bình Dương. Ảnh: Đoàn lãnh đạo DAIWA Institute of Research và FPT trong buổi làm việc tại trụ sở FPT “Chúng tôi thực sự ấn tượng với hệ sinh thái AI toàn diện của FPT và năng lực mở rộng đổi mới thông qua hạ tầng kỹ thuật mạnh mẽ. Sự cộng hưởng này mở ra nhiều tiềm năng hợp tác xuyên biên giới trong việc ứng dụng AI, nhằm nâng cao hiệu quả hoạt động và chất lượng nghiên cứu,” ông Atsushi Mochizuki chia sẻ. FPT AI Factory: Nền tảng phát triển AI toàn diện, quy mô toàn cầu Điểm nhấn trong chuyến thăm là phần giới thiệu chi tiết về FPT AI Factory – bộ giải pháp phát triển AI toàn diện của FPT. Mới đây, FPT AI Factory đã lọt vào bảng xếp hạng TOP500 siêu máy tính mạnh nhất thế giới, ghi dấu bước tiến vượt bậc trong năng lực tính toán và đầu tư chiến lược vào hạ tầng AI. Trang bị NVIDIA H100/H200 GPU hiện đại, FPT AI Factory cho phép doanh nghiệp huấn luyện, tinh chỉnh và triển khai mô hình AI một cách nhanh chóng, bảo mật và hiệu quả. Thành tích này không chỉ khẳng định năng lực kỹ thuật và tầm vóc công nghệ của FPT, mà còn thể hiện sự sẵn sàng phục vụ nhu cầu triển khai AI ở quy mô toàn cầu. Đoàn DAIWA đặc biệt quan tâm đến tiềm năng ứng dụng hạ tầng này trong các hoạt động mô hình hoá tài chính, phân tích dự đoán và nghiên cứu AI chuyên sâu – những lĩnh vực gắn liền với thế mạnh của DAIWA Institute & Research. Mở rộng hợp tác phát triển AI giữa Nhật Bản và Việt Nam FPT và DAIWA Institute & Research đã có quá trình hợp tác thành công trong nhiều dự án trước đây, dựa trên niềm tin và tầm nhìn chung về đổi mới sáng tạo. Chuyến thăm lần này một lần nữa khẳng định cam kết của hai bên trong việc mở rộng quan hệ hợp tác vượt ra ngoài phạm vi cung cấp dịch vụ công nghệ, hướng đến các sáng kiến R&D chung, ứng dụng AI trong tài chính và các chương trình trao đổi tri thức giữa hai quốc gia. FPT kỳ vọng mối quan hệ hợp tác này sẽ trở thành cầu nối vững chắc giữa hệ sinh thái AI của Việt Nam và Nhật Bản, kết hợp năng lực kỹ thuật và tính toán của FPT với kinh nghiệm nghiên cứu và chuyên môn tài chính của DAIWA, cùng hướng tới những sáng tạo có tác động thực tiễn, thúc đẩy năng suất và năng lực cạnh tranh số cho doanh nghiệp. Đồng hành kiến tạo tương lai trí tuệ nhân tạo Chuyến thăm của lãnh đạo DAIWA Institute & Research không chỉ là dịp gặp gỡ hợp tác, mà còn thể hiện tầm nhìn chung của hai bên trong hành trình kiến tạo tương lai doanh nghiệp thông minh. Trong vai trò đối tác công nghệ tin cậy, FPT cam kết tiếp tục đồng hành cùng các tổ chức toàn cầu trong việc ứng dụng công nghệ AI một cách bền vững, an toàn và hiệu quả, góp phần xây dựng một thế giới kết nối thông minh hơn. FPT tin tưởng rằng, với nền tảng công nghệ vững chắc cùng chiến lược của DAIWA Institute & Research, hai bên sẽ cùng mở ra những bước tiến đột phá trong lĩnh vực AI, mang lại giá trị thiết thực cho cộng đồng doanh nghiệp và xã hội.

FPT AI Factory: Đồng hành cùng AI startup phát triển AI hiện đại, hiệu quả

16:25 21/10/2025

Trí tuệ nhân tạo (AI) đang trở thành công nghệ then chốt cho quá trình chuyển đổi số, tái định hình nền kinh tế và xã hội toàn cầu. Ngày nay, AI đang góp phần thúc đẩy đổi mới sáng tạo, nâng cao năng suất, và giải quyết các thách thức phức tạp trong nhiều ngành nghề khác nhau. Đối với các quốc gia đang phát triển, AI không chỉ là công nghệ mới mà còn là cơ hội chiến lược để thúc đẩy tăng trưởng, nâng cao năng lực cạnh tranh và xây dựng một nền kinh tế vững mạnh, sẵn sàng cho tương lai. Tuy nhiên, bên cạnh những tiềm năng to lớn mà AI mang lại, các AI startup thường phải đối mặt với rào cản lớn nhất, đó là việc thiếu khả năng tiếp cận hạ tầng tính toán hiệu năng cao, một yếu tố cốt lõi để biến các ý tưởng thành những giải pháp thực tiễn. Sự bùng nổ của AI đã tạo nên nhu cầu khổng lồ về GPU và tài nguyên tính toán, khiến việc huấn luyện, tinh chỉnh và triển khai mô hình trở nên thách thức hơn bao giờ hết. Đối với những startup muốn phát triển các giải pháp từ mô hình AI tạo sinh (Generative AI) đến phân tích dữ liệu nâng cao, việc sở hữu nền tảng hạ tầng mạnh mẽ là điều kiện quan trọng để xử lý dữ liệu lớn, tối ưu hóa quy trình huấn luyện và rút ngắn thời gian ra mắt sản phẩm. Trong bối cảnh cạnh tranh AI khốc liệt, tốc độ, khả năng mở rộng trong quá trình triển khai chính là những yếu tố quyết định thành công của doanh nghiệp. Các startup cần biết cách tận dụng nguồn lực của hạ tầng tính toán mạnh mẽ để nắm bắt lợi thế vượt trội và không bị bỏ lại phía sau trong cuộc chiến công nghệ toàn cầu. Thiếu hụt hạ tầng: Rào cản chính cản trợ AI startup phát triển quy mô Trong bối cảnh AI phát triển nhanh chóng, tốc độ, hiệu quả và khả năng tạo khác biệt là yếu tố sống còn đối với mỗi startup. Việc biến những ý tưởng sáng tạo thành các giải pháp AI mang lại giá trị thực tế không chỉ đòi hỏi sự táo bạo, mà còn cần đến nền tảng hạ tầng tính toán hiệu năng cao có thể xử lý khối lượng công việc phức tạp. Việc huấn luyện và tinh chỉnh các mô hình AI quy mô lớn, đặc biệt trong lĩnh vực AI tạo sinh, phụ thuộc phần lớn vào GPU mạnh mẽ, hệ thống lưu trữ linh hoạt và kiến trúc có khả năng mở rộng nhanh chóng để thích ứng với nhu cầu ngày càng tăng. Tuy nhiên, việc tự xây dựng một hạ tầng như vậy thường vượt quá khả năng của phần lớn các startup. Chi phí đầu tư ban đầu cao, yêu cầu bảo trì liên tục và nhu cầu nhân lực kỹ thuật chuyên nghiệp đã tạo áp lực lớn lên ngân sách hạn hẹp của các startup, khiến các doanh nghiệp trẻ khó có thể thử nghiệm mô hình AI ở quy mô lớn. Bên cạnh đó, hạn chế về năng lực tính toán khiến quá trình huấn luyện mô hình bị chậm lại, xử lý dữ liệu bị giới hạn và không thể cải tiến nhanh chóng để đáp ứng kỳ vọng từ khách hàng hay nhà đầu tư. Trên thực tế, việc tiếp cận đủ nguồn lực tính toán đã trở thành một khoản đầu tư đáng kể, phản ánh qua quy mô tăng trưởng mạnh mẽ của thị trường hạ tầng hiệu năng cao toàn cầu từ 55,2 tỷ USD năm 2024 lên đến 101,48 tỷ USD vào năm 2033. Ví dụ, một startup muốn huấn luyện mô hình AI tạo sinh tầm trung có thể cần cụm từ 8–16 GPU cao cấp, với chi phí điện toán đám mây lên tới hàng chục nghìn USD mỗi tháng. Mức chi phí này buộc nhiều startup phải thu hẹp quy mô thử nghiệm hoặc kéo dài tiến độ phát triển, tạo nên khoảng cách hạ tầng rõ rệt so với các đối thủ được đầu tư mạnh hơn. Không chỉ dừng lại ở bài toán phần cứng, các startup còn đối mặt với thách thức về nguồn nhân lực chất lượng cao. Việc thu hút và giữ chân các kỹ sư AI, chuyên gia khoa học dữ liệu hay chuyên viên vận hành học máy (machine learning) là một cuộc cạnh tranh gay gắt và tốn kém. Ngay cả khi có đội ngũ tài năng, việc phối hợp để vận hành hiệu quả các pipeline AI phức tạp vẫn đòi hỏi quy trình tổ chức bài bản, điều mà nhiều doanh nghiệp trẻ vẫn đang trong quá trình hoàn thiện. Nhìn chung, các AI startup đang chịu áp lực từ ba vấn đề chính: chi phí hạ tầng cao, khan hiếm nhân tài và yêu cầu rút ngắn thời gian ra mắt sản phẩm. Những yếu tố này trở thành rào cản lớn khiến startup khó cạnh tranh hiệu quả trên quy mô toàn cầu. Cân bằng giữa năng lực tính toán, hiệu quả chi phí và nguồn nhân lực đang là bài toán then chốt mà các doanh nghiệp AI phải giải quyết nếu muốn bứt phá thành công. Nếu không tìm được lời giải, ngay cả những ý tưởng sáng tạo nhất cũng có thể bị chôn vùi trước khi chạm tới tiềm năng thực sự. FPT AI Factory – Bộ giải pháp phát triển AI toàn diện Trước làn sóng phát triển mạnh mẽ của AI và nhu cầu cấp bách của các doanh nghiệp trong kỷ nguyên AI, FPT hợp tác cùng NVIDIA ra mắt FPT AI Factory, bộ giải pháp toàn diện giúp tăng tốc phát triển AI một cách hiệu quả. Không chỉ là bộ công cụ đơn thuần, FPT AI Factory là bộ giải pháp mạnh mẽ, kết hợp hạ tầng GPU tiên tiến, ứng dụng AI sẵn có và môi trường ổn định để huấn luyện, tinh chỉnh và triển khai các mô hình AI hiệu quả. Nền tảng này mang đến tốc độ, khả năng mở rộng và sự linh hoạt, giúp doanh nghiệp xây dựng, tối ưu và vận hành giải pháp AI một cách liền mạch. Từ việc xây dựng mô hình AI tạo sinh riêng, tinh chỉnh kiến trúc hệ thống đến triển khai dịch vụ dựa trên AI, FPT AI Factory cung cấp sức mạnh tính toán vượt trội và quy trình làm việc tinh gọn, giúp doanh nghiệp nhanh chóng biến ý tưởng thành hiện thực. Triết lý “Build Your Own AI” Triết lý cốt lõi của FPT AI Factory là “Build Your Own AI”. Triết lý này giúp trao quyền cho các startup và doanh nghiệp dễ dàng tiếp cận và phát triển mô hình AI dành riêng cho từng nhu cầu kinh doanh. Để thành công trong thời đại trí tuệ nhân tạo đang phát triển như vũ bão, doanh nghiệp cần hội tụ đủ sự kết hợp giữa hạ tầng, công cụ và ứng dụng, giúp doanh nghiệp có thể thử nghiệm linh hoạt, cải tiến nhanh chóng và triển khai dễ dàng. FPT AI Factory được xây dựng trên sức mạnh của nền tảng hạ tầng NVIDIA H100/H200 GPU mạnh mẽ, kết hợp bộ lưu trữ hiệu năng cao và GPU Containers linh hoạt. Bên cạnh đó, FPT AI Factory cung cấp FPT AI Studio – bộ công cụ toàn diện cho việc thử nghiệm, tinh chỉnh và quản lý dữ liệu mô hình, cùng FPT AI Inference – nền tảng hỗ trợ triển khai linh hoạt trên nhiều môi trường khác nhau. Các mô hình vận hành thực tế có thể tương tác với người dùng thông qua AI Agents và ứng dụng, mang lại giá trị kinh doanh rõ rệt. Ứng dụng đa dạng của FPT AI Factory Không chỉ dừng lại ở triết lý, FPT AI Factory đã khẳng định giá trị của mình qua những ứng dụng cụ thể trên nhiều lĩnh vực khác nhau, bao gồm: Ngân hàng & Tài chính: Triển khai voicebot sử dụng mô hình ngôn ngữ lớn để tự động hóa chăm sóc khách hàng. Ứng dụng xử lý hình ảnh phục vụ eKYC: xác thực danh tính, nhận diện khuôn mặt, phát hiện deepfake. Xây dựng trợ lý tài chính cá nhân, có khả năng phân tích báo cáo và tổng hợp tin tức thị trường. Y tế: Áp dụng mô hình AI trong chẩn đoán sớm ung thư vú và phân tích tế bào học. Xử lý hình ảnh siêu âm nhanh hơn nhờ GPU Container. Công nghệ sinh học: Phân tích mã gen để hỗ trợ nghiên cứu sinh học và phát triển thuốc. Công nghệ thông tin: Phát triển chatbot cho chăm sóc khách hàng và hỗ trợ nội bộ. Huấn luyện và tinh chỉnh mô hình AI theo dữ liệu doanh nghiệp. Xây dựng mô hình AI thị giác quy mô lớn, phục vụ xử lý đa tác vụ và vận hành hệ thống ổn định. Ứng dụng AI Agent để tối ưu quy trình bán hàng và nâng cao trải nghiệm khách hàng. Những ví dụ trên chính là minh chứng mạnh mẽ, khẳng định rằng với hạ tầng mạnh mẽ và nền tảng phù hợp, AI có thể trở thành giá trị thực tiễn, mang lại tác động thiết thực trong hoạt động kinh doanh và xã hội. Tiếp sức cho thế hệ startup AI tiên phong Trong bối cảnh cạnh tranh AI toàn cầu, khả năng phát triển, huấn luyện và triển khai mô hình hiệu quả là yếu tố quyết định thành công. FPT AI Factory không chỉ mang đến nền tảng công nghệ vững chắc mà còn mở ra con đường để hiện thực hóa ước mơ đổi mới sáng tạo. Với triết lý “Build Your Own AI” và hàng loạt những ứng dụng thực tiễn trong đa ngành nghề, FPT AI Factory đang giúp startup và doanh nghiệp tăng tốc hành trình AI, biến ý tưởng thành giải pháp thực tiễn nhanh chóng hơn, thông minh hơn và tối ưu chi phí hơn. Liên hệ với chúng tôi để được tư vấn chi tiết về các giải pháp, dịch vụ của FPT Cloud Hotline: 1900 638 399 Email: [email protected] Support: m.me/fptsmartcloud

Quy trình phát triển toàn diện của Agentic AI: Cách FPT AI Factory hỗ trợ tăng tốc & phát triển AI Agents

11:04 30/09/2025

Khi trí tuệ nhân tạo (AI) tiếp tục cách mạng hóa các ngành công nghiệp, việc hiểu rõ cách thức vận hành bên trong của các hệ thống AI không chỉ thú vị mà còn trở nên thiết yếu. Một trong những đổi mới nổi bật nhất hiện nay chính là Agentic AI – công nghệ được thiết kế để mô phỏng khả năng ra quyết định, giải quyết vấn đề và thậm chí là sáng tạo giống con người. Khác với những công cụ thông thường, chỉ phản hồi theo lệnh của người dùng, thì các Agentic AI được xây dựng với tính tự chủ: chúng có thể hiểu được mục tiêu, tự chia nhỏ thành các bước cần làm và từng bước thực hiện cho đến khi đạt được kết quả. Chính khả năng này đã biến Agentic AI trở thành công nghệ hỗ trợ doanh nghiệp tự động xử lý các quy trình phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Vậy hành trình của một Agentic AI diễn ra như thế nào? Làm thế nào mà các AI Agents có thể xử lý các nhiệm vụ phức tạp một cách liền mạch, thích ứng với thách thức và cải thiện theo thời gian? Dưới đây là các bước chính trong vòng đời của một tác nhân AI (AI Agents) – mỗi bước đều đóng vai trò quan trọng trong việc tạo ra những hệ thống thông minh, và có khả năng thích ứng nhanh. 1. Perception – Nhận thức Sự nhận thức của AI Agents là khả năng thu thập và diễn giải thông tin từ môi trường – có thể qua dữ liệu hình ảnh, âm thanh, văn bản hoặc các dạng tín hiệu khác. Đây là lớp nền tảng giúp hệ thống đưa ra quyết định và giải quyết vấn đề. Nếu con người dựa vào giác quan để định hướng trong thế giới thực, thì AI Agents dựa vào khả năng nhận thức để hiểu dữ liệu đầu vào, nhận diện mẫu và phản ứng phù hợp. Nhận thức không phải là một quá trình thụ động. Nó bao gồm việc chủ động thu thập dữ liệu, xử lý và xây dựng hiểu biết về bối cảnh hiện tại. Các loại dữ liệu mà AI Agents nhận thức có thể thay đổi tùy thuộc vào thiết kế của hệ thống, và có thể bao gồm mọi thứ từ văn bản viết, lời nói, hình ảnh, âm thanh, cho đến các thay đổi trong môi trường. Có thể coi nhận thức chính là “cửa sổ nhìn ra thế giới” của AI Agents, cung cấp thông tin cần thiết để hành động thông minh và linh hoạt. Các tác nhân AI sử dụng nhiều loại nhận thức khác nhau để hiểu và diễn giải môi trường. Mỗi loại nhận thức cho phép tác nhân tương tác với thế giới theo những cách khác nhau, giúp xử lý các dạng dữ liệu và đưa ra quyết định thông minh. Các loại nhận thức chính bao gồm: Nhận thức văn bản (Textual Perception): Hiểu và tạo ra văn bản thông qua xử lý ngôn ngữ tự nhiên (NLP). Điều này cho phép các hệ thống AI tương tác với dữ liệu văn bản như bài viết, sách, email và trang web, rất cần thiết cho các ứng dụng như chatbot và trợ lý ảo. Nhận thức dự đoán (Predictive Perception): AI dự đoán các sự kiện tương lai dựa trên dữ liệu lịch sử, ứng dụng trong các lĩnh vực như tài chính và xe tự lái. Nhận thức thị giác (Visual Perception): Sử dụng thị giác máy tính (computer vision) để diễn giải hình ảnh và video – ứng dụng trong nhận diện khuôn mặt, phát hiện vật thể. Nhận thức môi trường (Environmental Perception): AI thu thập thông tin thông qua các cảm biến như GPS hoặc cảm biến chuyển động để thích nghi với các môi trường thay đổi. Ví dụ, robot sử dụng cảm biến này để phát hiện và tránh các chướng ngại vật khi di chuyển. Nhận thức thính giác (Auditory Perception): Khả năng xử lý và hiểu âm thanh, đặc biệt là giọng nói, giúp hệ thống như trợ lý giọng nói hoạt động hiệu quả. 2. Reasoning and Decision-making – Lập luận và Ra quyết định Lý luận là quá trình nhận thức cho phép các tác nhân AI đưa ra quyết định, giải quyết vấn đề và suy luận các kết luận dựa trên thông tin mà chúng thu thập được. Đây là một yếu tố quan trọng giúp tác nhân AI hành động thông minh và thích nghi trong các môi trường thay đổi liên tục. Trong khi giai đoạn “Nhận thức” giúp AI thu thập dữ liệu về thế giới, “Lý luận” sẽ giúp tác nhân diễn giải dữ liệu đó, đưa ra kết luận hợp lý và đưa ra quyết định thông minh. Nói cách khác, nhận thức là việc nhận thấy đèn giao thông chuyển sang màu đỏ; lý luận là nhận ra rằng bạn cần phải dừng xe để tránh nguy hiểm. Lý luận bao gồm việc sử dụng các quy tắc, phương pháp ước lượng, logic và các mô hình học được để xử lý thông tin từ hệ thống nhận thức. Điều này giúp các tác nhân AI không chỉ hiểu rõ trạng thái hiện tại của môi trường mà còn dự đoán kết quả, xử lý các tình huống không chắc chắn và đề ra chiến lược để đạt được mục tiêu. Lý luận có thể được chia thành các loại khác nhau, mỗi loại đóng một vai trò đặc biệt trong việc giúp các hệ thống AI hoạt động hiệu quả trong các tình huống khác nhau: Heuristic Reasoning: Sử dụng “luật ngón tay cái” để đơn giản hóa quyết định, phù hợp với tình huống cần phản hồi nhanh. Ví dụ, khi điều hướng trên bản đồ, AI có thể chọn "đoạn đường tốt nhất" dựa trên kinh nghiệm thay vì tính toán tất cả các tuyến đường có thể có. ReWoo (Suy luận không cần quan sát): Quá trình cải thiện qua các lần lặp lại, giúp AI điều chỉnh và tối ưu hóa chiến lược của mình dựa trên phản hồi và thay đổi từ môi trường. ReAct (Lý luận và hành động): Một phương pháp kết hợp lý luận và hành động đồng thời, có lợi trong những môi trường yêu cầu phản hồi ngay lập tức như lái xe tự động hay các trò chơi chiến lược thời gian thực. Self-reflection (Tự phản ánh): AI Agents đánh giá các quyết định trong quá khứ để học hỏi và cải thiện. Conditional Logic (Điều kiện logic): Quyết định dựa trên các điều kiện cụ thể, thường được sử dụng trong các hệ thống tự động. Ví dụ, một điều hòa thông minh có thể sử dụng logic điều kiện để điều chỉnh nhiệt độ: "Nếu nhiệt độ phòng dưới 70°F, hãy tăng nhiệt." 3. Action – Hành động Giai đoạn “Hành động” giúp các AI Agents thực thi các quyết định trong thế giới thực, cho phép nó tương tác với người dùng, các hệ thống kỹ thuật số, hoặc thậm chí là các môi trường vật lý. Sau khi “nhận thức” môi trường và “suy luận” về phương án hành động tốt nhất, tác nhân AI phải “thực thi” các quyết định của mình trong thực tế. Trong thế giới AI, giai đôạn “hành động” không chỉ giới hạn ở các chuyển động vật lý hay tương tác, mà còn bao gồm các quá trình như thao tác dữ liệu, thực thi quyết định và kích hoạt các hệ thống tự động. Dù là robot di chuyển trong môi trường vật lý, hệ thống phần mềm xử lý dữ liệu, hay một trợ lý ảo AI phản hồi theo lệnh, “Hành động” chính là giai đoạn mà tác nhân AI đưa lý luận và sự hiểu biết của mình thành hiện thực. 4. Learning – Học Hỏi Giai đoạn “học hỏi” là quá trình giúp các AI Agents cải thiện hiệu suất thông qua việc thu thập kiến thức từ kinh nghiệm, dữ liệu, hoặc phản hồi góp ý. Thay vì chỉ dựa vào các hướng dẫn đã được lập trình sẵn, tác nhân AI có thể thích nghi và phát triển bằng cách học hỏi từ môi trường và kết quả của các hành động mà nó thực hiện. Khả năng học hỏi này là điều giúp các tác nhân AI có thể xử lý những tình huống mới, chưa được thấy trước, đưa ra quyết định tốt hơn và tối ưu hóa chiến lược trong các tình huống động, thực tế. Đây là giai đoạn quan trọng đối với các tác nhân AI trong việc tự tạo ra hệ thống thông minh có khả năng tự cải tiến. Giống như con người học hỏi từ kinh nghiệm và áp dụng kiến thức đó vào các thử thách trong tương lai, các AI Agents sử dụng nhiều phương pháp học hỏi khác nhau để nâng cao khả năng ra quyết định và giải quyết vấn đề. Thông qua việc học hỏi liên tục, các tác nhân AI có thể tinh chỉnh hành vi và ngày càng phù hợp hơn với các mục tiêu của mình. Các phương pháp học hỏi của tác nhân AI rất đa dạng, tùy thuộc vào cách thức tác nhân tương tác với dữ liệu, phản hồi nhận được và loại nhiệm vụ mà nó cần thực hiện. Dưới đây là những phương pháp học hỏi chính mà các tác nhân AI sử dụng: Học không giám sát: Nhận diện các mô hình và cấu trúc trong dữ liệu mà không cần các ví dụ có gán nhãn. AI có thể nhóm các khách hàng dựa trên hành vi mua sắm mà không cần biết trước các nhãn. Học có giám sát: Huấn luyện AI trên dữ liệu có gán nhãn để dự đoán kết quả dựa trên các đầu vào đã biết. Học tăng cường: AI Agents học tập qua việc thử nghiệm và các lỗi sai gặp phải, nhận phản hồi dưới dạng thưởng hoặc phạt. Học đa tác nhân: Sự hợp tác và cạnh tranh giữa các tác nhân AI để giải quyết vấn đề một cách hiệu quả hơn. AI Agents không chỉ đại diện cho một sự nâng cấp vượt bậc của các hệ thống hiện tại mà là một sự chuyển mình thực sự hướng tới trí tuệ tự thích ứng và trí tuệ tự động. Bằng cách nhận thức, lý luận, hành động và học hỏi, các tác nhân AI đang dần thành công trong quá trình mô phỏng các khía cạnh cơ bản về nhận thức của con người. Tuy nhiên, để xây dựng lên những tác nhân AI như vậy không phải là điều đơn giản; các tổ chức cần có một cơ sở hạ tầng mạnh mẽ và linh hoạt. Từ nguồn tài nguyên GPU mạnh mẽ cho đến môi trường huấn luyện mô hình linh hoạt, tất cả đều là những yếu tố tiên quyết biến lý thuyết thành hiện thực. 5. Cách FPT AI Factory tăng tốc quá trình phát triển AI Agents Để đáp ứng nhu cầu này, FPT đã ra mắt FPT AI Factory, cung cấp một giải pháp toàn diện để hỗ trợ các doanh nghiệp phát triển AI Agents thông qua ba dịch vụ chính: FPT AI Infrastructure, FPT AI Studio và FPT AI Inference. Xử lý dữ liệu (FPT AI Infrastructure) Mỗi tác nhân AI thành công đều dựa vào một vòng quay dữ liệu liên tục để thúc đẩy sự cải tiến. Cơ sở hạ tầng NVIDIA H100/H200 GPU của FPT AI Factory hỗ trợ quá trình này bằng cách thu thập dữ liệu đa dạng (cuộc trò chuyện, tương tác người dùng, dữ liệu từ cảm biến), xử lý và gắn nhãn để huấn luyện AI Agents, từ đó triển khai các tác nhân AI thông minh hơn. Những tác nhân này tạo ra dữ liệu mới từ các tương tác của người dùng, truyền dữ liệu trở lại vào hệ thống để cải thiện các phiên bản tiếp theo. Chu trình tự củng cố này giúp các hệ thống AI ngày càng thông minh và phản hồi nhanh nhạy hơn khi các tác nhân được triển khai, tạo ra một vòng lặp cải tiến liên tục. Phát triển AI Agents (FPT AI Studio) Sau khi dữ liệu đã được chuẩn bị, các nhà phát triển có thể sử dụng FPT AI Studio để xây dựng và huấn luyện các tác nhân thông minh trong môi trường đám mây hợp tác. Nền tảng này hỗ trợ phát triển nhiều loại tác nhân AI - từ trợ lý hội thoại đến các hệ thống ra quyết định - cung cấp công cụ huấn luyện mô hình, tinh chỉnh hành vi và tối ưu hóa hiệu suất AI Agents để đảm bảo chúng phản hồi chính xác với các tình huống thực tế. Triển khai và cung cấp AI Agents (FPT AI Inference) Sau khi giai đoạn phát triển và kiểm tra đã hoàn thành, FPT AI Inference cho phép triển khai tác nhân AI vào các môi trường sản xuất một cách liền mạch. Những tác nhân được triển khai này không chỉ phục vụ người dùng một cách đáng tin cậy mà còn cung cấp các dữ liệu tương tác quan trọng quay trở lại vòng quay dữ liệu, tạo ra một chu trình cải tiến liên tục. Dù bạn đang triển khai một chatbot dịch vụ khách hàng, hệ thống xe tự lái, hay tích hợp AI Agents vào nền tảng thương mại điện tử, mỗi tương tác người dùng sẽ trở thành một phần của vòng quay dữ liệu giúp thế hệ tác nhân AI tiếp theo trở nên thông minh hơn. Từ ý tưởng cho đến sản phẩm, FPT AI Factory cung cấp toàn bộ cơ sở hạ tầng cốt lõi, biến các ý tưởng về tác nhân AI thành các hệ thống thông minh và tự cải tiến thông qua sức mạnh của vòng quay dữ liệu.

Tối ưu hóa sức mạnh của AI tạo sinh cùng Retrieval-Augmented Generation (RAG)

18:44 29/09/2025

Trí tuệ nhân tạo (AI) đang phát triển với tốc độ vượt bậc, làm thay đổi cách thức vận hành của các ngành công nghiệp và định hình lại cách doanh nghiệp tương tác với công nghệ. Ở trung tâm của làn sóng cách mạng này là các mô hình ngôn ngữ lớn (Large Language Models – LLM) như ChatGPT của OpenAI hay Google Gemini. Những mô hình này sở hữu năng lực vượt trội trong việc hiểu và tạo ra ngôn ngữ tự nhiên, trở thành công cụ hỗ trợ đắc lực cho nhiều lĩnh vực kinh doanh. Tuy nhiên, LLMs vẫn tồn tại những hạn chế nhất định. Các mô hình này chủ yếu dựa trên dữ liệu được huấn luyện sẵn vốn có nguy cơ trở nên lỗi thời, thiếu sót hoặc chưa đáp ứng được nhu cầu chuyên sâu. Do đó, đôi khi chúng có thể tạo ra thông tin không chính xác, gây hiểu nhầm hoặc gặp khó khăn trong việc xử lý các truy vấn yêu cầu dữ liệu theo thời gian thực. Để giải quyết thách thức này, phương pháp tăng cường truy xuất (Retrieval-Augmented Generation - RAG) đã ra đời. Cách tiếp cận này kết hợp sức mạnh sáng tạo của LLMs với khả năng truy xuất dữ liệu bên ngoài, từ đó mang lại các giải pháp AI chính xác, đáng tin cậy và sẵn sàng đáp ứng nhu cầu của doanh nghiệp. Retrieval-Augmented Generation là gì? Tăng cường truy xuất là một phương pháp AI được thiết kế nhằm cải thiện cách mô hình ngôn ngữ lớn tạo ra phản hồi. Thay vì chỉ dựa vào kiến thức được huấn luyện sẵn, RAG tích hợp thêm bộ truy xuất (retriever), cho phép lấy thông tin từ các kho dữ liệu bên ngoài như API, nội dung trực tuyến, cơ sở dữ liệu và tài liệu nội bộ. RAG được phát triển nhằm nâng cao chất lượng phản hồi của các mô hình ngôn ngữ lớn Công cụ truy xuất (retriever) có thể được lựa chọn tùy thuộc vào nhu cầu về mức độ ngữ nghĩa và độ chính xác, bao gồm: Vector database: Các truy vấn được chuyển đổi thành vector nhúng (dense vector embedding) thông qua các mô hình như BERT (transformers- based Model). Ngoài ra, các phương pháp truyền thống như TF-IDF có thể được sử dụng để tạo ra sparse embeddings. Việc tìm kiếm dựa trên độ tương đồng ngữ nghĩa (semantic similarity) hoặc tần suất thuật ngữ (term frequency). Graph database: Xây dựng cơ sở tri thức (knowledge base) từ các mối quan hệ giữa các thực thể (entity) được trích xuất từ văn bản. Phương pháp này đảm bảo tính chính xác của tri thức nhưng đòi hỏi truy vấn ban đầu phải chính xác, gây khó khăn trong một số trường hợp. Regular SQL database: Lưu trữ và truy xuất dữ liệu có cấu trúc nhưng hạn chế về mặt linh hoạt trong việc xử lý ngữ nghĩa. RAG đặc biệt hiệu quả trong xử lý lượng lớn dữ liệu phi cấu trúc, chẳng hạn như những thông tin phân tán khắp internet. Mặc dù dữ liệu này rất đa dạng, nhưng hiếm khi được tổ chức để trực tiếp trả lời truy vấn của người dùng. Đó là lý do tại sao RAG đã được áp dụng rộng rãi trong các trợ lý ảo và chatbot (ví dụ: Siri, Alexa). Khi người dùng đặt câu hỏi, hệ thống có thể truy xuất dữ liệu liên quan và tạo câu trả lời rõ ràng, chính xác trong ngữ cảnh. Ví dụ: Khi được hỏi “Làm thế nào để cài đặt lại điều khiển ABC?”, RAG có thể truy xuất thông tin liên quan từ tài liệu sản phẩm và các tài liệu tương ứng, từ đó tạo ra câu trả lời ngắn gọn, dễ hiểu và chính xác. Bằng cách kết hợp việc truy xuất kiến thức bên ngoài với khả năng của mô hình ngôn ngữ lớn, RAG giúp trải nghiệm người dùng trở nên chính xác, đáng tin cậy và phù hợp hơn, kể cả trong các tình huống phức tạp và chuyên ngành. Mô hình RAG thường được ứng dụng phổ biến trong các trợ lý ảo và chatbot Vì sao RAG quan trọng? Các mô hình ngôn ngữ lớn như ChatGPT hay Gemini đã định hình các tiêu chuẩn mới cho xử lý ngôn ngữ tự nhiên với khả năng từ hiểu biết, tóm tắt cho đến sáng tạo nội dung. Tuy nhiên, dù có hiệu suất ấn tượng, những mô hình này vẫn có giới hạn nhất định. Khi các tác vụ đòi hỏi chuyên môn sâu trong lĩnh vực cụ thể hoặc kiến thức cập nhật vượt ra ngoài phạm vi dữ liệu đã được huấn luyện, các mô hình ngôn ngữ lớn có thể tạo ra các câu trả lời nghe có vẻ trôi chảy nhưng lại sai sự thật. Vấn đề này thường được gọi là ảo giác AI (AI hallucination). Trong môi trường doanh nghiệp, thách thức này càng được thể hiện rõ rệt. Các tổ chức thường quản lý những kho lưu trữ khổng lồ chứa thông tin bảo mật bao gồm sổ tay kỹ thuật, tài liệu sản phẩm, các cơ sở kiến thức, mà các mô hình thường khó có thể điều hướng. Ngay cả các mô hình tiên tiến như GPT-4 vẫn có thể gặp phải hiệu ứng “lost in the middle” – một hạn chế khiến mô hình thường nhớ rõ thông tin ở đầu và cuối văn bản nhưng dễ bỏ sót các chi tiết quan trọng ở giữa, dẫn đến kết quả trả lời chưa đầy đủ. RAG được phát triển để khắc phục toàn bộ những hạn chế này. Bằng cách tích hợp cơ chế truy xuất, RAG cho phép mô hình ngôn ngữ lớn lấy thông tin trực tiếp từ nguồn bên ngoài, từ dữ liệu công khai đến tài liệu riêng của doanh nghiệp. Điều này không chỉ bù đắp lỗ hổng kiến thức mà còn giảm thiểu rủi ro “ảo giác”, đảm bảo câu trả lời dựa trên dữ liệu có thể kiểm chứng. Bằng cách tích hợp dữ liệu từ nguồn bên ngoài, RAG giúp LLM đưa ra phản hồi chính xác hơn và giảm nguy cơ ảo giác AI Cách thức hoạt động của RAG Lợi ích của RAG RAG mang lại nhiều ưu điểm đáng kể so với các LLMs độc lập, bao gồm: Cập nhật kiến thức nhanh chóng: Truy xuất thông tin mới nhất một cách linh hoạt mà không cần huấn luyện lại mô hình. Giảm thiểu ảo giác AI: Các câu trả lời có căn cứ giúp giảm thiểu rủi ro nội dung bịa đặt. Tính minh bạch: Cung cấp nguồn tham chiếu, cho phép người dùng xác minh thông tin. Tăng hiệu quả chi phí: Loại bỏ các chu kỳ huấn luyện lại thường xuyên, giảm chi phí tính toán và tài chính. Khả năng mở rộng dễ dàng: Hoạt động hiệu quả trên nhiều lĩnh vực, từ chăm sóc sức khỏe, tài chính đến CNTT doanh nghiệp. Đa dạng ứng dụng: Cung cấp sức mạnh cho các ứng dụng như chatbot, hệ thống tìm kiếm và công cụ tóm tắt thông minh. Ứng dụng thực tiễn của RAG RAG chính là chìa khóa giúp AI tạo sinh khắc phục những hạn chế của các mô hình như ChatGPT hay Gemini, vốn chỉ dựa vào dữ liệu huấn luyện trước có thể nhanh chóng trở nên lỗi thời hoặc không chính xác. Bằng cách kết hợp khả năng tạo sinh của các mô hình ngôn ngữ với việc truy xuất dữ liệu bên ngoài, RAG giúp đưa ra các câu trả lời rõ ràng, theo thời gian thực, giảm thiểu ảo giác AI và giúp doanh nghiệp tối ưu hóa chi phí. Trong thực tế, RAG đang định hình tương lai của AI trong nhiều lĩnh vực, bao gồm: Chatbot và dịch vụ khách hàng: Cung cấp phản hồi tức thì, chính xác bằng cách truy xuất câu trả lời trực tiếp từ sổ tay sản phẩm, câu hỏi thường gặp (FAQs) hoặc cơ sở kiến thức. Chăm sóc sức khỏe: Cung cấp thông tin y khoa đáng tin cậy bằng cách tìm kiếm thông tin từ các hướng dẫn lâm sàng và nghiên cứu khoa học đã được xác minh. Tài chính: Hỗ trợ cho các nhà phân tích với những dữ liệu được cập nhật thị trường theo thời gian thực và những hiểu biết theo ngữ cảnh được rút ra từ các dữ liệu trực tiếp, giúp mang lại những insight hữu ích. Quản lý tri thức (Knowledge management): Giúp nhân viên tương tác với các tài liệu kỹ thuật và quy trình một cách tự nhiên. Những trường hợp sử dụng thực tế này đã chứng minh cách RAG làm cho AI trở nên đáng tin cậy, minh bạch và thực sự có giá trị trên nhiều ngành công nghiệp. Tương lai của RAG RAG là bước tiến quan trọng hướng tới tạo ra giải pháp AI đáng tin cậy và có thẩm quyền. Bằng cách kết hợp giữa kiến thức đã học (parameterized knowledge) và dữ liệu truy xuất (retrieved knowledge), RAG khắc phục một trong những hạn chế lớn nhất của mô hình ngôn ngữ lớn. Trong tương lai, với sự phát triển của tác nhân AI (AI có khả năng tự động phối hợp truy xuất, suy luận, và tạo sinh), kết hợp với tăng tốc phần cứng như NVIDIA Grace Hopper Superchip và các framework mã nguồn mở (LangChain) và hạ tầng sẵn sàng cho doanh nghiệp như FPT AI Factory với GPU hiệu năng cao, RAG sẽ ngày càng trở thành nền tảng cốt lõi cho các giải pháp AI của doanh nghiệp. Vì vậy, RAG không chỉ là giải pháp cho vấn đề ảo giác hay thiếu hụt tri thức, mà chính là nền móng để xây dựng trợ lý thông minh, chatbot tiên tiến và hệ thống AI sẵn sàng cho doanh nghiệp trên mọi lĩnh vực.

AI Factory Playbook: Hướng dẫn Developer phát triển ứng dụng GenAI an toàn và hiệu quả

11:02 26/09/2025

Tại NVIDIA AI Day, ông Phạm Vũ Hùng – Solutions Architect & Senior Consultant của FPT Smart Cloud, Tập đoàn FPT đã có bài chia sẻ với chủ đề “AI Factory Playbook: Hướng dẫn Developer phát triển ứng dụng GenAI an toàn và hiệu quả”. Trong phần trình bày, ông Hùng mang đến góc nhìn về cách hiện thực hóa quy trình phát triển AI toàn trình, bao gồm từ việc xây dựng mô hình Generative AI cho đến triển khai AI Agent trong doanh nghiệp, trên nền tảng GPU Cloud H100/H200 của NVIDIA và hạ tầng AI Factory do FPT phát triển trong nước. Một vài điểm đáng chú ý trong phần chia sẻ: Phát triển AI toàn diện trong môi trường an toàn: quy trình khép kín từ huấn luyện GenAI đến triển khai AI Agent ngay tại data center trong nước. Tăng tốc với NVIDIA H100/H200 GPU: rút ngắn đáng kể thời gian training và inference. Xây dựng & tinh chỉnh GenAI bằng dữ liệu riêng: tạo ra mô hình chính xác hơn, đáp ứng nhu cầu đặc thù của doanh nghiệp. Xây dựng AI/ML Stack FPT AI Factory cung cấp hạ tầng AI/ML toàn diện, được xây dựng trên các trung tâm dữ liệu Tier 3 & 4 đạt chứng nhận NVIDIA tại Nhật Bản, xếp hạng tương ứng 36 và 38 trong danh sách TOP500 (tháng 6/2025).Trong số các dịch vụ nổi bật có GPU Container, GPU Virtual Machine và FPT AI Studio. Ngoài ra, nhà phát triển có thể tận dụng Bare Metal Server, GPU Cluster, AI Notebook và FPT AI Inference để đáp ứng đa dạng nhu cầu. [caption id="attachment_67178" align="aligncenter" width="1972"] Hình ảnh: Kiến trúc AI/ML Stack trên FPT AI Factory[/caption] GPU Container: Được thiết kế cho các tác vụ thử nghiệm, đi kèm tính năng giám sát, ghi log và sổ tay cộng tác (collaborative notebooks). Nhà phát triển có thể dễ dàng chia sẻ dữ liệu, viết mã, kiểm thử đơn vị (unit test) và thực thi trong một môi trường linh hoạt cao. GPU Virtual Machine: Máy ảo đa năng, tối ưu cho cả huấn luyện và suy luận, với tùy chọn cấu hình linh hoạt (từ 1 đến 8 GPU mỗi VM, dung lượng bộ nhớ GPU lên tới 141GB). GPU Cluster: Hạ tầng có khả năng mở rộng, hỗ trợ huấn luyện phân tán và suy luận quy mô lớn. Tích hợp NVLink, công nghệ chia sẻ GPU như MIG/MPS/Time-slice, cùng các tiện ích bảo mật nâng cao như nhật ký kiểm toán (audit logs) và CIS benchmarks. AI Notebook: Môi trường JupyterLab được quản lý, cài sẵn các thư viện AI/ML cần thiết. Nhà phát triển có thể bắt tay ngay vào lập trình trên GPU cấp doanh nghiệp mà không mất thời gian thiết lập, đồng thời tiết kiệm chi phí lên tới 70% so với môi trường notebook truyền thống. FPT AI Studio: Nền tảng MLOps no-code/low-code, tích hợp pipeline dữ liệu, các chiến lược tinh chỉnh (SFT, DPO, continual training), theo dõi thí nghiệm và quản lý mô hình. Giao diện kéo-thả trực quan cho phép nhà phát triển tinh chỉnh mô hình nhanh chóng và lưu trữ trong kho mô hình tập trung. FPT AI Inference: API sẵn sàng sử dụng với mức giá token cạnh tranh, giúp nhà phát triển triển khai mô hình đã tinh chỉnh một cách nhanh chóng và tiết kiệm chi phí. Trong phần trình bày, ông Hùng không chỉ nhấn mạnh những năng lực toàn diện của FPT AI Factory mà còn đưa ra ví dụ cụ thể từ khách hàng. Điển hình, FPT đã hợp tác với một công ty CNTT Nhật Bản để tinh chỉnh mô hình Donut (Document Understanding Transformer) trên bộ dữ liệu hơn 300GB. Bằng cách kết hợp GPU Container cùng FPT Object Storage, khách hàng có thể xử lý hiệu quả khối lượng lớn dữ liệu tài liệu, đồng thời tối ưu chi phí. Đây cũng là một ví dụ thực tiễn cho thấy doanh nghiệp có thể tận dụng hạ tầng của FPT AI Factory để triển khai các tác vụ AI trong thực tế. [caption id="attachment_67179" align="aligncenter" width="1674"] Hình ảnh: Quy trình tinh chỉnh mô hình Donut trên FPT AI Factory[/caption] Tăng tốc triển khai giải pháp AI thực tiễn Một trong những điểm nhấn của sự kiện là phần demo trực tiếp về AI Camera Agent được thiết kế cho bài toán tìm kiếm và tóm tắt nội dung video. Quy trình vận hành đơn giản nhưng mạnh mẽ: chỉ cần chọn một video, nhập mô tả ngắn gọn về nội dung cần tìm, và agent sẽ tự động xác định các đoạn liên quan, đồng thời tạo ra phần tóm tắt súc tích trong thời gian thực. NVIDIA Blueprints là yếu tố then chốt giúp hiện thực hóa giải pháp này – bộ kiến trúc giải pháp và công cụ đã được kiểm chứng, cho phép thử nghiệm nhanh chóng. Thay vì mất hàng tháng để xây dựng một nguyên mẫu từ đầu, nhóm đã có thể chuyển từ ý tưởng sang bản demo hoạt động chỉ trong một ngày. Sự tăng tốc này không chỉ chứng minh tính khả thi của giải pháp mà còn mang lại cho doanh nghiệp cách nhìn cụ thể về việc AI có thể được áp dụng như thế nào cho các thách thức xử lý dữ liệu video của riêng họ. [caption id="attachment_67180" align="aligncenter" width="1262"] Hình ảnh: Kiến trúc giải pháp AI Camera Agent (NVIDIA)[/caption] Đặc biệt, FPT AI Factory cung cấp môi trường full-stack, bao gồm từ các thành phần hạ tầng như GPU, máy ảo (VM) và Kubernetes đến các công cụ dành cho nhà phát triển, giúp triển khai giải pháp AI một cách nhanh chóng và hiệu quả. Với kiến trúc linh hoạt cùng các mô hình sẵn sàng sử dụng, nhà phát triển thậm chí có thể xây dựng giải pháp hoàn chỉnh chỉ với một NVIDIA H100 GPU, cân bằng giữa hiệu năng, khả năng mở rộng và tối ưu chi phí. Chẳng hạn, FPT AI Inference cung cấp thư viện mô hình sẵn dùng, cho phép nhà phát triển tích hợp ngay lập tức qua các API đơn giản. Với mức giá token cạnh tranh, đội ngũ phát triển có thể chạy các tác vụ suy luận nhanh hơn trong khi giảm đáng kể chi phí, giúp doanh nghiệp đưa ứng dụng AI ra thị trường một cách hiệu quả hơn. Tối ưu quy trình tinh chỉnh mô hình AI Hiện nay, nhà phát triển có thể tinh chỉnh mô hình trực tiếp trên GPU Container, điều này rất phù hợp cho mục đích thử nghiệm và phát triển nhanh. Tuy nhiên, để đưa một giải pháp vào vận hành thực tế, cần hơn cả sức mạnh tính toán - đó là khả năng tự động hóa quy trình tinh chỉnh. Để đáp ứng nhu cầu này, FPT AI Studio được giới thiệu, tích hợp các thành phần phổ biến trong quy trình MLOps như AI Notebook, xử lý dữ liệu (Data Processing) và nhiều chiến lược tinh chỉnh khác nhau như continual training. FPT AI Studio cho phép người dùng tích hợp dữ liệu, mô hình nền tảng và các chiến lược tinh chỉnh, với giao diện kéo-thả thân thiện, giúp xây dựng workflow nhanh chóng. Mô hình sau khi được tinh chỉnh có thể được lưu trữ trong Model Hub - một kho trung tâm để quản lý phiên bản, chia sẻ và tái sử dụng. Sau đó, các mô hình này có thể được chuyển ngay sang FPT AI Inference để triển khai với khả năng mở rộng và độ trễ thấp trong môi trường sản xuất. FPT AI Studio cung cấp môi trường lý tưởng để tối ưu hóa việc tinh chỉnh và triển khai mô hình. Nền tảng này vừa dễ tiếp cận cho người mới, vừa cho phép tùy chỉnh sâu cho người dùng nâng cao. Các thành phần chính của MLOps trên FPT AI Studio bao gồm: AI Notebook: môi trường thử nghiệm lập trình dựa trên mã nguồn. Các quy trình xử lý dữ liệu: xử lý dữ liệu trước khi huấn luyện và kỹ thuật tạo đặc trưng (feature engineering). Chiến lược tinh chỉnh bao gồm huấn luyện liên tục (continual training), thích ứng theo miền (domain adaptation) và học chuyển giao (transfer learning). Khi một mô hình đã được tinh chỉnh trong FPT AI Studio, nó sẽ được lưu giữ trong Model Hub để dễ dàng quản lý, chia sẻ và sử dụng lại. Từ đây, mô hình có thể được chuyển trực tiếp sang FPT AI Inference, phục vụ với hiệu suất cao và độ trễ thấp trong môi trường sản xuất. [caption id="attachment_67182" align="aligncenter" width="1312"] Hình ảnh: Quy trình huấn luyện trên FPT AI Studio[/caption] Tại buổi chia sẻ, ông Hùng đã minh họa một câu chuyện thành công về cách FPT AI Studio được ứng dụng để tùy biến một mô hình ngôn ngữ lớn phục vụ lĩnh vực y tế tại Việt Nam. Mô hình gốc được chọn là Llama-3.1-8B, cân bằng tốt giữa khả năng xử lý và hiệu suất. Nhiệm vụ đặt ra là phát triển một mô hình tối ưu cho trả lời câu hỏi y tế, yêu cầu điều chỉnh chuyên sâu theo lĩnh vực nhưng vẫn giữ nguyên năng lực suy luận tổng quát của mô hình gốc. Bộ dữ liệu sử dụng bao gồm các tài liệu y tế tiếng Việt, với mục tiêu nâng cao khả năng nhớ chính xác thông tin, độ chuyên sâu về lĩnh vực, và chất lượng phản hồi trong các tình huống hỏi đáp lâm sàng. Cách tiếp cận thứ nhất dựa trên việc huấn luyện liên tục (continual pre-training). Sử dụng 24 NVIDIA H100 GPU trên 3 node, mô hình được huấn luyện trên bộ dữ liệu y tế qua 3 epoch, toàn bộ quy trình mất khoảng 31 giờ để hoàn tất. Cách tiếp cận thứ hai áp dụng tinh chỉnh có giám sát với LoRA adapters, là giải pháp tiết kiệm tài nguyên hơn. Trong phương án này, chỉ sử dụng 4 NVIDIA H100 GPU trên một node, huấn luyện qua 5 epoch, với thời gian tổng cộng khoảng 3 giờ. Mặc dù yêu cầu tính toán thấp hơn, phương pháp này vẫn mang lại cải thiện đáng kể cho các tác vụ hỏi đáp chuyên ngành. [caption id="attachment_67183" align="aligncenter" width="922"] Hình ảnh: Kết quả của quá trình pre-training và SFT LLM với bộ dữ liệu y tế[/caption] Gợi ý triển khai hiệu quả Trước tiên, điều quan trọng là lựa chọn công cụ phù hợp cho từng loại khối lượng công việc nhằm tối đa hóa cả hiệu suất lẫn hiệu quả chi phí. Với FPT AI Factory, người dùng được trang bị đầy đủ công cụ cần thiết cho mọi loại khối lượng công việc AI/ML, giúp thúc đẩy đổi mới AI nhanh hơn và hiệu quả hơn. Đối với giai đoạn thử nghiệm ban đầu, GPU Container hoặc AI Notebook cung cấp môi trường linh hoạt cho các nhà phát triển thử nghiệm ý tưởng và chạy nguyên mẫu nhanh. Khi triển khai, lựa chọn phù hợp phụ thuộc vào khối lượng công việc: GPU Container lý tưởng cho việc suy luận nhẹ, trong khi GPU Virtual Machine mang lại hiệu suất cần thiết cho suy luận thời gian thực hoặc xử lý theo lô. Các khối lượng công việc tính toán hiệu năng cao (HPC) đạt hiệu quả tối ưu trên Metal Cloud, cung cấp hiệu suất bare metal cho các tác vụ yêu cầu cao. Cuối cùng, các tổ chức muốn sử dụng mô hình sẵn sàng có thể truy cập AI Marketplace, nơi cung cấp các LLM đã được huấn luyện sẵn và dịch vụ hỗ trợ để tăng tốc quá trình áp dụng mà không cần tinh chỉnh thêm. [caption id="attachment_67184" align="aligncenter" width="941"] Hình ảnh: Giải pháp của FPT AI Factory cho các loại khối lượng công việc AI/ML khác nhau[/caption] Thứ hai, các nhà phát triển cần tối ưu hóa khối lượng công việc huấn luyện. Việc tối ưu huấn luyện các mô hình AI sinh tạo lớn đòi hỏi kết hợp giữa kỹ thuật tận dụng phần cứng và thiết kế quy trình làm việc. Một phương pháp quan trọng là sử dụng huấn luyện chính xác hỗn hợp (mixed-precision training), áp dụng các định dạng như FP16 hoặc BF16 để tăng tốc tính toán trên NVIDIA GPU đồng thời giảm tới 50% bộ nhớ sử dụng. Điều này không chỉ rút ngắn thời gian huấn luyện mà còn duy trì độ chính xác với khả năng tự động mở rộng. Huấn luyện phân tán cũng rất quan trọng, với các chiến lược như PyTorch DDP hoặc pipeline parallelism giúp mở rộng khối lượng công việc trên nhiều GPU hoặc node, cải thiện thông lượng và rút ngắn chu kỳ phát triển. Trong môi trường đa node, tối ưu kết nối cluster bằng NVLink hoặc InfiniBand có thể tăng tốc huấn luyện lên tới 3 lần, đảm bảo đồng bộ hiệu quả cho các tác vụ AI quy mô lớn. Quy trình dữ liệu và lưu trữ cũng cần được tối ưu, sử dụng NVIDIA DALI và khả năng I/O mở rộng để tránh nghẽn cổ chai. Cuối cùng, các công cụ đối chuẩn như kiểm thử hiệu suất GPU của FPT AI Factory và kết quả MLPerf của NVIDIA giúp xác thực cấu hình, đảm bảo mở rộng hiệu quả về chi phí cho quá trình tinh chỉnh. Thứ ba, cần tối ưu hóa khối lượng công việc suy luận (inference) để cung cấp dịch vụ AI tạo sinh có khả năng mở rộng và độ trễ thấp. Một phương pháp hiệu quả là lượng tử hóa (quantization) và sử dụng độ chính xác thấp hơn với NVIDIA TensorRT, chuyển đổi mô hình sang FP8 hoặc INT8 để tăng thông lượng tới 1,4 lần với ít ảnh hưởng tới độ chính xác. Đối với các mô hình ngôn ngữ lớn, quản lý bộ nhớ KV cache hiệu quả cũng rất quan trọng; các kỹ thuật như PagedAttention và chunked prefill giúp giảm phân mảnh bộ nhớ và rút ngắn thời gian tạo token đầu tiên tới 2–5 lần trong môi trường nhiều người dùng. Speculative decoding cải thiện hiệu suất bằng cách kết hợp một mô hình nháp nhỏ với mô hình chính để dự đoán nhiều token cùng lúc, mang lại thông lượng tăng 1,9–3,6 lần, đồng thời giảm độ trễ, đặc biệt hữu ích trong ứng dụng thời gian thực như tóm tắt video. Mở rộng với multi-GPU parallelism cũng đóng vai trò then chốt, giúp tăng tới 1,5 lần hiệu suất trong các tác vụ tinh chỉnh phân tán ở cluster khối lượng lớn. Cuối cùng, model distillation và pruning giúp thu gọn mô hình, giảm chi phí và độ trễ 20 - 30% mà không làm giảm chất lượng đầu ra. Điểm nhấn chính Kiến trúc quy trình AI toàn diện và bảo mật: Phân tích kiến trúc của một “AI factory” trong thực tế, tập trung vào nguyên tắc thiết kế để xây dựng vòng đời phát triển an toàn trong trung tâm dữ liệu nội bộ. Khán giả sẽ nắm rõ các bước kỹ thuật để đảm bảo cách ly dữ liệu, quản lý hosting mô hình an toàn, và thiết lập lộ trình từ tinh chỉnh tới triển khai AI agent đạt chuẩn doanh nghiệp. Kỹ thuật thực tiễn cho vận hành LLM tăng tốc GPU: Vượt ra ngoài thông số kỹ thuật, học cách tận dụng GPU hiệu năng cao (như NVIDIA H100/H200) một cách thực tế. Phiên chia sẻ này trình bày các phương pháp tối ưu cụ thể cho cả huấn luyện và tinh chỉnh, nhằm tối đa hóa thông lượng, giảm độ trễ, và rút ngắn chu kỳ phát triển cho các ứng dụng AI sinh tạo có yêu cầu cao.

Tinh chỉnh Llama 3 trong 30 phút trên FPT AI Factory: Giải pháp giúp doanh nghiệp tăng tốc phát triển AI

11:34 03/09/2025

Vừa qua, FPT đã tổ chức webinar với chủ đề“Tinh chỉnh Llama 3 trong 30 phút trên FPT AI Factory” (“Fine-Tuning Llama 3 in 30 minutes on FPT AI Factory”) cùng sự tham gia của ông Donald Murataj, Chuyên gia AI tại FPT, xoay quanh chủ đề về ứng dụng kỹ thuật tinh chỉnh hiệu quả mô hình Llama 3 trên FPT AI Factory. AI tạo sinh – Xu hướng tất yếu của doanh nghiệp Trong bối cảnh hiện nay, trí tuệ nhân tạo (AI) đã trở thành một trong những yếu tố quan trọng thúc đẩy sự phát triển của doanh nghiệp. Đặc biệt, AI tạo sinh (Gen AI) nổi lên như một công nghệ đột phá, không chỉ giúp tối ưu hiệu quả vận hành và nâng cao trải nghiệm khách hàng, mà còn mở ra những mô hình kinh doanh hoàn toàn mới. Thách thức lớn nhất đối với doanh nghiệp là làm thế nào để "cá nhân hóa" những mô hình ngôn ngữ khổng lồ như Llama 3 theo dữ liệu và ngữ cảnh đặc thù của mình. Đây chính là lúc tinh chỉnh trở thành chìa khóa để GenAI thực sự tạo ra giá trị đột phá. Buổi webinar của FPT đã cho thấy quá trình phức tạp này có thể được thực hiện một cách nhanh chóng, đơn giản và hiệu quả ngay trên FPT AI Factory. Trải nghiệm tinh chỉnh Llama 3 chỉ trong 30 phút Điểm nhấn của webinar là màn trình diễn trực tiếp, nơi chuyên gia FPT thực hiện toàn bộ quy trình tinh chỉnh Llama 3 chỉ trong 30 phút, hướng dẫn người tham dự chi tiết qua từng bước: Bước 1: Chuẩn bị bộ dữ liệu huấn luyện sát với nhu cầu thực tế, giúp mô hình hiểu đúng bối cảnh và ngôn ngữ riêng của doanh nghiệp. Bước 2: Khởi tạo môi trường GPU Container trên FPT AI Factory để đảm bảo tốc độ xử lý nhanh, ổn định và dễ dàng mở rộng khi cần. Bước 3: Thực hiện fine-tuning ngay trên giao diện trực quan, vừa đơn giản thao tác vừa cho phép kiểm soát toàn bộ quá trình. Bước 4: Đánh giá kết quả và so sánh với mô hình gốc để nhận thấy rõ sự cải thiện về hiệu năng và độ chính xác. Điều khiến người tham dự ấn tượng nhất chính là sự đơn giản và dễ tiếp cận của FPT AI Factory. Ngay cả đội ngũ kỹ thuật chưa có nhiều kinh nghiệm phát triển AI cũng có thể nhanh chóng tạo ra mô hình AI riêng của mình. Nếu như trước đây quá trình tinh chỉnh thường mất vài ngày, thì nay chỉ trong chưa đầy một giờ, toàn bộ quy trình đã hoàn thiện, minh chứng rõ ràng cho sức mạnh tối ưu của FPT AI Factory. Trải nghiệm này đã biến một quy trình vốn phức tạp trở nên nhanh chóng và dễ áp dụng, mở ra cơ hội để mọi doanh nghiệp bắt tay vào ứng dụng AI ngay từ bước thử nghiệm đầu tiên. >>> Xem lại webinar tại đây: https://www.youtube.com/watch?v=6L1nQteXAnM&ab_channel=FPTAIFactory FPT AI Factory – Bộ giải pháp phát triển AI toàn diện dành cho doanh nghiệp Tất cả những điều này trở thành hiện thực nhờ FPT AI Factory – bộ giải pháp phát triển AI toàn diện được xây dựng trên hạ tầng hiện đại, khai thác sức mạnh của siêu chip NVIDIA H100/H200 GPU và phần mềm NVIDIA AI Enterprise. Kết hợp với kinh nghiệm triển khai thực tiễn từ FPT, FPT AI Factory giúp doanh nghiệp rút ngắn thời gian phát triển mô hình, tối ưu chi phí và mở rộng quy mô triển khai một cách linh hoạt, bảo mật. Nền tảng bao gồm 4 thành phần chính: FPT AI Infrastructure: Hạ tầng tính toán hiệu năng cao, tiết kiệm năng lượng cho LLM và mô hình đa phương thức. FPT AI Studio: Môi trường fine-tuning, thử nghiệm và prototyping nhanh chóng, tiết kiệm chi phí. FPT AI Inference: Nền tảng phục vụ AI với độ trễ thấp, hiệu năng cao, phù hợp cho ứng dụng ở môi trường sản xuất. FPT AI Agents: Nền tảng xây dựng và vận hành AI agent thông minh, đa ngôn ngữ, tích hợp liền mạch với quy trình doanh nghiệp. Ngoài ra, FPT AI Factory còn tích hợp hơn 20 sản phẩm GenAI sẵn sàng sử dụng, giúp doanh nghiệp nhanh chóng ứng dụng AI vào trải nghiệm khách hàng, vận hành, quản trị nhân sự và tối ưu chi phí.

Cookie	Thời gian	Mô tả
cookielawinfo-checbox-analytics	11 Tháng
cookielawinfo-checbox-functional	11 Tháng
cookielawinfo-checbox-others	11 Tháng
cookielawinfo-checkbox-necessary	11 Tháng
cookielawinfo-checkbox-performance	11 Tháng
viewed_cookie_policy	11 Tháng

Danh mục

FPT ra mắt AI Factory tại Nhật Bản

Apache NiFi cách mạng hóa nhập, chuyển đổi dữ liệu thế nào?

Khám phá những công nghệ mới sẽ được FPT Smart Cloud hé lộ tại FPT Techday 2024