Bàn về bản AI Workbench Beta sắp ra mắt của NVIDIA
Tại CES, Nvidia đã công bố một loạt bản cập nhật và phát hành công nghệ AI thế hệ mới, bao gồm GPU TensorRT, thư viện mã nguồn mở TensorRT-LLM, các công cụ dành cho PC và máy trạm RTX, GPU GeForce RTX SUPER được tăng tốc RTX và các công cụ phát triển AI mới để hỗ trợ tạo, kiểm tra và tùy chỉnh các mô hình AI và LLM tổng quát được đào tạo trước.
Hôm 8/1/2024 tại CES, NVIDIA đã công bố GPU desktop GeForce RTX SUPER mang lại hiệu suất AI vượt trội, laptop AI mới từ mọi nhà sản xuất hàng đầu cũng như các công cụ và phần mềm AI được tăng tốc NVIDIA RTX cho cả nhà phát triển và người tiêu dùng. Các công cụ này nâng cao trải nghiệm PC với AI tổng quát như: khả năng tăng tốc NVIDIA TensorRT của mô hình Stable Diffusion XL phổ biến dành cho quy trình chuyển văn bản thành hình ảnh, NVIDIA RTX Remix với các công cụ texture AI tổng quát, vi dịch vụ NVIDIA ACE và nhiều trò chơi khác sử dụng công nghệ DLSS 3 với Frame Generation.
AI Workbench mới, một bộ công cụ hợp nhất dành cho các nhà phát triển AI, sẽ ra mắt phiên bản beta vào cuối tháng này. Ngoài ra, NVIDIA TensorRT-LLM (TRT-LLM), một thư viện mã nguồn mở giúp tăng tốc và tối ưu hóa hiệu suất suy luận của các mô hình ngôn ngữ lớn (LLM) mới nhất, hiện hỗ trợ nhiều hơn các mẫu PC được tối ưu hóa trước. Được tăng tốc bởi TRT-LLM, Trò chuyện với RTX, một bản demo công nghệ của NVIDIA cũng phát hành trong tháng này, cho phép những người đam mê AI tương tác với ghi chú, tài liệu và nội dung khác của họ.
Jensen Huang, nhà sáng lập và Giám đốc điều hành NVIDIA cho biết: “Generative AI là quá trình chuyển đổi nền tảng quan trọng nhất trong lịch sử điện toán và sẽ biến đổi mọi ngành công nghiệp, bao gồm cả trò chơi diện tử”. “Với hơn 100 triệu PC và máy trạm RTX AI, NVIDIA là cơ sở cài đặt khổng lồ để các nhà phát triển và game thủ tận hưởng sự kỳ diệu của generative AI.”
Việc chạy Generative AI cục bộ trên PC rất quan trọng đối với các ứng dụng có tính riêng tư, độ trễ và nhạy cảm với chi phí. Tuy nhiên, nó đòi hỏi một lượng lớn các hệ thống sẵn sàng cho AI và các công cụ dành cho nhà phát triển được cài đặt để tối ưu hóa các mô hình AI cho nền tảng PC. Để thực hiện được điều này, NVIDIA đang đổi mới toàn bộ công nghệ của mình, thúc đẩy những trải nghiệm mới và xây dựng trên hơn 500 ứng dụng và trò chơi PC hỗ trợ AI đã được công nghệ NVIDIA RTX tăng tốc.
Máy tính và máy trạm RTX AI
GPU NVIDIA RTX có thể chạy nhiều ứng dụng với hiệu suất cao, giải phóng tiềm năng của AI trên PC. Lõi Tensor trong các GPU này tăng tốc đáng kể hiệu suất AI trên các ứng dụng đòi hỏi khắt khe.
Các card đồ họa dòng GeForce RTX 40 SUPER mới được công bố hôm 8/1/2024 tại CES bao gồm GeForce RTX 4080 SUPER, 4070 Ti SUPER và 4070 SUPER cho hiệu suất AI cao nhất. GeForce RTX 4080 SUPER tạo video AI nhanh hơn 1,5 lần — và hình ảnh nhanh hơn 1,7 lần — so với GPU GeForce RTX 3080 Ti. Lõi Tensor trong SUPER GPU cung cấp tới 836 nghìn tỷ hoạt động mỗi giây, mang lại khả năng biến đổi AI cho việc chơi game, sáng tạo và năng suất hàng ngày.
Các nhà sản xuất hàng đầu, bao gồm Acer, ASUS, Dell, HP, Lenovo, MSI, Razer và Samsung, đang phát hành một làn sóng laptop RTX AI mới, mang lại khả năng generative AI cho người dùng ngay lập tức. Các hệ thống mới mang lại hiệu suất tăng từ 20 đến 60 lần so với việc sử dụng các bộ xử lý thần kinh, sẽ bắt đầu xuất xưởng trong tháng này.
Máy trạm di động có GPU RTX có thể chạy phần mềm NVIDIA AI Enterprise, bao gồm TensorRT và NVIDIA RAPIDS, để phát triển khoa học dữ liệu và AI đơn giản, an toàn, tổng quát. Giấy phép ba năm cho NVIDIA AI Enterprise được bao gồm trong mỗi NVIDIA A800 40GB Active GPU.
Công cụ dành cho nhà phát triển PC mới để xây dựng mô hình AI
NVIDIA gần đây đã công bố NVIDIA AI Workbench, sẽ giúp các nhà phát triển tạo, thử nghiệm và tùy chỉnh các mô hình AI và LLM tổng quát được đào tạo trước bằng cách sử dụng hiệu năng và dung lượng bộ nhớ của PC. Ở phiên bản beta vào cuối tháng 1, nó sẽ cung cấp quyền truy cập hợp lý vào các kho lưu trữ phổ biến như Hugging Face, GitHub và NVIDIA NGC, cùng với giao diện người dùng đơn giản hóa cho phép các nhà phát triển sao chép, cộng tác và di chuyển dự án một cách dễ dàng.
Các dự án có thể được mở rộng quy mô đến hầu hết mọi nơi, chẳng hạn như trung tâm dữ liệu, đám mây công cộng hoặc Đám mây NVIDIA DGX, sau đó được đưa trở lại hệ thống RTX cục bộ trên PC hoặc máy trạm để suy luận và tùy chỉnh ánh sáng.
Phối hợp với HP, NVIDIA cũng đang đơn giản hóa việc phát triển mô hình AI bằng cách tích hợp các Mô hình và Điểm cuối của Nền tảng AI NVIDIA, bao gồm các mô hình AI được RTX tăng tốc và bộ công cụ phát triển phần mềm, vào HP AI Studio, một nền tảng tập trung cho khoa học dữ liệu. Người dùng có thể tìm kiếm, nhập và triển khai các mô hình được tối ưu hóa trên PC và đám mây.
Sau khi xây dựng mô hình AI cho các trường hợp sử dụng PC, nhà phát triển có thể tối ưu hóa chúng bằng cách sử dụng NVIDIA TensorRT để tận dụng Tensor Cores của GPU RTX.
Ngoài ra, NVIDIA gần đây đã mở rộng TensorRT sang các ứng dụng dựa trên văn bản với TensorRT-LLM dành cho Windows, một thư viện mã nguồn mở để tăng tốc LLM. Bản cập nhật mới nhất cho TensorRT-LLM hiện đã có, và đã bổ sung Phi-2 vào danh sách các mẫu được tối ưu hóa trước cho PC, chạy nhanh hơn tới 5 lần so với các chương trình phụ trợ suy luận khác.
Generative AI được tăng tốc RTX mang lại trải nghiệm PC mới
Tại CES, NVIDIA và các đối tác phát triển của mình đang phát hành các ứng dụng và dịch vụ mới dựa trên AI dành cho PC, bao gồm:
-
-
-
- NVIDIA RTX Remix, sẽ có bản beta vào cuối tháng này, là nền tảng tạo ra các bản remaster RTX của các trò chơi cổ điển. Nó cung cấp các công cụ AI tổng quát giúp chuyển đổi kết cấu cơ bản từ trò chơi cổ điển thành vật liệu kết xuất dựa trên vật lý hiện đại, có độ phân giải 4K.
- Các dịch vụ vi mô NVIDIA ACE, bao gồm các mô hình hoạt hình và lời nói tổng quát được hỗ trợ bởi AI, cho phép các nhà phát triển thêm hình đại diện kỹ thuật số thông minh, năng động vào trò chơi.
- Tăng tốc TensorRT cho các mô hình Turbo Stable Diffusion (SDXL) và mô hình nhất quán tiềm ẩn, TensorRT cải thiện hiệu suất cho cả hai lên tới 60% so với cách triển khai nhanh nhất trước đó. Hiện đã có phiên bản mở rộng Stable Diffusion TensorRT WebUI được cập nhật, bao gồm khả năng tăng tốc cho SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) và hỗ trợ LoRA được cải thiện.
- NVIDIA DLSS 3 với Frame Generation sử dụng AI để tăng tốc độ khung hình lên gấp 4 lần so với kết xuất gốc và xuất hiện trong 12 trên 14 trò chơi RTX mới được công bố, bao gồm Horizon Forbidden West, Pax Dei và Dragon’s Dogma 2.
- Trò chuyện với RTX, một bản demo công nghệ của NVIDIA sẽ ra mắt vào cuối tháng này, cho phép những người đam mê AI kết nối LLM PC với dữ liệu của họ bằng kỹ thuật thế hệ tăng cường truy xuất (RAG) phổ biến. Bản demo được TensorRT-LLM tăng tốc, cho phép người dùng tương tác với ghi chú, tài liệu và nội dung khác của họ. Nó cũng sẽ có sẵn dưới dạng một dự án tham khảo nguồn mở để các nhà phát triển có thể triển khai các khả năng tương tự trong ứng dụng của họ.
-
-
Tìm hiểu thêm về Generative AI tại NVIDIA tại CES.
iRender - Dịch vụ kêt xuất với công nghệ RTX mới nhất
iRender là một trong số ít dịch vụ kết xuất luôn cập nhật và cung cấp công nghệ GPU mới nhất RTX 4090/3090. Chúng tôi cung cấp cho thuê từ xa các máy chủ vật lý 100%. Bạn có thể thuê một (hoặc nhiều) máy chủ và sử dụng nó như máy tính của chính mình.
Chúng tôi có nhiều gói server, từ đơn cho đến đa GPU, phục vụ mọi phần mềm mà bạn muốn cài đặt. CPUs là AMD Ryzen Threadripper Pro 3955WX hoặc AMD Ryzen Threadripper Pro 5975WX, RAM 256GB, Lưu trữ NVMe SSD 2TB và card màn hình RTX4090 hoặc RTX3090.
Không chỉ có những cấu hình mạnh mẽ, iRender còn cung cấp cho bạn nhiều dịch vụ hơn nữa. Chúng tôi có công cụ truyền tải miễn phí và tiện lợi iRender drive cho macOS và Linux. Với người dùng Windows, chúng tôi khuyên dùng ứng dụng tích hợp iRender GPU, và bạn sẽ không cần truy cập trang web của chúng tôi nữa. Giá cả tại iRender cũng rất linh hoạt với thuê theo giờ (dùng đến đâu trả tiền đến đấy), thuê theo ngày/ tuần/ tháng với mức giảm giá 10-20%. Ngoài ra, bạn sẽ có sự hỗ trợ 24/7 từ đội ngũ của chúng tôi thông qua livechat, những người sẽ giúp bạn bất cứ khi nào bạn gặp vấn đề với dịch vụ.
Đăng ký tài khoản ngay hôm nay để trải nghiệm dịch vụ của chúng tôi. Hoặc liên hệ với chúng tôi qua Zalo: 0916806116 để được tư vấn và hỗ trợ.
Cảm ơn bạn & Happy Rendering!
Nguồn: awn.com