Wraz z szybkim rozwojem aplikacji AI, na czele którego stoją modele takie jak ChatGPT, zapotrzebowanie na moc obliczeniową gwałtownie wzrosło. Aby sprostać rosnącym wymaganiom obliczeniowym ery sztucznej inteligencji, grupa H3C pod patronatem Tsinghua Unigroup zaprezentowała niedawno 11 nowych produktów z serii H3C UniServer G6 i HPE Gen11 podczas szczytu liderów NAVIGATE 2023. Te nowe produkty serwerowe tworzą kompleksową matrycę dla sztucznej inteligencji w różnych scenariuszach, zapewniając potężną platformę bazową do obsługi ogromnych danych i algorytmów modeli oraz zapewniając wystarczającą ilość zasobów obliczeniowych AI.
Zróżnicowana matryca produktów zaspokajająca różnorodne potrzeby obliczeniowe AI
Jako lider inteligentnych obliczeń, Grupa H3C od wielu lat jest głęboko zaangażowana w dziedzinę sztucznej inteligencji. W 2022 r. firma H3C osiągnęła najwyższą stopę wzrostu na chińskim rynku obliczeń przyspieszonych i zgromadziła łącznie 132 pierwsze na świecie rankingi w znanym na całym świecie benchmarku AI MLPerf, co potwierdza jej dużą wiedzę techniczną i możliwości.
Wykorzystując zaawansowaną architekturę obliczeniową i możliwości inteligentnego zarządzania mocą obliczeniową zbudowane na fundamencie inteligentnego przetwarzania, firma H3C opracowała flagowy inteligentny komputer obliczeniowy H3C UniServer R5500 G6, zaprojektowany specjalnie do szkolenia modeli na dużą skalę. Wprowadzili także H3C UniServer R5300 G6, hybrydowy silnik obliczeniowy odpowiedni do scenariuszy wnioskowania/szkolenia na dużą skalę. Produkty te dodatkowo spełniają różnorodne wymagania obliczeniowe w różnych scenariuszach AI, zapewniając kompleksowe pokrycie obliczeń AI.
Flagowy model inteligentnego komputera zaprojektowany do szkolenia modeli na dużą skalę
H3C UniServer R5500 G6 łączy w sobie siłę, niskie zużycie energii i inteligencję. W porównaniu do poprzedniej generacji oferuje trzykrotnie większą moc obliczeniową, skracając czas szkolenia o 70% w przypadku scenariuszy szkoleniowych z modelami wielkoskalowymi GPT-4. Ma zastosowanie w różnych scenariuszach biznesowych AI, takich jak szkolenia na dużą skalę, rozpoznawanie mowy, klasyfikacja obrazów i tłumaczenie maszynowe.
Mocne strony: R5500 G6 obsługuje do 96 rdzeni procesora, zapewniając wzrost wydajności rdzenia o 150%. Jest wyposażony w nowy moduł 8-GPU NVIDIA HGX H800, zapewniający 32 PFLOPS mocy obliczeniowej, co skutkuje 9-krotnie większą szybkością uczenia AI wielkoskalowych modeli i 30-krotną poprawą wydajności wnioskowania AI wielkoskalowych modeli. Ponadto dzięki obsłudze sieci PCIe 5.0 i 400G użytkownicy mogą wdrażać klastry obliczeniowe AI o wyższej wydajności, przyspieszając wdrażanie i stosowanie sztucznej inteligencji w przedsiębiorstwach.
Inteligencja: R5500 G6 obsługuje dwie konfiguracje topologii, inteligentnie dostosowując się do różnych scenariuszy aplikacji AI i przyspieszając głębokie uczenie się i aplikacje obliczeniowe, znacznie poprawiając wykorzystanie zasobów procesora graficznego. Dzięki funkcji wieloinstancyjnej GPU modułu H800, pojedynczy H800 można podzielić na 7 instancji GPU, z możliwością utworzenia do 56 instancji GPU, każda posiadająca niezależne zasoby obliczeniowe i pamięci. Znacząco zwiększa to elastyczność zasobów AI.
Niski ślad węglowy: R5500 G6 w pełni obsługuje chłodzenie cieczą, w tym chłodzenie cieczą zarówno procesora, jak i karty graficznej. Dzięki współczynnikowi PUE (efektywności zużycia energii) poniżej 1,1 umożliwia „chłodzenie obliczeń” w ogniu wzrostu mocy obliczeniowej.
Warto wspomnieć, że R5500 G6 został uznany za jeden z „10 najlepszych serwerów o wysokiej wydajności w roku 2023” w „Rankingu mocy obliczeniowej 2023” już po premierze.
Hybrydowy silnik obliczeniowy do elastycznego dopasowywania wymagań szkoleniowych i wnioskowania
H3C UniServer R5300 G6, jako serwer AI nowej generacji, oferuje znaczną poprawę specyfikacji procesora i karty graficznej w porównaniu do swojego poprzednika. Charakteryzuje się wyjątkową wydajnością, inteligentną topologią oraz zintegrowanymi możliwościami obliczeniowymi i pamięciami masowymi, dzięki czemu nadaje się do uczenia modeli głębokiego uczenia się, wnioskowania głębokiego uczenia się i innych scenariuszy zastosowań sztucznej inteligencji, elastycznie dopasowując się do potrzeb szkoleniowych i wnioskowania.
Wyjątkowa wydajność: R5300 G6 jest kompatybilny z najnowszą generacją procesorów graficznych NVIDIA klasy korporacyjnej, zapewniając 4,85-krotny wzrost wydajności w porównaniu z poprzednią generacją. Obsługuje różne typy kart akceleracji AI, takie jak procesory graficzne, DPU i NPU, aby sprostać heterogenicznym wymaganiom AI w zakresie mocy obliczeniowej w różnych scenariuszach, wzmacniając erę inteligencji.
Inteligentna topologia: R5300 G6 oferuje pięć ustawień topologii procesora graficznego, w tym HPC, równoległą sztuczną inteligencję, szeregową sztuczną inteligencję, bezpośredni dostęp do 4 kart i bezpośredni dostęp do 8 kart. Ta niespotykana elastyczność znacznie zwiększa możliwości dostosowania do różnych scenariuszy aplikacji użytkownika, inteligentnie przydziela zasoby i zapewnia wydajne działanie mocy obliczeniowej.
Zintegrowane przetwarzanie i pamięć masowa: R5300 G6 elastycznie obsługuje karty przyspieszające sztuczną inteligencję i inteligentne karty sieciowe, łącząc możliwości szkolenia i wnioskowania. Obsługuje do 10 procesorów graficznych o podwójnej szerokości i 24 gniazda na dyski twarde LFF (Large Form Factor), umożliwiając jednoczesne szkolenie i wnioskowanie na jednym serwerze oraz zapewniając ekonomiczny silnik obliczeniowy dla środowisk programistycznych i testowych. Dzięki pojemności do 400 TB w pełni spełnia wymagania dotyczące przestrzeni dyskowej danych AI.
Wraz z postępującym boomem sztucznej inteligencji moc obliczeniowa podlega ciągłym zmianom i stanowi wyzwanie. Wprowadzenie na rynek serwerów AI nowej generacji stanowi kolejny kamień milowy w zaangażowaniu Grupy H3C w technologię „wrodzonej inteligencji” i jej ciągłym dążeniu do ewolucji inteligentnego przetwarzania danych.
Patrząc w przyszłość, kierując się strategią „Cloud-Native Intelligence”, Grupa H3C wyznaje koncepcję „skrupulatnego pragmatyzmu, wyposażania epoki w inteligencję”. Będą nadal uprawiać żyzną glebę inteligentnego przetwarzania danych, badać scenariusze zastosowań sztucznej inteligencji na głębokim poziomie i przyspieszać nadejście inteligentnego świata z gotową na przyszłość, możliwą do dostosowania mocą obliczeniową.
Czas publikacji: 04 lipca 2023 r