Nvidia RTX A4000 firmy HP

Nvidia RTX A4000 – test profesjonalnej karty graficznej

aktualizacja 10.05.2022

Karta graficzna RTX A4000 to jedna z ciekawszych propozycji z linii profesjonalnych procesorów graficznych ze względu na swoje niewielkie wymiary, atrakcyjną cenę oraz imponującą wydajność. Przeznaczona jest dla stacjonarnych stacji roboczych, które potrzebują wysokiej wydajności do ray tracingu w czasie rzeczywistym, obliczeń związanych ze sztuczną inteligencją oraz montażu materiałów wideo w 4K.

RTX A4000 jest nazywana najpotężniejszą kartą graficzną jednoslotową, ponieważ faktycznie zajmuje tylko jeden slot i jest smukła i lekka jak na dzisiejsze standardy. Jednak za tą skromną wielkością kryje się imponująca moc – wydajność w FP32 wynosi 19,17 TFLOPS, zawiera 48 rdzeni RT (drugiej generacji), 192 rdzeni Tensor trzeciej generacji, 6144 rdzeni CUDA oraz 16 Gb DDR6 ECC pamięci. Dzięki temu jest to idealna karta graficzna dla profesjonalistów poszukujących wysokiej wydajności w rozmiarze kompaktowym.

Karta graficzna RTX A4000 jest bardzo energooszczędna, ponieważ jej TDP wynosi tylko 140 W. W Polsce dostępna jest w cenie około 5500 PLN. Mimo trudnej sytuacji na rynku kart graficznych, cena tej karty nie jest zawyżona. Sugerowana przez producenta cena wynosi 999 $, a po doliczeniu podatku VAT oraz wysokiego kursu dolara, cena na rynku polskim wydaje się uczciwa. Oczywiście można znaleźć oferty z ceną wyższą, nawet 8 tys. PLN, ale jeśli dokładnie przejrzymy dostępne oferty, powinniśmy znaleźć kartę w cenie sugerowanej przez producenta lub nieznacznie wyższej.

Model, który trafił do naszej redakcji był to RTX A4000 produkcji firmy HP, ale wydaje się, że niczym się nie różni od wersji sprzedawanej przez PNY.

RTX A4000 oferuje te same profesjonalne funkcje, certyfikaty sprzętowe i programowe, certyfikowane sterowniki, które znajdziecie w pozostałych kartach serii RTX Axxxx. Karta jest wyposażona w cztery porty DisplayPort 1.4a i zwykły 1x 6-pinowy port zasilania PCIe.

Karty serii RTX A są skoncentrowane na stabilności działania i zaprojektowane do długotrwałego obciążenia w obliczeniach takich jak rendering czy nauczanie maszynowe. Mimo niewielkich rozmiarów, bez problemu wytrzymują nawet wielodniowe obciążenia związane ze sztuczną inteligencją. W naszych testach, przy czterodniowej, nieprzerwanej pracy przy trenowaniu modelu StyleGan2 Ada, karta nigdy nie przekroczyła temperatury powyżej 63 stopni Celsjusza, podczas gdy przy pracy z modelami renderowanymi w programie Daz3d temperatura maksymalnie wynosiła 81 stopni C. Zgodnie z informacjami producenta, karta bez problemu może pracować przez wiele dni nawet przy temperaturze 86 stopni C, jednak w naszych testach nigdy nie udało nam się osiągnąć takiej temperatury. Czytając zagraniczne recenzje tej karty, zauważyłem, że temperatura 86 stopni C była często osiągana w testach, ale ja nawet przy overclockingu za pomocą Afterburnera MSI nie osiągnąłem takiej temperatury. Kartę da się podkręcić, szczególnie pamięć, ale oczywiście nie jest to zalecane.

Karta graficzna RTX A4000 w grach plasuje się gdzieś pomiędzy RTX 3060 Ti a RTX 3070, bliżej do modelu 3060 Ti. Wydaje się, że w takim wypadku przepłacamy za kartę, ponieważ obecnie model RTX 3070 jest znacznie tańszy. Jednak nie do końca tak jest, ponieważ otrzymujemy dwa razy więcej pamięci, co jest istotne w wielu zastosowaniach. Ponadto, karta nie posiada zabezpieczenia LHR i mimo zbliżonej wydajności zużywa znacznie mniej energii – w RTX 3070 TDP wynosi 220 W, podczas gdy w RTX A4000 jedynie 140 W, przy różnicy wydajności 1,11 TFLOPS w FP32. To sprawia, że RTX A4000 jest ciekawą opcją dla profesjonalistów poszukujących wydajnej karty graficznej w kompaktowym rozmiarze.

Dlatego uważam, że karta graficzna RTX A4000 jest bardziej uniwersalna w zastosowaniach niż model RTX 3070. Pozwala ona na trenowanie złożonych modeli sztucznej inteligencji, energooszczędne kopanie kryptowalut (brak blokady LHR), renderowanie skomplikowanych scen, pracę nad materiałami wideo w rozdzielczości 4K oraz jest zalecaną kartą do Unreal Engine. W grach osiąga około 10% mniej klatek na sekundę niż RTX 3070, ale w pełnej rozdzielczości Full HD nadal oferuje wysoką wydajność.

Nie należy też lekceważyć jej certyfikowanych sterowników, które w wielu profesjonalnych programach potrafią zaskoczyć oferując znacznie wyższą wydajność niż teoretycznie mocniejsze karty dla graczy.

Oczywiście znajdą się głosy, które stwierdzą, że dokładając trochę złotówek można kupić RTX 3080 12 GB, który znacznie przewyższa wydajnością RTX A4000.

Jeśli tylko używasz komputera do gier, to zgadzam się z tym w 100%. Jednak jeśli robisz coś więcej niż tylko granie, te brakujące 4 GB pamięci mogą naprawdę zaboleć. Na przykład, przy obliczeniach związanych ze sztuczną inteligencją, nic tak bardzo nie frustruje jak komunikat o braku pamięci, a wszystkie poważniejsze modele najczęściej mieszczą się w granicach 16 GB pamięci karty graficznej. W takich przypadkach dodatkowe 4 GB pamięci w karcie RTX A4000 mogą okazać się bardzo przydatne i pozwolić na płynne działanie programów.

Testy karty w wydajności grafiki w DirecX12 oraz w OpenCL.

Basemark GPU

Basemark GPU to profesjonalne narzędzie do oceny i porównywania wydajności grafiki na platformach mobilnych i stacjonarnych.

Nasz test GPU RTX A4000 w DirectX12– 12089 punktów

LuxMark 3.1

LuxMark to wieloplatformowe narzędzie do testowania OpenCL stworzone przez twórców silnika renderowania 3D o otwartym kodzie źródłowym – LuxRender.

Test GPU OpenCL /Hotel Lobby/: 10 753 punktów /only benchmark GPU/

Test GPU OpenCL /LuxBall/: 48 334 punktów /only benchmark GPU/

StyleGan2 Ada

Przeprowadziłem również testowe szkolenie modelu StyleGan2 Ada Pytorch od podstaw o rozdzielczości 512×512 / ilości zdjęć ok. 7 tys/. Wydajność, jaką udało mi się osiągnąć, wynosiła 191-194 s/kimg, więc jestem rozczarowany. Model szkolił się stabilnie i bezproblemowo, ale mimo różnych prób nie udało mi się przyspieszyć szkolenia.

Z dokumentacji StyleGan2 Ada Pytorch wynika, że na podobnych parametrach jakie ja użyłem w szkoleniu StyleGan2 Ada wydajność pojedynczej karty V100 wynosiła: 72,5–74,9 s/kimg, więc to spora różnica. Spodziewałem się oczywiście różnicy, ale sięgającej 50-60% na korzyść V100. Wiele testów z którymi się wcześniej zapoznawałem wskazywało, że w szkoleniu modeli nauczania maszynowego karta V100 jest szybsza od A4000 średnio o 50%. Jednak moje próby tego nie potwierdziły. Co prawda wiele osób szkolących modele StyleGan2 Ada ma problemy z wydajnością kart z serii RTX 3000 więc może to jeszcze kwestia sterowników a nie słabej wydajności karty w zakresie szkolenia sztucznej inteligencji.

Aktualizacja: Słaba wydajność w StyleGan2 Ada nie dawała mi spokoju, więc wykonałem wiele prób konfiguracyjnych, aby ją poprawić. Bez większego sukcesu. Rozwiązaniem okazało się użycie wersji StyleGan3 w trybie szkolenia StyleGan2 Ada. Nowa wersja StyleGan poprawiła współpracę z kartami RTX serii 3000, co przełożyło się na wzrost wydajności. Uzyskałem 128,94 s/kimg, co jest bardzo dobrym wynikiem. W porównaniu, w tym samym trybie szkolenia, karta V100 osiągnęła wynik 71,59 s/kimg, a potężna A100 osiągnęła 41,06 s/kimg. Oczywiście, te karty są z zupełnie innej półki cenowej.

Plusy karty:

Uniwersalność w zastosowaniach

Energooszczędność – 140W

16 GB pamięci ECC

Brak blokady LHR

Zajmuje tylko jeden slot

Względnie cicha praca nawet przy sporym obciążeniu

Dobra cena jak na produkt profesjonalny

Minus karty:

Brak NVLink

Podsumowanie:

RTX A4000 wg mnie to świetny produkt, oczywiście zawsze się chce mieć więcej mocy i więcej pamięci, ale od tego są modele RTX A4500 i A5000 oczywiście za znacznie większe pieniądze. Trudno doczepić się do czegoś, bo karta przez sporą ilość pamięci i dobrą wydajność jest produktem uniwersalnym idealnym dla hobbysty komputerowego który nie tylko spędza większość czasu na graniu jak i dla małej firmy potrzebującej uniwersalnego komputera za niewielkie pieniądze o różnorodnym zastosowaniu lub dla inżyniera pracującego na programach typu AutoCad czy też youtubera chcącego sprawnie obrobić swoje materiały Video w 4K. Karta godna polecenia.

Parametry techniczne RTX A4000 HP

Pamięć GPU	16 GB pamięci GDDR6 ECC
Interfejs pamięci	256-bitowy
Przepustowość pamięci	448 GB/s
Nazwa GPU	GA104
Rdzenie CUDA oparte na architekturze NVIDIA Ampere	6144
Rdzenie tensorowe trzeciej generacji firmy NVIDIA	192
Rdzenie RT NVIDIA drugiej generacji	48
Wydajność o pojedynczej precyzji	19.2 TFLOPS
Wydajność rdzenia RT	37,4 TFLOPS
Wydajność tensora	153,4 TFLOPS
Interfejs systemu	PCI Express 4.0 x16
Pobór energii	Całkowita moc karty: 140 W
Chłodzenie	Aktywny
Wymiary	4,4” wys. x 9,5” dł., pojedynczy slot
Złącza wyświetlacza	4x DisplayPort 1.4a
Maksymalna liczba jednoczesnych wyświetlaczy	4x 4096×2160 @ 120 Hz, 4x 5120×2880 @ 60 Hz, 2x 7680×4320 przy 60 Hz
Złącze zasilania	1x 6-pinowe PCIe
Kodowanie/dekodowanie silników	1x kodowanie, 1x dekodowanie (+dekodowanie AV1)
Gotowy na VR	TAK
Graficzne API	DirectX 12.075, model cieniowania 5.175, OpenGL 4.686, Vulkan 1.26
Obliczeniowe interfejsy API	CUDA, DirectCompute, OpenCL™

Tekst zaktualizowano 25.04.2022