Nvidia RTX A4000 firmy HP – test

Nvidia RTX A4000 firmy HP – test

Nvidia RTX A4000 – test profesjonalnej karty graficznej

aktualizacja 10.05.2022

Karta graficzna RTX A4000 to jedna z ciekawszych kart z linii profesjonalnych procesorów graficznych ze względu na swoje niewielkie wymiary oraz atrakcyjną cenę /jak na produkt profesjonalny/. RTX A4000 przeznaczona jest dla stacjonarnych stacji roboczych, które potrzebują wysokiej wydajności do ray tracingu w czasie rzeczywistym, obliczeń związanych ze sztuczną inteligencję, czy też montażu materiałów Video w 4K.

Karta nazywana jest najpotężniejszą kartą graficzną jednosplotową, bo faktycznie zajmuje tylko jeden slot, jest smukła i naprawdę jak na dzisiejsze standardy kart graficznych jest wręcz filigranowa. Jednak za tą skromną wielkością kryje się całkiem spora moc, bo jej wydajność w FP32 wynosi 19,17 TFLOPS, zawiera ona 48 rdzeni RT (drugiej generacji), 192 rdzeni Tensor trzeciej generacji oraz 6144 rdzeni CUDA i posiada też całkiem sporo pamięci, bo aż 16 Gb DDR6 ECC.

Do tego jest bardzo energooszczędna, jej TDP wynosi tylko 140 W. W Polsce karta jest do kupienia w cenie ok 5500 PLN. Cena karty mimo kryzys na rynku kart graficznych nie jest przesadzona. Sugerowana przez producenta cena karty wynosi 999 $, zwiększając kwotę o podatek Vat i wysoki kurs dolara wydaje się, że cena karty na rynku polskim jest uczciwa. Oczywiście można spotkać firmy sprzedające RTX A4000 nawet za 8 tys PLN, ale jeżeli dokładnie przejrzymy oferty bez problemu znajdziemy kartę w cenie sugerowanej przez producenta lub nie wiele wyższej.

Model, który trafił do naszej redakcji był to RTX A4000 produkcji firmy HP, ale wydaje się, że niczym się nie różni od wersji sprzedawanej przez PNY.

RTX A4000 oferuje te same profesjonalne funkcje, certyfikaty sprzętowe i programowe, certyfikowane sterowniki, które znajdziecie w pozostałych kartach serii RTX Axxxx.  Karta jest wyposażona w cztery porty DisplayPort 1.4a i zwykły 1x 6-pinowy port zasilania PCIe.

Karty serii RTX A koncertują się na stabilności działania i są dostosowane do długotrwałego obciążenia w takich obliczeniach jak rendering czy nauczanie maszynowe. Mimo niewielkich rozmiarów bez problemu karta wytrzymuje nawet wielodniowe obciążenia związane ze sztuczną inteligencją. W naszych testach przy 4 dobowej nieprzerwanej pracy przy trenowaniu modelu StyleGan2 Ada karta nigdy nie przekroczyła temperatury wyższej niż 63 stopnie C natomiast przy pracy z modelami renderowanymi w programie Daz3d temperatura wynosiła maksymalnie 81 C. Karta wg producenta bez problemu może pracować przez wiele dni nawet przy temperaturze karty wynoszącej 86 C, ale nam nigdy nie udało się zaobserwować, żeby karta osiągnęła taką temperaturę. Czytałem zagraniczne recenzję tej karty, gdzie temperatura 86 stopni C było dość często osiągane przy testach jednak ja nawet takiej temperatury nie osiągnąłem przy overlockingu za pomocą Afterburner MSI, bo kartę da się podkręcić a szczególnie sporo jej pamięć, ale oczywiście nie jest to zalecane.

Karta w grach pod względem wydajności plasuje się gdzieś pomiędzy RTX 3060 Ti a RTX 3070 z tym, że bliżej jej do RTX 3060 TI niż modelu 3070. Oczywiście wydaje się, że w takim wypadku przepłacamy mocno za kartę, bo w tej chwili model RTX 3070 jest znacznie tańszy. Jednak nie do końca, po pierwsze otrzymujemy 2 razy więcej pamięci co jest istotne w wielu zastosowaniach, po drugie karta nie ma zabezpieczenia LHR a po trzecie mimo zbliżonej wydajności zużywa znacznie mniej energii, bo w RTX 3070 TDP wynosi 220W a w RTX A4000 jak już wspominałem wcześniej jedynie 140W przy różnicy wydajności 1,11 TFLOPS w FP32.

Dlatego uważam, że karta RTX A4000 jest bardziej uniwersalna w zastosowaniach niż model RTX 3070. Karta pozwala na trenowanie sporych modeli sztucznej inteligencji, energooszczędne kopanie kryptowalut / brak blokady LHR/, renederowanie naprawdę złożonych scen, pracy nad materiałami video 4K, jest też zalecaną kartą do Unreal Engine a w grach osiąga średnio ok 10% mniej klatek/s niż RTX 3070 więc w Full HD

Nie należy też nie doceniać jej certyfikowanych sterowników które w wielu profesjonalnych programach potrafią zaskoczyć oferując znacznie wyższą wydajność od teoretycznie mocniejszych kart dla graczy.

Oczywiście znajdą się głosy które stwierdzą, że dokładając trochę złotówek można kupić RTX 3080 12GB który znacznie przewyższa wydajnością RTX A4000.

Jeżeli tylko używasz komputera do gier to oczywiście zgadzam się w tym w 100%, ale jeżeli robisz coś więcej niż tylko granie te brakujące 4GB pamięci mogą naprawdę zaboleć, przykładowo przy obliczeniach związanych ze sztuczną inteligencją nic chyba bardziej nie frustruje w tej dziedzinie niż komunikat o braku pamięci a wszystkie poważniejsze modele najczęściej mieszczą się w granicach 16GB pamięci karty graficznej.

RTX A4000 w komputerze testowym

Testy karty w wydajności grafiki w DirecX12 oraz w OpenCL.

Basemark GPU

Basemark GPU to profesjonalne narzędzie do oceny i porównywania wydajności grafiki na platformach mobilnych i stacjonarnych.

Nasz test GPU RTX A4000 w DirectX12– 12089 punktów

LuxMark 3.1

LuxMark to wieloplatformowe narzędzie do testowania OpenCL stworzone przez twórców silnika renderowania 3D o otwartym kodzie źródłowym – LuxRender.

Test GPU OpenCL /Hotel Lobby/: 10 753 punktów /only benchmark GPU/

Test GPU OpenCL /LuxBall/: 48 334 punktów /only benchmark GPU/

StyleGan2 Ada

Przeprowadziłem również testowe szkolenie od podstaw modelu StyleGan2 Ada Pytorch o rozdzielczości 512×512 i ilości zdjęć ok 7 tys. Wydajność jaką udało mi się osiągnąć wynosiła: 191-194 s/kimg, więc tym wynikiem jestem rozczarowany. Model szkolił się bardzo stabilnie i bezproblemowo, ale mimo różnych prób nie udało mi się przyspieszyć szkolenia.

Z dokumentacji StyleGan2 Ada Pytorch wynika, że na podobnych parametrach jakie ja użyłem w szkoleniu StyleGan2 Ada wydajność pojedynczej karty V100 wynosiła: 72,5–74,9 s/kimg, więc to spora różnica. Spodziewałem się oczywiście różnicy, ale sięgającej 50-60% na korzyść V100. Wiele testów z którymi się wcześniej zapoznawałem wskazywało, że w szkoleniu modeli nauczania maszynowego karta V100 jest szybsza od A4000 średnio o 50%. Jednak moje próby tego nie potwierdziły. Co prawda wiele osób szkolących modele StyleGan2 Ada ma problemy z wydajnością kart z serii RTX 3000 więc może to jeszcze kwestia sterowników a nie słabej wydajności karty w zakresie szkolenia sztucznej inteligencji.

Aktualizacja: Słaba wydajność w StyleGan2 Ada nie dawała mi spokoju i i wykonałem wiele prób konfiguracyjnych żeby poprawić jej wydajność, jednak bez większego rezultatu. Rozwiązaniem okazało się użycie wersji StyleGan3, ale w trybie szkolenia StyleGan2 Ada. Nowa wersja StyleGan poprawiła min. współpracę z kartami RTX serii 3000 i wydajność karty wzrosła i to znacznie! Uzyskałem 128,94 s/kimg co jest bardzo dobrym wynikiem, bo w tym samym trybie szkolenia karta V100 uzyskała 71,59 s/kimg a potężna A100 osiągneła szybkość 41,06 s/kimg, ale to karty z zupełnie innej półki cenowej.

Plusy karty:

  • Uniwersalność w zastosowaniach
  • Energooszczędność – 140W
  • 16 GB pamięci ECC
  • Brak blokady LHR
  • Zajmuje tylko jeden slot
  • Względnie cicha praca nawet przy sporym obciążeniu
  • Dobra cena jak na produkt profesjonalny

Minus karty:

  • Brak NVLink

Podsumowanie:

RTX A4000 wg mnie to świetny produkt, oczywiście zawsze się chce mieć więcej mocy i więcej pamięci, ale od tego są modele RTX A4500 i A5000 oczywiście za znacznie większe pieniądze. Trudno doczepić się do czegoś, bo karta przez sporą ilość pamięci i dobrą wydajność jest produktem uniwersalnym idealnym dla hobbysty komputerowego który nie tylko spędza większość czasu na graniu jak i dla małej firmy potrzebującej uniwersalnego komputera za niewielkie pieniądze o różnorodnym zastosowaniu lub dla inżyniera pracującego na programach typu AutoCad czy też youtubera chcącego sprawnie obrobić swoje materiały Video w 4K. Karta godna polecenia.

Parametry techniczne RTX A4000 HP

Pamięć GPU16 GB pamięci GDDR6 ECC
Interfejs pamięci256-bitowy
Przepustowość pamięci448 GB/s
Nazwa GPU                                                                     GA104
Rdzenie CUDA oparte na architekturze NVIDIA Ampere6144
Rdzenie tensorowe trzeciej generacji firmy NVIDIA192
Rdzenie RT NVIDIA drugiej generacji48
Wydajność o pojedynczej precyzji19.2 TFLOPS
Wydajność rdzenia RT37,4 TFLOPS
Wydajność tensora153,4 TFLOPS
Interfejs systemuPCI Express 4.0 x16
Pobór energiiCałkowita moc karty: 140 W
ChłodzenieAktywny
Wymiary4,4” wys. x 9,5” dł., pojedynczy slot
Złącza wyświetlacza4x DisplayPort 1.4a
Maksymalna liczba jednoczesnych wyświetlaczy4x 4096×2160 @ 120 Hz, 4x 5120×2880 @ 60 Hz, 2x 7680×4320 przy 60 Hz
Złącze zasilania1x 6-pinowe PCIe
Kodowanie/dekodowanie silników1x kodowanie, 1x dekodowanie (+dekodowanie AV1)
Gotowy na VRTAK
Graficzne APIDirectX 12.075, model cieniowania 5.175, OpenGL 4.686, Vulkan 1.26
Obliczeniowe interfejsy APICUDA, DirectCompute, OpenCL™

Tekst zaktualizowano 25.04.2022

Author: gadzety360
Jestem pasjonatem wszelkich technologii IT a szczególnie nauczania maszynowego oraz grafiki 3D.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *