Na rynek trafiły popsute RTX 5090. Sprawdź swojego, wszak kosztował marne 20 tys. zł
Bezkonkurencyjne, najszybsze i najbardziej zaawansowane układy graficzne na rynku konsumenckim to bez najmniejszej wątpliwości układy GeForce RTX 5090. Na dziś kosztują niemałą kwotę, a i tak nie brakuje entuzjastów chcących zasmakować przyszłości grafiki w grach 3D. Zanim uruchomią państwo w ten weekend nową grę, najpierw sugeruję odpalić darmową aplikację GPU-Z. Może się okazać, że karta będzie do zwrotu.

GeForce RTX 5090 został zaprezentowany w styczniu bieżącego roku, ku jednoczesnemu entuzjazmowi i rozpaczy graczy komputerowych. Entuzjazmu trudno nie kryć - wszak Nvidia to na dziś zdecydowany lider jeśli chodzi o zaawansowanie techniczne konsumenckich układów graficznych.
Podobnie jak rozpaczy - crème de la crème gamingowych GPU to na dziś wydatek niemal 20 tys. zł. Cena częściowo jest nienaturalnie podwyższona z uwagi na popyt przekraczający aktualną podaż. Rekomendowana cena nie jest jednak o wiele niższa.
Czytaj też:
Problem w tym, że układy te mogą okazać się wadliwe
Na szczęście nie w ujęciu projektowym, a na skutek błędów produkcyjnych. Redakcja TechPowerUp badając wydajność karty Zotac GeForce RTX 5090 Solid odkryła, że w karcie jest mniej aktywnych jednostek obliczeniowych ROP (Raster Operations Pipelines) niż w kartach RTX 5090 od innych wykonawców. Powinno być ich 176, tymczasem pomiary wykryły liczbę 168.
Zmotywowani do wyjaśnienia tajemnicy dziennikarze zdecydowali się dokładniej zbadać wybrakowaną kartę i inne dostępne na rynku. Ubytek w ROP-ach oznacza średnio 5-procentowy spadek wydajności w porównaniu do kart bez rzeczonego ubytku. Wkrótce potem odkryto, że układy MSI RTX 5090D dostępne do testów mają osiem brakujących ROP-ów. Po publikacji artykułu zgłosili się do TechPowerUp czytelnicy, raportując ubytki w ich kartach od Gigabyte’a, Palita, Inno3D i MSI. Należy przy tym dodać że wada nie zależy od podwykonawcy - zgłosili się też posiadacze kart Zotaca, z którymi wszystko jest w porządku.
Problem został już potwierdzony przez Nvidię. - Zidentyfikowaliśmy rzadki problem dotyczący mniej niż 0,5 proc. procesorów graficznych GeForce RTX 5090 / 5090D i 5070 Ti, które mają o jeden ROP mniej niż określono. Średni wpływ na wydajność graficzną wynosi 4 proc., bez wpływu na obciążenia AI i Compute. Dotknięci tym problemem konsumenci mogą skontaktować się z producentem karty graficznej w celu wymiany. Anomalia produkcyjna została skorygowana - twierdzi rzecznik firmy.
Posiadacze opisywanych kart graficznych mogą pobrać darmową aplikację GPU-Z. Ta listuje między innymi aktywne ROP-y. Co ważne, przed skorzystaniem z aplikacji należy zainstalować sterowniki dedykowane danej karcie graficznej, jeżeli to nie zostało zrobione przez producenta komputera (lub użytkownika samodzielnie składającego komputer). Sterowniki domyślne z Windowsa generują błędy pomiaru.

Historia Nvidii wypełniona jest po brzegi triumfem i spektakularnymi sukcesami. Dlatego dziś skupiamy się dla odmiany na wpadkach. Tych było aż za wiele
Nvidia od dwóch dekad zmaga się z wyzwaniami związanymi z wadami produkcyjnymi układów graficznych. Od awarii strukturalnych w chipsetach mobilnych po współczesne błędy projektowe w architekturze Blackwell - historia firmy pełna jest przypadków, w których klienci otrzymywali wybrakowany sprzęt.
W latach 2005-2010 Nvidia dostarczyła na rynek ponad 18 mln układów graficznych z serii G84 i G86, które stały się symbolem największej afery jakościowej w historii mobilnej grafiki komputerowej. Rdzenie te, stosowane w laptopach Dell, HP i Lenovo, posiadały fundamentalną wadę produkcyjną polegającą na mikropęknięciach warstwy dielektrycznej pomiędzy krzemowym rdzeniem a podłożem PCB. Mechanizm awarii wynikał z różnic współczynników rozszerzalności cieplnej pomiędzy miedzią a krzemem. Podczas typowego cyklu grzania/chłodzenia (np. podczas uruchamiania gry), powstające naprężenia mechaniczne prowadziły do stopniowej degradacji połączeń wewnątrz układu. Typowe objawy obejmowały:
- Migotanie ekranu i losowe artefakty graficzne.
- Nagłe zawieszanie systemu podczas renderowania 3D.
- Trwałe uszkodzenie kontrolera sieci bezprzewodowej zintegrowanej w chipsecie.
W 2011 r. kanadyjski sąd nakazał Nvidii wypłatę 1,9 mln kanadyjskich dol. odszkodowań uznając, że firma świadomie wprowadzała na rynek wadliwe produkty. Klienci mogli ubiegać się o zwrot do 300 CAD za naprawy lub 150 CAD za wymianę laptopa.
Równolegle ujawniono problem tzw. Bumpgate, dotyczący układów BGA produkowanych do 2009 r. W tym przypadku kulki spoiwa lutowniczego (solder bumps) łączące rdzeń z podłożem układały się nieregularnie, prowadząc do utraty kontaktu elektrycznego pod wpływem temperatury. Nvidia wprowadziła zmiany w procesie produkcyjnym dopiero po pozwach zbiorowych, oznaczając poprawione wersje literą R w numerze seryjnym (np. G86-630-A2 → G86-630-R2). Premiera sztandarowej karty RTX 2080 Ti w 2018 r. przyniosła nowy rodzaj problemów - wadliwe moduły GDDR6 od producenta Micron. Pierwsze partie Founders Edition wykorzystywały kości MT61K256M32JE-14, które nie przechodziły testów stabilności przy nominalnych pracy 14 Gbps.
Nvidia początkowo utrzymywała, że awarie dotyczą niewielkiego procenta egzemplarzy, jednak analizy laboratoryjne wykazały 37 proc. wzrost temperatury pamięci przy pełnym obciążeniu, błędy ECC w 92 proc. testowanych próbek po 72 godzinach stresu i zmniejszoną żywotność komórek pamięci do 18 miesięcy. W odpowiedzi firma wprowadziła nowe wersje z pamięciami Samsung K4Z80325BC-HC14, zmieniając kolor opakowania z srebrnego na czarny. Jednakże, jak ujawniły śledztwa dziennikarskie, część sprzedawców nadal wprowadzała do obrotu zmodyfikowane karty z oryginalnymi numerami seryjnymi.
Okres pandemii przyniósł nowe wyzwania – karty z serii RTX 3000 stały się przedmiotem masowego wykupu przez górników kryptowalut. W 2021 roku prezes Jensen Huang przyznał, że niedobory mogą utrzymywać się do 2023 roku. Analiza źródeł branżowych wskazuje jednak na dodatkowe czynniki:
- 22 proc. dostarczanych układów GA102 (RTX 3090) nie spełniało wymogów binningu.
- Nvidia zezwoliła partnerom na wykorzystanie tych chipów w modelach z obniżonym TDP.
- W praktyce prowadziło to do sytuacji, gdzie karty z tym samym oznaczeniem modelu miały różną wydajność w zależności od partii produkcyjnej.
Nie tylko uszkodzone układy, ale i wadliwe sterowniki
Historia problemów z oprogramowaniem sięga 2014 r., gdy sterowniki ForceWare 280.26 WHQL powodowały przegrzewanie układów poprzez utrzymywanie maksymalnych taktowań w trybie bezczynności, awaryjne wyłączanie wentylatorów przy temperaturach powyżej 95°C i uszkodzenia termiczne w 0,7 proc. kart z ręczną kontrolą chłodzenia.
W 2019 r. luki CVE-2019-5683 do CVE-2019-5687 w sterownikach DirectX umożliwiały zdalne wykonanie kodu poprzez specjalnie spreparowane shadery. Naprawa wszystkich wersji zajęła Nvidii 11 miesięcy, pozostawiając użytkowników układów Tesla V100 bez aktualizacji zabezpieczeń.
Nvidia tu niczym się nie różni od reszty Big Techu
Historia wadliwych produktów Nvidii pokazuje powtarzający się schemat - od wykrycia problemu przez użytkowników, przez okresowe zaprzeczanie, po wdrożenie napraw wymuszonych pozwami lub interwencją regulatorów. W kontekście rosnącej złożoności układów (Blackwell integruje 208 mld tranzystorów) i presji na przyspieszone cykle produkcyjne, ryzyko podobnych incydentów w przyszłości pozostaje wysokie. Kluczowe wyzwania to poprawa procesów QA oraz transparentność w komunikacji z klientami.
Na szczęście w omawianym bieżącym przypadku problem jest relatywnie łatwy do rozwiąnia z punktu widzenia klienta. Darmowa aplikacja od razu informuje o ewentualnym problemie, a Nvidia zapewnia, że wszyscy jej partnerzy sprzętowi są gotowi na przyjęcie zwrotów uszkodzonych produktów. Miejmy nadzieję, że w istocie żaden z partnerów nie będzie się wykręcał od właściwej obsługi klienta.