Zwykle to Intel mówi o prawie Moore'a, ale tym razem od lat znany dobrze w branży Godfrey Cheng z TSMC wypowiedział się na temat przyszłości i potencjału najlepszego zakładu produkcyjnego świata.
Ludziom, którzy tego nie wiedzą wyjaśniamy, że powstaje tam każdy iPhone, większość systemów Snapdragon Qualcomma, procesorów AMD 7nm Ryzen, EPYC oraz Radeon, a także karty graficzne Geforce, Tesla i Quadro. Dla przypomnienia, TSMC to Taiwan Semiconductor Manufacturing Company, czyli Tajwańskie Przedsiębiorstwo Produkcji Półprzewodników.
Godfrey Cheng, który niedawno został w nim dyrektorem ds. marketingu globalnego, opublikował ciekawy wpis na temat prawa Moore'a na blogu. Dużo mówi się o tym, że "prawo" jest martwe, a podwajanie liczby tranzystorów co dwa lata przeszło do historii.
TSMC ma jednak rozwiązanie, by je kontynuować, a Godfrey przekonuje, że w miejsce zajmowania się częstotliwością i podnoszeniem wydajności pojedynczych tranzystorów, właściwym rozwiązaniem powinna być ich większa gęstość. Przeciwnicy prawa Moore'a w branży twierdzą, że nie da się już bardziej zmniejszać tranzystorów ze względu na fizyczne ograniczenia.
Przypomnijmy, że Intel na kilka generacji zatrzymał się na 14nm i dopiero teraz udało mu się zejść do 10nm, podczas gdy takie firmy jak Apple czy Qualcomm, które stosują najnowocześniejsze rozwiązania jeśli chodzi o chipy w telefonach, używały 10nm w swoich produktach z 2017 i 2018 roku oraz 7nm w telefonach z 2018/2019 czy obecnie powstających.
Aby móc dalej umieszczać miliardy chipów na bardzo małej przestrzeni 2D, logicznym rozwiązaniem było to, by po 7nm nadszedł czas na 5nm i tak dalej. Chip Apple 7nm A12, który znajduje się w iPhonie Xs ma 6,9 mld. tranzystorów na powierzchni 83,27 mm2.
Rozwiązanie problemu kontynuacji prawa Moore'a według TSMC
Rozwiązanie nazwane N5P to proces stworzony przez firmę, by dać klientom połączenie największej możliwej gęstości z najlepszą wydajnością. Dzisiejsze obciążenia wynikają z zadań związanych z procesorami CPU i GPU, a znacząco wpływa na nie potrzeba wykonywania obliczeń dla obecnych i przyszłych procesów związanych ze sztuczną inteligencją.
Jedną z najpoważniejszych przeszkód do pokonania jest zapewnienie CPU/GPU czy układom scalonym wystarczającej ilości danych. Komputery równoległe będą działały dobrze tylko wtedy, gdy interkonektor i interfejs pamięci będą w stanie cały czas dostarczać dane wszystkimi kanałami.
TSMC widzi rozwiązanie tego problemu w masywnych interposerach i zaawansowanych technikach pakowania układów. Kilka niedawnych, znanych czytelnikom przykładów, to choćby chipy w AMD Vega, Nvidia Tesla i Xilinx Versal, które wszystkie mają na interposerze pamięć HBM 2. Nie jest przypadkiem, że wszystkie zostały stworzone przez TSMC.
Posiadanie pamięci w tym samym pakiecie co CPU lub GPU przyspiesza wykonywanie obliczeń, bo wszystkie potoki otrzymują dane znacznie szybciej niż przy tradycyjnej pamięci. HBM 2 daje w niektórych produktach dostęp do prędkości nawet 460 GB/s, a Radeon VII czy Vega 20 mają całkowitą przepustowość 1028 GB/s, wykonaną w procesie TSMC 7 FF (FinFet). Karta obliczeniowa sztucznej inteligencji Tesli, opartej na technologii Nvidii V100 Volta ma całkowitą przepustowość 900 GB/s, a każda firma zajmująca się GPU/AI chce nawet więcej.
Pierwsza próbna produkcja procesorów 5nm TSMC pod nazwą N5 zaczęła się w marcu 2019 roku, a w porównaniu z wersją N7 7nm N5 oferował o 80 % większe zagęszczenie, prędkość wyższą o 15 % i moc mniejszą o 30. Nowe tranzystory eLVT mogą dać zysk w prędkości nawet na poziomie 25 %.
Nowe procesory N5P, które mają trafić do produkcji próbnej w przyszłym roku, powinny wycisnąć dodatkowe 7 % szybkości oraz 15 % mocy w porównaniu z N5.
Innowacja na poziomie systemu
Godfrey zasygnalizował też ważną rzecz - chip TSMC na waflu krzemowym z masywnym interposerem 2500 mm2. Interposer ma łączyć dwa masywne procesory 600 mm2 z 8 chipami pamięci HBM w pakiety o powierzchni 75 mm2.
Vega 7 ma 331 mm2, podczas gdy TeslaV100 jest jednym z największych kiedykolwiek powstałych chipów z powierzchnią 815 mm2 i 21 miliardami tranzystorów na 12nm. Mając to na względzie, TSMC stworzyło rozwiązanie dla dwóch rdzeni wielkości 600 mm, dzięki którym będzie możliwość zmieszczenia zdecydowanie większej ilości tranzystorów na takiej samej powierzchni w procesorach 5nm N5P lub nawet N5.
Interposer 2500 mm2, dwa chipy 600 mm2 i 8 chipów HBM.
Interposer 2500 mm2 z tak dużą liczbą chipów pamięci i podwójnych byłby w stanie wykonać wiele obliczeń powiązanych ze sztuczną inteligencją, a wszyscy wiemy, że wiele takich wyliczeń jest potrzebnych dla systemów zaawansowanego wspomagania kierowcy, samochodów autonomicznych, medycyny, badań nad nowymi materiałami, wydajności paliw i wszystkiego, co potrzebuje optymalizacji, w tym także transakcji giełdowych.
Godfrey, którego znamy z ATI, AMD, a ostatnio jako wiceprezydenta wykonawczego ds. rynku w firmie Synaptics, ma szansę pomóc TSMC w bardzo potrzebnym lepszym nagłośnieniu firmy i przyciągnięciu uwagi mediów. Wiele wskazuje na to, że jest to dziś najlepszy zakład produkcyjny, zwłaszcza gdy chodzi o przełomowe technologie, w tym 7nm i 5nm. Procesory 5nm są tuż-tuż i jako entuzjaści wydajności nie możemy się doczekać, by dowiedzieć się więcej.