“Dün, Nvidia’nın Çin ihracatına yönelik yeni veri merkezi hızlandırıcı kartlar serisiyle ABD Hükümeti İhracat Denetimi yasalarını ‘etrafından geçmeye’ veya ‘hızlı bir adım atmaya’ çalıştığını öne sürdüğü veya yorumlandığını düşündüğüm bir dizi makale yazıldı
Örneğin, Nvidia’nın H100’ü 989 TFLOPS’luk listelenmiş bir FP16/BF16 performansına sahip ve bu da TPP puanının 7 Bu nedenle performans yoğunluğu 6,5 olduğundan L4 Çin’e gönderilemiyor
Örneğin, Nvidia’nın L4/AD104 veri merkezi GPU’sunun TPP puanı 1936’dır (242 FP8 TFLOPS’8 = 1936) 13
Performans Yoğunluğu
En son kuralların getirdiği bir diğer parametre ise Performans Yoğunluğu (PD) metrik
Toplam İşleme Performansı
Performansa göre, yeni kurallar şunları tanımlar: Toplam İşleme Performansı (TPP) esasen listelenen işlem gücünün işlem uzunluğuyla çarpımı olan puan (ör Ancak kalıp boyutu 294 mm^2’dir 1 TFLOPS
Nvidia’nın Çin’e yönelik olduğu iddia edilen veri merkezi ürün serisine yakından bakıldığında, ailenin AI ve HPC GPU’larla ilgili en son ABD ihracat kurallarının olası ihlallerini önlemek için titizlikle tasarlandığı ortaya çıkıyor PD şu şekilde sayılır: TPP’nin milimetre kare cinsinden ölçülen kalıp alanına bölünmesi 9
En son ABD Savunma Bakanlığı ihracat kuralları veri merkezi yapay zekası ve HPC işlemcileri Çin, Makao, Suudi Arabistan, Birleşik Arap Emirlikleri ve Vietnam’a gönderilen GPU’ları ve diğer yapay zeka hızlandırıcılarını kapsar; ürünlerinin belirli performans ve/veya performans yoğunluğu seviyelerini aşması durumunda satıcıların ihracat lisansı başvurusunda bulunmalarını şart koşuyorlar FLOP’lar veya ÜSTLER ‘8/16/32/64) seyreklik olmadan
ABD Ticaret Bakanlığı sekreter yardımcısı Thea D ABD hükümeti, Çin’in (ister veri merkezleri ister istemci bilgisayarları için tasarlanmış olsun) 4800 TPP puanına sahip (matris çarpımı durumunda) işlemciler almasını istemiyor Bu nedenle Nvidia’nın Çin pazarı için özel olarak tasarlanmış veri merkezi ürünleri serisiyle ABD hükümetini kandırdığına dair söylentiler yayılmaya başladı Bu arada, TPP puanı 1936 olan, veri merkezi olmayan bir ürün olan Nvidia’nın GeForce RTX 4070 Ti’si kısıtlama olmaksızın Çin’e gönderilebiliyor Bu durumda ABD Savunma Bakanlığı, belirli bir ürünün varış yerini markalama yerine özelliklerine göre değerlendirmeyi planlıyor Bu, TPP puanı 1600 ile 4800 arasında olan küçük, yüksek yoğunluklu çipler için tasarlanmıştır Nvidia’nın dezavantajı çok büyük olabilir
Nvidia’nın söylentilere konu olan yeni yapay zeka (AI) ve yüksek performanslı bilgi işlem (HPC) GPU serisi, ABD Ticaret Bakanlığı tarafından Ekim ortasında yayınlanan en yeni genişletilmiş ihracat kurallarıyla mükemmel bir şekilde uyumlu olduğuna inanıyor Patrick MoorheadMoor Insights & Strateji’nin başkanı Örneğin, fanlı veya pasif soğutuculu çift yuvalı bir GeForce RTX 4070 Ti, resmi adı ne olursa olsun bir veri merkezi kartı olarak kabul edilir Basında yer alan bazı raporların aksine, şirketin yeni veri merkezi GPU’larıyla yapay zeka işlemcilerine yönelik genişletilmiş ABD yaptırımlarından kaçmaya çalışmadığına dikkat çekiyor
Yatay kaydırmak için kaydırınMimarlık | GPU | Hazne | GH100 | Ada Lovelace | AD102 | Ada Lovelace | AD104 | |
Hafıza | 96 GB HBM3 | 48 GB GDDR6, ECC’li | 24 GB GDDR6, ECC’li | |
Toplam İşlem Gücü (FP16/BF16) | 2 Şirket amansız bir yenilikçi ve rakip olabilir ama aptal değiller Bu parametre, bir araya getirildiğinde sınırlı çipler kadar güçlü olabilecek çok sayıda daha küçük veri merkezi AI çipinin edinilmesine yönelik boşluktan kaçınmak için tasarlanmıştır “Bunu gülünç buluyorum
Nvidia’nın GeForce RTX 4090/’ının nedeni budur Rozman Kendler, “Üretici ürünü veri merkezi kullanımı için pazarlamıyor olsa bile, ürün yine de ürünün teknik özelliklerine göre veri merkezi kullanımı için tasarlanmış olabilir” dedi 2 |
|||
Bellek Bant Genişliği | 4,0 TB/sn | 864 GB/sn | 300 GB/sn | |
INT8 I FP8 Tensörü | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS | |
BF16 I FP16 Tensör | 148 I 148 TFLOPS | 119,5 I 119,5 TFLOPS | 96,5 ve 96,5 TFLOPS | |
TF32 Tensör | 74 TFLOP | 59,8 TFLOP | 48 Yani hayır, Nvidia ve ortakları 16 Kasım’dan itibaren GeForce RTX 4090’ı Çin’e gönderemeyecek ,” Moor yazdı bir blog yazısında 912 | 1 Bu arada Savunma Bakanlığı kısa süre önce, veri merkezleri için tasarlanmamış olsalar bile hangi ürünlerin Çin’e lisans olmadan gönderilemeyeceğini açıkladı ve görünüşe göre GeForce RTX 4090 da bunlardan biri Yeni teklifler grafikteki yeşil bölgeye sığacak şekilde tasarlandı, böylece ABD’nin Çin’e karşı yaptırımlarına uyum sağlarken Nvidia’nın giderek kısıtlanan Çin pazarındaki satışlarında kaybettiği 5 milyar doların bir kısmını telafi etmesine olanak tanıdı 280 TPP puanına ulaşması nedeniyle ihracat lisansı verilebilir öğeler kategorisine de giriyor Nvidia, Intel ve AMD, Çinli müşterilere tonlarca yapay zeka ve HPC donanımı gönderiyor ve bu satışları kaybetmek onlara milyarlarca dolarlık gelire mal olacak 912 olduğu anlamına geliyor, bu da onu Çin’e ihracat için çok güçlü kılıyor 3 TFLOP |
FP32 | 44 TFLOP | 59,8 TFLOP | 24
YorumlamaBuradaki heyecan verici kısım, hükümetin bir ürünün veri merkezi kullanımı için tasarlanıp tasarlanmadığına dair yorumudur 544 |
|
Performans Yoğunluğu | 2
Yeni kurallar biraz karmaşık olabilir: Burada nelere izin verdiklerine, neleri yasakladıklarına ve bunun sizin için ne anlama geldiğine ayrıntılı bir bakış bulacaksınız Kalıp alanı yerleşik önbellekleri içerir ancak HBM’ler gibi harici bellek aygıtlarını hariç tutar Nvidia’nın (İddia Edilen) Çin Veri Merkezi GPU SerisiABD Ticaret Bakanlığı’nın Ekim ortasında AI ve HPC iş yükleri için kullanılan veri merkezi işlemcilerine yönelik yeni ihracat kurallarını yayınlamasının ardından, bu kurallar o kadar ciddi göründü ki, Çin’e ve diğer ülkelere neredeyse hiçbir yüksek performanslı donanım gönderilemedi Other Articles
|