Yüksek Hızlı Optik Ara Bağlantı: Veri Merkezi Çözümleri

Apr 27, 2026|

Geçtiğimiz çeyrekte, Arista 7060X5 anahtarlarında rastgele bağlantı kanatları olduğunu iddia eden kırk adet 400G DR4 modülünü geri gönderen bir müşterimiz vardı. Daha RMA belgelerini açmadan önce test mühendisimiz bir soru sordu: kontrol ettiniz mi?MPO konnektörlerikurulumdan önce? Yapmamışlardı. Modülleri tam regresyonumuz aracılığıyla gönderdik, göz diyagramları temizdi, BER dört şerit boyunca 1E-13'ün altındaydı,DDM okumaları nominal. Daha sonra onlardan ana kablo uç yüzlerinin-yüzlerinin fotoğraflarını fiber mikroskop altında göndermelerini istedik. Her bir konnektörde partikül kirliliği mevcuttu. Kırk modül, sıfır hata. Sorun tozdu.

 

Her ay bunun bir versiyonunu görüyoruz. Her ölçekteki yüksek hızlı optik ara bağlantı dağıtımları aynı duvara çarpıyor ve rakamlar da bunu destekliyor: tüm 400G ve 800G bağlantı arızalarının %65 ila %70'i alıcı-verici arızalarından değil, konektör kirliliğinden kaynaklanıyor. (AscentOptics aracılığıyla IEEE 802.3 saha verileri) İlk önce bunu gündeme getiriyoruz çünkü bu, tüm ara bağlantı kararı hakkındaki düşüncelerimizi çerçeveliyor. Modül neredeyse hiçbir zaman en zayıf halka değildir. Çevresindeki fiziksel katman öyledir.

Microscopic view of an MPO fiber optic connector end-face showing severe dust and particulate contamination on the four precision glass cores of a 400G module, illustrating the number one cause of link failure.

 

Trafik Düzeniniz Optik Ara Bağlantı Mimarinizi Belirler

 

Herkes parça numarasıyla başlar.QSFP-DD veya OSFP, SR veya DR, çok modlu veya tek{0}}mod. Biz de yapıyoruz. Ancak müşterilerimiz için iyi giden dağıtımların hepsi başka bir yerde başladı: trafik gerçekte nasıl görünüyor?

Büyük-ölçekli yapay zeka eğitimi,-tüm-tüm GPU iletişimlerini üretir ve bu iletişimin, dakikalardan saatlere kadar uzanan zaman aralıklarında şaşırtıcı derecede tahmin edilebilir olduğu ortaya çıkar. Google, paketleri değiştirmek yerine raflar arasındaki fiziksel ışık yollarını yeniden yapılandırarak Jüpiter ağındaki optik devre anahtarlarıyla bunu kullanıyor. On yıllık üretim kullanımından elde edilen yayınlanmış sonuçlar: önceki Clos mimarilerine kıyasla %41 güç azalması, %30 daha düşük sermaye harcaması ve yapı çalışma süresinde 50 kat iyileşme. (Google SIGCOMM'22) Bu rakamlar gerçektir ancak beş yıl boyunca OCS altyapısına 500 milyon ila 1 milyar dolar arasında harcama yapan bir şirkete aittir. Bir avuç orta ölçekli müşterimizin, kendi ortamları için OCS'nin fizibilitesini değerlendirmemizi istediği- bir durumla karşılaştık. Her durumda, sayıları 500'ün altındaki düğüm ölçeğinde çalıştırdıklarında, sermaye gereksinimleri yeniden yapılandırmanın avantajlarından daha ağır bastı ve takılabilir modüller kullanan geleneksel omurga yaprağıyla kaldılar.

Çıkarım denklemi tersine çevirir. Akış düzeyinde trafik yoğun ve öngörülemezdir ve gecikme toleransı sıfıra yakındır. Optik yolları istek bazında-yeniden yapılandıramazsınız. İhtiyacınız olan şey, sizi her bağlantının her zaman aydınlatıldığı bir omurga-yaprak topolojisindeki takılabilir alıcı-vericilere doğru iten, deterministik gecikme süresine sahip, sürekli olarak aşırı tedarik edilen bir yapıdır. Modülleri her iki senaryoya da satıyoruz ve mühendislik konuşmaları tamamen farklı. Eğitim kümesi alıcıları, raf başına toplam bant genişliği ve bit başına güç hakkında bilgi edinmek ister. Çıkarım alıcıları kuyruk gecikmesi ve bir bağlantı kesildiğinde ne olacağı hakkında sorular sorar.

 

Conceptual architectural diagram of a data center network topology comparing a custom Optical Circuit Switch (OCS) fabric for long-running AI training jobs versus a standard non-blocking Spine-Leaf topology for bursty inference workloads.

 

Hiper ölçeğin altındaki geleneksel kurumsal ve colo ortamları için, port başına maliyet daha baskındır ve mevcut fiber tesisiyle geriye dönük uyumluluk, ham bant genişliği yoğunluğundan daha önemlidir. Test ettik14 anahtar platformunda 400G QSFP-DD modülleriCisco Nexus 93600CD, Arista 7060X5 ve Juniper QFX5220 dahil. Bu ortamlarda baskın endişe hız değildir. Bu, modülün, manuel geçersiz kılma komutları olmadan anahtar yazılımı tarafından tanınıp tanınmayacağıdır.

 

Mühendisleri Hazırlıksız Yakalayan 800G Ölü Bölge

 

400G'de ara bağlantı seçimi iki-adımlı bir süreçti: mesafeyi ölçün, bakır veya fiber seçin. Pasif DAC rahatlıkla 3 ila 5 metre kat etti. 800G bunu kırdı. Her şerit 112G PAM4'ü çalıştırır. Bu frekanslardaki bakır kaybı, 400G'ye kıyasla kabaca iki katına çıkıyor ve sonuç, pasif kablo için 2 metre civarında sert bir tavan oluyor.

 

High-speed cable comparison showing an Active Electrical Cable (AEC) vs a standard Direct Attach Copper (DAC) bundle. The AEC uses internal retimers to extend the 800G signal reach to 7 meters at the cost of slight latency overhead.

 

Bunu pahalı yoldan öğrendik. Erken bir müşterimiz siparişimizi verdi800G pasif DAC düzenekleri400G raf düzenine göre 3 metre uzunluklarda. Bağlantı eğitimi bağlantı noktalarının %60'ından fazlasında başarısız oldu. Bakır kusurlu değildi; fizik buna izin vermiyordu. 3 ila 5 metrelik koşular için AEC'ye ve bunun ötesindeki her şey için takılabilir optik modüllere geçtiler ve dağıtım bir hafta içinde stabil hale geldi. O tarihten bu yana, 2,5 metrenin üzerindeki pasif 800G DAC için sipariş almayı durdurduk ve sipariş onay sürecimize bir dağıtım mesafesi önerisi ekledik.

 

AEC artık 3 ila 7 metrelik boşluğa sahip. Dijital yeniden zamanlayıcılar, optik dönüşüm olmadan sinyali elektriksel olarak yeniden üretir; bu da maliyeti düşürür ancak gecikmeyi artırır. KP4 FEC tek başına 800G'deki her atlamada 50 ila 100 nanosaniye koyar ve retimer en üstte daha fazlasını biriktirir. Şu anda gönderdiğimiz AEC düzeneklerinde toplam eklenen gecikmeyi 85 ila 110 ns olarak ölçtük. Sırt-yaprak kumaş bağlantıları için bu ek yük, uygulama performansında görünmez. Sıkı bir şekilde birleştirilmiş GPU kümeleri için bu farklı bir hikaye. H100 düğümlerini çalıştıran üç müşteri dağıtımından elde edilen profil oluşturma verilerine göre, eğitim işinizin iletişim ek yükü zaten %15'in üzerindeyse, birden fazla anahtar katmanında atlama başına bu fazladan yüz nanosaniye, NCCL AllReduce operasyonlarında birleştirilmeye başlar.

 

7 metrenin ötesinde, 800G için takılabilir optik alıcı-vericiler geçerli tek yoldur. Buradaki fiziksel katmanın oldukça sıkılaştırılması gerekiyor. IEEE 802.3ck kapsamında uçtan uca ekleme kaybı bütçeleri çoğu 800G erişim sınıfı için 1,5 dB'nin altına düşer ve bağlantılı her MPO bağlantısı 0,35 dB'nin altında kalmalıdır. Juniper'in ağ araştırma ekibinin 2023'te bildirdiğiyle tutarlı olarak, 100G sertifikasını geçen kurulu fiberin, kablo kanallarında birkaç yıl sıkıştırıldıktan sonra nominal spesifikasyonunun iki ila üç katı PMD değerleri gösterdiğini gördük. Herhangi bir 800G alıcı-verici kurulumundan önce standart önerimiz: mevcut her fiber segmentinde OTDR ve PMD karakterizasyonunu çalıştırın. Örnek değil. Her bölüm. İki ana kabloyu yeniden çekmenin maliyeti, altı ay boyunca aralıklı bağlantı kapaklarında hata ayıklama maliyetinin çok küçük bir kısmıdır.

 

CPO, LPO ve Takılabilirlik: Her Teknolojinin 2026'da Gerçekte Durduğu Yer

 

Birlikte-paketlenmiş optikler, veri merkezi anahtarlama altyapısının oluşturulma biçimini değiştirecek. Bunu takılabilir bir modül üreticisi olarak söylüyoruz, bu nedenle görüşümüzü tarafsız değil bilinçli olarak kabul edin.

 

OFC 2026'da, CPO prototiplerine ilişkin güvenilirlik verileri, arıza oranlarının geleneksel takılabilir modüllerden potansiyel olarak daha düşük olduğunu gösterdi. Mekanik yerleştirme döngüleri veya açıkta kalan konnektör yüzeyleri olmadan, takılabilir modüllerin baskın arıza modları geçerli değildir. Broadcom'un Bailly 51.2T CPO anahtar platformu, eşdeğer takılabilir yapılandırmalarla karşılaştırıldığında optik katmanda yaklaşık %70 daha düşük güç tüketimi gösterdi. (DataMIntelligence Optik Ara Bağlantı Raporu) NVIDIA, GTC 2026'da CPO{0}}entegre anahtarların 2027 ila 2028 penceresinde ölçeklendirme dağıtımını hedeflemesini-gösterdi.

 

Konumumuz: Özel anahtar silikonu üreten bir hiper ölçekleyici değilseniz, takılabilir optikler en az 2027 yılına kadar konuşlandırılabilir tek seçeneğinizdir. CPO'nun, çoğu anahtar satıcısının henüz göndermediği kart mimarilerine, henüz kesinleşmemiş konektör standartlarına ve bir modülü çekerek çözemeyeceğiniz arızalarla başa çıkmak için tamamen yeni bir taktik kitabına ihtiyacı vardır. Genel kurumsal satın alma ekosistemi henüz mevcut değil. Geçtiğimiz yıl, CPO'yu bekleyen 400G-800G'ye yükseltmelerini erteleyen iki potansiyel müşterimiz oldu. Bant genişliği boşlukları üretim sorunları haline geldikten sonra her ikisi de sonunda geri geldi ve takılabilir siparişler verdi. Bu pozisyonun mühendislik gerekçesini daha detaylı olarak yazımızda yazdık.takılabilir alıcı-verici mimarisi analizi.

 

LPO farklı bir alanda oturuyor. DSP'nin modülden çıkarılması, toplam modülün güç tüketiminin yarısından sorumlu olan, en fazla güce ihtiyaç duyan-tek bileşeni devre dışı bırakır. Sonuç, %30 ila %50 daha düşük tüketim ve 15 nanosaniyeye kadar daha az gecikmedir. 2025'in sonlarında LPO-ya özel RFQ'lar sunmaya başladık. Dört tekliften üçü, NVIDIA Spectrum-X üzerinde tek-satıcılı GPU kümeleri oluşturan müşterilerden geldi. Hiçbiri, LPO'nun bugün nerede çalıştığı hakkında size her şeyi anlatan, çok{12}}satıcılı kumaşları çalıştırmıyor. Ağınız anahtar satıcılarını karıştırıyorsa LPO ortamınızla uyumlu değildir. Tek satıcılı bir yapay zeka kümesi çalıştırıyorsanız bu, mevcut en akıllı yükseltme olabilir ve 2027 ortasına kadar LPO'ya hazır modüllerin kalifikasyona sahip olmasını bekliyoruz.

Modül Seçimi için 800G Termal Marjlar Ne Anlama Geliyor?

 

800G'deki termal matematik insanları hazırlıksız yakalıyor. Bu nesildeki yüksek hızlı optik ara bağlantı güç yoğunluğu, 400G'de olmayan sorunları yaratıyor. 16W'ta 800G modüllerle tamamen yüklenmiş 64 bağlantı noktalı bir anahtar, ASIC'in kendi 400 ila 500W'ından önce, yalnızca alıcı-verici gücünden yaklaşık 1kW çeker. Bu, anahtar başına 1,4 ila 1,5 kW demektir. Bir omurga katmanındaki sekiz anahtar, genellikle toplamda 8 ila 10 kW için sağlanan raflarda, yalnızca ağ ekipmanından 11 kW'ın üzerinde güç sağlar.

 

Juniper Networks, yüksek güç çekişine sahip üçüncü taraf modüllerin, özellikle tutarlı ZR ve ZR+ türlerinin, ana makine ekipmanında termal hasara yol açabileceği ve sorumluluğun kullanıcıya düşebileceği konusunda açıkça uyarıyor. (Juniper Networks 800G Optik SSS) Bu, üçüncü-taraf optik modüllere karşı bir argüman değil. Bu, tam olarak neye taktığınızı bilmenizi gerektiren bir argümandır. Termal döngü kalifikasyonumuzda, her 800G modül tasarımını 2.000 saat boyunca sürekli 85 derecelik bağlantı sıcaklığında test ediyoruz ve birincil yaşlanma göstergesi olarak lazer önyargılı akım sapmasını izliyoruz. 38 mA'nın üzerine çıkan üniteler üretim hattından çekilir. 800G yoğunluklarda, 14W çizimli bir modül ile 18W çizimli bir modül arasındaki fark, rafın termal zarf içinde mi kalacağını yoksa sabah 2'de kapatma alarmlarını mı tetikleyeceğini belirler. Spesifikasyonun yanlış anlaşılması her zaman sinir bozucu olmuştur. Bu güç seviyelerinde pahalıdır.

Thermal heatmap of a high-density switch rack illustrating extreme heat concentration in the transceiver cage area where 64 modules drawing 16W each generate significant thermal load, nearing cooling capacity limits.

 

 

Takılabilir modülleri 1G SFP'den 800G OSFP'ye kadar gönderiyoruz ve büyük anahtar platformlarına göre testler yapıyoruz. Neyin işe yarayıp neyin yaramadığının kayıtlarını tutuyoruz. Belirli bir anahtar ortamına göre uyumluluk kontrolüne ihtiyacınız varsa veya yüksek-yoğunluklu 800G raflar için termal ve güç-sınıfı teknik özellikler istiyorsanız mühendislerimiz bu görüşmeleri her hafta gerçekleştirir. Bizim800G OSFP ve QSFP-DD800 alıcı-verici sayfasıgönderdiğimiz her modül için spesifikasyonlara, erişim-sınıf seçeneklerine ve örnek istek formlarına sahiptir.

Soruşturma göndermek