When the GPUs are waiting for the network

Det finns en punkt där ett AI-kluster slutar handla om hur många GPUer man har köpt. Den punkten kallas nätverket.

Det låter kanske märkligt, eftersom nästan all uppmärksamhet i dag hamnar på acceleratorer, HBM-minne, FP4, rackdensitet och hur många megawatt som går att få fram till hallen. Men i praktiken är det ofta något mindre glamoröst som avgör hur bra klustret faktiskt fungerar: nätverket.

Dyra GPUer gör ingen nytta när de står och väntar.

I ett mindre system märks det kanske inte så tydligt. Men när hundratals, tusentals eller tiotusentals acceleratorer ska arbeta tillsammans förändras förutsättningarna. Då räcker det inte att varje server är snabb. Hela klustret måste kunna arbeta i takt. Data ska skickas, synkroniseras och tas emot utan att fastna i köer, microbursts, omsändningar eller ojämn belastning mellan länkarna.

Det är därför nätverket i ett modernt AI-kluster inte längre kan ses som vanlig transport mellan servrar. Det är en del av själva beräkningssystemet.

Det är också mot den bakgrunden Aristas nya 7060XE7-serie ska förstås.


Det Arista släppte är mer än ännu en snabb switch

Den 9 juni 2026 presenterade Arista 7060XE7, en ny serie 1,6T-plattformar för AI-fabrics i mycket stora kluster. Serien är byggd för både scale-out och scale-up, med upp till 102,4 Tbps kapacitet per system och stöd för 1,6T per port.

Det viktiga är inte bara hastigheten. Det viktiga är att Arista tydligt rör sig från en värld där man säljer enskilda switchar till en värld där nätverket byggs som en del av hela racket. Det handlar om systemdesign, inte bara portkapacitet.

7060XE7-familjen består av tre huvudsakliga modeller:

  • 7060XE7-64PS och 7060XE7-64PRS — luftkylda 4U-switchar med 64 portar à 1,6T. Planerade för leverans under fjärde kvartalet 2026.
  • 7060XE7-64PRS-RV3-L — vätskekyld 2OU-plattform för Open Rack v3, utan interna fläktar, kopplad direkt mot rackets vätskekrets. Planerad för första kvartalet 2027.
  • 7060XE7-128PE — 128 portar à 800G i luftkylt 4U-format. Passar miljöer där portdensitet och bakåtkompatibilitet är viktigare än 1,6T hela vägen ut. Planerad för första kvartalet 2027.

Under huven bygger serien på Broadcom Tomahawk 6 och 224G SerDes i de relevanta 1,6T-modellerna. Arista kör allt på EOS, samma operativsystem som redan används i många campus- och datacenternät.

Det gör skillnad. För den som redan driftar Arista i andra delar av infrastrukturen blir AI-fabricen inte en helt separat värld med egen logik, egna verktyg och egen felsökning. Det blir en fortsättning på samma modell, men i betydligt högre hastighet och med mycket högre krav.


AI-trafik beter sig inte som vanlig datacentertrafik

Ett traditionellt datacenter har många olika typer av trafik: användare, applikationer, databaser, lagring, backup, loggar, APIer och säkerhetssystem. Belastningen kan vara komplex, men den är ofta ganska utspridd.

AI-trafik är annorlunda.

När ett stort träningsjobb körs behöver många GPUer utbyta data nästan samtidigt. Det skapar korta, intensiva trafiktoppar. Det är inte den genomsnittliga bandbredden som blir problemet, utan vad som händer när väldigt många noder skickar mycket data på samma gång.

Det är här vanliga nätverksmått kan bli missvisande. Det räcker inte att säga att man har 400G, 800G eller 1,6T per port. Den verkliga frågan är hur fabricen beter sig under belastning. Klarar den ojämna trafikmönster? Hur snabbt upptäcks flaskhalsar? Hur hanteras congestion? Kan trafiken balanseras om utan att träningsjobbet tappar fart?

Det är därför Aristas mjukvarufunktioner är minst lika viktiga som hårdvaran. I 7060XE7-serien lyfter Arista bland annat fram Dynamic Load Balancing, Cluster Load Balancing, MRC, Link Layer Retry, PFC-aware ECN, congestion signaling och snabb återkoppling vid länkproblem.

Det där är inte funktioner man lägger till för att fylla en databladstabell. I ett stort AI-kluster kan en dålig länk, en felbalanserad väg eller en stockning i fel ögonblick påverka hela träningsjobbet. När många GPUer måste vänta på varandra räcker det att några få delar av nätet beter sig dåligt för att nyttjandegraden ska falla.

Det är därför nätverket bör ses som en del av GPU-ekonomin. Man räknar inte hem ett AI-kluster på hur många acceleratorer som står i racket. Man räknar hem det på hur stor del av tiden de faktiskt används.


Ethernet vann inte för att det var elegantast. Det vann för att det blev tillräckligt bra.

Under lång tid var InfiniBand det självklara valet för tät GPU-kommunikation. Det hade låg latens, stark RDMA-historik och en mycket etablerad position inom HPC. Ethernet sågs ofta som det öppnare och mer driftvänliga alternativet, men inte alltid som det bästa valet för de allra mest krävande AI-klustren.

Den bilden har förändrats snabbt.

Dell’Oro skrev i sin 2025/2026-analys att Ethernet under 2025 passerade InfiniBand inom AI back-end networking. Bara två år tidigare stod InfiniBand för nästan 80 procent av försäljningen i samma segment. Samma analys pekade också på att 1,6T-switchar väntas börja volymdeployas under 2026 och att 800G har nått 20 miljoner portar betydligt snabbare än 400G gjorde.

Det betyder inte att InfiniBand är dött. Den typen av tvärsäkra dödförklaringar brukar åldras dåligt i infrastrukturvärlden.

Men det betyder att Ethernet nu på allvar har tagit sig in i en del av marknaden där många tidigare trodde att InfiniBand skulle dominera länge.

För enterprise-kunder, nordiska AI-satsningar, Tier-2-kluster och många HPC-miljöer är det en viktig förskjutning. Ethernet ger ofta en enklare driftmodell, större kompetensbas, fler leverantörsalternativ och bättre koppling till befintliga datacenterprocesser.

Men det kräver rätt design. Ethernet för AI är inte “vanligt nätverk, fast snabbare”. Det handlar om RoCE, congestion management, buffertar, telemetri, optimerad topologi, optikval och disciplin i implementationen.


Vätskekylning och LPO handlar i slutändan om GPU-budget

Den vätskekylda 7060XE7-64PRS-RV3-L är kanske den tydligaste signalen i hela lanseringen. Den saknar interna fläktar, använder DC-matning från ORv3-racket och är byggd för att fungera i samma termiska verklighet som vätskekylda XPU-servrar.

Det är inte en udda variant för laboratoriemiljöer. Det är en bild av vart AI-racken är på väg.

Samma sak gäller Linear Pluggable Optics, LPO. Arista anger att LPO kan minska strömförbrukningen i interconnect med omkring 60 procent. Först låter det som en detalj i optiken, men i ett AI-datacenter är det en del av den totala energikalkylen.

Lägre förbrukning i länkarna betyder mindre värme, mindre kylbehov och mer effekt kvar till det kunden egentligen vill använda: beräkning.

När ett rack närmar sig 100 kW, och i vissa fall passerar det med god marginal, blir varje watt viktig. Den ska rymmas i fastighetens elkapacitet, kylsystemets begränsningar och kundens budget. En watt som inte går till fläktar eller optik kan i bästa fall gå till fler GPUer, högre nyttjandegrad eller bättre marginal i designen.

Därför är nätverket inte en passiv kostnadspost. Det är en hävstång.


HPE, Juniper, Cisco och den nya nätverkskartan

Det vore för enkelt att skriva att Arista har “vunnit”. Marknaden är mer intressant än så.

HPE slutförde sitt förvärv av Juniper Networks den 2 juli 2025 och fick därmed en betydligt bredare nätverksportfölj. Junipers datacenter-, routing- och AI-native-delar kombineras nu med HPE:s befintliga Aruba- och GreenLake-värld. HPE positionerar detta som en modern nätverksstack för hybrid cloud, AI och enterprise.

Under 2026 har HPE också börjat visa hur Juniper-teknik ska integreras i HPE AI Factories, bland annat genom Mist Data Center Assurance, AIOps och Juniper-baserade datacenterkomponenter.

Cisco sitter inte heller still. I februari 2026 presenterade Cisco Silicon One G300, ett 102,4 Tbps-switchchip för AI-datacenter, tillsammans med nya Nexus 9000- och 8000-system, vätskekylda designer och förbättrad fabric-hantering via Nexus One. Cisco pratar tydligt om att nätverket blir en del av compute-lagret.

Och så finns Nvidia, som inte längre bara är GPU-leverantör i den här diskussionen. IDC:s Q1 2026-data pekar ut Nvidia som största leverantör inom datacenter-Ethernet switching mätt i intäkter, drivet av Spectrum-X och en integrerad modell för GPU plus nätverk.

Det är här man behöver hålla två tankar i huvudet samtidigt. Arista är inte ensam på planen. Men Arista har en mycket stark position där öppet Ethernet, hyperscaler-erfarenhet, EOS, telemetri och praktisk driftbarhet väger tungt. Det är också där många nordiska kunder faktiskt befinner sig.

De vill inte bara ha maximal teoretisk prestanda. De vill ha ett kluster som går att bygga, felsöka, uppgradera och leva med.


Vad betyder 1,6T för en nordisk kund?

För de flesta betyder det inte att man ska köpa 1,6T i morgon.

Ett mindre eller medelstort AI-kluster, från några noder upp till ett par hundra, kommer ofta mycket långt med 400G eller 800G. Vad som är rätt beror på GPU-typ, workload, lagring, topologi, tillväxtplan och krav på nyttjandegrad.

Det viktiga är att designen inte blir en återvändsgränd.

Man vill kunna börja på rätt nivå och växa utan att behöva byta driftmodell, telemetri, verktyg och designprinciper längs vägen. Där är Aristas portfölj stark. Samma grundtänk, samma EOS och samma CloudVision-modell kan följa med från campus och datacenter in i AI-fabricen.

Man kan börja med 400G eller 800G och ha en naturlig väg mot 1,6T när klustret, effekttätheten och arbetslaster kräver det.

Den mest strategiska frågan är därför sällan vilken switch som är snabbast på pappret. Den bättre frågan är vilken fabric som gör att GPU-investeringen faktiskt nyttjas, utan att man bygger in sig i ett hörn.


Vanliga frågor

Är InfiniBand dött?

Nej. InfiniBand kommer fortsätta vara relevant i vissa HPC- och AI-miljöer, särskilt där det redan finns kompetens, verktyg och optimerade applikationsmönster. Men Ethernet har tagit ett stort steg inom AI back-end networking och är i dag ett mycket starkt alternativ för många enterprise- och Tier-2-kluster. För många nordiska kunder kommer en välbyggd Arista Ethernet-fabric vara mer flexibel, mer driftbar och mer kostnadseffektiv.

När behöver man 1,6T?

När klustret, rackdensiteten och trafikmönstret gör att 800G börjar bli en begränsning. Det handlar typiskt om mycket stora XPU-miljöer, täta rack och scale-out- eller scale-up-design där fabricen behöver följa acceleratorernas utveckling. Mindre kluster bör inte köpa hastighet för rubrikens skull. De bör köpa rätt fabric för de kommande tre till fem åren.

Vad vinner man på vätskekylt nätverk?

Framför allt effekt och termisk kontroll. Om switchen kan integreras i rackets vätskekrets och slippa interna fläktar minskar overheaden. I högdensitetsrack är det inte en lyxfråga, utan en del av totaldesignen.

Är Cisco eller HPE fel val?

Nej. Cisco har starka enterprise- och säkerhetsfördelar, och HPE med Juniper har en allt mer komplett portfölj för AI, campus, datacenter och moln. Men för själva AI-fabricen, särskilt där öppet Ethernet, EOS, hyperscaler-erfarenhet och praktisk driftbarhet är centrala krav, är Arista ett mycket starkt förstaval.


Aixias vinkel

Aixia bygger och driver AI- och HPC-infrastruktur där nätverket inte får vara en eftertanke. I praktiken handlar det om att dimensionera hela kedjan: GPUer, lagring, fabric, kylning, effekt, drift, support och framtida expansion.

Arista är vår främsta nätverkspartner för AI- och HPC-fabrics. Vi designar, implementerar och supportar Arista-miljöer från 400G till 800G och vidare mot 1,6T, med luftkylda eller vätskekylda designval beroende på kundens verklighet.

Vi levererar även Cisco och HPE där helheten kräver det. Men när själva AI-nätverket ska bära dyr compute utan att bli flaskhals leder vi ofta med Arista, av tekniska skäl lika mycket som strategiska.

För i slutändan är det ganska enkelt: om GPUerna står och väntar är det inte längre en GPU-fråga. Då är det nätverket som ska granskas.

Vill du veta mer om hur vi designar AI-nätverk som faktiskt levererar?

Hör av dig →

Latest News

The AI agents have been given the keys to the systems

Autonoma AI-agenter är inte längre bara smarta assistenter som svarar på frågor. De läser dokument, hämtar data, anropar APIer, skriver…

Read more

When the GPUs are waiting for the network

Det finns en punkt där ett AI-kluster slutar handla om hur många GPUer man har köpt. Den punkten kallas nätverket….

Read more

Reliable Wi-Fi: Why Wireless Networks Are a Business-Critical Infrastructure

Wireless networks are no longer just a convenient option—they’re business-critical infrastructure. Here’s how to ensure your Wi-Fi measures up….
Read more

Arista Networks: Why the Modern Network No Longer Looks Like It Used to

Discover why Arista Networks is the most interesting player in the networking market. EOS, CloudVision, Deep Buffers, and open standards—the…
Read more