Blogg
juni 26, 2026

67% av AI-workloads lämnar molnet. Ska ni följa efter?

Blogg

67 procent av alla AI-workloads körs nu utanför molnet. 88 procent av företag kör minst en AI-workload on-prem. Det handlar inte om att lämna molnet helt — det handlar om hybrid AI där kontroll, säkerhet och IP skyddas bäst on-prem.

Målgrupp: CTO, infrastrukturansvarig, AI-lead | Lästid: 6 minuter

TL;DR: 67 procent av alla AI-workloads körs nu utanför molnet. 88 procent av företag kör minst en AI-workload on-prem. Det handlar inte om att lämna molnet helt — det handlar om hybrid AI där kontroll, säkerhet och IP skyddas bäst on-prem. GPU-kluster med NVIDIA DGX-platformen som NVIDIA NVIDIA DGX-system blir strategiska investeringar, inte experiment.

Vad händer med AI och molnet just nu?

För tre år sedan var svaret självklart: AI körs i molnet. AWS, Azure, GCP erbjuder GPU-instanser på begäran, och startups byggde hela sin verksamhet kring API-anrop till OpenAI och Anthropic.

Men under 2026 har vinden vänt. Dell Technologies World i maj presenterade siffror som fick salen att tystna: 67 procent av alla AI-workloads körs nu utanför publika molnet. Fyra av fem företag — 88 procent — kör minst en AI-workload on-prem, i en co-location eller i edge-miljö.

Det är inte en marginell förskjutning. Det är en fundamental omvärdering av hur AI-infrastruktur ska byggas.

Varför flyttar företag AI från molnet till on-prem?

Det finns fem drivkrafter bakom skiftet:

1. Kostnaden skenar i molnet

GPU-timmar i molnet är dyra. En NVIDIA H100-instans på AWS kostar cirka 4-5 dollar per timme. För ett träningsjobb som kräver 1 000 GPU-timmar per dag blir årskostnaden lätt 1,5-2 miljoner dollar — bara för compute.

Med en on-prem NVIDIA DGX-system H100-system är break-even ofta nådd på 18-24 månader för konstanta workloads. På 5-7 år blir skillnaden flera miljoner dollar.

2. Dataresidens och regulatoriska krav

Nordiska företag inom finans, hälsovård och offentlig sektor har strikta krav på var data får lagras och processas. GDPR, patientdatalagen och försvarsrelaterad sekretess gör att känslig data inte kan lämna landet — eller ens organisationens egna datacenter.

Molnet kan lösa detta med region-specifika instanser, men kontrollen är aldrig densamma som när man äger infrastrukturen själv.

3. IP-skydd och konkurrensfördel

När man tränar en AI-modell på proprietär data är modellen själv en konkurrensfördel. Att låta den tränas i en delad molnmiljö — där molnleverantören teoretiskt kan observera eller replikera mönster — är ett affärsrisk som allt fler vägrar ta.

4. Förutsägbar prestanda

Molnet är delat. Andras workloads påverkar era. Latens varierar. Bandbredd är inte garanterad.

On-prem betyder dedicerade GPU:er, dedicerad nätverksbandbredd och full kontroll över hela stacken. För inferens i realtid — särskilt agentisk AI som interagerar med interna system — är detta avgörande.

5. Skalbarhet utan låsning

Molnmiljöer låser fast er i en leverantörs ekosystem. On-prem med öppna standarder ger möjlighet att byta tillverkare, migrera workloads och behålla kontrollen över er tekniska roadmap.

Dell, IDC och Gartner: Vad säger siffrorna om 2026?

Metric	Siffra	Källa
NVIDIA DGX-system (8×B200-GPU)	4,8–5,3 MSEK	0,5–0,8 MSEK
Nätverk (400/800 GbE, leaf+spine)	1,5–3,0 MSEK	Inkluderat
Lagring (500 TB, NVMe-tier)	3,0–6,0 MSEK	0,4–0,8 MSEK
El och kylning (0,5 MW)	—	2,0–4,0 MSEK
Drift och support (24/7)	—	1,0–2,0 MSEK
Total 5–10 racks	45–90 MSEK	7,9–13,6 MSEK

Siffrorna talar sitt tydliga språk: AI-infrastruktur är den snabbast växande kategorin inom IT. Och den växer snabbast on-prem.

Gartners senaste prognos visar att AI-infrastruktur nu står för 31,7 procent av den totala IT-budgeten — upp från 13,7 procent så sent som 2024. Det är en fördubbling på ett år. Och det är bara början.

IDC rapporterar att icke-x86-servrar, drivna av AI-chips med Arm-kärnor, nu står för 47,9 procent av servermarknadens omsättning med en ökning på 107 procent året före. Marknaden transformeras i realtid.

Vilka workloads passar bäst on-prem vs i molnet?

On-prem är överlägset för:

›Modellträning med proprietär data (finjustering av LLM:s, branschspecifika modeller)
›Agentisk AI med systemtillgång (interna API:er, databaser, dokument)
›Workloads med strikta dataresidenskrav (finans, hälsovård, försvar)
›Inferens i realtid med låg latenskrav (industri, autonomi, sensorfusion)
›Konstanta, förutsägbara workloads (molnet är dyrt när GPU:erna står och snurrar dygnet runt)

Molnet vinner på:

›Experiment och prototyping (testa en modell i två veckor utan kapitalbindning)
›Burst-baserade workloads (säsongstoppar, kampanjer)
›Tillgång till hyper-skalerade modeller (GTP-5-klass, kräver datacenter med 10 000+ GPU:er)
›Organisationer utan intern infrastrukturkompetens

Verkligheten för de flesta nordiska företag: en hybrid strategi där träning och känslig inferens sker on-prem medan experiment och toppar hanteras i molnet.

Kostnadsbilden: Prislappen för ett modernt AI-datacenter

Att bygga ett AI-datacenter är inte längre bara för hyperscalers. Med DGX-plattformen som NVIDIA NVIDIA DGX-system kan ett företag komma igång med en AI-fabrik i rack-skala.

Prisindikationer för nordiska förhållanden (alla belopp exklusive moms):

Komponent	Investering	Drift per år
NVIDIA DGX-system (8 st H200-GPU med 1 128 GB totalminne, 32 petaFLOPS)	4–5,5 MSEK	0,5–0,8 MSEK
Nätverk (switch + adaptrar + kablage)	1,5–3,0 MSEK	Inkluderat
Lagring (AI-grade, 500 TB usable, flash)	2,5–5,0 MSEK	0,3–0,6 MSEK
El och kylning (0,5 MW, beroende på PUE och elpris)	—	2,0–4,0 MSEK*
Drift och support (24/7, proaktiv övervakning)	—	1,0–2,0 MSEK

* Driftkostnad för el och kylning varierar kraftigt beroende på utnyttjandegrad, elprisavtal och datacenterets PUE (Power Usage Effectiveness). Priserna ovan är vägledande uppskattningar exklusive moms.

För ett komplett system med 5–10 racks med NVIDIA DGX-system—vilket ger kapacitet motsvarande medelstora molnmiljöers AI-beräkningskluster—landar totalkostnaden på 45–90 MSEK i investering och 8–14 MSEK per år i drift.

Jämfört med molnet: En likvärdig GPU-kapacitet på AWS skulle kosta 20–35 MSEK per år. Break-even för on-prem är ofta nådd på 18–30 månader. Break-even för on-prem är ofta nådd på 18–30 månader.

””Det handlar inte att välja mellan moln och on-prem. Det handlar om att placera rätt workload på rätt plats till rätt pris.””

5 steg för en lyckad migrering från cloud till hybrid AI

Steg 1: Inventera era workloads

Kartlägg alla AI-workloads: vad tränas, vad körs i inferens, vilka data används, vilka latenskrav finns? Detta ger underlaget för beslut om vad som ska flyttas on-prem.

Steg 2: Välj rätt datacenterpartner

För de flesta företag är co-location eller managed AI-datacenter bättre än att bygga eget. Sök en partner med:

›Erfarenhet av GPU-intensiva miljöer (NVIDIA DGX-system-certifiering är ett plus)
›Klimatneutral drift (viktigt för ESG-rapport och kostnader)
›Nätverkskompetens (InfiniBand/RoCE)
›Svensk dataresidens

Steg 3: Designa för hybrid

Molnet försvinner inte. Designa arkitekturen så att modeller kan tränas on-prem, deployeras till molnet för burst och sedan dras tillbaka. Kubernetes med GPU-support (Run:ai, NVIDIA KAI Scheduler) är nyckeln.

Steg 4: Säkerställ dataflöden

AI-modeller är beroende av data. Säkerställ att träningsdata kan flyttas effektivt mellan lagring och compute. WEKA, VAST eller Pure Storage är vanliga val för AI-grade lagring.

Steg 5: Bygg kompetens internt

On-prem kräver annan kompetens än molnet. Säkerställ att teamet har kapacitet att hantera GPU-scheduling, nätverksoptimering och modelldeployment. Alternativt: köp managed services från en partner.

Aixias vinkel: Hybrid AI gjort enkelt

Aixia bygger och driftar NVIDIA NVIDIA DGX-system i Norden med full support för hybrid AI. Våra klimatneutrala datacenter och DGX-plattformen gör on-prem AI tillgängligt för svenska och nordiska företag.

›NVIDIA DGX-system: Validerad design från NVIDIA med upp till 5 petaFLOPS AI-prestanda per rack
›Klimatneutral drift: ISO 14001-certifierade datacenter med hållbar energi
›Svensk dataresidens: Data stannar i Sverige, utan molnblickning
›Managed AI: Vi sköter driften — ni fokuserar på modellerna

”Vill du ha en förutsättningslös genomgång? Kontakta Aixias AI-infrastrukuturteam för en workshop där vi kartlägger era workloads och rekommenderar rätt hybrid-strategi.”

Sammanfattning: Tre saker att göra denna månad

1Inventera era AI-workloads. Vilka körs i molnet idag? Vilka data används? Vilka kostar mest?

2Räkna på break-even. Jämför molnmotsvarighetens kostnad med on-prem investering över 3-5 år. Glöm inte att räkna med dataresidens, IP-skydd och prestanda.

3Boka en NVIDIA DGX-system-demo. Se vad en validerad AI-fabrik kan ge er för prestanda — innan ni skriver nästa molnkontrakt.

Källor och vidare läsning

›Dell Technologies World: AI Infrastructure Shifts to On-Premises — Next Platform, maj 2026 (67% utanför molnet, 88% minst en on-prem)
›Data and Storage at the Center of the AI Stack — Next Platform, maj 2026
›IDC Worldwide Quarterly Server Tracker Q1 2026 — IDC, juni 2026 (icke-x86 servrar +107%)
›Gartner AI Spending Forecast 2026 — Gartner, juni 2026 (31,7% av IT-budgeten)
›TeraWulf AI Datacenter Build-out — Next Platform, maj 2026 ($7-10M per MW)

Aixia AB — Nordens exklusiva NVIDIA NVIDIA DGX-system partner. Vi förenklar komplex AI-infrastruktur för svenska och nordiska företag.

Kontakt: petter.ahlen@aixia.se | aixia.se

Redo att utforska hybrid AI?

Låt Aixias AI-infrastrukturteam kartlägga era workloads och rekommendera rätt strategi.

Boka en workshop

Aixia AB — Nordens exklusiva NVIDIA NVIDIA DGX-system partner

petter.ahlen@aixia.se | aixia.se

Latest News

Blogg
juni 26, 2026
67% av AI-workloads lämnar molnet. Ska ni följa efter?
67 procent av alla AI-workloads körs nu utanför molnet. 88 procent av företag kör minst en AI-workload on-prem. Dell, IDC…
Läs mer

Blogg
juni 24, 2026
Augusti 2026: När EU AI Act går från teori till tvingande verklighet
Från och med i sommar är smekmånaden för oreglerad AI över. EU AI Act träder i kraft med bötesnivåer på…
Läs mer

Blogg
juni 23, 2026
5 tecken på att er IT-infrastruktur behöver en reality check
När den globala servermarknaden växer med 30 procent årligen men leveranstiderna fördubblas, räcker det inte längre att uppdatera IT-strategin vart…
Läs mer

Blogg
juni 22, 2026
Zero Trust för AI-agenter — när maskiner får sina egna identiteter
Agentisk AI är här — autonoma AI-agenter som agerar på egen hand i era system. Dagens identitets- och åtkomstmodeller är…
Läs mer

Cookie	Varaktighet	Beskrivning
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.