67 procent av alla AI-workloads körs nu utanför molnet. 88 procent av företag kör minst en AI-workload on-prem. Det handlar inte om att lämna molnet helt — det handlar om hybrid AI där kontroll, säkerhet och IP skyddas bäst on-prem.
Målgrupp: CTO, infrastrukturansvarig, AI-lead | Lästid: 6 minuter
TL;DR: 67 procent av alla AI-workloads körs nu utanför molnet. 88 procent av företag kör minst en AI-workload on-prem. Det handlar inte om att lämna molnet helt — det handlar om hybrid AI där kontroll, säkerhet och IP skyddas bäst on-prem. GPU-kluster med NVIDIA DGX-platformen som NVIDIA NVIDIA DGX-system blir strategiska investeringar, inte experiment.
Vad händer med AI och molnet just nu?
För tre år sedan var svaret självklart: AI körs i molnet. AWS, Azure, GCP erbjuder GPU-instanser på begäran, och startups byggde hela sin verksamhet kring API-anrop till OpenAI och Anthropic.
Men under 2026 har vinden vänt. Dell Technologies World i maj presenterade siffror som fick salen att tystna: 67 procent av alla AI-workloads körs nu utanför publika molnet. Fyra av fem företag — 88 procent — kör minst en AI-workload on-prem, i en co-location eller i edge-miljö.
Det är inte en marginell förskjutning. Det är en fundamental omvärdering av hur AI-infrastruktur ska byggas.
Varför flyttar företag AI från molnet till on-prem?
Det finns fem drivkrafter bakom skiftet:
1. Kostnaden skenar i molnet
GPU-timmar i molnet är dyra. En NVIDIA H100-instans på AWS kostar cirka 4-5 dollar per timme. För ett träningsjobb som kräver 1 000 GPU-timmar per dag blir årskostnaden lätt 1,5-2 miljoner dollar — bara för compute.
Med en on-prem NVIDIA DGX-system H100-system är break-even ofta nådd på 18-24 månader för konstanta workloads. På 5-7 år blir skillnaden flera miljoner dollar.
2. Dataresidens och regulatoriska krav
Nordiska företag inom finans, hälsovård och offentlig sektor har strikta krav på var data får lagras och processas. GDPR, patientdatalagen och försvarsrelaterad sekretess gör att känslig data inte kan lämna landet — eller ens organisationens egna datacenter.
Molnet kan lösa detta med region-specifika instanser, men kontrollen är aldrig densamma som när man äger infrastrukturen själv.
3. IP-skydd och konkurrensfördel
När man tränar en AI-modell på proprietär data är modellen själv en konkurrensfördel. Att låta den tränas i en delad molnmiljö — där molnleverantören teoretiskt kan observera eller replikera mönster — är ett affärsrisk som allt fler vägrar ta.
4. Förutsägbar prestanda
Molnet är delat. Andras workloads påverkar era. Latens varierar. Bandbredd är inte garanterad.
On-prem betyder dedicerade GPU:er, dedicerad nätverksbandbredd och full kontroll över hela stacken. För inferens i realtid — särskilt agentisk AI som interagerar med interna system — är detta avgörande.
5. Skalbarhet utan låsning
Molnmiljöer låser fast er i en leverantörs ekosystem. On-prem med öppna standarder ger möjlighet att byta tillverkare, migrera workloads och behålla kontrollen över er tekniska roadmap.
Dell, IDC och Gartner: Vad säger siffrorna om 2026?
| Metric | Siffra | Källa |
|---|---|---|
| NVIDIA DGX-system (8×B200-GPU) | 4,8–5,3 MSEK | 0,5–0,8 MSEK |
| Nätverk (400/800 GbE, leaf+spine) | 1,5–3,0 MSEK | Inkluderat |
| Lagring (500 TB, NVMe-tier) | 3,0–6,0 MSEK | 0,4–0,8 MSEK |
| El och kylning (0,5 MW) | — | 2,0–4,0 MSEK |
| Drift och support (24/7) | — | 1,0–2,0 MSEK |
| Total 5–10 racks | 45–90 MSEK | 7,9–13,6 MSEK |
Siffrorna talar sitt tydliga språk: AI-infrastruktur är den snabbast växande kategorin inom IT. Och den växer snabbast on-prem.
Gartners senaste prognos visar att AI-infrastruktur nu står för 31,7 procent av den totala IT-budgeten — upp från 13,7 procent så sent som 2024. Det är en fördubbling på ett år. Och det är bara början.
IDC rapporterar att icke-x86-servrar, drivna av AI-chips med Arm-kärnor, nu står för 47,9 procent av servermarknadens omsättning med en ökning på 107 procent året före. Marknaden transformeras i realtid.
Vilka workloads passar bäst on-prem vs i molnet?
On-prem är överlägset för:
- ›Modellträning med proprietär data (finjustering av LLM:s, branschspecifika modeller)
- ›Agentisk AI med systemtillgång (interna API:er, databaser, dokument)
- ›Workloads med strikta dataresidenskrav (finans, hälsovård, försvar)
- ›Inferens i realtid med låg latenskrav (industri, autonomi, sensorfusion)
- ›Konstanta, förutsägbara workloads (molnet är dyrt när GPU:erna står och snurrar dygnet runt)
Molnet vinner på:
- ›Experiment och prototyping (testa en modell i två veckor utan kapitalbindning)
- ›Burst-baserade workloads (säsongstoppar, kampanjer)
- ›Tillgång till hyper-skalerade modeller (GTP-5-klass, kräver datacenter med 10 000+ GPU:er)
- ›Organisationer utan intern infrastrukturkompetens
Verkligheten för de flesta nordiska företag: en hybrid strategi där träning och känslig inferens sker on-prem medan experiment och toppar hanteras i molnet.
Kostnadsbilden: Prislappen för ett modernt AI-datacenter
Att bygga ett AI-datacenter är inte längre bara för hyperscalers. Med DGX-plattformen som NVIDIA NVIDIA DGX-system kan ett företag komma igång med en AI-fabrik i rack-skala.
Prisindikationer för nordiska förhållanden (alla belopp exklusive moms):
| Komponent | Investering | Drift per år |
|---|---|---|
| NVIDIA DGX-system (8 st H200-GPU med 1 128 GB totalminne, 32 petaFLOPS) | 4–5,5 MSEK | 0,5–0,8 MSEK |
| Nätverk (switch + adaptrar + kablage) | 1,5–3,0 MSEK | Inkluderat |
| Lagring (AI-grade, 500 TB usable, flash) | 2,5–5,0 MSEK | 0,3–0,6 MSEK |
| El och kylning (0,5 MW, beroende på PUE och elpris) | — | 2,0–4,0 MSEK* |
| Drift och support (24/7, proaktiv övervakning) | — | 1,0–2,0 MSEK |
* Driftkostnad för el och kylning varierar kraftigt beroende på utnyttjandegrad, elprisavtal och datacenterets PUE (Power Usage Effectiveness). Priserna ovan är vägledande uppskattningar exklusive moms.
För ett komplett system med 5–10 racks med NVIDIA DGX-system—vilket ger kapacitet motsvarande medelstora molnmiljöers AI-beräkningskluster—landar totalkostnaden på 45–90 MSEK i investering och 8–14 MSEK per år i drift.
Jämfört med molnet: En likvärdig GPU-kapacitet på AWS skulle kosta 20–35 MSEK per år. Break-even för on-prem är ofta nådd på 18–30 månader. Break-even för on-prem är ofta nådd på 18–30 månader.
””Det handlar inte att välja mellan moln och on-prem. Det handlar om att placera rätt workload på rätt plats till rätt pris.””
5 steg för en lyckad migrering från cloud till hybrid AI
Steg 1: Inventera era workloads
Kartlägg alla AI-workloads: vad tränas, vad körs i inferens, vilka data används, vilka latenskrav finns? Detta ger underlaget för beslut om vad som ska flyttas on-prem.
Steg 2: Välj rätt datacenterpartner
För de flesta företag är co-location eller managed AI-datacenter bättre än att bygga eget. Sök en partner med:
- ›Erfarenhet av GPU-intensiva miljöer (NVIDIA DGX-system-certifiering är ett plus)
- ›Klimatneutral drift (viktigt för ESG-rapport och kostnader)
- ›Nätverkskompetens (InfiniBand/RoCE)
- ›Svensk dataresidens
Steg 3: Designa för hybrid
Molnet försvinner inte. Designa arkitekturen så att modeller kan tränas on-prem, deployeras till molnet för burst och sedan dras tillbaka. Kubernetes med GPU-support (Run:ai, NVIDIA KAI Scheduler) är nyckeln.
Steg 4: Säkerställ dataflöden
AI-modeller är beroende av data. Säkerställ att träningsdata kan flyttas effektivt mellan lagring och compute. WEKA, VAST eller Pure Storage är vanliga val för AI-grade lagring.
Steg 5: Bygg kompetens internt
On-prem kräver annan kompetens än molnet. Säkerställ att teamet har kapacitet att hantera GPU-scheduling, nätverksoptimering och modelldeployment. Alternativt: köp managed services från en partner.
Aixias vinkel: Hybrid AI gjort enkelt
Aixia bygger och driftar NVIDIA NVIDIA DGX-system i Norden med full support för hybrid AI. Våra klimatneutrala datacenter och DGX-plattformen gör on-prem AI tillgängligt för svenska och nordiska företag.
- ›NVIDIA DGX-system: Validerad design från NVIDIA med upp till 5 petaFLOPS AI-prestanda per rack
- ›Klimatneutral drift: ISO 14001-certifierade datacenter med hållbar energi
- ›Svensk dataresidens: Data stannar i Sverige, utan molnblickning
- ›Managed AI: Vi sköter driften — ni fokuserar på modellerna
”Vill du ha en förutsättningslös genomgång? Kontakta Aixias AI-infrastrukuturteam för en workshop där vi kartlägger era workloads och rekommenderar rätt hybrid-strategi.”
Sammanfattning: Tre saker att göra denna månad
- 1Inventera era AI-workloads. Vilka körs i molnet idag? Vilka data används? Vilka kostar mest?
- 2Räkna på break-even. Jämför molnmotsvarighetens kostnad med on-prem investering över 3-5 år. Glöm inte att räkna med dataresidens, IP-skydd och prestanda.
- 3Boka en NVIDIA DGX-system-demo. Se vad en validerad AI-fabrik kan ge er för prestanda — innan ni skriver nästa molnkontrakt.
Källor och vidare läsning
- ›Dell Technologies World: AI Infrastructure Shifts to On-Premises — Next Platform, maj 2026 (67% utanför molnet, 88% minst en on-prem)
- ›Data and Storage at the Center of the AI Stack — Next Platform, maj 2026
- ›IDC Worldwide Quarterly Server Tracker Q1 2026 — IDC, juni 2026 (icke-x86 servrar +107%)
- ›Gartner AI Spending Forecast 2026 — Gartner, juni 2026 (31,7% av IT-budgeten)
- ›TeraWulf AI Datacenter Build-out — Next Platform, maj 2026 ($7-10M per MW)
Aixia AB — Nordens exklusiva NVIDIA NVIDIA DGX-system partner. Vi förenklar komplex AI-infrastruktur för svenska och nordiska företag.
Kontakt: petter.ahlen@aixia.se | aixia.se
Redo att utforska hybrid AI?
Låt Aixias AI-infrastrukturteam kartlägga era workloads och rekommendera rätt strategi.
Aixia AB — Nordens exklusiva NVIDIA NVIDIA DGX-system partner




