VAST Undivided Attention – lagring för AI och HPC

Nyhet: VAST revolutionerar AI-prestanda – och Aixia levererar lösningen

 

VAST Data har precis lanserat VUA (VAST Undivided Attention) – en ny öppen mjukvaruteknik som kraftigt förbättrar hastigheten och effektiviteten vid AI-bearbetning. Aixia är stolta över att som VAST-partner kunna erbjuda denna banbrytande lösning till våra kunder.

 

Vad handlar det om?

När AI-modeller, som exempelvis stora språkmodeller (LLM), genererar text och analyser, skapas enorma mängder data (så kallade tokens) i realtid. Dessa tokens måste normalt lagras i serverns GPU-minne för att undvika tidskrävande omräkningar. Problemet är att GPU-minnet snabbt blir fullt – och då bromsas hela processen.

VASTs VUA löser detta genom att smart lagra dessa tokens på blixtsnabba NVMe-anslutna SSD-diskar. På så vis får GPU-servrarna tillgång till betydligt mer ”virtuellt” minne, utan att prestandan drabbas. Detta betyder att AI-tjänster kan skala upp snabbare, hantera mer komplexa frågor och samtidigt minska både svarstider och hårdvarukostnader.

Vad betyder det för en CFO?

  • Kortare svarstider = bättre användarupplevelse och konkurrensfördelar.

  • Mindre behov av att köpa fler dyra GPU:er.

  • Ökad effektivitet och lägre TCO (Total Cost of Ownership) för AI-infrastruktur.

Vad betyder det För en tekniker:

  • VUA skapar ett nytt cache-lager mellan GPU, CPU och NVMe, integrerat med GPUDirect.

  • Global, delad cache som kan hantera miljarder tokens och minimera ”cache misses”.

  • 292 % snabbare token-generering vid tester – och stöd för framtidens allt större AI-modeller.

 

Med VUA från VAST kan företag ta sina AI-satsningar till nästa nivå, samtidigt som de optimerar investeringarna i sin infrastruktur. Aixia hjälper er att implementera och anpassa lösningen efter era behov – från rådgivning till färdig drift.
Vill du veta mer om hur VUA kan accelerera din AI-strategi? Kontakta oss på Aixia!

Latest News

AI Factory: Från buzzword till affärskritisk produktionslina – så navigerar du 2026

AI Factory är inte bara en trend för globala giganter. Lär dig de tre nivåerna av mognad och de fem…
Läs mer

När brandsläckning blir dyrare än proaktiv drift: Är er IT-miljö redo för 2026?

Brandsläckning i IT-avdelningen kostar mer än proaktiv drift. Lär dig hur du går från akuta utryckningar till strategisk IT med…
Läs mer

Från pilot-kyrkogården till produktion: Vägen till en mogen MLOps-strategi

Många AI-projekt dör i pilot-kyrkogården. Lär dig vad som krävs för att bygga en mogen MLOps-strategi som faktiskt kan skala…
Läs mer

NIS2 gäller redan. Vad det faktiskt innebär för er AI-miljö.

NIS2 trädde i kraft oktober 2024. Fyra konkreta frågor att ställa om er AI-miljö – och varför on-prem ger tydligare…
Läs mer