VAST Undivided Attention

Nyhet: VAST revolutionerar AI-prestanda – och Aixia levererar lösningen

 

VAST Data har precis lanserat VUA (VAST Undivided Attention) – en ny öppen mjukvaruteknik som kraftigt förbättrar hastigheten och effektiviteten vid AI-bearbetning. Aixia är stolta över att som VAST-partner kunna erbjuda denna banbrytande lösning till våra kunder.

 

Vad handlar det om?

När AI-modeller, som exempelvis stora språkmodeller (LLM), genererar text och analyser, skapas enorma mängder data (så kallade tokens) i realtid. Dessa tokens måste normalt lagras i serverns GPU-minne för att undvika tidskrävande omräkningar. Problemet är att GPU-minnet snabbt blir fullt – och då bromsas hela processen.

VASTs VUA löser detta genom att smart lagra dessa tokens på blixtsnabba NVMe-anslutna SSD-diskar. På så vis får GPU-servrarna tillgång till betydligt mer ”virtuellt” minne, utan att prestandan drabbas. Detta betyder att AI-tjänster kan skala upp snabbare, hantera mer komplexa frågor och samtidigt minska både svarstider och hårdvarukostnader.

Vad betyder det för en CFO?

  • Kortare svarstider = bättre användarupplevelse och konkurrensfördelar.

  • Mindre behov av att köpa fler dyra GPU:er.

  • Ökad effektivitet och lägre TCO (Total Cost of Ownership) för AI-infrastruktur.

Vad betyder det För en tekniker:

  • VUA skapar ett nytt cache-lager mellan GPU, CPU och NVMe, integrerat med GPUDirect.

  • Global, delad cache som kan hantera miljarder tokens och minimera ”cache misses”.

  • 292 % snabbare token-generering vid tester – och stöd för framtidens allt större AI-modeller.

 

Med VUA från VAST kan företag ta sina AI-satsningar till nästa nivå, samtidigt som de optimerar investeringarna i sin infrastruktur. Aixia hjälper er att implementera och anpassa lösningen efter era behov – från rådgivning till färdig drift.
Vill du veta mer om hur VUA kan accelerera din AI-strategi? Kontakta oss på Aixia!

Latest News

De fem misstagen vi ser om och om igen när organisationer kör AI i molnet

Fem misstag vi ser om och om igen när organisationer kör AI i molnet – från TCO-kalkyler som spricker till…
Läs mer

AI i tillverkning: pilotprojekten är över

Fictiv och MISUMIs nya rapport visar att AI-adoptionen i tillverkning hoppat från 87% till 93%. Men pilotprojekten är över –…
Läs mer

Pentagon satsar $13,4 miljarder på AI – och det handlar inte bara om autonoma vapen

Pentagon satsar $13,4 miljarder på AI – men det handlar inte om drönare. Det handlar om beslutsförmåga, sensorfusion och suverän…
Läs mer

AiQu: infrastrukturen som tar AI från lovande pilot till faktisk produktion

Att skala AI handlar mer om infrastruktur än om algoritmer. AiQu låser inte er till en leverantör – stödjer NVIDIA,…
Läs mer