Witold Kepinski - 26 augustus 2024

IBM onthult nieuwe chip voor AI-workloads van de volgende generatie

IBM heeft op Hot Chips 2024 architectuurdetails bekendgemaakt voor de aankomende IBM Telum II Processor en IBM Spyre Accelerator. De nieuwe technologieën zijn ontworpen om de verwerkingscapaciteit in de volgende generatie IBM Z mainframesystemen aanzienlijk te schalen, waardoor het gebruik van traditionele AI-modellen en Large Language AI-modellen samen wordt versneld via een nieuwe ensemblemethode van AI.

IBM onthult nieuwe chip voor AI-workloads van de volgende generatie image

IBM heeft een paar nieuwe chips geïntroduceerd die zijn ontworpen om AI-workloads drastisch te versnellen, en die inspelen op het stijgende energieverbruik dat gepaard gaat met generatieve AI-modellen. De Telum II-processor, die de volgende generatie IBM Z-systemen moet aandrijven, en de Spyre Accelerator, een speciale AI-accelerator, vertegenwoordigen een aanzienlijke sprong voorwaarts in enterprise computing.

Aanpak van de energiebehoefte van AI 

Een recente studie van Morgan Stanley voorspelde dat het energieverbruik van generatieve AI de komende jaren met 75% per jaar zou kunnen toenemen. Om deze groeiende vraag naar energie aan te pakken, heeft IBM de Telum II-processor ontworpen met een hogere frequentie, een grotere geheugencapaciteit en geïntegreerde AI-versnelling. In combinatie met de Spyre Accelerator stellen deze ontwikkelingen ondernemingen in staat om complexe AI-modellen efficiënter en kosteneffectiever uit te voeren.

Belangrijkste kenmerken en voordelen

  • Telum II-processor: Deze nieuwe chip biedt een aanzienlijke verbetering in prestaties en efficiëntie, waardoor deze ideaal is voor het verwerken van de veeleisende rekenvereisten van AI-werklasten. De geïntegreerde AI-accelerator biedt een aanzienlijke toename in rekencapaciteit, wat snellere inferentietijden mogelijk maakt.
  • Spyre Accelerator: De Spyre Accelerator is ontworpen als aanvulling op de Telum II-processor en biedt extra AI-rekenmogelijkheden. Het ondersteunt ensemblemethoden, een techniek die meerdere AI-modellen combineert om nauwkeurigere en robuustere resultaten te behalen.
  • Energie-efficiëntie: Beide chips zijn gebouwd op Samsung Foundry's 5nm-procesknooppunt, bekend om zijn energie-efficiëntie. Dit zorgt ervoor dat ondernemingen de kracht van AI kunnen benutten zonder buitensporige energiekosten te maken.

Gebruiksscenario's 

De combinatie van de Telum II-processor en Spyre Accelerator opent nieuwe mogelijkheden voor AI-gestuurde toepassingen, waaronder:

  • Fraudedetectie: verbeterde fraudedetectie bij verzekeringsclaims door taalmodellen te combineren met traditionele neurale netwerken.
  • Witwassen: betere detectie van verdachte financiële activiteiten om financiële criminaliteit te voorkomen.
  • AI-assistenten: versnelde applicatieontwikkeling en verbeterde kennisdeling.

Impact op de industrie 

De nieuwste innovaties van IBM staan ​​op het punt het enterprise computing-landschap te hervormen. Door een krachtig en efficiënt platform voor AI-workloads te bieden, stellen deze chips bedrijven in staat om:

  • Kosten verlagen: verlaag het energieverbruik en verbeter de operationele efficiëntie.
  • Versnel innovatie: ontwikkel en implementeer sneller nieuwe AI-toepassingen.
  • Verbeter de beveiliging: bescherm gevoelige gegevens en voldoe aan de wettelijke vereisten.

"De Telum II Processor en Spyre Accelerator zijn ontworpen om krachtige, veilige en energiezuinigere enterprise computing-oplossingen te leveren," aldus Tina Tarquinio, VP, Product Management, IBM Z en LinuxONE. "Na jaren van ontwikkeling worden deze innovaties geïntroduceerd in ons volgende generatie IBM Z-platform, zodat klanten LLM's en generatieve AI op schaal kunnen benutten."

Conclusie 

Naarmate ondernemingen steeds meer AI gebruiken om innovatie te stimuleren en een concurrentievoordeel te behalen, zal de vraag naar krachtige en efficiënte computerplatforms alleen maar toenemen. IBM's nieuwste ontwikkelingen in processortechnologie positioneren het bedrijf als leider in het in staat stellen van ondernemingen om het volledige potentieel van AI te benutten.

Outpost24 17/12/2024 t/m 31/12/2024 BN + BW