Witold Kepinski - 11 augustus 2023

NVIDIA CEO Jensen Huang belicht nieuwe generatieve AI innovaties

Terwijl generatieve AI een steeds meer digitale, hyperverbonden wereld blijft veroveren, maakte NVIDIA-oprichter en CEO Jensen Huang (foto) een daverende terugkeer naar SIGGRAPH, 's werelds belangrijkste computergraphics-conferentie.

NVIDIA CEO Jensen Huang belicht nieuwe generatieve AI innovaties image

"Het generatieve AI-tijdperk staat voor de deur, het iPhone-moment als je wilt", vertelde Huang aan een publiek van duizenden tijdens een persoonlijk speciaal adres in Los Angeles.

Hoogtepunten van het nieuws zijn onder meer het GH200 Grace Hopper Superchip-platform van de volgende generatie , NVIDIA AI Workbench - een nieuwe uniforme toolkit die vereenvoudigde modelafstemming en implementatie op NVIDIA AI-platforms introduceert - en een belangrijke upgrade naar NVIDIA Omniverse met generatieve AI en OpenUSD .

De aankondigingen gaan over het samenbrengen van alle innovaties van het afgelopen decennium - AI, virtuele werelden, versnelling, simulatie, samenwerking en meer - samen.

"Grafiek en kunstmatige intelligentie zijn onlosmakelijk met elkaar verbonden, grafische afbeeldingen hebben AI nodig en AI heeft grafische afbeeldingen nodig", zei Huang, die uitlegde dat AI vaardigheden zal leren in virtuele werelden en dat AI zal helpen virtuele werelden te creëren.

Fundamenteel voor AI, real-time graphics

Vijf jaar geleden vond NVIDIA bij SIGGRAPH graphics opnieuw uit door AI en real-time ray tracing naar GPU's te brengen. Maar "terwijl we computergraphics opnieuw uitvonden met kunstmatige intelligentie, waren we de GPU helemaal opnieuw aan het uitvinden voor kunstmatige intelligentie", zei Huang.

Het resultaat: steeds krachtigere systemen zoals de NVIDIA HGX H100, die acht GPU's gebruikt — en in totaal 1 biljoen transistors — die een dramatische versnelling bieden ten opzichte van CPU-gebaseerde systemen.

"Dit is de reden waarom de datacenters van de wereld snel overgaan op versneld computergebruik", zei Huang tegen het publiek. “Hoe meer je koopt, hoe meer je bespaart.”

Om het momentum van AI voort te zetten, creëerde NVIDIA de Grace Hopper Superchip, de NVIDIA GH200, die een 72-core Grace CPU combineert met een Hopper GPU, en die in mei volledig in productie ging.

Huang kondigde aan dat de NVIDIA GH200, die al in productie is, zal worden aangevuld met een extra versie met geavanceerd HBM3e-geheugen.

Hij vervolgde dat door het GH200 Grace Hopper-superchipplatform van de volgende generatie aan te kondigen met de mogelijkheid om meerdere GPU's aan te sluiten voor uitzonderlijke prestaties en een gemakkelijk schaalbaar serverontwerp.

Het nieuwe platform is gebouwd om 's werelds meest complexe generatieve workloads aan te kunnen, met grote taalmodellen, aanbevelingssystemen en vectordatabases, en zal beschikbaar zijn in een breed scala aan configuraties.

De dubbele configuratie - die tot 3,5x meer geheugencapaciteit en 3x meer bandbreedte levert dan de huidige generatie - bestaat uit een enkele server met 144 Arm Neoverse-cores, acht petaflops aan AI-prestaties en 282 GB van de nieuwste HBM3e-geheugentechnologie.

Toonaangevende systeemfabrikanten zullen naar verwachting in het tweede kwartaal van 2024 systemen op basis van het platform leveren.

Een volle zaal op de SIGGRAPH professionele grafische conferentie woonde de keynote-toespraak van NVIDIA-oprichter en CEO Jensen Huang bij.

NVIDIA AI Workbench versnelt de acceptatie van aangepaste generatieve AI

Om de aangepaste acceptatie van generatieve AI voor ondernemingen over de hele wereld te versnellen, heeft Huang NVIDIA AI Workbench aangekondigd. Het biedt ontwikkelaars een uniforme, gebruiksvriendelijke toolkit om snel generatieve AI-modellen op een pc of werkstation te creëren, testen en verfijnen - en ze vervolgens te schalen naar vrijwel elk datacenter, openbare cloud of NVIDIA DGX Cloud .

AI Workbench verwijdert de complexiteit van aan de slag gaan met een enterprise AI-project. Het is toegankelijk via een vereenvoudigde interface die op een lokaal systeem draait en stelt ontwikkelaars in staat om modellen van populaire repositories zoals Hugging Face, GitHub en NGC te verfijnen met behulp van aangepaste gegevens. De modellen kunnen vervolgens eenvoudig worden gedeeld over meerdere platforms.

Hoewel er nu honderdduizenden vooraf getrainde modellen beschikbaar zijn, kan het een uitdaging en tijdrovend zijn om ze aan te passen met de vele beschikbare open-sourcetools.

"Om dit vermogen te democratiseren, moeten we het mogelijk maken om vrijwel overal te rennen", zei Huang.

Met AI Workbench kunnen ontwikkelaars met slechts een paar klikken generatieve AI aanpassen en uitvoeren. Het stelt hen in staat om alle benodigde enterprise-grade modellen, frameworks, software development kits en bibliotheken samen te brengen in een uniforme werkruimte voor ontwikkelaars.

"Iedereen kan dit", zei Huang.

Toonaangevende aanbieders van AI-infrastructuur – waaronder Dell Technologies, Hewlett Packard Enterprise, HP Inc., Lambda, Lenovo en Supermicro – omarmen AI Workbench vanwege zijn vermogen om enterprise generatieve AI-mogelijkheden te bieden waar ontwikkelaars maar willen werken – inclusief een lokaal apparaat.

Huang kondigde ook een samenwerking aan tussen NVIDIA en startup Hugging Face , die 2 miljoen gebruikers heeft, waardoor generatieve AI-supercomputing binnen handbereik komt van miljoenen ontwikkelaars die grote taalmodellen en andere geavanceerde AI-toepassingen bouwen.

Ontwikkelaars hebben toegang tot NVIDIA DGX Cloud AI-supercomputing binnen het Hugging Face-platform om geavanceerde AI-modellen te trainen en af ​​te stemmen.

"Dit wordt een geheel nieuwe service om 's werelds grootste AI-gemeenschap te verbinden met' s werelds beste training en infrastructuur", zei Huang.

In een video liet Huang zien hoe AI Workbench en ChatUSD alles samenbrengen: een gebruiker in staat stellen een project te starten op een GeForce RTX 4090-laptop en naadloos op te schalen naar een werkstation of het datacenter naarmate het complexer wordt.

Met behulp van Jupyter Notebook kan een gebruiker het model vragen om een ​​afbeelding van Toy Jensen in de ruimte te genereren. Wanneer het model een resultaat oplevert dat niet werkt, omdat het nog nooit Toy Jensen heeft gezien, kan de gebruiker het model verfijnen met acht afbeeldingen van Toy Jensen en het vervolgens opnieuw vragen om een ​​correct resultaat te krijgen.

Met AI Workbench kan het nieuwe model vervolgens worden geïmplementeerd in een bedrijfstoepassing.

Nieuwe NVIDIA Enterprise 4.0-software bevordert AI-implementatie

In een volgende stap om de acceptatie van generatieve AI te versnellen, heeft NVIDIA de nieuwste versie van zijn bedrijfssoftwaresuite, NVIDIA AI Enterprise 4.0, aangekondigd .

NVIDIA AI Enterprise geeft bedrijven toegang tot de tools die nodig zijn om generatieve AI toe te passen, en biedt tegelijkertijd de beveiliging en API-stabiliteit die nodig zijn voor grootschalige bedrijfsimplementaties.

Major Omniverse-release convergeert generatieve AI, OpenUSD voor industriële digitalisering

Huang biedt nieuwe basistoepassingen en -diensten voor ontwikkelaars en industriële ondernemingen om hun 3D-pijplijnen te optimaliseren en te verbeteren met het OpenUSD- framework en generatieve AI . en virtuele werelden.

Hij kondigde ook NVIDIA's bijdragen aan OpenUSD aan, het raamwerk en de universele uitwisseling voor het beschrijven, simuleren en samenwerken van 3D-tools. Updates voor het Omniverse-platform omvatten verbeteringen aan Omniverse Kit - de engine voor het ontwikkelen van native OpenUSD-applicaties en -extensies - evenals aan de NVIDIA Omniverse Audio2Face Foundation-app en ruimtelijke rekenmogelijkheden .

Cesium, Convai, Move AI, SideFX Houdini en Wonder Dynamics zijn nu verbonden met Omniverse via OpenUSD.

Om hun samenwerking uit te breiden met Adobe Substance 3D, generatieve AI en OpenUSD-initiatieven, kondigden Adobe en NVIDIA plannen aan om Adobe Firefly - Adobe's familie van creatieve generatieve AI-modellen - beschikbaar te maken als API's in Omniverse.

Omniverse-gebruikers kunnen nu content, ervaringen en applicaties bouwen die compatibel zijn met andere op OpenUSD gebaseerde ruimtelijke computerplatforms zoals ARKit en RealityKit. Huang kondigde een breed scala aan frameworks, bronnen en diensten aan voor ontwikkelaars en bedrijven om de acceptatie van Universal Scene Description, bekend als OpenUSD , te versnellen , inclusief bijdragen zoals geospatiale datamodellen, metrische assemblage en simulatie-ready, of SimReady , specificaties voor OpenUSD. Huang kondigde ook vier nieuwe Omniverse Cloud API's aan, gebouwd door NVIDIA voor ontwikkelaars om OpenUSD-pijplijnen en -applicaties naadloos te implementeren en te implementeren.

  • ChatUSD — ChatUSD helpt ontwikkelaars en artiesten die werken met OpenUSD-gegevens en -scènes. ChatUSD is een large language model (LLM)-agent voor het genereren van Python-USD-codescripts uit tekst en het beantwoorden van USD-kennisvragen.
  • RunUSD - een cloud-API die OpenUSD-bestanden vertaalt naar gerenderde afbeeldingen met volledige pathtracing door de compatibiliteit van de geüploade bestanden te controleren met versies van OpenUSD-releases en door renders te genereren met Omniverse Cloud.
  • DeepSearch - een LLM-agent die snel semantisch zoeken mogelijk maakt door enorme databases met niet-gecodeerde activa.
  • USD-GDN Publisher — een service met één klik waarmee ondernemingen en softwaremakers high-fidelity, op OpenUSD gebaseerde ervaringen kunnen publiceren naar het Omniverse Cloud Graphics Delivery Network (GDN) vanuit een Omniverse-gebaseerde applicatie zoals USD Composer , evenals stream in realtime naar webbrowsers en mobiele apparaten.

Deze bijdragen zijn een evolutie van de aankondiging vorige week van NVIDIA's medeoprichter van de Alliance for OpenUSD samen met Pixar, Adobe, Apple en Autodesk.

Krachtige nieuwe desktopsystemen, servers

Door meer rekenkracht te bieden voor dit alles, kondigt Huang aan dat NVIDIA en wereldwijde fabrikanten van werkstations krachtige nieuwe RTX-werkstations aankondigen voor ontwikkeling en contentcreatie in het tijdperk van generatieve AI en digitalisering.

De systemen, waaronder die van BOXX, Dell Technologies, HP en Lenovo, zijn gebaseerd op NVIDIA RTX 6000 Ada Generation GPU's en bevatten NVIDIA AI Enterprise- en NVIDIA Omniverse Enterprise- software.

Los daarvan heeft NVIDIA drie nieuwe Ada Generation GPU's voor desktopwerkstations uitgebracht — de NVIDIA RTX 5000 , RTX 4500 en RTX 4000 — om de nieuwste AI, graphics en real-time renderingtechnologie te leveren aan professionals over de hele wereld.

Huang legde ook uit hoe NVIDIA, samen met wereldwijde fabrikanten van datacentersystemen, generatieve AI en industriële digitalisering blijft stimuleren met de nieuwe NVIDIA OVX met de nieuwe NVIDIA L40S GPU, een krachtig, universeel datacenterprocessorontwerp.

De krachtige nieuwe systemen versnellen de meest rekenintensieve, complexe toepassingen, waaronder AI-training en inferentie, 3D-ontwerp en -visualisatie, videoverwerking en industriële digitalisering met het NVIDIA Omniverse-platform.

NVIDIA-onderzoek brengt nieuwe mogelijkheden

Er komen meer innovaties aan, dankzij NVIDIA Research.

Tijdens het Real Time Live Event van de show zullen NVIDIA-onderzoekers een generatieve AI-workflow demonstreren die kunstenaars helpt om snel materialen voor 3D-scènes te creëren en te herhalen, met behulp van tekst- of beeldprompts om sneller en met fijnere creatieve controle materialen met aangepaste textuur te genereren.

En NVIDIA Research demonstreerde ook hoe AI videoconferenties naar een hoger niveau kan tillen met nieuwe 3D-functies. NVIDIA Research heeft onlangs een paper gepubliceerd waarin wordt aangetoond hoe AI een 3D-videoconferentiesysteem kan aandrijven met minimale opnameapparatuur.

De productieversie van Maxine, nu beschikbaar in NVIDIA Enterprise, stelt professionals, teams, makers en anderen in staat om gebruik te maken van de kracht van AI om audio- en video-effecten van hoge kwaliteit te creëren, zelfs met standaardmicrofoons en webcams.

Outpost24 17/12/2024 t/m 31/12/2024 BN + BW