NVIDIA ondersteunt nieuwe Oracle Cloud Infrastructure Compute instances
Oracle heeft de aankomende beschikbaarheid aangekondigd voor nieuwe Oracle Cloud Infrastructure (OCI) Compute- instances, mogelijk gemaakt door NVIDIA H100 Tensor Core GPU's , NVIDIA L40S GPU's en Ampere AmpereOne CPU's.

De nieuwe OCI Compute-instances zijn ontworpen om het uitvoeren van een verscheidenheid aan workloads – van training, verfijning en AI-modelinferentie tot het uitvoeren van cloud-native applicaties en video-transcoderingsapplicaties – in de cloud toegankelijker te maken voor organisaties en tegelijkertijd een betere prijs-prestatieverhouding te bieden. .
De komende OCI Compute-instances op basis van de volgende generatie NVIDIA GPU's omvatten:
OCI Compute Bare Metal Instances aangedreven door NVIDIA H100 GPU's: Kan klanten helpen de tijd te verkorten die nodig is om grote AI-modellen te trainen, zoals modellen die natuurlijke taalverwerking en aanbevelingssystemen aandrijven. Organisaties die NVIDIA H100 Tensor Core GPU's gebruiken, hebben een prestatieverbetering van maar liefst 30x gezien voor AI-inferentiegebruiksscenario's en 4x betere AI-modellen voor prestatietraining vergeleken met het gebruik van de vorige generatie NVIDIA A100 Tensor Core GPU's. Voor klanten met intensieve computerworkloads, zoals AI-modeltraining, OCI Superclusterstelt hen in staat tienduizenden NVIDIA H100 GPU's aan te sluiten via een krachtig clusternetwerk met ultralage latentie. Het is de bedoeling dat deze instances later dit jaar algemeen beschikbaar zullen zijn in de Oracle Cloud London Region en Oracle Cloud Chicago Region, terwijl andere naar verwachting zullen volgen.
OCI Compute Bare Metal Instances aangedreven door NVIDIA L40S GPU's: Biedt klanten een alternatieve optie voor workloads zoals AI-inferenties of het trainen van kleine tot middelgrote AI-modellen. Deze instances zijn getest om tot 20% prestatieverbetering te leveren voor generatieve AI-workloads en tot 70% verbetering in het afstemmen van modellen ten opzichte van de vorige generatie NVIDIA A100 GPU's. De exemplaren zullen naar verwachting volgend jaar beschikbaar zijn.
De komende OCI Compute Instances op basis van Ampere Computing CPU's omvatten:
OCI Compute A2-instances aangedreven door Ampere AmpereOne CPU's: Er wordt verwacht dat ze prijs-prestatieverhoudingen en het hoogst beschikbare aantal processorcores in de sector zullen leveren (320 cores in de bare metal-vorm en maximaal 156 cores in de flexibele VM-vorm) om een verscheidenheid aan algemene cloud-workloads aan te drijven, waaronder running web servers, het transcoderen van video en het afhandelen van CPU-gebaseerde AI-inferentieverzoeken. Het hoge aantal cores dat in deze instances beschikbaar is, kan hogere prestatieniveaus, virtuele machinedichtheid en schaling ondersteunen, zodat klanten hun computerwerklasten efficiënter kunnen beheren en tegelijkertijd de voetafdruk van het datacenter en het energieverbruik kunnen verminderen. Deze instanties kunnen ook flexibele vormen voor virtuele machines uitvoeren om klanten gedetailleerde opties te bieden voor de hoeveelheid verwerkingskracht en geheugen om het gebruik van bronnen te helpen maximaliseren en de kosten te minimaliseren, terwijl ze een eenvoudig en voorspelbaar prijsmodel bieden. Deze exemplaren zullen naar verwachting volgend jaar verschijnen.