OpenAI pole enam rahul Nvidia AI-kiipidega, eriti nende kiiruse osas, millega nad kasutajate küsimustele vastavad. Ettevõte hakkas juba eelmisel aastal teisi võimalusi otsima ning nüüd vestleb AMD-ga, Cerebrasiga ja isegi Groq’ga – enne seda, kui viimane lõpetati.
Selle pinge muutus tõeliseks, kui OpenAI mõistis, et Nvidia kiibid ei ole piisavalt kiired spetsiifiliste ülesannete jaoks, nagu näiteks koodi kirjutamine ja tarkvara-vaheliste ülesannete lahendamine.
Üks siseringi allikas väitis, et OpenAI soovib uusi kiipe, mis suudaks edaspidi katta vähemalt 10% sellest, mida ettevõte infereerimiseks vajab. Infereerimine on see osa, kus AI vastab kasutajate küsimustele, mitte see, kus ta õpib ja kogub andmeid.
Enamik OpenAI praegust tööd toimub endiselt Nvidia kiipidel, kuid kulisside taga testitakse kiipe, mis võivad kõike veelgi kiiremaks muuta.
Selle hulka kuuluvad SRAM-i täis pakitud kiibid, mis kiirendavad protsessoreid, paigutades mälu otse protsessori lähedale. Nvidia ja AMD kasutavad endiselt kiipi, mis asub kiibi väljaspool, mis aeglustab süsteemi tööd.
OpenAI-sse kuulujad viitasid Codexile, tarkvarale, mis kirjutab koodi, kui probleemile, kus aeglus oli kõige suurem. Mõned töötajad süüdistasid Nvidia riistvara nõrka jõudlust. 30. jaanuaril toimunud pressikonverentsil ütles OpenAI tegevjuht Sam Altman: “Meie koodimudeleid kasutavad kliendid panustavad koodimise kiirusele väga suuresti.”
Sam lisas, et tavapärased ChatGPT kasutajad ei pea kiirust nii oluliseks, kuid arendajate ja ettevõtete jaoks loeb iga sekund. Ta sõnas, et OpenAI oli just sõlminud lepingu Cerebrasiga, et aidata kiirendada süsteeme.
Samas saavad ettevõtted nagu Anthropic ja Google oma kiipide abil paremaid tulemusi. Google’i TPU-d on loodud just sellisteks infereerimisülesanneteks, mis muudavad need vastamiskiiremateks, eriti mudelite Claude ja Gemini puhul.
OpenAI vestles ka Groq’ga, teise startupiga, kes arendab kiireid kiipe, kuid need läbirääkimised ei jõudnud kaugemale. Nvidia astus sisse ja sõlmis Groq’ga 20 miljardi dollari suuruse litsentsilepingu. See andis Nvidia-le juurdepääsu Groq’ projekteerimisele ja lõpetas OpenAI plaanid koostööd nendega jätkata.
Situatsioonile lähedal olev allikas ütles, et Groq’ kiibid olid loodud just selleks, mida OpenAI vajas. Kuid kui Nvidia lepingu lõplikult sõlmis, sulgus see uks. Kuigi litsents ei olnud eksklusiivne, keskendub Groq nüüd pilvepõhistele tarkvaradele ja Nvidia võttis osa Groq’ kiipide disaineritest enda juurde.
Cerebras aga ütles Nvidia pakkumisele „ei“ ja sõlmis hoopis oma lepingu OpenAI-ga. Groq sai samuti investeeringupakkumisi, mis hindasid ettevõtte väärtust umbes 14 miljardile dollarile, kuid nüüd on see muutunud, kuna Groq on Nvidia-ga seotud.
OpenAI pole Nvidia-st täielikult loobunud. Avalikus avalduses ütles pressiesindaja: “Me usaldame Nvidia’t, et toita enamikku meie infereerimisflotist,” ning nimetas nende jõudlust dollarit kohta turu parimaks. Nvidia ütles samuti: “Kliendid valivad infereerimiseks jätkuvalt Nvidia’d, sest me pakume suuremahuliselt parimat jõudlust ja kogukulu.”
Eelmisel aastal teatas Nvidia, et plaanib investeerida kuni 100 miljardit dollarit OpenAI-sse. Selle raha eesmärk oli aidata OpenAI-l osta arenenumaid kiipe, ja vastutasuks saaks Nvidia ettevõttes osaluse. Reuters teatas, et lepingu pidanuks lõppema mõne nädala jooksul. See pole siiani toimunud.
Kuigi see leping seisakus, sõlmis OpenAI edasi lepinguid AMD-ga ja teistega, et testida kiipe, mis võiksid olla konkurentsis otse Nvidia kiipidega. Kuid kui OpenAI oma tooteplaane muutis, muutus ka nende jaoks vajalik riistvara. See aeglustas vestlusi veelgi, ütles situatsiooniga kursis olev inimene.
Laupäeval küsiti Nvidia tegevjuhilt Jensen Huangilt sellest hõõrumisest. Ta ütles: “See on rumalus,” ja rõhutas, et Nvidia plaanib endiselt suurelt investeerida OpenAI-sse. Kuid kulisside taga on selge, et mõlemad pooled uurivad oma võimalusi.
Samas on Nvidia otsinud uusi kiipide ideid. Nad pöördusid nii Cerebras kui Groq poole, et vaadata, kas nood oleksid avatud ostule. Cerebras keeldus ja panustas rohkem oma lepingule OpenAI-ga.
Hetkel kasutab OpenAI enamikku oma teenuseid GPT4o abil. Kuid nii, nagu asjad liiguvad, hakkab vähemalt osa sellest tööst lähitulevikus töötama AMD või Cerebras’i kiipidel. Ettevõte ei püüa Nvidia-st täielikult loobuda, kuid on selge, et nad soovivad rohkem kontrolli oma süsteemide kiiruse üle.
Täpsustage oma strateegiat mentorluse ja igapäevaste ideede abil – 30 päeva tasuta juurdepääsu meie kauplemisprogrammile


