NVIDIA on välja andnud oma uusimad GB300 NVL72 süsteemid. Need suudavad töötada 50 korda efektiivsemalt ühe megavati elektrienergia kohta võrreldes vanema Hopperi platvormiga. See tähendab, et iga töödeldud infokillu kohta langevad kulud lausa 35 korda.
Signal65 viis GB200 NVL72-süsteemi eraldi testid läbi ja leidis, et see töötleb ühe vatti kohta enam kui 10 korda rohkem teavet, vähendades kulud kümnekordselt võrreldes varasematega.
Parandused jätkuvad pidevalt. NVIDIA TensorRT-LLM-i raamatukogu uuendused andsid GB200-le ainuüksi nelja kuuga viiekordse jõudluse tõusu ülesannetes, mis nõuavad kiiret reageerimist. Dynamo, Mooncake ja SGLang tööriistade kallal töötavad meeskonnad pingutavad veelgi suurema efektiivsuse saavutamise nimel.
Need AI-tööriistad ei toimi korralikult, kui tekib latentsust või kui nad ei suuda piisavalt konteksti meeles pidada. Ettevõtted vajavad neid, et need päris äriolukordades ka tegelikult toimiks, mitte lihtsalt demo-versioonides.
Ajaveebide ja digitaalsete abiliste kirjutatud koodi ning muude digitaalsete abivahenditega seotud AI-tööriistad moodustavad nüüd ligi pool kõigist AI-teemalistest otsingutest, kasvades aastaga 11% pealt 44%ni.
Numbrid pärinevad OpenRouter’i „Inference State“ raportist ja näitavad, kui kiirelt see valdkond areneb.
Selle järsk hüpe on sundinud ettevõtteid kiirustama, et ehitada riistvara, mis suudaks sammu pidada. Need AI-assistentid peavad reageerima kohe ja meeles pidama konteksti terveid tarkvaraprojekte, mis seab arvutusvõimsusele tõsised nõudmised.
Turul puhkeb eksploditsioon – tehnikagigantide võitlus valitsemise eest
Raha, mida sellesse investeeritakse, on tohutu. AI-agentide turu väärtus oli 2024. aastal 4,92 miljardit dollarit. Hinnangute kohaselt kasvab see 2025. aastaks 6,016 miljardi dollarini ja ulatub 2035. aastaks 44,97 miljardi dollarini. Järgmise kümnendi jooksul on aastane kasv 22,28%. Pankadest, haiglatest, kauplustest ja tehastest on esimesed, kes seda tehnoloogiat kasutama hakkavad.
Äriühingud paigaldavad neid agente kliendihaldussüsteemidesse, planeerimisriistadesse ja turvaseadistustesse, et kokku hoida raha ja rohkem asju ära teha. See, mis alguses oli valikuliselt kasutatav tehnoloogia, on muutumas baastaristiks.
Cryptopolitan’i teatel käivitas Alibaba just Qwen3.5, kes on suunatud Hiina turule, väites, et selle töötlemiskulud on 60% madalamad kui varem. Mudel suudab vaadata ekraane ja teha ülesandeid nii telefonides kui arvutites. See astub otse vastu ByteDance’i Doubao rakendusele ja lähiajal on oodata ka DeepSeek uuendust.
OpenAI palkas 15. kuupäeval Peter Steinbergeri. Ta on loonud OpenClaw’i, avatud koodiga AI-agenti. Tegevjuht Sam Altman ütles, et Steinberger juhib järgmise põlvkonna isiklike agentide arendust ja nimetas teda geniaalseks inimeseks, kellel on suurepärased ideed nutikate assistentide kohta, mis suudavad kasulikke ülesandeid edukalt täita.
Talentikriis, mida keegi ei suuda lahendada
94% ärijuhtidest ütleb, et neil napib AI-oskusi. 2028. aastaks ootab 44% ettevõtteid endiselt 20–40% suurust oskuste puudujääki. Workera hinnangul võivad sellised kitsaskohad 2026. aastal maailmamajandusele maksta 5,5 triljoni dollarit hilinenud toodete, kvaliteediprobleemide ja kaotatud müügikäibe tõttu.
Hetkel ületab AI-talendile esitatud nõudlus pakkumist ülemaailmselt 3,2:1. AI-töökohtade palk on 67% kõrgem kui tavapäraste tarkvaraosakondade töökohtade palk. Ometi õpivad 85% büroo töötajaid sellest tehnoloogiast oma vabal ajal ja 83% ütlevad, et õpivad enamasti ise, mitte ei saa ametlikku koolitust.
Kui ettevõtted ostavad spetsialiseeritud tarnijatelt AI-tööriistu, õnnestuvad nad 67% juhtudel. Sisemised lahendused töötavad vaid umbes kolmandikul juhtudest.
Salesforce nägi 2025. aasta alguses 119% agentide kasvu ja ületas nende toodete püsivaru 500 miljoni dollari piiri. Kolme kuuga lisandus neile 6000 ettevõtte klienti.
Äriühingud ostavad tõenäoliselt lahendusi, mitte ei ehitata neid ise. See viitab turu kontsentreerumisele mõne suure mängija ümber, kes suudavad pakkuda just seda, mis tegelikult töötab.
Allikas: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/








