TLDR: TurboQuant vähendab AI KV-vahemälu mahtu kuni viis korda, mõjutamata oluliselt mudeli kvaliteeti. Uuendus võimaldab sülearvutitel ja telefonidel pikemat aega kasutada AI-dTLDR: TurboQuant vähendab AI KV-vahemälu mahtu kuni viis korda, mõjutamata oluliselt mudeli kvaliteeti. Uuendus võimaldab sülearvutitel ja telefonidel pikemat aega kasutada AI-d

Tether toob Google’i TurboQuant tootmisesse, avades pika kontekstiga tehisintellekti igapäevastele seadmetele

2026/06/02 07:46
3 minutiline lugemine
Selle sisu kohta tagasiside või murede korral võtke meiega ühendust aadressil crypto.news@mexc.com

Kokkuvõte:

  • TurboQuant vähendab AI KV-vahemälu mahtu kuni viis korda, mõjutades mudeli kvaliteeti minimaalselt.
  • Uuendus võimaldab sülearvutitel ja telefonidel käivitada pikemaid AI-seansse ilma pilveteenustele toetumiseta.
  • QVAC SDK 0.12.0 integreerib TurboQuanti Fabric’i, laiendades kohalikku AI-arenduse võimalusi.
  • Tether soovib edendada privaatsuskeskset AI-d, viies tõhusa järeldamise lähemale lõppkasutajatele.

Tetheri AI-uuringute rühm on avaldanud TurboQuanti avatud lähtekoodiga tootmisversiooni – meeldejäävuse kokkusurumise algoritmi, mille alguse sai Google Research.

See versioon kuulub QVAC SDK 0.12.0 koosseisu ja on mõeldud sülearvutitele, telefonidele, äärerakendustele ja hajutatud võrkudele. See võimaldab kohalikel AI-mudelitel käivitada pikemaid seansse ilma pilviinfrastruktuuri kasutamiseta.

See tähistab praktilist nihet selle suhtes, kuidas seadmesisene AI haldab mälukirjeldavaid ülesandeid.

TurboQuant vähendab AI-mälu kuni viis korda

Mälu on pikka aega olnud takistuseks võimsate AI-mudelite käivitamisel tarbijaseadmetel. Kui AI-assistent töötleb pikkade dokumentide või vestluste konteksti, salvestatakse see kontekst nii nimetatud KV-vahemällu.

Ligikaudu 262 000 tokeni puhul võib 4B mudeli KV-vahemälu üksnes selle jaoks kasutada umbes 8 GB mälu. Neli samaaegset seanssi võivad selle arvu tõsta 32 GB-ni enne iseenesest mudeli mäluarvestust.

TurboQuant lahendab selle probleemi, vähendades KV-vahemälu kuni viis korda, säilitades samas väljundkvaliteedi peaaegu sama tasemel nagu tavalise (komprimeerimata) mudeli puhul.

Nüüd saab kasutaja küsida sülearvutis töötavalt assistendilt, et see analüüskiks saja leheküljelist õigusdokumenti ilma selle üleslaadimata kaugserverisse.

Üliõpilased, arendajad, ajakirjanikud ja teadlased saavad kõik kasu pikematest ning kontekstirikkamatetest AI-seanssidest oma juba olemasolevates seadmetes.

Kommenteerides laiemat põhjust, miks seda versiooni avaldati, viitas Tetheri tegevjuht Paolo Ardoino uurimuse ja praktilise tarkvara vahelisele lünkle.

Google’i uuring näitas, et AI-mälu saab kokkusuruda palju tõhusamalt, kui enamik inimesi eeldasid,“ ütles ta. „Meie töö viib selle lähenemise tootmisversioonis tarkvarasse, millega saavad tegelikult töötada arendajad, start-up’id ja kasutajad.“

Tootmisversioon sisaldab täielikku kvantiseerimisvoogu, raamistiku adaptereid, arendajate dokumentatsiooni ja koormusel optimeeritud profiile.

Need komponendid on disainitud reaalseteks keskkondadeks väljaspool hüpermahukaid andmekeskusi, hõlmates piiratud mälu, segatud riistvara ja latentsusele tundlikke deploy-minguid.

QVAC SDK 0.12.0 laiendab kohalikku AI-arenduse võimalusi

TurboQuant on kaasatud QVAC SDK 0.12.0 koosseisu ja integreeritud otse Fabric’i – QVAC-i põhikomponenti.

Fabric sai alguse llama.cpp fork’ist ja on alates sellest kasvanud, hõlmates mitmeid uuringute edusamme. SDK pakub arendajatele ühtset tööriistade, teegite ja käitusaja komponentide komplekti kohalike AI-rakenduste loomiseks.

Start-up’ide ja iseseisvate arendajate jaoks eemaldab see eelduse, et suured AI-tooted nõuavad kalliste GPU-klastrite kasutamist.

Tiimid saavad nüüd disainida pikemaid kontekstiaknasid, suuremaid failikoormusi ja paindlikumat deploy-mingut tarbijaseadmete ja äärerakenduste jaoks. See avab praktilised teejuhised AI-toodete loomiseks ilma ainult pilvitehnoloogia tugita arhitektuurita.

Ardoino käsitleses andmete privaatsuse ja pilveteenuste sõltuvuse küsimusi, rõhutas ta AI-ülesannete hoidmist kohalikes seadmetes.

Inimestel peaks olema võimalik paluda AI-assistendilt pika dokumendi lugemist või privaatse teabe töötlemist ilma selleta, et iga ülesanne läheks läbi kaugandmekeskuse,“ ütles ta. Selles mõttes annab TurboQuant kohalikule AI-le rohkem operatsioonilist ruumi.

Tetheri strateegia keskendub AI-le, mis töötab lähemal kasutajatele – nii personaalse seadme kui ka hajutatud võrgu tasandil. Ettevõte peab tarkvara tõhusust ja ülekantavust järgmise AI-arenguetapi määravateks teguriteks koos suurtõulistatud arvutusinfrastruktuuriga.

The post Tether Brings Google’s TurboQuant to Production, Unlocking Long-Context AI on Everyday Devices appeared first on Blockonomi.

Turuvõimalus
Gensyn logo
Gensyn hind(AI)
$0.0299
$0.0299$0.0299
-6.99%
USD
Gensyn (AI) reaalajas hinnagraafik

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Register for a chance to win a free lucky draw

Lahtiütlus: Sellel saidil taasavaldatud artiklid pärinevad avalikelt platvormidelt ja on esitatud ainult informatiivsel eesmärgil. Need ei kajasta tingimata MEXC seisukohti. Kõik õigused jäävad algsetele autoritele. Kui arvate, et sisu rikub kolmandate isikute õigusi, võtke selle eemaldamiseks ühendust aadressil crypto.news@mexc.com. MEXC ei garanteeri sisu täpsust, täielikkust ega ajakohasust ega vastuta esitatud teabe põhjal võetud meetmete eest. Sisu ei ole finants-, õigus- ega muu professionaalne nõuanne ega seda tohiks pidada MEXC soovituseks ega toetuseks.

RealStocks Now Live

RealStocks Now LiveRealStocks Now Live

Trade real U.S. stock via regulated brokerage