Rozruch okolo GPT-5 od OpenAI: Kríza dôvery a lekcie o modelovaní AI
Oznámenie GPT-5 od OpenAI minulý týždeň malo byť triumfom, dôkazom, že spoločnosť je stále nepochybniteľným lídrom v oblasti umelej inteligencie. Cez víkend sa však ozvala vlna kritiky od zákazníkov, ktorá premenila toto uvedenie na verejnú krízu. Používatelia nariekali nad stratou svojich obľúbených modelov, ktoré im slúžili ako terapeuti, priateľa a romantickí partneri. Vývojári sa sťažovali na zhoršený výkon. Kritik Gary Marcus označil GPT-5 za „oneskorený, prehypovaný a nevýrazný“.
Mnohí poukazovali na nového „smerovača“ v reálnom čase, ktorý automaticky rozhoduje, ktorý z variantov GPT-5 sa má spustiť pre každú úlohu. Používatelia predpokladali, že GPT-5 je jeden model trénovaný od začiatku. V skutočnosti ide o sieť modelov, z ktorých niektoré sú slabšie a lacnejšie, iné silnejšie a drahšie, ktoré sú navzájom prepojené. Podľa odborníkov by tento prístup mohol predstavovať budúcnosť umelej inteligencie, keďže rozsiahle jazykové modely napredujú a sú náročnejšie na zdroje. Pri debute GPT-5 však OpenAI demonštrovala výzvy spojené s týmto prístupom a získala dôležité poznatky o tom, ako sa vyvíjajú očakávania používateľov v ére AI.
Mnohým používateľom GPT-5 sa nepáčila absencia kontroly, ktorú vnímali ako pokus OpenAI niečo zakryť. V reakcii na rozruch okolo GPT-5 OpenAI rýchlo vrátila hlavný predošlý model, GPT-4o, pre profesionálnych používateľov. Spoločnosť tiež uviedla, že opravila chybný smerovač, zvýšila limity používania a prisľúbila neustále aktualizácie na obnovenie dôvery a stability používateľov. Anand Chowdhary, spoluzakladateľ platformy predaja AI FirstQuadrant, zhrnul situáciu priamo: „Keď smerovanie funguje, je to ako mágia. Keď zlyhá, je to doslova pokazené.“
Sľub a nekonzistentnosť smerovania modelov
Jiaxuan You z University of Illinois Urbana-Champaign uviedol, že jeho laboratórium skúmalo sľub aj nekonzistentnosť smerovania modelov. V prípade GPT-5 sa domnieva, že smerovač niekedy posiela časti toho istého dotazu rôznym modelom. Lacnejší a rýchlejší model môže poskytnúť jednu odpoveď, zatiaľ čo pomalší model zameraný na odôvodňovanie poskytne inú. Keď systém tieto odpovede spojí, objavia sa jemné rozpory.
Myšlienka smerovania modelov je intuitívna, vysvetlil, ale „jej reálne fungovanie je veľmi náročné“. Zdokonalenie smerovača môže byť rovnako náročné ako budovanie odporúčacích systémov Amazonu, ktoré si vyžadujú roky a rozsiahle odborné znalosti. GPT-5 má rozsiahlejšie zdroje a smerovač by nemal produkovať nekonzistentné odpovede, aj keď vyberie menší model.
You verí, že smerovanie je tu na to, aby ostalo. Komunita tiež verí, že smerovanie modelov je sľubné, a to z technických a ekonomických dôvodov. Výkon jedného modelu zjavne dosahuje plató. Množstvo dát a výpočtovej sily už nevedú k lineárnemu zlepšovaniu. Kapacita jedného modelu sa v skutočnosti nasýti.
Z ekonomického hľadiska smerovanie umožňuje poskytovateľom AI používať staršie modely namiesto toho, aby ich vyhodili, keď sa uvedie nový model. Aktuálne udalosti si vyžadujú časté aktualizácie, ale statické fakty zostávajú presné roky. Smerovanie určitých dotazov na staršie modely zabraňuje plytvaniu obrovským množstvom času, výpočtovej sily a peňazí, ktoré sa už vynaložili na ich trénovanie.
Existujú aj ťažké fyzikálne limity. Pamäť GPU sa stala prekážkou pre trénovanie čoraz väčších modelov a technológia čipov sa blíži k maximálnej pamäti, ktorú je možné umiestniť na jeden čip. V praxi to znamená, že ďalší model nemôže byť desaťkrát väčší.
Staršia myšlienka, ktorá je teraz prehypovaná
William Falcon z Lightning AI poukazuje na to, že myšlienka používania súboru modelov nie je nová. Existuje už od roku 2018. Modely OpenAI sú „čierna skrinka“, takže s istotou nevieme ,či GPT-4 nepoužíval systém smerovania modelov. Dôležitejšie je, že uvedenie GPT-5 bolo silne prehypované vrátane systému smerovania modelov. Blogový príspevok predstavujúci model ho označil za „najinteligentnejší, najrýchlejší a najužitočnejší model s integrovaným myslením“. OpenAI potvrdila, že GPT-5 v rámci ChatGPT beží na systéme modelov koordinovaných smerovačom v zákulisí, ktorý prepína hlbšie odôvodňovanie, keď je to potrebné.
CEO OpenAI Sam Altman vyzdvihol smerovač modelov ako spôsob riešenia zložitosti modelov, z ktorých bolo ťažké vyberať. Tvrdil, že predchádzajúce rozhranie pre výber modelu bolo „veľmi mätúce“. Falcon povedal, že základný problém spočíva v tom, že GPT-5 nepôsobí ako výrazný skok vpred. Posuny od GPT-1 po 2, 3 a 4 boli masívne. Posun od 4 po 5 nebol viditeľne lepší. To je to, čo ľudí rozčuľuje.
Prispejú mnohé modely k AGI?
Debata o smerovaní modelov viedla niektorých k tomu, aby poukázali na súčasný humbuk okolo možnosti skorého vývoja umelej všeobecnej inteligencie (AGI). OpenAI AGI oficiálne definuje ako „vysoko autonómne systémy, ktoré prekonávajú ľudí vo väčšine ekonomicky hodnotných úloh“, ale Altman uviedol, že to „nie je super užitočný pojem“.
AI výskumník Aiden Chaoyang He kritizoval uvedenie GPT-5: „Čo s tou sľubovanou AGI? Aj silná spoločnosť ako OpenAI nemá schopnosť trénovať super rozsiahly model, čo ju núti uchýliť sa k smerovaču modelov v reálnom čase.“
Robert Nishihara z Anyscale tvrdí, že škálovanie v AI stále napreduje, ale myšlienka jedného všemocného AI modelu zostáva nepolapiteľná. Je ťažké vytvoriť jeden model, ktorý je najlepší vo všetkom. Preto GPT-5 v súčasnosti beží na sieti modelov prepojených smerovačom a nie na jednom monolitickom modeli.
OpenAI uviedla, že dúfa, že ich v budúcnosti zjednotí do jedného modelu, ale Nishihara poukazuje na to, že hybridné systémy majú reálne výhody: Je možné aktualizovať jeden komponent bez narušenia ostatných a získať väčšinu výhod bez nákladov a zložitosti preškolenia celého obrovského modelu. Výsledkom je, že Nishihara si myslí, že smerovanie tu zostane.
He súhlasí. V teórii platia zákony škálovania (viac dát a výpočtovej sily zlepšuje modely). V praxi sa vývoj bude pohybovať v „špirále“ medzi dvoma prístupmi: smerovaním špecializovaných modelov a pokusom o ich konsolidáciu do jedného. Rozhodujúcimi faktormi budú inžinierske náklady, výpočtové a energetické limity a obchodné tlaky.
Tiež je potrebné prispôsobiť naratív o prehypovanej AGI. Ak niekto urobí niečo, čo sa blíži k AGI, nie je isté, či to bude dosiahnuté jednou sadou váh (vnímané ako „mozog“ LLM). Ak ide o súbor modelov, ktorý sa prejavuje ako AGI, je to v poriadku.
Sharon Goldman



