Spoločnosť OpenAI v septembri ruší štandardný hlasový režim ChatGPT. K dispozícii bude iba rýchlejší a expresívnejší pokročilý hlasový režim. Mnohí používatelia sú z tejto zmeny rozladení a preferujú zvuk a prístup hlasu, ktorý OpenAI odstraňuje.
Hlas, ktorý si ľudia spojili s ChatGPT, sa k 9. septembru končí a nie všetci sú z toho nadšení. Hlas „Štandard“ ChatGPT zmizne a nahradí ho možnosť „Pokročilý“ hlas, ktorý bol minulý rok prvýkrát sprístupnený obmedzenému výberu používateľov ChatGPT. Prejde rebranding na jednoduchý názov „Hlas ChatGPT“ a bude to jediná možnosť.
Pôvodný „Štandardný“ hlasový režim debutoval v roku 2023 a bol postavený na jednoduchej línii: hovoríte, servery OpenAI prepíšu váš vstup, vygenerujú odpoveď pomocou modelu GPT a potom ju prečítajú pomocou relatívne neutrálneho syntetického hlasu.
Pokročilý hlasový režim ChatGPT je navrhnutý tak, aby reagoval rýchlejšie, mal ľudskejší tón a spôsob reči a vo všeobecnosti fungoval na vyššej úrovni ako jeho predchodca. Napriek tomu si veľa ľudí myslí, že je to chyba.
„Štandardný hlas ponúka teplo, hĺbku a prirodzené spojenie, ktorému sa pokročilý hlas jednoducho nevyrovná,“ napísal jeden používateľ na fóre OpenAI. „Pokročilý hlas pôsobí roboticky a odmerane, chýba mu oduševnený a chápavý tón, ktorý si cením.“
Viac ako jedna osoba opísala nový hlas ako menej pútavý na rozhovor. Objavili sa tiež sťažnosti, že nový model hovorí príliš rýchlo, ako keby sa snažil interakciu rýchlo ukončiť.
„Štandardný hlas je premyslený a má hlas a kadenciu, ktoré sú prirodzené a upokojujúce,“ napísal používateľ Redditu. „Pokročilý hlas nemá rovnaké vlastnosti, neposkytuje premyslené odpovede, má obmedzujúce obsahové limity a vždy znie, akoby sa snažil prehnať priemernú odpoveď.“
Aj keď vám nevadí, ako nový hlas znie, niektorí používatelia ChatGPT sú nahnevaní, pretože zistili, že nefunguje ani rovnako ako predošlý hlas.
Pokročilý hlasový režim integruje váš hlas, odpovede AI a jej hlasový prejav do jedného procesu v reálnom čase. Integrovaný proces znamená, že AI necituje písomnú odpoveď doslovne. Namiesto toho vyjadruje myšlienky konverzačnejšie, niekedy vynecháva frázy, zhusťuje vety alebo upravuje tón na základe kontextu. Technicky pôsobivé, ale nie to, čo niektorí používatelia ChatGPT chcú.
„Štandardný hlas by doslova prečítal presnú odpoveď, ktorú by vám ChatGPT normálne dal. Bola to priama línia, viete?“ píše sa v jednom príspevku na Reddite. „Ale tento nový? Znie to, akoby to parafrázoval alebo zhrnul. Vynecháva malé detaily a spôsobuje, že sa celá konverzácia zdá oveľa viac odpojená.“
To sa môže zdať v kontexte pokroku AI ako maličkosť, ale odráža to širší trend v technológiách, kde sú ľudia rozrušení, keď dôjde k veľkej zmene, aj keď je to zdanlivo vylepšenie.
Samozrejme, nie každému sa nová možnosť hlasu nepáči. Niektorým sa páči jeho realizmus a rýchlosť a to, ako prispieva k plynulejšej konverzácii. OpenAI sľúbila aj ďalšie vylepšenia. Ale vzhľadom na to, že sťažnosti na odstránenie GPT-4o, keď debutoval GPT-5, viedli k návratu staršieho modelu, nebol by som veľmi prekvapený, keby sa Štadardný hlasový režim tiež vrátil.
erichs211@gmail.com (Eric Hal Schwartz)