Umelou inteligenciou generované hlasy teraz napodobňujú ľudí tak presvedčivo, že ich detekcia je takmer nemožná.
Vytvorenie presvedčivého hlasového klonu teraz trvá len niekoľko minút a vyžaduje minimálne odborné znalosti.
Niektoré syntetické hlasy boli v skutočnosti hodnotené ako dôveryhodnejšie než skutočné ľudské nahrávky.
Po celé roky sa mnohí ľudia domnievali, že reč generovanú umelou inteligenciou možno vždy identifikovať podľa jej mierne „falošných“ kvalít.
Nový výskum z Queen Mary University of London spochybňuje tento predpoklad a ukazuje, že súčasná technológia hlasu umelej inteligencie dosiahla úroveň, kde sú „hlasové klony“ a deepfakes takmer nerozoznateľné od skutočných nahrávok.
V štúdii účastníci porovnávali ľudské hlasy s dvoma formami syntetického zvuku: klonovanými hlasmi navrhnutými na napodobňovanie skutočných rečníkov a hlasmi generovanými systémom rozsiahlych jazykových modelov bez špecifických náprotivkov.
Poslucháči mali často problém rozlíšiť medzi týmito dvoma, čo naznačuje, že technológia vstúpila do fázy, kde už ľudská realita nie je len ašpiráciou, ale realitou.
Výskumný tím skúmal nielen to, či účastníci dokážu rozlíšiť medzi syntetickými a skutočnými hlasmi, ale aj to, ako ich vnímali.
Prekvapivo, oba typy hlasov generovaných AI boli hodnotené ako dominantnejšie než ľudské a v niektorých prípadoch boli považované za dôveryhodnejšie.
Dr. Nadine Lavan, odborná asistentka psychológie na Queen Mary University of London, zdôraznila, ako ľahko a lacno jej tím vytvoril tieto hlasové klony.
„Hlasy generované umelou inteligenciou sú teraz všade okolo nás, bolo len otázkou času, kým technológia AI začne produkovať naturalistickú, ľudsky znejúcu reč, proces si vyžadoval minimálne odborné znalosti, len niekoľko minút hlasových nahrávok a takmer žiadne peniaze,“ povedala.
Tvrdí, že jednoduchosť použitia ukazuje, ako ďaleko pokročila technológia v krátkom čase.
Takáto dostupnosť vytvára príležitosti v oblastiach, ako je vzdelávanie, komunikácia a prístupnosť, kde by prispôsobené syntetické hlasy mohli zlepšiť zapojenie a dosah.
Rovnako ako autori AI vyvolávajú otázky o originalite, autorských právach a zneužití, generovanie hlasu AI vyvoláva debaty o vlastníctve identity a súhlasu.
Ak je možné vytvoriť realistický zvuk len z krátkej ukážky, riziká neoprávneného klonovania nemožno ignorovať.
Keďže nástroje AI sa neustále rozširujú v schopnostiach a dostupnosti, výzvou bude zabezpečiť, aby sa využili výhody bez toho, aby sa otvorili nové cesty k podvodom.
Pochopenie toho, ako ľudia reagujú na tieto hlasy, je len prvým krokom pri riešení etických, právnych a sociálnych dôsledkov technológie, ktorá už nie je futuristická, ale pevne prítomná.