Počítače budou brzy schopny dokonale napodobit náš hlas


Jde o deepfake, který by mohl mít pozitivní vedlejší účinky: případ Kilmer. Jak se počítače naučí mluvit naším hlasem.

Schopnost klonovat vlastní hlas bude v budoucnu stále dostupnější. Společnosti, které tuto službu nabízejí, pracují také na přesnosti výsledku: zapomeňte na elektronické hlasy, na které jsme zvyklí, budoucí umělá mluva bude stále více k nerozeznání od "syntetizovaného" hlasu člověka.

Vytvoření vlastního hlasu na počítači: jak to uděláme

Funguje to následovně: pro naklonování vlastního hlasu se přečte scénář a počítač jej nahraje. Někdy se budete muset vrátit a zopakovat některé řádky textu, abyste nahradili mumlání nebo zvuky, které nejsou dokonale naskenovány. Celý proces zabere pouhých 30 minut a několik hodin zpracování v softwaru. Pak bude připraven váš vlastní hlas, který pak počítač může reprodukovat, třeba tak, že "přečte" řádky v chatech, které jsme sami napsali.

Jedná se o děsivou technologii, stejně děsivou jako cokoli, co přibližuje schopnosti strojů schopnostem lidí: kritičnost takových aplikací umělé inteligence se snad ukáže jako první. Je to po všech stránkách deepfake, který se však rozvíjí pouze po zvukové stránce. Deepfakes jsou ve skutečnosti definovány jako syntetická média, v nichž je osoba na obrázku nebo videu uměle nahrazena nebo naklonována, zkrátka zfalšovaný obsah a případně falešné zprávy, které využívají inovativní techniky strojového učení a umělé inteligence.


Dva příklady: případ Bourdaina a Kilmera

Například výběr autorů dokumentu Roadrunner: A Film About Anthony Bourdain, věnovaného kuchaři, který zemřel sebevraždou, nezapomněl vzbudit kontroverze. Při této příležitosti byly některé repliky napsané rukou americké celebrity převedeny do hlasového projevu pomocí softwaru pro syntézu hlasu. Reakce veřejnosti na Vala Kilmera byla zcela opačná: herec měl v roce 2014 poškozený hlas po tracheotomii, kterou podstoupil kvůli rakovině krku. Díky zásahu softwaru podobnému výše popsanému může nyní Val Kilmer používat velmi účinnou elektronickou verzi svého hlasu. To ukazuje, že kontroverzní technologie syntézy řeči může mít i aplikace, které jsou široce vnímány jako pozitivní.

Giuseppe Giordano