Co je to hluboké učení a jak se používá

Používání Siri nebo jiného hlasového asistenta se v dnešní době stalo součástí našeho každodenního života, abychom mohli snadno a rychle provádět různé úkoly. Ne každý však ví, že když využíváme potenciál těchto nástrojů, blížíme se vlastně k hlubokému učení. Tento termín, který se v našem jazyce označuje jako hluboké učení, někteří jej nazývají hierarchickým učením a který je dvojím způsobem spjat s pojmem strojové učení a obecněji s pojmem umělá inteligence, neboli AI, z anglického Artificial Intelligence. Pokud je strojové učení specifickým odvětvím umělé inteligence, pak technologie, kterou se zabýváme v této příručce, je její podmnožinou a je základem něčeho mnohem širšího než prostého víceúrovňového strojového učení. Z toho vyplývá, jak jsme si již řekli, že aplikací je nespočet a ty hlavní přirozeně společně objevíme v následujících odstavcích.


Definice hlubokého učení

Technická definice hlubokého učení neboli deep learning je definice třídy algoritmů automatického učení, tedy výzkumné oblasti strojového učení, již zmíněného strojového učení, a umělé inteligence, která je založena na různých úrovních reprezentace, odpovídajících hierarchiím vlastností faktorů nebo konceptů, přičemž koncepty vysoké úrovně jsou definovány na základě konceptů nízké úrovně. Definice Observatoře umělé inteligence na Politecnico di Milano je pro neodborníky ještě srozumitelnější: hluboké učení je ve skutečnosti popsáno jako soubor technik založených na umělých neuronových sítích uspořádaných do různých vrstev, přičemž každá vrstva vypočítává hodnoty pro další vrstvu, takže informace jsou zpracovávány stále úplněji.

Není tedy náhodou, že mezi architekturami hlubokého učení se obvykle uvádějí hluboké neuronové sítě, konvoluce hlubokých neuronových sítí, hluboké sítě víry a rekurzivní neuronové sítě. Všechny představují přístup, podle něhož učení probíhá díky datům získaným pomocí algoritmů, především statistických výpočtů.

Jistě jste tedy pochopili, že velké množství dat zpracovávaných neuronovými sítěmi probíhá "cestou" velmi podobnou té, která se odehrává v lidském mozku, což inspiruje fungování stejných umělých sítí. Hlubokému učení se věnuje řada výzkumníků a vědců, například Andrew Yan-Tak Ng, zakladatel Google Brain, Ian J. Goodfellow, kterého bostonský MIT označil za jednoho z nejlepších světových inovátorů mladších 35 let, Yoshua Bengio, Ilya Sutskever a Geoffrey Everest Hinton, jedna z klíčových postav umělé inteligence.

Právě jejich přínos nám nyní umožňuje definovat hluboké učení jako systém, který využívá třídu algoritmů strojového učení, které především využívají různé úrovně kaskádových nelineárních jednotek k provádění úloh extrakce a transformace příznaků, přičemž každá následující úroveň využívá jako vstup výstup předchozí úrovně. Algoritmy se pak spoléhají na tzv. neřízené učení více hierarchických úrovní datových rysů, které vytvářejí hierarchickou reprezentaci. A nejen to, díky tomu, jak jsou navrženy, se učí více úrovní reprezentace, které odpovídají různým úrovním abstrakce, a vytvářejí tak hierarchii pojmů.

O hlubokém učení se začalo mluvit až kolem roku 2000. V poměrně krátké době se však jeho využití díky technologickému pokroku a stále dokonalejším neuronovým sítím rozšířilo jako blesk. První studie o vícevrstvých neuronových sítích vypracoval a publikoval japonský vědec Kunihiko Fukushima, který v roce 1975 vyvinul model kognitronu a následně neokognitronu. Tentýž vědec představil myšlenku oblasti spojení neuronů, která se vyvinula v konvoluční neuronové sítě.

V 80. letech pokračovala analýza vícevrstvých umělých neuronových sítí rozhodnějším způsobem, ale teprve v posledním desetiletí, zejména díky nástupu velkých dat a překonání některých omezení, ukazují veškerý svůj potenciál v nejrůznějších odvětvích. Systémy hlubokého učení dnes kromě mnoha jiných užitečných funkcí umožňují například identifikaci objektů na obrázcích a videích, přepis řeči do textu nebo identifikaci a interpretaci zájmů uživatelů internetu, a tím vracení výsledků vyhledávání bližších jejich specifickým potřebám.

Jak funguje hluboké učení

Jak bylo vysvětleno v předchozím odstavci příručky, hluboké učení zakládá celé své fungování na klasifikaci a postupném výběru nejrelevantnějších dat s cílem dosáhnout co nejoptimálnějšího závěru. Fungování, které se řídí fungováním našeho biologického mozku, ať už jde o formulaci správné odpovědi na otázku, nebo o řešení konkrétního problému, či dokonce o vyvození logické hypotézy. Někteří z vás si možná vzpomenou na slavný případ AlphaGo, softwaru, který v roce 2016 s několikaletým předstihem porazil mistra světa ve hře Go.

Hluboké učení se tedy chová stejně jako lidské uvažování, ale využívá umělé neuronové sítě, o kterých jsme mluvili, tedy matematicko-výpočetní modely založené na fungování biologických neuronových sítí, které jsou zase tvořeny informačními propojeními. Neuronová síť je vlastně systém adaptivního typu: může měnit svou strukturu, tvořenou uzly a relativními propojeními, na základě vnějších i vnitřních dat, která se pak ve fázi učení a uvažování propojují a kříží.

Učení je pak jak automatického, tak "hlubokého" typu, přičemž slovem hluboké myslíme na více úrovních. Tento druh učení se ukázal být rozhodně výkonnější než předchozí technologie umělé inteligence, a to natolik, že nedávno přitáhl nebývalou pozornost médií. A nevyhnutelně také vědeckou a ekonomickou pozornost. O omezení není nouze, ale hluboké učení lze rozhodně označit za kvalitní výsledek, který má odpovídající obrovskou výhodu při učení se řešení složitých problémů rozpoznávání vzorů. Ačkoli požadavek na obrovskou výpočetní kapacitu může být omezením, škálovatelnost hlubokého učení s rostoucím množstvím dostupných dat a algoritmů je to, co jej odlišuje od strojového učení.

První z nich zlepšuje svůj výkon s rostoucím množstvím dat, zatímco druhé není schopno zdokonalit svůj výkon, jakmile dosáhne určité úrovně. Složitá neuronová síť se totiž samostatně učí, jak analyzovat surová data a jak provádět určitý úkol. Počítač se tak po počáteční tréninkové fázi dokáže "učit sám", bez lidských pokynů. Konečným cílem je úspora času a zdrojů, zejména u rutinních prací, které jsou prováděny mnohem efektivněji a rychleji než jakýkoli člověk, bez jakéhokoli úsilí a při zachování prakticky konstantní úrovně kvality.


Aplikace hlubokého učení

Hluboké učení

V této oblasti byl učiněn obrovský pokrok, ačkoli ani dnes nejsou některá rozhodnutí v hlubokém učení z čistě lidského pohledu zcela pochopitelná. To nebrání, jak je nyní zřejmé, neustálému zdokonalování technologií souvisejících s hlubokým učením, a to zejména díky množství dostupných dat a dostupnosti velmi výkonných infrastruktur, přičemž odkaz je zejména na CPU a GPU. Nemělo by nás překvapit, že se hluboké učení v současné době uplatňuje v různých průmyslových odvětvích a především, že se v blízké budoucnosti bude uplatňovat a rozšiřovat do mnoha dalších oblastí našeho každodenního života. Stačí si vzpomenout na auta bez řidiče, robotické drony pro doručování zásilek, rozpoznávání a syntézu hlasu a jazyka pro chatboty a servisní roboty nebo rozpoznávání obličeje pro bezpečnostní účely.

Existují také lékařské aplikace v radiologii pro včasnou detekci některých forem rakoviny nebo možnost snadné identifikace genetických sekvencí určitých nemocí pro výrobu účinnějších léků. Dále můžeme zmínit automatické kolorování černobílých snímků, simultánní překlad, klasifikaci objektů na fotografii, automatické generování rukopisu a textu spolu s intuitivním rozdělením na popisky. Podobně bylo vyvinuto i automatické hraní her, kdy se systém samostatně učí, jak danou hru hrát. Závěrem je třeba říci, že nelze podceňovat schopnosti hlubokého učení při odhalování nesrovnalostí v činnosti systému díky jejich nezávislému a průběžnému učení, zejména v případě nebezpečných kybernetických útoků nebo "chytrých" videozáznamů instalovaných na nejmodernějších letištích.

Při těchto slovech je však důležité zdůraznit, že hluboké učení nemůže a nemělo by být nejlepším technologickým řešením pro každý problém. Mnozí výzkumníci, zejména v posledních pěti letech, jsou přesvědčeni, že brzy budou nalezeny efektivnější a možná i levnější přístupy, které učiní hierarchické učení založené na fungování lidského mozku zastaralým. Jako by šlo o pomíjivý jev, zmenšený tak, aby představoval jen jeden z mnoha neuvěřitelných! - projevy umělé inteligence.