Každý, kdo vyzkoušel Fotky Google, by souhlasil s tím, že tato bezplatná služba pro ukládání a správu fotografií od Googlu je chytrá. Balíček obsahuje různé chytré funkce, jako je pokročilé vyhledávání, schopnost kategorizovat obrázky podle umístění a dat, automaticky vytvářet alba a videa na základě podobností a procházet vás po paměťové dráze tím, že vám před několika lety ukáže fotografie ze stejného dne. Existuje mnoho věcí, které Google Photos mohou udělat, což by před několika lety bylo strojově nemožné. Google Photos je jednou z mnoha „chytrých“ služeb od společnosti Google, která používá a technologie strojového učení nazývá se TensorFlow. Slovo učení se naznačuje, že technologie bude časem chytřejší do té míry, že si ji naše současné znalosti nedokážou představit. Ale co je TensorFlow? Jak se může stroj naučit? Co s tím můžete dělat? Pojďme to zjistit.
Co je TensorFlow?
TensorFlow je open-source a výkonný Google software umělé inteligence, který zajišťuje mnoho služeb a iniciativ od společnosti Google. Jedná se o druhou generaci systému pro rozsáhlé implementace strojového učení, kterou vytvořil tým Google Brain. Tato knihovna algoritmů je nástupcem DistBelief - první generace.
Tato technologie představuje výpočet ve formě stavových grafů toku dat. Díky čemu je TensorFlow jedinečný, je jeho schopnost modelovat výpočty na široké škále hardwaru, od mobilních zařízení na úrovni spotřebitele po špičkové servery s více GPU. Může běžet na různých GPU a CPU a slibuje škálovatelnost strojového učení mezi různými zařízeními a gadgety, aniž by bylo nutné měnit značné množství kódu.
TensorFlow vznikl z toho, že Google potřebuje instruovat počítačový systém napodobující fungování lidského mozku v učení a uvažování. Systém známý jako neuronové sítě by měl být schopen fungovat na vícerozměrných datových polích označovaných jako „tenzory“. Konečným cílem je naučit neuronové sítě detekovat a dešifrovat vzorce a korelace.
V listopadu 2015 Google tuto technologii vyrobil open-source a umožnil jeho přijetí do všech druhů produktů a výzkumů. Kdokoli, včetně výzkumných pracovníků, techniků a fandů, může pomoci urychlit růst strojového učení a posunout ho na vyšší úroveň za kratší dobu.
Ukázalo se, že tento krok je správný, protože od nezávislých vývojářů do TensorFlow existuje tolik příspěvků, že daleko převyšují příspěvky Google. Wikipedia uvádí, že „existují 1 500 úložišť na GitHubu, které zmiňují TensorFlow, z nichž 5 pochází od Googlu. “ Jedna z diskusí v Quora má podezření, že vydaný open-source kód je „vyčištěná“ verze od té, kterou Google používá ve svých službách.
Jak funguje TenserFlow?
Pomocí jednoduchého normálního lidského jazyka a velkého zjednodušení bychom mohli vidět jednu stranu TensorFlow jako pokročilou technologii autonomního filtrování. Jádrem této technologie je obrovská softwarová knihovna strojového učení. Využívá databázi, aby mu pomohla „učinit rozhodnutí“.
Například někdo nahraje fotku do Fotek Google. Tato technologie porovná všechny podrobnosti z obrázku s jeho databází a rozhodne, zda se jedná o obrázek zvířete nebo člověka. Pak, pokud je to člověk, pokusí se určit pohlaví, věk až po to, kým je daná osoba. Stejný postup se opakuje pro ostatní objekty na fotografii.
Využívá také uživatelská data, jako je identita osoby na obrázku a umístění, kde je snímek pořízen, k vylepšení knihovny, aby v budoucnu mohla poskytovat lepší výsledky - jak pro jednotlivce, který fotografii nahrál, tak pro všechny jiný. Odtud tedy termín „učení“. Nezastaví se to však jen při znalosti a učení údajů z fotografií. Existuje tolik, co technologie dokáže s informacemi z fotografie. Může například seskupovat fotografie s podobnými podrobnostmi, jako je stejná osoba, stejné místo, stejné datum; podívejte se na vzorec tváří, abyste určili, ke které rodině a přátelům osoba na fotografii patří, a použijte tyto informace k pořizování videí z rodinné dovolené nebo animací z nepřetržitých snímků.
To stěží poškrábe povrch toho, jak TensorFlow funguje, ale doufám, že vám může poskytnout obecný obraz o technologii. Použitím pouze jednoho příkladu nelze dosáhnout spravedlnosti toho, čeho je schopen.
A pro všechny nadšence umělé inteligence, které existují, stojí za zmínku, že Google již vytvořil technologii počítačových čipů optimalizovanou pro strojové učení a integraci TensorFlow do ní. Jmenuje se to ASIC čip Tensor Processing Unit (TPU).
Ti, kteří se chtějí o TensorFlow dozvědět více, mohou navštívit jeho výukovou stránku.
Aplikace TensorFlow
Jsme v rané fázi technologie strojového učení, takže nikdo neví, kam nás zavede. Existuje však několik počátečních aplikací, které by nám mohly nahlédnout do budoucnosti. Protože pochází od společnosti Google, je zřejmé, že Google tuto technologii používá pro mnoho svých služeb.
-
Více o analýze obrazu
Diskutovali jsme o příkladu použití technologie pro analýzu obrázků ve Fotkách Google. Ale aplikace pro analýzu obrázků se také používá ve funkci Street View v Mapách Google. Například TensorFlow se používá k propojení obrazu se souřadnicemi mapy a k automatickému rozmazání poznávací značky jakéhokoli automobilu, který je do obrázku náhodně zahrnut..
-
Rozpoznávání řeči
Google také používá TensorFlow pro svůj software pro rozpoznávání řeči hlasovým asistentem. Technologie, která umožňuje uživatelům vyslovit pokyny, není nová, ale zahrnutí stále rozšířené knihovny TensorFlow do mixu může tuto funkci přinést o několik stupňů výše. V současné době technologie rozpoznávání řeči rozpoznává více než 80 jazyků a variant.
-
Dynamický překlad
Dalším příkladem „výukové“ části technologie strojového učení je funkce překladu Google. Google umožňuje svým uživatelům přidávat nové slovníky a opravovat chyby v Překladači Google. Stále rostoucí data lze použít k automatické detekci vstupního jazyka, který chtějí ostatní uživatelé přeložit. Pokud stroj dělá chyby v procesu detekce jazyka, mohou je uživatelé opravit. A stroj se z těchto chyb poučí, aby zlepšil svůj budoucí výkon. A cyklus pokračuje.
-
Alpha Go
Jedním ze zábavných příkladů použití TensorFlow je Alpha Go. Je to aplikace naprogramovaná na hrát Go. Pro ty, kteří Go neznají, je to abstraktní desková hra pro dva hráče, která vznikla v Číně před více než pěti tisíci pěti sty lety a je to nejstarší desková hra, která se dodnes hraje nepřetržitě. I když jsou pravidla jednoduchá - obklopit více území než soupeř, hra je neuvěřitelně složitá a podle Wikipedie: „má více možností než celkový počet atomů ve viditelném vesmíru.“
Je tedy zajímavé, co technologie učícího stroje dokáže s nekonečnými možnostmi. Ve svých zápasech proti Lee Sedol - 18násobnému mistrovi světa Go, Alpha Go vyhrál 4 z 5 her a získal čestnou nejvyšší hodnost Go velmistra.
-
Magenta Project
Další zajímavou aplikací TensorFlow je Magenta Project. Je to ambiciózní projekt strojově generované umění. Jedním z prvních hmatatelných výsledků experimentu je 90 sekund klavírní melodie. Google z dlouhodobého hlediska doufá, že prostřednictvím svého projektu Magenta vygeneruje pokročilejší strojově generované umění a vytvoří kolem něj komunitu umělců.
V únoru 2016 uspořádal Google také uměleckou výstavu a aukci v San Fransisco, kde předvedl 29 počítačem generovaných - s malou pomocí lidských - uměleckých děl. Šest z největších děl bylo prodáno až za 8 000 $. Počítač může ještě čekat velmi dlouhá cesta, než dokáže napodobit skutečného umělce, ale množství peněz, které jsou lidé ochotni zaplatit za umění, nám ukazuje, jak daleko technologie zašla.
Podpora pro iOS
I když jsme již viděli možnosti TenserFlow pro Android, s jeho nejnovější verzí TensorFlow konečně přidává podporu pro zařízení iOS. Vzhledem k tomu, že existuje spousta skvělých mobilních aplikací dostupných výhradně pro iOS nebo jsou vydány jako první pro iOS, znamená to, že můžeme v blízké budoucnosti očekávat další skvělé mobilní aplikace využívající strojové učení. Totéž lze říci o možnostech širšího přijetí a aplikací TensorFlow.
Budoucnost TensorFlow
Co může člověk dělat se strojem, který je schopen se učit a rozhodovat sám? Jako člověk, který se v rámci každodenního života zabývá více než jedním jazykem, mi jako první napadne jazykový překlad. Ne na úrovni slovo po slově, ale spíše na delší úrovni textu, jako jsou dokumenty nebo dokonce knihy. Dnešní překladatelská technologie je omezena na slovníky. Můžete snadno zjistit, co „spí“ v čínštině a naopak, ale zkuste vložit jednu kapitolu Musashi Eijiho Yoshikawu v její původní japonštině a přeložit kapitolu do angličtiny. Uvidíš, na co se chystám.
Je také zábavné sledovat, co může budoucnost umělé inteligence udělat s hudbou. I když je to stále velmi základní, aplikace Apple Music Memo vám již může automaticky poskytnout doprovod basů a bicích na váš zaznamenaný zpěv. Vzpomínám si na jednu epizodu televizní show SciFi, kde postava v seriálu vytvořila stroj, který analyzuje všechny nejlepší písničky v hitparádách a dokáže psát vlastní hity. Přijedeme tam někdy??
A na závěr bych rád zmínil Sunspring. Jedná se o krátký sci-fi film, jehož autorem je scénárista AI, který si sám říká Benjamin - který dokonce složil pop-song hudební mezihru. Film sestavil režisér Oscar Sharp pro 48hodinovou akci Film Challenge of Sci-Fi London.
Teď nemohu přestat myslet na Terminátora. Vítejte v budoucnosti.
Uznání: Wikipedia, TechInsider, The Verge, Wall Street Journal