Umělá inteligence se naučí dělat pizzu. Víme, k čemu je to dobré

I malé dítě snadno přijde na to, jak se připravuje pizza: vyválíte těsto, přidáte omáčku, posypete to sýrem, dozdobíte přísadami a dáváte do trouby.

Pro počítač se ale jedná o docela zrádný úkol. Jak třeba zjistí, co udělat nejdříve? Jestli sýr nasypat předtím, než se dává omáčka, nebo až potom? Existuje nějaký správný způsob, jak aranžovat přísady? A jak je to vůbec se samotným pečením?

Výzkumníci z Massachusettského výzkumného institutu a z Qatar Computing Research Institute se rozhodli zodpovědět tyto otázky v právě probíhajícím projektu. Jeho cílem není přímo naučit umělou inteligenci, jak se dělá pizza, ale dosáhnou toho, aby věděla, v jakém sledu kroků toho dosáhnout. Výzkumníci v podstatě vytváří systém umělé inteligence, který si prohlédne fotografii pizzy a z ní vyvodí, jaké ingredience tvoří tu kterou vrstvu pokládanou na korpus pizzy. Výstupy z výzkumu prezentovali vědci minulý týden v kalifornském Long Beach na konferenci věnované umělé inteligenci.

Může to znít možná šíleně, ale opravdu máme užitek z toho, že umělá inteligence rozpozná, jestli se klobása pokládá až na sýr? Počítače se už dnes dokážou naučit identifikovat specifické objekty v obrázcích, ale když je takový objekt částečně v zákrytu (dejme prosciutto, na kterém leží rukola), mají problém určit, na co se zrovna dívají. A konkrétně jídlo, které často tvoří několik různých vrstev (představte si třeba mřížkovanou buchtu nebo salát), může pro počítač znamenat docela oříšek při snaze určit, co kam patří. Podívat se na obrázek a říct, že to je pizza, není těžké. Ale dokázat „rozebrat“ ji na jednotlivé složky a ty pak zase složit dohromady, to už vyžaduje nějakou úroveň porozumění.

Dimitrios Papadopoulos, post-doc na MIT a zároveň vedoucí projektu, prohlásil pro CNN Business, že pokud počítač dokáže určit základní ingredience i to, jak jsou pokládány na pizzu, tak bude schopný téhož i v případě obrázků jiných jídel.

„Jídlo je důležitou složkou našeho života, stejně jako vaření, proto chceme vytvořit model schopný uchopit jídlo tak nějak obecně,“ tvrdí Papadopoulos.

A proč zrovna si pro začátek vybrali pizzu? Papadopoulos říká, že on i jeho kolegové měli jasno v tom, že chtějí dělat na projektu umělé inteligence souvisejícím s jídlem. Nápad zaměřit se na pizzu přišel okamžitě vzápětí, když začali uvažovat nad vývojem umělé inteligence schopné napodobovat postup receptu a rozkládat jídlo do jednotlivých vrstev.

Fotky s pizzami je navíc opravdu snadné dohledat na internetu, jsou si často také docela podobné: mnoho z nich tvoří z nadhledu pořízený obrázek kruhového „koláče“, tvořeného těstem, omáčkou a na ní položenými různými přísadami. Výzkumníci shromáždili tisíce fotografií pizz uveřejněných na Instagramu, pracovníci služby Amazon’s Mechanical Turk následně ručně označili ingredience jako rajčata, olivy, bazalku, sýr, klobásu, papriku a různé typy omáčky. Označkované fotografie poté posloužily k tréninku několika na konkrétní ingredienci zaměřených generativně sporných sítí (anglicky generative adversarial networks, zkráceně GAN). Ty tvoří 2 nervové sítě vzájemně soutěžící, která z nich přijde s něčím novým na základě zpracovávání té stejné sady dat. V tomto případě každá z generativně sporných sítí dokáže prohlédnout si fotografii pizzy a vygenerovat nový obrázek, do kterého buď přidá ingredienci neobjevující se na předchozí fotografii, nebo naopak nějakou odebere.

Kupříkladu tak existuje generativně sporná síť, která umí přidávat nebo odebírat klobásku: ukažte jí obrázek pizzy s klobáskou a měla by být schopná vytvořit novou pizzu, shodnou s tou předchozí, akorát na ní nebudou kusy klobásky, a přesně naopak umí ingredienci přidávat, jak můžeme ostatně vidět na tomto odkazu (http://pizzagan.csail.mit.edu/#Results). Jiné sítě zase dokážou přidat nebo odebrat rukolu či vytvořit pizzu, která je buď upečená, nebo neupečená.

Papadopoulos věří, že jejich výzkum by mohl posloužit jako základ pro tvorbu aplikací zaměřených i na něco jiného než jídlo, jakou může být například digitální prodavač, který s využitím umělé inteligence sestaví slušivý outfit. „Idea je v základu stejná: akorát nepřidáváte na pizzu klobásku, ale kombinujete bundu s jinými kusy oblečení,“ tvrdí mladý vědec.



Další články k tématu: Uncategorized