Publikováno: 16.05.2025
Kolik lidí přišlo na fotbalový zápas? Nechovají se fanoušci podezřele? A co když někdo z nich vytáhne zbraň? To jsou informace, které neuniknou umělé neuronové síti, kterou zkoumá a trénuje absolvent a nyní také pedagog a vědec Fakulty elektrotechniky a informatiky Dominik Štursa. K práci potřebuje jen počítač a kameru. Ideálně spíš hodně kamer.
Když na Fakultě elektrotechniky a informatiky pochodují studenti po schodech nahoru a dolů, není to z rozmaru a kvůli jejich potřebě pohybu, pracují na projektu, který jim zadal vyučující. Pedagog a vědec Dominik Štursa se vždy zajímal o strojové učení a nyní prováděl testování společně se svými studenty. „Vzal jsem studenty při výuce předmětu umělé inteligence a říkal jsem jim: choďte po schodech nahoru a dolů. Nafotíme si vlastní sadu dat. A tak jsme chodili,“ říká Dominik Štursa k testování, kterým ověřoval detekci a počítání hlav za pomoci umělé neuronové sítě.
Je totiž součástí výzkumného týmu profesora Petra Doležela, který mimo jiné vyvíjí systémy na detekci, lokalizaci i klasifikaci nejrůznějších objektů. „Takto nasbíraná data jsme potom vzali, získali jednotlivé snímky a ručně jsme označovali hlavy studentů,“ popisuje vědec. A proč? Aby je stejným způsobem dokázala rozpoznat a spočítat i umělá neuronová síť, jejímž vzorem je chování neuronů v mozku.
„Neuronové sítě, které využíváme, se učí z toho, co jim na začátku dáme. To znamená, že jim nejprve poskytneme určitá data a ukážeme jim, jaké výsledky od nich očekáváme. Na základě toho si vytvoří vnitřní logiku, kterou pak aplikují na nová, neznámá data,“ vysvětluje Dominik Štursa podstatu práce s umělou neuronovou sítí. Ta poté dokáže například odhalit podezřelé nebo neobvyklé chování a poskytnout o něm informaci někomu dalšímu. A to všechno pomocí počítačového zpracování obrazu.
Druhé oči vědců
Ke spočítání studentů přitom vědci pomohly „jen“ kamery, které jsou jeho druhýma očima. Uvnitř laboratoře sbírá tým Petra Doležela těmito kamerami cenné výzkumné podklady, zatímco sledování ostatních míst na Fakultě elektrotechniky a informatiky má z bezpečnostních důvodů na starosti vrátná. Jednou už tam ale třeba nebude muset sedět, protože detekovat nežádoucí postavu či předmět za ni zvládne právě vytrénovaná a přesně naučená neuronová síť.
„Pracujeme s principy, které při rozpoznávání a následném zpracování obrazů používá člověk. Snažíme se, aby počítače dokázaly identifikovat objekty a uživatele v obrázcích a videích a dokázaly jim také porozumět,“ říká Dominik Štursa s tím, že vlastně jen replikují způsob, jakým lidé vidí, a také způsob, jakým chápou to, co vidí. Oproti lidem, kteří vidí pouze barevné spektrum, mají počítače velkou výhodu. Dívají se na svět skrz kamery a můžou tak zaznamenat i jiná spektra. „Kamery nebo obecně roboti můžou vidět třeba infračervené nebo ultrafialové spektrum a podobně. Mohou totiž využívat i jiné fyzikální principy na zobrazování obrazových dat. Na těchto principech pak funguje třeba magnetická rezonance nebo rentgen,“ doplňuje Štursa. V takto pořízených snímcích pomáhá zpracování obrazu například detekovat shluk nádorových buněk nebo vyhodnotit zlomeniny.
Pryč se špatnou sušenkou
Nejčastěji pracuje s dvourozměrnými daty, tedy s fotografiemi, které sám nafotí nebo si je vypreparuje z kamerových záznamů a videí. „V některých případech nemá cenu vyhodnocovat video, protože nám stačí jen jednoduchá informace právě z fotky, jindy zas potřebujeme třeba popsat nějakou polohu v určitém časovém horizontu a k tomu je zas lepší využívat videa. Nedá se proto říct, co je na zpracování lepší,“ vysvětluje.
Na čem ale záleží, je to, co chce s daty dál provádět. Například fotka poskytne typická statická data, která jsou klíčová třeba pro detekci vadných kusů ve výrobním průmyslu. „Existují základní úlohy, které se v průmyslu vykonávají. Může to být detekce špatných kusů sušenek jedoucích na pásu, které následně odebere robotické rameno. Jsou to poházené součástky v boxu, ze kterých potřebujete odebrat konkrétní součástku a dát ji třeba na desku plošných spojů, která jede zase někam dál, kde se to celé kompletuje,“ dává příklady průmyslových úloh Dominik Štursa.
Patří k nim také třeba přemísťování a systematické rovnání objektů například na paletu. Jeho úloha v těchto úkonech spočívá v tom, že díky zpracování obrazu poskytne neuronové síti informaci o tom, co je poškozená sušenka a kde se může objevit, nebo jak přesně vypadá daná součástka, kam se vkládá nebo jak se objekty nejlépe rovnají na sebe. Právě to je cesta k další automatizaci a robotizaci nejen průmyslové výroby.
V bezpečí vždy a všude?
Vize je taková, že nás umělá neuronová síť bude umět ochránit ve veřejném prostoru. Třeba v autobusu, kde dnes už běžně můžeme narazit na kameru. „S její pomocí řidič sleduje prostor autobusu. Letmým pohledem na monitor může ale něco lehce přehlédnout. Zjistí třeba, že někdo usnul na sedačce, ale už neuvidí, že se mu tam na konečné stanici někdo schoval. Právě tuhle informaci mu dá neuronová síť, která rozpozná podezřelé chování,“ popisuje Štursa.
Dopravcům se ale takové kamery hodí i proto, že monitorují pohyb cestujících a dokážou je také spočítat. „Na základě toho si pak mohou odpovědět na to, zda jezdí dostatek autobusů, nakolik jsou vytížené a jestli jejich trasy není třeba optimalizovat. Data se totiž dají spárovat s informacemi z GPS,“ dodává Štursa. Obdobného počítání osob se dá využít i na místech s velkou koncentrací lidí. Třeba na stadionech. Pomocí nástrojů našich vědců se dá třeba zjistit, zda se v době hrozícího nebezpečí zvládli evakuovat všichni přítomní. „Na základě toho, co kamera vidí, neuronová síť rozpozná nebezpečnou situaci a upozorní operátora: Hele, tady se děje něco podezřelého a je potřeba zakročit,“ popisuje. Pardubičtí vědci se zrovna zabývají vývojem systému pro detekci chování, při němž osoba vytáhne zbraň.
Pod neustálým dohledem
Systém může pomáhat třeba na letišti, a to v případě, kdy se do hledáčku kamery dostane zapomenuté zavadlo. „Systém se snaží zavadlo s někým spárovat. Podle dalšího vývoje situace vyhodnotí, jestli si jen cestující odskočil na toaletu, nebo se ke kufru už nevrátil,“ doplňuje Štursa, který se podílel i na vývoji systému pro detekci objektů za účelem ochrany vzdušného prostoru. Systém umí na snímcích horizontu najít bezpilotní letadla a drony a určit, kde se nacházejí a zda jsou či nejsou nebezpečné. Tyto systémy se ale neobejdou bez fungování velkého počtu sledovacích zařízení, a právě neustálý dohled kamer mohou mnozí nést s nelibostí.
Útěchou může být to, že neuronová síť neví o lidech, kteří se vyskytují v jejím zorném poli, žádné informace. „V našich aplikacích pouze indikuje, jestli se tam neděje něco neobvyklého, potažmo nebezpečného. Nejde o žádný zásah do běžného života. Nedělá vlastně nic jiného než ten vrátný, který sedí na židli a kouká na záznam z kamer,“ upřesňuje vědec.
Dominika Štursu naopak množství kamer v objektech, do kterých přichází, těší. Hlavou se mu v tu chvíli nejspíš honí to, jak obrazové záznamy z nich zpracovat, aby nám zase ulehčily život.
Dominik Štursa je součástí pětičlenného výzkumného týmu profesora Petra Doležela, který se zabývá aplikovaným výzkumem a experimentálním vývojem v oblasti strojového a hlubokého učení. Řeší nejrůznější úkoly v průmyslových výrobách, jako robotizaci a automatizaci výrobních procesů, detekci a klasifikaci objektů, segmentaci a shlukování dat či extrakci vlastností vizuálních a dalších dat. Jejich nejnovější technologie Neural Vision View, kterou v současnosti využívají dva partneři z komerční sféry, přispívá ke zvýšení přesnosti a spolehlivosti robotických systémů v praxi. Nabízí i nové možnosti využití v oblasti bezpečnostních systémů, biomedicíny nebo odpadového hospodářství. S technologií se probojovali do finále prestižní soutěže Transfera Technology Day a získali ocenění TOP Inovační projekt Parádního kraje.
TEXT Zuzana Paulusová : FOTO Adrián Zeiner, Ivana Mlatečková
Tento text najdete v exkluzivním vydání časopisu Univerzity Pardubice MY UPCE i v on-line podobě.