Strona główna Telewizja Dozorowa Sztuczna inteligencja w systemach wizyjnych

Sztuczna inteligencja w systemach wizyjnych

O zastosowaniach sztucznej inteligencji w systemach monitoringu wizyjnego
mówi
Mats Thulin, dyrektor ds. kluczowych technologii w Axis Communications.

Mats Thulin,
dyrektor ds. kluczowych technologii
w Axis Communications

W branży security wiedza na temat sztucznej inteligencji jest zróżnicowana. Czy może Pan pokrótce wyjaśnić, na czym polega ta technologia?

Mats Thulin (M.T.): Sztuczna inteligencja (AI) to dziedzina informatyki, która bada i rozwija metody symulowania inteligentnego zachowania przez komputery. To bardzo szeroka koncepcja, a w kontekście analityki wizji w branży dozoru wizyjnego jej głównym celem jest zwiększenie wydajności operacyjnej i dodanie nowych wartości poprzez automatyczne przetwarzanie strumieni wizyjnych. W tej dziedzinie najbardziej istotną kategorią do omówienia jest podkategoria AI nazywana uczeniem maszynowym. Uczenie maszynowe (machine learning) to metody umożliwiające komputerom ulepszanie algorytmów poprzez samoszkolenie na podstawie rzeczywistych przykładów. Ulepszone algorytmy są następnie wykorzystywane do analizy obrazów lub ich sekwencji w celu generowania alarmów, metadanych czy innych informacji.

W ostatnich latach wiele uwagi poświęcono specjalnej podkategorii uczenia maszynowego, a mianowicie metodom głębokiego uczenia (deep learning). Ta kategoria algorytmów opiera się na symulowanych sieciach neuronowych. Pomysł na ten typ algorytmów został zainspirowany ludzkim aparatem wzroku („systemem wizyjnym” człowieka), stąd jego nazwa – sieci neuronowe. W sieciach głębokiego uczenia warstwy operacyjne są ułożone w hierarchii warstw złożonych i abstrakcyjnych. Każda kolejna warstwa wykorzystuje informacje z poprzedniej, aby wyciągnąć końcowy wniosek. Modele głębokiego uczenia umożliwiają budowanie bardziej złożonych algorytmów analitycznych, charakteryzujących się większą precyzją niż tradycyjne. W systemach dozoru wizyjnego są stosowane przede wszystkim do wykrywania, klasyfikowania i rozpoznawania obiektów. Jednym z mankamentów algorytmów głębokiego uczenia jest to, że wymagają dużo większej mocy obliczeniowej, gdyż wykonują większą liczbę operacji matematycznych w porównaniu z algorytmami tradycyjnymi.

Jakie są zalety, a jakie ograniczenia analityki opartej na algorytmach głębokiego uczenia?

M.T.: Te nowe technologie wymagają ogromnej ilości odpowiednich danych wejściowych do szkolenia maszyny, aby nauczyła się poprawnie je analizować. Jeśli dostępna jest wystarczająca ilość jakościowych danych, zaletą uczenia maszynowego i analizy opartej na głębokim uczeniu jest to, że dane te można skutecznie przetwarzać. Komputer może analizować tysiące zdjęć, aby znaleźć charakterystyczne szczegóły obiektu w różnych scenariuszach. Dlatego, jeśli dane i ich opisy są wysokiej jakości, aplikacja oparta na głębokim uczeniu się może często osiągnąć większą dokładność.

Warto jednak pamiętać, że stosowana obecnie analityka nie ma żadnej świadomości ani tego, co można by nazwać inteligencją w rozumieniu przetwarzania wiedzy ogólnej. W zastosowaniach, w których ta technologia jest wykorzystywana, koncentruje się ona na specyficznych problemach w ograniczonych, konkretnych obszarach. Na przykład aby aplikacja głosowa, np. Siri, odpowiadała dokładnie na nasze pytania, musimy je zadawać w określony sposób, w przeciwnym razie otrzymamy niezrozumiałą odpowiedź. Podobnie w systemach dozorowych: zły opis obrazów używanych do szkolenia da efekt niskiej dokładności wyników.

Do prawidłowego zrozumienia przez SI tego, co przedstawia obraz z kamery dozorowej, jeszcze długa droga. Ponieważ nadal istnieją ograniczenia związane z dokładnością tej technologii, musimy być ostrożni w jej zastosowaniach. Dziś już AI poprawia wydajność, ale faktyczne podejmowanie decyzji w scenariuszach dozoru wizyjnego musi nadal leżeć w gestii pracownika ochrony lub operatora.

Na ile zastosowanie sztucznej inteligencji czy głębokiego uczenia w systemach dozoru wizyjnego jest modą, a na ile koniecznością?

M.T.: Kiedy technologia jest w początkowej fazie rozwoju, budzi nadzieję na jej szerokie zastosowanie. W miarę dojrzewania, jej słabości i ograniczenia klarują się, a zastosowania w obszarach, do których wnosi wartość, rosną. W przypadku dozoru wizyjnego istotną kwestią jest rozpatrzenie w pierwszej kolejności potrzeby użytkowej – zdefiniowanie problemu, który ma rozwiązać, lub efektu, który chce się osiągnąć. Osiągnięcie dobrych wyników jest znacznie bardziej prawdopodobne, gdy opieramy się na dobrym zrozumieniu konkretnego celu, realizacji potrzeby.

W przypadku AI w systemach dozoru wizyjnego oceniłbym, że wciąż jesteśmy na początku drogi, chociaż istnieją już zastosowania, w których analizy oparte na głębokim uczeniu się zapewniają prawdziwą wartość dla klientów końcowych, jak wspomniane już przeglądanie dużych ilości zarejestrowanego materiału w poszukiwaniu określonych obiektów lub wydarzeń. Głęboko wierzymy, że wykorzystanie aplikacji analitycznych w systemach dozoru wizyjnego będzie rosło, ale konieczne jest zachowanie ostrożności w tym zakresie. Kluczowe znaczenie ma dokładne zrozumienie celu zastosowania i ograniczeń technologii, a następnie jej testowanie i rzetelna ocena, czy zamierzony efekt został osiągnięty.

Jaka jest filozofia firmy Axis we wdrażaniu sztucznej inteligencji w najnowszych urządzeniach?

M.T.: Skupiamy się przede wszystkim na jakości urządzenia i generowanego obrazu, co określamy wskaźnikami użyteczności obrazu. Dotyczy to również korzystania z aplikacji do analizy zawartości wizji, ponieważ rzeczywista jakość obrazu przekłada się bezpośrednio na dokładność analizy. Kamery w systemach dozoru wizyjnego zwykle muszą działać przez całą dobę, cały rok oraz radzić sobie z wahaniami temperatury i zmiennymi warunkami oświetleniowymi, jednocześnie prawidłowo analizując obraz w czasie rzeczywistym.
Jesteśmy świadkami wyraźnego trendu: coraz bardziej zaawansowana analityka wizji jest przenoszona do urządzeń brzegowych, np. kamer. Istnieje wiele przyczyn takiego stanu, m.in. oszczędność przepustowości sieci i drogiej infrastruktury serwerowej, obawy związane z utratą prywatności itd. Dzięki nowym modelom kamer z wbudowaną możliwością wykonywania zaawansowanej analizy głębokiego uczenia otwierają się nowe możliwości dla nas i naszych partnerów opracowujących aplikacje w programie Axis Development Partner. Jak zawsze otwartość stanowi dla nas wartość kluczową, a zapewnienie otwartej platformy programistycznej dla naszych partnerów pozwala na opracowanie nowych rodzajów zaawansowanych rozwiązań analitycznych.

Dziękujemy za rozmowę