Wielkoskalowe modele AI w systemach Smart City
Sztuczna inteligencja oparta na nowoczesnych wielkoskalowych modelach to zaawansowana technologia, która rewolucjonizuje koncepcję Smart City, integrując inteligentne rozwiązania AIoT z infrastrukturą miejską. Firma Hikvision opracowała w tym zakresie technologię Guanlan, której nazwa nawiązuje do starożytnej filozofii mówiącej, że zrozumienie natury wymaga uważnej obserwacji zjawisk.
Tomasz Goljaszewski
Technologia Guanlan opiera się na trójwarstwowej architekturze, obejmującej:
- warstwę podstawową: modele wizyjne, językowe i multimodalne;
- warstwę pośrednią: modele branżowe, zbudowane z udziałem fachowej wiedzy z zakresu konkretnej branży oraz specyfiki występujących w niej przypadków;
- najwyższą warstwę: złożone modele zadaniowe opracowane dla szczególnych przypadków, w których potrzebna jest analiza modeli warstwy podstawowej i pośredniej w konkretnych scenariuszach oraz zależnościach.
W przypadku wcześniej wspomnianych modeli multimodalnych w warstwie podstawowej, oprócz modeli wizyjnych możemy mieć do czynienia z dużymi modelami dla termowizji, modelami fal milimetrowych (radary), modelami światłowodowymi (analizatory) oraz modelami fal rentgenowskich (bramki, skanery). Wszystkie te technologie można integrować z zewnętrznymi systemami i zarządzać nimi centralnie w ramach wielkoskalowych projektów ochrony aglomeracji.
AI w nowoczesnym monitoringu miejskim
Obecnie wielkoskalowe modele AI są najczęściej wykorzystywane w kilku obszarach związanych z bezpieczeństwem i funkcjonowaniem miasta. Jednym z nich jest system monitoringu miejskiego. Zastosowanie tej nowoczesnej technologii umożliwia błyskawiczne wyszukiwanie zdarzeń w zarejestrowanym materiale za pomocą opisów tekstowych. Ponieważ wielkoskalowe modele AI rozumieją cechy obiektów oraz kontekst, umożliwiają szybkie wyszukiwanie obiektów przy użyciu tekstowych instrukcji wysyłanych do urządzeń systemowych.
Stosując tekstowe opisy jako polecenia wyszukiwania, np. „kobieta z wózkiem dziecięcym” czy „człowiek prowadzący psa”, jesteśmy w stanie bardzo szybko odnaleźć w zarejestrowanych danych interesujące nas nagranie. Kluczowe dla tej funkcjonalności są wielkoskalowe modele językowe Guanlan oraz funkcja AcuSeek, zaimplementowana w kamerach i rejestratorach Hikvision. Inteligentne rejestratory DeepinMind z funkcją AcuSeek (seria Vpro), wraz z platformą systemową HikCentral Pro, stanowią podstawę działania takiego systemu.

W przypadku dużych systemów Hikvision zapewnia serwery AI z serii Fusion Ultra, które mają dzienną wydajność detekcji do 3 mln obiektów (wskaźnik podano dla kamer Full HD). W takim przypadku rejestracja nie odbywa się na rejestratorach, lecz na macierzach dedykowanych systemowi HikCentral Pro.
Ochrona infrastruktury krytycznej z wykorzystaniem AI
Kolejnym istotnym obszarem, w którym wdrożono sztuczną inteligencję opartą na wielkoskalowych modelach AI, jest ochrona obiektów istotnych z punktu widzenia funkcjonowania miasta. Mogą to być obiekty strategiczne, takie jak dworce, duże węzły komunikacyjne, zakłady produkcji czystej wody czy obiekty związane z produkcją i dystrybucją energii elektrycznej oraz ciepła.
Algorytmy detekcji działające w oparciu o Guanlan znacząco podnoszą efektywność wykrywania zagrożeń. Na przykład w przypadku detekcji człowieka skuteczność wzrasta o 5–10%, w zależności od dystansu czy rozdzielczości kamery. Z kolei w przypadku innych obiektów, np. pozostawionego przedmiotu czy obecności dymu, skuteczność jest wyższa – od kilkunastu do kilkudziesięciu procent.
Wzrost skuteczności może przekładać się na większe zasięgi detekcji oraz redukcję liczby fałszywych alarmów. Redukcja fałszywych alarmów jest szczególnie istotna z punktu widzenia pracy operatorów systemów bezpieczeństwa. Ma ona podstawowy wpływ na efektywność detekcji oraz czas reakcji na zagrożenie.
Hikvision wprowadziło specjalną serię kamer wizyjnych i termowizyjnych, w których algorytmy detekcji zostały usprawnione właśnie dzięki wielkoskalowym modelom AI. Technologię Guanlan można znaleźć w wybranych kamerach 5. i 7. linii oraz kamerach termowizyjnych linii G1.
Sztuczna inteligencja w zarządzaniu ruchem drogowym
Ważnym obszarem, w którym wykorzystuje się wielkoskalowe modele AI, są drogi miejskie, a co za tym idzie – wykrywanie zagrożeń w ruchu drogowym. Zarządzanie ruchem drogowym z wykorzystaniem wielkoskalowych modeli AI, w połączeniu z systemami ITS, ma na celu zwiększenie bezpieczeństwa na drogach miejskich. Dodatkowo technologie te wpływają na optymalizację przepływu pojazdów oraz redukcję liczby fałszywie wykrytych wykroczeń i incydentów drogowych.
Ze względu na zdecydowanie wyższą skuteczność wykrywania w porównaniu z tradycyjnymi systemami bazującymi na typowej analizie wideo, mogą służyć do dyscyplinowania kierowców i wymuszania poprawnych zachowań na użytkownikach dróg. Badania wykazały, że stosowanie wielkoskalowych modeli AI (zwłaszcza wykorzystujących warstwę pośrednią, czyli modele branżowe) do wykrywania wykroczeń, takich jak jazda pod prąd, skręt z niewłaściwego pasa ruchu, zajmowanie buspasa, brak zapiętych pasów czy używanie telefonu podczas jazdy, umożliwia redukcję fałszywych alarmów nawet o 75%, jednocześnie zwiększając skuteczność odczytu numerów rejestracyjnych do 98%, a cech pojazdu do 95%.
Nowa generacja kamer ANPR

Firma Hikvision, wykorzystując technologię Guanlan, opracowała w zeszłym roku nowe kamery ANPR przeznaczone do zastosowania na drogach szybkiego ruchu oraz drogach miejskich. Kamery te oferują lepszą skuteczność nie tylko w zakresie funkcji podstawowych (czyli odczytu tablic rejestracyjnych), lecz także funkcji dodatkowych, takich jak detekcja koloru, cech pojazdu, prędkości czy niektórych wykroczeń.
Oprócz kamer ANPR gamę produktów uzupełniły również nowe kamery do detekcji i monitorowania przepływu pojazdów (Traffic Flow) oraz detekcji incydentów (AID). We wszystkich tych produktach zastosowano wielkoskalowe modele AI w warstwie podstawowej i pośredniej, a w niektórych przypadkach również w warstwie zadaniowej.
Przyszłość AI w przestrzeni miejskiej
W przyszłości wielkoskalowe modele AI będą coraz częściej wykorzystywane w różnych obszarach życia miasta w celu zwiększania efektywności oraz automatyzacji procesów. Takie problemy, jak parkowanie w mieście, zbiórka śmieci czy bezpieczeństwo dzieci w drodze do szkoły mogą być kolejnymi obszarami, w których można zaimplementować technologie bazujące na AI.
Wraz ze wzrostem popularności technologii termowizyjnej, radarowej czy innych technologii niewizyjnych (np. światłowodów) wzrośnie również znaczenie modeli multimodalnych. Z całą pewnością technologia ta nie jest jedynie krótkotrwałym trendem. Należy się spodziewać, że na stałe wpisze się w definicję systemów Smart City. Wszystko to z korzyścią dla nas, czyli zwykłych mieszkańców miast i użytkowników infrastruktury miejskiej. •
Hikvision Poland
ul. Żwirki i Wigury 16B
02-092 Warszawa
www.hikvision.com/europe/
info.pl@hikvision.com











