Just Walk Out – koncepcja sklepu bez kasjerów według Amazon Go
Jan T. Grusznic
Jak wynika z raportu Polskiej Organizacji Handlu i Dystrybucji1), handel w Polsce daje ok. 2 mln miejsc pracy, co stanowi ok. 15 proc. wszystkich pracowników. 250 tys. osób jest zatrudnionych w sieciach zagranicznych, 60 proc. handlowców to kobiety, jedna trzecia z nich to panie 50+. Sporą część stanowią sprzedawcy-kasjerzy, o których coraz trudniej na rynku pracy, dlatego więcej sieci handlowych swoją przyszłość wiąże z rozwiązaniami samoobsługowymi.
W rozwiniętych krajach Europy Zachodniej i Stanach Zjednoczonych tego rodzaju praktyka nie jest zjawiskiem nowym. Przykładowo Albert Heijn w 2010 r. otworzył w Amsterdamie sklep bez kasjerów. W 2013 r. sieć marketów Tesco wprowadziła w Wielkiej Brytanii system Scan as you shop w około 200 placówkach. Takie rozwiązanie zostało niedawno testowo wdrożone przez polską sieć „Piotr i Paweł” w jednym ze sklepów w Poznaniu. Klient przy użyciu własnego smartfona, który w tym przypadku pełni funkcję skanera i odpowiedniej aplikacji, może samodzielnie skanować produkty, zapakować je do torby, a następnie przy wyznaczonym stanowisku zapłacić kartą za zakupy.
Takie podejście pozwala klientowi uniknąć konieczności wypakowywania zakupów i ponownego pakowania ich do toreb, a w efekcie skrócić czas zakupów. Nie musi czekać w kolejce do kasy (z wyłączeniem sytuacji, gdy system zgodnie ze specjalnie stworzonym algorytmem scoringowym – ocena punktowa w polityce kredytowej – wymusza weryfikację zakupów).
Przytoczone przykłady to jednak jedynie nieśmiała próba wdrożenia sklepów bez kasjerów wobec tego, czego dokonano w Seatle (USA) na początku tego roku. Oto bowiem 22 stycznia Amazon Go otworzył swoje podwoje dla klientów, uruchamiając sklep spożywczy w systemie Just Walk Out („po prostu wyjdź”). Wstęp jest możliwy po zeskanowaniu unikatowego kodu QR na swoim urządzeniu mobilnym.
Później telefon w zasadzie nie jest konieczny, gdyż kombinacja czujników i kamer rejestruje każdy ruch klienta i wszystkie wybrane przez niego produkty, które są automatycznie wykrywane i umieszczane w wirtualnym koszyku. Po zakończeniu zakupów po prostu wychodzi ze sklepu, a płatność jest dokonywana za pośrednictwem aplikacji, bez konieczności dotykania ekranu smartfona.
-=-=-=-=–=
Sklep o powierzchni ok 170 m2 został wyposażony w setki urządzeń, z których sygnały są analizowane na bieżąco. Amazon ponad rok testował technologię Just Walk Out. Podczas próbnych zakupów jego pracownicy wielokrotnie usiłowali oszukać algorytmy, także w tak niekonwencjonalny sposób, jak przebieranie trzech pracowników w stroje Pikachu. Nie udało się oszukać systemu, który poprawnie zidentyfikował klientów pomimo ich identycznych, żółtych ubrań, obciążając prawidłowo konto każdego z nich. Doprowadzenie rozwiązania do takiej perfekcji nie obyło się bez problemów. Amazon Go zaliczył 10-miesięczne opóźnienie w otwarciu, ze względu na różne problemy związane z użytą technologią. Prasa [2] donosi, że system zawieszał się podczas testów, gdy sklep był zatłoczony.
Just Walk Out
Wejścia do przestrzeni sklepowej chronią bramki kontroli dostępu, które otwierają się po zeskanowaniu kodu QR wygenerowanego przez aplikację Amazon Go zainstalowaną w telefonie. Od tej chwili konto klienta jest powiązane z jego fizyczną obecnością, a kamery – wiele kamer – zaczynają śledzić każdy jego ruch.
Osoby z branży security zajmujące się również rozwiązaniami przeznaczonymi dla segmentu retail, słysząc o Amazon Go, były ciekawe, jak technicznie zostanie zrealizowany pomysł sklepu bez kas: kamery na suficie, za gablotami, na cokołach? Jaki rodzaj? Czujniki zbliżeniowe RFID i wagowe, rozpoznawanie twarzy? Gdzie dane byłyby zbierane i przetwarzane?
Okazało się, że podejście Amazona nie jest tak skomplikowane, jak było można się tego spodziewać. System składa się z wielu kamer zamontowanych na suficie, obserwujących każdy metr kwadratowy sklepu pod różnymi kątami. Są wśród nich typowe kamery dozoru wizyjnego, w obudowach na zamówienie, wykonujące podstawowe prace z zakresu analizy zawartości obrazu, takie jak wykrywanie ruchu czy podstawowa identyfikacja obiektu. Są one wspomagane przez osobne kamery z funkcją głębokiego uczenia, a także wykorzystujące m.in. technologię Time-of-Flight2).
Dane przechwytywane z tych kamer są wysyłane do centralnej jednostki przetwarzania, która szybko i dokładnie identyfikuje różne osoby i produkty w sklepie. Podniesienie z półki artykułu powoduje automatyczne dodanie go do „wirtualnego koszyka na zakupy”. Nie jest wymagana specjalna prezentacja do kamery lub dłuższy czas przetrzymywania w dłoni, żeby system „mógł to zobaczyć”.
A jednak nie RFID
Do monitorowania przepływu ludzi i produktów w sklepie Amazon postanowił wykorzystać technologię analizy zawartości obrazu, a nie – jak powszechnie sądzono – tagi RFID. Dilip Kumar, wiceprezes ds. technologii Amazon Go, przyznał, że głównym powodem takiej decyzji były wcześniejsze inwestycje Amazona w rozwój uczenia maszynowego. Inną, nie mniej ważną kwestią były koszty operacyjne wynikające z konieczności oznaczenia każdego artykułu ręcznie przed jego wprowadzeniem na półkę. W sklepie z produktami szybko rotującymi koszt RFID jest zbyt wysoki ze względu na cenę pojedynczego taga oraz koszt pracownika.
Poza tym technologia RFID ma sporo ograniczeń. Na zasięg odczytu ma wpływ wiele czynników środowiskowych, takich jak woda, metal, oświetlenie fluorescencyjne, maszyny a także konkurencyjne częstotliwości.
Maksymalny zasięg odczytu może zostać osiągnięty i utrzymany tylko poprzez ciągłe testowanie i dokonywanie stosownych zmian w systemie w całym okresie funkcjonowania rozwiązania. Na zasięg odczytu ma również wpływ sama wielkość znacznika i jego usytuowanie. W przypadku pasywnych tagów RFID można przyjąć zasadę, że im większy tag (większa antena w nim zawarta), tym jest większa odległość, z której można odczytać dane. Dłuższy promień odczytu uzyskuje się również wtedy, gdy tag całą swoją powierzchnią będzie zwrócony przodem do anteny, a nie np. odczytywany pod kątem. Przy antenach liniowych zasięgi odczytu są lepsze, gdy tag jest umieszczony równolegle do osi anteny. A gdy znakowany obiekt jest zbudowany z metalu lub wypełniony płynem, wtedy używa się specjalnego znacznika RFID, zoptymalizowanego do pracy z tymi materiałami, a w związku z tym droższego. Tag przeznaczony do montowania na tworzywach sztucznych, ale umieszczony na metalu znacząco obniży swój zasięg odczytu z kilku metrów nawet do kilku centymetrów.
Ten brak powtarzalności oraz niski poziom skuteczności wpłynęły na decyzję o zaniechaniu dalszych prób z technologią RFID w Amazon Go i dalsze rozwijanie AI.
Ciekawe, że nigdzie nie zastosowano algorytmów rozpoznawania twarzy. Amazon zapewne wyczuł, że przyniesie mu więcej problemów niż pożytku. Zamiast tego system jest oparty na autoryzacji kodem QR i analizie przemieszczania się obiektów dzięki pełnemu pokryciu kamerami, których jest w sklepie około stu. Jeśli zatem wystąpi problem techniczny z kamerą lub w jakiś sposób pojawi się sos na jej obiektywie, system nie załamie się. Twórcy rozwiązania przetestowali jego skuteczność z brakującymi kamerami.
Tłumaczenie świata komputerowi
Według Dilipa Kumara jednym z największych wyzwań stojących obecnie przed analizą wizji i głębokim uczeniem jest rozróżnianie bardzo podobnych do siebie produktów, np. tego samego napoju w wersji podstawowej i bez cukru. O ile człowiek nie ma problemu z ich odróżnieniem, o tyle dla komputerów stanowi to nie lada wyzwanie. Oba artykuły wyglądają podobnie, a „wytłumaczenie” algorytmowi niuansów wiąże się z ogromnymi nakładami finansowymi i obliczeniowymi bez gwarancji sukcesu. Osiągnięcie skuteczności przekraczającej 99% jest zadaniem wymagającym ogromnych nakładów pracy. Co ciekawe, skuteczność na poziomie do 80% może osiągnąć system zaprojektowany przez ogarniętego studenta informatyki dysponującego ogólnodostępnymi w Internecie zasobami. Aby przekroczyć granicę 80%, trzeba przetworzyć ogromną liczbę informacji we właściwy sposób. Dlatego oprócz kamer pod półkami zostały umieszczone czujniki tensometryczne (napięcia powierzchniowego), a system wie, ile dokładnie waży każdy przedmiot. Dzięki połączeniu danych przetwarzanych w czasie rzeczywistym wskaźnik błędów jest na tyle niski, że Amazon nie uwzględnia go w definicji problemu.
W tradycyjnych sklepach nieprawidłowości zdarzają się stale: towar jest źle zeskanowany, pomijany lub wręcz kradziony – pewien poziom „strat” jest zakładany.
Tak więc okazjonalne błędne zliczenia nie załamią modelu biznesowego Amazona. Co warte podkreślenia, system nie został zaprojektowany w celu „łapania” złodziei, w ogóle tego nie przewidywał. Amazon wyszedł bowiem z założenia, że większość ludzi nie jest rabusiami. Budowanie systemu, który zakłada czyjeś złe intencje, a nie tylko wykrywa rozbieżności, nie zawsze jest dobrym rozwiązaniem.
Człowiek w procesie maszynowym
Wdrożona w Seatle koncepcja zakłada wprowadzenie nowej dodatkowej wartości dla klientów Amazona. Gianna Puerini, wiceprezes Amazon Go, wyznała, że detaliści zainteresowani technologią powinni najpierw opracować zrównoważony model biznesowy, zanim podejmą decyzję o wdrożeniu podobnego rozwiązania. Innymi słowy należy najpierw myśleć o kliencie i jego potrzebach, dopiero w kolejnym kroku dzięki aplikacji sprzedawca może uzyskać informacje zwrotne od swoich klientów w czasie rzeczywistym, co pomaga lepiej zarządzać sklepem i magazynem. Dla przykładu Amazon szybko uzyskał informację zwrotną od wegan, którzy narzekali, że ser jest wymieszany w sałatce. Dzisiaj oferuje ser oddzielnie, dołączony do pojemnika z zieleniną.
Tak jak komputery mają problem z rozpoznaniem podobnych obiektów, co wymusza umieszczanie ich z dala od siebie w sklepie, również ludzie czują opór przed opuszczeniem sklepu Amazona. Mimo że został zaprojektowany tak, aby zakupy były jak najbardziej naturalne, to wiele osób podczas pierwszych wizyt zatrzymuje się przed wyjściem, wahając się, czy rzeczywiście mogą opuścić sklep. Ten fakt zaskoczył projektantów systemu.
W sklepie Amazon Go nie ma punktu sprzedaży – pracownik sklepu, który teoretycznie zajmowałby się wprowadzaniem cen produktów na kasę, teraz doradza klientom podczas zakupów lub uzupełnia półki.
Należy zwrócić uwagę, że Amazon Go jest typowym sklepem spożywczym. Ze względu na szybkie zakupy, większą liczbę klientów i szybszą obsługę, regały muszą być stale uzupełniane – zwłaszcza w godzinach szczytu: w czasie śniadań, lunchu i po pracy. Zwiększony obrót w magazynie był kolejną rzeczą, która zaskoczyła twórców Amazon Go.
Pomimo spektakularnego sukcesu i kampanii informacyjnej o koncepcji Amazon Go nie wygląda na to, żeby obecnie jakakolwiek sieć dążyła do stworzenia podobnego sklepu. Jak wskazują wewnętrzne analizy Amazon, taki lokal handlowy potrzebuje tysięcy klientów, np. pracowników biurowych w najbliższej okolicy, aby inwestycja stała się opłacalna.
Koncepcja Amazon Go |
Koncepcja Amazon Go wykorzystuje technologię Just Walk Out, opierając się na analizie zawartości obrazu, syntezie danych z czujników i głębokim uczeniu się w celu wykrycia, kiedy produkty są zdejmowane z półek lub uzupełniane. Kupujący wchodzą do sklepu, autoryzując się za pośrednictwem aplikacji mobilnej na bramce przy wejściu, biorą z półki potrzebne artykuły, a przy wyjściu ze sklepu są za dokonane zakupy automatycznie obciążani. |
JAK TO DZIAŁA… |
1) Skonfiguruj aplikację – kupujący pobiera aplikację Amazon Go na swój telefon, zakłada konto i ustawia metodę płatności.2) Zeskanuj kod QR– gdy kupujący wchodzi do sklepu Amazon Go, otwiera aplikację i skanuje ją przy bramkach umieszczonych w pobliżu drzwi (wyglądają jak kołowroty w metrze).
3) Bierz – klient może swobodnie wędrować po sklepie, wybierając przedmioty z półki tak, jak w tradycyjnym sklepie i wkładać je do torby. Wbudowane technologie, takie jak kamery, czujniki pod półkami, widzenie maszynowe, sztuczne sieci neuronowe i inne systemy monitorują, jakie przedmioty wybiera kupujący, dodając je w tle do „wirtualnego” koszyka. 4) Wyjdź – i voila! Po zakończeniu zakupów klient po prostu opuszcza sklep. System automatycznie obciąża konto kupującego za dokonane zakupy. |
1) PWC, POHiD, Rynek handlu detalicznego w Polsce, 15 maja 2015 r. 2) Time-of-Flight to w skrócie technologia potrafiąca mierzyć prędkość światła odbitego od poszczególnych obiektów sceny. To stosunkowo stara metoda wykorzystywana w dalmierzach laserowych, a przez fanów konsol do gier znana z kinecta do Xbox One. Większość kamer Time-of-Flight jest oparta na zastosowaniu zmodulowanego promieniowania elektromagnetycznego o określonej długości fali do oświetlenia obiektu oraz rejestracji promieniowania odbitego. Dzięki modulacji można określić różnice w fazie sygnału nadawanego i odbieranego. Rozdzielczość przetworników obrazu tych kamer nie jest duża (do 320 x 240 pix), rozdzielczość pomiaru natomiast dochodzi do 1 cm.
Literatura
[1] „Amazon Go execs share insights into shopper behavior”, Anne D’Innocenzio, 19/03/2018, ChicagoTribune
[2] „Amazon Delays Opening of Cashierless Store to Work Out Kinks”, The Wall Street Journal, 27.03.2017 r.
[3] http://rfid.zone
[4] https://www.sanpeiventures.com/qr-code-rfid-or-computer-vision-3-levels-of-technologies-behind-unmanned-stores-in-china/
[5] „Amazon Go debuts, and its prying cameras foil our shoplifting attempts”, Sam Machkovech, ars TECHNICA, 22/1/2018
[6] https://purple.ai/blogs/amazon-go-technology-retail/
[7] https://www.amazon.com/
[8] https://www.techwalla.com/articles/advantages-disadvantages-of-rfid
[9] „6 Factors that Affect RFID Read Range”, Shain Armstrong, RFID INSIDER, 1/06/2013
Jan T. Grusznic
Z-ca red. naczelnego „a&s Polska”. Z branżą wizyjnych systemów zabezpieczeń związany od 2004 r. Ma bogate doświadczenie w zakresie projektowania i wdrażania rozwiązań dozoru wizyjnego w aplikacjach o rozproszonej strukturze i skomplikowanej dystrybucji sygnałów. Ceniony diagnosta zintegrowanych systemów wspomagających bezpieczeństwo.