Sama budowa nie wystarczy

Adam Beniowski
Adam Beniowski
24 marca 2022

W grudniu 2021 McKinsey opublikował raport “The State of AI in 2021”. Ten artykuł to część mojej subiektywnej analizy tej publikacji. Kluczowe wnioski znajdziesz pod tym linkiem, zawarłem tam też odnośniki do innych części analizy.

Firmy przodujące w wykorzystywaniu AI, dużo lepiej zdają sobie sprawę, że warto i należy dbać o rozwój modeli AI.

Raz wyprodukowany model teoretycznie może sprawdzać się przez kilka miesięcy. W praktyce, często okazuje się, że był on adekwatny do rzeczywistości jedynie przez krótki okres, np. do momentu, gdy nastąpiło gwałtowne załamanie rynku. 

Nawet bez gwałtownych zmian rynkowych, co w świecie VUCA jest rzadkością, większość modeli AI, wraz z mijającym czasem, staje się coraz mniej skuteczna. Wiemy to z własnej praktyki, jednak jak wskazuje McKinsey zdają sobie z tego sprawę jedynie firmy z dużym doświadczeniem w wykorzystaniu AI. Oczywiście czas trwałości modelu bardzo zależy od branży i wykorzystania AI. W przypadku, do którego najczęściej wykorzystujemy AI, jako PBS, a więc przy wykorzystaniu Image Recognition do kontroli dostępności i ekspozycji produktów w punktach sprzedaży. Swego rodzaju bieżąca dbałość i opieka nad siecią są szczególnie istotne. Aby model w pełni wykorzystywał swój potencjał, konieczne jest jego zasilanie nowymi danymi i trenowanie z ich użyciem. Dla przykładu, w ofercie każdej firmy ciągle pojawiają się nowe produkty, a te obecne dotychczas, zmieniają opakowania, wymiary, kształty lub  komunikowane na nich promocje. W przypadku Image Recognition nie rozwijana AI “umiera” dość szybko. 

Badanie McKinsey wskazuje kilka poziomów najlepszych praktyk dbania
o sieć AI: 

  1. Podstawowe, 
  2. Zaawansowane zarządzanie danymi, 
  3. Zaawansowane modelowanie, narzędzia i technologie,
  4. Angażowanie użytkowników.

wykres artykuł AB - 02Na podstawie raportu McKinsey "The state of AI in 2021".

Te różnice w pojmowaniu jak ważny jest rozwój AI, dostrzegalne są w każdym z w/w obszarów. Na mnie szczególne wrażenie zrobił trzeci poziom najlepszych praktyk a w nim świadomość, że modele AI należy regularnie odświeżać, bazując na jasno zdefiniowanych kryteriach. Tu różnica między “AI high performers” (czyli organizacjami, które przodują w wykorzystaniu AI) a pozostałymi respondentami przekraczała 100%. Doświadczeni użytkownicy deklarują, iż nawet trzy razy częściej postępują zgodnie z tą praktyką. 

Kolejnym elementem, jaki dużo częściej zauważają  zaawansowani użytkownicy AI, jest konieczność odświeżania pakietu technologii wspierających AI, przynajmniej raz w roku. Respondenci w tych firmach wskazują tę praktykę, jako istotny czynnik zdobywania trwałej przewagi konkurencyjnej i robią to aż 3 razy częściej niż, początkujący użytkownicy AI. 

Praktycznie co miesiąc powstają nowe opracowania naukowe z zakresu rozwoju AI. Co miesiąc pojawiają się nowe techniki i technologie trenowania sieci AI. Nowe mechanizmy ułatwiające i usprawniające trening, kontrolę i rozwój funkcjonowania AI, wchodzą na rynek. Jeszcze kilka lat temu zbudowanie sieci funkcjonującej w środowisku bez dostępu do internetu, zainstalowanej na telefonie średniej klasy, obsługującej rozpoznawanie kilkuset produktów z prędkością kilkudziesięciu weryfikacji na sekundę byłoby niemożliwe. Mówimy o aplikacji, która działa offline i może być zainstalowana na ogólnodostępnym urządzeniu, np. z systemem Android. Wydawało się to niedoścignionym celem, jeszcze 2-3 lata temu. Od kilkunastu miesięcy budujemy takie sieci i sami wyprodukowaliśmy aplikację, która to umożliwia. 

Warto dodać, że AI jest bardzo szerokim pojęciem, coraz szerzej wspiera ludzkość. Podążanie za szczegółowymi zdobyczami nauki w całym zakresie AI, nie jest możliwe bez posiadania bardzo zaawansowanych wiedzowo zasobów, co zresztą wg mnie, w wielu wypadkach nie ma sensu. Posiadanie ekspertyzy wewnętrznej w każdej dziedzinie, w tym w  AI, bywa bardzo drogie i często nieopłacalne dla organizacji. My, jako zewnętrzny dostawca zaawansowanych usług Image Recognition, od ponad 6 lat koncentrujemy się na rozwoju AI, właśnie w tym obszarze pogłębiając i rozwijając swoją wiedzę. Poszukujemy najnowszych technologii, rozwijamy własne narzędzia i procesy, implementując je do naszego łańcucha produkcyjnego. 

wykres artykuł AB - 01Na podstawie raportu McKinsey "The state of AI in 2021".

Warto przyjrzeć się też sekcji z dobrymi praktykami, dotyczącej zarządzania danymi. To co szczególnie zwróciło moją uwagę, to wyniki badania w obszarze posiadania słownika danych oraz procesów, który można skalować, w obszarze oznaczania danych, odpowiedniego ich przygotowania do zestawu treningowego. Dlaczego te 2 elementy są takie ważne? 

Posiadanie odpowiedniej struktury i uporządkowania danych wejściowych jest ważne z tego samego powodu, co posiadanie sprawdzonego procesu etykietowania danych wejściowych do zestawu treningowego. To nic innego jak baza do nauki AI. W dużym uproszczeniu jedna z najczęściej stosowanych metod treningu AI, polega na wskazaniu zestawu prawidłowych i błędnych odpowiedzi na określony problem (tzw. supervised learning). Zarówno prawidłowe, jak i błędne odpowiedzi powinny posiadać odpowiednie oznaczenia - etykiety. AI wypracowuje swoje algorytmy, tworząc sieć tak, aby zmaksymalizować zgodność odpowiedzi własnych, z odpowiedziami z zestawu treningowego. Aby wyprodukować dobrą AI, musimy być pewni odpowiedzi zamodelowanych w zestawie treningowym. Jeżeli w zestawie jest bałagan, jeżeli odpowiedzi posiadają złe etykiety, model wytrenowany na takim zestawie będzie mało wiarygodny. W przypadku Image Recognition, odpowiednie etykietowanie lub inaczej labelowanie danych wejściowych, to bardzo złożony
i skomplikowany proces.

Jak wynika z raportu McKinsey, świadomość wagi w/w jest 2 razy większa u doświadczonych użytkowników AI. Warto zauważyć, że tylko co 5 z ankietowanych początkujących użytkowników, rozumie wagę tego problemu. Moim zdaniem fakt,
iż jedynie co drugi z wysoko doświadczonych respondentów zauważyło to wyzwanie, jest również niepokojący. Wg mnie zdecydowanie zbyt mało managerów zajmujących się AI, ewentualnie zakupami tych usług zdaje sobie z tego sprawę, jak ważne są procesy nauki AI i ile detali musi zostać zaadresowanych aby AI dawała zadowalające rezultaty. 

Świadomość faktu, że raz wyprodukowana AI, nie działa w nieskończoność, jest bardzo istotna. W naszej rynkowej praktyce, często spotykamy się z propozycjami, typu: “To wyprodukujcie nam sieć, a my już później sobie z nią poradzimy”. Siecią należy się opiekować jak żywym organizmem. Wszystkie czynności z tym związane, w tej nadal pionierskiej dziedzinie, ciągle należy doskonalić. To bardzo złożony
i skomplikowany proces. Jednocześnie jestem świadomy, że dla wielu osób chcących używać AI, jest on niewidoczny lub mało namacalny. W końcu “Sztuczna Inteligencja” zawiera w swojej nazwie słowo “Inteligencja”, czyli coś co się “samo” rozwija
i aktualizuje.

👉 Zapraszamy do śledzenia naszej aktywności w mediach społecznościowych, aby być na bieżąco:

Nasz profil na Facebook'u New call-to-action

baner-nowy-123b

 

TAGI: photorecognition, prodisplay, probspl, retail, aiinretail, ai, imagerecognition