Górnośląskie Centrum Obliczeń Naukowych i Inżynierskich

Detekcja skóry w obrazach cyfrowych oraz jej poprawna segmentacja stanowi aktywny obszar badawczy i znajduje zastosowanie w wielu zagadnieniach komputerowej wizji dotyczących rozpoznawania gestów, filtracji treści, klasyfikacji obrazów, kompresji i wielu innych. Podstawą działania istniejących w tym zakresie rozwiązań jest modelowanie barwy ludzkiej skóry, a następnie stosowanie przygotowanego modelu do klasyfikacji poszczególnych pikseli obrazu lub określenia prawdopodobieństwa, że przedstawiają one skórę.

Wśród modeli barwy skóry można wyodrębnić dwie podstawowe grupy, mianowicie modele regułowe i statystyczne. Pierwsze z nich działają na podstawie reguł zdefiniowanych w wejściowej lub odpowiednio przekształconej przestrzeni barwnej. Druga grupa metod wymaga statystycznej analizy rozkładu barwy skóry w wielu obrazach stanowiących próbkę treningową, a następnie w oparciu o tę analizę przeprowadzana jest detekcja.

Metody te pozwalają na przekształcenie obrazu w mapę prawdopodobieństwa przynależności poszczególnych pikseli do skóry, która następnie poddawana jest progowaniu w celu wskazania obszarów występowania ludzkiej skóry. Procedura ta obarczona jest najczęściej dość dużym błędem wynikającym z niskiej specyficzności, a jednocześnie wysokiej wariancji barwy ludzkiej skóry. Błędy te można ograniczać na kilka sposobów, wśród których można wyróżnić: 1) adaptację modelu barwnego do osoby lub sceny, 2) wykorzystanie cech teksturalnych obrazów barwnych lub map prawdopodobieństwa występowania skóry, i 3) analizę spójności obszarów występowania skóry. Adaptacja modelu barwnego wymaga najczęściej wskazania regionu w obrazie przedstawiającego ludzką skórę – informacja ta może być podana przez użytkownika lub pozyskana automatycznie, na przykład za pomocą detektora twarzy. Model barwy skóry otrzymany na podstawie zadanego regionu (zwany modelem lokalnym) umożliwia detekcję skóry z wysoką precyzją klasyfikacji, ale jednocześnie przy niskiej czułości. Z tego względu model lokalny łączony jest z modelem globalnym, co pozwala na poprawę jakości klasyfikacji.

Algorytm opisany w pracy realizuje adaptację modelu barwy skóry do przedstawionej sceny. Adaptacja przeprowadzana jest bez konieczności jawnego wskazywania fragmentu skóry – jest on pozyskiwany poprzez zaproponowaną w pracy analizę mapy prawdopodobieństwa występowania skóry, otrzymanej za pomocą modelu globalnego. Następnie model lokalny wykorzystywany jest do wyznaczenia w obrazie ziaren rozrostu dla geodezyjnej transformacji odległościowej, z użyciem której realizowana jest analiza spójności obszarów występowania skóry. Wagi do transformacji odległościowej obliczane są w dziedzinie barwy oraz w dziedzinie prawdopodobieństwa występowania skóry, przy czym wykorzystywane jest tutaj prawdopodobieństwo otrzymane za pomocą modelu globalnego. Tym samym model lokalny łączony jest z modelem globalnym w ramach analizy spójności obszarów występowania skóry.

Istotnym etapem zaproponowanego algorytmu jest wspomniany wcześniej sposób pozyskiwania fragmentu skóry, na podstawie którego realizowana jest adaptacja. Najpierw w mapie prawdopodobieństwa występowania skóry, otrzymanej za pomocą modelu globalnego, wyznaczane są piksele cechujące się wysokim prawdopodobieństwem (określane są one mianem ziaren początkowych, ang. initial skin seeds – ISS). Ich analiza pozwala na stwierdzenie czy w obrazie w ogóle znajdują się regiony przedstawiające ludzką skórę. Jeżeli odpowiedź na to pytanie jest pozytywna, to dokonywane jest następnie nieznaczne rozszerzenie ziaren ISS z wykorzystaniem geodezyjnej transformacji odległościowej. Dopiero uzyskane w taki sposób piksele są wykorzystywane do nauki lokalnego modelu barwy skóry, dzięki któremu realizowany jest transfer ziaren w dziedzinie barwy.

W pracy przedstawiono wyniki szeroko zakrojonych badań eksperymentalnych, w ramach których zrealizowana została analiza czułościowa zaproponowanej metody oraz wykonane zostały porównania z wieloma detektorami skóry opracowanymi w ostatnich latach. Otrzymane wyniki jednoznacznie potwierdziły wysoką skuteczność nowego algorytmu, a jednocześnie pozwoliły na zidentyfikowanie jego potencjalnych słabości i wskazanie kierunków dalszych prac.