Podstawy głębokiego uczenia się

Dogłębne uczenie się jest potężną formą uczenia maszynowego (ML), która buduje złożone struktury matematyczne zwane sieciami neuronowymi, wykorzystując ogromne ilości danych (informacji).

Głęboka definicja uczenia się

Dogłębne uczenie się jest sposobem na wdrożenie ML przy użyciu wielu warstw sieci neuronowych do przetwarzania bardziej złożonych typów danych. Czasami nazywany nauczaniem hierarchicznym, głębokie uczenie się wykorzystuje różne typy sieci neuronowych do uczenia się funkcji (zwanych także reprezentacjami) i odnajdywania ich w dużych zestawach surowych, nieoznaczonych danych (dane niestrukturalne). Jednym z pierwszych przełomowych pokazów głębokiego uczenia się był program, który z powodzeniem wybrał zdjęcia kotów z zestawów filmów z YouTube.

Głębokie przykłady uczenia się w życiu codziennym

Głębokie uczenie się jest stosowane nie tylko w rozpoznawaniu obrazów, ale także w tłumaczeniu języka, wykrywaniu oszustw i analizie danych zebranych przez firmy na temat ich klientów. Na przykład Netflix używa głębokiego uczenia się, aby przeanalizować swoje nawyki oglądania i przewidzieć, które programy i filmy wolisz oglądać. W ten sposób Netflix wie, że w kolejce sugestii umieści filmy akcji i naturalne filmy dokumentalne. Amazon korzysta z głębokiego uczenia się, aby analizować swoje ostatnie zakupy i przedmioty, które niedawno wyszukiwałeś, aby stworzyć sugestie dotyczące nowych albumów muzycznych kraju, które prawdopodobnie Cię zainteresują, oraz że jesteś na rynku pary szarego i żółtego tenisa buty. Ponieważ głębokie uczenie się zapewnia coraz więcej informacji z niestrukturalnych i nieprzetworzonych danych, korporacje mogą lepiej przewidywać potrzeby swoich klientów, podczas gdy indywidualny klient otrzymuje bardziej spersonalizowaną obsługę klienta.

Sztuczne sieci neuronowe i głębokie uczenie się

Aby ułatwić zrozumienie głębokiego uczenia się, powróćmy do naszego porównania sztucznej sieci neuronowej (SSN). Dla głębokiego uczenia się, wyobraź sobie, że nasz 15-piętrowy budynek biurowy zajmuje blok miejski z pięcioma innymi budynkami biurowymi. Po obu stronach ulicy znajdują się trzy budynki. Nasz budynek buduje A i dzieli tę samą stronę ulicy co budynki B i C. Po drugiej stronie ulicy od budynku A znajduje się budynek 1, a naprzeciwko budynku B znajduje się budynek 2 i tak dalej. Każdy budynek ma inną liczbę pięter, jest wykonany z różnych materiałów i ma inny styl architektoniczny niż pozostałe. Jednak każdy budynek jest nadal ułożony w osobne piętra (warstwy) biur (węzłów) - w związku z tym każdy budynek jest unikalnym ANN.

Wyobraź sobie, że do budynku A dociera pakiet cyfrowy zawierający wiele różnego rodzaju informacji z wielu źródeł, takich jak dane tekstowe, strumienie wideo, strumienie audio, połączenia telefoniczne, fale radiowe i fotografie - jednak pojawia się w jednym wielkim zbiegu i nie jest oznakowane ani posortowane w żaden logiczny sposób (dane niestrukturalne). Informacje są przesyłane przez każde piętro w kolejności od 1^ul do 15^th do przetwarzania. Po zbieraniu informacji do 15^th piętro (wyjście), jest wysyłane do 1^ul piętro (wejście) budynku 3 wraz z końcowym wynikiem przetwarzania z budynku A. Budynek 3 uczy się i zawiera wynik wysłany przez budynek A, a następnie przetwarza informacje w każdym z pięter w ten sam sposób. Gdy informacja dotrze do najwyższego piętra budynku 3, zostanie przesłana z tego miejsca, a wyniki tego budynku zostaną przesłane do budynku 1. Budynek 1 uczy się i zawiera wyniki z budynku 3 przed przetworzeniem go piętro po piętrze. Budynek 1 przekazuje informacje i wyniki w taki sam sposób do budynku C, który przetwarza i wysyła do budynku 2, który przetwarza i wysyła do budynku B.

Każda SSN (budynek) w naszym przykładzie szuka innej funkcji w niestrukturalnych danych (zbieranina informacji) i przekazuje wyniki do następnego budynku. Następny budynek zawiera (dowiaduje się) wyniki (wyniki) z poprzedniego. Ponieważ dane są przetwarzane przez każdą SSN (budynek), zostaje ona uporządkowana i opatrzona etykietą (sklasyfikowana) według określonej cechy, tak że kiedy dane docierają do ostatecznego wyniku (ostatniego piętra) ostatniej SSN (budynku), jest klasyfikowana i oznaczana etykietą (bardziej uporządkowany).

Sztuczna inteligencja, uczenie maszynowe i głęboka nauka

Jak głębokie uczenie się pasuje do ogólnego obrazu sztucznej inteligencji (AI) i ML? Głęboka nauka zwiększa moc ML i zwiększa zakres zadań, które AI jest w stanie wykonać. Ponieważ głębokie uczenie się opiera się na wykorzystaniu sieci neuronowych i rozpoznawaniu funkcji w zestawach danych zamiast prostszych algorytmów specyficznych dla zadania, może wyszukiwać i wykorzystywać detale z niestrukturalnych (surowych) danych bez potrzeby ręcznego oznaczania przez programistę najpierw - raz - wykonanie zadania, które może wprowadzić błędy. Głębokie uczenie się pomaga komputerom lepiej i lepiej wykorzystywać dane, aby pomóc zarówno korporacjom, jak i osobom prywatnym.