Każdy, kto wypróbował Zdjęcia Google, zgodzi się, że ta bezpłatna usługa przechowywania i zarządzania zdjęciami od Google jest inteligentna. Zawiera różne inteligentne funkcje, takie jak wyszukiwanie zaawansowane, możliwość kategoryzowania zdjęć według lokalizacji i dat, automatyczne tworzenie albumów i filmów na podstawie podobieństw oraz poprowadzenie Cię w dół ścieżki pamięci, pokazując zdjęcia z tego samego dnia sprzed kilku lat. Jest wiele rzeczy, które mogą zrobić Zdjęcia Google, które kilka lat temu byłyby niemożliwe maszynowo. Zdjęcia Google to jedna z wielu „inteligentnych” usług Google korzystających z rozszerzenia technologia uczenia maszynowego o nazwie TensorFlow. Słowo uczenie się wskazuje, że technologia stanie się z czasem inteligentniejsza do tego stopnia, że nasza obecna wiedza nie może sobie tego wyobrazić. Ale co to jest TensorFlow? Jak maszyna może się uczyć? Co możesz z tym zrobić? Dowiedzmy Się.
Co to jest TensorFlow?
TensorFlow to potężne narzędzie Google typu open source oprogramowanie sztucznej inteligencji, który obsługuje wiele usług i inicjatyw Google. To druga generacja systemu do wielkoskalowych wdrożeń uczenia maszynowego, zbudowanego przez zespół Google Brain. Ta biblioteka algorytmu jest następcą DistBelief - pierwszej generacji.
Technologia przedstawia obliczenia jako stanowe wykresy przepływu danych. To, co wyróżnia TensorFlow, to możliwość modelowania obliczeń na szerokiej gamie sprzętu, od urządzeń mobilnych na poziomie konsumenckim po światowej klasy serwery z wieloma procesorami GPU. Może działać na różnych procesorach graficznych i procesorach i obiecuje skalowalność uczenia maszynowego wśród różnych urządzeń i gadżetów bez konieczności zmiany znacznej ilości kodu.
TensorFlow powstał z potrzeby instruowania Google system komputerowy naśladujący działanie ludzkiego mózgu w uczeniu się i rozumowaniu. System, znany jako sieci neuronowe, powinien być w stanie działać na wielowymiarowych tablicach danych zwanych „tensorami”. Ostatecznym celem jest wyszkolenie sieci neuronowych w zakresie wykrywania i rozszyfrowywania wzorców i korelacji.
W listopadzie 2015 roku Google stworzył tę technologię otwarte źródło i pozwolił na zaadaptowanie go do wszelkiego rodzaju produktów i badań. Każdy, w tym badacze, inżynierowie i hobbystów, może pomóc przyspieszyć rozwój uczenia maszynowego i przenieść go na wyższy poziom w krótszym czasie.
To posunięcie okazało się słuszne, ponieważ niezależnych programistów wnosi tak wiele wkładów do TensorFlow, że znacznie przewyższają one wkład Google. Wikipedia wspomina, że „są 1500 repozytoriów w serwisie GitHub, w którym wspomniano o TensorFlow, z których 5 pochodzi od Google ”. Biorąc to pod uwagę, w jednej z dyskusji w Quora podejrzewano, że udostępniony kod open source jest „oczyszczoną” wersją tego, którego Google używa w swoich usługach.
Jak działa TenserFlow?
Używając prostego, normalnego ludzkiego języka i dużego uproszczenia, możemy postrzegać jedną stronę TensorFlow jako zaawansowaną autonomiczną technologię filtrowania. Sercem tej technologii jest ogromna biblioteka oprogramowania do uczenia maszynowego. Korzysta z bazy danych, aby pomóc jej „podjąć decyzję”.
Na przykład ktoś przesyła zdjęcie do Zdjęć Google. Technologia porówna wszystkie szczegóły ze zdjęcia z bazą danych i zdecyduje, czy jest to zdjęcie zwierzęcia czy człowieka. Następnie, jeśli jest to człowiek, spróbuje określić płeć, wiek aż do tego, kim jest ta osoba. Ten sam proces jest powtarzany dla innych obiektów na zdjęciu.
Wykorzystuje również dane użytkownika, takie jak tożsamość osoby na zdjęciu i miejsce zrobienia zdjęcia, aby ulepszyć swoją bibliotekę, aby mogła dawać lepsze wyniki w przyszłości - zarówno dla osoby, która umieściła zdjęcie, jak i dla wszystkich jeszcze. Stąd termin „uczenie się”. Ale nie ogranicza się tylko do poznania i uczenia się danych ze zdjęć. Jest tak wiele, że technologia może zrobić z informacjami ze zdjęcia. Na przykład może grupować zdjęcia z podobnymi szczegółami, takimi jak ta sama osoba, ta sama lokalizacja, ta sama data; zobacz wzór twarzy, aby określić, do której rodziny i przyjaciół należy osoba na zdjęciu, i wykorzystaj te informacje do zrobienia filmów z rodzinnych wakacji lub animacji z ciągłych ujęć.
To ledwo zarysowuje sposób działania TensorFlow, ale mam nadzieję, że da ci ogólny obraz tej technologii. Ponadto użycie tylko jednego przykładu nie odda tego, do czego jest zdolny.
A dla wszystkich entuzjastów sztucznej inteligencji warto wspomnieć, że Google już stworzył technologię chipów komputerowych zoptymalizowaną pod kątem uczenia maszynowego i integrującą z nią TensorFlow. To jest nazwane Układ ASIC Tensor Processing Unit (TPU).
Ci, którzy chcą dowiedzieć się więcej o TensorFlow, mogą odwiedzić jego stronę z samouczkami.
Zastosowania TensorFlow
Jesteśmy na wczesnym etapie technologii uczenia maszynowego, więc nikt nie wie, dokąd nas to zaprowadzi. Ale jest kilka początkowych aplikacji, które mogą dać nam wgląd w przyszłość. Ponieważ pochodzi z Google, oczywiste jest, że Google wykorzystuje tę technologię w wielu swoich usługach.
-
Więcej o analizie obrazu
Omówiliśmy przykład wykorzystania technologii do analizy obrazu w Zdjęciach Google. Ale aplikacja do analizy obrazu jest również używana w funkcji Street View w Mapach Google. Na przykład TensorFlow służy do łączenia obrazu ze współrzędnymi mapy i automatycznego rozmycia numeru rejestracyjnego dowolnego samochodu, który został przypadkowo umieszczony na obrazie.
-
Rozpoznawanie mowy
Google używa również TensorFlow w swoim oprogramowaniu do rozpoznawania mowy z asystentem głosowym. Technologia, która umożliwia użytkownikom wypowiadanie instrukcji, nie jest nowa, ale włączenie stale powiększającej się biblioteki TensorFlow do tej mieszanki może podnieść tę funkcję o kilka stopni. Obecnie technologia rozpoznawania mowy rozpoznaje ponad 80 języków i wariantów.
-
Tłumaczenie dynamiczne
Innym przykładem „uczącej się” części technologii uczenia maszynowego jest funkcja tłumaczenia Google. Google umożliwia swoim użytkownikom dodawanie nowych słowników i naprawianie błędów w Tłumaczu Google. Coraz więcej danych można wykorzystać do automatycznego wykrywania języka wejściowego, który inni użytkownicy chcą przetłumaczyć. Jeśli maszyna popełnia błędy w procesie wykrywania języka, użytkownicy mogą je poprawić. Maszyna nauczy się na tych błędach, aby poprawić swoją przyszłą wydajność. Cykl trwa.
-
Alpha Go
Zabawnym przykładem wykorzystania TensorFlow jest Alpha Go. Jest to aplikacja, która jest zaprogramowana na graj w Go. Dla tych, którzy nie znają Go, jest to abstrakcyjna gra planszowa dla dwóch graczy, która powstała w Chinach ponad pięć tysięcy pięćset lat temu i jest to najstarsza gra planszowa, w którą ciągle się gra. Chociaż zasady są proste - otoczyć więcej terytorium niż przeciwnik, gra jest niesamowicie złożona i według Wikipedii: „ma więcej możliwości niż całkowita liczba atomów w widzialnym wszechświecie”.
Jest więc interesujące, co może zrobić ucząca się technologia maszynowa z nieskończonymi możliwościami. W meczach z Lee Sedolem - 18-krotnym mistrzem świata w Go, Alpha Go wygrała 4 z 5 meczów i otrzymała honorową najwyższą rangę arcymistrza Go.
-
Projekt Magenta
Innym interesującym zastosowaniem TensorFlow jest projekt Magenta. To ambitny projekt do stworzenia sztuka generowana maszynowo. Jednym z wczesnych namacalnych rezultatów eksperymentu jest 90-sekundowa melodia fortepianu. W dłuższej perspektywie Google ma nadzieję wygenerować bardziej zaawansowaną grafikę generowaną maszynowo za pośrednictwem projektu Magenta i zbudować wokół niego społeczność artystów..
W lutym 2016 r. Firma Google zorganizowała również wystawę i aukcję sztuki w San Fransisco, na której pokazano 29 wygenerowanych komputerowo - przy niewielkiej pomocy człowieka - dzieł sztuki. Sześć największych dzieł sprzedano za 8 000 dolarów. Komputer może nadal mieć bardzo długą drogę do przebycia, zanim będzie mógł naśladować prawdziwego artystę, ale ilość pieniędzy, które ludzie są skłonni zapłacić za sztukę, pokazuje nam, jak daleko zaszła technologia.
Wsparcie dla iOS
Chociaż widzieliśmy już możliwości TenserFlow w systemie Android, w jego najnowszej wersji TensorFlow wreszcie dodaje obsługę urządzeń z systemem iOS. Ponieważ istnieje mnóstwo wspaniałych aplikacji mobilnych dostępnych wyłącznie na iOS lub wydanych jako pierwsze na iOS, oznacza to, że w najbliższej przyszłości możemy spodziewać się kolejnych świetnych aplikacji mobilnych wykorzystujących uczenie maszynowe. To samo można powiedzieć o możliwościach szerszych adaptacji i zastosowań TensorFlow.
Przyszłość TensorFlow
Co można zrobić z maszyną, która potrafi się uczyć i samodzielnie podejmować decyzje? Jako osoba, która na co dzień ma do czynienia z więcej niż jednym językiem, pierwszą rzeczą, która przychodzi mi do głowy, jest tłumaczenie językowe. Nie na poziomie słowa, ale bardziej na dłuższym poziomie tekstu, takim jak dokumenty, a nawet książki. Dzisiejsza technologia tłumaczenia ogranicza się do słowników. Możesz łatwo dowiedzieć się, co „śpi” po chińsku i na odwrót, ale spróbuj wrzucić jeden rozdział Musashi Eiji Yoshikawy w oryginalnym japońskim i przetłumaczyć go na angielski. Zobaczysz, do czego zmierzam.
Fajnie jest też zobaczyć, co przyszłość sztucznej inteligencji może zrobić z muzyką. Choć nadal jest to bardzo proste, aplikacja Music Memo firmy Apple może już dawać automatyczny akompaniament basu i perkusji do nagranego śpiewu. Pamiętam jeden odcinek programu telewizyjnego SciFi, w którym postać z serialu stworzyła maszynę, która analizuje wszystkie najpopularniejsze utwory na listach przebojów i jest w stanie napisać własne przeboje. Czy kiedykolwiek tam dotrzemy?
I jako myśl końcowa chciałbym wspomnieć Sunspring. To krótki film science fiction napisany w całości przez scenarzystę AI, który sam siebie nazwał Benzoes - który skomponował nawet muzyczny interludium do piosenki pop. Film został zmontowany przez reżysera Oscara Sharpa na 48-godzinne wyzwanie filmowe Sci-Fi London.
Teraz nie mogę przestać myśleć o Terminatorze. Witamy w przyszłości.
Źródło zdjęcia: Wikipedia, TechInsider, The Verge, Wall Street Journal