Meta tworzy nowy system tłumaczenia. Poradzi sobie z językami, z którymi nie radzą sobie lingwiści
Tłumaczenie maszynowe, choć coraz doskonalsze, ma jedną piętę achillesową: języki bez jednolitego systemu zapisu. Jak deklaruje Meta, dzięki nowo opracowanej metodzie uczenia maszynowego, już wkrótce sztuczna inteligencja może być w stanie swobodnie tłumaczyć tysiące języków, z którymi nie są w stanie poradzić sobie lingwiści.
Metę znamy przede wszystkim jako spółkę zarządzającą Facebookiem, Instagramem, Messengerem i Whatsappem. Osoby znające tematy technologiczne głębiej utożsamiają Metę również z projektem wirtualnego świata Metaverse, który przynosi firmie Marka Zuckerberga stałe straty.
W skład Mety wchodzi również Meta AI, laboratorium pracujące nad rozwojem sztucznej inteligencji. Do jednych z zadań Meta AI należy praca nad doskonaleniem zdolności SI pod względem rozumienia języka naturalnego i generowania wypowiedzi naśladujących język naturalny. Efektem prac Meta AI jest pionierska technologia, która jest w stanie tłumaczyć z języków nieposiadających formy pisanej.
Tłumaczenie języka bez formy zapisu. Meta przeciera szlaki dla sztucznej inteligencji
Współcześnie lingwistom znanych jest 7139 żywych języków, z czego jedynie 4065 języków posiada system zapisu. Pozostałe 3074 języki należą przede wszystkim do plemion i niewielkich kręgów kulturowych, zamieszkujących w niedostępnych terenach Afryki, Azji i Ameryki Południowej. Jednym z przykładów niezapisywalnego języka jest Hokkien. Choć przez wielu Hokkien uważany jest za dialekt języka chińskiego, w przeciwieństwie do większości dialektów nie posiada jednolitego, znormalizowanego systemu zapisu, bazując na zapożyczeniach i znakach wymyślonych na potrzeby zapisu, niemających wiele wspólnego z zapisem języka chińskiego.
Tworząc model tłumaczący pomiędzy Hokkien a angielskim, inżynierowie Mety, oprócz braku jednolitego systemu zapisu, musieli zmierzyć się z jeszcze jednym problemem: niewielkimi zasobami. Do treningu modelu mieli oni wąski zasób danych szkoleniowych, ale i ludzkich tłumaczy będących w stanie manualnie tłumaczyć z angielskiego na Hokkien.
Rozwiązaniem było zastosowanie języka mandaryńskiego jako pomostu łączącego język angielski i Hokkien. Sztuczna inteligencja była trenowana na danych, które przetłumaczono z języka angielskiego na mandaryński, a następnie na Hokkien i na odwrót. Metoda ta znacznie poprawiła wydajność modelu poprzez wykorzystanie danych z podobnego języka o dużym zasobie.
Dzięki próbnie wytrenowanemu koderowi mowy, inżynierowie Mety byli w stanie zakodować osadzenia mowy Hokkien w tej samej przestrzeni semantycznej co inne języki, bez konieczności posiadania przez Hokkien formy pisemnej.
Jak działa tłumaczenie niepisemnego języka?
Powszechnie znane systemy tłumaczenia opierają się na transkrypcji. Sztuczna inteligencja przechwytuje wypowiedziany tekst i przeprowadza transkrypcje poszczególnych dźwięków na znaki systemu pisma. Następnie model tłumaczy wygenerowany tekst na wybrany język. Jednak w przypadku języków nieposiadających jednolitego systemu zapisu, ta metoda jest nieefektywna.
Sztuczna inteligencja Mety wykorzystuje metodę S2UT (speech-to-unit translation, tłumaczenie mowy na jednostki). Metoda ta pozwala na tłumaczenie mowy - sygnału wejściowego na sekwencję jednostek akustycznych. Następnie owa sekwencja jednostek jest przetwarzana na graficzne fale akustyczne, z których sztuczna inteligencja generuje dwa tłumaczenia: tekstowe na język mandaryński i mowę w języku angielskim.
Jak mówi Meta, obecny postęp projektu pozwala na głosową konwersację osoby mówiącej po angielsku z osobą mówiącą w Hokkien. Obecnie model jednorazowo może przetłumaczyć jedno zdanie, jednakże zdaniem inżynierów Meta AI, pionierskie techniki opracowane przez laboratorium "mogą być rozszerzone na wiele innych języków pisanych i niepisanych".
Sztuczna inteligencja w tłumaczach? Właściwie bez niej nie istniałby żaden tłumacz
Choć zastosowanie sztucznej inteligencji w systemie tłumaczenia wydaje się być kolejną nowością i pionierskim zastosowaniem SI, w rzeczywistości żadne oprogramowanie do tłumaczenia maszynowego nie byłoby w stanie działać bez sztucznej inteligencji. Tłumaczenie maszynowe z wykorzystaniem sztucznej inteligencji sięga lat 50. ubiegłego wieku.
Pierwszy publiczny pokaz tłumaczenia maszynowego miał miejsce 7 stycznia 1954 roku w Nowym Jorku, kiedy to w siedzibie IBM przeprowadzono eksperyment Georgetown-IBM, w ramach którego komputer naukowy IBM 701 przetłumaczył wcześniej przygotowane wypowiedzi w języku rosyjskim. Wypowiedzi dotyczyły przede wszystkim chemii, jednakże mimo to wprawiły w zachwyt opinię publiczną
Publiczna demonstracja tego, co uważa się za pierwsze udane użycie maszyny do tłumaczenia znaczących tekstów z jednego języka na drugi, miała miejsce tutaj wczoraj po południu. Może to być kumulacja wieków poszukiwań przez uczonych "mechanicznego tłumacza". Jak na razie system dysponuje słownictwem liczącym zaledwie 250 słów. Ale nie ma przewidywalnych ograniczeń co do liczby słów, które urządzenie może przechowywać, ani liczby języków, które można skierować do tłumaczenia. Uczeni i naukowcy, którzy nad nim pracowali, uważają, że w ciągu kilku lat system może znacznie zwiększyć komunikację, szczególnie w tematach technicznych, dzięki temu, że tłumaczenie będzie szybkie, dokładne i łatwe. [...]
Robert K. Plumb, The New York Times, "Russian Is Turned Into English By a Fast Electronic Translator; Calculator Takes on a New Job: Language Translation LANGUAGE DEVICE TRANSLATES FAST", 8 stycznia 1954