REKLAMA

7 świetnych funkcji Galaxy AI działających w Polsce - test AI od Samsunga

Wraz z premierą smartfonów Z Flip 6 oraz Z Fold 6 sztuczna inteligencja Galaxy AI nauczyła się nowych, przydatnych sztuczek. Zdecydowana większość działa w Polsce, a ja postanowiłem wybrać dla was najciekawsze.

Test 7 świetnych funkcji Galaxy AI dostępnych w Polsce
REKLAMA

Samsung i Apple to w kontekście AI trochę jak dobra i zła strona mocy. Koreańczycy ogłosili misję demokratyzacji sztucznej inteligencji, wdrażając Galaxy AI na jak największą liczbę urządzeń. Do końca 2025 roku takich sprzętów ma być na rynku już ponad 200 milionów. W tym samym czasie Apple - jak ma w zwyczaju - udaje że świat poza USA nie istnieje. Firma Tima Cooka nie tylko jest spóźniona na tematyczne AI Party, ale też nie wyraża chęci szybkiego wdrażania Apple Intelligence poza Stanami.

REKLAMA

Oczywiście Samsung nie jest grupą altruistów walczących z globalnym cyfrowym wykluczeniem. To gigantyczna korporacja dla której liczy się zysk oraz dominacja. Sztuczna inteligencja ma być do tej dominacji kluczem. Dlatego Koreańczycy wytoczyli wielkie działa, integrując Galaxy AI z aż 16 językami. W tym z językiem polskim.

Wiem, mam gigantyczny talent

Dzięki wsparciu polskiego języka Galaxy AI wyrasta na jedną z najsilniejszych nowości w smartfonach Samsunga, także w Polsce. Wraz z debiutem składaków Fold 6 i Flip 6 sztuczna inteligencja Koreańczyków nauczyła się zupełnie nowych sztuczek. Po prawie tygodniu ze składanymi smartfonami chciałbym wam pokazać najciekawsze z nich:

1. Generowanie grafik na podstawie prostych bazgrołów.

Rysując palcem bądź rysikiem po ekranie smartfonu, Galaxy AI zamienia naszą pożałowania godną twórczość w pełne detali grafiki. Bazgroły na poziomie 5-latka takie jak domek, kotek czy drzewko zamieniają się w cyfrowe dzieła, a cały proces zajmuje zaledwie kilka sekund. Tyle wystarczy by Galaxy AI wygenerowało kilka propozycji stworzonych na podstawie naszego szkicu.

Co przydatne, Galaxy AI może generować grafiki na podstawie bazgrołów w pięciu różnych stylach: akwarela, rysunek, szkic, pop art oraz kreskówka 3D. Wybrany przez nas wariant zostaje zapisany jako .jpg w rozdzielczości 1536 na 1536 pikseli, zajmując zazwyczaj między 500 kB i 2 MB przestrzeni na telefonie.

Przykład 1: "mamy pikaczu w domu"

Przykład 2: liść

Przykład 3: rycerz

Ciekawe jest to, że w przypadku bardziej złożonych bazgrołów, jak mój przepiękny rycerz, Galaxy AI lubi się poddawać. Sztuczna inteligencja albo generuje mniej wariantów grafiki do wyboru, albo nie generuje ich wcale. AI jest przy tym dosyć niekonsekwentne. Dwa razy nie chciało wygenerować mojego rycerza w stylu szkic, ale za trzecim razem wypluło jedną propozycję.

Co z rysunkami bardziej, ekhem, wulgarnymi czy fallicznymi? Widząc je, Galaxy AI albo staje się dziecinnie naiwna, zamieniając penisy godne marginesów z zeszytu gimnazjalisty w grzybki, albo wprost odmawia wygenerowania grafiki.

Co imponuje już teraz:

  • szybkość generowania grafiki
  • kilka propozycji do wyboru
  • skuteczna interpretacja bazgrołów

Co może być lepsze:

  • mała powierzchnia do rysowania
  • AI gubi się przy bardziej skomplikowanych szkicach
  • Galaxy AI czasem zbyt szybko się poddaje
  • Czekam na "realistyczny" styl

2. Transkrypcja z dyktafonu z uwzględnieniem rozmówców

Aplikacja Dyktafon od Samsunga ma nowego lokatora - Galaxy AI. Sztuczna inteligencja tłumaczy nagrane rozmowy i zamienia je w pisaną transkrypcję, którą potem można wyeksportować jako plik tekstowy. Dobre narzędzia tego typu są niezwykle przydatne w mojej pracy oraz - niestety - płatne. Dlatego z chęcią sprawdziłem na co stać transkrypcje Samsunga.

Rozpoznawanie polskiej mowy nie działa idealnie. Narzędzia takie jak MacWhisper pozostają tutaj skuteczniejsze. Model Samsunga jest jednocześnie niezbyt dokładny oraz aż nazbyt dokładny. Z jednej strony myli odmianę końcówek bądź miesza konkretne wyrazy, by z drugiej bezwzględnie wpisywać rozmaite „hmm” oraz „eee” w transkrypcję. Jest duże pole do poprawy, chociaż już teraz Dyktafon wsparty AI może pomagać i przyspieszać pracę media workerów.

Bardzo spodobało mi się, że Galaxy AI rozpoznaje rozmaitych uczestników rozmowy na podstawie cech ich głosu. Można im przypisać nazwy czy inicjały, co znacząco ułatwia potem odczyt. Do tego słuchając nagrania, widzimy zaznaczony na niebiesko zapisany tekst, co także ułatwia pracę podczas spisywania wywiadów. Mamy zatem solidne podstawy i liczę, że Dyktafon Samsunga będzie tylko lepszy.

Co imponuje już teraz:

  • identyfikacja rozmówców
  • synchronizacja słowa i tekstu w podglądzie
  • funkcja podsumowania nagranej treści

Co może być lepsze:

  • skuteczność w rozpoznawaniu polskiego języka
  • mniej "ee" i "yy" zamienianych na tekst
  • lepsze zrozumienie kontekstu

3. Zamiana zdjęć selfie w imponujące awatary.

Pamiętacie gdy eksplodowała popularność płatnej aplikacji generującej awatary na podstawie naszych zdjęć portretowych? Teraz to samo robi Galaxy AI, całkowicie za darmo, przy pomocy narzędzia Studio portretu. Sztuczna inteligencja Samsunga zamienia nasze selfie w kolorowe, stylowe grafiki, w sam raz do wykorzystania jako profilowe w tych mniej poważnych mediach społecznościowych.

Przykład 1:

Przykład 2:

Studio portretu napędzane przez Galaxy AI zamienia selfie na awatary w kilku różnych stylach: komiks, kreskówka 3D, akwarela oraz szkic. Mój ulubiony efekt to zdecydowanie komiks. Jest co prawda najmniej zaawansowany pod względem interpretacji obrazu źródłowego, ale wypluwa bardzo przyjemne grafiki. Z kolei kreskówka 3D bywa zbyt realistyczna, a przez to trochę niepokojąca. Coś jak nieudane eksperymenty genetyczne, trzymane w podziemiach Pixara.

Oczywiście czuć, że Samsungowi zależało, aby Studio portretu schlebiało naszej próżności. Na generowanych grafikach jesteśmy zatem drastycznie przystojniejsi, piękniejsi, chudsi i gładsi niż w rzeczywistości. Social media, wschodzę! Niestety, Studio portretu świadomie odmawia upiększania piesków i kotków. Liczę, że z czasem się to zmieni.

Co imponuje już teraz:

  • szybkość metamorfozy w awatar
  • kilka propozycji dla każdego stylu
  • styl komiksowy

Co może być lepsze:

  • styl kreskówka 3D
  • domagam się metamorfozy zwierzaków
  • większy realizm, mniej upiększania poproszę

4. Tworzenie tekstu na zlecenie

Kompozytor Galaxy AI to kolejne narzędzie o gigantycznym potencjale. Zadaniem tej funkcji jest tworzenie tekstu zleconego przez użytkownika. Podam wam przykład: Jestem chory. Zamiast pisać ładnego maila do kadr tłumaczącego nieobecność, proszę o to Galaxy AI. W ten sposób powstaje gotowy tekst, który kopiuję, wklejam i wysyłam. Treści tworzone przez sztuczną inteligencję - w przeciwieństwie do tych z transkrypcji - są spójne, sensowne i dobrze napisane. Galaxy AI opanowało nasz język w stopniu wystarczającym.

Kompozytor pozwala dopasować tworzoną treść do danej sytuacji, generując treści w trzech stylach: profesjonalnym, nieformalnym praz uprzejmym, a także biorąc pod uwagę cztery formy komunikacji pisanej: standardową, komentarz w sieci, wpis w social media oraz e-mail. Zmiana tonu w zależności od tych ustawień jest silnie wyczuwalna. Kompozytor może być naszym ziomalem jak i odpowiedzialnym pracownikiem korpo.

Przykład 1: tekst dla szefa informujący o nieobecności z powodu choroby:

Przykład 2: tekst dla żony w którym życzę miłego dnia i zapraszam na kolację:

Kompozytor Galaxy AI nie tylko generuje treści na zlecenie, ale także pilnuje gramatyki w tworzonych przez nas tekstach. Potrafi je też redagować i zmieniać ich styl. Napisałeś służbowego maila, ale wydaje ci się, że jest zbyt nieformalny? Galaxy AI to naprawi. Tylko poprawianie błędów wychodzi sztucznej inteligencji tak sobie. AI założyło np. że nie mogę być aż takim debilem i nie napisałem „kura” z „ó”. Zamieniła więc nioskę na korę. Tyle tylko, że kora nie znosi jaj. Galaxy AI nie spojrzało na cały kontekst.

Co imponuje już teraz:

  • jakość tworzonego tekstu na zlecenie
  • kilka stylów i form do wyboru
  • niezłe opanowanie podstaw języka polskiego

Co może być lepsze:

  • dłuższe teksty na zamówienie
  • możliwość bezpośredniej odpowiedzi na wyświetlane wiadomości
  • Lepsza, kontekstowa korekta naszych tekstów

5. Nanoszenie realistycznych obiektów na nasze zdjęcia

Opisany wcześniej mechanizm zamiany szkiców na grafiki znalazł swoje rozwinięcie w nowej funkcji Od szkicu do obrazu. AKtywując ją, kreślimy po wykonanym zdjęciu, rysując na nim dowolne bazgroły. Następnie Galaxy AI przekształca je na realistycznie wyglądające, zintegrowane ze zdjęciem obiekty pasujące do całego kadru.

Czasem uzyskane efekty są dalekie od oczekiwań. Narzędzie Od szkicu do obrazu kiepsko radzi sobie na przykład z humanoidami. Gdy chciałem postawić jednego na drodze do centrum Katowic, Galaxy AI stworzyło postać godną własnego odcinka w kultowym serialu Z Archiwum X.

Dorysowana kość dla psa:

Dorysowany owad na kwiatku:

Dorysowany humanoid na jezdni:

Za to już dorysowany przeze mnie owad na czerwonym kwiecie został zamieniony w tak realistycznie wyglądającego insekta, że można go pomylić z prawdziwym robalem, złapanym w kadrze podczas wykonywania zdjęcia. Kość dorysowana dla pieska czekającego pod sklepem na swojego właściciela także wypada niczego sobie.

Widzimy zatem jak Galaxy AI generuje dla Samsunga sporę przewagę nad rywalami. Inne edytory foto od producentów smartfonów potrafią usuwać wskazane obiekty ze zdjęcia i retuszować ten zabieg, wypełniając ubytek. Galaxy AI też to potrafi, ale jednocześnie może tworzyć zupełnie nowe obiekty już na tych istniejących - to kolejna „warstwa” AI możliwa do nałożenia na nasze zdjęcie.

Co imponuje już teraz:

  • realizm wielu generowanych obiektów
  • spójność generowanej treści z całym zdjęciem
  • szybkość modyfikowania zdjęcia

Co może być lepsze:

  • generowanie złożonych obiektów
  • więcej wariantów do wyboru
  • lepsza interpretacja bazgrołów

6. Tłumaczenie telefonów zza granicy w czasie rzeczywistym.

Galaxy AI możemy aktywować także rozmawiając przez telefon z osobami posługującymi się innym językiem. Sztuczna inteligencja wciela się wtedy w tłumacza, pracującego w czasie rzeczywistym na całej linii: nam tłumaczy rozmówcę na język polski, rozmówcy tłumaczy nas na jego język. Brzmi fantastycznie, prawda?

Chociaż narzędzie ma wielki potencjał, na ten moment pozostawia sporo do życzenia. Po pierwsze, rozmowa z tego typu aktywnym tłumaczem wymaga nauki oraz zerwania z dotychczasowymi nawykami. Nie można sobie przeszkadzać i trzeba dać przestrzeń tłumaczowi do wybrzmienia. Inaczej w rozmowę wkrada się potworny, niemożliwy do naprawienia chaos.

Po drugie, tak jak w przypadku transkrypcji od Samsunga, problemem jest samo tłumaczenie języka polskiego. W rozmowę wkrada się wiele niedomówień, błędów, nadinterpretacji oraz dezinformacji. Zdecydowanie nie jest to narzędzie, z wykorzystaniem którego chciałbym dopiąć jakiś deal albo ustalić szczegóły zagranicznego wyjazdu. Sama technologia ma duży potencjał, ale wymaga teraz intensywnego szlifowania.

Co imponuje już teraz:

  • jako tako, ale działa po polsku
  • nasz rozmówca jest informowany o tłumaczeniu

Co może być lepsze:

  • dokładność i skuteczność w tłumaczeniu polskiego
  • większe usystematyzowanie rozmowy
  • mniej chaosu wprowadzanego przez tłumacza

7. Kadrowanie z generowaniem zawartości.

Nie macie pojęcia, ile razy kinąłem pod nosem, kadrując zdjęcia produktów do recenzji w Lightroomie. Chcę wyrównać niezłe ujęcie, ale przez co ucinam róg istotnego przedmiotu znajdującego się z boku. Tutaj z pomocą nadchodzi Galaxy AI, generując elementy zdjęcia których „brakuje w kadrze” podczas kadrowania.

Być może nie brzmi to przesadnie imponująco, ale dla mnie nowa możliwość to coś bardzo przydatnego. Czasem zamieniam się bowiem w ultrasa dobrze wypoziomowanych zdjęć. Na krzywy horyzont reaguję wtedy alergią oraz wysypką. Wyrównywanie fotografii często wiąże się z cięciem zawartości zdjęcia. Nowa funkcja Galaxy AI pudruje te ubytki, generując zawartość na brzegach fotografii.

Trzy przykłady - kadrowane zdjęcie i uzyskany efekt:

- Ale Szymon, to nie jest nic przełomowego, to wszystko już było!

Drogi Internauto, pełna zgoda. Nie tylko już było, ale też było rozproszone. Osobne popularne narzędzie AI generuje grafiki, inne tworzy tekst, jeszcze inne wypluwa efektowne awatary w oparciu o nasze selfie. Wiele z nich jest przy tym płatnych. Samsung oferuje szeroki pakiet usług dostępnych systemowo na smartfonie, bez dodatkowych kosztów i abonamentów, a także bez konieczności zakładania innych kont, poza kontem Samsung.

REKLAMA

Mając tyle zróżnicowanych narzędzi AI pod ręką, zunifikowanych na poziomie systemowym, realnie zaczyna się z nich korzystać. O ile nie chcę by sztuczna inteligencja tworzyła za mnie teksty i wiadomości, tak regularnie korzystam z wypełniania ubytków podczas kadrowania zdjęć oraz z transkrypcji nagranych wywiadów. Nie muszę już mieć od tego osobnych programów, wystarczy wyjąć Flipa z kieszeni. To duża wygoda.

Dlatego nie dziwi mnie, że Samsung wypycha Galaxy AI na środek swojej sceny. Od niedawnej premiery smartfonów S24, S24+ i S24 Ultra sztuczna inteligencja Koreańczyków nauczyła się wielu przydatnych sztuczek i aż strach pomyśleć, co będzie potrafiła za kilka(naście) lat.

REKLAMA
Najnowsze
Zobacz komentarze
REKLAMA
REKLAMA
REKLAMA