DeepSeek już wie, co się wydarzyło na Placu Niebiańskiego Spokoju. Amerykanie usunęli chińską cenzurę
Chiński model AI jest dostępny zarówno przez aplikację DeepSeek, jak i w formie samej open-source’owej technologii, którą można modyfikować i wykorzystywać do własnych celów. Z tego ostatniego atutu skorzystała firma Perplexity, usuwając z modelu wszelkie przejawy chińskiego fałszowania historii.

Perplexity to jedna z najciekawszych na dziś firm z branży IT. Podobnie jak świat Big Techu, również i rzeczona firma skupia całą swoją uwagę na sztucznej inteligencji, w tym tej generatywnej. Nie buduje jednak własnego modelu - zamiast tego używa tych, w jej ocenie, najlepszych na rynku i odpowiednio je dostraja. Dla przykładu wyszukiwarka Perplexity wykorzystuje zarówno OpenAI o3, jak i (hostowanego u siebie, nie w Chinach) DeepSeeka.
Sam DeepSeek jest jednak wysoce problematyczny. Chiński model AI skupił uwagę świata z uwagi na inny niż amerykański kraj pochodzenia, swoją zestawialną z amerykańskimi modelami jakość, a przede wszystkim z uwagi na dużo niższy od konkurencji koszt szkolenia i utrzymania. Nie jest jednak pozbawiony wad. Ta najbardziej widoczna to cenzura faktów, o których w Chinach mówić nie wolno. Biada temu, kto wykorzysta do swojej pracy o Placu Niebiańskiego Spokoju informacje z chińskiego modelu. Albo o wyspę Tajwan.
To też jest ciekawe:
DeepSeek jest jednak modelem częściowo otwartym. Amerykanie z Perplexity zrobili psikusa Chińczykom
DeepSeek sam w sobie nie ma otwartego kodu, ale pozwala na wykorzystanie zawartej w nim technologii do szkoleń na dowolnym zbiorze danych, jaki sobie tylko klient zażyczy. DeepSeek-R1 w wersji 1776 to model, którego dodatkowym szkoleniem zajęło się rzeczone Perplexity. Chińska technologia została na nowo nakarmiona faktami, a wszelkie próby wstrzymywania się z odpowiedzią na kontrowersyjne dla chińskich władz tematy zostały wykryte i od strony technicznej usunięte.

W efekcie DeepSeek R1-1776 (hostowany i udostępniony w repozytorium firmy HuggingFace, jest też dostępny przez interfejs programowy Perplexity Sonar, a także w samej usłudze Perplexity) według niezależnych testów nie tylko w oczywisty sposób udziela wiarygodniejszych odpowiedzi na objęte chińską cenzurą tematy od generycznego oryginalnego chińskiego modelu, ale też od… amerykańskiej konkurencji, która ewidentnie w procesie szkolenia inkorporowała dane pochodzące z Chin.





- Zadbaliśmy również o to, aby zdolności matematyczne i rozumowania modelu pozostały nienaruszone po procesie decenzurowania. Oceny w wielu testach porównawczych wykazały, że nasz model po treningu działał na równi z modelem bazowym R1, co wskazuje, że decenzurowanie nie miało wpływu na jego podstawowe zdolności rozumowania - jak dodaje Perplexity. I jak tu nie kochać open source?