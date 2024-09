Wszystkie czatboty, z którymi aktywnie konwersujemy (lub o których czytasz każdego dnia) - ChatGPT, Gemini, Copilot, Claude, Grok, oparte są na architekturze transformer, metodzie głębokiego uczenia zaprojektowanej przez inżynierów Google. W dużym uproszczeniu, gdy do dużego modelu językowego (LLM) wprowadza się dane tekstowe, AI rozbija je na tokeny. Token może być słowem, częścią słowa, sylabą lub literą - zależnie od wielkości modelu, jego specyfiki i specyfiki języka (tj. naszego ludzkiego języka) którym operuje. Następnie każdemu tokenowi przypisuje identyfikator, czyli po prostu reprezentującą go liczbę. Sercem architektury transformer jest mechanizm uwagi (stąd też nazwa publikacji naukowców Google'a: "Attention is all you need" - "Uwaga to wszystko, czego potrzebujesz"). Pozwala on modelowi skupić się na różnych częściach tekstu wejściowego podczas tworzenia przewidywań tekstu - czyli po prostu generowania pożądanej przez nas odpowiedzi. W efekcie pozwala to AI na "ważenie" (niczym ocen w szkole) znaczenie każdego tokena w stosunku do innych, a tym samym wygenerowanie ciągu tokenów, które "zdaniem" sieci neuronowej najlepiej pasują do zapytania. A z naszej perspektywy tokeny to - ponownie - słowa, części słowa, sylaby, litery, po prostu tekst.