Z drugiej strony OpenAI świadomie i w naprawdę przerażających ilościach (bo mówimy tu o terabajtach danych) łamało prawa autorskie, nawet w przypadkach gdzie w czystej teorii mogło się ono "dogadać", poprzez różnego rodzaju kontrakty i licencje na jednorazowe czy długoterminowe przetwarzanie danych. Sprawie nie pomaga także niedawny pozew ze strony The New York Times Company, które na licznych przykładach udowodniło, że przy odpowiednim zapytaniu modelu GPT-4, nie wygeneruje on treści, a dosłownie "przekopiuje" bez zmian treść artykułu z The New York Times, w praktyce plagiatując dane treningowe.