11.08.2023, 11:30Lektura na 2 minuty

Naukowcy: ChatGPT popełnia tyle błędów, że rzut monetą da nam lepsze odpowiedzi

Sztuczną inteligencję Sama Altmana krytykują badacze z Purdue University.

Antoni „Darkling” Antoszek

ChatGPT w miarę dobrze radzi sobie z ogólnymi poradami, ale czy kiedykolwiek stosowaliście go do konkretnych naukowych zadań, np. do pisania kodu? Cóż, jeśli tak, naukowcy z amerykańskiego Purdue University nie mają dla was dobrych wiadomości: w przypadku pytań dotyczących programowania, ChatGPT odpowiada poprawnie… w 48% przypadków. Oznacza to, że jeśli macie wątpliwości w kwestii kodu, bardziej opłaca się wylosować odpowiedź poprzez rzut monetą.

Przekonujący, ale błędny

O raporcie badaczy informuje The Register. Przeanalizowali oni odpowiedzi ChatGPT do 517 pytań zadanych na Stack Overflow, platformie, która umożliwia konsultowanie kodu z innymi programistami. Porównali je z odpowiedziami autorstwa ludzkich użytkowników Stack Overflow.

Okazuje się, że 52% odpowiedzi ChatGPT było po prostu niepoprawne. W dodatku 77% porad, których udzieliła sztuczna inteligencja, okazało się niepotrzebnie rozwlekłe.

Ciekawe są jednak ustalenia naukowców w kwestii preferencji użytkowników odnośnie do odpowiedzi – ludzie w 39% przypadków wolą czytać porady ChatGPT, gdyż są one… lepiej zredagowane. Autorzy badania wskazują, że sztuczna inteligencja jest często dużo milsza niż użytkownicy Stack Overflow, w dodatku styl, w którym napisane są odpowiedzi, sprawia wrażenie dużego przekonania w kwestii poprawności i sporej wiedzy chatbota. Badacze zauważyli, że odbiorcy są w stanie zidentyfikować błąd w odpowiedzi tylko wtedy, gdy jest on oczywisty; jeśli jednak ukrywa się on w meandrach rozwlekłych tyrad ChatGPT, w większości przypadków trudno go wykryć. Gdy odpowiedź AI wydawała się odpowiednio wnikliwa, uczestnicy badania byli w stanie zignorować zawarte w niej błędy.

Autorzy mają jeszcze kilka ciekawych obserwacji. Przykładowo: twierdzą, że popełniane przez sztuczną inteligencję błędy wynikają częściej z niezrozumienia przez bota pytania niż z faktycznego braku wiedzy.

Trzeba jednak pamiętać, że badanie przeprowadzone zostało na wyjątkowo małej grupie osób (mowa o 12 uczestnikach). Autorzy zdają sobie z tego sprawę i zachęcają do ponowienia eksperymentu na większej próbce przez innych badaczy.

Czytaj dalej

Kultura19.05.2025

Netflix wprowadzi reklamy generowane przez AI. Od 2026 zobaczymy je w trakcie filmów i seriali

Agnieszka Michalska

Newsy29.04.2025

Reżyser Niera: Automaty martwi się o przyszłość twórców gier. Jego zdaniem sztuczna inteligencja zabierze ludziom pracę

Krzysztof „Gwint” Jackowski

Kultura11.04.2025

James Cameron popiera używanie sztucznej inteligencji. Twierdzi, że bez niej blockbustery nie przetrwają

Agnieszka Michalska

Kultura28.03.2025

Internet zalewają obrazki inspirowane japońską animacją. Studio Ghibli podejmuje w tej sprawie kroki prawne?

Agnieszka Michalska

Kultura19.05.2025

Netflix wprowadzi reklamy generowane przez AI. Od 2026 zobaczymy je w trakcie filmów i seriali

Agnieszka Michalska

Newsy29.04.2025

Reżyser Niera: Automaty martwi się o przyszłość twórców gier. Jego zdaniem sztuczna inteligencja zabierze ludziom pracę

Krzysztof „Gwint” Jackowski

Kultura11.04.2025

James Cameron popiera używanie sztucznej inteligencji. Twierdzi, że bez niej blockbustery nie przetrwają

Agnieszka Michalska

Redaktor

Antoni „Darkling” Antoszek

Moim ulubionym zajęciem związanym z grami jest notoryczne umieranie w Dead Cells. Interesują mnie nowe technologie, ale nie mogę oprzeć się wrażeniu, że wszystko, co było na ich temat do powiedzenia, napisał już Philip K. Dick. Lubię robić kawę, filozofować i obserwować swojego kota.

Profil

Wpisów248

Obserwujących2

Podziel się lub zapisz

Sztuczna inteligencja OpenAI ChatGPT

Dyskusja

Dodaj komentarz

Najlepsze

Najnowsze

Najstarsze

Dodaj komentarz
Najlepsze
Najnowsze
Najstarsze