Na hlavný obsah

Pätina odpovedí vygenerovaných AI obsahovala faktické chyby, píše BBC. Chce spolupracovať s vývojármi na zlepšeniach

V teste použili štyri chatovacie roboty.

Pätina odpovedí vygenerovaných AI obsahovala faktické chyby, píše BBC. Chce spolupracovať s vývojármi na zlepšeniach
Ilustračný obrázok. Foto: Unsplash

Zhruba pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovala faktické chyby. Vyplýva to z testu, ktorého výsledky v utorok (11. 2.) zverejnila stanica BBC. Tím stanice sa pýtal na informácie z článkov obsiahnutých na spravodajskom serveri BBC News. V teste použila chatovacie roboty ChatGPT, Copilot, Gemini a Perplexity.

V rámci testu tím BBC sprístupnil chatovacím robotom obsahy spravodajského serveru BBC News a potom im položil otázky. Podľa zverejnených výsledkov malo nejakú formu vady 51 percent vygenerovaných odpovedí. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent potom nepresné citácie z článkov na serveri BBC News.

Medzi chybnými odpoveďami boli tvrdenia chatovacích robotov, že britský expremiér Rishi Sunak či bývala šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci tomu v čase testu už tak nebolo. V ďalšej odpovedi napríklad aplikácia AI mylne tvrdila, že britská zdravotnícka služba NHS odporúča elektronické cigarety ako nástroj na skončení s fajčením.

Hodnotili presnosť

Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, píše sa v hodnotení testu. „Chceli sme vedieť, či platformy AI poskytujú presné odpovede na otázky ohľadom správ a či odpovede verne zodpovedajú správam z BBC News použitých ako zdroje,“ uviedol šéf tímu, ktorý sa zaoberá umelou inteligenciou v BBC, Pete Archer.

Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. „Je ťažké nevnímať, ako rýchlo pokrivenie informácií zo strany AI môže podkopať už tak krehkú dôveru ľudí vo fakty a overené informácie,“ uviedla v komentári šéfka spravodajského serveru BBC News Deborah Turnessová.

Podľa testovacieho tímu je podstatné, aby informácie boli presné nezávisle od kanála, ktorý ich prenáša. „Nepresnosti z AI asistentov sa môže ľahko šíriť, keď sú zdieľané na sociálnych sieťach,“ uviedol Archer.

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie. Domnievajú sa však, že chatovacie roboty nemôžu byť v súčasnosti zdrojom presných správ. „Chceme, aby AI spoločnosti vypočuli naše obavy a konštruktívne s nami spolupracovali,“ píše sa v záveroch testu. Podobný test chce BBC opakovať v blízkej budúcnosti.

Moje odložené články

    Viac

    Najčítanejšie

    Nové v rubrike Svet