Na hlavný obsah

Slovenskí vedci vytvorili jazykový AI model trénovaný pre potreby slovenčiny. Učil sa na superpočítačoch Leonardo a Perun

Globálne jazykové modely často nedostatočne zachytávajú špecifiká menších jazykov.

Na snímke je otvorená stránka umelej inteligencie ChatGPT.
Na snímke je otvorená stránka umelej inteligencie ChatGPT. Foto: Unsplash

Tím slovenských vedcov vytvoril inštrukčný jazykový model cielene trénovaný pre potreby slovenského jazyka. Tento model podľa jedného z jeho autorov, Mareka Dobeša zo Slovenskej akadémie vied (SAV), umožňuje posilniť technologickú autonómiu krajiny a zároveň zachovať jej kultúrnu identitu v digitálnom svete.

Model Qwen3-14B-SK vznikol úpravou parametrov multilingválneho modelu, ktorý vedci kompletne doladili pomocou rozsiahlych slovenských jazykových dát. „Významnou súčasťou projektu bolo aj technické zabezpečenie tréningu modelu. Ten prebiehal na výkonných európskych superpočítačoch Leonardo a Perun,“ doplnil Dobeš.

Na vývoji modelu sa okrem neho podieľali aj Peter Bednár z Technickej univerzity v Košiciach a Radovan Garabík z Jazykovedného ústavu Ľ. Štúra SAV.

Jazykové modely predstavujú základ moderných nástrojov umelej inteligencie (AI), ktoré dokážu pracovať s textom podobne ako človek. „V praxi sa využívajú pri automatickom preklade, tvorbe textov, sumarizácii informácií, vyhľadávaní odpovedí, ale aj v medicíne či vzdelávaní. Pomáhajú zrýchľovať prácu, sprístupňovať informácie a zjednodušovať komunikáciu v digitálnom prostredí,“ spresnil Dobeš.

Globálne jazykové modely podľa jeho slov často nedostatočne zachytávajú špecifiká menších jazykov. „Nedostatok sa prejavuje najmä pri témach úzko spätých so slovenským prostredím – históriou, spoločenskými reáliami, regionálnymi výrazmi alebo odbornou terminológiou,“ ozrejmil. Aj preto považuje vývoj domáceho riešenia za dôležitý krok k posilneniu technologickej a jazykovej autonómie Slovenska.

„Modely trénované na kvalitných slovenských dátach dokážu lepšie rozumieť kontextu, rešpektovať jazykové normy a poskytovať presnejšie a prirodzenejšie odpovede pre používateľov na Slovensku,“ podotkol s tým, že model z dielne slovenských vedcov je verejne dostupný pre ďalší výskum aj praktické využitie.

Moje odložené články

    Viac

    Najčítanejšie

    Nové v rubrike Slovensko