💡 Zhrnutie pre tých, ktorí rýchlo scrollujú:
- Poľština dosiahla 88-percentnú úspešnosť, najviac zo všetkých 26 jazykov.
- Angličtina skončila až šiesta, čínština takmer na dne rebríčka.
- AI v poľštine robí menej chýb a lepšie chápe kontext.
- Výsledky sú podľa vedcov „prekvapivé a protintuitívne“.
Výskumníci z University of Maryland testovali šesť veľkých jazykových modelov (LLM), ktoré poháňajú populárne platformy ako ChatGPT či Google Gemini. Cieľ bol jednoduchý - zistiť, ako presne tieto modely odpovedajú na identické úlohy, ak sú zadané v rôznych jazykoch, píše portál TVP World.
A výsledok? Poľština vyhrala. S presnosťou 88 percent predbehla všetky ostatné jazyky, vrátane angličtiny, francúzštiny či čínštiny. Vedci to označili za „prekvapivé a protintuitívne“, pretože poľština je v AI svete považovaná za jazyk s relatívne malým objemom dát. Väčšina modelov sa totiž učí primárne z textov v angličtine a čínštine, teda takzvaných. „vysokoresursových jazykov“.
Poľština predbehla aj angličtinu
Podľa štúdie bola poľština najúspešnejšia v úlohách, ktoré si vyžadovali pochopenie širšieho kontextu, napríklad pri sumarizácii textu, analýze obsahu alebo rozhodovacích procesoch. Druhé a tretie miesto obsadili francúzština a taliančina, zatiaľ čo angličtina sa dostala len na šieste miesto s úspešnosťou 83,9 percenta.
Ešte väčším prekvapením bolo, že čínština, jeden z jazykov, z ktorých sa modely najviac učia, skončila štvrtá od konca, s presnosťou len 62,1 percenta.
Slabé jazyky a veľké otázky
Vedci si nie sú istí, prečo niektoré jazyky s obrovským množstvom dát (ako čínština) dopadli tak zle, zatiaľ čo poľština, s omnoho menším objemom trénovacích textov, uspela tak výrazne.
Jediné, čo sa ukázalo ako spoločný faktor všetkých top jazykov, je latinská abeceda a dostatok článkov na Wikipédii. Naopak, nízkodátové jazyky ako hindčina či swahilčina mali problém udržať výkon, ak sa zadania predlžovali a komplikovali.
Poľská AI nastupuje
Zaujímavosťou je, že Poľsko už svoju AI revolúciu rozbieha. Tamojšia vláda tento rok predstavila vlastného poľsky hovoriaceho chatbota, ktorý má byť domácou alternatívou k ChatGPT.
Prvým mestom, ktoré ho nasadilo do praxe, bola Częstochowa na juhu krajiny. A ak sa štúdia Univerzity v Marylande potvrdí aj v realite, možno práve poľština ukazuje, že jazyková dominancia angličtiny v AI ére nie je taká istá, ako sa zdalo.