Teksty generowane przez sztuczną inteligencję stają się w ostatnim czasie coraz bardziej imponujące. Niestety język polski często okazuje się być tu przeszkodą. Choć teoretycznie jest on obsługiwany przez najpopularniejsze narzędzia, takie jak ChatGPT, to nie zawsze udaje im się poprawnie użyć pewnych słów, a w konstrukcje zdań wkradają się błędy. Problemem tym postanowili zająć się polscy naukowcy.
Qra to polskojęzyczne generatywne modele językowe opracowane przez naukowców z Politechniki Gdańskiej we współpracy z AI Lab z Ośrodka Przetwarzania Informacji (OPI).
Qra to pierwszy tej skali i najlepszy w modelowaniu języka polskiego odpowiednik otwartych narzędzi Mety czy Mistral AI. Qra lepiej rozumie treści w języku polskim, lepiej rozumie pytania zadawane w tym języku i lepiej sama tworzy spójne teksty
- czytamy w poście opublikowanym na profilu Ośrodek Przetwarzania Informacji - PIB na Facebooku. Przy tworzeniu narzędzia wykorzystano korpusu danych zawierającego teksty wyłącznie w języku polskim. Początkowo było to około 2TB surowych danych tekstowych, ale ostatecznie wartość ta zmniejszyła się prawie dwukrotnie w wyniku procesu czyszczenia i deduplikacji. Jak donosi Business Insider, dane dotyczył różnych dziedzin, takich jak prawo, technika, nauki społeczne, biomedycyna, religia czy sport, a testowanie zajęło mniej więcej pół roku. Warto podkreślić, że prace były prowadzone w Centrum Kompetencji STOS, czyli jednym z najnowszych ośrodków IT w Europie, gdzie znajduje się superkomputer Kraken. Dzięki temu proces został skrócony z lat do miesięcy. Obecnie dostępne są trzy modele różniące się modelem złożoności: Qra 1B, Qra 7B i Qra 13B. Na tym jednak ambicje polskiego zespołu się nie kończą.
Opracowane dotychczas modele są upublicznione w dedykowanym repozytorium OPI-PG na platformie huggingface i każdy może z nich korzystać. Narzędzie już teraz daje bardzo zadowalające rezultaty, ale jego twórcy podkreślają, że trwają prace nad jego dalszym rozwojem. Jest to ważna informacja dla polskich użytkowników indywidualnych, a także przedsiębiorstw. Coraz więcej firm w naszym kraju interesuje się bowiem wykorzystaniem sztucznej inteligencji, co potwierdzają wyniki badań Amazon Web Services (AWS), na które powołuje się "Rzeczpospolita". Według nich niemal co czwarta firma w Polsce korzysta już z systemów AI. Ponadto ponad połowa naszych rodaków przewiduje wzrost znaczenia sztucznej inteligencji w ciągu najbliższych trzech lat, a 64 proc. twierdzi, że będzie miała szczególny wpływ na opiekę zdrowotną, edukację i transport.