Kraje od Hiszpanii po Rumunię inwestują w tworzenie chatbotów posługujących się narodowymi językami, aby powstrzymać dominację amerykańskiej technologii – pisze portal Politico. Tylko w ub.r. 13 państw europejskich ogłosiło lub podjęło kroki w celu opracowania modeli opartych na narodowych językach.
Najnowsza technologia AI, związana z takimi narzędziami jak ChatGPT, opiera się na dużych modelach językowych (LLM – Large Language Model), które specjalizują się w przetwarzaniu języka naturalnego. Zakres działań obejmuje m.in. generowanie i tłumaczenie tekstów, a także prowadzenia interaktywnych rozmów z chatbotami.
Zdaniem Politico Europa chce dynamicznie rozwijać tę technologię, chociaż używanie 24 języków na terenie Unii może stanowić poważny problem.
„Mark Twain nie powinien przesłaniać Stendhala” – powiedział w lutym francuski minister gospodarki i finansów Bruno Le Maire. Polityk wyraził zaniepokojenie, że status języka francuskiego może zostać osłabiony przez algorytmy i systemy sztucznej inteligencji oparte na języku angielskim.
Obecnie USA dominują na rynku AI. ChatGPT tworzony przez OpenAI, Gemini opracowany przez Google, Claude firmy Anthropic oraz Meta i xAI Elona Muska to amerykańskie modele, które biorą udział w globalnym wyścigu technologicznym. Tempo rozwoju tej branży wzbudza niepokój europejskich rządów – stwierdza portal. Jak wyjaśnia, obawy dotyczą możliwej dominacji amerykańskich firm, tak jak jest w przypadku mediów społecznościowych i Web 2.0.
Politico informuje, że w ciągu ostatniego roku 13 krajów europejskich ogłosiło lub podjęło kroki w celu opracowania modeli opartych na narodowych językach. Wsparcie ma dotyczyć m.in. projektów akademickich, startupów i zespołów niezależnych programistów.
Wśród wymienionych przez portal modeli jest polski wielki model językowy PLLum (Polish Large Language Universal Model), który będzie wytrenowany na treściach głównie polskojęzycznych. Konsorcjum PLLuM powstało w listopadzie 2023 r. i tworzy je sześć jednostek naukowych z obszaru sztucznej inteligencji i językoznawstwa: Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK (PIB NASK), Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN.
Zdaniem Politico walka o własne języki LLM sięga przemysłu rozrywkowego i zarządzaniem dziełami kultury, w tym scenariuszy filmowych, archiwów medialnych czy praw autorskich. Portal przypomina, że tylko w ostatnich miesiącach amerykańskie OpenAI zawarło umowy z koncernem wydawniczym Axel Springer, który jest właścicielem niemieckich tytułów „Bild” i „Welt”, francuskim dziennikiem „Le Monde” czy agencją Associated Press.
Jednocześnie w lutym 2024 r. Komisja Europejska powołała konsorcjum Alt-EDIC (European Digital Infrastructure Consortium), którego celem jest współpraca w zakresie rozwoju LLM w językach europejskich. Polska jest jednym z 12 jego członków.