Euroopan johtavat tekoälyalan yritykset ja tutkimuslaitokset yhdistävät voimansa uudessa Open Euro LLM -henkkeessa kehittääkseen seuraavan sukupolven avoimen lähdekoodin kielimalleja. Uuden hankkeen 20 jäsenestä viidesosa on jopa suomalaisia. EU-hanketta koordinoi Tšekin Univerzita Karlova -yliopiston Jan Hajic, joka johtaa sitä AMD:lle myydyn Silo AIn Peter Sarlinin kanssa. Uudessa hankkeessa kehitetään markkinoiden suorituskykyisistä, monikielisistä ja suurista perustakielimalleista koostuvaa tuoteperhettä.
Uudessa Open Euro LLM-hankkeessa kehitettävät mallit ovat mukana olevien tahojen mukaan hyödynnettävissä kaupallisiin ja teollisiin käyttötarkoituksiin sekä julkiseen palvelutuotantoon. Hankkeessa uskotaan, että läpinäkyvät ja EU-sääntelyä noudattavat avoimen lähdekoodin mallit demokratisoivat tekoälyteknologian saatavuutta. Samalla ne vahvistaisivat eurooppalaisten yritysten kykyä kilpailla globaaleilla markkinoilla.
Hankkeen lopputulosten toivoaan tukevat myös julkisten organisaatioiden kykyä tuottaa vaikuttavia julkisia palveluja. Malleja kehitetään Euroopan vankassa sääntelykehyksessä, mikä varmistaa eurooppalaisten arvojen ja sääntelyn noudattamisen sekä turvaa teknologista huippuosaamista.
Suomesta konsortioon osallistuvat AMD:n nykyisin omistama Silo AI, Turun Yliopiston TurkuNLP-tutkimusryhmä, Helsingin yliopiston kieliteknologian tutkimusryhmä sekä CSC – Tieteen tietotekniikan keskus. EUn kärkihankkeen osana Suomeen on syntymässä kilpailukykyinen tekoälykeskittymä osana eurooppalaista ekosysteemiä.
OpenEuroLLM tekee myös yhteistyötä avoimen lähdekoodin ja avoimen tieteen yhteisöjen, kuten LAIONin, open-sci:n ja OpenML:n kanssa sekä muiden alan asiantuntijoiden kanssa, jotka on koottu hankkeen neuvonantajiksi. Uuden OpenEuroLLM-hankkeen kautta tarkoitus on varmistaa, että mallit, ohjelmistot, tiedot ja arviointi ovat täysin avoimia ja että niitä voidaan hienosäätää ja ohjeistaa teollisuuden ja julkisen sektorin erityistarpeisiin.
Kehitettävät kielimallit mahdollistavat sekä kielellisen että kulttuurisen monimuotoisuuden ylläpidon. Näistä huolehtien, eurooppalaiset yritykset voivat kehittää korkealaatuisia tuotteita ja palveluja tekoälyn aikakaudella. Hankkeelle on myönnetty jo STEP-hyväksyntämerkki (Strategic Technologies for Europe Platform) ja siinä hyödynnetään konsortiojäsenten aiempien hankkeiden tuomaa kokemusta ja osaamista sekä ennenäkemättömiä suuria korkealaatuista dataa sisältäviä arkistoja.
Konsortion kokoonpanon yliopistot ja tutkimuslaitokset
- Charles University (Institute of Formal and Applied Linguistics), Tšekki (koordinaattori)
- Alliance for Language Technologies EDIC (ALT-EDIC), Ranksa
- Eindhoven University of Technology, Alankomaat
- ELLIS Institute Tübingen, Saksa
- Fraunhofer IAIS, Saksa
- Lindholmen Science Park (AI Sweden), Ruotsi
- University of Helsinki, Suomi
- University of Oslo, Norja
- University of Turku, Suomi
- University of Tübingen (Tübingen AI Center), Saksa
Konsortion kokoonpanon yritysjäsenet
- Silo GenAI (AMD Silo AI), Suomi (yhteisjohtaja)
- Aleph Alpha Research, Saksa
- Ellamind, Saksa
- LightOn, Ranska
- Prompsit Language Engineering, Espanja
- EuroHPC-keskukset
- Barcelona Supercomputing Center, Espanja
- Cineca Consorzio Interuniversitario, Italia
- CSC, Suomi
- Research Center Juelich, Germany
- Surf, Alankomaat
Kuvituskuva: Shutterstock