
Metan avoimen lähdekoodin tekoälykielimallit tukevat yli 1 1000 kieltä
Koneoppimisen ja puheentunnistusteknologian kehittyminen ovat tehneet tiedonhankinnasta saavutettavampaa. Erityisesti henkilöt, jotka tukeutuvat tiedon ääneen lukemiseen, ovat hyötyneet tästä tekoälyn kehittymisestä. Haasteena modernien koneoppimiseen pohjautuvien kielimallien kehityksessä ovat eri kielien loputon määrä ja vähäinen selitetyn datan määrä kielistä.
Vastauksena tähän ongelmaan Metan johtama Massively Multilingual Speech (MMS) -projekti on edennyt valtavasti uusien kielien sisällyttämisessä kielimalleihin. He ovat tehostaneet puheentunnistuksen toimintaa sekä synteettisiä malleja.
Yhdistämällä itseohjatun oppimisen (self-supervised learning) uskonnollisten tekstien monipuoliseen datasettiin MMS on onnistunut kasvattamaan tekoälyn 100 tuetusta kielestä yli 1 100 kieleen.