Благодаря тому, что генеральный директор Meta* Марк Цукерберг называет «одним из самых быстрых суперкомпьютеров в мире», последняя модель искусственного интеллекта компании теперь способна переводить 200 различных языков, включая многие недостающие ресурсы и языки, поддерживаемые системой перевода.
Компания назвала проект «Ни один язык не остался позади» и стремится обеспечить не менее 25 миллиардов переводов в день между приложениями Meta*.
Хотя сегодня в мире насчитывается более 7100 известных языков, многим из них не хватает наборов данных для обучения искусственного интеллекта. Эти так называемые малоресурсные языки включают египетский, арабский, балийский, сардинский, нигерийский фула, бансилан, мбанду и другие. Есть много носителей этих языков, но их не так много в Интернете.
«Технология модели искусственного интеллекта, которую мы используем, помогает добиться высококачественных переводов на эти языки, на них говорят миллиарды людей по всему миру», — заявил генеральный директор Meta* Марк Цукерберг в своем заявлении на Facebook**.
Компания заявляет, что модель может переводить 55 африканских языков в «высоком качестве».
«Чтобы почувствовать масштаб этого проекта, модель на 200 языках имеет более 50 миллионов параметров, и мы обучили ее на одном из самых быстрых суперкомпьютеров в мире, Research SuperCluster (RSC)».
«Это означает, что влияние этой технологии коснется миллиардов людей во всем мире, что позволит им общаться на своем родном языке», — заявила ученый-исследователь Meta* AI Марта Р. Костахоса в рекламном ролике проекта.
Эл Янгблад, исследователь пользователей Meta* AI, также сказал: «Это изменит то, как люди живут, ведут бизнес и получают образование. Вся работа проекта «Ни одного языка не останется позади» основана на этом. Миссия является ядром, и он действительно ориентирован на людей».
Для проекта технологическому гиганту сначала нужно было провести исследовательское интервью с носителями языков с низким уровнем ресурсов, чтобы понять их потребности в переводе. Затем была разработана и обучена компьютерная модель на данных, собранных с использованием методов интеллектуального анализа данных, адаптированных для языков с низким уровнем ресурсов.
Meta Platforms*, а также принадлежащие ей социальные сети Facebook** и Instagram**:
*признана экстремистской организацией, её деятельность в России запрещена