Лингвисты нашли универсальные закономерности в 22 языках

Что общего у русского, английского, китайского, шведского и хинди.

Долгое время считалось, что каждый язык развивается по своим уникальным законам. Однако масштабное исследование ученых из Гарварда (США), Фуданьского университета (Китай) и Университета Стоуни-Брук (США) опровергло это мнение. С помощью искусственного интеллекта лингвисты проанализировали данные за несколько столетий и обнаружили, что эволюция речи подчиняется строгим математическим моделям. Результаты работы опубликованы в журнале Proceedings of the Royal Society B. Ранее мы рассказывали, когда появился первый язык.

буквы
Фото: Leka Sergeeva/Shutterstock/FOTODOM

Словарные «созвездия» 

Чтобы понять, как рождаются новые понятия, исследователи использовали метод векторных представлений. Каждое слово в этой системе превращается в точку в многомерном пространстве. Если слова близки по смыслу, они располагаются рядом. Проанализировав 22 языка, ученые увидели, что структура этого  «пространства слов» почти везде одинакова.

Среди языков —  английский, русский, французский, немецкий, испанский, итальянский, португальский, норвежский, шведский, датский, польский, финский, нидерландский,  каталанский, венгерский,  хинди,  китайский, тайский, японский, индонезийский, бенгальский, эсперанто.

«Нас вдохновила идея, что технологии машинного обучения дают надежный способ анализировать сложный материал человеческого языка», — рассказал старший автор статьи Стивен Скиена. 

Команда работала над этим проектом более семи лет, объединяя лингвистические данные со времен Средневековья с современными алгоритмами.

Выявленные закономерности

Ученые выявили несколько универсальных закономерностей, которые работают для всех изученных языков. Во-первых, самые используемые слова не разбросаны по словарю хаотично. Они стремятся группироваться друг с другом, образуя целые «острова» высокочастотной лексики.

Во-вторых, новые слова почти никогда не появляются поодиночке. Они приходят группами, подобно вспышкам в биологической эволюции. Это происходит в периоды важных общественных перемен, когда языку внезапно требуется целый набор новых терминов для описания реальности.

Лингвисты также выяснили, что развитие языка подчиняется закону Тейлора. Изначально этот закон использовали экологи для описания популяций животных, но теперь выяснилось, что он идеально описывает и «популяции» слов. Математическая связь между частотой употребления слова и временем его появления оказалась единой для всех культур. По словам ученых, найденные ими закономерности, скорее всего, применимы не только к языку, но и к другим областям человеческой деятельности.

Читайте «Мою Планету» в MAX