Все новости

В мурманском университете разработали программу автоматического поиска неологизмов и архаизмов

В АИФ-Мурманск сообщили, что Мурманский арктический университет представил инновационный проект по автоматическому обнаружению изменений в языковой лексике.

Для этого мы разработали специальную программу на основе языка программирования, позволяющую сравнивать изменения частоты употребления слов в больших текстовых файлах. Это позволяет находить новые и старые слова и отслеживать изменения с течением времени. .

— Раньше ученые искали новые слова вручную. То есть они могли читать газетные статьи, интернет-форумы и т. д. и самостоятельно создавать из этих слов новые слова, которые впоследствии можно было проанализировать и внести в словарь. Этот метод требует много времени и усилий, субъективен и ограничен предпочтениями ученого. Более того, найти таким способом слова, выходящие из языка, вообще невозможно», — пояснила автор проекта, кандидат лингвистических наук, доцент Татьяна Рычкова.

Она подчеркнула, что вообще слова, обозначающие то, чего не существует, например «кафтан», или древние славянские слова, например «уста», считаются бесполезными. Наш инновационный проект позволяет нам подсчитывать все новые и архаичные слова с высоким уровнем точности и объективности.

С помощью специальной программы были обработаны текстовые файлы трёх исторических периодов (дореволюционного с 1700 по 1916 год, советского с 1918 по 1991 год и постсоветского с 1992 по 2016 год) общим объёмом 250 миллионов слов. Сравните и проанализируйте.

«Эти файлы никогда не смогут быть проанализированы людьми». Даже пролистать эти файлы — невыполнимая задача для человека. Для сравнения, в «Войне и мире» всего 188 088 слов», — добавила Татьяна Рычкова.

Хотя этот проект появился совсем недавно, он уже дал очень интересные результаты. Поэтому, по мнению автора, количество новых слов намного превышает количество уходящих. Вопреки нашим страхам, это означает, что наш словарный запас становится шире и богаче. С другой стороны, упрощается грамматика и сокращается количество разных форм слова или слова с одним и тем же корнем.

Подобное исследование проводится в России впервые. Ожидается, что на основе выявленных изменений можно будет выявить общие тенденции в словарном запасе и спрогнозировать будущие изменения, например, за счет использования искусственного интеллекта.

Теперь они тоже читают: «Пока не буду рекламировать свое рабочее место»: Мэр Полярных Зори переезжает в Запорожскую область.


Источник: Информационное агентство Nord-NewsИнформационное агентство Nord-News

Загрузка новости...

Два крестьянина и один цвет

Loading...