Том 3, № 2 (2025)

Языки народов Российской Федерации: цифровые инструменты документирования и медиадоступность

Письменный корпус татарского языка: структура, состав и возможности использования

Кенешбекова Ш.Н.

Аннотация

Исследование носит аналитический характер и посвящено изучению и описанию структуры, состава и функциональных возможностей Письменного корпуса татарского языка (Корпус) - одного из наиболее масштабных цифровых ресурсов для тюркских языков Российской Федерации. Рассмотрены этапы создания Корпуса, методология сбора и аннотирования текстов, включая метаразметку и морфологическую разметку с использованием системы Apertium . Особое внимание уделено прикладным аспектам: интеграции Корпуса в системы синтеза и распознавания речи, разработке различных лингвистических сервисов, а также его применению в образовательных и научных проектах. Проанализированы принципы устранения дублирующихся текстов и предложены перспективы дальнейшего развития, включая расширение жанрового разнообразия и внедрение международных стандартов аннотирования. Материалом исследования послужили сам Корпус и публикации, описывающие этапы его создания и применения. Методология представлена комплексом эмпирических методов и приемов, как наблюдение, анализ, описание, тестирование (функциональных возможностей корпуса и др.), а также графический метод для визуализации изучаемого материала. Отмечена научная и культурная значимость Письменного корпуса татарского языка в контексте цифровизации языков народов России, что соответствует задачам Международного десятилетия языков коренных народов (2022-2032), инициированного Генеральной Ассамблей ООН и координируемого Организацией Объединенных Наций по вопросам образования, науки и культуры.

Macrosociolinguistics and Minority Languages. 2025;3(2):97-116
pages 97-116 views

Электронный текстовый корпус лингвокультуры Северного Приангарья: структура, состав и возможности использования

Кириленко Е.

Аннотация

Развитие цифровых технологий привело к появлению новых и удобных инструментов документирования и сохранения находящихся под угрозой исчезновения идиомов. Под последними могут пониматься как языки, так и диалекты и иные варианты языков, стандартные формы которых обладают высокой витальностью. Исследование посвящено комплексному анализу структуры, состава и функционального потенциала Электронного текстового корпуса лингвокультуры Северного Приангарья (КЛСП). Актуальность исследования обусловлена необходимостью фиксации исчезающих региональных вариантов русского языка и связанных с ними культурных практик в условиях глобализации и масштабных социальноэкономических изменений. Цель исследования - представить детальное описание корпуса как междисциплинарного инструмента для гуманитарных исследований. Материалом исследования послужили данные, представленные на официальном сайте корпуса, включая его структуру, метаразметку и описательные разделы. Основными методами выступили описательный анализ, корпусная лингвистика и элементы контент-анализа. Результаты исследования включают: детализацию трехуровневой структуры корпуса (диалектный, фольклорный, мультимедийный подкорпуса); описание уникальной системы многоаспектной ручной разметки (ареальная, временная, жанровая, тематическая, концептуальная, сюжетно-мотивная); анализ функциональных возможностей онлайн-платформы для сложного поиска; оценку научной значимости корпуса на основе уже выполненных исследований в области коммуникативной диалектологии, этнолингвистики и фольклористики. Подчеркивается роль КЛСП как ключевого ресурса для сохранения нематериального культурного наследия Северного Приангарья и потенциал корпуса в образовательных, лексикографических и технологических проектах.

Macrosociolinguistics and Minority Languages. 2025;3(2):117-130
pages 117-130 views

Производство аудиокниг на языках народов России с использованием синтезаторов речи: проблемы и перспективы

Пожидаев М.С., Теплых Е.С., Данилов С.И.

Аннотация

Создание аудиокниг на языках народов России с применением синтезаторов речи - научно и социально значимая задача. Актуальность исследования обусловлена развитием речевых технологий и государственной политикой поддержки языкового разнообразия в т. ч. в цифровом пространстве. Рассмотрен типовой алгоритм создания аудиокниги, выделены инвариантные и лингво-специфичные этапы разработки. Отмечено, что основные сложности связаны с этапами, требующими языковой адаптации текста к озвучиванию синтезатором речи: аннотированием, расшифровкой аббревиатур и сокращений. Для малоресурсных языков особую проблему представляют задачи сегментации, токенизации и контекстного аннотирования, включая обработку омографов и фонетических особенностей конкретных языков. Сделан вывод о невозможности полной автоматизации процесса создания аудиокниг на языках народов России с использованием синтезаторов речи на данном этапе развития этой технологии. Создание аудиокниг на таких языках требует предварительной разработки специализированных лингвистических ресурсов. Необходимым условием является формирование параллельного корпуса текстов и аудиозаписей, созданных носителями языка. Таким образом, успешная реализация подобных проектов требует значительных предварительных работ по сбору обучающих датасетов и адаптации алгоритмов под специфику конкретного языка.

Macrosociolinguistics and Minority Languages. 2025;3(2):131-145
pages 131-145 views

Язык и культура как символический капитал

Социокультурные ограничения перевода кинозаголовков: почему ИИ их не преодолеть

Алюнина Ю.М., Ганеева Э.Р.

Аннотация

Особенностям локализации кинозаголовков посвящено много исследований. Большинство из них фокусируется на лингвистической и культурной специфике адаптации названия фильма к стране принимающего языка. Значительно реже в научной литературе поднимается вопрос влияния экстралингвистических факторов на перевод кинозаголовка: исторического, социального, политического контекстов, а также условий рыночной экономики. В то же время на различных переводческих форумах, сайтах стриминговых платформ и онлайн-кинотеатров встречается немалое количество обывательских и профессиональных обзоров тех причин, которые могут влиять на перевод названия аудиовизуального произведения. В современных реалиях вопрос перевода осложняется развитием технологий искусственного интеллекта, массовость которых ставит под сомнение необходимость человеческого перевода в некоторых областях знания, особенно когда речь идет о небольшом фрагменте текста, как, например, название фильма. Однако в силу того, что локализация фильма посредством его названия является областью деятельности маркетологов, а не переводчиков, перевод кинозаголовка подчиняется не только лингвистическим законам, но и маркетинговым, которые современные машинные переводчики пока не способны соблюдать. С учетом социокультурной сути локализации кинозаголовка, а также в свете развития машинных переводчиков на примере переводов кинозаголовков с английского языка на русский рассмотрены стратегии их адаптации к принимающему русскоязычному рынку. Исследование носит аналитический характер и основано на обзорах российских стриминговых платформ и переводческих компаний, которые делятся своими наблюдениями о стратегиях перевода англоязычных фильмов в контексте локализации британских и американских фильмов для российского рынка. Методологическое ядро исследования составляют эмпирические методы. В результате исследования удалось выделить 7 основных стратегий локализации: расширение названия, использование мемов, развитие истории, добавление сленга, добавление сексуального подтекста, снижение риска политизированности, расширение франшизы.

Macrosociolinguistics and Minority Languages. 2025;3(2):146-165
pages 146-165 views

Социолингвистические параметры образа СССР в романе У. Тевиса «The Queen’s gambit» и его экранизации: легитимация доминирования

Кузнецова А.С.

Аннотация

Рассмотрены языковые средства для создания образа СССР в межсемиотической плоскости на материале речи героев романа У. Тевиса «The Queen’s Gambit» (1984), его русскоязычного перевода «Ход королевы» (2020), экранизации романа и его аудиовизуальной адаптации на русский язык. Исследовательский корпус составили реплики главных персонажей литературного и кинематографического произведений. Лексический материал реплик был распределен по группам: имена и фамилии героев, топонимы, шахматная терминология и лексика, описывающая реалии Советского Союза. Отдельное внимание обращено на роль русского языка в англоязычном оригинале романа, стратегии передачи функционала русской речи в переводе рассмотренных произведений на русский язык. Методология исследования представлена количественным и качественным подходами. Количественный подход включает инструменты дальнего чтения (работа с корпусным менеджером Sketch Engine и его инструментами Word List и Keyword ), качественный - кластеризацию и лексико-семантический анализ фокусных лексических единиц. Выявлены ключевые стратегии репрезентации образа «другого». В оригинале романа лингвистическая маркировка советского пространства достигается за счет транслитерации русских лексем, создающей для англоязычной аудитории эффект культурной дистанции. В русскоязычном переводе данный эффект нивелируется, а языковой барьер передается имплицитно через авторские ремарки. Экранизация формирует образ СССР преимущественно через комплекс аудиовизуальных кодов (кадры архитектуры, предметов быта, невербальная коммуникация и др.), создавая детализированный визуальный контекст. При этом в локализованном сериале утрачивается исходная языковая полифония, приводящая к снижению аутентичности и смысловым упрощениям. Исследование показало, что анализируемый образ предстает как динамический конструкт, формирующийся в результате активизации вербальных, переводческих и визуальных стратегий.

Macrosociolinguistics and Minority Languages. 2025;3(2):166-191
pages 166-191 views

Символический капитал и конструирование «другого»: цвет как маркер образа России в американском кинематографе

Роговец А.А.

Аннотация

Процессы глобализации среди прочего направлены на унификацию семиотического пространства, что приводит к трансформации структур языка и культуры как символического капитала. Один из наиболее действенных инструментов мягкой силы - кинематограф, полимодальная семантика которого обладает эффективным набором различных инструментов воздействия на зрителя. Помимо развлекательной функции кинокартины могут использоваться в качестве инструмента «мягкой силы». Существующие исследования этого феномена фокусируются на сюжете и комплексном представлении событий и персонажей, репрезентация которых является центральным элементом картины. Изучение таких элементов репрезентации, как звучащий и написанный текст, костюмы, музыкальные произведения, постановка кадра и цвет, позволит сформировать наиболее эффективный набор инструментов воздействия. Цель исследования - проследить инструментализацию цвета при формировании образа России в американском кино. Материалом выступили американские фильмы, отобранные по подготовленным критериям. Проведение исследования в два этапа позволило рассмотреть 50 кинокартин с дальнейшим более детальным изучением 30 из них. Корпусный анализ текстов субтитров к кинофильмам выявил вхождения с упоминанием России, русских людей или элементов русской культуры. Впоследствии было решено рассмотреть визуальную составляющую в момент звучания реплик, а затем и применение цвета. В результате выявлена наибольшая частотность использования в кадре красного цвета с отсылкой к элементам государственной символики. Отмечено: с функциональной точки зрения цвет в большинстве случаев лишь дополняет и усиливает значение, переданное другими инструментами, а не формирует его самостоятельно. Полученные результаты показали, что выбор цвета не всегда обусловлен эстетическими требованиями, но может быть следствием макропроцессов социального и языкового характера, за которыми стоит языковое и культурное доминирование.

Macrosociolinguistics and Minority Languages. 2025;3(2):192-213
pages 192-213 views

НАУЧНЫЕ СОБЫТИЯ. ОБЗОРЫ. РЕЦЕНЗИИ

Геоинформационное картографирование в современных этнографических исследованиях

Сидорина И.Е., Сюзюмов А.А.

Аннотация

-

Macrosociolinguistics and Minority Languages. 2025;3(2):214-221
pages 214-221 views