<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE root>
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ali="http://www.niso.org/schemas/ali/1.0/" article-type="research-article" dtd-version="1.2" xml:lang="en"><front><journal-meta><journal-id journal-id-type="publisher-id">Macrosociolinguistics and Minority Languages</journal-id><journal-title-group><journal-title xml:lang="en">Macrosociolinguistics and Minority Languages</journal-title><trans-title-group xml:lang="ru"><trans-title>Macrosociolinguistics and Minority Languages</trans-title></trans-title-group></journal-title-group><issn publication-format="electronic">2949-5997</issn><publisher><publisher-name xml:lang="en">Peoples' Friendship University of Russia</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="publisher-id">50693</article-id><article-id pub-id-type="doi">10.22363/2949-5997-2025-3-2-117-130</article-id><article-id pub-id-type="edn">HDFRDB</article-id><article-categories><subj-group subj-group-type="toc-heading" xml:lang="en"><subject>The Languages of the Peoples of Russian Federation:  Digital Documentation Tools and Media Accessibility</subject></subj-group><subj-group subj-group-type="toc-heading" xml:lang="ru"><subject>Языки народов Российской Федерации: цифровые  инструменты документирования и медиадоступность</subject></subj-group><subj-group subj-group-type="article-type"><subject>Research Article</subject></subj-group></article-categories><title-group><article-title xml:lang="en">Digital corpus of the linguoculture of the Northern Angara region: structure, composition and applications</article-title><trans-title-group xml:lang="ru"><trans-title>Электронный текстовый корпус лингвокультуры Северного Приангарья: структура, состав и возможности использования</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><contrib-id contrib-id-type="orcid">https://orcid.org/0009-0003-1238-2923</contrib-id><contrib-id contrib-id-type="spin">6450-4415</contrib-id><name-alternatives><name xml:lang="en"><surname>Kirilenko</surname><given-names>Elena</given-names></name><name xml:lang="ru"><surname>Кириленко</surname><given-names>Елена</given-names></name></name-alternatives><bio xml:lang="en"><p>6 Miklukho-Maklaya st., Moscow, 117198, Russian Federation.</p></bio><bio xml:lang="ru"><p>аспирант, лаборант кафедры иностранных языков филологического факультета</p></bio><email>kirilenko-e@rudn.ru</email><xref ref-type="aff" rid="aff1"/></contrib></contrib-group><aff-alternatives id="aff1"><aff><institution xml:lang="en">RUDN University</institution></aff><aff><institution xml:lang="ru">Российский университет дружбы народов</institution></aff></aff-alternatives><pub-date date-type="pub" iso-8601-date="2026-06-17" publication-format="electronic"><day>17</day><month>06</month><year>2026</year></pub-date><volume>3</volume><issue>2</issue><issue-title xml:lang="en"/><issue-title xml:lang="ru"/><fpage>117</fpage><lpage>130</lpage><history><date date-type="received" iso-8601-date="2026-06-18"><day>18</day><month>06</month><year>2026</year></date></history><permissions><copyright-statement xml:lang="en">Copyright ©; 2025, Kirilenko E.</copyright-statement><copyright-statement xml:lang="ru">Copyright ©; 2025, Кириленко Е.</copyright-statement><copyright-year>2025</copyright-year><copyright-holder xml:lang="en">Kirilenko E.</copyright-holder><copyright-holder xml:lang="ru">Кириленко Е.</copyright-holder><ali:free_to_read xmlns:ali="http://www.niso.org/schemas/ali/1.0/"/><license><ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">http://creativecommons.org/licenses/by/4.0</ali:license_ref></license></permissions><self-uri xlink:href="https://macrosociolingusictics.ru/MML/article/view/50693">https://macrosociolingusictics.ru/MML/article/view/50693</self-uri><abstract xml:lang="en"><p>The development of digital technology has led to the emergence of new and convenient tools for documenting and preserving endangered idioms. These include languages, dialects, and other language variants whose standard forms are highly active. The study presents a comprehensive analysis of the Electronic Text Corpus of the Linguistic Culture of the Northern Angara Region (CLCNA), focusing on its structure, composition, and functional potential. The relevance of this study stems from the need to preserve regional variants of the Russian language and associated cultural practices in a rapidly changing world. The purpose of this study is to describe the corpus as a valuable tool for humanities research, providing a detailed overview of its structure and features. The study relies on data available on the official corpus website, including information about its structure, metadata, and descriptive elements. Using descriptive analysis, corpus linguistics, and content analysis techniques, the author provides a thorough description of the CLCNA’s three-tiered structure, including dialectal, folklore, and multimedia subsets. The findings of this research contribute to a better understanding of the corpus’s capabilities and potential applications in various fields of study.; A description of the unique system of multi-dimensional manual annotation (spatial, temporal, genre, thematic, conceptual, and plot motif); an analysis of the functional capabilities of the online platform for complex search; and an assessment of the scientific significance of the corpus based on previous research in the fields of communicative dialectology, ethnolinguistics, and folklore studies. The study concludes by emphasizing the role of CLCNA as a key resource for preserving the intangible cultural heritage of the Northern Angara Region and its potential in educational, lexicographic, and technological projects.</p></abstract><trans-abstract xml:lang="ru"><p>Развитие цифровых технологий привело к появлению новых и удобных инструментов документирования и сохранения находящихся под угрозой исчезновения идиомов. Под последними могут пониматься как языки, так и диалекты и иные варианты языков, стандартные формы которых обладают высокой витальностью. Исследование посвящено комплексному анализу структуры, состава и функционального потенциала Электронного текстового корпуса лингвокультуры Северного Приангарья (КЛСП). Актуальность исследования обусловлена необходимостью фиксации исчезающих региональных вариантов русского языка и связанных с ними культурных практик в условиях глобализации и масштабных социальноэкономических изменений. Цель исследования - представить детальное описание корпуса как междисциплинарного инструмента для гуманитарных исследований. Материалом исследования послужили данные, представленные на официальном сайте корпуса, включая его структуру, метаразметку и описательные разделы. Основными методами выступили описательный анализ, корпусная лингвистика и элементы контент-анализа. Результаты исследования включают: детализацию трехуровневой структуры корпуса (диалектный, фольклорный, мультимедийный подкорпуса); описание уникальной системы многоаспектной ручной разметки (ареальная, временная, жанровая, тематическая, концептуальная, сюжетно-мотивная); анализ функциональных возможностей онлайн-платформы для сложного поиска; оценку научной значимости корпуса на основе уже выполненных исследований в области коммуникативной диалектологии, этнолингвистики и фольклористики. Подчеркивается роль КЛСП как ключевого ресурса для сохранения нематериального культурного наследия Северного Приангарья и потенциал корпуса в образовательных, лексикографических и технологических проектах.</p></trans-abstract><kwd-group xml:lang="en"><kwd>corpus linguistics</kwd><kwd>language documentation</kwd><kwd>Russian language</kwd><kwd>dialect</kwd><kwd>idiom vitality</kwd><kwd>language preservation</kwd></kwd-group><kwd-group xml:lang="ru"><kwd>корпусная лингвистика</kwd><kwd>документирование языка</kwd><kwd>русский язык</kwd><kwd>диалект</kwd><kwd>витальность идиома</kwd><kwd>сохранение языка</kwd></kwd-group><funding-group/></article-meta><fn-group/></front><body></body><back><ref-list><ref id="B1"><label>1.</label><citation-alternatives><mixed-citation xml:lang="en">Felde, O.V. (2021). Electronic corpus of linguoculture of the Northern Angara region: Foundations, structure, and application. The Bulletin of Kemerovo State University, 23(4), 1086–1095. (In Russ.). https://doi.org/10.21603/2078–8975–2021–23–4–1086–1095 EDN: YBZRHW</mixed-citation><mixed-citation xml:lang="ru">Васильев В.К. Об архетипическом подходе к анализу женских образов-­характеров (письменный и устный текст) // Сибирский филологический журнал. 2018. № 3. С. 142–153. https://doi.org/10.17223/18137083/64/14 EDN: XZEUXR</mixed-citation></citation-alternatives></ref><ref id="B2"><label>2.</label><citation-alternatives><mixed-citation xml:lang="en">Kaiser, K.V. (2018). The concept ‘Healer’ in the linguistic culture of Angara region. Proceedings of the 2nd international scientific and practical conference ‘High technologies, science and education: current issues, achievements and innovations’, 164–166. Nauka i prosveshchenie publ. (In Russ.). EDN: YQZBMD</mixed-citation><mixed-citation xml:lang="ru">Вязовикина О.В. Ангарский охотничий нарратив как объект лингвистического исследования // Филологические науки. Вопросы теории и практики. 2020. Т. 13. № 1. С. 135–138. https://doi.org/10.30853/filnauki.2020.1.26 EDN: RBFGFW</mixed-citation></citation-alternatives></ref><ref id="B3"><label>3.</label><citation-alternatives><mixed-citation xml:lang="en">Rodionova, A.P., &amp; Pellinen, N.A. (2024). The corpus linguistics and the marathon of recordings of Vepsian and Karelian speech as a tool for popularizing the Baltic-­Finnish languages of Karelia. Macrosociolinguistics and Minority Languages, 2(2), 115–130. (In Russ.). https://doi.org/10.22363/2312–797X2024–2–2–115–130 EDN: IPVMVI</mixed-citation><mixed-citation xml:lang="ru">Кайзер К.В. Концепт «знахарка» в ангарской лингвокультуре // Высокие технологии, наука и образование: актуальные вопросы, достижения и инновации : сб. статей II Междунар. науч.-практ. конф., Пенза, 10 ноября 2018 г. Пенза : МЦНС «Наука и Просвещение», 2018. С. 164–166. EDN: YQZBMD</mixed-citation></citation-alternatives></ref><ref id="B4"><label>4.</label><citation-alternatives><mixed-citation xml:lang="en">Smirnov, E.S. (2018). The value layer of the ‘Evenki’ concept in Angarsk linguoculture. Proceedings of the 56th international scientific student conference, 76–77. Novosibirsk State University publ. (In Russ.). EDN: XVMNOP</mixed-citation><mixed-citation xml:lang="ru">Родионова А.П., Пеллинен Н.А. Корпусная лингвистика и марафон записей вепсской и карельской речи как инструмент популяризации прибалтийско-­финских языков Карелии // Macrosociolinguistics and Minority Languages. 2024. T. 2. № 2. С. 115–130. https://doi.org/10.22363/2312-797X2024-2-2-115-130 EDN: IPVMVI</mixed-citation></citation-alternatives></ref><ref id="B5"><label>5.</label><citation-alternatives><mixed-citation xml:lang="en">Speranskaya, A.N. (2017). Inserted utterances about parents in narratives of the Angara river area inhabitants. Social Sciences, (5), 390–399. (In Russ.). EDN: XOQCST</mixed-citation><mixed-citation xml:lang="ru">Смирнов Е.С. Ценностный слой концепта «эвенки» в ангарской лингвокультуре // МНСК‑2018: Языкознание : материалы 56‑й Междунар. науч. студ. конф. Новосибирск : Новосибирский национальный исследовательский государственный университет, 2018. С. 76–77. EDN: XVMNOP</mixed-citation></citation-alternatives></ref><ref id="B6"><label>6.</label><citation-alternatives><mixed-citation xml:lang="en">Utkina, Yu.V. (2024). Representation of the concept-­mythologeme ‘Brownie’ in Russian linguoculture (based on the material of regional and urban folklore). Chelovek i tekst [Man and text], 118–125. (In Russ.). EDN: JVLLJO</mixed-citation><mixed-citation xml:lang="ru">Сперанская А.Н. Вставные реплики о родителях в нарративах ангарцев // Общественные науки. 2017. № 5. С. 390–399. EDN: XOQCST</mixed-citation></citation-alternatives></ref><ref id="B7"><label>7.</label><citation-alternatives><mixed-citation xml:lang="en">Vasiliev, V.K. (2018). Оn the archetypical approach to the analysis of female images-­characters (written and oral text). The Siberian Journal of Philology, (3), 142–153. (In Russ.). https://doi.org/10.17223/18137083/64/14 EDN: XZEUXR</mixed-citation><mixed-citation xml:lang="ru">Уткина Ю.В. Репрезентация концепта-­мифологемы «домовой» в русской лингвокультуре (на материале региональных быличек и городского фольклора) // Человек и текст : материалы VI Междунар. лингвокультуролог. конф., посв. 225‑летию со дня рожд. А.С. Пушкина, Ульяновск, 24 апреля 2024 г. Ульяновск : Ульяновский государственный университет, 2024. С. 118–125. EDN: JVLLJO</mixed-citation></citation-alternatives></ref><ref id="B8"><label>8.</label><citation-alternatives><mixed-citation xml:lang="en">Vyazovikina, O.V. (2020). Angara hunters’ narrative as an object of linguistic studies. Philology. Theory &amp; Practice, 13(1), 135–138. (In Russ.). EDN: RBFGFW</mixed-citation><mixed-citation xml:lang="ru">Фельде О.В. Электронный текстовый корпус лингвокультуры Северного Приангарья: принципы создания, структура и возможности использования // Вестник Кемеровского государственного университета. 2021. Т. 23. № 4 (88). С. 1086–1095. https://doi.org/10.21603/2078-8975-2021-23-4-1086-1095 EDN: YBZRHW</mixed-citation></citation-alternatives></ref></ref-list></back></article>
