РЕЧЕВОЙ КОРПУС ВЕПКАР КАК ИНСТРУМЕНТ СОХРАНЕНИЯ ДИАЛЕКТНОЙ РЕЧИ ПРИБАЛТИЙСКО-ФИНСКИХ НАРОДОВ КАРЕЛИИ

  • Александра Павловна Родионова
    • Институт языка, литературы и истории Карельского научного центра РАН
  • Наталья Борисовна Крижановская
    • Институт прикладных математических исследований Карельского научного центра РАН
  • Наталия Александровна Пеллинен
    • Институт языка, литературы и истории Карельского научного центра РАН
Ключевые слова: Речевой корпус, вепсский язык, карельский язык, корпусная лингвистика, аудио-образцы, разметка текста

Аннотация

Статья посвящена описанию Речевого корпуса прибалтийско-финской речи, созданного на платформе «Открытого корпуса вепсского и карельского языков» (ВепКар), его архитектуре и возможностям. Разработанный сотрудниками Института языка литературы и истории (ИЯЛИ) и Института прикладных математических исследований (ИМПИ) Речевой корпус представляет собой собрание звучащих текстов на разных диалектах карельского и вепсского языков, снабженных транскрипцией, разметкой и переводом на русский язык, а также необходимые для работы поисковые фильтры (поиск по языку/диалекту, месту и году записи, информанту и собирателю, источнику). Актуальность исследования обусловлена необходимостью дальнейшего развития корпуса ВепКар, широко востребованного как в научных исследованиях, так и в процессе развития литературных форм карельского и вепсского языков. Применение современных технологий и методик к накопленному на протяжении многих десятилетий полевому материалу в совокупности с новейшими данными позволит восполнить целый ряд лакун, выявленных лингвистами в данной системе ранее. Для наполнения корпуса аудиозаписями карельской и вепсской речи исследователи используют три основных источника: аудиоколлекции Фонограммархива ИЯЛИ КарНЦ РАН, аудиозаписи передач на ливвиковском наречии карельского языка, а также полевые материалы авторов, записанные в ходе экспедиций. Научная новизна обоснована недостатком речевых корпусов прибалтийско-финских языков. Цифровизация архивных и полевых аудио-образцов карельской и вепсской речи в формате Речевого корпуса в дальнейшем сможет упростить обработку и хранение материалов, позволит ввести в научный оборот и представить в открытый доступ уникальные аудиоматериалы, отражающие состояние карельских и вепсских диалектов начиная с середины прошлого столетия.

Литература

1. Баранцев А. П. Образцы людиковской речи (образцы корпуса людиковского идиолекта) / А. П. Баранцев. Петрозаводск: Карелия, 1978. 287 c.
2. Бойко Т. П. Лингвистический корпус ВепКар - «заповедник» прибалтийско-финских языков Карелии / Бойко Т. П., Зайцева Н. Г, Крижановская Н. Б., Крижановский А. А., Новак И. П.,. Пеллинен Н. А., Родионова А. П., Трубина Е. Д. // Труды КарНЦ РАН. - 2021. - № 7. - C. 100-115
3. БНК - Британский национальный корпус: URL: http://www.natcorp.ox.ac.uk/ (дата обращения: 18.11.2022).
4. ВепКар - Открытый корпус вепсского и карельского языков: URL: http://www.dictorpus.krc.karelia.ru/ (дата обращения: 05.12.2022)
5. ВНК - Венгерский национальный корпус: URL: http://mnsz.nytud.hu/index_eng.html/ (дата обращения: 16.11.2021).
6. Зайцева Н. Г. Вепсские причитания в фокусе корпусной лингвистики и лингвофольклористики / Зайцева Н. Г. // Материалы XLI Международной филологической конференции. 26-31 марта 2012 г. Секция «Уралистика». - Санкт-Петербург: Филологический факультет СПбГУ, 2012. - C. 16-26.
7. Зайцева Н. Г. Корпусная лингвистика в прибалтийско-финском исследовательском пространстве (на материале Корпуса вепсского языка и Открытого корпуса вепсского и карельского языков) / Зайцева Н. Г., Крижановская Н. Б. // Альманах североевропейских и балтийских исследований. - 2018. - Выпуск 3. - C. 264-273.
8. ККЗЯ - Корпус коми-зырянского языка: URL: http://komi-zyrian.webcorpora.net/ (дата обращения: 16.11.2022)
9. ККПЯ - Корпус коми-пермяцкого языка: URL: http://komi-permyak.web-corpora.net/ (дата обращения: 16.11.2022)
10. КЛМЯ - Корпус лугового марийского языка: URL: http://meadow-mari.web-corpora.net/ (дата обращения: 16.11.2022).
11. Крижановский А. А. Представление диалектов в Открытом корпусе вепсского и карельского языков (ВепКар) / Крижановский А. А., Крижановская Н. Б., Новак И. П // Труды международной конференции «Корпусная лингвистика - 2019». СПб, 2019. C. 288-295.
12. Кузнецова В. П. Формирование фондов Фонограммархива ИЯЛИ КарНЦ РАН, проблемы их сохранения и систематизации / Кузнецова В.П. // Кижский вестник. 2017. Вып. 17. С. 185-192.
13. Макаров Г. Н. Образцы карельской речи / Г. Н. Макаров, В. Д. Рягоев. Ленинград: Наука, 1969. 283 с.
14. НКРЯ - Национальный корпус русского языка: URL: http://www.ruscorpora.ru/ (дата обращения: 16.11. 2022).
15. НКУЯ - Национальный корпус удмуртского языка: URL: http://udmcorpus.udman.ru/ (дата обращения: 16.11.2022).
16. Новак И. П. Коллекция тверских карельских диалектных материалов в Фонограммархиве ИЯЛИ КарНЦ РАН / Новак И. П // Ученые записки Петрозаводского государственного университета. 2021. Т. 43, № 1. С. 41-51.
17. Родионова А. П. О коллекциях людиковских диалектных материалов Фонограммархива ИЯЛИ КарНЦ РАН / Родионова А. П. // Ученые записки Петрозаводского государственного университета. 2022 Т. 44, № 7 С. 64-70
18. СКЭЯ - Сводный корпус эстонского языка: URL: https://www.cl.ut.ee/korpused/segakorpus/index.php?lang=en/ (дата обращения: 16.11.2022).
19. ФА - Фонограммархив ИЯЛИ КарНЦ РАН: URL: http://phonogr.krc.karelia.ru/ (дата обращения: 16.11.2022).
20. ЧНК - Чешский национальный корпус: URL: https://www.korpus.cz/ (дата обращения: 17.11.2022).
21. ЯБФ - Языковой банк Финляндии: URL: https://www.kielipankki.fi/aineistot/ftc/ (дата обращения: 16.11.2022).
22. Boyko Tatyana. The Open corpus of the Veps and Karelian languages: overview and applications / Boyko Tatyana, Zaitseva Nina, Krizhanovskaya Natalia, Krizhanovsky Andrew, Novak Irina, Pellinen Nataliya, Rodionova Aleksandra // KnE Social Sciences. -7(3). - 2022. - P. 29-40.
23. Krizhanovskaya, N. Morphological inflectional rules for Karelian Proper verbs / Krizhanovskaya, N., Novak, I., Krizhanovsky, A., Pellinen, N. Eesti Ja Soome-Ugri Keeleteaduse Ajakiri. Journal of Estonian and Finno-Ugric Linguistics, 13(2). 2022. P. 47-78.
24. Näytteitä karjalan kielestä I (Образцы карельской речи). Joensuu-Петрозаводск, 1994. 455 с.
Поступила в редакцию 2023-05-29
Опубликована 2023-09-29
Раздел
Языкознание
Страницы
343-351