Игнатова София Дмитриевна

Федеральный исследовательский центр «Информатика и управление» РАН

E-mail: ignatova_sophia@ mail.ru

Об авторе Публикации

инженер

Надкорпусная база данных как инструмент изучения пунктуации
Вестник Московского Университета. Серия 19. Лингвистика и межкультурная коммуникация. 2024. Т. 27. № 4. c.147-158

Нуриев В.А., Игнатова С.Д.

подробнее
616
- В статье рассматриваются возможности таких современных информационных ресурсов, как надкорпусные базы данных, для многоаспектного изучения пунктуации. С одной стороны, в разных естественных языках при общем совпадении репертуара знаков препинания и их письменного обозначения могут обнаруживаться зоны функционального расхождения, в следствие чего правила расстановки одного и того же знака будут разниться от языка к языку. Знание этих межъязыковых расхождений принципиально важно для человека-переводчика и для обучения систем машинного перевода, в противном случае перевод может существенно нарушить смысловое содержание исходного текста. Некоторые такие различия зафиксированы в докорпусную эпоху. Еще больше межъязыковых пунктуационных дифференциаций позволяют выявить надкорпусные базы данных — информационные инструменты, возникшие благодаря к онсолидированным усилиям информатики, компьютерной лингвистики и корпусного переводоведения: они помогают верифицировать уже имеющиеся знания на больших текстовых массивах и дополнять их. С другой стороны, пунктуация традиционно считается областью языка, достаточно хорошо изученной, жестко регламентированной и потому наименее подверженной изменениям и инновациям. Однако надкорпусные базы данных предоставляют возможность выявить новые (еще не закрепленные в нормирующей литературе) функционально-семантические особенности употребления отдельно взятых знаков препинания. Всестороннее изучение функционально-семантической нагрузки пунктуационных знаков приобретает сейчас особое значение в связи с развитием информационных технологий на базе искусственного интеллекта, а именно: голосовых ассистентов. В статье на примере восклицательного знака в русском и французском языках показано, какие возможности надкорпусные базы данных открывают для изучения пунктуации.
  
  Ключевые слова: корпусные информационные ресурсы; аннотирование; пунктуация; контрастивные исследования; перевод; межъязыковая асимметрия; корпусное переводоведение; база данных
  DOI Number: 10.55959/MSU-2074-1588-19-27-4-11