ЖАНРЫ

Введение в лингвофольклористику: учебное пособие
Шрифт:

Филологическая мысль и практика видят несколько путей работ, целесообразных с точки зрения использования современных информационных технологий в интересах гуманитарной практики. Среди них фольклористическое направление. В материалах конференции «Современная технология и филология» (Москва, ИЛИ РАН, 2005) приводятся конкретные примеры использования информационных технологий в деятельности собирателей и исследователей народного творчества: фольклорный архив Кабинета фольклора и теории литературы филфака СПбГУ [Веселова 2005]; электронная версия фольклорного архива Сыктывкарского государственного университета [Канева, Чаркова 2005]; электронное издание удмуртского фольклора на примере локальной традиции [Попова, Перевозчиков 2005];

система СКАЗКА как инструмент исследования волшебных сказок [Рафаева 2005]; мультимедийные технологии описания фольклорной и хозяйственно-бытовой традиции села [Серов 2005]. В материалах международной научной конференции «Типология фольклорной традиции: актуальные проблемы полевой фольклористики» (Москва, 22–23 ноября 1999 г.) есть специальный раздел «Компьютерная систематизация полевых записей и мультимедийные публикации».

Суть материалов этого раздела выражена в статье о проблемах компьютеризации фольклорных архивов [Мороз 2004]. Автор пишет о том, что большинство фольклорных, диалектологических и этнолингвистических архивов организовано по старинке, что позволяет использовать информацию не более чем на 30 %, поскольку записи в картотеках рассортированы по минимуму признаков; записи хранятся в папках или в аудиокассетах с краткой описью; классификация, сортировка и поиск возможны по одному параметру; доступ лиц, не причастных непосредственно к созданию архива, затруднителен; публикация материалов в значительном объёме затруднена; записи в одном селе дублируются разными экспедициями. Первые попытки применения компьютерной техники ориентируются на те же принципы, что и рукописные архивы. Автор формулирует принципы использования компьютера в создании фольклорных архивов: одновременный перекрёстный поиск по разным параметрам: соединение текстовых, аудио-, фото– и видеоматериалов в одном архиве; широкие возможности распространения (в том числе и через Интернет); создание единой информационной системы, объединяющей несколько архивов.

Информационные технологии можно классифицировать как коллективные и индивидуальные. Коллективные технологии делятся на технологии общего пользования, способные решать неограниченный круг задач, и технологии специализированные, тематические, создаваемые с целью решения определённых задач. К первым относятся технологии, основанные на корпусной лингвистике. Ко вторым можно отнести, например, ресурсы для исследования топонимии. Индивидуальными можно назвать те, которые создаются если не самим пользователем, то при активном его участии и ориентированы на решение определённых исследовательских задач.

Начнём с вопроса, в какой реальной помощи со стороны информатики нуждается гуманитарий-исследователь? Ответ: в наличии электронного корпуса текстов и программном обеспечении, позволяющем быстро и точно представлять пользователю все необходимые языковые единицы в отвлечении от текста и в форме конкорданса. Информационная технология должна дать сведения о наличии требуемого элемента, его количестве (словоупотреблении) и функции в контексте. В итоге в руках исследователя должен оказаться своеобразный текстовый информационный комплекс: текст – программа – промежуточные вспомогательные материалы, полученные с помощью программы на базе привлечённого текста.

Как используются индивидуальные информационные системы, покажем на примере созданного нами информационного текстового комплекса «Конкорданс русской народной лирики».

Из семитомного свода А.И. Соболевского «Великорусские народные песни» (СПб., 1895–1902) (тома 2–6) были извлечены песенные тексты, записанные в XIX веке в Курской, Архангельской и Олонецкой губерниях. Также учитывались былинные тексты, записанные А.Ф. Гильфердингом от Т.Г. Рябинина. В итоге сформировались четыре корпуса текстов – «Курск», «Архангельск», «Олонец» и «Рябинин».

Тексты подверглись некоторой адаптации: были сняты все примечания и указания на место записи, сборник и год публикации, каждый текст получил паспорт – в ломаных скобках номер тома свода Соболевского / Гильфердинга и номер песни / былины в томе. В результате каждый корпус превратился в единый текст, похожий на гипертекст, под которым понимается некое информационное пространство, позволяющее разрушить формальную оболочку отдельного конкретного текста, в него помещённого, за счёт создания системы связей, служащих объединению этих отдельных текстов в сверхтекстовые единства [Дедова 2003: 106–107]. В нашем случае гипертекст – это корпус текстов, представленный одним файлом в текстовом формате с системой паспортизации.

Далее гипертекст с помощью компьютерной «Программы автоматизированного составления и обработки словников» (авторы – Михаил Викторович и Елена Викторовна Литус из города Славянска-на-Кубани) преобразуется в лексикографические продукты.

Рабочее окно программы состоит из трёх полей: (1) поле словника, (2) поле слияния словоформ в лексему и (3) конкорданс отмеченной словоформы (лексемы). В нижней строке отмечается наличие / отсутствие текстового файла, необходимого для составления словника.

Меню первого поля «Файл» содержит команды следующих операций.

Открыть – открывается анализируемый текстовый файл. В специальной строке внизу указывается имя открытого файла, его адрес и степень готовности словника (в процентах).

(Рис. 1)

Сохранить – словник словоформ (лексем) фиксируется в специальном файле с расширением. slv, который раскрывается только программой NewSlov.

Экспорт – создаётся текстовый файл словника.

Выход – завершение работы программы.

Меню первого поля «Вид» обеспечивает обе основные операции программы – (1) операцию по слиянию словоформ в лексему и (2) предъявление контекста со словоформой.

Меню первого поля «Сервис» содержит следующие команды.

Загрузить словник – открывается текстовый файл словника с расширением. slv.

Создать словник – загруженный текстовый файл «рассыпается» на словоформы. Одинаковые словоформы суммируются. Например,

ала 1

алаго 2

алее 1

алой 2

алу 1

алую 1

алы 1

алые 1

алым 1

алыя 1

В итоге в словнике появляется лексема алый 12.

Сортировать – производится алфавитное упорядочение списка словоформ (лексем).

Поиск – обеспечивает возможность нахождения любой словоформы (лексемы).

Удалить контекст – используется при редактировании введённого текстового файла.

Правая клавиша «мышки» обеспечивает операции:

Удалить – удаляет слово из словника.

Копия – делает копию выделенного в словнике слова (для разведения омонимов)

Удалить контекст – удаляются контексты, не соответствующие тому или иному омониму

Отправить в Word – создаёт файл с конкордансом избранной словоформы (лексемы).

Итак, мы загрузили олонецкие песни в текстовом файле и в меню «Сервис» использовали команду «Создать словник». В результате в левом поле появился алфавитный список словоформ с указанием частотности. По умолчанию одна из словоформ автоматически случайным образом выделена. Эта выделенная словоформа появляется в центральном поле. Как только в квадратике будет поставлена «галочка», внизу в окошке «Слово для замены» появится эта же словоформа, которую можно редактировать, заменяя её на исходную форму. По команде «Слить» в левом поле появится исходная форма. В правом поле – конкорданс словоформы (лексемы). Если в окошке «Использовать паспортизацию» стоит галочка, то каждый контекст сопровождается указанием номера тома и номера песни (былины) в томе (в ломаных скобках) (рис. 2). «Упорядочить паспортизацию» – конкорданс сортируется в порядке следования томов и номеров песен (былин).

Поделиться с друзьями: