Чтение онлайн

ЖАНРЫ

Актуальные проблемы современной лингвистики. Учебное пособие

Чурилина Любовь Николаевна

Шрифт:

Можно предположить, что взаимодействие признаков (гиперпризнаков) в процессе лексического поиска формально описывается с помощью правил теории размытых, или нечетких, множеств <...>.

В другой редакции это будет утверждением о том, что контекст, частотность слова и другие факторы повышают или снижают требования к количеству и качеству акустической информации, необходимой для принятия решения об идентификации слова <...>: высокочастотные слова, слова, предсказываемые контекстом с достаточно высокой вероятностью, позволяют обходиться меньшим числом признаков, их менее выраженными акустическими коррелятами. При прочих равных условиях такие слова распознаются быстрее. В сущности, это проявление иерархически более высокого статуса таких признаков, как семантические и грамматические валентности, частотность и др. Вопрос об автономности / интерактивности различных компонентов перцептивной системы оказывается в значительной степени искусственным <...>: модули и субмодули перцептивной системы функционируют независимо, но результаты их работы постоянно сопоставляются.

Лишь очень кратко упомянем о тех проблемах, которые принято относить к высшим уровням языка и речевой деятельности и которые связаны не со словарем, а с правилами построения текста и соответственно его анализа при восприятии. Здесь очень важны разного типа валентности. Если расслоение словаря на подсловари сужает класс поиска слова в процессе интерпретации входной цепочки за счет парадигматических связей слова, то валентности дают тот же эффект за счет синтагматических связей. Приведем простой пример. Если предтекст содержит (уже идентифицированное) слово ограбить, то весьма высока вероятность появления слова в винительном падеже со значением лица (лиц) или имущественного объекта (ограбить банкира, богатых, квартиру, банк и т.п.). Иначе говоря, распознавание слова ограбить приводит к активации подсловарей, принадлежащих определенному семантическому полю, а также предопределяет грамматическую форму, в которой должны появиться соответствующие слова. Такого рода сужение класса поиска объясняется именно тем, что слушающий – носитель языка обладает знанием валентностей языковых единиц, и это знание используется как источник наложения ограничений на семантические и формальные свойства языковых единиц, которые могут быть в тексте после и / или до единицы X.

Из сказанного следует, в частности, что требуют оговорок традиционные формулировки <...> связи с разграничением сферы словаря языковых единиц и сферы правил, регулирующих использование этих единиц – т.е., практически, грамматики. При всей обоснованности такого разграничения необходимо признать, что уже в словаре при лексической единице должна быть записана достаточно детализированная информация, отражающая валентности этой единицы, равно как и ее частотность, форме– и словообразовательные потенции и т.д.

Для информации о формо– и словообразовательных потенциях требуется, в свою очередь, чтобы словарная единица была представлена как некая формальная структура с выделением блоков, релевантных для действия правил формо– и словообразования. Разные блоки и в процессе восприятия речи будут обрабатываться отдельно. Здесь возникает еще один источник максимального «распараллеливания» процесса восприятия, в данном случае выражающегося в том, что лексическая информация, а также разные виды грамматической информации обрабатываются отдельно и в значительной степени одновременно. В связи с этим заслуживают внимания экспериментальные результаты ряда авторов <...>, которые указывают на такой процесс распознавания, в частности префигированных слов:

«(1) установи, что в слове присутствует префикс и удали его [для дальнейшего] лексического поиска;

(2) найди в словаре основу;

(3) когда основа найдена, восстанови префикс и фиксируй слово. Распознавание [слова] осуществляется на данной стадии» [Emmorey, Fromkin, 1989].

Использование подобных и близких к ним процедур как раз и дает возможность представлять словарь, участвующий в процессах речевосприятия, не как множество словоформ, отражающих полную парадигму каждого слова (поскольку все члены парадигмы могут встретиться в тексте), а как множество основных, и притом внутренне структурированных словоформ, к которым по определенным правилам можно свести реальные словоформы текста.

Разумеется, префиксация, на которой сосредоточили свое внимание упомянутые выше авторы, – лишь частный, притом не самый распространенный способ грамматической информации. Суть в том, что система восприятия речи должна располагать отдельными модулями и субмодулями для обработки грамматической информации: на основе анализа определенных сегментов текста, фонемных цепочек, эти модули формируют гипотезы относительно синтаксической структуры предложения, а также целого ряда признаков наподобие грамматического времени, вида, числа и т.п. Вес, приписываемый этим гипотезам, должен быть достаточно высоким, ибо грамматическая структура служит источником существенных ограничений на вид структуры семантической, установление которой и является конечной целью процесса речевосприятия.

В то же время сама гипотеза о грамматической структуре верифицируется не только относительно результатов работы фонетико-фонологического модуля с его субмодулями, когда, например, информация о наличии вопросительного слова сопоставляется с типом интонации и, если рассогласования этих двух источников нет, принимается решение о коммуникативном типе предложения. Гипотеза о грамматической структуре высказывания должна одновременно находиться под контролем семантической гипотезы, или смысловых ожиданий слушающего, которые формируются <...> его собственными установками, ситуацией, контекстом и т.п.

С этой точки зрения процесс речевосприятия не только завершается «семантической стадией», но и начинается с таковой. Учитывая данное обстоятельство, равно как и неизбежное несовершенство самого акустического речевого сигнала (который в типичном случае просто не содержит информации, необходимой и достаточной для его декодирования), следует эксплицитно предположить, что автономная модель восприятия речи – автономная в том смысле, что она не использует информации, помимо содержащейся в сигнале и в обрабатывающей сигнал языковой системе, – просто невозможна. Задача создания полной и универсальной модели восприятия речи в этом смысле эквивалентна созданию искусственного интеллекта <...>.

В то же время <...> следует принимать во внимание, что возможна разная «глубина» восприятия и что само по себе восприятие не предполагает с необходимостью понимания. <...> человек обычно может записать на слух не очень длинное предложение (которое субъективно может быть представлено как последовательность единиц, числом не превосходящих объем оперативной памяти), даже не понимая его смысла, например, когда предложение отражает какую-то информацию из специфической сферы, чуждой слушающему. Это как раз и означает, что акт восприятия имел место, поскольку языковая структура речевому сигналу приписана, при этом приписанная семантическая структура носит сугубо внутриязыковой характер, т.е. отражает лишь словарные значения лексических единиц (если слова вообще знакомы слушающему) и связанную с ними информацию из области грамматической семантики.

Строго говоря, непосредственной задачей специалиста, моделирующего восприятие речи и не рискующего при этом вторгаться в область искусственного интеллекта, могло бы быть воспроизведение именно процедур такого рода.

А.В. Венцов, В.Б. Касеdич, Е.В. Ягунова

КОРПУС РУССКОГО ЯЗЫКА И ВОСПРИЯТИЕ РЕЧИ

(НТИ. Серия 2. Информационные процессы и системы. М., 2003)

В настоящее время лингвистика во многом избавилась от раннегенеративистских иллюзий, в частности, от уверенности, что лингвистические механизмы как таковые могут быть познаны с привлечением весьма ограниченного набора примеров (обычно сочиненных самим лингвистом). На смену этим достаточно наивным представлениям приходит понимание необходимости строить исследование даже самого «мелкого» фрагмента языковой системы с использованием репрезентативного множества текстов соответствующего языка. Оговоримся, что имеется в виду репрезентативность как в количественном, так и в качественном отношении – по представленности жанров, стилей и т.п.

Такое множество текстов стало уже традиционным называть корпусом. Приступая к исследованию конкретной проблемы, лингвист может (а в реальной ситуации, как правило, должен) составлять свой собственный корпус.

В последние десятилетия усилия лингвистов многих стран направлены на создание национальных, или универсальных, интегральных корпусов. Хотя критерии репрезентативности такого корпуса пока не вполне ясны, ясна задача: корпус должен обладать количественными и качественными параметрами, необходимыми и достаточными для построения на его основе адекватных словаря и грамматики соответствующего языка. Адекватность словаря определяется, с этой точки зрения, тем, насколько мала вероятность встретить в произвольном тексте – вне текстов корпуса – словарную единицу (слово, словоформу, фразеологизм), отсутствующую в словаре. «Произвольность» текста не следует понимать буквально: для любого корпуса, даже универсального, допустимы ограничения – например, невключение текстов диалектного характера. Адекватность грамматики мы предпочли бы трактовать как характеристику действующей, динамической системы, обеспечивающей речевую деятельность.

Поделиться с друзьями: