Актуальные проблемы современной лингвистики. Учебное пособие
Шрифт:
В частности, для каждой фонемы конкретного языка должен существовать, вероятно, ее перцептивный эталон. Последний задает конфигурацию признаков, выделяемых психоакустическим модулем, а также допустимые пределы их варьирования относительно заданных условий (высоты голоса, темпа речи, позиции и т.п.) и относительно друг друга. Метрика перцептивного эталона позволяет системе использовать функцию сходства для определения меры близости конфигурации признаков, выделяемых психоакустическим модулем, к конфигурации эталонной. Эта операция необходима, поскольку реальные параметры речевого сигнала сплошь и рядом отличаются высокой степенью неопределенности. Гиперпризнаки <...>, возможно, целесообразнее интерпретировать как такую ситуацию, когда значение функции сходства позволяет отнести данную конфигурацию признаков к двум или более эталонам с равной вероятностью.
Правда, смысл введения понятия гиперпризнаков в этой модели был связан не с тем, что слушающий не может использовать соответствующую информацию, а, скорее, с тем, что он не должен («не обязан») ее использовать: гиперпризнаки, по мысли авторов модели, позволяют достичь идентификации языковых единиц более экономными средствами. Но мы сейчас обсуждаем фактически максимальные возможности каждого из модулей. Функционирование субмодулей, обладающих низким иерархическим статусом, может действительно в конкретных условиях оказываться избыточным, тем не менее все они необходимы для максимального использования всех ресурсов системы в минимально благоприятных условиях.
Выход фонетико-фонологического уровня представлен цепочкой дискретных единиц – символов, в типичном случае фонем. Как следует из сказанного выше, такая цепочка в достаточно большом числе случаев (хотя какая бы то ни было статистика нам не известна) не может фигурировать в качестве «готового» экспонента той или иной языковой единицы: часть членов этой цепочки может характеризоваться лишь мерой близости к фонеме А или же фонемам А/В (А/В/С...), а какая-то часть элементов цепочки может вообще отсутствовать (в сопоставлении с намерением говорящего), причем возможен как вариант, когда такое отсутствие абсолютно (ничто в сформированной фонетико-фонологическим модулем цепочке не говорит о том, что налицо нулевая редукция), так и вариант «относительного» отсутствия, когда фиксируется наличие сегмента, но не его качество. Последний случай можно интерпретировать как вычисление такой функции сходства, которая устанавливает равнозначную отнесенность данной конфигурации признаков к любому из перцептивных эталонов, отвечающих фонемам данного языка. <...>
До сих пор речь фактически шла о функционировании фонетико-фонологического модуля, который (субмодуль) ответствен за принятие решений относительно сегментных единиц – фонем (вопрос о слогах, также являющихся сегментными единицами, мы сейчас специально затрагивать не будем <...>). Но одновременно нужно допустить существование некоторого набора субмодулей, связанных с установлением супрасегментных, или просодических, характеристик речи. Как минимум, это интонационный субмодуль <...> и акцентный, а для тональных языков – тональный. Эти субмодули действуют параллельно сегментному, что, однако, никак не означает невозможности их иерархического соотношения <...>.
Разумеется, просодические субмодули также работают с информацией, полученной на выходе психоакустического модуля. Сформулируем здесь лишь несколько положений, связанных с возможными принципами функционирования акцентного субмодуля.
Обычно принимается, что информация об ударении – это фактически информация об акцентном контуре слова. Из этого следует, что для получения соответствующих характеристик необходимо обладать сведениями о членении звучащей речи на слова. Однако <...> информация о сегментации речевого потока на слова никоим образом не обеспечивается одними или даже преимущественно фонетическими признаками. Между тем есть основания полагать, что место ударения можно установить и без знания о том, где проходят границы слов, т.е. в определенном смысле эта задача может решаться в пределах фонологического (фонетико-фонологического) компонента.
Соответственно получение информации об ударении может пониматься как задача детектирования ударных слогов не по отношению к границам слова, а, скорее, по отношению друг к другу: определяется момент, соответствующий первому ударному слогу, второму, третьему и т.д. Это связывает нахождение акцентных характеристик с проблемой речевого ритма <...>.
<...> Результатом работы субмодуля является расстановка меток, соответствующих ударным слогам. <...>
Если в распоряжении системы имеются данные о составе цепочек сегментных единиц <...>, а также о местоположении ударных слогов, то необходима еще информация о членении речевого потока на слова, чтобы система могла обратиться к процедуре отождествления соответствующих цепочек с единицами словаря. Заметим сразу, что в языках с фиксированным ударением обнаружение ударных слогов естественным образом обеспечивает одновременно установление словесных границ <...>. Но и в языках с разноместным ударение, к которым принадлежит русский, выявление ударных слогов есть установление числа слов, что также содействует обнаружению словесных границ, особенно если учесть статистические закономерности местоположения ударного слога в слове.
<...> обратимся к механизмам словарного поиска.
Если словарь представить себе как некоторую упорядоченную совокупность словоформ (хотя это не очень реалистическая гипотеза <...>) и исходить из такой ситуации, когда фонемная цепочка, отвечающая слову, «заполнена» однозначно и без пропусков, то проблема словарного поиска решается тривиально. Идентификация данной цепочки, охарактеризованной просодически, в качестве экспонента некоторого слова (словоформы) реализуется в результате последовательного просмотра всего корпуса словаря. Как вполне понятно, такой процесс сплошного сканирования множества словарных единиц носит громоздкий характер. Процедуры этого типа, возможно, используются в ситуациях, когда распознаванию подлежат новые слова, а также слова, появление которых в данной точке речевой цепи характеризуется низкой вероятностью.
Более обычны ситуации, когда восприятие речи организуется встречной активностью субъекта восприятия. Использованию активных стратегий восприятия способствует то обстоятельство, что сам словарь пронизан множественными связями между его единицами – связями семантическими, грамматическими, фонетическими (фонологическими). Иначе говоря, упорядоченность словаря реализуется как наличие в его составе пересекающихся групп слов, каждая из которых объединена теми или иными признаками. Контекст речевого акта, установки слушающего, предтекст позволяют достаточно узко отграничить, прежде всего с семантической точки зрения, тот подсловарь, единицы которого слушающий «рассчитывает» встретить в воспринимаемом тексте. Поэтому сканирование, о котором говорилось выше, обычно осуществляется в рамках не всего словаря, а одного из подсловарей.
Меньший объем словаря (подсловаря) имеет одним из своих результатов снижение требований к точности и полноте описания входных единиц с фонетической (фонологической) точки зрения. В этих условиях и возникает возможность использования гиперпризнаков, понимаемых как признаки единиц супрафонемного формата, в типичном случае – слов. <...>
Любой подсловарь дополнительно стратифицирован в силу разной частотности входящих в него слов. Частотность слова также принадлежит к его гиперпризнакам.
Все используемые в процессе восприятия признаки (гиперпризнаки) иерархизированы за счет приписывания им определенных весов <...>. Поскольку идентификацию слов уместно понимать как активирование связей, принадлежащих ментальному лексикону, можно сказать, что признаки, которым отвечает меньший вес, достаточно часто вообще не используются: уровня активации, достигаемого за счет использования признаков высокого иерархического статуса (с большим весом), оказывается достаточно, чтобы имела место идентификация входной цепочки в качестве слова X.
Вес, приписываемый признаку, может носить постоянный и переменный характер. По-видимому, постоянно высокое значение весов свойственно тем признакам, которые отличает существенная помехоустойчивость. К последним принадлежат прежде всего просодические признаки. Частотность как таковую тоже представляется уместным отнести к признакам с высоким весовым значением, однако конкретное распределение слов по частотности будет зависеть от выбора подсловаря. В условиях шепотной речи, например, естественным будет снижение веса признака «звонкость/глухость», который в русском и в ряде других языков может фигурировать как гиперпризнак, характеризуя более или менее протяженные фонемные цепочки.