Диссертация (1173174), страница 10
Текст из файла (страница 10)
НоррисаМаксасовместноПланка,ссотрудникамипредполагаетналичиеИнститутапроцедурысегментации слитного речевого потока на слова, которая осуществляется за счетиспользования различных акустических «ключей» пограничных сигналов границслова, целостности просодической структуры слова и информации о частотноститех или иных фонетических явлений в начале / конце / середине слова. Всоответствиисданноймоделью,впроцессерешенияразличныхэкспериментальных задач сегментации речи должны учитываться доминирующаяв английском языке акцентная модель ударения на первом слоге и/или наличие ванглийском языке большого количества односложных слов (ср. со стратегиейметрической сегментации [Cutler, Norris 1988; Cutler, Butterfield 1992; Norris,McQueen, Cutler, Butterfield 1997]).
В качестве одного из основных параметров1Коннекционизм – направление, сменившее когнитивизм и связанное с появлением новыхмоделей деятельности мозга, в которых работа мозга описывается с помощью представления оконнекциях (связях) нейронных обоснований, формирующих определенную сетку этих связей[Жеребило 2010: 162].47просодической структуры слова рассматривается «качество» слога в терминахпротивопоставления «сильный» vs. «слабый» слог.В своем исследовании Л. Х. Накатани и Дж. А. Шаффер выявляютосновные просодические пограничные сигналы, которые являются наиболееинформативными маркерами стыка на перцептивном уровне [Nakatani, Schaffer1978].
Для выявления просодических «ключей» стыка использовалась методикатак называемой «повторяющейся речи» (reiterant speech), когда вместотрехсложных словосочетаний прилагательного с существительным используетсяповторяющийся слог /ma/, например, во фразе «The remote stream was perfect forfishing» слог /ma/ заменяет сочетание «remote stream»: «The mama ma was perfectfor fishing». Синтаксическая структура всех фраз сохраняется без изменения:article + adjective + noun + verb phrase. Это позволяет, во-первых, элиминироватьнежелательное влияние любой фонемной вариативности, во-вторых, исключитьиспользование фонемной комбинаторики, а также стыковой аллофонии в качествеопорного пограничного сигнала1.Слушающим была дана инструкция прослушать фразы и расставитьударения в зависимости от степени ударности по шкале от 0 до 2 (0 – null, 1 –primary stress, 2 – secondary stress).
После неоднократного прослушиванияиспытуемыми распознавались предъявляемые им фразы типа «ma mama» или«mama ma»,прилагательноевоспроизводившие+двухсложноепоследовательностисуществительноеилиодносложноедвухсложноеприлагательное + односложное существительное. При этом предлагаемые дляпрослушивания первой группе аудиторов фразы чередовались с фразами,включающими сенс-материал (всего 63 фразы). Вторая группа аудитороввыполняла задание по прослушиванию фраз только с чередующимися слогами/ma/ (всего 18 фраз). Более 50 % фраз были однозначно распознаны1Эффективность данной методики подтверждается результатами аналогичного исследования нанонсенс-материале при полной замене фраз чередованием слогов ma, например, maMA ma длясочетания absurd day и MAma ma для сочетания типа sunny day, что исключает влияниесегментного и лексического факторов на просодические характеристики речи (об этомподробнее см.
[Liberman, Streeter 1978]).48испытуемыми: как правило, это фразы, включающие модели, при которых напервом и последнем слоге фиксировалось второстепенное ударение или ударениеотсутствовало, т.е. тип слога, который может быть только частью двусложногослова. Однако ударение оказалось недостаточным маркером для распознаваниянеоднозначных последовательностей типа «tasty food» (10 1) и «bold design» (101). В этом случае испытуемые полагаются на другие просодические «ключи»,позволяющие осуществить корректную сегментацию. Результаты эксперимента сиспользованием методики под названием hybrid speech synthesis1 (синтезгибридной речи) показывают, что дополнительной просодической опорой дляраспознавания неоднозначных фраз является ритм, при этом такие просодическиехарактеристики как тональное движение (pitch) и интенсивность (amplitude)являются менее значимыми критериями сегментации гибридной речи.Дальнейшее исследование соотношения длительности всех компонентовслова как важнейшей характеристики речевого ритма еще раз подтвердилополученные ранее данные о количественных маркерах стыковых единиц слова[Lehiste 1972; Oller 1973; Klatt 1973].
Выявлены тенденции к увеличениюдлительности а) односложного слова; б) конечного слога слова; в) начальногосогласного слова.Таким образом, результаты проведенных экспериментов свидетельствуют отом, что процесс декодирования связной речи осуществляется в первую очередь сиспользованием просодико-ритмических критериев сегментации. Ритм являетсянаиболее надежным и часто достаточным просодическим сигналом дляперцептивного распознавания фраз как естественной, так и синтезированной речи.При этом пролонгирование односложных слов оказывается первичным ритмикопросодическим сигналом, а увеличение длительности инициального согласногослов – второстепенным сигналом [Nakatani, Schaffer 1978: 243–244].Висследованиивзаимодействия1Д.
В. ГоуакустическихиП. К. Гордона(долексических)ипроводилсялексическихПодробнее о данной методике см. [Nakatani, Schaffer 1978: 239–240].анализсредств49сегментации речи с применением методики «прайминга»1 [Gow, Gordon 1995].Изучение процесса распознавания минимальных пар типа two lips – tulips,помещенных во фразы, в рамках первого эксперимента проводилось путем замерадлительности начальных согласных слогов (/t/ и /l/).
Разница в длительностиинициального /t/ в two lips vs. /t/ в tulips оказалась статистически незначимой(91 мс и 86 мс соответственно); длительность /l/ в two lips значительнопревосходит количественный показатель /l/ в tulips (81 мс и 70 мссоответственно). Этот результат коррелирует с предыдущими данными (см.,например, [Lehiste 1972; Klatt 1973; Oller, 1973; Umeda, 1975; Nakatani, Schaffer1978] и др.) и еще раз подтверждает, что пролонгированная инициальная фонемаслова является ключевым маркером словесного стыка. По мнению авторов,именно акустическое маркирование начальных компонентов слова способствуетлучшему узнаванию слов на лексическом уровне [Gow, Gordon 1995: 353].Можно добавить, что наиболее значимыми для сегментации сигналамистыка, локализующимися в начале слова (word onset) помимо увеличениядлительности начальных фонем (onset phonemes) и слогов [Lehiste 1972; Oller1973; Umeda 1975; Klatt 1976; Nakatani, Schaffer 1978; Gow, Gordon 1995] и др.,могут быть такие акустические маркеры, как аспирация и ларингализация[Nakatani, Dukes 1977], появление ударного («сильного») гласного [Cutler, Carter,1987; Cutler, Norris 1988; Cutler, Butterfield 1990] и другие стыковые пограничныесигналы.Важными, на наш взгляд, являются выводы исследователей относительносуществования в языках универсальных просодических сигналов, позволяющихслушающему сегментировать звучащую иностранную речь, при условии, что1В психолингвистике для решения проблемы автоматической и контролируемой переработкиинформации традиционно используется методология прайминга.
Термин «прайминг» (от англ.глагола to prime – инструктировать заранее, давать предшествующую установку) – явлениеимплицитной памяти, которое представляет собой либо (а) изменение скорости или точностирешения задачи (например, перцептивной), наблюдаемое после предъявления информации,связанной с содержанием или с контекстом этой задачи, либо (б) повышение вероятностиспонтанного воспроизведения этой информации в подходящих условиях (URL:http://old.virtualcoglab.ru/projects/priming.html; см. также [Crystal 2008: 385]).50испытуемый не владеет данным языком [Endress, Hauser 2010]. Так, припредъявлении носителям американского произносительного варианта фразтипологически неродственных языков (французского, турецкого и венгерского), впроцессе прослушивания и выполнения задач сегментации речи успешноосуществлялось распознавание слов незнакомого языка.
Несмотря на наличиеразных просодических структур в указанных языках, в ходе серий перцептивныхэкспериментов доказывается наличие универсальных механизмов просодическойсегментации речи (language-invariant prosodic cues). Более того, инвариантныепросодические сигналы, существующие независимо от фонетической спецификиязыков, облегчают детям в раннем возрасте процесс узнавания слов любого языка(в том числе и неродного), предвосхищая, таким образом, «настройку» ребенка назвуковую структуру родного языка.1.5.
Глоттализация как компонент системы просодических пограничныхсигналов в английском языкеВ последние десятилетия исследователи все чаще обращаются к изучениюакустико-перцептивных и функциональных характеристик такого неоднозначногов своем определении фонетического явления, как глоттализация, которое донедавнего времени не являлось предметом пристального внимания фонетистовэкспериментаторов. Конец ХХ и начало ХХI вв. ознаменовались появлениемобщефонетических [Gordon, Ladefoged 2001], а также частных исследований наматериале американского произносительного варианта [Pierrehumbert, Talkin1992; Pierrehumbert 1995; Dilley, Shattuck-Hufnagel, Ostendorf 1996; Redi, ShattuckHufnagel 2001; Garellek 2012] и др., посвященных описанию фонетическихсвойств и функций гортани, что дает возможность детального изучения всегомногообразияартикуляционныхиакустическихреализацийявленияглоттализации1.1Современные методики исследования состояния гортани, такие как высокоскоростная съемкагортани, а также электроглоттография (ЭГГ), позволяют оценить подвижность гортани идиагностировать характер колебаний голосовых складок.
Данные ЭГГ определяются с точкизрения фазы контакта, во время которой происходит соприкосновение двух голосовых складок.51Функциональные особенности ларингальных звуков1, к которым относитсяи гортанная смычка /Ɂ/, связаны с их акустико-артикуляционной природой.Гортанные согласные образуются за счет работы гортани, при этом надгортанныеобласти в их образовании не участвуют, либо участвуют пассивно, что объясняетподвижность и неустойчивость их фонетического статуса [Царенко 1973].Гортанная смычка занимает особое положение в звуковой системе английскогоязыка и выполняет различные лингвистические функции, обусловленные ееакустико-артикуляционными особенностями: гортанная смычка является комплементарной единицей по отношению ксамостоятельным фонологическим единицам языка; гортанная смычка может служить дифференциальным признаком согласныхфонем, являясь аллофоном глухих взрывных согласных /p, t, k/ вопределенных контекстах; гортаннаясмычкаможетвыполнятьпросодическуюфункцию.Ванглийском языке ларингальность можно считать «кульминативнойпросодемой»2, выполняющей разграничительную функцию (в английскомязыке маркируется слово с гласным в инициальной позиции); гортанная смычка может совмещать сразу несколько функций, имеягетерогенный характер функциональной нагруженности, либо переходить содного фонологического уровня на другой.Так, результаты ряда исследований, проведенные на материале различныхязыков, указывают на возможное появление глоттализации на стыках свокальнымкомпонентомвкачествеособогопограничногомаркераКоэффициент контакта (Contact quotient, CQ), т.е.
соотношение фазы контакта к основномупериоду колебания, отображает степень смыкания голосовых складок и в модальном регистресоставляет от 0,4 до 0,6 как для женщин, так и для мужчин [Дегтярева 2014].1Ларингальные (гортанные) звуки – это, как правило, согласные /h/, /ɦ/ и /ʔ/ (другие названия –ларингалы или глайды), артикулируемые в области гортани.2Термин заимствован из работы Е.И. Царенко [Царенко 1973: 81].52супрасегментногоуровнядляусиленияпросодическойвыделенности1постстыкового сегмента [Карташевская 2007; Кривнова, Андреева 2007; Kohler1994; Dilley, Shattuck-Hufnagel, Ostendorf 1996; Garellek 2012] и др.Как показывают данные позиционно-дистрибутивного и фонотактическогоанализа распределения гласных относительно границ слов, гласные фонемы вкачестве предстыкового и постстыкового элементов составляют 35 % и 25 %соответственно от общего числа фонем в указанных позициях.