Диссертация (1148644), страница 42
Текст из файла (страница 42)
Иными словами, на каком бы уровне не была допущенаошибкаэквивалентности(включаяпрагматический),допущенныеошибкиадекватности вносились в матрицу данных отдельно согласно соответствующемупараметру.Пример: Après la guerre, les premiers clients des fabricants d'ordinateurs sontd'abord intéressés par des applications tertiaires - recherche scientifique, informatique degestion251После войны, первыми клиентами производителей компьютеров в первуюочередь стали люди, заинтересованы в коммерческих приложениях – научныхисследований, информационного управленияПомимо нескольких ошибок нарушения компонентного и формальногосоответствия, которые привели к искажению прагматической составляющей, за чтоможно засчитать ошибку параметра 29 – необоснованно вольная передача ИТ, вприведённом примере есть две ошибки адекватности – пунктуационная (параметр70) и нарушения согласования частей сложного предложения (параметр 73 –некорректное формулирование единиц ПЯ).Единственный случай, когда нарушения адекватности не рассматриваются вкачестве отдельных ошибок, это ошибки параметра 31 – отсутствие смысла в ТП,когда необоснованные нарушения норм ПЯ привели к полной потере всякогосмысла синтаксической единицы.Пример: À cette fin, il doivent se demander si la copie constitue une traductionfidèle et idiomatique, ne nécessitant que peu ou pas de révision et digne d'un membred'une association professionnelle.Для этого, им надо решить, является ли перевод достоверным иидиоматическим, требует ли они доработки и достоин ли члена профессиональногообъединения.Si l'Acheteur n'est pas satisfait de la qualité des produits livrés ou à livrer, il doit eninformer aussitôt que possible le Vendeur, dans un délai maximum de 7 jours de leurlivraison.Если Покупатель не удовлетворён качеством поставляемой продукции илибыть доставлен или доставкой, он должен сообщить об этом Продавцу как можноскорее, сроком не больше 7 дней.В приведённых примерах была засчитана одна ошибка из категории параметра31 (отсутствие смысла в ТП).2523.
5. Обработка экспериментальных данныхВ завершение проведённого эксперимента были обработаны 210 письменныхработ студентов. Обработка включала выявление и систематизацию всех ошибок,допущенных в переводах, в соответствии с априорным словарём параметров. Такимобразом, для каждого из 30 текстов была сформирована таблица ошибок (таблица15, приложение Т):Таблица 15.Ошибки текста №1текст 1№параметра1.2.3.4.5.…56.Дальнейшаяс1с262000……обработкас332004……с411000……с522002……экспериментальныхс612001……данныхс712001……30000……предусматриваетреализацию следующих процедур: 1) снижение размерности параметрическогопространства, 2) описание объектов на языке рабочего словаря параметров системыОКП, 3) реализацию процедуры многомерной классификации объектов с цельюполучения количественных оценок и ранжировок.3.
5. 1. Снижение размерности параметрического пространстваПроцедура снижения размерности параметрического пространства необходимадля выявления наиболее информативных параметров, которые будут в дальнейшемэффективно использоваться при оценивании. Как следует из априорного словаряпараметров, их количество значительно превышает оптимально удобное дляпрактического применения. Принимая во внимание то, что некоторые параметры,особенно лингвистические, сильно связаны между собой, уменьшение размерностипараметрического пространства представляется единственно верным решением вданном случае.
При достаточно сильной корреляции двух параметров можно, исходя253из результатов одного из них, определить значение другого. Процедура сокращенияразмерности параметрического пространства позволяет оставить в рабочем словаренаиболее независимые и информативные параметры, которые наиболее полноописывают степень отклонения от нормативных критериев эквивалентности иадекватности. Для формирования набора информативных параметров будетиспользована схема Бонгарда [194], включающая два этапа уменьшения размерностипараметрического пространства: первый – определение параметров, релевантныхдля различения классов, второй – анализ корреляционных связей параметров [195].Для проведения вычислений прежде всего построим семь объектнопризнаковых матриц (по числу студентов, входящих в экспериментальные группы)56 строк (число параметров) на 30 столбцов (количество переведённых текстов)(таблица 16, приложение У).
В ячейках каждой из таблиц указана частота ошибок покаждому параметру для каждого текста. Далее вычислим среднее число ошибок покаждому параметру для каждого студента по каждому тексту, используя формулугде i – номер студента, n = 30– число переведённых текстов, j–номер текста, атакже обобщающие характеристики генеральной совокупности ошибок (приложениеУ).Таблица 16. Среднее число ошибок и обобщающие характеристики№1.2.3.4.Студент 1ошибки выборалексическогоэквивалентаошибки выбораслова в контекстеТПошибки припереводетерминологииошибки притекст1текст2текст3текст4текст…текст306280……235000030СреднееДисперсия3,33,87602,3665,432001,533…6,782…2545.…56.переводесокращенийошибки припереводе имёнсобственных0…0…0…4……………………Релевантность параметров для различения априорных классов определяется поt-критерию Стьюдента. Критерий Стьюдента применяется для определениясущественности разности двух выборочных средних.
Проведём сравнение по tкритерию Стьюдента, используя следующую формулу:Где хi1 и хi2 – средние значения каждого параметра у первого и второгостудента из пары, s2i1 и s2i2 – дисперсии каждого параметра у первого и второгостудентов из пары, n1, n2 – число текстов.Пороговое значение t-критерия при уровне значимости α=0,05 равно 1,96 [196,с. 71].
Далее необходимо провести сравнение значения критерия с пороговымзначением. (таблица 17). Таким образом, получаем таблицу в 56 строк (количествопараметров) и 21 столбец (пары студентов) (см. приложение Ф, таблицу 17).Таблица 17.Двувыборочный t-критерий для независимых выборок№параметры1ошибкивыборалексическогоэквивалента1-21-3…2-3…3-4…6-7Количествопар, дляразличениякоторыхданныйпараметрявляетсярелевантным(t>1.96)…0,1872,4382,0392,76092552ошибкивыбора словав контекстеТП…0,6070,9070,4251,2405………56Далее для каждого параметра подсчитываем количество пар студентов,которые он различает, то есть для которых t-критерий> 1,96.
Если наблюдаемоезначение критерия больше порогового, то параметр относится к числу релевантныхдля различения априорных классов, если – нет, то он исключается из дальнейшегорассмотрения.В результате получаем ранжированный список параметров, составленный поубываниюразличаемыхпар(приложениеХ).Исходяизполученногоранжированного списка возможно определить набор параметров, релевантных дляразличения априорных классов (таблица 18):Таблица 18. Параметры, релевантные для различения априорных классовКол-во парпараметров876543210Мощностьгруппы3024243731Итого:56Состав группыП1, П25, П31П44, П46П2, П21, П41, П56П33, П50П29, П39, П45, П52П38, П43, П49П5, П7, П8, П18, П19, П22, П47П3, П4, П6, П9, П10, П11, П12, П13, П14, П15, П16, П17, П20, П23, П24,П26, П27, П28, П30, П32, П34, П35, П36, П37, П40, П42, П48, П51, П53,П54, П55Наиболее эффективными для различения априорных классов являютсяпараметры, образовавшие от 8 до 3 пар.
Данному критерию отвечают только 15параметров: П1, П25, П31, П44, П46, П2, П21, П41, П56, П33, П50, П29, П39, П45, П52.256Второй этап уменьшения размерности параметрического пространствазаключается в исследовании корреляционных связей параметров. С этой цельюнеобходимо сформировать общую объектно-признаковую матрицу данных (таблица19). Эта матрица формируется на основе значений параметров априорного словаря,полученных экспериментальным путём при анализе текстов переводов, выбранныхдля исследования. В каждой ячейке стоит сумма значений каждого параметра(допущенных ошибок) по всем текстам у каждого студента. Таким образом, имеемтаблицу (таблица 19) из 56 строк (количество параметров) и 7 столбцов (числостудентов) (см.
приложение Ц):Таблица 19. Объектно-признаковая матрица№параметра0102030405Ст199714611…Ст298825210…Ст357654811…СтудентыСт461964813…Ст574774111…Ст64760356…Ст75849188…N…………………Как видно из таблицы 19, статистическая зависимость между двумяпараметрами (строками таблицы 19) может быть оценена при помощи коэффициенталинейной корреляции Пирсона. Однако очевидным является тот факт, чтопараметры эквивалентности и параметры адекватности не являются равнозначными(см. Главу 2.2), поэтому правомерным представляется выявление эффективностипараметров внутри двух отдельных групп параметров эквивалентности (параметры с01 по 31) и адекватности (параметры с 32 по 56).
Для этого построим две матрицыкорреляционных связей (приложения Ч и Ш) для указанных групп, элементамикоторых являются коэффициенты корреляции Пирсона:257где x – значение по первой выборке, y – значение по второй выборке, x—среднее по первой выборке, y– среднее по второй выборке.Теперь определим, какие параметры из релевантных представлены вкорреляционных матрицах для группы параметров эквивалентности и для группыпараметров адекватности.
Из корреляционной матрицы первой группы – параметровэквивалентности (01-31) – таковыми являются всего 6 параметров: 01, 02, 21, 25, 29и 31. Из корреляционной матрицы второй группы – параметров адекватности (32-56)– выделяются 9 параметров: 33, 39, 41, 44, 45, 46, 50,52 и 56.Далее рассчитаем среднюю внутригрупповую корреляцию между параметрамиэквивалентности, используя формулугде rij – коэффициент корреляции между двумя параметрами, m – мощностьгруппы; а также внегрупповую корреляцию для каждого параметра данной группыпо формуле:где rij – коэффициент корреляции между двумя параметрами, m – мощностьгруппы, n=31 – общее число параметров в подгруппе. Теперь можно определитьэффективность (Е) параметров эквивалентности:258Проделав все необходимые вычисления, мы получим следующие результатырелевантных параметров из группы параметров эквивалентности (1-31) (таблица 20):Таблица 20.
Внутригрупповая и внегрупповая корреляции и эффективностьпараметров эквивалентности№1221252931Параметрошибки выбора лексическогоэквивалентаошибки выбора слова в контексте ТПошибки при переводе частейсложной или осложнённойсинтаксической единицыошибки искажения функций ИТнеобоснованно вольная передача ИТотсутствие смысла в ТПВнутригркоррВнегр коррЭффективность0,3650,4740,3420,5861,0660,8090,3530,3880,3830,4500,1680,4960,5430,6122,0980,7800,7050,735Такие же вычисления проведём для релевантных параметров из группыпараметров адекватности (32-56) и получим следующие результаты (таблица 21):Таблица 21.
Внутригрупповая и внегрупповая корреляции и эффективностьпараметров адекватности№333941444546505256Параметрфункционально-стилистическиеошибкииноязычная лексикакалькирование синтаксиса ИТошибки в структуре словапунктуационные ошибкиошибки в написании заглавной истрочной буквынеобоснованное многословиесинтаксическая двузначностьнарушение требованийоформления ТПВнутригркоррВнегр коррЭффективность0,3050,3030,3270,2510,3520,3230,3080,2590,3100,2230,9450,9821,2610,8101,5810,5030,5090,4120,3650,3940,3121,3791,2901,3180,3830,2821,354259Как следует из приведённых таблиц, в рабочий словарь системы ОКП могутвойти только два параметра из первой группы и шесть параметров из второй,эффективность которых больше 1. Таким образом, мы получили 8 информативныхпараметров ОКП из первоначального априорного словаря в 56 параметров.Приведённые ниже параметры войдут в рабочий словарь параметров качества:1) ошибки выбора лексического эквивалента;2) ошибки при переводе частей сложной или осложнённой синтаксическойединицы;3) калькирование синтаксиса ИТ;4) пунктуационные ошибки;5) ошибки в написании заглавной и строчной буквы;6) необоснованное многословие;7) синтаксическая двузначность;8) нарушения требований оформления ТП.Дляпоследующегооцениванияпереводовидальнейшейобработкиэкспериментальных данных мы будем использовать этот набор параметров.3.
5. 2. Оценивание качества переводовС помощью полученного рабочего словаря параметров можно провестипроцедуру оценивания качества студенческих переводов на основе объективныхстатистических методов. Для этого необходимо описать все тексты переводов спомощью параметров рабочего словаря. Для этого сформируем таблицу (таблица 22)из 7 строк (количество студентов) и 8 столбцов (количество параметров):52.56.нарушениетребованийоформления ТП50.синтаксическаядвузначность46.написаниизаглавной истрочной буквы45.пунктуационные ошибкивошибки41.калькированиесинтаксиса ИТ21.осложнённойсинтаксическойединицыошибкивыбораошибкиприлексическогопереводечастейэквивалентасложнойили1.необоснованноемногословиеТаблица 22. Данные по рабочему словарю параметров260с1с2с3с4с5с6с79998618274475859817105182514181762713261236313324242314927101257339566873442885312434484261535616161Стандартизация матрицы данных.