ssmt-text (1006268), страница 8

Файл №1006268 ssmt-text (Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке) 8 страницаssmt-text (1006268) страница 82017-06-10СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 8)

Существует несколько вариантов решения этой проблемы:

  • предобработка исходного текста, на предмет разрешения подобных смысловых групп, и их преобразования в явные;

  • чтение машинного перевода текста параллельно с оригиналом;

Однако, ни один из способов не может быть удовлетворителен, так как потребует дополнительных затрат времени и дополнительных знаний.

Методы автоматического построения синонимичных конструкций на данный момент так же требуют доработки. При их применении опять же потребуется проверка результата. И мы придем опять к той же проблеме. Остается надеяться, что проблема разбора неявных определений исчезнет в недалеком будущем.

Следующий пример тоже можно считать определением.

Второе предложение второго отрывка:

"Discrete simulation" means the simulation of a system …

Обе СМП и переводчик

«Дискретное моделирование» означает моделирование системы …

Совпадение всех трех вариантов перевода объясняется логичностью и простотой фразы.

Большая часть предложений имеет прямой порядок слов. В тексте преобладают сложноподчиненные предложения. На шестьдесят одно предложение всех трех отрывков (без учета алгоритма Евклида) было обнаружено двадцать девять сложноподчиненных предложений, что составляет примерно сорок семь процентов.

Большая часть придаточных предложений в рассматриваемых отрывках оказалась индивидуализирующими определительными. Вторыми по частоте оказались придаточные условия. Благодаря своей четкой регулярной структуре такие предложения были корректно переведены обеими СМП.

Сложноподчиненных предложений не абсолютное большинство среди всех рассмотренных предложений, но важно учитывать, что предложения содержат себе более чем одно придаточное. Более того, эти придаточные относятся к разным типам. При переводе таких сложных предложений с помощью СМП лучше производить их предварительную обработку. СМП не всегда могут выявить к кому члену (основного или придаточного предложения) относится то или иное придаточное. Из-за этого многие сложные предложения превратились в набор слов.

Например, к таким предложениям относится седьмое предложение третьего отрывка. Оно содержит семь придаточных: уступки, причины условия и придаточное предложение сказуемое.

Для удобства восприятия предложение каждая основа записана на отдельной строке. Конец каждой распространенной основы обозначим символом конкатенации строк «║».

We must admit that, ║

as the number n of nodes created

by a linking automaton approaches infinity, ║

we don't know how to build such a device physically, ║

since we want

the machine operations to take

the same amount of time regardless of the size of n; ║

if linking is represented by using addresses as in a computer memory, ║

it is necessary to put a bound on the number of nodes, ║

since the link fields have a fixed size.

Статистическая СМП c таким предложением справилась плохо. Понять смысл высказывания без оригинала текста невозможно. Поведение системы перевода объясняется ее устройством, а именно тем, что вычисляются частоты использования именно для пятерок слов. Для верного перевода данного предложения уместнее было бы анализировать набор слов, в который бы всегда попадали, по крайней мере, две основы.

Статистическая СМП:

Мы должны признать, что, ║

как число n узлов,

созданных по образцы бесконечности автомата подходы, ║

мы не знаем, как построить такие устройства физически, ║

так как мы хотим

машинных операций принять

столько же времени, независимо от размера n, ║

если образцы представлены

с помощью адресов, как в памяти компьютера, ║

необходимо поставить оценку числа узлов, ║

так как ссылка поля имеют фиксированный размер.

Кроме того, ошибки связаны с неправильным разрешением омонимии. В результате глаголы были восприняты как существительные, что разрушило структуру предложений. Вариант трансфертной СМП оказался более читаемым. Трансфертная СМП:

Мы должны признать, ║

что, поскольку номер n узлов, создаваемых

соединяющимся автоматом, приближается к бесконечности, ║

мы не знаем,

как создать такое устройство физически, ║

так как мы хотим, ║

чтобы машинные операции заняли

то же самое количество времени независимо от размера n; ║

если соединение представляется

при использовании адресов как в памяти компьютера, ║

необходимо поместить привязанный число узлов, ║

так как у полей ссылки есть фиксированный размер.

Структура предложения изменена не была.

Трансфертная СМП производит подробный синтаксический анализ. Все основы были выделены, ряд оборотов (that as the number n) были верно переведены на русский язык. Из примера можно заключить, что трансфертная машина может обрабатывать предложения любой сложности, максимально сохраняя стилистику авторского текста.

Как и было указано выше в данном случае машина не стала разбивать предложение на две части по символу «;», хотя в данном случае это было бы вполне оправдано. Переводчик поступил иначе.

Более того, он избавился от второй основы, сделав ее обстоятельством условия. На наш взгляд первая часть варианта переводчика воспринимается труднее, чем та же часть, переведенная трансфертной СМП. Обстоятельства условия более характерны для русскоязычной научной прозы, но встречаются крайне редко. Вторая часть текста, которую перевел человек воспринимается проще, чем вариант трансфертной СМП. Вариант переводчика:

Следует признать, ║

что при стремлении количества созданных

связывающим автоматом узлов n к бесконечности

неизвестно,

как построить такое устройство физически, ║

поскольку желательно, ║

чтобы операции машины выполнялись

за одно и то же время независимо от размера n. ║

Если связывание представлено

с использованием адресов в машинной памяти, ║

необходимо определить границу для количества узлов, ║

поскольку поля связей имеют фиксированный размер.

Немногочисленные простые предложения развернуты за счет однородных членов. В первом отрывке ‑ только одно короткое простое предложение (не учитывая алгоритм Евклида).

Of course, Euclid did not present his algorithm in just this manner.

Мысль высказывания, крайне четкая. Она призвана уберечь читателей от ложных выводов.

Во втором отрывке простые предложения содержат перечисления.
Это связано с тем, что большую часть отрывка занимает описание модели.

The Mathematics building has five floors: sub-basement, basement, first, second, and third.

On each floor there are two call buttons, one for UP and one for DOWN.

Corresponding to these buttons, there are ten variables CALLUP [j]
and CALLDOWN [j], 0 <= j <= 4.

The elevator is in one of three states: GOINGUP, GOINGDOWN, or NEUTRAL.

Подобные предложения претерпевают меньше всего трансформаций при переводе. Если все части предложения будут переведены верно и не возникнет проблем с омонимией, то СМП вернет правильный перевод предложений, что мы можем наблюдать для приведенных примеров.

В конце третьего отрывка встречаются еще более короткие простые предложения.

Relevance is more important than realism.

But of course much still remains to be done.

Важно заметить, что по эти предложения не выражают отдельную мысль и являются. Они дополняют мысли предыдущих фраз.

Оба эти предложения были переведены СМП без изменения структуры.

Во втором случае переводчик решил объединить предложение с предыдущей фразой. Это сделало более очевидным развитие мысли автора, но с другой стороны – несколько исказило текст.

Для передачи логических связей в тексте используется большое число союзов, в том числе и двойных.

Например:

Webster’s New World Dictionary as late as 1957 ...

... was once known as Lake Khwarizm ...

... as explained by the Oxford English Dictionary ...

... as invented by Leibniz.

... it is referred to as Algorithm 1.1E.

If r = 0, the algorithm teminates

Сами по себе союзы были обработаны СМП без ошибок, но вот конструкции с этими союзами в переводном тексте получились достаточно странными.

Третье предложение первого отрывка:

The word did not appear in Webster's New World Dictionary as late as 1957 ...

Статистическая СМП:

Слово не появится в Новом Свете Словарь Вебстера как в конце 1957 года ...

(Тут важно отметить, что саму по себе фразу «as late as 1957», трансфертная СМП переводит как «еще в 1957 году», что на наш взгляд является наиболее подходящим вариантом.)

Трансфертная СМП:

Слово не появлялось в Новом Мировом Словаре Вебстера уже в 1957 ...

Вариант переводчика СМП:

Этого слова еще не было в издании словаря Webster’s New World Dictionary, вышедшем в 1957 году.

Переводчик решил обойти фразу стороной, на что имел полное право. Получается, что ни один из вариантов перевода не отражает полностью смысл конструкции.

Специфичными для технических текстов, являются препозитивные определительные группы.

Например:

multitape Turing machine

greatest common divisor,

the largest positive integer.

СМП подобные конструкции переводятся верно. Однако стоит напомнить случай описанный выше a discrete simulation program.

Только человек корректно перевел термин ‑ программа дискретного моделирования. В то время как СМП перевели фразу:

отдельная программа моделирования

дискретная программа моделирования

С точки зрения препозиционных конструкций СМП восприняли фразу верно. Модель разбора в данном случае можно представить в виде

(discrete (simulation program))

Такая модель имеет смысл только для трансфертной СМП. Для статистической явление можно объяснить тем, что словосочетание «программа дискретного моделирования» является редким, а то что discrete simulation – является термином учтено не было.

Верную интерпретацию можно изобразить как:

((discrete simulation) program)

Препозитивные определительные группы более характерны для тестов, в которых идет речь о приборах, оборудовании или методах проектирования.

Отдельно стоит сказать про синтаксическую структуру описания алгоритма Эвклида. Предложения краткие и безличные, глаголы стоят в повелительном наклонении. Шаги алгоритма показаны в виде элементов списка, что помогает «пошаговому» восприятию.

Такие синтаксические особенности не требуют трансформационных преобразований текста. С задачей перевода сходным образом справились как человек так и машина.

3.4 Морфологические особенности

Широко распространены пассивные конструкции

Например:

... the Khwarizm region is located ...

... the appropriate section number is attached ...

... algorithm is called Algorithm E ...

... the algorithm are identi?ed ...

... The chapters are divided ...

В тексте используются именные конструкции:

At the time this chapter was first written

И человек и СМП учли эту особенность

Статистическая СМП:

В то время эта глава впервые была написана

Трансфертная СМП:

В то время, когда эта глава была сначала записана

Переводчик:

В то время, когда автор приступил к работе над настоящей главой

Несмотря на то, что машины перевели фразу с ошибками, можно сказать, что цель выражения была достигнута. – Не столь важна точная дата события, как то что оно произошло одновременно с другим событием.

Широко распространены так же безличные и неопределенно-личные конструкции.

В первом отрывке:

... at first glance it may look as though someone intended to write ...

... while in later sections it is referred to as …

Статистическая СМП:

... на первый взгляд это может выглядеть, как будто кто-то собирался ...

... а в последующих разделах это называется …

Трансфертная СМП:

... на первый взгляд может выглядеть, как если бы кто-то намеревался ...

... в то время как в более поздних разделах это упоминается как …

Переводчик-человек:

... На первый взгляд может показаться, будто кто-то собирался ...

... ссылаться на него в последующих разделах мы будем как …

При машинном переводе эти выражения были переведены шаблонно. С одной стороны это сохранило их безличную форму, которая также характерна для русского языка. С другой стороны это отрицательно повлияло на согласование. Человек-переводчик в данном случае предпочел изменить порядок слов. Это немного изменило стилистическую направленность текста, но упростило его восприятие.

Во втором отрывке:

... but it is believed to be the simplest set of rules ...

Статистическая СМП:

... но это, как полагают, простейший набор правил ...

Характеристики

Список файлов ВКР

Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке
defence
presentation-material
ssmt-presentation-material
colorschememapping.xml
filelist.xml
header.htm
item0001.xml
props0002.xml
themedata.thmx
ssmt-presentation-material.htm
ssmt-presentation-material.xps
presentation-oration
ssmt-presentation-oration
colorschememapping.xml
filelist.xml
header.html
item0001.xml
props0002.xml
themedata.thmx
Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7028
Авторов
на СтудИзбе
260
Средний доход
с одного платного файла
Обучение Подробнее