ssmt-text (1006264), страница 8
Текст из файла (страница 8)
Вариант переводчика:
... не было в издании словаря Webster’s New World Dictionary …
На наш взгляд, более верным является второй вариант перевода. Перевод был явно калькирован, но он не выглядит бессмысленно как в случае статистической СМП. Вариант, который предложил переводчик тоже верен, однако много слов на иностранном языке вызывает неприятное впечатление. Важно отметить, что официального русскоязычного перевода названия словаря до сих пор нет.
3.3 Синтаксические особенности
Стоит сразу сказать, что СМП рассматриваемых типов не могут кардинальным образом влиять на синтаксические особенности текста. Они оставляют структуру сверхфразовых единств и предложений такой, какая она была в оригинальном тексте. Этот факт был нами проверен на исследуемых отрывках.
В некоторых случаях статистическая СМП, в текущей реализации, может менять порядок слов. Но эти изменения маловероятны, и будут происходить только внутри пятерок слов. Нами подобное поведение установлено не было, но это не говорит, о том, что оно не может быть обнаружено на других текстах или при другой исходной базе СМП.
Сохранение оригинальной синтаксической структуры является плюсом систем перевода. Но такой подход не всегда возможен. В научных текстах очень часто встречаются распространенные сложные предложения. Если разбивать такие предложения, то текст будет легче для восприятия. Переводчик-человек может учесть этот факт и упростить авторский текст.
При этом будет потерян авторский стиль. Подобную ситуацию можно наблюдать в пятом и девятнадцатом предложении первого отрывка, во первой части двадцать пятого предложения второго отрывка.
СМП не обладает информацией о мысли, которую хотел донести автор. Она оперирует только лингвистическими знаниями и никакой разбивки предложений не производит.
Возможна и обратная ситуация, когда мысль автора выражена не одним, а несколькими предложениями. В этом случае, переводчик имеет право соединить две части высказывания, чтобы нагляднее донести мысль автора. СМП переведет авторский текст так, как он есть, без каких либо изменений структуры. Подобная ситуация прослеживается в последнем предложении третьего отрывка.
В англоязычной научной прозе для сложносочиненных предложений часто используют знак препинания «точка с запятой». В отечественной литературе знак используется только для маркированных списков.
При анализе оригинального текста на английском языке (особенно математического), заранее не известно, какую функцию несет «точка с запятой». Потому в этом случае, СМП не меняет структуры. Но человек, следуя отечественной традиции, может поменять знаки препинания.
Подобную ситуацию можно наблюдать в третьем и восьмом предложениях первого отрывка, в третьем, шестом, восьмом предложении и в первой части двадцать пятого предложения второго отрывка, в седьмом предложении третьего отрывка.
Рассматриваемый текст имеет четкую структуру. Первый отрывок делится на шесть абзацев и без учета алгоритма содержит двенадцать предложений. Второй отрывок делится на семь абзацев и содержит двадцать восемь предложений. Третий отрывок содержит четыре абзаца и содержит тринадцать предложений.
В каждом абзаце выдвигается определенное предположение, которое в нем же и доказывается. Например, в начале второго отрывка
By contrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc.
Ниже до начала следующего абзаца рассказывается о непрерывном моделировании и его отличиях от дискретного.
В отрывке можно предложения с прямым порядком слов, которые можно считать определениями.
... algorithm is basic to all of computer programming...
... that [common divisor] is, the largest positive integer that
evenly divides both m and n.
... n is the answer ...
В научно-техническом тексте достаточно часто встречаются и обычные «настоящие» определения. В рассмотренных отрывках виде они в явном виде не встретились. Малое количество определений в отрывках еще раз подчеркивает, что реальные научные тексты обладают стилистической неоднородностью. Часто автору проще донести свою мысль косвенно, неприбегая к именованию. Последнее представляет значительную сложность для СМП, так как тут не всегда можно обойтись эквивалентными трансформациями.
Четвертое предложение второго отрывка:
In a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time …
Переводчик передал фразу как неявное определение:
При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента …
Что может быть передано в явном виде как
Процесс моделирования – суть выполнение определенных действий, предусмотренных для данного момента …
Однако СМП передали это предложение с сильным искажением:
Статистическая СМП:
В дискретного моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования …
Трансфертная СМП:
На дискретном моделировании мы продолжаем, делая независимо от того, что должно быть сделано в определенный момент моделируемого времени …
Машины перевели максимально близко к тексту автора, однако основная идея высказывания была потеряна. Для научного текста – это серьезная проблема. На данном этапе развития технологий не представляется возможным автоматизировано, в общем случае, выделять дефидент и дефиницию для неявных определений.
Существует несколько вариантов решения этой проблемы:
-
предобработка исходного текста, на предмет разрешения подобных смысловых групп, и их преобразования в явные;
-
чтение машинного перевода текста параллельно с оригиналом;
Однако, ни один из способов не может быть удовлетворителен, так как потребует дополнительных затрат времени и дополнительных знаний.
Методы автоматического построения синонимичных конструкций на данный момент так же требуют доработки. При их применении опять же потребуется проверка результата. И мы придем опять к той же проблеме. Остается надеяться, что проблема разбора неявных определений исчезнет в недалеком будущем.
Следующий пример тоже можно считать определением.
Второе предложение второго отрывка:
"Discrete simulation" means the simulation of a system …
Обе СМП и переводчик
«Дискретное моделирование» означает моделирование системы …
Совпадение всех трех вариантов перевода объясняется логичностью и простотой фразы.
Большая часть предложений имеет прямой порядок слов. В тексте преобладают сложноподчиненные предложения. На шестьдесят одно предложение всех трех отрывков (без учета алгоритма Евклида) было обнаружено двадцать девять сложноподчиненных предложений, что составляет примерно сорок семь процентов.
Большая часть придаточных предложений в рассматриваемых отрывках оказалась индивидуализирующими определительными. Вторыми по частоте оказались придаточные условия. Благодаря своей четкой регулярной структуре такие предложения были корректно переведены обеими СМП.
Сложноподчиненных предложений не абсолютное большинство среди всех рассмотренных предложений, но важно учитывать, что предложения содержат себе более чем одно придаточное. Более того, эти придаточные относятся к разным типам. При переводе таких сложных предложений с помощью СМП лучше производить их предварительную обработку. СМП не всегда могут выявить к кому члену (основного или придаточного предложения) относится то или иное придаточное. Из-за этого многие сложные предложения превратились в набор слов.
Например, к таким предложениям относится седьмое предложение третьего отрывка. Оно содержит семь придаточных: уступки, причины условия и придаточное предложение сказуемое.
Для удобства восприятия предложение каждая основа записана на отдельной строке. Конец каждой распространенной основы обозначим символом конкатенации строк «║».
We must admit that, ║
as the number n of nodes created
by a linking automaton approaches infinity, ║
we don't know how to build such a device physically, ║
since we want ║
the machine operations to take
the same amount of time regardless of the size of n; ║
if linking is represented by using addresses as in a computer memory, ║
it is necessary to put a bound on the number of nodes, ║
since the link fields have a fixed size.
Статистическая СМП c таким предложением справилась плохо. Понять смысл высказывания без оригинала текста невозможно. Поведение системы перевода объясняется ее устройством, а именно тем, что вычисляются частоты использования именно для пятерок слов. Для верного перевода данного предложения уместнее было бы анализировать набор слов, в который бы всегда попадали, по крайней мере, две основы.
Статистическая СМП:
Мы должны признать, что, ║
как число n узлов,
созданных по образцы бесконечности автомата подходы, ║
мы не знаем, как построить такие устройства физически, ║
так как мы хотим ║
машинных операций принять
столько же времени, независимо от размера n, ║
если образцы представлены
с помощью адресов, как в памяти компьютера, ║
необходимо поставить оценку числа узлов, ║
так как ссылка поля имеют фиксированный размер.
Кроме того, ошибки связаны с неправильным разрешением омонимии. В результате глаголы были восприняты как существительные, что разрушило структуру предложений. Вариант трансфертной СМП оказался более читаемым. Трансфертная СМП:
Мы должны признать, ║
что, поскольку номер n узлов, создаваемых
соединяющимся автоматом, приближается к бесконечности, ║
мы не знаем,
как создать такое устройство физически, ║
так как мы хотим, ║
чтобы машинные операции заняли
то же самое количество времени независимо от размера n; ║
если соединение представляется
при использовании адресов как в памяти компьютера, ║
необходимо поместить привязанный число узлов, ║
так как у полей ссылки есть фиксированный размер.
Структура предложения изменена не была.
Трансфертная СМП производит подробный синтаксический анализ. Все основы были выделены, ряд оборотов (that as the number n) были верно переведены на русский язык. Из примера можно заключить, что трансфертная машина может обрабатывать предложения любой сложности, максимально сохраняя стилистику авторского текста.
Как и было указано выше в данном случае машина не стала разбивать предложение на две части по символу «;», хотя в данном случае это было бы вполне оправдано. Переводчик поступил иначе.
Более того, он избавился от второй основы, сделав ее обстоятельством условия. На наш взгляд первая часть варианта переводчика воспринимается труднее, чем та же часть, переведенная трансфертной СМП. Обстоятельства условия более характерны для русскоязычной научной прозы, но встречаются крайне редко. Вторая часть текста, которую перевел человек воспринимается проще, чем вариант трансфертной СМП. Вариант переводчика:
Следует признать, ║
что при стремлении количества созданных
связывающим автоматом узлов n к бесконечности
неизвестно,
как построить такое устройство физически, ║
поскольку желательно, ║
чтобы операции машины выполнялись
за одно и то же время независимо от размера n. ║
Если связывание представлено
с использованием адресов в машинной памяти, ║
необходимо определить границу для количества узлов, ║
поскольку поля связей имеют фиксированный размер.
Немногочисленные простые предложения развернуты за счет однородных членов. В первом отрывке ‑ только одно короткое простое предложение (не учитывая алгоритм Евклида).
Of course, Euclid did not present his algorithm in just this manner.
Мысль высказывания, крайне четкая. Она призвана уберечь читателей от ложных выводов.
Во втором отрывке простые предложения содержат перечисления.
Это связано с тем, что большую часть отрывка занимает описание модели.
The Mathematics building has five floors: sub-basement, basement, first, second, and third.
On each floor there are two call buttons, one for UP and one for DOWN.
Corresponding to these buttons, there are ten variables CALLUP [j]
and CALLDOWN [j], 0 <= j <= 4.