ssmt-text (1006268), страница 7
Текст из файла (страница 7)
Подобные, слова являются обособленными, потому с ними может справится даже самая простейшая система машинного перевода.
Важно, что общелингвистическое и специальное значение таких слов совпадает для русского и английского языков (чего в общем случае утверждать нельзя). Устойчивые фразы из второго отрывка такие как:
The methods to be discussed below …
Были переведены СМП как
Методы, которые будут обсуждаться ниже …
Однако переводчик перевел фразу так же усточивой для русского языка фразой
Рассматриваемые ниже методы…
В большинстве случаем перевод сделанный СМП и человеком таких устойчивых фраз совпадает.
В тексте можно так же заметить логическое подчеркивание. Благодаря своей шаблонности, такие маркеры так же весьма удачно переводятся машиной. В третьем отрывке:
Some of the most interesting problems …
Статистическая СМП:
Некоторые из наиболее интересных задач …
Трансфертная СМП:
Некоторые из самых интересных проблем …
Переводчик:
Самыми интересными проблемами …
Переводчик опять позволил себе вольность, однако это не является критическим в данном случае. Но, это несколько искажает смысл фразы. Переводчик ограничивает круг жестче интересных проблем, в то время как автор этого не делает. Эту же фразу можно классифицировать,
как и выражение количественной экспрессивности. Можно утверждать, что переводчик умышленно ее усиливает.
Логическое подчеркивание видно на примере предложения
So far we have described the elevator from a user's point of view; the situation is more interesting as viewed by the elevator.
В данном случае противопоставляются две точки зрения, и на вторую автор хочет обратить особое внимание, потому что далее речь пойдет именно о ней. Статистическая СМП перевела это предложение как:
До сих пор мы описали лифт с точки зрения пользователя, ситуация более интересная, если смотреть на лифте.
Вариант трансфертной системы и вариант переводчика не сильно стилистически отличаются, хотя обе СМП сильно исказили текст, следующий за подчеркиванием
До сих пор мы описали лифт с точки зрения пользователя; ситуация более интересна как просматривающийся лифтом.
До сих пор работа лифта описывалась с точки зрения пользователя, но ситуация станет более интересной, если рассмотреть ее с точки зрения лифта.
В тексте встречается количественная экспрессивность
В конце первого отрывка:
... most frequently associated with Euclid's algorithm,
Статистическая СМП:
... чаще всего связаны с алгоритмом Евклида ...
Трансфертная СМП:
... наиболее часто связывался с алгоритмом Евклида ...
Переводчик:
... чаще всего ассоциировалось с алгоритмом Евклида ...
Интересно заметить, что различные СМП перевели фразы по-разному.
Варианты, сделанные переводчиком и машиной, являются верными и те и другие отражают экспрессивность, но различными средствами. Отдельное внимание стоит обратить на тот факт, что варрант статистической СМП совпал с вариантом переводчика. Это говорит о том, что в русском техническом тексте используется именно этот вариант перевода. Трансфертная СМП действовала в данном случае по заложенным в нее правилам. Она выдала, тоже верный вариант, но он не является устойчивым и в процессе беглого прочтения может быть воспринят неверно.
Сходная ситуация наблюдается и в примере ниже. Вариант трансфертной СМП больше отличается от вариант переводчика, чем вариант статистической. Все три варианта перевода верны.
В конце второго отрывка:
… algorithm below, which is much more precise …
Статистическая СМП:
… алгоритм, который является гораздо более точным ….
Трансфертная СМП:
… в алгоритме ниже, который намного более точен …
Переводчик:
… в алгоритме, который выглядит гораздо более строго …
В первом отрывке встречается большое количество точных дат, которые так же являются показателем научности. В научном тексте, обычно, вся числовая информация передается цифрами, и даты не являются исключением, потому и для машин и для переводчиков «перевод» подобных слов выполняется крайне просто.
Иначе дело обстоит с географическими названиями и именами собственными. В рассматриваемом тексте правильное название городов и других объектов не критичны, но они показывают кругозор автора и его осведомленность. При переводе таких слов надо учитывать именование таких объектов принятое в русской литературе.
В седьмом предложении первого отрывка
The Aral Sea in Central Asia was once known as Lake Khwarizm …
Статистическая СМП:
Аральское море в Центральной Азии когда-то называлось озером Хорезм …
Трансфертная СМП:
Аральское море в Средней Азии было когда-то известно как Озеро Хваризм, …
Переводчик:
Аральское море в Центральной Азии было когда-то называли озеро Хорезм …
Здесь можно увидеть сразу два географических объекта регион Средней Азии и озеро Хорезм.
Именование первого термина имеет различную географическую и политическую трактовку. Анализируя перевод сделанный человеком, приходится учитывать текущие веяния и, возможно, оказываемое на переводчика давление. В случае СМП дело обстоит не намного проще, ибо ряд фраз мог быть жестко прописан в алгоритме перевода. Аналогичная ситуация касается не только географических объектов, но так же может проявиться при переводе любых названий и именований, особенно если объекты реального мира были названы в честь какого-либо ученого или общественного деятеля.
Еще более интересная ситуация складывается, если в момент написания оригинала и в текущей момент объекты назывались по-разному. В данном случае такая ситуация тоже имеет место быть. Мы считаем, что переводить термин Central Asia в этом предложении следует именно как Средняя Азия. Именно так назывался этот регион, когда Д. Кнут писал свой труд. Однако, в текущий момент регион называется Центральной Азии. Это название было закреплено за регионом, во время работы переводчика.
Этим объясняется его вариант перевода.
В случае перевода статистической СМП, то вероятно, что название было переведено как выражение общей лексики, без осознания того, что это имя собственное. Но точно утверждать нельзя. В трансфертную СМП перевод словосочетания был заложен жестко.
Для уменьшения разночтений переводов научно-технической литературы, нам кажется наиболее приемлемым обращаться к оригиналу и уже самостоятельно делать выводы на основе экстралингвистических знаний.
Рассмотрим второй географический объект, который встретился в этом предложении. Правильное русское название Lake Khwarizm ‑ озеро Хорезм. Однако, трансфертная СМП в данном случае использовала транслитерацию. В данном случае – недопустимо, потому что это дает неверные представления и если указанного слово не оказалось в базе данных СМП, то его лучше оставить без перевода и привести оригинальное название из авторского текста. Такой подход был использован в этом же предложении.
В тексте:
... Amu River basin just south of that sea.
Статистическая СМП:
... в бассейне реки Амударьи к югу от этого моря.
Трансфертная СМП:
... в бассейне реки Amu только к югу от того моря.
Переводчик:
... в бассейне реки Амударьи южнее этого моря.
Далее в тексте первого отрывка можно найти (третье предложение):
... did not appear in Webster's New World Dictionary ...
Статистическая СМП:
... не появится в Новом Свете Словарь Вебстера ...
Трансфертная СМП:
... не появлялось в Новом Мировом Словаре Вебстера...
Вариант переводчика:
... не было в издании словаря Webster’s New World Dictionary …
На наш взгляд, более верным является второй вариант перевода. Перевод был явно калькирован, но он не выглядит бессмысленно как в случае статистической СМП. Вариант, который предложил переводчик тоже верен, однако много слов на иностранном языке вызывает неприятное впечатление. Важно отметить, что официального русскоязычного перевода названия словаря до сих пор нет.
3.3 Синтаксические особенности
Стоит сразу сказать, что СМП рассматриваемых типов не могут кардинальным образом влиять на синтаксические особенности текста. Они оставляют структуру сверхфразовых единств и предложений такой, какая она была в оригинальном тексте. Этот факт был нами проверен на исследуемых отрывках.
В некоторых случаях статистическая СМП, в текущей реализации, может менять порядок слов. Но эти изменения маловероятны, и будут происходить только внутри пятерок слов. Нами подобное поведение установлено не было, но это не говорит, о том, что оно не может быть обнаружено на других текстах или при другой исходной базе СМП.
Сохранение оригинальной синтаксической структуры является плюсом систем перевода. Но такой подход не всегда возможен. В научных текстах очень часто встречаются распространенные сложные предложения. Если разбивать такие предложения, то текст будет легче для восприятия. Переводчик-человек может учесть этот факт и упростить авторский текст.
При этом будет потерян авторский стиль. Подобную ситуацию можно наблюдать в пятом и девятнадцатом предложении первого отрывка, во первой части двадцать пятого предложения второго отрывка.
СМП не обладает информацией о мысли, которую хотел донести автор. Она оперирует только лингвистическими знаниями и никакой разбивки предложений не производит.
Возможна и обратная ситуация, когда мысль автора выражена не одним, а несколькими предложениями. В этом случае, переводчик имеет право соединить две части высказывания, чтобы нагляднее донести мысль автора. СМП переведет авторский текст так, как он есть, без каких либо изменений структуры. Подобная ситуация прослеживается в последнем предложении третьего отрывка.
В англоязычной научной прозе для сложносочиненных предложений часто используют знак препинания «точка с запятой». В отечественной литературе знак используется только для маркированных списков.
При анализе оригинального текста на английском языке (особенно математического), заранее не известно, какую функцию несет «точка с запятой». Потому в этом случае, СМП не меняет структуры. Но человек, следуя отечественной традиции, может поменять знаки препинания.
Подобную ситуацию можно наблюдать в третьем и восьмом предложениях первого отрывка, в третьем, шестом, восьмом предложении и в первой части двадцать пятого предложения второго отрывка, в седьмом предложении третьего отрывка.
Рассматриваемый текст имеет четкую структуру. Первый отрывок делится на шесть абзацев и без учета алгоритма содержит двенадцать предложений. Второй отрывок делится на семь абзацев и содержит двадцать восемь предложений. Третий отрывок содержит четыре абзаца и содержит тринадцать предложений.
В каждом абзаце выдвигается определенное предположение, которое в нем же и доказывается. Например, в начале второго отрывка
By contrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc.
Ниже до начала следующего абзаца рассказывается о непрерывном моделировании и его отличиях от дискретного.
В отрывке можно предложения с прямым порядком слов, которые можно считать определениями.
... algorithm is basic to all of computer programming...
... that [common divisor] is, the largest positive integer that
evenly divides both m and n.
... n is the answer ...
В научно-техническом тексте достаточно часто встречаются и обычные «настоящие» определения. В рассмотренных отрывках виде они в явном виде не встретились. Малое количество определений в отрывках еще раз подчеркивает, что реальные научные тексты обладают стилистической неоднородностью. Часто автору проще донести свою мысль косвенно, неприбегая к именованию. Последнее представляет значительную сложность для СМП, так как тут не всегда можно обойтись эквивалентными трансформациями.
Четвертое предложение второго отрывка:
In a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time …
Переводчик передал фразу как неявное определение:
При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента …
Что может быть передано в явном виде как
Процесс моделирования – суть выполнение определенных действий, предусмотренных для данного момента …
Однако СМП передали это предложение с сильным искажением:
Статистическая СМП:
В дискретного моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования …
Трансфертная СМП:
На дискретном моделировании мы продолжаем, делая независимо от того, что должно быть сделано в определенный момент моделируемого времени …
Машины перевели максимально близко к тексту автора, однако основная идея высказывания была потеряна. Для научного текста – это серьезная проблема. На данном этапе развития технологий не представляется возможным автоматизировано, в общем случае, выделять дефидент и дефиницию для неявных определений.















