49066 (Создание программы-переводчика текстов с английского на русский язык)

2016-07-30СтудИзба

Описание файла

Документ из архива "Создание программы-переводчика текстов с английского на русский язык", который расположен в категории "". Всё это находится в предмете "информатика" из 1 семестр, которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "информатика, программирование" в общих файлах.

Онлайн просмотр документа "49066"

Текст из документа "49066"

Министерство образования и науки Республики Казахстан

Карагандинский Государственный Технический Университет

Курсовая работа

По дисциплине:

«Лингвистическое обеспечение»

Тема:

«Создание программы-переводчика текстов с английского на русский язык»

2009

Содержание

Введение

1. Предпроектные исследования

2. Работа на тему «Бинарные деревья»

2.1 Техническое задание на разработку программы

2.2 Описание программы

2.3 Выводы по работе

2.4 Результаты работы программы

3. Работа на тему «Польская запись»

3.1 Техническое задание на разработку программы

3.2 Описание программы

3.3 Выводы по работе

3.4 Результаты работы программы

4. Работа на тему «Переводчик»

4.1 Техническое задание на разработку программы

4.2 Описание программы

4.3 Выводы по работе

4.4 Результаты работы программы

Заключение

Список использованных источников

Приложения

Введение

Целью выполнения данного курсового проекта является приобретение практических навыков в построении переводчиков; в разработке диалога САПР; в структурировании языков САПР; в области использования языков программирования и создания языков проектирования.

В задачи курсового проекта по дисциплине «Лингвистическое обеспечение» входит:

  • получение знаний в области лингвистического обеспечения;

  • изучение классификации языков САПР, структуры трансляторов, структуры диалога в САПР;

  • развитие навыков программирования, полученных на предыдущих курсах;

  • развитие системное мышление;

  • написание программы, соответственно варианту задания.

В настоящее время все большее распространение приобретает английский язык, как язык международного значения. Поэтому ставится задача создания более совершенных переводчиков. Разработанный проект демонстрирует переводчик, работа с которым очень удобна для пользователя. Программа является очень актуальной на сегодняшний день, она способствует быстрому переводу различных текстовых документов и обработку большого количества информации, а также предоставляет возможность добавления новых слов в словарь.

1. Предпроектные исследования

Лингвистическое обеспечение – это совокупность всех языковых средств используемых в САПР, включая термины и определения, правил формализации естественного языка, методы сжатия и развертывания текстов, необходимых для выполнения автоматизированного проектирования.

Лингвистическое обеспечение автоматизированной системы – совокупность языковых средств, используемых в автоматизированных системах, а также правил формализации естественного языка в целях повышения эффективности машинной обработки информации.

Практика показала, что мощность и комфортность конкретной системы автоматизированного проектирования прямо и весьма существенно зависит от мощности ее лингвистического обеспечения. Возрастающая практическая значимость лингвистического обеспечения определяется такими причинами, как:

  • огромные объемы текстов на естественном языке, циркулирующих в информационных системах;

  • необходимость использования новых стратегий обработки информации с учетом семантических законов обыденного языка;

  • потребность в гибком и тесном симбиозе человека и компьютерной системы;

  • вовлечение в обработку многообразных скрытых знаний, экспликация которых возможна только на естественном языке.

В настоящее время искусственные языки, использующие для описания предметной области текстовое представление, широко применяются не только в программировании, но и в других областях. С их помощью описывается структура всевозможных документов, трехмерных виртуальных миров, графических интерфейсов пользователя и многих других объектов, используемых в моделях и в реальном мире. Для того, чтобы эти текстовые описания были корректно составлены, а затем правильно распознаны и интерпретированы, используются специальные методы их анализа и преобразования. В основе методов лежит теория языков и формальных грамматик, а также теория автоматов.

Несмотря на то, что к настоящему времени разработаны тысячи различных языков и их трансляторов, процесс создания новых приложений в этой области не прекращается. Это связано как с развитием технологии производства вычислительных систем, так и с необходимостью решения все более сложных прикладных задач. Элементы теории языков и формальных грамматик применимы и в других разнообразных областях, например, при описании структур данных, файлов, изображений, представленных не в текстовом, а двоичном формате.

Лингвистическое обеспечение состоит из совокупности трёх языков: входного, внутреннего и выходного.

2. Работа на тему «Бинарные деревья»

2.1 Техническое задание на разработку программы

Дана числовая последовательность. Отсортировать ее, используя обратный обход бинарного дерева в порядке возрастания.

2.2 Описание программы

Входной язык

Входной язык является средством взаимодействия пользователя с данной программой в ходе обработки исходных данных и формулировки проблемы.

Для данной программы исходными данными являются, числовая последовательность, необходимая для сортировки, которую пользователь вводит с клавиатуры.

Форма ввода для исходных данных приведены ниже (рисунок 1).

Рисунок 1 – Форма ввода данных для программы «Бинарные деревья»

Внутренний язык

Внутренний язык обычно скрыт от рядового пользователя, служит для представления и обработки информации, которая передаётся между различными подсистемами информационных систем. В качестве внутреннего языка был выбран Паскаль.

Это структурированный язык высокого уровня, который можно использовать для написания программ любого типа и размера. Разработка программ на Паскале включает в себя следующие действия: ввод и редактирование текста на языке программирования, трансляция и отладка программы. Для каждого этапа требуются специальные средства: редактор текстов, компилятор, включающий в себя компоновщик – для построения исполняемого компьютером программного модуля и отладчик – для отладки программы. Систему программирования Турбо Паскаль называют еще интегрированной средой программирования, так как она объединяет в себе все ранее разрозненные средства, используемые при разработке программ.

Широкой популярности Паскаля способствовали следующие причины:

  • Благодаря компактности, удачному первоначальному описанию язык оказался достаточно легким для изучения.

  • Он отражает фундаментальные концепции алгоритмов в легко воспринимаемой форме.

  • Паскаль позволяет четко реализовывать идеи структурного программирования и осуществлять переход к объектно-ориентированному программированию (язык Турбо Паскаль предоставляет программисту все средства ООП: высокую степень структурированности, модульность, абстрактность и возможность повторного использования, которые встроены непосредственно в язык).

  • Язык программирования позволил перейти к системам автоматической проверки правильности программ.

Паскаль – язык структурного программирования.

Для данной программы этот язык подходит больше всего, так как имеет возможность работы с динамическими структурами данных, т.е. с такими структурами данных, размер и конфигурация которых изменяются во времени исполнения программ. Для них выделение и очистка памяти происходит не на этапе трансляции, а в ходе выполнения самой программы. Для работы с динамическими величинами в Паскале предусмотрен специальный тип значений – ссылочный. Этот тип не относится ни к простым, ни к составным. Переменные ссылочного типа, или указатели, являются статическими переменными. Значением переменной ссылочного типа является адрес ячейки – места в памяти соответствующей динамической величины. Своё значение ссылочная переменная получает в процессе выполнения программы, в момент появления соответствующей динамической величины.

Выходной язык

Выходной язык обеспечивает оформление результатов программы в текстовом виде.

Для данной программы выходными данными является последовательность чисел, отсортированная в порядке возрастания, используя обратный обход бинарного дерева. Форма выходной информации приведена ниже (рисунок 2).

Рисунок 2 – Форма выходных данных для программы «Бинарные деревья»

2.3 Выводы по работе

В данной работе были изучены алгоритмы сортировки методом прохождения бинарного дерева.

Деревом называется орграф для которого:

1. Существует узел, в который не входит ни одной дуги. Этот узел называется корнем.

2. В каждую вершину, кроме корня, входит одна дуга.

С точки зрения представления в памяти важно различать два типа деревьев: бинарные и сильноветвящиеся. В бинарном дереве из каждой вершины выходит не более двух дуг. В сильноветвящемся дереве количество дуг может быть произвольным.

Бинарное дерево является рекурсивной структурой, поскольку каждое его поддерево само является бинарным деревом и, следовательно, каждый его узел в свою очередь является корнем дерева.
Узел дерева, не имеющий потомков, называется листом.

Я считаю, что этот метод сортировки для данной работы является очень удобным и быстрым. Он позволяет значительно ускорить время поиска любого элемента. Программа позволяет сортировать с помощью бинарных деревьев последовательность чисел в порядке возрастания методом обратного обхода.

2.4 Результаты работы программы

Результаты работы программы представлены на рисунке 3. Листинг программы приведен в приложении А.

Рисунок 3 – Результаты работы программы «Бинарные деревья»

3. Работа на тему «Польская запись»

3.1 Техническое задание на разработку программы

Перевести входную строку в инфиксной форме в постфиксную.

3.2 Описание программы

Входной язык

Лексемами входного языка в данной работе являются буквы или цифры, т.е. операнды, и связывающие их арифметические действия.

Входными данными являются арифметические выражения.

Форма исходной информации приведена на рисунке 4.

Рисунок 4 – Форма ввода данных для программы «Польская запись»

Внутренний язык

В качестве внутреннего языка для данной работы был выбран Паскаль.

Описание данного языка программирования приведено в первой работе на тему «Бинарные деревья».

Выходной язык

Выходной язык обеспечивает оформление результатов программы в текстовом виде.

Для данной программы выходными данными является строка символов в постфиксной форме записи. Форма выходной информации приведена ниже (рисунок 5).

Рисунок 5 – Форма выходных данных для программы «Польская запись»

3.3 Выводы по работе

В данной работе были изучены алгоритмы перевода выражений в форму, удобную для машинной обработки в виде польской записи, а также был осуществлен на практике алгоритм перевода выражения из инфиксной формы в постфиксную.

Обратная польская запись обладает pядом замечательных свойств, котоpые пpевpащают ее в идеальный пpомежуточный язык пpи тpансляции. Во-пеpвых, вычисление выpажения, записанного в обpатной польской записи, может пpоводиться путем однокpатного пpосмотpа, что является весьма удобным пpи генеpации объектного кода пpогpамм.

Во-втоpых, получение обpатной польской записи из исходного выpажения может осуществляться весьма пpосто на основе пpостого алгоpитма, пpедложенного Дейкстpой, – метод стеков с приоритетами.

Этот метод основан на использовании стека с приоритетами, позволяющего изменить порядок следования знаков операций в выражении так, что получается обратная польская запись. В данной работе был использован именно этот метод, так как он является более удобным для реализации щаной программы.

3.4 Результаты работы программы

Результаты работы программы представлены на рисунке 6. Листинг программы приведен в приложении В.

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Нет! Мы не выполняем работы на заказ, однако Вы можете попросить что-то выложить в наших социальных сетях.
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
4121
Авторов
на СтудИзбе
667
Средний доход
с одного платного файла
Обучение Подробнее