7148-1 (Автоматизация работы в офисе), страница 3
Описание файла
Документ из архива "Автоматизация работы в офисе", который расположен в категории "". Всё это находится в предмете "информатика" из 1 семестр, которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "7148-1"
Текст 3 страницы из документа "7148-1"
Вкладка «Сегментация» позволяет настраивать некоторые параметры для автоматической сегментации. Здесь задают параметры автоматического разбиения таблиц и настраивают режим автоматической сегментации многоколоночного текста.
Средства вкладки «Форматирование» позволяют задать способ форматирования распознанной страницы и выбрать используемые шрифты.
Вкладка «Распознавание» определяет параметры распознавания документа. Она позволяет задать язык документа и особенности исходного шрифта, а также настроить режим распознавания с обучением. Здесь же задается метод цветового выделения ненадежно распознанных символов.
Элементами управления вкладки «Проверка» задают метод проверки орфографии и способ пометки обнаруженных ошибок или сомнительных мест.
Вкладка «Установки» определяет общие настройки программы. Здесь задают язык интерфейса и настраивают используемые единицы измерения.
Флажки панели «Показывать» определяют способ представления окна программы и открытых документов.
Панель «Цвета» позволяет определить цвета различных элементов документа. В нижней части окна можно задать дополнительные параметры.
2.7. Распознавание бланков
Важной особенностью программы FineReader является возможность распознавания бланков. Бланк представляет собой отформатированный документ, в специальные поля которого вносятся данные. Типичными примерами бланков являются анкеты. Формат бланка может быть достаточно вычурным и не напоминать ни книжную, ни журнальную страницу.
Особенность работы с бланками заключается в том, что приходится иметь дело с объемным пакетом документов одинаковою формата, заполненных разными людьми. В таких документах различается содержание заполненных полей, а стандартные заголовки не представляют интереса. Данные, полученные из набора бланков, обычно подлежат последующей обработке, например статистической. Для обработки бланков предназначено специальное приложение FineReader Forms.
Для распознавания содержимого бланка необходимо предварительно создать шаблон формы. Для этого служит команда «СервисШаблоны». В открывшемся диалоговом окне «Шаблоны» можно создать новый шаблон или открыть для редактирования уже имеющийся.
В этом случае программа открывает окно «Редактор шаблонов» и дополнительное диалоговое окно «Параметры». В этом окне размещают блоки, соответствующие полям бланка и для каждого блока указывают тип содержащегося в нем значения. Блоки, содержащие данные, задаваемые пользователем, помечаются как экспортируемые. Данные могут записываться в текстовый файл или заноситься в базу данных в качестве записей.
Созданный шаблон используется на этапе сегментации. Сегментация в данном случае состоит не в реальном разбиении страницы на блоки, а в наложении шаблона. Положение шаблона корректируется в соответствии с тем, насколько ровно был размещен бланк при сканировании.
Заключительный этап состоит в распознавании содержимого бланка. Результат представляется в виде формы, содержащей названия полей и их содержание. Последовательность распознанных бланков может быть сохранена в рамках единой базы данных для последующей обработки.
3. Автоматический перевод документов
Идея автоматического перевода текстов с одного языка на другой витает в воздухе со времени появления самых первых компьютеров. Если бы полноценный перевод был возможен, значительно упростилось бы общение между народами и обмен документами, но это очень сложная задача, о полном решении которой пока не приходится говорить.
Все упирается в объем переводимого текста. Компьютеризованный словарь вполне может справиться с переводом отдельных слов, особенно если он способен предложить несколько значений на выбор. Однако ситуация заметно усложняется, когда мы переходим к переводу целых фраз и, тем более, абзацев связного текста.
Для таких случаев надежного алгоритма перевода с одного языка на другой не существует. Это связано с тем, что каждая фраза языка имеет два уровня: синтаксический и смысловой. Синтаксический уровень определяет построение предложения, а смысловой – его содержание. Для правильного смыслового перевода необходимо принимать во внимание не только конкретную фразу, но и абзац или даже целую главу текста. Таким образом, рассчитывать на то, что при автоматическом переводе получится полноценный документ, нельзя.
Программы автоматического перевода рассчитаны, в первую очередь, на тех, кто совсем не знает соответствующего иностранного языка, но должен ознакомиться с содержанием документа хотя бы приблизительно. Кроме того, подобные программы позволяют готовить короткие сообщения электронной почты на иностранном языке. Такие сообщения трудно считать грамотными, но, скорее всего, корреспондент сумеет понять, что ему хотели сообщить.
Если нет никаких требований к качеству перевода текста с иностранного языка на русский, то программы автоматического перевода можно рассматривать как удобные средства получения простейшего черновика. Если подобные требования есть, то использовать подобные программы не рекомендуется. Квалифицированное редактирование текста, полученного автоматическим путем, обходится в несколько раз дороже, чем услуги специалистов-переводчиков.
3.1. Средства автоматического перевода
Программные средства автоматического перевода можно условно разбить на две основные категории. Первую категорию представляют компьютерные словари. Назначение компьютерных словарей то же, что и у обычных словарей: предоставить значение неизвестного слова.
Преимущество компьютерных словарей состоит в быстроте доступа и удобстве автоматического поиска значения выделенного слова. Автоматический словарь обычно предоставляет возможность перевода слова по нажатию выделенной комбинации клавиш.
Ко второй категории относятся программы, позволяющие выполнить автоматический перевод связного текста. Они принимают текст на одном языке (предположительно грамотный и не содержащий опечаток) и выдают текст на другом языке. В ходе работы программа использует обширные словари, наборы грамматических правил и другие средства, обеспечивающие наилучшее (с точки зрения программы) качество перевода. Словарь может содержать не только отдельные слова, но и типичные словосочетания.
Используя эти средства, программа анализирует грамматическую структуру предложений исходного текста, обнаруживает связи между словами и пытается построить верный перевод фразы на другом языке. Чем короче предложение, тем больше шансов на то, что такое преобразование будет правильным. В длинных предложениях и сложных грамматических конструкциях любая система перевода может давать сбои.
В Украине наиболее широкое распространение получили программы автоматического перевода с английского языка на русский, а также с русского на английский. Это объясняется ведущей ролью английского языка в сфере международного общения. Английский язык достаточно прост для изучения, однако его простота неожиданно создает дополнительные трудности для систем автоматического перевода. Дело в том, что одинаково написанные слова в английском языке часто относятся к разным частям речи. Это затрудняет грамматический анализ предложения и нередко приводит к возникновению грубых ошибок в автоматическом переводе.
3.1.1. Программа Promt98
Из систем автоматического перевода с русского языка на английский и наоборот наиболее распространены такие программы, как Socrat и Stylus. Stylus, вне всяких сомнений, обеспечивает более высокое качество и более высокую гибкость при переводе. Последняя версия программы Stylus сменила название и теперь называется Promt98.
Программа Promt98 предназначена для автоматического перевода текстов с английского языка на русский и с русского на английский. Она способна работать с документами в различных форматах, допускает немедленное редактирование и оригинала и перевода и может сохранить в нужном виде как оригинал, так и перевод.
Система Promt98 включает богатый набор как универсальных, так и специализированных словарей и содержит средства для управления их использованием. Перевод слов, которые не входят ни в один из словарей, можно определить самостоятельно и сохранить в пользовательском словаре. Кроме того, программа Promt98 позволяет указать правила работы с именами собственными и другими словами, не требующими перевода, например сокращениями.
Дополнительные возможности программы включают пакетный перевод файлов, быстрый перевод неформатированного текста, а также возможности синхронного перевода Web-страниц в Интернете. Эти средства реализованы как отдельные приложения.
3.2. Рабочее окно программы Promt98
После установки программы Promt98 в Главном меню появляются пункты, которые позволяют ее запустить. Дополнительно на панели индикации (на правом краю Панели задач) устанавливается значок для быстрого запуска программы. Щелчок правой кнопкой мыши на этом значке открывает меню, позволяющее запускать все приложения системы. Основная программа запускается при выборе пункта PROMT98.
Интерфейс Promt98 реализован в соответствии с требованиями операционной системы Windows9Х. После запуска программы на экране открывается окно приложения, которое содержит строку меню, ряд панелей инструментов и рабочую область.
Рабочая область окна приложения разбита на несколько подобластей. Две основные зоны содержат исходный текст и его перевод. Они располагаются непосредственно под панелями инструментов.
В нижней части окна приложения расположена информационная панель. Она содержит три вкладки, предназначенные для отображения и выбора используемых словарей, для ведения списка слов текущего документа, не знакомых программе, и для управления списком зарезервированных слов, не требующих перевода. Эту панель в случае необходимости можно убрать с экрана.
В верхней части окна приложения под строкой меню располагаются инструментальные панели. Панель инструментов «Основная» содержит кнопки для открытия и сохранения документов и для операций с буфером обмена. Здесь же находятся кнопки, позволяющие произвести проверку орфографии, контекстный поиск и замену слов, а также пересылку документа по электронной почте. Прочие кнопки этой панели служат для изменения представления документа в окне приложения.
Панель «Перевод» содержит элементы управления, используемые при выполнении перевода. С их помощью осуществляется работа со словарями, перевод всего текста или отдельных его фрагментов, выбор направления перевода (то есть, языков оригинала и перевода), а также резервирование отдельных слов и целых абзацев.
Панель форматирование используют при редактировании исходного текста или текста перевода. Программа позволяет сохранять документы в форматах основных текстовых процессоров.
Панель «Сервис» используют при работе с другими вспомогательными приложениями. К таковым относятся программы сканирования и распознавания документов, а также дополнительные справочные словари. Здесь же расположены элементы управления, предназначенные для сбора статистики о документе и для настройки программы. На этой же панели располагается кнопка контекстной справки, позволяющая узнать назначение имеющихся элементов управления.
3.3. Автоматический перевод
Простой перевод исходного файла, содержащего текст, с помощью программы Promt98 выполняется очень легко. Сначала надо загрузить файл с исходным текстом. Это выполняют командой «ФайлОткрыть» или с помощью соответствующей кнопки на панели инструментов «Стандартная».
После выбора имени исходного файла программа открывает диалоговое окно «Конвертировать файл». В этом диалоговом окне автоматически выби-рается формат файла и необходимое направ-ление перевода. Пользо-вателю остается только убедиться в том, что параметры заданы верно, и щелкнуть на кнопке «ОК».
Исходный документ загружается в программу и поначалу одновременно отображается как в области оригинала, так и в области перевода. Для выполнения перевода надо дать команду «ПереводВесь текст» или воспользоваться кнопкой «Весь текст» на панели инструментов «Перевод». Перевод представляет собой достаточно сложную и медленную операцию. Во время перевода в основном окне программы можно наблюдать прокручивание исходного документа и замену абзацев исходного текста текстом на другом языке.
По достижении конца документа можно просмотреть как исходный текст, так и текст перевода, а также выполнить их редактирование.
Если в оригинал вносятся изменения, можно повторить перевод измененных абзацев. Для этого используют команду «ПереводТекущий абзац» или кнопку «Текущий абзац» на панели инструментов «Перевод». В этом случае все остальные абзацы перевода остаются неизменными.
3.4. Работа со словарями
Качество автоматического перевода существенно зависит от того, какие именно словари используются. Система Promt98 предоставляет генеральный словарь, который содержит общеупотребительные слова, а также специализированные словари по разным областям знаний.
Необходимость в специализированных словарях связана с тем, что в разных областях человеческой деятельности используются различные термины, которые описывают понятия, относящиеся к данной области. Некоторые из этих терминов могут иметь только специфические значения, некоторые могут использоваться и в обыденной жизни, хотя, возможно, в другом смысле. При переводе специальных текстов термины должны использоваться только в соответствующем смысле.
Рассмотрим в качестве примера английское слово box. Универсальные словари могут переводить его как коробку или ящик. Но в текстах, связанных с программным обеспечением, это слово скорее всего обозначает диалоговое окно.