48844 (Робота з програмою FineReader), страница 2
Описание файла
Документ из архива "Робота з програмою FineReader", который расположен в категории "". Всё это находится в предмете "информатика" из 1 семестр, которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "информатика, программирование" в общих файлах.
Онлайн просмотр документа "48844"
Текст 2 страницы из документа "48844"
Панель Зображення ( мал. 6 ) містить кнопки, що дозволяють робити аналіз макету сторінки (наприклад, створити і відредагувати блоки), а також кнопки, що дозволяють збільшити/зменшити масштаб зображення, відредагувати зображення (наприклад, стерти непотрібні ділянки зображення такі, як підписи або великі ділянки сміття).
Н а панелі Стандартна ( мал. 7 ) знаходяться кнопки, що керують роботою з файлами і зображенням (скасування і повтор дії, переміщення сторінками пакету, очищення і поворот зображення), а також список мов розпізнавання
Мал. 7.
Вигляд вікна програми FineReader, точніше кількість кнопок на панелях інструментів Зображення, Стандартна і Оформлення залежить від роздільної здатності екрану комп'ютеру. Щоб побачити всі кнопки, згадані вище, потрібно змінити роздільну здатність екрану на більш високу. Оскільки кнопки реалізують лише частину доступних у програмі FineReader команд і дублюються параметрами меню, відсутність декількох кнопок на панелях не обмежує функціональність програми.
Перш ніж приступити до роботи з програмою FineReader необхідно ввести (просканувати) деяку текстову інформацію. Для цього потрібно:
-
увімкнути сканер (якщо він має окреме від комп'ютера джерело живлення).
Слід зазначити, що багато моделей сканера необхідно вмикати до вмикання комп'ютера. -
Увімкнути комп'ютер і запустити FineReader (Пуск/Програми/ABBYY FineReader 5.0). Відкриється головне вікно програми FineReader.
-
Вставити у сканер сторінку, яку потрібно розпізнати.
-
Натиснути на стрілку праворуч від кнопки Scan&Read, в локальному меню виберати пункт Маг Scan&Read.
Після сканування з'явиться вікно Зображення, що містить "фотографію" сторінки. Потім програма запропонує встановити параметри розпізнавання і почне розпізнавання зображення, одночасно аналізуючи його. Оброблені ділянки зображення зафарбовуються голубим кольором.
Результат розпізнавання можна побачити у вікні Текст. У цьому ж вікні можна перевірити і відредагувати розпізнаний текст. Діючи далі за вказівками Мага Scan&Read, можна або передати розпізнаний текст до обраної програми чи записати його на диск, або продовжити обробку наступних зображень.
2.2. Робота з програмою
Процес роботи з програмою FineReader складається з чотирьох етапів: сканування, розпізнавання, перевірка і збереження результатів розпізнавання.
1. Сканування
FineReader працює зі сканерами через TWAIN-інтерфейс. Це єдиний міжнародний стандарт, введений у 1992 році для уніфікації взаємодії пристроїв для введення зображень у комп'ютер (наприклад, сканеру) із зовнішніми програмами. При цьому можливо два варіанти взаємодії програми зі сканерами через TWAIN-драйвер:
-
через інтерфейс FineReader: у цьому випадку для задавання параметрів сканування використовується діалогове вікно програми FineReader Параметри сканування;
-
через інтерфейс TWAIN-драйвера сканера: для задавання параметрів сканування використовується діалогове вікно TWAIN-драйвера сканеру. У цьому режимі, як правило, доступна функція попереднього перегляду зображення (preview), яка дозволяє точно задати розміри області, що сканується, підібрати яскравість, одразу контролюючи результати цих змін. Нажаль, діалог TWAIN-драйвера сканера в кожного сканера виглядає по-своєму, у більшості випадків усі написи англійською мовою. Вигляд цього вікна і зміст параметрів описаний у документації, яка є у комплекті до сканеру.
У режимі Використовувати інтерфейс FineReader доступні такі параметри, як можливість сканування в циклі на сканерах без автоподавача, збереження параметрів сканування в окремий файл Шаблон пакета (*.fbt) і можливість використання цих параметрів для інших пакетів.
По потребі можна легко переключатися між цими режимами, для цього на закладці Сканування/Зображення діалогового вікна Параметри (меню Сервіс>Параметри) потрібно вибрати один з пунктів: Використовувати інтерфейс TWAIN-драйвера чи Використовувати інтерфейс FineReader.
Щоб запустити сканування необхідно:
Н атиснути кнопку 1-сканувати чи в меню Файл вибрати пункт Сканувати. Через деякий час у Головному вікні програми FineReader з'явиться вікно Зображення з "фотографією" вставленого листка.
Якщо потрібно відсканувати декілька сторінок, то слід натиснути стрілку праворуч від кнопки 1-сканувати і в локальному меню вибрати пункт Сканувати декілька сторінок.
У випадку, якщо сканування не почалося одразу, відкриється вбудований TWAIN-інтерфейс сканера або відкриється діалог Параметри сканування ( тут слід задати усі режими сканування ).
Я кщо необхідно одразу запустити розпізнавання відсканованих сторінок, то слід скористатися параметром Сканувати і розпізнати чи Сканувати і розпізнати декілька сторінок. У цьому випадку слід натиснути стрілку праворуч від кнопки Scan&Read і в локальному меню вибрати один з пунктів: Сканувати і розпізнати чи Сканувати і розпізнати декілька сторінок.
FineReader відсканує і розпізнає зображення. У Головному вікні програми з'являться вікно Зображення з "фотографією" уставленого листа і вікно Текст з результатом розпізнавання. Розпізнаний текст можна передати до зовнішніх редакторів і записати у підтримуваних форматах.
Якість розпізнавання багато в чому залежить від того, наскільки гарне зображення отримано при скануванні. Якість зображення регулюється задаванням основних параметрів сканування: типу зображення, роздільної здатності та яскравості.
Щоб задати параметри сканування необхідно:
-
При скануванні через TWAIN з використанням інтерфейсу FineReader: у меню Сервіс слід вибрати пункт Параметри сканування і в діалоговому вікні Параметри сканування задати потрібні параметри.
-
При скануванні через TWAIN з використанням інтерфейсу TWAIN-драйвера сканеру для задавання параметрів сканування використовується діалогове вікно сканеру, що відкривається автоматично при натисканні на кнопку 1-сканувати. Параметри для сканування можуть називатися по-різному, у залежності від моделі сканеру. Наприклад, яскравість може називатися brightness, threshold, зображуватися "сонечком" чи чорно-білим кружком. Зміст параметрів описаний у документації, яка є у комплекті до сканеру.
Для зручності сканування великої кількості сторінок у програмі FineReader передбачено спеціальний режим сканування: Сканувати декілька сторінок. Він дозволяє відсканувати декілька сторінок у циклі. При цьому:
-
при скануванні через TWAIN з використанням інтерфейсу FineReader по закінченні сканування сторінки сканер автоматично починає сканування наступної;
-
при скануванні через TWAIN з використанням інтерфейсу TWAIN-драйвера сканеру Twain-діалог сканеру не закривається після закінчення сканування першої сторінки. Тут можна покласти наступну сторінку в сканер і відсканувати її і т.д.
2. Розпізнавання
Перед запуском розпізнавання потрібно перевірити задані параметри: мову розпізнавання, тип друку тексту, що розпізнається і тип сторінки.
У програмі FineReader можна:
-
Розпізнати блок або кілька блоків, виділених на зображенні.
-
Розпізнати відкриту сторінку або всі сторінки, виділені у вікні Пакет.
-
Розпізнати всі нерозпізнані сторінки пакета.
-
Розпізнати всі сторінки у фоновому режимі. У цьому режимі можливо розпізнавання з одночасним редагуванням уже розпізнаних сторінок.
-
Розпізнати сторінки в режимі розпізнавання з навчанням. Даний режим використовується в основному для розпізнавання текстів, що використовують декоративні шрифти, або розпізнавання великого обсягу (більш 100 сторінок) документів поганої якості друку
Щоб запустити розпізнавання потрібно натиснути кнопку 2 - розпізнати на панелі Scan&Read або у меню Процес вибрати потрібний пункт:
-
Розпізнати - щоб розпізнати відкриту сторінку або усі сторінки, виділені у вікні Пакет;
-
Розпізнати усі - щоб розпізнати всі нерозпізнані сторінки пакету;
-
Розпізнати Блок - щоб розпізнати блок або кілька блоків, виділених на зображенні;
-
Розпочати фонове розпізнавання - щоб розпочати розпізнавання у фоновому режимі.
К нопка 2-Розпізнати запускає розпізнавання відкритого зображення. Щоб змінити режим кнопки, слід натиснути на стрілку праворуч від неї і з меню, яке відкриється, вибрати потрібний пункт.
П еред розпізнаванням важливо правильно вибрати мову розпізнавання. FineReader підтримує розпізнавання як одномовних, так і багатомовних (наприклад, англійсько-українських) документів. Щоб задати мову тексту, що розпізнається, потрібно вибрати відповідний рядок у списку на панелі Розпізнавання ( мал. 8. ).
Якщо потрібно розпізнати документ, написаний кількома мовами, то у списку мов на панелі Стандартна слід вибрати пункт Вибір декількох мов… У діалоговому вікні Мова тексту, що розпізнається вказати кілька мов. Для цього потрібно відзначте пункти з відповідними назвами мов.
3. Перевірка розпізнаного тексту
Невпевнено розпізнані символи і слова, яких немає в словнику, виділяються різними кольорами. Стандартно для виділення невпевнено розпізнаних символів використовується голубий, для слів, що не знайдені в словниках – рожевий колір. Змінити ці кольори можна на закладці Вигляд (меню Сервіс>Параметри) у полі Елемент, вибравши пункт Невпевнено розпізнаний символ (Слово, що не знайдене в словниках) і в полі Колір - колір підсвічування.
Щоб перевірити результати розпізнавання потрібно:
-
Натиснути кнопку 3-перевірити на панелі Scan&Read (або вибрати пункт Перевірка у меню Сервіс).
-
Перевірка дозволяє знайти у тексті слова, що містять невпевнено розпізнані символи, слова, що не знайдені в словниках, а також слова з орфографічними помилками.
-
Клавіатурна команда: F7
-
Відкриється діалогове вікно Перевірка ( мал. 9) .
-
У діалоговому вікні Перевірка три частини. Верхня частина - аналог вікна «Крупний план» програми FineReader, у ньому показано зображення слова з можливою помилкою. Середня частина показує саме слово з можливою помилкою, у рядку над цим вікном виводиться назва типу помилки. У нижній частині, Варіанти замін, пропонуються варіанти заміни цього слова (якщо такі
-
і снують). Для варіантів використовується словник, зазначений у полі Мова словника. Тут можна використовувати будь-який словник із запропонованого списку.
Працюючи з діалоговим вікном Перевірка користувач має наступні можливості:
-
Натиснути кнопку Пропустити, щоб залишити слово, як воно є.
-
Натиснути кнопку Пропустити всі, щоб залишити всі такі слова в розпізнаному тексті, як вони є.
-
Вибрати варіант для заміни і натисніть кнопку Замінити або Замінити всі, щоб замінити поточне слово або всі такі слова в тексті. Якщо серед слів, які є у Варіантах замін немає правильного варіанту для заміни слова, можна відредагувати його в середній частині діалогового вікна і натиснути кнопку Підтвердити, щоб замінити поточне слово.
-
Натиснути Додати..., щоб додати слово в словник. У цьому випадку при подальшій перевірці орфографії, якщо це слово (або одна з його форм) зустрінеться в тексті, воно не буде вважатися помилковим
-
Натиснути Параметри..., щоб задати параметри перевірки розпізнаного тексту
-
Натиснути Закрити, щоб закрити діалогове вікно.
4. Збереження результатів розпізнавання
Результати розпізнавання можна записати у файл, передати до зовнішньої програми, не записуючи на диск, скопіювати у буфер обміну чи відправити електронною поштою. Зберегти можна усі сторінки або тільки обрані.
К нопка 4 - зберегти дозволяє передати результати розпізнавання у обрану програму чи записати їх у файл. Зовнішній вигляд іконки міняється в залежності від обраного режиму збереження; підпис Зберегти міняється на назву обраної програми. Натиснувши на кнопку 4 – зберегти, відкривається діалогове вікно Маг збереження результатів ( мал. 10 ).