Система оптического распознавания текста ABBYY® FineReader Версия 8.0

Руководство пользователя
Источник:ABBYY Software
Дата публикации:2005
Поделиться в Twitter Поделиться в F******k Поделиться в VKontakte Поделиться в Telegram Поделиться в Mastodon

Информация, содержащаяся в этом документе, может быть изменена без предварительного уведомления, и компания ABBYY не берет на себя на этот счёт никаких обязательств.

Глава 1. Работа с программой ABBYY FineReader 8.0

Сценарии ABBYY FineReader

Процесс распознавания документов очень часто состоит из одного и того же набора операций – например, сканирование документов, их распознавание и сохранение распознанного текста в определённом формате. Автоматизировать однотипные действия вам помогут сценарии ABBYY FineReader.

Сценарий ABBYY FineReader – это набор последовательных шагов, каждый из которых соответствует одному этапу обработки документа. Запуск выполнения сценария осуществляется из меню кнопки Scan&Read. Переход от одного шага сценария к следующему выполняется автоматически.

В программе предусмотрено три встроенных сценария, полностью готовых к использованию. С помощью Менеджера сценариев можно также создать свои – пользовательские сценарии, состоящие из шагов, необходимых для решения ваших задач.

Запуск и выполнение сценария

Для того чтобы запустить сценарий:

  • выберите сценарий из выпадающего списка многофункциональной кнопки Scan&Read, или
  • воспользуйтесь горячими клавишами CTRL+W, если на кнопке Scan&Read выбран нужный сценарий, или
  • в диалоге Менеджера сценариев выберите сценарий из списка и нажмите кнопку Запуск.
Выполнение сценария

Сценарии ABBYY FineReader выполняются автоматически, с использованием настроек, выбранных в диалоге Опции (для того чтобы открыть диалог Опции, воспользуйтесь командой Опции... в меню Сервис).

Замечание.

1. Если при выполнении сценария изображения добавляются в пакет, уже содержащий изображения, то будет выполнена обработка только добавленных изображений. Если же в ходе выполнения сценария должен быть обработан пакет, то будут обработаны все изображения из этого пакета.

2. Если в ходе сценария должен быть обработан пакет ABBYY FineReader, в котором есть распознанные страницы, и страницы, на которых уже была выполнена разметка блоков, то распознанные страницы повторно обрабатываться не будут, страницы с размеченными блоками будут распознаны.

После запуска сценария на экране появляется панель выполнения сценария, содержащая индикатор выполнения сценария, список шагов сценария, а также подсказки и предупреждения.

Совет. Если для сценария необходимы значения настроек, которые Вы обычно не используете, то можно создать набор настроек и загружать его перед выполнением сценария, при этом Вам не придется изменять значение настроек вручную перед каждым выполнением сценария.

Для того чтобы создать набор настроек, установите в диалоге Опции значения настроек и сохраните набор настроек (кнопка Сохранить настройки на закладке Общие в диалоге Опции). Затем перед выполнением сценария загрузите набор настроек, требующийся для выбранного сценария, (кнопка Загрузить настройки) и запустите выполнение сценария.

Управление сценариями

Управление сценариями – это запуск выполнения сценариев, создание и редактирование пользовательских сценариев, а также удаление неиспользуемых пользовательских сценариев.

Управление сценариями ABBYY FineReader осуществляется с помощью Менеджера сценариев.

Для того чтобы открыть диалог Менеджера сценариев:

  • выберите команду Менеджер сценариев из списка команд кнопки Scan&Read, или
  • в меню Процесс выберите команду Сценарии>Менеджер сценариев, или
  • в меню Сервис выберите команду Менеджер сценариев.

На панели инструментов диалога Менеджера сценариев расположены кнопки, позволяющие создать, изменить, копировать, удалить и запустить выполнение сценария.

В левой части окна Менеджера сценариев располагается список сценариев. Встроенные сценарии ABBYY FineReader отмечены значком (картинка), пользовательские сценарии отмечены другим значком (картинка). Сценарии, которые невозможно выполнить на данном компьютере, отмечаются специальным значком (картинка). При выборе сценария из списка в правой части окна появляется список шагов сценария.

Замечание. Для передачи распознанного текста в какое–либо внешнее приложение, требуется наличие этого приложения на компьютере. Поэтому сценарии, предусматривающие передачу распознанного текста в приложения, отсутствующие на компьютере, не будут выполняться на данном компьютере. Такие сценарии не отображаются в списке сценариев кнопки Scan&Read, а также в выпадающем меню Automation меню Процессы.

Нажмите кнопку Для того чтобы...

Новый Создать новый сценарий. Мастер сценариев поможет вам выбрать шаги сценария и полностью их настроить.

 Экспорт... Экспортировать пользовательский сценарий. Файл сценария затем можно передать другому пользователю.

В открывшемся диалоге Экспортировать сценарий укажите имя файла, в который будет экспортирован сценарий (файлы пользовательских сценариев имеют расширение *.fta).

Замечание. По умолчанию файлы сценариев сохраняются в папку %userprofile%\Local Settings\Application Data\ABBYY\FineReader\8.00.

Импорт... Импортировать сценарий, созданный другим пользователем.

В открывшемся диалоге Импорт сценария выберите имя файла пользовательского сценария (файл *.fta) и папку, в которую он будет сохранен.

Изменить Отредактировать сценарий. Мастер сценариев поможет вам выбрать шаги сценария и полностью их настроить.

Замечание. Встроенные сценарии ABBYY FineReader нельзя редактировать, можно создать копию такого сценария, а затем внести в нее все необходимые изменения.

Копировать Создать копию сценария. Копия сценария будет добавлена в список сценариев сразу после оригинала.

Удалить Удалить сценарий.

Замечание. Встроенные сценарии ABBYY FineReader удалить нельзя.

Запустить Начать обработку документов в соответствии с выбранным сценарием.

Совет. Изменить название пользовательского сценария, можно выбрав команду Переименовать в контекстном меню сценария.

Встроенные сценарии ABBYY FineReader

Встроенные сценарии ABBYY FineReader содержат все шаги, необходимые для того, чтобы получить изображение документа, распознать изображение и сохранить распознанный текст. В состав встроенных сценариев не входит шаг проверки результатов распознавания.

В программе предусмотрены следующие готовые сценарии:

Сценарий PDF/изображения в Word

Последовательность шагов сценария:

1. Открытие файлов изображений или PDF файлов.

При запуске сценария открывается диалог Открыть, в этом диалоге укажите файлы документов, подлежащих обработке. Выбранные изображения будут добавлены в текущий пакет ABBYY FineReader.

2. Распознавание изображений.

3. Сохранение распознанного текста в Microsoft Word.

В программе Microsoft Word будет открыт новый документ, содержащий распознанный текст.

Замечание. Для данного сценария необходимо, чтобы на вашем компьютере была установлена программа Microsoft Word.

Сценарий Сканировать в Word

Последовательность шагов сценария:

1. Сканирование бумажных документов.

Полученные со сканера изображения будут добавлены в текущий пакет ABBYY FineReader.

2. Распознавание изображений.

3. Сохранение распознанного текста в Microsoft Word.

В программе Microsoft Word будет открыт новый документ, содержащий распознанный текст.

Замечание. Для данного сценария необходимо, чтобы на вашем компьютере была установлена программа Microsoft Word.

Сценарий Сканировать в PDF

Последовательность шагов сценария:

1. Сканирование бумажных документов.

Полученные со сканера изображения будут добавлены в текущий пакет ABBYY FinaReader.

2. Распознавание изображений.

3. Сохранение распознанного текста в формате PDF.

Все документы, обработанные в ходе выполнения сценария, сохраняются в файл формата PDF.

Пользовательские сценарии

Пользовательские сценарии предоставляют большее разнообразие шагов по сравнению со встроенными сценариями. В отличие от встроенных сценариев пользовательские сценарии могут содержать шаг проверки результатов распознавания, а также несколько шагов сохранения документа, что позволяет создавать копии одного и того же документа в различных форматах.

Последовательность шагов сценария должна соответствовать этапам обработки документа в программе ABBYY FineReader: получение изображения – распознавание – проверка результатов – сохранение результатов распознавания.

При создании сценария шаги добавляются со свойствами по умолчанию. Вы можете изменить свойства шагов и настроить процесс обработки документов наиболее удобным образом.

Пользовательский сценарий может включать в себя основные и дополнительные шаги.

Основные шаги пользовательского сценария

В сценарий можно добавить только один шаг получения изображения, один шаг распознавания и несколько шагов сохранения.

Получение изображения

Данный шаг всегда первый в сценарии, его цель – получение изображения для дальнейшей обработки.

Название шага Свойства шага Описание
Сканировать изображения Сканирование выполняется с текущими настройками ABBYY FineReader. Сканирование бумажных документов.
Открыть изображения (Свойство по умолчанию)  
  Запрашивать имена файлов изображений при запуске сценария При запуске сценария программа запрашивает файлы изображений и добавляет их в текущий пакет ABBYY FineReader.
В диалоге Открыть укажите файлы, подлежащие обработке.
  Обработать изображения из папки При запуске сценария программа откроет указанную папку, и добавит изображения, найденные в ней, в текущий пакет ABBYY FineReader.
При выборе данной опции необходимо указать папку, содержащую изображения.
Для того чтобы при выполнении сценария были обработаны изображения из указанной папки и всех вложенных папок, отметьте опцию Обработать изображения из вложенных папок.
Открыть пакет
(Свойство по умолчанию)
  
  Запрашивать имя пакета при запуске сценария При запуске сценария программа запрашивает пакет ABBYY FineReader.
В открывшемся диалоге Открыть укажите пакет ABBYY FineReader, изображения которого должны быть обработаны.
  Использовать текущий пакет При запуске сценария начинается обработка изображений из текущего пакета.
  Использовать указанный пакет При запуске сценария начинается обработка изображений из указанного пакета.
Укажите путь к файлу пакета ABBYY FineReader, изображения из которого должны быть обработаны.

Анализ макета страницы

Название шага Свойства шага Описание
Загрузить шаблон блоков (Свойство по умолчанию)  
  Запрашивать шаблон блоков при запуске сценария При выполнении сценария в диалоге Открыть укажите файл шаблона блоков.
  Использовать шаблон блоков из файла Укажите путь к файлу шаблона блоков.
  Проверить и редактировать блоки вручную При выполнении сценария после наложения блоков пользователь может проверить разметку блоков и внести в нее изменения.
Анализ макета страницы
(Свойство по умолчанию)
  
  Анализировать страницы автоматически, а затем вносить исправления вручную (рекомендуется) После получения изображения программа ABBYY FineReader выполнит анализ изображений и разметит на них блоки.
  Нарисовать блоки вручную После получения изображения пользователь выполняет разметку блоков.

Распознавание

Данный шаг позволяет распознать изображения.

Название шага Свойства шага Описание
Распознать все изображения Распознавание выполняется с текущими настройками ABBYY FineReader 8.0 Автоматическое распознавание изображений из указанного пакета или папки.

Проверка результатов распознавания

Название шага Свойства шага Описание
Проверить (Свойство по умолчанию)  
  Проверка орфографии При переходе к этому шагу автоматически открывается диалог Проверка.
  Просмотр текста без проверки орфографии. Распознанный текст будет открыт в окне Текст.

Сохранение

Данный шаг позволяет сохранить распознанный текст в файлы различных форматов или передать его в выбранное приложение. Пользовательский сценарий может содержать несколько шагов сохранения.

Название шага Свойства шага Описание
Сохранить страницы (Свойство по умолчанию)  
  Запрашивать имена файлов при сохранении При переходе к шагу сохранения открывается диалог Сохранить текст как...
В этом диалоге необходимо указать имя файла, в который будет сохранен распознанный текст, а также можно выбрать опции сохранения.
  Сохранить файлы с указанными именами в указанную папку При выборе данного свойства необходимо указать:
1. папку, в которую будет помещены файл(ы) с распознанным текстом;
Для того чтобы при каждом выполнении вам не приходилось задавать новую папку (т.е. перенастраивать сценарий), отметьте опцию При каждом запуске сценария сохранять файлы в новую папку, к имени которой добавлять дату и время;
2. формат файла;
3. режим сохранения страниц:
  • Каждая страница в отдельный файл – позволяет сохранить каждую страницу в отдельный файл;
  • Сохранять с именами исходных изображений – позволяет сохранить распознанные страницы в отдельные файлы выбранного формата, причём имена этих файлов будут совпадать с именами соответствующих файлов изображений;
  • Пофайловое деление по пустым страницам – все страницы рассматривается как совокупность групп страниц, разделенных пустыми страницами. Для каждой такой группы при сохранении образуется отдельный файл, в который последовательно записываются страницы группы; имена формируемых в этом режиме файлов образуются добавлением к указанному пользователем имени файла индексов следующего вида: –1, –2, –3 и т.д.;
  • Все страницы в один файл – позволяет сохранить все (или все выделенные) страницы пакета в один файл.

4. имя файла.
Сохранить изображения (Свойство по умолчанию)  
  Запрашивать имя файла при сохранении изображения При переходе к шагу сохранения открывается диалог Сохранить изображение как...
В этом диалоге необходимо указать имя файла, в который будет сохранен распознанный текст, а также можно выбрать опции сохранения.
  Сохранить изображения с указанными именами и в указанную папку При выборе данного свойства необходимо указать:
1. папку, в которую будет помещены файл(ы) с изображениями;
2. формат файла;
для того чтобы сохранить все изображения в один файл, отметьте опцию Сохранить в один многостраничный файл (только для форматов TIFF и PDF);
3. имя файла.
Дополнительные шаги пользовательского сценария

Дополнительные шаги сценария позволяют передать распознанный текст во внешнее приложение, создать письмо электронной почты с прикрепленным файлом, в которой можно поместить полученное изображение или распознанный текст и создать копию пакета ABBYY FineReader .

Передать во внешнее приложение

Название шага Свойства шага Описание
Передать во внешнее приложение (Свойство по умолчанию)  
  Сохранить с помощью Мастера сохранения Выберите нужное приложение из выпадающего списка.
При выполнении сценария распознанный текст будет помещен в новый файл, открытый в выбранном приложении.

Отправка распознанного текста и изображения по электронной почте

Название шага Свойства шага Описание
Отправить страницы по электронной почте   
  Отправить как Из выпадающего списка выберите нужный формат файла. Полный список поддерживаемых форматов см. в разделе "Форматы, в которых ABBYY FineReader сохраняет распознанный текст".
  Опции файла При выборе данного свойства необходимо указать режим сохранения страниц:
  • Каждая страница в отдельный файл – позволяет сохранить каждую страницу в отдельный файл;
  • Сохранять с именами исходных изображений – позволяет сохранить распознанные страницы в отдельные файлы выбранного формата, причём имена этих файлов будут совпадать с именами соответствующих файлов изображений;
  • Пофайловое деление по пустым страницам – все страницы рассматривается как совокупность групп страниц, разделенных пустыми страницами. Для каждой такой группы при сохранении образуется отдельный файл, в который последовательно записываются страницы группы; имена формируемых в этом режиме файлов образуются добавлением к указанному пользователем имени файла индексов следующего вида: –1, –2, –3 и т.д.;
  • Все страницы в один файл – позволяет сохранить все (или все выделенные) страницы пакета в один файл;
Отправить изображения по электронной почте   
  Отправить как Выберите формат файла из выпадающего списка.
Изображения будут сохранены в выбранном формате, полученные файлы с изображениями– присоединены к электронному письму. Полный список поддерживаемых форматов см. в разделе "Поддерживаемые графические форматы".
  Сохранить как один многостраничный файл Для того чтобы сохранить все изображения в один файл, отметьте опцию Сохранить в один многостраничный файл (только для форматов TIFF и PDF).
Имя - Укажите имя файла.

Замечание. Если каждое изображения сохраняется в отдельный файл (опция Сохранить в один многостраничный файл не отмечена, то выбранному вами имени файла будут автоматически добавлены номера страниц (0001, 0002 и.т.д.).

Сохранение пакета ABBYY FineReader

Название шага Свойства шага Описание
Сохранить пакет (Свойство по умолчанию)  
  Запрашивать имя пакета при сохранении При переходе к данному шагу открывается диалог Сохранить пакет как..., в данном диалоге укажите имя пакета и папку, в которую будет сохранен пакет.
  Сохранить пакет в папку Укажите папку, в которую будет сохранен пакет ABBYY FineReader.
Создание пользовательского сценария

1. Запустите Менеджер сценариев. Для этого:

  • выберите команду Менеджер сценариев из списка команд кнопки Scan&Read, или
  • нажмите CTRL+T,
  • в меню Процесс выберите команду Сценарии> Менеджер сценариев, или
  • в меню Сервис выберите команду Менеджер сценариев.

2. На панели инструментов Менеджера сценариев нажмите кнопку Новый.

3. В открывшемся диалоге введите имя сценария. Нажмите ОК.

4. Откроется окно Мастера сценариев. Мастер сценариев поможет вам выбрать шаги сценария и их свойства.

Диалог Мастера сценариев состоит из двух панелей. Левая панель содержит список шагов сценария, доступных для выбора. Состав списка зависит от уже выбранных шагов. На правой панели отображается список выбранных шагов сценария, который вы создаете, и их свойства.

5. На левой панели выберите один из доступных шагов. Выбранный шаг будет помещен на правую панель.

6. При добавлении в сценарий шаги имеют свойства по умолчанию. Значение свойства, с которым шаг был добавлен в сценарий, отображается в подсказке, расположенной под названием шага. Рядом с подсказкой находится кнопка Изменить. Щёлкните по этой кнопке, чтобы увидеть все возможные свойства данного шага и выберите наиболее подходящие.

7. В строке подсказки к шагу сценария также находится кнопка Удалить, с помощью которой можно удалить из сценария ненужный шаг.

Поскольку выбор каждого следующего шага сценария зависит от шагов выбранных ранее, не все шаги сценария можно удалить по отдельности. Если в сценарий добавлен шаг Распознавание, то из сценария уже невозможно удалить шаг анализа макета страницы. В этом случае для удаления шага вам придётся воспользоваться кнопкой Назад и вернуться к тому шагу, который вы хотите удалить.

8. После того, как вы добавили в сценарий все необходимые шаги и выбрали их настройки, нажмите кнопку Готово.

Созданный сценарий будет добавлен в список сценариев Менеджера сценариев и в список сценариев кнопки Scan&Read.


Предыдущая |  Содержание



Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2024