Системы оптического распознавания документов презентация

Октябрь 25, 2021

Главная
Информатика
Системы оптического распознавания документов

Содержание

2. Необходимость в системах распознавания символов С помощью сканера достаточно просто получить изображение страницы текста в графическом
3. Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition
4. Получение электронного документа Отсканировать изображение (с помощью ПО сканера); Распознать структуру размещения текста на странице: выделить
5. Методы распознавания символов Если исходный документ имеет типографское качество то задача распознавания решается методом сравнения с
6. ABBYY FineReader FineReader - омнифонтовая система оптического распознавания текстов. Это означает, что она позволяет распознавать тексты,
7. Оптимальное разрешение при сканировании обычный текст - 300 dpi мелкий шрифт (9 и менее пунктов)- 400-600
8. Системы распознавания рукописного текста преобразуют текст, созданный на экране карманного компьютера специальной ручкой, в текстовый компьютерный
9. Системы оптического распознавания форм При заполнении документов большим количеством людей (например, при сдаче (ЕГЭ)) используются бланки
10. Вопросы: Зачем нужны программы распознавания текста? Как происходит распознавание текста? Какие программы распознания текста вы знаете?
12. Скачать презентацию

Слайд 2

Необходимость в системах распознавания символов
С помощью сканера достаточно просто получить изображение

страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя будет его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.

Слайд 3

Программы распознавания текста
Преобразованием графического изображения в текст занимаются специальные программы распознавания

текста (Optical Character Recognition - OCR).
Наиболее распространенные системы оптического распознавания символов:
ABBYY FineReader
CuneiForm от Cognitive

Слайд 4

Получение электронного документа
Отсканировать изображение (с помощью ПО сканера);
Распознать структуру размещения текста

на странице: выделить колонки, таблицы, изображения и т.д.
Выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст;
Проверка орфографии (если необходимо);
Сохранение в файл или передача текста в другое приложение, например в Word.

Слайд 5

Методы распознавания символов
Если исходный документ имеет типографское качество то задача распознавания

решается методом сравнения с растровым шаблоном.
При распознавании документов с низким качеством печати используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.).

Слайд 6

ABBYY FineReader
FineReader - омнифонтовая система оптического распознавания текстов. Это означает, что

она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.

Слайд 7

Оптимальное разрешение при сканировании
обычный текст - 300 dpi
мелкий шрифт (9

и менее пунктов)- 400-600 dpi
Сканирование в сером режиме
осуществляется автоматический подбор яркости.
Сканирование цветных элементов (картинки, цвет букв и фона) – следует выбрать цветной тип изображения.

Слайд 8

Системы распознавания рукописного текста
преобразуют текст, созданный на экране карманного компьютера

специальной ручкой, в текстовый компьютерный документ.

Слайд 9

Системы оптического распознавания форм
При заполнении документов большим количеством людей (например, при

сдаче (ЕГЭ)) используются бланки с пустыми полями. Данные вводятся в поля печатными буквами от руки. Затем эти данные распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.

Слайд 10

Вопросы:
Зачем нужны программы распознавания текста?
Как происходит распознавание текста?
Какие программы распознания текста

вы знаете? Какими пользовались?
Какое разрешение является оптимальным для сканирования текста, изображений?

Системы оптического распознавания документов презентация

Содержание

Необходимость в системах распознавания символовС помощью сканера достаточно просто получить изображение

Программы распознавания текстаПреобразованием графического изображения в текст занимаются специальные программы распознавания

Получение электронного документаОтсканировать изображение (с помощью ПО сканера);Распознать структуру размещения текста

Методы распознавания символовЕсли исходный документ имеет типографское качество то задача распознавания

ABBYY FineReaderFineReader - омнифонтовая система оптического распознавания текстов. Это означает, что

Оптимальное разрешение при сканированииобычный текст - 300 dpi мелкий шрифт (9

Системы распознавания рукописного текста преобразуют текст, созданный на экране карманного компьютера

Системы оптического распознавания формПри заполнении документов большим количеством людей (например, при

Вопросы:Зачем нужны программы распознавания текста?Как происходит распознавание текста?Какие программы распознания текста

Похожие презентации