- Как это работает?
- Как распознать текст с изображения?
- Загрузите изображения или PDF-файлы
- Язык и формат
- Для чего может использоваться программа?
- Какой текст распознается лучше всего?
- Как оптимизировать фото, скриншот, изображение для лучшего качества преобразования?
- Яндекс OCR
- Convertio
- Как пользоваться сервисом?
- Abbyy Finereader
- Как пользоваться
- Что можно делать с распознанным текстом?
- Распознавание текста онлайн без регистрации
- Online OCR
- Как пользоваться
- Free Online OCR
- Как пользоваться
- OCR Convert
- Как пользоваться
- Free OCR
- Как пользоваться
- I2OCR
- Как пользоваться
- Преимущества сервиса
- Перевод текста на другие языки
Как это работает?
OCR — это оптическое распознавание изображений, которое работает онлайн на tesseract.js. Технология идентифицирует и преобразует отсканированные печатные символы в электронный формат. Он легче распознается компьютером и другими программами. Грубо говоря, технология распознает текст, изучает его и переводит символы в код для последующей обработки данных. То есть физический документ становится машиночитаемым.
Программа OCR преобразует ваш документ в ч/б или двухцветную версию. Затем растровое изображение анализируется на наличие темных областей (текст) и светлых (фон). Далее темные области оцениваются как символы, распознаваемые следующим этапом технологии на предмет цифр или букв.
Как распознать текст с изображения?
Шаг 1
Загрузите изображения или PDF-файлы
Выберите файлы с компьютера, Google Диска, Dropbox или перетащите их на страницу
Шаг 2
Язык и формат
Выберите все языки, используемые в документе. Кроме того, выберите .doc или любой другой формат, который вам нужен в результате (поддерживается более 10 текстовых форматов)
Шаг 3
Для чего может использоваться программа?
Услуга полезна для тех, кому необходимо перевести текст с помощью сканера в электронный вид или
распознать текст на фото и получить его как текстовый документ. Технология часто используется специалистами, работающими с большими объемами литературы и физических документов. Набирать такой текст вручную невозможно.
Отсканированный текст может быть отредактирован и отформатирован пользователем в обычном редакторе. Это упрощает обработку больших объемов текста, изначально существовавшего вне электронного формата.
Какой текст распознается лучше всего?
Чтобы сервис распознавал текст без ошибок, он должен соответствовать следующим требованиям:
- отсканированная копия или четкое фото текста на камеру телефона;
- все симобили ровные;
- контраст между фоном и буквами;
- текст хорошо читается;
- фоновый текст монотонный.
Сервис не распознает рукописный текст, капчу и текст с немонотонным или шумным фоном.
Как оптимизировать фото, скриншот, изображение для лучшего качества преобразования?
Следуйте предыдущему пункту и старайтесь сделать максимальный контраст между фоном и символами, при этом фон должен быть максимально однотонным.
Яндекс OCR
Недавно открыл для себя этот сервис, и мне очень понравилось его качество и простота использования. В основном он предназначен для перевода загруженной картинки, но может использоваться и для распознавания текста с картинки. Регистрация не требуется, ограничений на количество изображений нет. В настоящее время он находится в стадии бета-тестирования.
Просто зайдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и нажмите «Открыть в Переводчике». Откроется как текст с картинками, так и перевод в нужном поле.
Перетащите изображение
Результат признания
Convertio
Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, дорога собанивает его технология. В общем мне не понравилось. Свидетельство ИНН, загруженное инфекция, он вообще не узнал, так как плохо различает текст среди картинок. Ни одно слово не было распознано! Для его проверки я вырезал из ИНН кусок текста и распознал его — это удалось сделать.
И иногда зависает в попытках что-то распознать.
Форматы ввода | pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp, webp |
Выходные форматы | Обычный текст, PDF, Word, Excel, Pptx, Djvu, Epub, Fb2, Csv |
Размер файла | ?, в зависимости от тарифа |
Ограничения | 10 страниц бесплатно, далее тарифы от 7 долларов. |
Качество | Сложно оценить — файл с картинами (ИНН) не разноранл современно, отдельно вырезанный кусок текста разноранл.
Замечено, что при распознавании сервиса иногда зависает, тк ваши картинки ставятся первыми в бесплатном тарифе. |
Как пользоваться сервисом?
Для вас технология работает просто:
- Сделайте снимок с помощью телефона/фотокамеры или отсканируйте текст, который необходимо распознать. Поддерживаемые форматы: jpg, jpeg, png, bmp, pbm.
- Нажмите кнопку «Скачать файл».
- Выберите файл на своем компьютере.
- Дождитесь обработки вашего документа — это займет не более 1 минуты.
- Скопируйте текст и сохраните результат в удобном формате:
- Чистый текст (txt)
- Адоб Акробат (pdf)
- Microsoft Word (docx)
- OpenOffice (неопр)
- и другие
Скачивание файлов с сайта в готовом/выбранном формате будет реализовано позже.
Вы можете распознать любое количество файлов бесплатно. Регистрация или оплата не требуется.
Abbyy Finereader
В Abbyy Finereader Online максимально удобный интерфейс, хорошее качество, но доступна только ознакомительная версия — за две недели можно распознать не более 10 страниц. (200 страниц в месяц стойт 299р). Для использования сервиса необходимо зарегистрироваться (вы можете войти через учетные записи социальных сетей). Кроме того, полученный текст можно перевести там на другой язык с помощью машинного перевода.
Бесплатно доступно не более 10 страниц за две недели.
Форматы ввода | PDF, TIF, JPEG, BMP, PCX, PNG |
Выходные форматы | Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub |
Размер файла | До 100 МБ |
Ограничения | 10 фотографий за две недели |
Качество | Качество распознавания улик оказалось хорошим. Например, как вы используете Online OCR — какие-то части документа лучше распознаются тем сервисом, а какие-то этим. |
Результат распознавания Finereader. (ФИО и город распознаются, но стираются вручную)
Читайте также: Как сбросить пароль на Windows 7 если забыли пароль?
Как пользоваться
- Скачать файлы
- Выберите ваш язык
- Выберите выходной формат
- Нажмите кнопку «Распознать
Что можно делать с распознанным текстом?
Теперь у вас есть большой выбор манипуляций с готовым текстом:
- копировать;
- проверьте орфографию;
- редактировать;
- делайте SEO-анализ текста для подсчета слов и символов;
- сохраните его в файл для дальнейшей работы с ним на вашем устройстве.
Распознавание текста онлайн без регистрации
Online OCR
Online OCR http://www.onlineocr.net/ – электронный калькулятор с сервисом Abbyy Finereader, который позволяет сохранять изображения в выходном формате вместе с текстом. Вот как выглядит распознанная версия с выходным форматом Word:
Результат распознавания в Online OCR (ФИО и дата розонный но стерты вручную)
Форматы ввода | PDF, TIF, JPEG, BMP, PCX, PNG, GIF |
Выходные форматы | Word, Excel, Adobe PDF, обычный текст |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Распознает не более 15 картинок в час без регистрации |
Качество | Качество распознавания улик оказалось хорошим. Например, как в Abbyy Finereader — какие-то части документа лучше распознаются тем сервисом, а какие-то — этим. |
Как пользоваться
- Загрузите файл (нажмите «Выбрать файл»)
- Выберите язык и формат вывода
- Введите капчу и нажмите «Конвертировать»
Ниже появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым
Free Online OCR
Бесплатное онлайн-распознавание текста https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).
Форматы ввода | PDF, DjVu JPEG, PNG, GIF, BMP, TIFF |
Выходные форматы | Text Plain (PDF и Word тоже можно скачать, но внутри них все тот же текст без форматирования и картинок). |
Размер файла | До 5Мб без регистрации и до 100Мб с ней |
Ограничения | Нет ограничений по количеству |
Качество | Качество распознавания доказательств низкое. |
Возможно распознавание как всего изображения, так и выбор части изображения для распознавания.
Как пользоваться
- Выберите файл или вставьте URL-адрес файла и нажмите «Предварительный просмотр» — картинка загрузится и появится в окне браузера
Не забудьте правильно указать язык. - Общая область как есть
- Выберите языки, на которых написан текст на картинке и нажмите кнопку «OCR
- Ниже появится окно с текстом
OCR Convert
Преобразование OCR http://www.ocrconvert.com/txt
Форматы ввода | Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Обычный текст |
Размер файла | Общий размер файла до 5 МБ за один раз. |
Ограничения | До 5 файлов одновременно. Сколько раз. |
Качество | Качество распознавания доказательств среднее. (ФИО разноранно прационально). Лучше, чем Google, но хуже, чем Finereader |
Как пользоваться
-
-
- Скачайте файл, выберите язык и нажмите кнопку «Обработать
-
-
-
- Появится ссылка на файл с распознанным текстом
-
Free OCR
Бесплатный OCR www.free-ocr.com разноран документ вхе всех.
Форматы ввода | PDF, JPG, PNG, BMP, GIF, TIFF |
Выходные форматы | Обычный текст |
Размер файла | До 6Мб |
Ограничения | В файле PDF распознается только первая страница |
Качество | Качество распознавания улик низкое – правильно распознаются только три слова. |
Как пользоваться
-
-
- Выберите файл
- Выберите языки на картинке
- Нажмите кнопку «Пуск
-
I2OCR
I2OCR http://www.i2ocr.com/ хороший сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество узнаваемых картинок. Но зависает на какое-то время.
Форматы ввода | JPG, PNG, BMP, TIF, PBM, PGM, PPM |
Выходные форматы | Text Plain (PDF и Word тоже можно скачать, но внутри них все тот же текст без форматирования и картинок). |
Размер файла | До 10Мб |
Ограничения | сеть |
Качество | Качество распознавания улик среднее — сравнимо с OCR Convert.
Заметил, что сервис временами не работает. |
Как пользоваться
- Выберите ваш язык
- Скачать файл
- Введите капчу
- Нажмите кнопку «Извлечь текст
- С помощью кнопки «Скачать» вы можете скачать выходной файл в нужном формате
Преимущества сервиса
- В несколько кликов вы получите текст с картинками, готовый к редактированию и обработке.
- Все строго конфиденциально и защищено сертификатом SSL+.
- Ваши файлы и распознанные тексты не сохраняются в сервисе и никак не оцениваются.
- Максимум 1 минута для распознавания любого файла.
- Используйте сервис без регистрации.
- Не требует установки на компьютер, вся работа выполняется в любом браузере онлайн.
Перевод текста на другие языки
Если вам нужны переводы большого количества обрабатываемых текстов, пишите нам на почту (contactistio@gmail.com), мы добавим эту функцию.