Текст с картинки: распознавание изображений

Работа на компьютере

Как это работает?

OCR — это оптическое распознавание изображений, которое работает онлайн на tesseract.js. Технология идентифицирует и преобразует отсканированные печатные символы в электронный формат. Он легче распознается компьютером и другими программами. Грубо говоря, технология распознает текст, изучает его и переводит символы в код для последующей обработки данных. То есть физический документ становится машиночитаемым.

Программа OCR преобразует ваш документ в ч/б или двухцветную версию. Затем растровое изображение анализируется на наличие темных областей (текст) и светлых (фон). Далее темные области оцениваются как символы, распознаваемые следующим этапом технологии на предмет цифр или букв.

Как распознать текст с изображения?

Шаг 1

Загрузите изображения или PDF-файлы

Выберите файлы с компьютера, Google Диска, Dropbox или перетащите их на страницу

Шаг 2

Язык и формат

Выберите все языки, используемые в документе. Кроме того, выберите .doc или любой другой формат, который вам нужен в результате (поддерживается более 10 текстовых форматов)

Шаг 3

Для чего может использоваться программа?

Услуга полезна для тех, кому необходимо перевести текст с помощью сканера в электронный вид или

распознать текст на фото и получить его как текстовый документ. Технология часто используется специалистами, работающими с большими объемами литературы и физических документов. Набирать такой текст вручную невозможно.

Отсканированный текст может быть отредактирован и отформатирован пользователем в обычном редакторе. Это упрощает обработку больших объемов текста, изначально существовавшего вне электронного формата.

Какой текст распознается лучше всего?

Чтобы сервис распознавал текст без ошибок, он должен соответствовать следующим требованиям:

  • отсканированная копия или четкое фото текста на камеру телефона;
  • все симобили ровные;
  • контраст между фоном и буквами;
  • текст хорошо читается;
  • фоновый текст монотонный.

Сервис не распознает рукописный текст, капчу и текст с немонотонным или шумным фоном.

Как оптимизировать фото, скриншот, изображение для лучшего качества преобразования?

Следуйте предыдущему пункту и старайтесь сделать максимальный контраст между фоном и символами, при этом фон должен быть максимально однотонным.

Яндекс OCR

Недавно открыл для себя этот сервис, и мне очень понравилось его качество и простота использования. В основном он предназначен для перевода загруженной картинки, но может использоваться и для распознавания текста с картинки. Регистрация не требуется, ограничений на количество изображений нет. В настоящее время он находится в стадии бета-тестирования.

Просто зайдите на https://translate.yandex.ru/ocr, загрузите картинку (можно перетащить) и нажмите «Открыть в Переводчике». Откроется как текст с картинками, так и перевод в нужном поле.

Перетащите изображение
Перетащите изображениеРезультат признания
Результат признания

Convertio

Convertio hhttps://convertio.co/ru/ocr/ работает своеобразно, дорога собанивает его технология. В общем мне не понравилось. Свидетельство ИНН, загруженное инфекция, он вообще не узнал, так как плохо различает текст среди картинок. Ни одно слово не было распознано! Для его проверки я вырезал из ИНН кусок текста и распознал его — это удалось сделать.

И иногда зависает в попытках что-то распознать.

Форматы ввода pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp, webp
Выходные форматы Обычный текст, PDF, Word, Excel, Pptx, Djvu, Epub, Fb2, Csv
Размер файла ?, в зависимости от тарифа
Ограничения 10 страниц бесплатно, далее тарифы от 7 долларов.
Качество Сложно оценить — файл с картинами (ИНН) не разноранл современно, отдельно вырезанный кусок текста разноранл.

Замечено, что при распознавании сервиса иногда зависает, тк ваши картинки ставятся первыми в бесплатном тарифе.

Как пользоваться сервисом?

Для вас технология работает просто:

  1. Сделайте снимок с помощью телефона/фотокамеры или отсканируйте текст, который необходимо распознать. Поддерживаемые форматы: jpg, jpeg, png, bmp, pbm.
  2. Нажмите кнопку «Скачать файл».
  3. Выберите файл на своем компьютере.
  4. Дождитесь обработки вашего документа — это займет не более 1 минуты.
  5. Скопируйте текст и сохраните результат в удобном формате:
    • Чистый текст (txt)
    • Адоб Акробат (pdf)
    • Microsoft Word (docx)
    • OpenOffice (неопр)
    • и другие

Скачивание файлов с сайта в готовом/выбранном формате будет реализовано позже.

Вы можете распознать любое количество файлов бесплатно. Регистрация или оплата не требуется.

Abbyy Finereader

В Abbyy Finereader Online максимально удобный интерфейс, хорошее качество, но доступна только ознакомительная версия — за две недели можно распознать не более 10 страниц. (200 страниц в месяц стойт 299р). Для использования сервиса необходимо зарегистрироваться (вы можете войти через учетные записи социальных сетей). Кроме того, полученный текст можно перевести там на другой язык с помощью машинного перевода.

Бесплатно доступно не более 10 страниц за две недели.

Форматы ввода PDF, TIF, JPEG, BMP, PCX, PNG
Выходные форматы Word, Excel, Power Point, Open Document, RTF, Adobe PDF, Text Plain, Fb2, Epub
Размер файла До 100 МБ
Ограничения 10 фотографий за две недели
Качество Качество распознавания улик оказалось хорошим. Например, как вы используете Online OCR — какие-то части документа лучше распознаются тем сервисом, а какие-то этим.

в
Результат распознавания Finereader. (ФИО и город распознаются, но стираются вручную)

Читайте также: Как сбросить пароль на Windows 7 если забыли пароль?

Как пользоваться

  1. Скачать файлы
  2. Выберите ваш язык
    fineReader-онлайн
  3. Выберите выходной формат
  4. Нажмите кнопку «Распознать
    fineReader-онлайн

Что можно делать с распознанным текстом?

Теперь у вас есть большой выбор манипуляций с готовым текстом:

  • копировать;
  • проверьте орфографию;
  • редактировать;
  • делайте SEO-анализ текста для подсчета слов и символов;
  • сохраните его в файл для дальнейшей работы с ним на вашем устройстве.

Распознавание текста онлайн без регистрации

Online OCR

Online OCR http://www.onlineocr.net/ – электронный калькулятор с сервисом Abbyy Finereader, который позволяет сохранять изображения в выходном формате вместе с текстом. Вот как выглядит распознанная версия с выходным форматом Word:

онлайн окр гостиница
Результат распознавания в Online OCR (ФИО и дата розонный но стерты вручную)

Форматы ввода PDF, TIF, JPEG, BMP, PCX, PNG, GIF
Выходные форматы Word, Excel, Adobe PDF, обычный текст
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Распознает не более 15 картинок в час без регистрации
Качество Качество распознавания улик оказалось хорошим. Например, как в Abbyy Finereader — какие-то части документа лучше распознаются тем сервисом, а какие-то — этим.

Как пользоваться

  1. Загрузите файл (нажмите «Выбрать файл»)
  2. Выберите язык и формат вывода
  3. Введите капчу и нажмите «Конвертировать»

онлайн распознавание

Ниже появится ссылка на выходной файл (текст с картинками) и окно с текстовым содержимым

Free Online OCR

Бесплатное онлайн-распознавание текста https://www.newocr.com/ позволяет выделить часть изображения. Выдает результат в текстовом формате (картинки не сохраняются).

Форматы ввода PDF, DjVu JPEG, PNG, GIF, BMP, TIFF
Выходные форматы Text Plain (PDF и Word тоже можно скачать, но внутри них все тот же текст без форматирования и картинок).
Размер файла До 5Мб без регистрации и до 100Мб с ней
Ограничения Нет ограничений по количеству
Качество Качество распознавания доказательств низкое.

Возможно распознавание как всего изображения, так и выбор части изображения для распознавания.

Как пользоваться

  1. Выберите файл или вставьте URL-адрес файла и нажмите «Предварительный просмотр» — картинка загрузится и появится в окне браузера
    Не забудьте правильно указать язык.
  2. Общая область как естьБесплатный онлайн-распознаватель
  3. Выберите языки, на которых написан текст на картинке и нажмите кнопку «OCRБесплатный онлайн-распознаватель
  4. Ниже появится окно с текстом

OCR Convert

Преобразование OCR http://www.ocrconvert.com/txt

Форматы ввода Многостраничные PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Обычный текст
Размер файла Общий размер файла до 5 МБ за один раз.
Ограничения До 5 файлов одновременно. Сколько раз.
Качество Качество распознавания доказательств среднее. (ФИО разноранно прационально). Лучше, чем Google, но хуже, чем Finereader

Как пользоваться

      1. Скачайте файл, выберите язык и нажмите кнопку «Обработать

ocr-конвертировать

      1. Появится ссылка на файл с распознанным текстом

ocr-конвертировать

Free OCR

Бесплатный OCR www.free-ocr.com разноран документ вхе всех.

Форматы ввода PDF, JPG, PNG, BMP, GIF, TIFF
Выходные форматы Обычный текст
Размер файла До 6Мб
Ограничения В файле PDF распознается только первая страница
Качество Качество распознавания улик низкое – правильно распознаются только три слова.

Как пользоваться

      1. Выберите файл
      2. Выберите языки на картинке
      3. Нажмите кнопку «Пуск

бесплатное распознавание

I2OCR

I2OCR http://www.i2ocr.com/ хороший сервис со средним качеством выходного файла. Отличается приятным дизайном, отсутствием ограничений на количество узнаваемых картинок. Но зависает на какое-то время.

Форматы ввода JPG, PNG, BMP, TIF, PBM, PGM, PPM
Выходные форматы Text Plain (PDF и Word тоже можно скачать, но внутри них все тот же текст без форматирования и картинок).
Размер файла До 10Мб
Ограничения сеть
Качество Качество распознавания улик среднее — сравнимо с OCR Convert.

Заметил, что сервис временами не работает.

Как пользоваться

  1. Выберите ваш язык
  2. Скачать файл
  3. Введите капчу
  4. Нажмите кнопку «Извлечь текст
  5. С помощью кнопки «Скачать» вы можете скачать выходной файл в нужном формате
      1. i2ocr

Преимущества сервиса

  1. В несколько кликов вы получите текст с картинками, готовый к редактированию и обработке.
  2. Все строго конфиденциально и защищено сертификатом SSL+.
  3. Ваши файлы и распознанные тексты не сохраняются в сервисе и никак не оцениваются.
  4. Максимум 1 минута для распознавания любого файла.
  5. Используйте сервис без регистрации.
  6. Не требует установки на компьютер, вся работа выполняется в любом браузере онлайн.

Перевод текста на другие языки

Если вам нужны переводы большого количества обрабатываемых текстов, пишите нам на почту (contactistio@gmail.com), мы добавим эту функцию.

Оцените статью
Блог про Steam