cellphonegoodru

Abbyy Finereader Pro 7.0

Abbyy Finereader Pro 7.0 10,0/10 9613 reviews

FineReader Pro для Mac Распознавание текста на Mac OS X. PDF Transformer Эффективная работа с PDF. ABBYY FineReader 14. Вы можете активировать ABBYY FineReader Professional Edition прямо. (для ABBYY FineReader 8.0 или ABBYY FineReader 7.0).

История Abbyy FineReader насчитывает уже более 20 лет. Юбилейный 2013 г.

Компания отметила выпуском полновесного (по сравнению с Express Edition от 2009 г.) Abbyy FineReader Pro для Mac, а через пару месяцев, в феврале 2014 г., свой «подарок» получили и пользователи Windows — Abbyy FineReader 12 Professional и Corporate. Напомню, что предыдущая версия появилась, а два с половиной года срок немалый — давайте разбираться, насколько существенны изменения. Общая информация Системные требования для новой версии совершенно не изменились.

Платформой может служить Windows или Windows Server начиная от XP и 2003 соответственно. Аппаратные запросы по нынешним временам и подавно скромны: процессор любой разрядности с частотой от 1 ГГц, оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро и т. п. Несколько увеличилась только потребность в дисковом пространстве — теперь для установки требуется не 700, а 850 МБ (плюс, по-прежнему, еще 700 МБ для рабочих файлов). Естественно, речь идет о минимальных требованиях; полностью возможности Abbyy FineReader 12 Professional раскроются только на сравнительно современных системах. В частности, напомню, что программа умеет эффективно распараллеливать обработку отдельных страниц, задействует при этом все процессорные ядра и загружает любой процессор почти на 100%. А вот к оперативной памяти она действительно не жадная, и даже остается 32-разрядной. Даже на основе этой скромной информации можно предположить, что перед нами результат эволюции.

Соответственно, в дальнейшем я сосредоточусь на описании изменений по сравнению с предыдущей версией, которые условно можно разделить на две основные группы: работа с программой (интерфейс, вспомогательные инструменты, удобство использования) и OCR (качество и производительность собственно распознавания). Работа с программой Abbyy FineReader 12 Professional демонстрирует некоторые доработки в части пользовательского интерфейса.

Это сразу же заметно на окне Задачи, которое по умолчанию открывается при запуске программы. Оно, очевидно, имитирует концепцию плиток Windows 8.x и адаптировано для управления пальцами, тем более, что в программе также поддерживаются и основные жесты вроде прокрутки и масштабирования. На деле же, изменения коснулись только «фасада», да и то отчасти — рядом с плитками соседствуют обычные элементы управления и в процессе настройки любого сценария придется иметь дело со стандартными диалоговыми окнами. Работать с ними пальцами довольно проблематично, особенно на экранах 8-10″, которые становятся популярными у Windows-планшетов. Представить же, что пользователь такого планшета, оснащенного камерой, может захотеть быстро «на ходу» ввести какой-то печатный документ, действительно несложно. Между тем вся история Windows, начиная с первой редакции Tablet PC, подтверждает бессмысленность адаптации к сенсорному управлению стандартного настольного интерфейса.

По-видимому, для этих целей гораздо правильнее создавать специальную оболочку, соответствующую всем канонам Metro, но использующую тот же «движок». Примером подобного решения служит Internet Explorer из Windows 8.x. К тому же, у Abbyy даже имеется некий задел в виде Abbyy FineReader Touch для Windows 8, который использует облачный сервис компании. Если же отвлечься от сенсорного ввода, то найдутся еще изменения данного класса — от вполне ожидаемого обновления окон открытия/сохранения документов, которые, среди прочего, обеспечивают простой доступ к облачным хранилищам (при наличии в системе соответствующего агента и его папки), до нескольких более важных и полезных.

Обработка страниц в Abbyy FineReader 12 Professional теперь выполняется в фоновом режиме. Это подразумевает отсутствие прежнего модального окна со статусом операций (теперь данную роль играет строка статуса внизу экрана) и, соответственно, наличие доступа к интерфейсу.

Таким образом пользователь имеет возможность работать с программой параллельно процессу распознавания (если он, конечно достаточно длительный), к примеру, копировать фрагменты полученного текста или даже корректировать разметку страниц — последние при этом будут поставлены в очередь и обработаны заново. В отличие от прежней версии, также не происходит перелистывания страниц по мере распознавания или при начальной загрузке документа, если автоматическое распознавание отключено. В Abbyy FineReader 12 Professional документ загружается и разбивается на страницы практически мгновенно, а их эскизы строятся только по мере ручного пролистывания в левой панели. Кроме всего прочего, тем самым экономятся вычислительные ресурсы, причем, довольно ощутимо на больших многостраничных документах. Остальные изменения данного класса не столь интересны, хотя и могут пригодиться в каких-то сценариях, поэтому о них кратко. Если нужно не обработать документ целиком, а лишь процитировать отдельные места, то можно отключить все автоматические операции и выбирать необходимые фрагменты любых типов, сразу же копируя их в буфер обмена — при этом анализ и распознавание будут выполняться на лету.

OCR Теперь давайте разберемся, какие улучшения произошли в механизмах собственно распознавания. Разработчики сообщают об очередном этапе совершенствования технологии ADRT, которая, анализирует и воссоздает логическую структуру документа. Декларируется, что она стала работать гораздо точнее, особенно с таблицами, списками, диаграммами. Продемонстрировать это адекватными примерами не так просто, но не невозможно. Вот, к примеру, результаты распознавания (с настройками по умолчанию) одной и той же страницы в Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу). Старая версия выделила и обработала только основной текстовый блок, возможно, из-за низкого качества оригинала сочтя остальные элементы «мусором».

Новая, напротив, корректно опознала список и попыталась его воссоздать. Результат, правда, не идеален: то что распознаны не все маркеры можно, опять же, отнести на качество изображения, но программа, по-видимому, все же не поняла, что перед ней содержание, иначе не интерпретировала бы цифры как буквы. Тем не менее, прогресс налицо и на более качественных оригиналах подобных претензий, возможно, не было бы. А вот как обрабатывается «неявная» таблица без разделительных линий — Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу). Хорошо видно, что старая версия, в отличие от новой, вообще не увидела здесь табличной структуры и ограничилась набором несвязанных между собой текстовых блоков. Не поленитесь щелкнуть на изображениях и сравнить результаты распознавания — у Abbyy FineReader 12 Professional он близок к идеалу.

К сожалению, так происходит не всегда и уже на соседних страницах Abbyy FineReader 12 Professional показал результаты, аналогичные Abbyy FineReader 11 Professional. Хотя именно ADRT должна была бы отследить одинаковые «шапки» и понять, что перед ней своеобразная перетекающая таблица.

Но все равно хорошо заметно, что обновленные алгоритмы обращают внимание на большее количество деталей чем ранее. В процессе тестирования Abbyy FineReader 12 Professional наблюдалась, к примеру, даже попытка интерпретировать как таблицу картинку с упорядоченным размещением на нем текстовой информации. Гораздо чаще также новая версия пытается воссоздавать различные диаграммы и схемы на основе фонового рисунка, а не из отдельных графических и текстовых блоков. Есть еще несколько новинок, призванных повысить в Abbyy FineReader 12 Professional качество распознавания. Как известно, одной из предпосылок для этого является качество оригинала, особенно если он получен с помощью не сканера, а фотокамеры. Именно поэтому в свое время в FineReader появились средства предварительной обработки оригиналов.

В новой версии их список расширен, добавились обрезка по краям страниц, осветление и выравнивание яркости фона, удаление цветных элементов. Последнее может пригодиться, к примеру, для обработки документов с печатями и штампами. Кроме того, теперь пользователь может подключать различные методы индивидуально.

Ну и наконец, один из наиболее животрепещущих вопросов для многих читателей: выросла ли скорость работы программы? Аргументированно ответить на этот вопрос, тем более с цифрами, не так-то просто — слишком много языков, каждый из которых имеет свои нюансы; слишком велико разнообразие оригиналов; слишком много неизвестных нам факторов влияния на работу алгоритмов.

Поэтому даже сами разработчики достаточно сдержанно говорят о росте производительности Abbyy FineReader 12 Professional на 10-15%. Подобные цифры обычно получаются по результатам обработки достаточно больших массивов документов и, соответственно, представляют собой нечто вроде «средней температуры по больнице». Поэтому полезно подробнее изучить какие-нибудь показательные частные случаи, к примеру, подобные двум следующим:. отсканированные в цвете с разрешением 300 dpi 10 страниц полноцветного буклета формата A4. Качество хорошее, языки русский и английский, макет сложный;. PDF с графическими изображениями 138 страниц книги, содержащей небольшое количество цветных и черно-белых иллюстраций, несколько таблиц.

Качество низкое (начиная, по-видимому, со «слепой» печати в бумажной книге), языки украинский и русский, макет простой. Оба документа распознавались в цветном режиме, а второй также и в черно-белом, что имело целью имитировать процесс подготовки электронной книги. Все настройки по умолчанию оставлялись без изменений, за исключением набора языков и, соответственно, режимов работы. В качестве тестового полигона использовался ПК с процессором i5-3450 и 8 ГБ памяти.

Результаты представлены в следующей таблице: Документ FineReader 11 Professional FineReader 12 Professional Первый прогон Повторные прогоны Первый прогон Повторные прогоны Буклет 0:15 0:11 0:13 0:09 PDF-книга (цветной режим) 2:30 2:05 2:05 1:40 PDF-книга (ч/б режим) 2:09 1:45 1:40 1:20 Как видно, для PDF ускорение даже превышает обещанные 15% — возможно, это как раз один из особых случаев, хорошо подходящих для последних оптимизаций в алгоритмах распознавания. При этом надо иметь в виду, что программы, вообще говоря, проделали разный объем работы. Взгляните хотя бы на иллюстрации выше к обработке таблиц — трудно сказать, какой из версий пришлось сложнее. Что касается количества ошибок, то оно у обеих версий практически совпадало, хотя было заметно, что иногда сомнения вызывают разные фрагменты и символы — это, по-видимому, является свидетельством тренировки алгоритмов. В любом случае, большинство неуверенно распознанных символов абсолютно корректно идентифицировалось с помощью словарей, а «грубые» ошибки (некорректная интерпретация специальных и декоративных символов, текста на графике и пр.) совпадали. Так что разницу и вовсе можно считать исчезающей.

Другой вопрос, насколько подобное повышение производительности вообще имеет значение? По-видимому, выигрыш в полминуты на 138 страницах, которые все равно нужно проверять и, возможно, корректировать, немногого стоит. Если работы, подобные тестовым заданиям, предполагается выполнять от случая к случаю, то о производительности можно точно не переживать.

Другое дело, если речь идет об автономной обработке больших объемов документов, которая доступна в Abbyy FineReader 12 Corporate. В таком случае экономия 15% времени уже вполне ощутима. Резюме Несмотря на то, что новый Abbyy FineReader 12 Professional не обещал ничего революционного, по крайней мере несколько изменений в нем заслуживают всяческой похвалы. Прежде всего, это усовершенствования технологии ADRT в части распознавания таблиц, диаграмм и вообще логической структуры страниц, что в некоторых случаях позволяет получать кардинально лучшие результаты, а также фоновый режим обработки, который открывает новые возможности для интерактивной работы с большими документами. Других изменений также немало, хотя они и менее значимы. Движение в сторону поддержки сенсорного управления сегодня безусловно оправдано, однако путь выбран порочный — обеспечить в одном интерфейсе одинаково удобную работу мышью и пальцами вряд ли возможно.

Впрочем, пока Windows-планшеты только пытаются пробиться на рынок, и у разработчиков из Abbyy еще есть время. Цены на Abbyy FineReader 12 Professional:. коробочная версия: 4990 руб.;. версия для скачивания: 4490 руб.;. обновление: 2690 руб.

Как обычно, ответ на вопрос «стоит ли менять старую версию на новую?» зависит от ситуации. В любом случае стоит учитывать, что жизненный цикл у FineReader достаточно продолжительный, и если какое-то из описанных улучшений играет для вас сколько-нибудь существенную роль, то за 2-3 года затраты на обновление наверняка окупятся — если не материально, то морально. Решить же для себя этот вопрос окончательно поможет.

. Назначение продукта и установка Программные приложения оптического распознавания данных часто обозначают просто - «OCR». Расшифровывается эта аббревиатура как Optical Character Recognition. Данные могут быть любого рода: книга, газета, журнал, факс - любой документ, содержащий текст, который надо перенести в компьютер. Имея на руках документ и необходимость перевести его в электронную форму, у пользователя есть выбор: перепечатать документ, восстановив его первоначальное оформление (таблицы, колонки, иллюстрации и так далее) или использовать сканер и OCR-приложение, что гораздо быстрее и проще, в случае если OCR-приложение распознает документ с достаточной точностью.

Знакомство с программой FineReader компании у меня началось ещё в 1995 году. Тогда компания ABBYY называлась более благозвучно, на мой взгляд, «BIT Software», а OCR-приложение имело порядковый номер 2.0. Версии 1.0 ни один из известных мне людей не видел, хотя, это совершенно не важно, ибо те же Windows реально начали использовать только начиная с версии 3.0. Хотел бы отметить сразу, что официальное название программы - ABBYY FineReader 1.0/2.0/3.0 и так далее.

Но, да простят меня сотрудники ABBYY, каждый раз название компании мы указывать не будем, потому, как и так ясно о чём идёт речь. «Двойка» в том далёком уже 1995 году умещалась на пяти дискетах, и требовала целых 10 мегабайт на жестком диске. В то время планшетный сканер был далеко не у всех, люди пользовались ручными сканерами. Сканирование длилось неимоверно долго, а дальнейшая «склейка» изображения (ручной сканер едва захватывал половину листа А4) не всегда давала корректный результат. Тем не менее, сканирование уже тогда позволяло значительно сократить время, требуемое на оцифровку текста, и, разумеется, чем введенное оцифрованное изображение распознавать было также важно. Реальных конкурентов у FineReader тогда, впрочем, как и сейчас, не было.

Да, был Presto! OCR 3.0, был CuneiForm, актуальной на тот момент версии 2.95 с дистрибутивом всего в 4,3 МБ от российского разработчика Cognitive Technologies. Но всё это были разработки с менее удобным интерфейсом, с несколько меньшей точностью распознавания, а Presto!, как продукт западной разработки, либо вовсе не работал с русским языком, либо результаты распознавания приходилось долго и усиленно править. Правда, стоит отметить, что CuneiForm приемлемо работал на медленных компьютерах, тогда как у FineReader с этим были некоторые трудности.

FineReader 3.0 Professional, вышедший в 1996 году на тот момент был уже весьма серьезным, законченным продуктом. Список протестированных и поддерживаемых сканеров демонстрировал 28 моделей, среди них были и аппараты Hewlett-Packard, для работы с которыми использовалась собственные разработки HP, что накладывало определённые трудности в работе для большинства программ распознавания. Программа уже умела использовать MMX-инструкции, и процесс распознавания на быстрых компьютерах был значительно ускорен. Дистрибутив OCR-приложения при этом можно было приобрести на дискетах, количество которых варьировалось от девяти до одиннадцати, в зависимости от версии программы. Разработчики Cognitive Technologies тоже не сидели сложа руки, и версия CuneiForm 97 v4.0 стала достойной альтернативой FineReader. Языки распознавания можно было подключать отдельно, а интерфейс был в некоторых случаях более продуманным и удобным, чем у продукта BIT Software.

Также новую версию CuneiForm выгодно отличала цена (но много ли в то время людей покупали лицензионные продукты?) и более эффективное использование оперативной памяти компьютера. Чаша весов заметно качнулась в сторону FineReader с выходом в начале 98-го года FineReader 4.0. Новая версия появилась как раз тогда, когда неплохой планшетный сканер уже стало возможно купить за 150 долл. «Четверка» стала одной из наиболее распространённых программ распознавания данных на компьютерах пользователей, ко всему прочему она стабильно работала под Windows NT 4.0, правда, это накладывало необходимость устанавливать Service Pack 3 в обязательном порядке.

Поэтому дистрибутив на диске занимал целых 320 мегабайт, но если покопаться, то можно было обнаружить, что 295 из них занимал SP3 для различных языков. Комментарий специалиста ABBYY: в четвёртой версии введена процедура повторной обработки неуверенно распознанных или нераспознанных слов. Завершив анализ страницы, система вновь обращалась к тем объектам, которые не удалось уверенно распознать при первом проходе. К этому моменту классификаторы успевали обучиться на материале всей страницы, и получали возможность распознать то, что «не далось» вначале. Четвертая версия FineReader запомнилась также обилием обновлений. Наиболее ходовыми стали версии 4.64 и 4.72. У многих, в том числе и у меня, 4.72 «жила» на компьютере дольше остальных.

На фоне этого выход CuneiForm 99 OCR v5.00 прошел практически незаметно. Во всяком случае, пользователей, работавших с новым продуктом Cognitive Technologies, было в разы меньше.

Заметным шагом в сторону «не продвинутых» пользователей был сделан в пятой версии программы. Мастер сканирования позволил полностью избавить от такой непонятной многим функции, как «сегментирование», интерфейс и навигация были максимально облегчены и упрощены.

Это дало возможность FineReader 5.0 стать излюбленным инструментом многих пользователей, а все основы, заложенные в этой версии, использовались во всех дальнейших. Что же касается лично меня, то я оставил себе версию 4.72, так как не заметил ощутимой разницы в скорости распознавания, а вот упрощение интерфейса воспринял, как многие автомобилисты в своё время восприняли автоматическую коробку передач у автомобиля, выискивая множество аргументов в пользу механики. FineReader 6.0 почему-то многим пользователям предыдущей версии не приглянулся, хотя, по большому счёту, заметных кардинальных внешних отличий от FineReader 5.0 в новой версии программы, ждать которой пришлось почти два года, по сути, не было. Основные изменения коснулись внутреннего устройства программы и непосвящённым пользователям были неочевидны. От раза к разу разработчики FineReader говорили об улучшении алгоритмов распознавания и о повышении, соответственно, скорости распознавания. Именно в шестой версии FineReader был наделён ещё двумя технологиями, получившими названия «адаптивной бинаризации» и «фильтрации текстур».

Обе они были направлены на улучшение распознавания «проблемных» документов, где текст расположен на цветном фоне или же имеет яркостные дефекты, образовавшиеся при передаче по факсу или в силу других причин. В предыдущих версиях FineReader необходимо было привести оцифровываемый документ в однобитный растровый формат, что несколько осложняло распознавание, когда необходимо было сосканировать документ с цветными фотографическими элементами, сохранив при этом первозданное форматирование. Применяемый в FineReader 6.0 механизм адаптивной бинаризации сам определял для каждого слова оптимальные параметры яркости и контрастности, с тем, чтобы после приведения к режиму Black & White/Lineart он стал как можно более четким.

После этого вступал в дело алгоритм очистки, который был реализован еще в четвёртой версии, он анализировал содержимое документа и удалял из него мелкие точки, оставляя лишь большие заполненные массивы, которые предположительно могли оказаться символами. Другим важным обновлением в FineReader 6.0 стала возможность работы с PDF-файлами, точнее, добавилась функция импорта из PDF, тогда как экспорт в PDF был реализован ещё в четвёртой версии. Теперь у пользователя появилась возможность не только распознавать данные, введённые с помощью сканера, но и файлы, которые, как правило, можно было лишь прочитать такими утилитами, как Adobe Acrobat. Это было весьма кстати, так как формат набрал заметную распространённость, а путей быстро перевести файл из формата PDF в тот же Microsoft Word почти не было. Люди часто просто распечатывали PDF-файлы, а потом сканировали распечатанное. Правда, разработчики ABBYY пошли тогда на хитрость, поддержка формата PDF была не «нативной». На самом деле FineReader 6.0 перед распознаванием с помощью бесплатной утилиты PDF2BMP преобразовывал файл в растровое однобитное изображение и далее работал как с сосканированными документами.

Для корректной передачи многоязычных документов вместе с новой программой поставлялся набор шрифтов Type 1 нескольких основных типов с расширенной таблицей символов. Была значительно усовершенствована и система предварительного редактирования распознанных страниц. Внутренний редактор теперь представлял собой не просто окно редактирования текста, а полноценное WYSIWYG-пространство, где отображался точный макет комплексного итогового документа (например, многоколоночный текст, отдельные текстовые блоки и так далее). Изменился и интерфейс программы. Начиная с того, что пиктограммы стали более «мультяшно-полноцветными», как в системе Windows XP, заканчивая появившейся настраиваемой панелью инструментов, позволяющей вынести наиболее часто используемые функции и убрать ненужные. Шестая версия два раза несколько перерабатывалась, судя по выпуску сервис-паков для программы.

Очередная, седьмая версия FineReader, вышла в сентябре 2003 года совершенно тихо и не заметно. Как всегда было объявлено о совершенствовании алгоритмов и скорости распознавания, более качественной работе с PDF-файлами, увеличении числа языков распознавания, поддержке формата XML и тесной интеграции с Microsoft Office 2003. Заявлено о совершенствовании системы проверки орфографии, а также «очень актуальной» для многих пользователей поддержке распознавания штрих-кодов, в том числе двухмерных типа PDF-417. Ниже вы сможете сравнить интерфейсы FineReader 6-ой и 7-ой версий.

Как можете заметить, отличий практически нет. ABBYY FineReader 6.0 ABBYY FineReader 7.0 Возможно, конечно, мной были упущены некоторые ключевые моменты, но, скачав Try&Buy версию FineReader 7.0, изучив список добавлений и изменений, веских оснований для перехода на новую версию обнаружено не было.

Кстати говоря, до седьмой версии можно обновить программу еще с версии 4.0 Standart или Professional. А что CuneiForm? В апреле 2000 года была выпущена обновлённая версия CuneiForm 2000 R2, на этом развитие проекта остановилось. С одной стороны - это понятно, поддерживать достойную конкуренцию FineReader очень нелегко, с другой - очень жаль, что рынок лишился единственного реального конкурента компании ABBYY, а только конкуренция в большей степени влияет на развитие рынка и технологий. В отсутствие конкуренции, компания ABBYY два года работала над следующей версией своего пакета, уже восьмой в ряде продуктов FineReader. Что нового в FineReader 8.0 Professional Edition?

Вот что говорит разработчик: « Новая версия сочетает в себе непревзойдённую точность распознавания, простоту использования и широкий диапазон настроек. Повышено качество распознавания факсов и документов, отсканированных с низким разрешением, на новый уровень выведено распознавание изображений, полученных с помощью цифровой камеры. Новый быстрый режим распознавания позволяет в несколько раз ускорить обработку качественно отпечатанных документов. Реализовано автоматизированное выполнение типовых задач распознавания, в том числе и по собственным сценариям. Быстрее и точнее стало преобразование PDF-файлов, добавлена функция защиты PDF-файлов паролем. Теперь в комплект поставки системы входит утилита для распознавания скриншотов». На сегодняшний день существует две версии ABBYY FineReader 8.0: Professional Edition и Corporate Edition.

Последняя отличается от «профессиональной» тем, что предназначена для работы в корпоративной сети с возможностью совместной работы над распознаванием документов. Повышенная точность распознавания включает в себя, помимо традиционного улучшения самого алгоритма распознавания, повышение точности распознавания «специализированных» текстов, а также распознавания цифровых фотографий. Повышение точности распознавания специализированных текстов обусловлено появившейся возможностью подключать при распознавании пользовательский словарь Microsoft Word, хотя, конечно, при его отсутствии преимущество этой функции будет неочевидно. Распознавание изображений, снятых с помощью цифровой камеры, возможно, покажется невесть каким достижением, но, тем не менее, стоит учесть, что с точки зрения OCR-системы, цифровые фотографии значительно отличаются от отсканированных изображений. На снимках нередко встречаются искажения: неравномерное освещение, плохая фокусировка, «изогнутые» строки на краях документа, и т.д. Кроме того, в файлах цифровых фотографий зачастую отсутствует информация о разрешении.

Возможность распознавания цветных изображений, заложенная еще в шестой версии, уже тогда позволяла делать данную нехитрую операцию с высокой долей успеха. Достоинство FineReader 8.0 в том, что тот научился отличать сфотографированные документы от отсканированных и применять при этом для обработки снимков новую адаптивную технологию распознавания. Учитывая куда большую распространённость цифровых фотоаппаратов, нежели сканеров, данная функция может быть весьма полезной для многих пользователей. Тем не менее, не стоит особо обольщаться.

Действительно приемлемых результатов можно добиться на приличной камере уровня 4 Мпикс. Освещение при съёмке должно быть достаточным и ровным, а фотография - четкой, без «размыленностей» и заметного шума. Отснятые фотографии имеет смысл сохранять в формате TIFF, а не применять JPEG-сжатие, дабы не вносить дополнительных искажений. Для достижения гарантированного результата имеет смысл использовать при съёмке штатив. Выполнив все эти требования, можно будет без особых проблем передавать изображения даже в разрешении 1280х1024 и тратить минимум времени на дальнейшую корректировку после распознавания.

Дальнейшее развитие в FineReader 8 получила технология распознавания PDF-файлов. В новой версии усовершенствована технология обработки PDF-файлов. Как известно, некоторые PDF-файлы содержат так называемый текстовый слой, причём его содержимое может не полностью соответствовать видимому на экране документу. FineReader 8.0 предварительно анализирует содержимое файла и для каждого текстового блока принимает решение: распознать его или извлечь соответствующий текст из текстового слоя. Также появилась возможность защиты PDF–файлов паролем. Пароль может быть установлен как на открытие файла, так и на прочие действия с документом (печать, извлечение содержимого, возможность редактирования, внесение комментариев, добавление/удаление страниц и др.). Предусмотрена возможность выбрать один из трёх уровней шифрования: 40-битный, 128-битный на основе стандарта RC4, 128-битный уровень, основанный на стандарте AES (Advanced Encryption Standard).

Добавлена возможность работы с дополнительной информацией PDF-файлов (заголовок, предмет, автор, ключевые слова). Эту информацию можно извлекать, редактировать или задавать заново по своему усмотрению При преобразовании PDF-файла и сохранении результатов распознавания в форматы Microsoft Word, PDF и HTML FineReader 8.0 по умолчанию восстанавливает все гиперссылки, найденные в исходном документе. К таковым относятся как ссылки на внешние источники (интернет-сайты, другие файлы, и т.п.), так и внутренние ссылки, ведущие на другие страницы того же документа. Одним из декларируемых моментов является то, что распознанные PDF-документы теперь можно сразу, без предварительного сохранения на диск, передавать в Adobe Acrobat.

Реальной пользы от данной функции, кроме как предпросмотр распознаваемого документа с дальнейшим сохранением в PDF придумать сложно. Теперь ABBYY FineReader 8.0 способен открывать графические файлы формата TIFF, сжатые по алгоритму LZW. Появилась возможность сохранять результаты распознавания в формат Microsoft Reader eBook (LIT), один из самых популярных форматов для создания электронных книг. При сохранении результатов распознавания в любом из форматов PDF, HTML, PPT, DOC, RTF, можно задавать цветность картинок – цветная, серая или чёрно-белая. Например, если в документе много цветных иллюстраций, может быть полезно сохранить некоторые из них как серые или чёрно-белые.

Это существенно уменьшит размер получившегося файла. Кроме того, появились дополнительные опции сохранения картинок при экспорте в PDF, HTML и PPT.

При сохранении в PDF теперь можно выбрать метод сжатия иллюстраций, при сохранении в HTML и PPT – формат файлов с изображениями (JPEG или PNG). Настройки цветности и качества можно изменять как для отдельной картинки, так и для всех страниц пакета. Автоматическая обработка документов - Процесс распознавания документов очень часто состоит из одного и того же набора операций. Например, сканирование, распознавание, сохранение распознанного текста в определённом формате. Для экономии времени пользователя в FineReader 8.0 предусмотрена возможность автоматизации однотипных действий. Для этого описано несколько наиболее распространённых сценариев обработки документов.

Для запуска сценария достаточно просто нажать одну кнопку — вся остальная работа будет выполнена системой автоматически, в соответствии с настройками сценария. Так, например, мы создали собственный сценарий, позволяющий сосканировать документ, распознать все страницы, проверить результат, сделать промежуточное сохранение в xls-файл и передать для работы в Microsoft Excel. При предварительной обработке изображений появилась специальная опция исправления разрешения. Эта настройка увеличивает точность распознавания в тех случаях, когда изображение отсканировано с низким разрешением, получено с помощью цифровой камеры или представляет собой скриншот экрана. Если обрабатывать такие изображения без предварительной коррекции, качество окажется невысоким.

Поэтому FineReader 8.0 при добавлении изображений в пакет проверяет каждое из них. В случаях, когда разрешение изображений оказывается неподходящим для системы оптического распознавания, автоматически производится его коррекция. При желании пользователь может устанавливать разрешение изображений вручную. В ABBYY FineReader 8.0 появилась функция обрезания изображения; предусмотрены автоматический и ручной режимы. Функция предназначена для удаления чёрных полей (они иногда возникают при сканировании книг), для приведения страниц пакета к одинаковому размеру, для удаления с фотографий документов областей, не содержащих текста. Одной из самых интересных новых функций, как мне кажется, стало «выпрямление» строк.

Зачастую при сканировании толстых книг и журналов строки текста вблизи сгиба оказываются искривлены. Схожая проблема встречается при фотографировании: строки искривляются вблизи краёв документа. В восьмой версии FineReader появилась функция, позволяющая устранить подобные искажения и увеличить, таким образом, качество распознавания. И, наверное, одно из наиболее весомых нововведений - поддержка технологий Intel Dual Core и Hyper-Threading, позволяющая повысить скорость распознавания в фоновом режиме при работе на современных процессорах Intel.

Для тех, кто ранее не работал с FineReader Установка ABBYY FineReader проста и достаточно стандартна. Вставьте установочный диск в дисковод, программа установки должна запуститься автоматически. Если пойти по пути выборочной установки, то новичка может поразить количество языков, доступных для распознавания. ABBYY FineReader 8.0 поддерживает 179 языков распознавания, включая 36 языков со словарной поддержкой. Пользователи, не нуждающиеся в распознавании, например, каталанского, эстонского или, скажем уйгурского языка, смело могут оставить лишь русский, английский, немецкий и французский языки.

Кому-то, возможно, понадобится итальянский или испанский. Можно распознавать тексты, написанные на формальных языках, таких как языки программирования (Pascal, Basic, C/C), можно работать с искусственными языками (эсперанто, идо, интерлингва).

В общем - есть простор для выбора. Процесс установки позволит вам выпить чашечку чая, даже если у вас мощный и быстрый компьютер. Сначала жесткий диск будет активно работать какое-то время, а потом уже пойдёт считывание данных с CD. После установки, запустив программу, она попросит у вас осуществить активацию программы.

Наиболее простой и оперативный способ - осуществить активацию через Интернет. В этом случае от вас не потребуется почти никаких действий и не составит никаких затруднений (разумеется, если программа приобретена легально). После регистрации вас также попросят провести еще одну активацию, которая позволит работать с программой ABBYY Screenshot Reader, поставляющейся в составе FineReader 8.0. Об этой утилите мы расскажем немного позднее.

Для тех, кто не знаком с процессом сканирования и распознавания документов, наиболее оптимальным вариантом будет воспользоваться помощью «Мастера Scan&read», он пошагово проведёт через все этапы ввода и распознавания данных, в зависимости от исходного документа и требуемого результата. Если вы случайно убрали «мастера», а как действовать дальше не представляете, то достаточно просто нажать на яркую кнопку «Scan&Read», либо на стрелочку правее от кнопки и выбрать нужное действие. Если у вас нет желания вдаваться в подробности сканирования, то это всё, что вам нужно знать. Остальное FineReader сделает за вас всё сам. Программа, пожалуй, как никогда ранее дружественна неопытному пользователю, и даже при минимуме знаний о работе сканера и соответствующих приложений можно добиться нужных результатов. Интерфейс Интерфейс программы почти не изменился со времён шестой версии, но это и понятно, функциональность и очевидность его достигла, пожалуй, своего оптимума еще в FineReader 6.0. Распознавание: шаг за шагом Более опытным пользователям, которые желают держать процесс распознавания под своим контролем, необходимо выполнить 4 шага.

Abbyy Finereader 7.0 Professional Edition Скачать С Торрента

Нажмите кнопку Сканировать (или Открыть, в зависимости от источника), чтобы начать сканирование. Откроется окно программы сканирования. В большинстве случаев оптимальным разрешением будет 300dpi, режим сканирования при этом лучше устанавливать, ориентируясь на то, какие элементы присутствуют в документе (только текст, текст с графиками или диаграммами, текст с иллюстрациями). Для того, чтобы отсканировать несколько страниц подряд, нажмите на стрелку справа от кнопки Сканировать, выберите команду Опции. И в открывшемся диалоге Опции отметьте пункт Сканировать несколько страниц.

В многостраничных PDF- и TIFF-файлах можно открыть не все страницы, а только те, что нужны вам. Для этого укажите номера (или диапазоны) страниц, разделяя их запятой, например: 1,2,8-12. Далее, сосканированное изображение (или изображения) необходимо распознать. Распознать можно как текущее изображение, так и все изображения, введенные в рамках данной сессии в программу со сканера. При этом помните, язык распознавания должен соответствовать языку, на котором написан документ. Для многоязычных документов можно указать несколько языков.

Однако не рекомендуется выбирать более двух-трёх языков. Пользователи, желающие распознавать и работать только с теми сегментами документа, которые нужны им, могут воспользоваться кнопкой «Анализ макета страницы». Наши читатели, которые давно работают с FineReader, эту кнопку знают больше как «Сегментирование». Проверку можно осуществить вручную, пользуясь встроенным WYSIWYG-редактором, который обеспечивает максимально точное воспроизведение всех деталей оформления документа: колонки текста, таблицы и картинки отображаются в окне редактора точно так же, как они были расположены на исходном изображении.

Abbyy

Это удобно: качество сохранения форматирования можно проверить сразу, не дожидаясь экспорта документа в Microsoft Word или веб-браузер. Также можно воспользоваться диалогом Проверка, в котором показывается слово с ошибкой, его изображение на исходном документе и варианты замены. При этом следует учитывать, что подсвечиваются и отображаются в диалоге «Проверка» те слова, в которых есть неуверенно распознанные символы, то есть такие, для которых оценка уверенности самой лучшей гипотезы из всех, выдвинутых системой, меньше некоего заданного уровня.

Вовсе не факт, что неуверенно распознанные символы - ошибочны. Для того, чтобы сохранить результаты распознавания в файл, нажмите на стрелку справа от кнопки Сохранить и выберите команду Сохранить страницы. Распознанный текст можно сохранить в следующих форматах: RTF, DOC, Word XML, XLS, PDF, HTML, PPT, TXT, DBF, CSV, LIT. Разумеется, можно передать распознанный документ в соответствующее приложение, чтобы продолжить работу с ним с использованием привычных инструментов.

Для каждого формата можно выбрать настройки сохранения. Они находятся на соответствующей закладке диалога Форматы (настройки формата PDF находятся на закладке PDF и т.д.). Для того чтобы открыть диалог Форматы, нажмите на стрелку справа от кнопки Сохранить, выберите команду Опции. И в открывшемся диалоге нажмите кнопку Форматы. Интеграция FineReader в Microsoft Word Интеграция FineReader в Microsoft Word позволяет обойтись без вызова «большого» FineReader, ограничившись лишь упрощённым интерфейсом.

Это может быть достаточно удобно, когда вы точно знаете, что за документ вам нужно распознавать и дальнейшая обработка будет более рациональна в Word. Вызов интерфейса осуществляется с помощью заметной красной кнопки, которая появляется на панели инструментов сразу после установки FineReader на компьютер. К слову сказать, старый значок FineReader - некий техногенный глаз (знакомый многим пользователям еще по четвёртой версии FineReader) был куда более стильным, на мой взгляд, чем это «красное нечто», появившееся в FineReader 8.0. Скорость распознавания Читателей, ожидающих увидеть в данном разделе данные о возросшей в несколько раз скорости распознавания, мы вынуждены огорчить. Замеры, проведенные с секундомером на скорость распознавания идеального (с точки зрения программ распознавания) текста, напечатанного на листе А4 лазерным принтером 12-ым шрифтом, а также статьи, напечатанной в газете мелким шрифтом с истёртыми в некоторых местах строчками, показали, что на современном компьютере скорость распознавания в шестой и восьмой версиях почти одинакова.

Выигрыш в скорости у FineReader 8.0 присутствует, но назвать его ошеломляющим нельзя. Экономия времени достигается в первую очередь за счёт более точного, а не более быстрого распознавания, а также при распознавании многолистовых документов. Тут FineReader 8.0 может помочь сэкономить полезные минуты, которые можно провести за другим занятием. ABBYY Screenshot Reader При помощи ABBYY Screenshot Reader вы можете создавать «снимки» экрана и распознавать находящиеся на «снимках» текст и таблицы. Результаты можно сохранять в файл, копировать в буфер обмена или экспортировать в Microsoft Word и Microsoft Excel. Как мы уже говорили, для работы с данной утилитой необходимо пройти активацию.

Поддержка

Сделано это, очевидно, в качестве одного из элементов средств защиты программы, но вот много ли потеряют люди, не воспользовавшиеся активацией в принципе, мы сейчас попробуем разобраться. Говоря простым языком, ABBYY Screenshot Reader - приложение, которое позволяет распознавать текст с экрана компьютера. Для запуска ABBYY Screenshot Reader в меню Пуск выберите Программы - ABBYY FineReader 8.0 - ABBYY Screenshot Reader. Внешний вид программы прост и незатейлив При нажатии на кнопку «Снимок» появляется сетка захвата, и если вы отметили некоторую область мышью, появится следующее окно: Далее появится окно, в котором необходимо указать язык распознавания скриншота и дополнительные настройки, в зависимости от наличия или отсутствия изображений в ранее выделенной области экрана. Качество распознавания далеко от идеального, но приемлемо для быстрой и срочной обработки документа, который по каким-то причинам невозможно сохранить в одном из распространённых форматов.

В качестве примера мы «захватили» часть информации с html-странички, открытой в браузере. И перевели её в Word как можно видеть, картинка, которая является также и ссылкой, распозналась некорректно. При распознавании «захваченной» области текста с иллюстрациями также выявляются некоторые недочёты. Так, если текст распознаётся корректно и правильно (даже если в слове допущена ошибка, как, например, со словом «тработает»), то иллюстрации передаются с искажениями. «Захват» и распознавание таблиц также не лишён недостатков. Результат перевода таблицы, отображённый браузером в html (слева) можно посмотреть на правой иллюстрации.

В общем и целом - всё неплохо и несколько упрощает задачу, если таблицу просто копировать через буфер и потом обрабатывать. Жаль, что некоторые досадные огрехи распознавания несколько портят общее впечатление. Так, первые 36 строк в первом столбце упорно преобразовывались в Excel как одна ячейка.

Abbyy Finereader 7.0 Professional Edition Скачать Бесплатно Русская Версия

Утилита достаточно интересна просто, потому что реализует новые возможности. Реальное же её применение неочевидно. Редко когда требуется распознавать данные, уже представленные в цифровом виде. Выводы Новый продукт (а, точнее, обновлённый) ABBYY получился, как и ранее, - качественным и функциональным.

Продуманный интерфейс, обилие настроек и возможностей, позволят пользователю эффективно экономить время, переводя в цифровой вид различные источники. Улучшенная работа с файлами формата PDF существенно расширяет функционал программы. Есть ли резон переходить на FineReader 8.0, с более ранних версий?

Если ваша работа не ограничивается лишь сканированием пары страниц в месяц, а подразумевает интенсивную работу с документами, а также и с файлами в формате PDF, то резон есть, и он очевиден. Если для решения всех ваших задач вам хватает чётвёртой или пятой версии, то, как говорится, «лучшее - враг хорошего». Я свой выбор сделал, ABBYY FineReader 8.0 занял достойное место в списке программ, которые необходимо установить в первую очередь, после очередной переустановки Windows:-).