А АSaturday, 11 July 2015

Хитрости многостраничного TIFF.


Всем привет.

Нарисовался фокус с форматом ТIFF. Коллега показал файлик и спросил как его можно вставить в документ Word-a. Казалось что тут такого сложного, но дело в том что TIFF-файл оказался двух-страничным. Есть такая полезная фича в формате TIFF как многостраничность в пределах одного файла.

Т.е. файлик в документ Word-a вставляется, но только первая страничка, второй не видно никак. Штатные варианты в Windows 7 «Открыть с помощью» предлагает нам MS Paint, MS Picture Manager и Windows Media Center. Ни в MS Paint ни в MS Picture Manager наш TIFF не виден далее первой страницы. Более того даже операция экспорта из MS Picture Manager в JPEG не дает второй страницы! С Windows Media Center Microsoft пошутил.)




Уууу, как все запущено то в Windows 7 с форматом TIFF если больше одной страницы. Корректно работает только стандартный просмотр и печать. А нам то нужен файл для вставки в документ.


Возможные варианты решения:

1 – это выполнить печать не на бумагу, а в файл. Надо проверить поддерживает ли мой принтер такую опцию.

2- это выполнить OCR по отношению к файлу. Я проверил на автомате в Fine Reader Hot Folder. Обе страницы файла распознались на ура в две страницы формата DOC.

3- это задействовать инструмент третьей стороны, раз Windows 7 сплоховала. 
Например:

  • FastStone Image Viewer – бесплатен для некоммерческого использования с версии 3.5. Имеет встроенный эскизовый файловый менеджер. Также может использоваться как менеджер изображений.
  • AlternaTIFF – дополнение (плагин) к браузеру, предназначенный для открытия и отображения файлов формата TIFF. Поддерживает большинство популярны браузеров семейства ОС Windows, начиная с версии XP.
  • XnView позволяет читать около 500 форматов (включая многостраничные и анимированные еще форматы APNG, TIFF, GIF, ICO и т.д..). XnView предоставляет постраничный экспорт страниц TIFF-файла.


Вот такие дела.

А теперь сюрприз. От Windows 7. Вы что-нибудь слышали о компоненте Windows TIFF Ifilter ?

Windows TIFF IFilter предоставляет возможность поиска документов TIFF основанных на текстовом содержимом. При загрузке Windows TIFF IFilter выполняет оптическое распознавание символов (optical character recognition OCR), обрабатывая изображения TIFF, а затем предоставляет полученный текст для построения поискового индекса.

Windows TIFF IFilter выполняет поиск тех документов, которые содержат ясно распознаваемый текст (например, черный текст на белом фоне) и менее успешный для документов, которые содержат смешанное содержимое (например, нестандартные шрифты или текст, содержащий рисунки). Изображения низкого качества и смешанные языки могут отрицательно воздействовать на обработку OCR. В этом случае качество поисковых результатов снижается.

Вот так вот.  Windows 7 уже умеет искать нужный текст в изображениях TIFF. Осталось ее научить это же делать и в других форматах.))

No comments:

Post a Comment

А что вы думаете по этому поводу?

Версия на печать

Популярное

Медиа облако