Главная

Saturday, 11 July 2015

Хитрости многостраничного TIFF.


Всем привет.

Нарисовался фокус с форматом ТIFF. Коллега показал файлик и спросил как его можно вставить в документ Word-a. Казалось что тут такого сложного, но дело в том что TIFF-файл оказался двух-страничным. Есть такая полезная фича в формате TIFF как многостраничность в пределах одного файла.

Т.е. файлик в документ Word-a вставляется, но только первая страничка, второй не видно никак. Штатные варианты в Windows 7 «Открыть с помощью» предлагает нам MS Paint, MS Picture Manager и Windows Media Center. Ни в MS Paint ни в MS Picture Manager наш TIFF не виден далее первой страницы. Более того даже операция экспорта из MS Picture Manager в JPEG не дает второй страницы! С Windows Media Center Microsoft пошутил.)




Уууу, как все запущено то в Windows 7 с форматом TIFF если больше одной страницы. Корректно работает только стандартный просмотр и печать. А нам то нужен файл для вставки в документ.


Возможные варианты решения:

1 – это выполнить печать не на бумагу, а в файл. Надо проверить поддерживает ли мой принтер такую опцию.

2- это выполнить OCR по отношению к файлу. Я проверил на автомате в Fine Reader Hot Folder. Обе страницы файла распознались на ура в две страницы формата DOC.

3- это задействовать инструмент третьей стороны, раз Windows 7 сплоховала. 
Например:

  • FastStone Image Viewer – бесплатен для некоммерческого использования с версии 3.5. Имеет встроенный эскизовый файловый менеджер. Также может использоваться как менеджер изображений.
  • AlternaTIFF – дополнение (плагин) к браузеру, предназначенный для открытия и отображения файлов формата TIFF. Поддерживает большинство популярны браузеров семейства ОС Windows, начиная с версии XP.
  • XnView позволяет читать около 500 форматов (включая многостраничные и анимированные еще форматы APNG, TIFF, GIF, ICO и т.д..). XnView предоставляет постраничный экспорт страниц TIFF-файла.


Вот такие дела.

А теперь сюрприз. От Windows 7. Вы что-нибудь слышали о компоненте Windows TIFF Ifilter ?

Windows TIFF IFilter предоставляет возможность поиска документов TIFF основанных на текстовом содержимом. При загрузке Windows TIFF IFilter выполняет оптическое распознавание символов (optical character recognition OCR), обрабатывая изображения TIFF, а затем предоставляет полученный текст для построения поискового индекса.

Windows TIFF IFilter выполняет поиск тех документов, которые содержат ясно распознаваемый текст (например, черный текст на белом фоне) и менее успешный для документов, которые содержат смешанное содержимое (например, нестандартные шрифты или текст, содержащий рисунки). Изображения низкого качества и смешанные языки могут отрицательно воздействовать на обработку OCR. В этом случае качество поисковых результатов снижается.

Вот так вот.  Windows 7 уже умеет искать нужный текст в изображениях TIFF. Осталось ее научить это же делать и в других форматах.))

3 comments:

  1. а как разбить на отдельные страницы, у меня в одном тифе по 50 файлов

    ReplyDelete
  2. еще раз - у вас 50 чего, страниц?

    ReplyDelete
  3. Можно насканировать и 200 страниц! Еще и в двухстороннем режиме.

    А корректно редактировать такой файл может Microsoft Office Document Imaging ( MODI). Искать в ПУске или C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0\MSPVIEW.exe (Это для 32битного MS office 2007). Там же сканировалка.

    https://support.microsoft.com/ru-ru/help/982760/install-modi-for-use-with-microsoft-office-2010
    http://softokot.blogspot.com/2012/02/document-imaging-office-2010.html

    ReplyDelete

А что вы думаете по этому поводу?