Нарисовался фокус с форматом ТIFF. Коллега показал файлик и спросил как его можно вставить в документ Word-a. Казалось что тут такого сложного, но дело в том что TIFF-файл оказался двух-страничным. Есть такая полезная фича в формате TIFF как многостраничность в пределах одного файла.
Т.е. файлик в документ Word-a вставляется, но только первая страничка, второй не видно никак. Штатные варианты в Windows 7 «Открыть с помощью» предлагает нам MS Paint, MS Picture Manager и Windows Media Center. Ни в MS Paint ни в MS Picture Manager наш TIFF не виден далее первой страницы. Более того даже операция экспорта из MS Picture Manager в JPEG не дает второй страницы! С Windows Media Center Microsoft пошутил.)
Уууу, как все запущено то в Windows 7 с форматом TIFF если больше одной страницы. Корректно работает только стандартный просмотр и печать. А нам то нужен файл для вставки в документ.
Возможные варианты решения:
1 – это выполнить печать не на бумагу, а в файл. Надо проверить поддерживает ли мой принтер такую опцию.
2- это выполнить OCR по отношению к файлу. Я проверил на автомате в Fine Reader Hot Folder. Обе страницы файла распознались на ура в две страницы формата DOC.
3- это задействовать инструмент третьей стороны, раз Windows 7 сплоховала.
Например:
- FastStone Image Viewer – бесплатен для некоммерческого использования с версии 3.5. Имеет встроенный эскизовый файловый менеджер. Также может использоваться как менеджер изображений.
- AlternaTIFF – дополнение (плагин) к браузеру, предназначенный для открытия и отображения файлов формата TIFF. Поддерживает большинство популярны браузеров семейства ОС Windows, начиная с версии XP.
- XnView позволяет читать около 500 форматов (включая многостраничные и анимированные еще форматы APNG, TIFF, GIF, ICO и т.д..). XnView предоставляет постраничный экспорт страниц TIFF-файла.
Вот такие дела.
А теперь сюрприз. От Windows 7. Вы что-нибудь слышали о компоненте Windows TIFF Ifilter ?
Windows TIFF IFilter предоставляет возможность поиска документов TIFF основанных на текстовом содержимом. При загрузке Windows TIFF IFilter выполняет оптическое распознавание символов (optical character recognition OCR), обрабатывая изображения TIFF, а затем предоставляет полученный текст для построения поискового индекса.
Windows TIFF IFilter выполняет поиск тех документов, которые содержат ясно распознаваемый текст (например, черный текст на белом фоне) и менее успешный для документов, которые содержат смешанное содержимое (например, нестандартные шрифты или текст, содержащий рисунки). Изображения низкого качества и смешанные языки могут отрицательно воздействовать на обработку OCR. В этом случае качество поисковых результатов снижается.
Вот так вот. Windows 7 уже умеет искать нужный текст в изображениях TIFF. Осталось ее научить это же делать и в других форматах.))
3 comments:
а как разбить на отдельные страницы, у меня в одном тифе по 50 файлов
еще раз - у вас 50 чего, страниц?
Можно насканировать и 200 страниц! Еще и в двухстороннем режиме.
А корректно редактировать такой файл может Microsoft Office Document Imaging ( MODI). Искать в ПУске или C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0\MSPVIEW.exe (Это для 32битного MS office 2007). Там же сканировалка.
https://support.microsoft.com/ru-ru/help/982760/install-modi-for-use-with-microsoft-office-2010
http://softokot.blogspot.com/2012/02/document-imaging-office-2010.html
Post a Comment
А что вы думаете по этому поводу?