Главная

Wednesday, 15 February 2012

Про EXIF - ваши фото знают про вас больше !


    Ежедневно миллионы пользователей интернета создают, выгружают, загружают и просто делятся своими или не своими фотографиями и графическими рисунками в цифровом виде. Самый популярный формат для этого – JPEG. Его поддерживают все графические редакторы, просмотрщики и онлайн сервисы.

    Нередко можно встретить пользователя который даже не знает, что могут быть другие графические форматы, да и зачем? JPEG и его клоны вполне оправдывают свое назначение для обычного пользователя. Но мало кто, кроме фотографов и дизайнеров, знает что файл формата JPEG может содержать не только графику, но и так называемые метаданные. Т.е. то что можно прочесть только специальными программами. Метаданные могли бы иметь даже свой единый стандарт, но прогресс шагнул дальше и поэтому сейчас уже известно три стандарта для метаданных: EXIF, IPTC и XMP. Дабы никого не обидеть расскажем про всех, тем более что многие программные пакеты стараются иметь поддержку на чтение-запись для всех стандартов в одном формате JPEG.

    EXIF (англ. Exchangeable Image File Format) — стандарт, позволяющий добавлять к изображениям и прочим медиафайлам дополнительную информацию (метаданные), комментирующую этот файл, описывающий условия и способы его получения, авторство и т. п. Получил широкое распространение в связи с появлением цифровых фотокамер. Информация, записанная в этом формате, может использоваться как пользователем, так и различными устройствами, например, принтером. Стандарт EXIF является чрезвычайно гибким (например, позволяет сохранить полученные с приёмника GPS координаты места съёмки) и допускает широкое развитие — как правило, фотоаппараты добавляют к файлу информацию, специфичную только для данной конкретной камеры. Правильно интерпретировать такую информацию могут только программы от изготовителя фотоаппарата.


    IPTC (англ. International Press Telecommunications Council — «международный совет по прессе и телекоммуникациям») — организация со штаб-квартирой в Лондоне, Англия, состоящая из крупнейших новостных агентств и поставщиков новостей, целью которой является создание и улучшение технических стандартов для обмена новостями. В частности ими был разработан одноименный стандарт метаданных для цифровых изображений, который позволяет хранить различную содержательную информацию (в отличие от Exif - больше нацеленного на техническую информацию).


   Adobe XMP (eXtensible Metadata Platform, расширяемая платформа метаданных) - это технология фирмы Adobe, позволяющая пользователю добавлять дополнительную информацию в файлы, сохраняемые в форматах PNG, GIF, JPEG, Photoshop и TIFF. Технология XMP обеспечивает обмен метаданными между различными приложениями. Например, можно сохранить метаданные из одного файла в качестве шаблона, а затем экспортировать эти метаданные в другие файлы.


    В целом понятно для чего каждый стандарт по метаданным был создан. Существует большое количество программ для визуализации этих данных. Самые простые и весьма информативные из них две - Exif Pilot и PhotoME.

    Бесплатная программа Exif Pilot предназначена для анализа параметров съемки (EXIF данных цифровой камеры) в учебных целях и для поиска оптимальных параметров съемки. Например, можно посмотреть зависимость глубины резкости от фокусного расстояния. Программа позволяет просматривать, создавать и редактировать EXIF, EXIF GPS и IPTC данные. Кроме того, можно просматривать XMP данные. Вы можете импортировать EXIF и IPTC данные из XML, MS Excel и CSV форматов и экспортировать EXIF и IPTC данные в XML, MS Excel и CSV форматы, а также скопировать EXIF или IPTC данные в XMP данные или, наоборот, XMP данные в EXIF или IPTC данные.

   PhotoME (Photo Metadata Editor) поддерживает еще больше функций.


   Кстати формат JPEG не единый графический формат, который позволяет хранить метаданные. Поэтому обе программы позволяют вычитывать метаданные из следующих форматов:

Формат
Операция
JPEG
чтение и запись
TIFF
чтение и запись
PNG
чтение и запись
DNG
чтение и запись
NEF
чтение и запись
PEF
чтение и запись
CRW
чтение и запись
JP2
чтение и запись
PSD
чтение и запись
CR2
чтение
MRW
чтение
ARW
чтение
SR2
чтение
ORF
чтение
RAF
чтение
RAW
чтение
SP2
чтение
RW2
чтение
PGF
чтение

   По такому же пути пошли и разработчики широко известного в медицинских кругах формата DICOM. Файлы формата DICOM содержат еще большее количество специфичных метаданных, которые описывают УЗИ или МРТ снимки пацента. Но метаданные из DICOM-a не являются EXIF-данными поэтому для их чтения требуется специальное программное обеспечение. Лет десять назад мне довелось заниматься разработкой одного програмного комплекса для УЗИ-сканера HDI5000. Сканер по тем временам был очень продвинутым, имел встроенный web-сервер. У меня вдохновения хватило даже на разработку простенького DICOM-viewer.

  

    Ну и что мне с этих метаданных, - спросите вы, - если я не профессиональный фотограф ?

   Да, в принципе, ничего страшного, если не учитывать что эти метаданные могут заполняться без вашего прямого участия. С одной стороны если вы публикуете такое фото в интернете определенные метаданные говорят о вашем авторстве на фото, с другой стороны возможно они несут информацию, которую вы бы не хотели публиковать: время создания, геолокация. Также следует учесть что популярные фотосервисы, Google picasa например, активно вычитывают такие метаданные для категорирования ваших фотографий. Эти метаданные могут повлиять на продвижение вашей фотогалереи в поисковых запросах того же Google или Яндекса. Ну и самое последнее – многие параметры в списке метаданных можно изменить или удалить. Если вы работаете со своими фото это одно, а если некто с нехорошими намерениями сделал тоже самое с вашими фото, то это совсем другое.

   Вот наглядный пример. При изучении очередного JPEG фото обнаружил удивительный факт – preview фотографии НЕ соответствовал ее содержанию. После беглого анализа были обнаружены два JPEG-а в одном. Вполне возможно что на это повлияла операция прописывания EXIF-метаданных программным обеспечением сканера.




No comments:

Post a Comment

А что вы думаете по этому поводу?