Читать онлайн Фотопейзаж и компьютер бесплатно
Зачем я написал эту книжку
Если посмотреть, какие книги по цифровой фотографии лежат на прилавках магазинов (включая интернет-магазины), то можно увидеть, что основная масса книг – это мастер-классы фотографов мирового уровня (многие книги идут под лозунгом «Как заурядный снимок, сделанный мыльницей, превратить в обалденную фотографию»). При этом особым достоинством считается отсутствие технических деталей (цитирую по аннотациям):
• «без сложных объяснений и технического жаргона», «Это не книга о теории фотографии, переполненная терминами и заумными рассуждениями» (Келби Скотт. Цифровая фотография. Том 1, издательство Вильямс, 2017).
• «Никаких диаграмм и графиков, никаких сложных терминов» (Кэролл Генри. Сними свой лучший портрет. Советы 50 легендарных фотографов, издательство Бомбора, 2018).
Но как же быть, если в настройках камеры попался пункт «Выберите тип колориметрического отображения»? Ставить или нет галочку в строке «CIECAM02» окна модуля управления цветом операционной системы компьютера?
А первый вопрос, который задает серьезный графический редактор, это – «в каком цветовом пространстве будете работать?». Я уже не говорю о количестве инструментов редактора – их сотни. Какими из них можно попробовать решить конкретную проблему с фотографией, а какие применять бессмысленно?
Можно, конечно, использовать значения параметров, заданные по умолчанию. Но тогда, если что-то получится не так, всегда будет оставаться сомнение, нельзя ли было исправить положение, выбрав другие, более подходящие значения?
Что можно сделать с фотографией с помощью инструментов, появившихся совсем недавно, например, «многомасштабная сшивка фрагментов» (multi-resolution blending) или «вейвлет-анализ»? Или «редактирование изображения по Пуассону» (Poisson Image Editing)?
Все возрастающую необходимость объяснять теорию видят, конечно, и авторы классических книг для фотографов. И вот уже Майкл Фриман излагает основы теории цвета (Работа с цветом в цифровой фотографии, издательство Добрая книга, 2014) и описывает способы создания снимков с широким динамическим диапазоном (HDR, high dynamic range). То же самое делает и Дэвид Найтингейл (HDR-фотография. Полное практическое руководство, издательство Добрая книга, 2012). А Том Энг описывает основы алгоритмов работы с изображениями (Все секреты цифровой фотографии. Новейшее исчерпывающее руководство, издательство АСТ, 2013. В аннотации сказано, что «это единственное руководство, сочетающее полный набор профессиональных методов с обстоятельным изложением основ работы с изображением»).
Вопросов, в которых приходится разбираться фотографам, масса: какие программы ему могут пригодиться еще, кроме Photoshop и Lightroom; зачем нужны разные виды профилей мониторов и фотокамер, какую проекцию выбрать при построении панорамы, и т. д. и т. п.
В этой книжке я и захотел дать ответы на эти и многие другие вопросы, имеющие важное практическое значение для фотографа.
Если несколько лет тому назад можно было безболезненно игнорировать непонятные места в теории пост-обработки, то с каждым годом таких мест становится все больше, и неизбежно наступает время, когда приходится сказать себе: «Все! Пора, наконец, мне в этом разобраться!». Данная книжка поможет это сделать.
Какой должна была получиться эта книжка
Часть информации, содержащейся в этой книжке, сочинил я сам. Это некоторые приемы цифровой обработки фотографий, методики фотосъемки панорам, популярное изложение некоторых теоретических вопросов. И, конечно, это мои фотографии пейзажей и рисунки, нарисованные моими компьютерными программками.
Но, все же, существенная часть информации, изложенной в этой книжке, естественно, встречается в том или ином виде и в других книгах и в интернете. Поэтому необходимо было сформулировать отличия моей книжки от других источников. Отличия, ради которых и стоило трудиться.
Замысел был таков.
Во-первых, отличия в подборе материала. Основной упор в книжке должен быть сделан на те важные для практики вопросы, которые либо отсутствуют, либо затронуты недостаточно подробно или разбросаны по многим книгам о цифровой фотографии. В частности, нужно было описать последние достижения в области цифровой обработки изображений, многие из которых только начинают (в 2019 году) реализовываться в виде инструментов графических редакторов, и продемонстрировать их применение на своих фотографиях.
Во-вторых, объем книжки должен быть небольшой. Это должна была получиться не энциклопедия, а, скорее, краткий справочник приемов, инструментов, алгоритмов, программ и интересных идей, лежащих в основе цифровой обработки изображений. Полноту изложения нужно было принести в жертву. Поэтому я нигде (кроме одного параграфа) не привожу пошаговые инструкции (они есть во многих книгах, например, Майкл Фриман. Творческая обработка фотографий и специальные эффекты, издательство Добрая книга, 2013). Я не показываю читателю скриншоты программ, за исключением важных фрагментов, без которых нельзя обойтись (гистограммы и цветовые кривые). Я нигде не обсуждаю чисто творческие вопросы (этому справедливо посвящена основная масса книг по фотографии), тем более, что я не очень высокого мнения о художественных достоинствах своих снимков. Рассказывая о применении компьютерных программ, я не пересказываю их инструкции (мануалы). Цифровая обработка показана на примерах только фотоснимков пейзажей (не портретов, не макро), тоже с целью ограничить объем книжки.
В-третьих, изложение теоретических вопросов должно быть понятно и не-математикам. Основные идеи всех алгоритмов нужно объяснить «на пальцах», без формул.
Я хотел, чтобы так было и, по-моему, кое-что из этого удалось.
Для кого написана эта книжка
Работая над этой книжкой, я в первую очередь ориентировался на читателей, влюбленных в фотографию и не упускающих случая углубить свое понимание принципов, лежащих в основе обработки изображений. И, как следствие, обогатить свой арсенал технических средств, с помощью которых можно добиваться желаемых результатов.
Вторая группа читателей, которым будет интересна эта книга, – это пользователи графических редакторов, работающие с другими видами изображений, но сталкивающиеся с проблемами, похожими на изложенные выше. Думаю, что даже самые опытные пользователи фотошопа найдут в этой книге что-то новое для себя, просто потому, что хороший графический редактор позволяет осуществлять немыслимое количество различных способов обработки изображений, и все эти способы попробовать одному человеку нереально. Более того, бо́льшая часть из возможных способов обработки, скорее всего, так никем и не будет когда-либо попробована!
И, наконец, среди читателей этой книжки я вижу творческих людей других специальностей, ценящих возможность расширить свой кругозор.
Везде, где было возможно, я пытался копать вглубь и выяснять детали, которые обычно отсутствуют в популярных книгах на эти темы. Я старался не повторять то, что уже написано во многих других книгах, кроме необходимого минимума.
Может быть, кто-то спросит: зачем писать о том, что каждый может запросто найти в интернете? Ответить легко. Если бы эта книжка содержала все потоки информации, выдаваемые интернет-поисковиком на все затронутые в ней вопросы, то ее невозможно было бы читать. Информация из интернета была мною отфильтрована (удалена ошибочная, малосущественная, чересчур упрощенная, заумная и т. д.), сверена, приведена к «общему знаменателю», обдумана, структурирована, согласована с личным опытом и изложена с единых позиций. Эта работа заняла много месяцев, доставила массу удовольствия и, я думаю, окажется полезной.
Предвижу еще один вопрос. Зачем я нашпиговал текст английскими словами, разве это не будет раздражать читателей, не знающих языка?
Во-первых, упоминание соответствующих английских терминов помогает уточнить, что имеется в виду. Во-вторых, эти термины можно использовать при поиске в англоязычном интернете. В-третьих, это облегчает понимание пунктов меню и названий кнопок тех компьютерных программ, которые не имеют интерфейса на русском языке. Да и перевод на русский бывает такой, что приходится лезть в английский интерфейс, чтобы понять, что имеется в виду. В-четвертых, в настоящее время большая часть научно-технической терминологии попадает в русский язык из английского языка. В любом случае полезно знать, откуда взялось то или иное слово.
В этой книжке нет ни одного изображения, скачанного из интернета. Все рисунки и графики нарисовал я сам, вручную или с помощью написанных мною программ. Все фотографии, препарированные на страницах этой книжки, снял тоже я, чем обеспечил себе отсутствие возможных претензий в свой адрес со стороны оскорбленных авторов.
Об авторе
Я – фотограф-любитель и программист-профессионал. Первую цветную фотографию пытался напечатать в 1960 году. Первую программку написал в 1966 году на втором курсе МФТИ на автокоде БЭСМ-06.
А еще не могу жить без путешествий, точнее, турпоходов. В основном, пешком, в группе или в одиночку. Реже – на плотах, на байдарках, на лыжах, на велосипеде. Обошел и объехал всю Кировскую область и Подмосковье, был в Забайкалье, на Урале, на Тянь-Шане, на Алтае, на Балхаше, на Белом море, в Карелии, на Северной Двине, в Крыму, в Молдавии, в Узбекистане, Киргизии.
А началось все с первой вылазки, которую совершил пяти лет, вместе с дружком такого же возраста. Прошли километра два по соснячку, пожарили хлеб на палочке на костре и благополучно вернулись домой.
Первую цифровую камеру купил в 2012 году и начал осваивать пост-обработку. Не только практику, но и теорию. Путешествовал и фотографировал пейзажи. Провел за редактированием снимков на компьютере сотни часов. Накачал много программ из интернета и попробовал их. Накопил опыт, которым стоит поделиться.
Вступление. Воспоминания о пейзаже
Вы когда-нибудь пробовали понять, что приходит в голову, когда пытаешься вспомнить какой-нибудь пейзаж (любой)? Я пытался, но до конца так и не понял, что происходит.
Года два тому назад в солнечный день я поднимался по крутой тропинке, идущей вверх по склону высокого берега Вятки недалеко от Котельнича. Тропинка шла по хвойному лесу и делала неожиданные резкие повороты. Я ничего не фотографировал, был в этом месте впервые в жизни и с тех пор там не бывал. И вот, что сейчас мне удается вспомнить об этом месте. Первый ракурс: тропинка идет справа налево и снизу вверх, вокруг высокие ели, контрастное освещение, ярко-зеленые участки хвои и глубокие тени, трава по краям тропинки. Второй ракурс: резкий поворот направо и вверх по гребню (дальше по прямой идти нельзя, крутой спуск, почти обрыв), после поворота, слева – то ли пень, то ли коряга. И третий ракурс: сверху, как будто с дрона, видна тропинка до и после поворота. Откуда взялся третий ракурс? Даже с дрона нельзя было увидеть под таким углом обе части тропинки одновременно, деревья бы заслоняли. А где остальные части тропинки? Не запомнились или не могу сейчас вспомнить?
То, что вспомнилось, представляется смутно, без деталей (не вижу, что лежит на тропинке). Наклон и направление тропинки как будто бы правильные, в остальных отношениях это вполне могла бы быть тропинка совсем из другого пейзажа или, вообще, какая-то абстрактная тропинка. Вспоминаю запах смолы и утреннюю прохладу. Но, скорее всего, опять, смолистый запах и прохладу вообще. Явно не распределение температурных полей и не градиенты ароматов в тот конкретный момент. Говорят, зрительная память у разных людей развита по-разному. У меня – явно плохо. Но уверен, что нас таких много. Я не помню наизусть даже то, в какую сторону открывается дверца аккумуляторного отсека в моей камере.
Если бы я тогда сделал снимок, например, крутого поворота тропинки, то сейчас мог бы посмотреть, был ли это пень или коряга, и какие веточки и шишки лежали на тропинке. В случае удачной фотографии мне, возможно, вспомнился бы дополнительно шум ветра в вершинах и то ощущение мягкой податливости, которое возникает, когда наступаешь на раскрытую сосновую шишку. А что почувствует человек, которого не было тогда со мной, и который увидит этот снимок? Если мой замысел был в том, чтобы передать мои тогдашние ощущения, и если бы снимок удался, то, возможно, он удивится крутизне тропинки, неожиданности поворота, ощутит прохладу, запах и шум ветра в вершинах елей. Но это уже будут его представления о прохладе, запахе и шуме ветра.
Допускаю, что кто-нибудь из городских жителей может спутать торжественный соборный шум вершин елей и сосен, который возникает при обтекании потоком воздуха иголок и возникающей при этом турбулентности воздушных струек, с шумом ветра в кронах лиственных деревьев, состоящим из множества пришептываний и пришлепываний.
Я видел, давно, правда, какой-то художественный фильм, в котором кадры с движущимся грузовым поездом сопровождались звуками движущегося пассажирского поезда. Это, конечно, был «ляп». Сходные «ляпы» при рассматривании фотографии могут возникнуть в мозгу зрителя, и фотограф, по-видимому, тут бессилен. Но хорошо бы что-то понимать, что происходит в голове у зрителя, который рассматривает мой фотопейзаж.
Эту книжку я начну как раз с этого. В первой главе проследим процесс обработки визуальной информации зрительной системой человека. В последние годы в этой области открыты удивительные вещи! Неправильно, что многие фотографы лучше понимают, как картинку обрабатывают их камеры, чем как это делают их головы!
Во второй главе посмотрим, каким образом обработка зрительной информации может быть описана математически. Затем в общих чертах коснемся аппаратуры, применяемой при обработке изображений (третья глава).
В четвертой главе рассмотрим компьютерные программы для обработки изображений.
В пятой главе опишем современные алгоритмы обработки изображений (без формул, только на уровне идей).
И, наконец, главы с шестой по восьмую посвящены собственно практическому применению современных методов обработки пейзажных фотографий.
Глава 1
Система «глаз-мозг» и фотоаппарат
Фотограф создает цифровую фотографию с помощью камеры и компьютера, а фотография оценивается автором и зрителем с помощью глаз и мозга. Знание деталей каждого из процессов этой цепочки не только интересно, но и полезно. В частности, обрабатывая снимок на компьютере, хочется не только знать, что нужно сделать для улучшения изображения, но и понимать почему.
В этой главе я собрал информацию о том, как человек воспринимает изображение. Точнее, о том, как человек получает и обрабатывает информацию об изображении. Ограничиваясь только сведениями, которые могут быть интересны фотографу. Я не биолог, поэтому почерпнул все эти сведения из литературы, приведенной в конце книжки, и, конечно, из интернета.
Что происходит, когда человек рассматривает реальный 3D-пейзаж? Световые лучи от источников света и отраженный от предметов свет попадают в глаз, преобразуются сетчаткой в нервные импульсы, которые передаются в мозг, обрабатываются там и, наконец, появляется осознание того, что же мы видим в данный момент. Рассмотрим этот процесс подробнее, но только с точки зрения обработки информации, не очень углубляясь в биологические детали.
1.1. Движения глазного яблока
Поле зрения одного глаза приблизительно характеризуется следующими углами (отсчитываются от оси глаза, когда он смотрит прямо перед собой):
• 90° – по горизонтали, в сторону, противоположную носу;
• 60° – по горизонтали, к носу;
• 60° – вверх;
• 65° – вниз.
Эти углы будут меньше, если учитывать не простую индикацию света, а способность различать трехмерность, или, тем более, цвет. Самое большое поле зрения для синего цвета, а самое маленькое – для зеленого. У некоторых птиц поле зрения по горизонтали достигает почти 360°. Для сравнения: угол поля зрения объектива: 9° и менее – сверхдлиннофокусный, от 40° до 60° – нормальный объектив, более 80° – сверхширокоугольный.
Когда то, что видно в поле зрения одного глаза, проецируется на сетчатку, наиболее резко воспринимается только та часть картинки, которая попадает на центральную ямку сетчатки (фовеа). Менее резко – та часть, которая попадает на желтое пятно (макула), в центре которого находится фовеа. И совсем нерезко и почти бесцветно – остальная часть. Если сравнить размеры перечисленных областей сетчатки (соответственно, 0.4 мм, 5 мм, 22 мм) (или в углах: 1° 40', 18° 20', 135° по горизонтали), то становится понятно, что, несмотря на такое широкое поле зрения, в каждый момент времени каждый глаз резко воспринимает только очень небольшой кусочек всей картинки.
Мы этого обычно не замечаем, потому что глаза сканируют пейзаж скачкообразно, совершая быстрые движения (саккады, от двух до нескольких десятков угловых минут) примерно три-четыре раза в секунду, перемещаясь от одной привлекающей внимание детали к другой. В первую очередь привлекают внимание движущиеся или сильноконтрастные детали, а также участки, которые мозг по какой-то причине считает важными (например, исходя из своего предыдущего опыта). Какие-то другие части пейзажа могут остаться непросканированными. Что именно сканируется и в каком порядке – зависит еще и от целевой установки смотрящего (что ему важно увидеть или не пропустить). Благодаря саккадам самая важная часть изображения рассматривается с большим разрешением с помощью проектирования на фовеа по частям.
В начале рассматривания нового пейзажа саккадические прыжки длинные, а периоды фиксации взгляда – короткие. Затем периоды фиксации удлиняются, а прыжки укорачиваются. С возрастом периоды фиксации укорачиваются, а прыжки удлиняются. Полагают, что это происходит благодаря накопленному опыту наблюдения.
Между саккадами в момент фиксации взора происходит дрейф – медленное и плавное смещение взора (от 3 до 30 угловых минут). Периоды дрейфа прерываются быстрыми движениями небольшой амплитуды (менее 1 ÷ 2 угловых минут) и случайного направления (микросаккады). Микросаккады обычно возникают во время длительной фиксации (несколько секунд). И на все это накладывается еще и тремор – дрожание глаза с амплитудой 20–40 угловых секунд и с частотой 30–250 герц (измерение спектра частот тремора используется в диагностике состояния мозга, в частности, при проведении анестезии).
Роль микросаккад до конца невыяснена, но предполагают, что они нужны для компенсации смещения глаза из-за дрейфа и для поддержания изображения на сетчатке в движении (благодаря микросаккадам нейроны поддерживаются в активном состоянии из-за того, что неподвижные детали картинки перемещаются по их рецептивным полям, подробнее см. в следующем параграфе). Как показали эксперименты, если бы не было мелких движений глаз, мы бы видели только движущиеся предметы (как, например, видят лягушки). В этом случае при просмотре неподвижной сцены после начала каждой фиксации взгляда примерно через несколько секунд изображение бы полностью исчезало, а после перевода взгляда на другую точку новая картинка снова бы появлялась на несколько секунд.
Продолжительность фиксации взгляда примерно равна одной четверти секунды, но может быть разной, в зависимости от того, сколько времени нужно мозгу для завершения анализа соответствующей мгновенной картинки («кадра»). Интересно, что эти времена приблизительно кратны одной четверти секунды. Возможно, четверть секунды – это как раз именно то время, которое необходимо для выполнения алгоритма обработки глазом и мозгом одного «кадра». Поскольку во время выполнения саккадического прыжка информация от рецепторов сетчатки в мозг не передается, то нейроны мозга для обработки предыдущего «кадра» имеют дополнительное время. Еще один источник дополнительного времени – мигание.
1.2. Обработка зрительного сигнала рецепторами сетчатки
Свет, попадающий в глаз, проходит сквозь роговицу и хрусталик. Роговица и хрусталик играют роль двухлинзового объектива, причем линза-хрусталик имеет изменяемую кривизну и неравномерный коэффициент преломления, максимальный в центре и минимальный на периферии. Преломление света в роговице больше, чем в хрусталике, потому что коэффициенты преломления воздуха и роговицы различаются сильнее, чем коэффициенты преломления роговицы и хрусталика.
Изображение, сфокусированное роговицей и хрусталиком, попадает на сетчатку. Сетчатка занимает примерно две трети внутренней поверхности глазного яблока, а ее толщина – около 0.3 мм. Изображение на сетчатке глаза воспринимается рецепторами: палочками и тремя видами колбочек: L-колбочки, M-колбочки, S-колбочки (от Long, Middle, Short wavelength). В сетчатке одного глаза находится до 125 миллионов палочек и до 7 миллионов колбочек (распределение по типам L: M:S – 32:16:1). Размер наружной части рецептора, содержащей светочувствительный пигмент, равен 1 ÷ 2 микрон для палочки или 1 ÷ 5 микрон для колбочки.
Плотность рецепторов в центральной части сетчатки: 60000–150000 на мм2. Чувствительность: 5–14 фотонов для палочки и в 100–1000 раз больше для колбочки.
Максимум спектральной чувствительности палочек – 510 нм. Три вида колбочек имеют максимумы спектральной чувствительности 570 нм. (L), 544 нм. (M) и 443 нм. (S), то есть, приблизительно в области красных, зеленых и синих цветов.
Под слоем рецепторов находится слой клеток, содержащий черный пигмент меланин, поглощающий прошедший сквозь слои сетчатки и уже не нужный свет. Кроме того, эти клетки играют важную роль в процессе восстановления обесцвеченного светочувствительного пигмента палочек и колбочек.
Интересно, что у животных, ведущих ночной образ жизни, этот слой клеток, наоборот, имеет высокий коэффициент отражения, что повышает чувствительность сетчатки к свету (отраженный свет снова проходит через слой рецепторов в обратном направлении), но, разумеется, за счет ухудшения качества изображения. Именно поэтому глаза таких животных светятся в темноте (отраженным светом, конечно).
Под действием света в палочках обесцвечивается пигмент родопсин (зрительный пурпур), а в колбочках – пигмент йодопсин (точнее, хлоролаб, эритролаб, цианолаб в зависимости от вида колбочки). Причем количество прореагировавшего пигмента зависит от яркости приблизительно логарифмически (закон Вебера – Фехнера), или, точнее, как степенная функция (закон Стивенса).
Пигмент находится в элементах рецепторов, называемых дисками для палочек и полудисками для колбочек. В каждом рецепторе таких (полу)дисков около тысячи. Диски и полудиски с обесцветившимся пигментом рассасываются, и в рецепторе возникают новые с восстановленным пигментом. Полная замена дисков и полудисков одного рецептора осуществляется примерно за 10 дней. Интересно, что обновление колбочек происходит после захода солнца, а палочек – на восходе.
Когда рецептор не освещен, он активен и постоянно выделяет нейротрансмиттер глутамат (химическое вещество, в других слоях сетчатки используются и другие нейромедиаторы, например, глицин). А соседний нейрон сетчатки, получающий этот нейротрансмиттер, постоянно выдает импульс за импульсом, которые передаются далее по аксону. После поглощения фотона количество выделяемого вещества уменьшается, то есть, свет фактически выключает рецептор. Плавное изменение освещенности рецептора вызывает постепенное изменение количества выделяемого вещества в рецепторе и, соответственно, частоты импульсов соседнего нейрона.
В отличие от сенсоров цифровых камер свойства разных участков сетчатки неодинаковы. Эта неоднородность заключается в следующем.
Во-первых, рецепторы в сетчатке распределены неравномерно. В центре фовеа палочек нет совсем. По мере удаления от центра фовеа плотность палочек возрастает и достигает максимума (около 150000 на мм2) примерно при угле 25°, а затем снова падает до 40000 на мм2 на периферии. Плотность колбочек максимальна (около 150000 на мм2) в центре фовеа (за исключением S-колбочек, которых тут нет), затем резко падает и при углах, больших 25°, становится меньше 5000 на мм2.
Во-вторых, часть сетчатки, а именно, макула, покрыта желтым фильтром (клетки содержат пигменты лютеин и зеаксантин), что изменяет в этом месте спектральную чувствительность колбочек (фильтр поглощает избыток синего и ультрафиолетового света).
В-третьих, фоторецепторы в центре сетчатки и на ее периферии по-разному соединены с нейронами сетчатки, о чем ниже.
Края сетчатки не дают даже черно-белого зрительного ощущения, а только служат датчиком движения, который вызывает рефлекторный поворот глаз к движущемуся объекту.
Эти факты объясняют, почему при достаточно ярком освещении разрешающая способность глаза максимальна в фовеа и падает по мере приближения к периферии. Если же яркость объекта настолько мала, что чувствительность колбочек оказывается недостаточной и работают только палочки, разрешающая способность, наоборот, минимальна в фовеа и достигает максимума при угле около 25°. При такой низкой яркости цвета уже не различаются. Таким образом, для того чтобы рассмотреть слабый источник света в условиях низкой освещенности, нужно смотреть не прямо на источник, а на 25° в сторону.
Поскольку в центре фовеа S-колбочек почти нет, то синие цвета в этом месте сетчатки определяются плохо. Вдобавок, коротковолновая часть света еще и ослабляется желтым пигментом, присутствующим в клетках макулы. С другой стороны, синяя компонента изображения в центре фовеа обычно и так находится не в фокусе из-за продольных хроматических аберраций. Поэтому потери информации из-за отсутствия центре фовеа S-колбочек немного.
В 1991 году был обнаружен еще один тип фоторецепторов сетчатки глаза: светочувствительные ганглионарные клетки типа ipRGC (intrinsically photosensitive retinal ganglion cells), или mRGC (melanopsin-containing retinal ganglion cells), содержащие светочувствительный пигмент меланопсин. Подробнее об этом – в следующем параграфе.
Интересно, что почти у всех млекопитающих, кроме приматов, типов колбочек только два, а не три. Так что собаки и кошки видят цвета совсем по-другому, чем мы. Еще интереснее, какие цвета видят сумчатые и некоторые птицы, у которых четыре типа колбочек, включая колбочки, реагирующие на ультрафиолет! Даже у некоторых людей, в основном у женщин, редко, но встречается четвертый вид колбочек.
В сетчатке кошек вместо центральной ямки имеется зрительная полоска. А вот у ястреба центральных ямок – две. Я где-то читал, что если добыча, сбитая соколом в воздухе, падает на землю, то он ее не подбирает. Я думал, что он такой гордый или брезгливый. Теперь я думаю, что он ее просто не видит или не воспринимает как съедобное – она неподвижна. Над моим дачным участком часто охотится пустельга. Один раз я, и правда, нашел на земле сбитого им дрозда со сломанной шеей. Но, с другой стороны, сороки воруют блестящие предметы, значит, они их видят.
1.3. Обработка зрительного сигнала в нейронах сетчатки
Сигналы от рецепторов поступают в нейроны, несколько слоев которых располагаются в сетчатке над слоем с рецепторами. То есть, свет, попадающий на рецепторы, сначала проходит сквозь тонкий слой нейронов. Функции этих нейронов и связи между ними очень интересны, но из нескольких десятков типов нейронов сетчатки я упомяну только один, а именно, ганглиозные клетки. Аксоны ганглиозных (или ганглионарных) клеток образуют зрительный нерв и уходят глубоко в мозг (бо́льшая часть – в наружное коленчатое тело (часть таламуса)). По этим аксонам в мозг передается информация о том, что спроецировалось на сетчатку.
В отличие от плавного изменения выходного сигнала рецептора (концентрации нейротрансмиттера), выходной сигнал нейрона представляет собой импульс. Если входной сигнал меньше порогового значения, нейрон молчит. Если входной сигнал превысит порог, нейрон выдает импульс. После импульса нейрон некоторое время не способен генерировать импульсы. Таким образом, аналоговая информация, содержащаяся во входном сигнале нейрона, кодируется в частоту выходных импульсов.
Один рецептор сетчатки через промежуточные нейроны может быть связан с десятками ганглиозных клеток. А каждая ганглиозная клетка получает сигналы только от одной колбочки, если та находится в фовеа, или же от нескольких тысяч рецепторов, находящихся на периферии. Это снова приводит к тому, что в фовеа разрешение выше, чем на периферии, но чувствительность к свету в фовеа меньше.
Информация от приблизительно 130 миллионов фоторецепторов преобразуется в серии нервных импульсов, передающихся в мозг по зрительному нерву, состоящему из примерно 1 миллиона волокон (аксонов ганглиозных клеток сетчатки). То есть, информация, содержащаяся в (амплитудно-модулированной) степени освещенности фоторецепторов, сжимается приблизительно в 130 раз и преобразуется в частотно-модулированный сигнал, поступающий в мозг. Передаваемая информация может заключаться не только в частоте импульсов, но и в величине задержки между появлением стимула и первым импульсом, и в величине фазового сдвига между первым импульсом и фоновыми осцилляциями головного мозга.
Участок сетчатки, с которого ганглиозная клетка сетчатки собирает информацию, называется ее рецептивным полем. Это примерно 1 мм2. Ученые, обнаружившие рецептивные поля, получили Нобелевскую премию по физиологии/медицине в 1981 году (David H. Hubel, Torsten N. Wiesel).
Ганглиозные клетки бывают разных типов. Пространственно оппонентные ганглиозные клетки ведут себя так. Если рецептивное поле равномерно освещено, то такая ганглиозная клетка не возбуждается. А вот если яркость в центре рецептивного поля и на его периферии различается более чем на 2 % (приблизительно), то клетка выдает серию импульсов.
Аналогично, спектрально оппонентная «красно-зеленая» ганглиозная клетка возбуждается только тогда, когда на ее рецептивном поле сигналы от красных в центре и зеленых на периферии колбочек различаются.
Таким образом, в мозг уходит не «попиксельная» информация об изображении на сетчатке, а данные о наличии яркостных и цветовых границ и, возможно, что-то еще.
Нейрон, возбудившийся в результате соответствующего стимула в его рецептивном поле, не только передает сигнал в мозг, но и увеличивает пороги возбуждения соседних нейронов. Это приводит к подчеркиванию границ и усилению контраста (знакомые слова для фотографов!).
В отличие от других нейронов сетчатки, светочувствительные ганглиозные клетки реагируют на свет непосредственно, без помощи палочек и колбочек. И не на границы, а на среднюю освещенность. Полагают, что сигналы от этих клеток используются мозгом для управления сужением зрачка и в качестве сигналов, помогающих понять, день или ночь сейчас.
При рассмотрении природной сцены при каждом саккадическом прыжке может происходить значительное изменение яркости и контраста. Адаптация к яркости осуществляется главным образом в сетчатке. При этом изменения в яркости, происходящие во время перехода от одного участка сцены к другому, эффективно устраняются. Адаптация к контрасту начинается в сетчатке и продолжается в зрительной коре. Чувствительность к контрасту максимальна для низко контрастных областей и минимальна для высоко контрастных.
1.4. Обработка зрительного сигнала в наружных коленчатых телах
Преобразованное описанным выше способом изображение поступает в мозг, причем большинство (70 %) волокон зрительного нерва заканчивается в наружном коленчатом теле, которое служит первичным зрительным центром. В каждом полушарии мозга находится свое НКТ (по 1.8 миллионов нейронов). НКТ имеет слоистую структуру, состоящую из 6 слоев. Нервные импульсы от одного глаза поступают в четные слои НКТ, а от другого глаза – в нечетные. При этом проекции одной (любой) точки зрительного поля находятся в слоях НКТ строго одна под другой. А соседние точки зрительного поля проецируются на соседние точки НКТ в каждом слое. Таким образом, изображение на сетчатке проецируется на слои нейронов НКТ. При этом область фовеа занимает непропорционально большую площадь.
В свою очередь, НКТ соединяется с первичной зрительной корой головного мозга нервными волокнами, которые образуют зрительную лучистость.
Раньше считали, что НКТ служит всего лишь передаточным звеном между нейронами сетчатки и зрительной корой. Однако обнаружилось, что НКТ получает информацию не только от сетчатки, но и от слоя VI зрительной коры (25–30 %) и от мозгового ствола (brainstem), который, в частности, управляет вниманием и движением глаз. Особенно интересно наличие обратной связи: результат обработки изображения несколькими слоями зрительной коры снова передается на участок первичной обработки картинки, которым является НКТ (не считая нейронов сетчатки).
Таким образом, функционирование НКТ управляется высшими отделами мозга с помощью нервных волокон, идущих во все слои НКТ из коры головного мозга, что явно было бы не нужно для простой ретрансляции сигнала. И действительно, обнаружилось, что если рецептивные поля нейронов сетчатки постоянны, то рецептивные поля нейронов НКТ изменяются в соответствии с данными, поступающими в НКТ из зрительной коры головного мозга.
Если сравнить нейроны сетчатки и нейроны НКТ, то получим следующее. Сетчатка дает множественные картинки окружающего мира, полученные эффективно и с хорошей чувствительностью. НКТ использует контекст (уже обнаруженные свойства изображения в целом) для повышения информативности данных, передаваемых в зрительную кору. Активность обратной связи возрастает, например, когда текстура изображения вне рецептивного поля отличается от структуры внутри.
Нейроны НКТ значительно различаются между собой по времени задержки реакции на входной сигнал. Гораздо сильнее, чем нейроны сетчатки. Благодаря этому осуществляется обнаружение изменений картинки во времени. Нейрон сетчатки осуществляет выделение пространственных границ в кусочке изображения, попавшего в его рецептивное поле, а нейрон НКТ обнаруживает изменение картинки в своем рецептивном поле, происходящее с течением времени. Таким образом, в зрительную кору поступает информация о пространственно-временной структуре изображения на сетчатке. Это позволяет не передавать в мозг малосущественную часть данных.
Активность нейронов НКТ возрастает с повышением внимания и возбуждением, чего не наблюдается в сетчатке. НКТ помогает зрительной системе направлять внимание на наиболее важный объект (например, по информации от слуховой системы). И наоборот, активность НКТ меняется при переносе внимания от одной части сцены к другой.
Исходя из структуры НКТ, можно предположить, что именно здесь начинают анализироваться различия в изображениях, полученных правым и левым глазами, то есть, связанные с бинокулярностью зрения. Информация об этих различиях используется для следующего:
• управления сведением глаз при рассматривании близко расположенного предмета,
• определения расстояния до предмета,
• управления фокусированием глаз по «вычисленному» расстоянию до предмета,
Функции НКТ, связанные с управлением движением глаз:
• подавление передачи зрительной информации во время саккад,
• различение движения среды от самодвижения,
• переход от системы координат, связанной с сетчаткой, к системе координат, связанной с головой.
Подавление сигнала от сетчатки начинается примерно за 100 мс до начала саккады. То, что подавление начинается до начала саккады, говорит о том, что этим процессом не могут управлять ни сетчатка, ни сигналы от мышц глаза.
Во время микросаккад происходит повышение активности НКТ, что может говорить о том, что в это время осуществляется уточнение и обогащение информации, повышение резкости границ.
Кроме того, полагают, что НКТ осуществляют что-то, похожее на разложение изображения по пространственным частотам. Происходит это с помощью управления размерами рецептивных полей нейронов НКТ. Сразу же после саккадического прыжка НКТ передает в первичную зрительную кору изображение, полученное с помощью больших рецептивных полей (низкие пространственные частоты, грубая картинка). Затем рецептивные поля постепенно уменьшаются и в мозг передаются изображения, состоящие из более высоких пространственных частот (детали). И так до тех пор, пока рецептивные поля не уменьшатся до минимума. После этого передача информации от НКТ в зрительную кору прекращается до следующего саккадического прыжка.
Несмотря на массу данных о строении НКТ на уровне нейронов, остается много непонятного, например, почему объем и структура НКТ мало изменились с течением эволюции, по сравнению со зрительной корой? Почему мало изменились слои нейронов сетчатки – предположить можно. Потому что они находятся перед рецепторами, и если бы их стало больше, зрение ухудшилось бы.
1.5. Обработка сигнала в зрительной коре
Зрительная кора, занимающая затылочную часть головного мозга, имеет толщину около 2 мм и состоит из 140 миллионов нейронов в каждом полушарии. Зрительная кора разделяется на первичную (V1, стриарную, то есть, полосатую, так как под микроскопом видны полоски, идущие параллельно поверхности) и экстрастриарную зрительную кору. Последняя состоит из более чем 20 зон, обозначаемых V2. V3, V4, V5, IT (inferior temporal cortex), MT (middle-temporal cortex), MST (medial superior temporal cortex), PIT, AIT и других. Первая зона экстрастриарной коры называется вторичной зрительной корой (V2). Общая поверхность первичной коры у человека – 30000 мм2.
Типов нейронов зрительной коры насчитывается несколько сотен. Зоны V1 и V2 содержат около 70 % всех нейронов зрительной коры. Все зрительные зоны, как и другие зоны коры головного мозга в целом, содержат по шесть слоев нейронов, а основной вход в зону происходит в нейроны четвертого слоя.
Количество связей между первичной зрительной корой и последующими слоями в 25 раз больше количества волокон зрительной лучистости. Таким образом, нейроны следующего слоя могут формировать свои рецептивные поля из комбинаций рецептивных полей нейронов предыдущего слоя.
Также как и в НКТ, соседние участки поля зрения «проецируются» на соседние же участки первичной зрительной коры, причем сигналы от небольшого участка поля зрения поступают в небольшой участок зрительной коры. Центральная ямка сетчатки глаза проецируется на пространство коры в сотни раз большее, чем периферия сетчатки. Кроме того, сигналы от соседних участков сетчатки обрабатываются мозгом более или менее независимо (по крайней мере, на начальных стадиях обработки).
Если ганглиозные клетки сетчатки реагировали на наличие границы, то нейроны в слоях зрительной коры реагируют на более сложные виды картинок в своих рецептивных полях. Чем дальше расположен нейрон от сетчатки по пути, по которому идет визуальная информация, тем выше его избирательность. Так в зоне V1 существуют нейроны, реагирующие только на границу, идущую в определенном направлении, и не реагирующие на границы, идущие в других направлениях. То же самое для движения в определенном направлении. Также найдены клетки коры, возбуждающиеся только при поступлении информации о конце границы (линии).
По мере перехода к более глубоким слоям нейронов вид картинок, на которые нейроны реагируют, усложняется, а избирательность увеличивается. Есть нейроны, реагирующие только на определенные пространственные частоты. В более глубоких слоях зрительной коры существуют нейроны, возбуждающиеся только тогда, когда в их рецептивных полях находится изображение лица (может быть даже только определенного лица).
Зрительная кора, как и другие регионы коры головного мозга, состоит из миллионов вертикальных колонок нервных клеток по нескольку сотен нейронов в колонке. Диаметр колонок – 30–50 микрон. Между колонок первичной зрительной коры размещаются шарообразные области диаметром около полмиллиметра (цветовые шарики). Если двигаться параллельно поверхности V1, то будут чередоваться колонки, получающие информацию от левого и от правого глаза. То есть, изображения левого и правого зрительных полей не объединяются, а обрабатываются параллельно. Если двигаться перпендикулярно к поверхности V1, то направление, к которому чувствительны нейроны, будет плавно меняться от горизонтального к вертикальному и обратно.
Первичная зрительная кора служит своеобразной «линзой», с помощью которой остальные зрительные зоны получают визуальную информацию об окружающем мире, и свойства которой (линзы) они могут менять в широких пределах. Если первые зоны зрительной системы человека (НКТ, V1) занимаются выделением локальных деталей изображения, то остальные зоны ответственны за различение форм и узнавание объектов. В зоне V2 анализируются границы и форма поверхностей. В зонах V4 и MT осуществляется анализ признаков глубины и отделение объектов от фона.
Еще раз подчеркну, что деятельность первых зон в значительной степени зависит от результатов обработки картинки высшими зрительными зонами, задачей, которую ставит перед собой человек, и его личным опытом наблюдения подобных изображений.
С другой стороны, благодаря наличию прямых связей первичных зон с высшими (в обход промежуточных зон) информация о локальных деталях может поступать в высшие зоны зрительной коры непосредственно из первых зон.
Рецептивные поля нейронов зон V4 и MT примерно в четыре раза больше рецептивных полей нейронов зоны V1. Рецептивное поле нейрона зоны IT занимает уже бо́льшую часть всего поля зрения.
Обработка изображения происходит параллельно по трем взаимодействующим каналам.
• Первый канал (канал «Что») состоит из нейронов-детекторов деталей изображения. Эти нейроны хорошо различают мелкие детали, но имеют низкую чувствительность к контрасту и к изменениям во времени. По мере перехода от слоя к слою избирательность нейронов увеличивается. Нейроны зоны IT реагируют на очень сложные элементы картинки, например, на изображения лица, независимо от их размера и положения на сетчатке.
• Второй канал (канал «Где») состоит из нейронов-детекторов контраста и движения. Эти нейроны имеют высокую чувствительность к контрасту и к изменениям во времени, но низкое пространственное разрешение. Одни нейроны MST реагируют на небольшие движущиеся объекты, а другие – на движение краев больших объектов. С помощью этого канала быстро обнаруживаются новые или изменившиеся объекты.
• Третий канал состоит из нейронов, имеющих отношение к восприятию цвета.
Интересно, что полученное человеком образование влияет на размеры зон коры головного мозга. Так обнаружено, что у музыкантов, зона, ответственная за чтение партитур, увеличена за счет уменьшения соседних зон.
Каждый нейрон может иметь до 15000 соединений с соседними нейронами. Те соединения, которые оканчиваются на дендритном дереве, возбуждают нейрон, а те, которые соединяются с телом нейрона – тормозят. Каждую секунду нейрон может получать тысячи возбуждающих и тормозящих импульсов от своих соседей. Как это все работает – уму непостижимо!
А как все это выросло из одной клетки! Конечно, в ДНК закодирована не схема соединения нейронов, а правила ее построения. Типа «аксон нейрона ищет ближайший нейрон, использующий такой же нейромедиатор, и соединяется с ним; если не находит, то нейрон этого аксона отмирает».
Когда-нибудь докопаются и до детальных исходных текстов этой программы.
1.6. Кодирование сенсорного сигнала в коре головного мозга
Придумана красивая математическая модель, которая удивительным образом объясняет, для чего могло бы понадобиться создать такую систему рецептивных полей нейронов коры головного мозга и как это могло быть сделано. Идею можно объяснить следующим образом.
Пусть мы имеем много фотоснимков разных пейзажей. Поставим такую задачу: найти такой набор кусочков изображений, из которых можно было бы составить (как пазл) любую из этих фотографий. Пусть таких кусочков будет много, лишь бы каждый снимок состоял из небольшого их числа. Эта задача имеет тривиальное решение: разрезаем каждый снимок на кусочки и все вместе они и дадут искомый набор.
Потребуем теперь, чтобы количество кусочков было гораздо меньше, чем получились в этом наборе. Это можно было бы сделать, например, рассортировав этот набор на группы похожих кусочков, и каждую группу заменить на один «усредненный» кусочек.
Оказывается, что такая задача может быть решена не разрезанием изображений на части и сортировкой кусочков, а математически строго. То есть, для заданного множества изображений можно построить набор наилучших картинок, из которых может быть составлено каждое изображение из этого множества. «Наилучших» в том смысле, что составленное из этих картинок изображение будет отличаться от исходного минимальным образом. И при важном условии, что каждое изображение составляется из небольшого количества картинок.
Основная цель решения этой задачи не в том, чтобы получить составные изображения, близкие к исходным, а в том, чтобы найти элементарные компоненты изображений данного класса, позволяющие экономным образом закодировать их структуру.
Когда такой алгоритм (sparse coding, разреженное кодирование) обработал около полумиллиона кусочков изображений пейзажей и других сцен окружающего нас мира, то полученные элементарные картинки оказались невероятно похожи на картинки, на которые настроены рецептивные поля некоторых из нейронов первичных зрительных зон головного мозга!
Если составление изображений из кусочков сравнить с составлением слов из букв, то получается, что полученный алфавит (набор элементарных картинок) содержит много букв, но каждое изображение представляет собой короткое слово. В этом и состоит «разреженность». Получается что-то вроде китайской азбуки, но вид иероглифов не придуман людьми, а вычислен оптимальным образом для заданного набора понятий, которые должны быть описаны этим языком.
Если это все действительно так, то вырисовывается следующая схема.
1. Каждый «пиксель» изображения на сетчатке представлен в высших разделах зрительной коры головного мозга в виде возбуждения только тех нейронов, для которых картинка в окрестности этого пикселя «совпала» с той, на которую настроены их рецептивные поля. Нейронов, в рецептивных полях которых находится окрестность данного пикселя – много, может быть, сотни тысяч и больше, но для конкретного изображения (одного из тех, которые могут встретиться в природе), всегда сработает только небольшое их количество, возможно, единицы или десятки (в этом и проявляется разреженность!).
2. Картинки в рецептивных полях, на которые реагируют нейроны зрительной коры, формируются в процессе самообучения в раннем возрасте, а может быть, и в течение всей жизни. Когда младенец с удивлением рассматривает яркую игрушку, может быть, в это время это и происходит. Получающиеся картинки различаются рисунком, ориентацией и полосой пространственных частот этого рисунка.
Если верно, что наружное коленчатое тело преобразует изображение на сетчатке в последовательность изображений с разными интервалами пространственных частот, то тем самым дается шанс нейронам, настроенным на разные частоты, «опознать» свой рисунок.
Полагают, что разреженное кодирование является общим принципом кодирования сенсорной информации в нервной системе и используется, в частности, для кодирования природных звуков или запахов.
Благодаря представлению информации, полученной от сенсоров, в виде разреженного кода:
• выявляется структура сложных входных данных, что упрощает их анализ на последующих уровнях;
• повышается емкость ассоциативной памяти, т. к. повышается различимость сходных состояний;
• экономится энергия (а подсчитано, что в коре головного мозга энергии хватает только для одновременной активации не более чем 2 % всех нейронов коры).
По мере перехода к последующим слоям нейронов их рецептивные поля все усложняются и для моделирования их структуры, если такое окажется возможным, уже нужно будет учитывать степень значимости для организма элементарного изображения (какое типичное поведение оно вызывает: опасность это, или добыча, или что-то другое жизненно важное).
На заключительных стадиях обработки зрительной информации, о которых на клеточном уровне мало что известно, осуществляется следующее:
• отсутствующие, например, из-за наличия на сетчатке слепого пятна, части изображения восстанавливаются, видимо, с помощью интерполяции и сведений, хранящихся в памяти;
• информация, которая была отсечена на этапе структуризации изображения, домысливается (если она требуется), снова с помощью интерполяции и памяти;
• мозг «улучшает» поступившую картинку с помощью ранее полученных знаний об изображенных предметах и, в частности, о законах перспективы;
• конечный результат мысленной реконструкции изображения мозгом помещается в долговременную память человека.
1.7. Механизмы константности зрительного восприятия
Деятельность мозга по улучшению картинки нужно описать подробнее. Еще Декарт заметил, что часто мы визуально воспринимаем вещи правильнее, чем это можно было бы сделать, основываясь только на том, как они видны в реальности. Это явление называется константностью зрительного восприятия.
Существует множество видов константности восприятия: константность восприятия размеров, формы, яркости, цвета и другие.
Так, в изображении на сетчатке размеры предметов подчиняются законам передачи перспективы. Но благодаря механизму константности размеров мы воспринимаем размер очень близких предметов уменьшенным по сравнению с тем размером, который получился на сетчатке. А размер удаленных предметов воспринимается немного увеличенным. То есть, мозг частично исправляет перспективные искажения размеров предметов. Коррекция восприятия осуществляется на основе сведений об условиях просмотра (в том числе, с учетом признаков глубины) и хранящихся в памяти знаний о свойствах предметов, которые мы видим.
Включив лампу накаливания, мы обнаруживаем, что белая бумага стала восприниматься немного желтоватой. Однако через небольшой промежуток времени бумага снова станет восприниматься белой. Произошла адаптация к цвету источника освещения. Влияние цвета источника освещения на воспринимаемый цвет ослабляется свойством зрительной системы человека, которое называется хроматическая адаптация.
Видя нарисованный на картинке эллипс, мы часто можем легко определить по остальным деталям картинки, что на самом деле это – круг, видимый сбоку. Сработала константность формы.
Наличие механизмов константности зрительного восприятия объясняется тем, что человеку важнее выделить в изображении реальные знакомые объекты, чем определить фотометрический уровень освещенности или, к примеру, цвет источника освещения.
Разумеется, мозг корректирует (с помощью накопленных знаний) информацию, получаемую не только от органов зрения, но и от других органов чувств.
Обнаружено, что степень такой коррекции (коэффициент константности), обычно составляет 10–70 %. Константность восприятия наблюдается уже у трехлетних детей, и ее развитие продолжается до 10–12 лет.
Мы можем не только видеть предметы или пейзажи, но и вспоминать их и даже мысленно конструировать их. Различают следующие основные виды визуальной памяти.
• Сенсорная (иконическая) память – это, например, изображение, остающееся в памяти после срабатывании вспышки в темной комнате. Длится около полусекунды, но содержит многие детали. Объясняется продолжающейся активностью фоторецепторов и тех нейронов, которые находятся в сетчатке и, возможно, в первичной зрительной коре.
• Кратковременная память хранит последовательные менее детальные визуальные образы и в более структурированном виде, но не более 30 секунд. Также объясняется продолжающейся деятельностью нейронов, но уже, возможно, той, которая обеспечивается обратными связями между ними.
• Долговременная память может хранить картинки (фрагменты картинок) годами и даже всю жизнь. Объясняется возникшими при запоминании изменениями в структуре связей между нейронами и в свойствах синаптических переходов. Долговременная память ассоциативна. Чтобы вспомнить какой-либо пейзаж, часто бывает нужно сначала вспомнить ту поездку, во время которой он был увиден, или какие-то обстоятельства, с ним связанные. Картинки, хранящиеся в такой памяти, сильно перемешиваются с воспоминаниями других типов (звуки, запахи, эмоции и другие). Запомненные картинки, похоже, с течением времени постепенно деградируют.
Процесс восприятия изображения сложным образом переплетен с деятельностью визуальной памяти:
• восприятие картинки непрерывно корректируется с помощью информации, хранящейся в визуальной памяти;
• воспринимаемые картинки непрерывно поступают в память;
• видимая картинка содержит больше деталей, чем находится в памяти.
Говорят, что встречается фотографическая память (эйдетическая). Это когда человек может взглянуть на лист бумаги с каким-то незнакомым ему текстом, закрыть глаза и по памяти зачитывать этот текст хоть слева направо, хоть наоборот, а хоть и снизу вверх. И даже правильно отвечать на неожиданные вопросы, например, если соединить заданные три слова линиями, то получится острый угол или тупой. Вместо текста может быть взята картинка. Однако, похоже, научным образом этот феномен никогда не исследовался, и существует ли он на самом деле, неизвестно.
1.8. Сравнение с фотоаппаратом
Попробуем сравнить процессы обработки изображения (в нашем случае пейзажа) фотокамерой и зрительной системой человека.
Сначала сравним «угол зрения» объектива с углом зрения глаза.
Нормальная острота зрения у человека – это когда не сливаются в одну точку две точки, разделенные углом в 1 дуговую минуту, что соответствует 60 пикселям на градус (пнг). Средняя острота зрения примерно равна 85 пнг, а для пилотов морской авиации США – 150 пнг.
Для человека с остротой зрения 85 пнг и полем зрения 180° × 125° получаем, что полное изображение состоит из 15300 × 10625 пикселей, то есть, около 163 мегапикселей.
Для одного «кадра» поле зрения приблизительно равно 1° 40' × 1° 40', и часть изображения, спроецированного на фовеа, состоит из 142 × 142 пикселей, то есть, около 0.02 мегапикселей.
Для 100-миллиметрового объектива (углы зрения по горизонтали 20° и по вертикали 14°) и камеры с сенсором 5472 × 3648 пикселей получаем «остроту зрения» этой пары в 273 пнг по горизонтали и 243 пнг по вертикали.
Теперь сравним рецепторы сетчатки с пикселями сенсора камеры.
Размер наружной части рецептора, содержащей светочувствительный пигмент, равен 1 ÷ 2 микрон для палочки или 1 ÷ 5 микрон для колбочки. Размер пикселя сенсора равен 2.5 ÷ 8 микрон, размер зерна фотопленки: 0.05 ÷ 3 микрон.
Плотность палочек: 40–150 тысяч на мм2, колбочек: 5–150 тысяч на мм2. Плотность фоторецепторов сенсора – до 40 тысяч на мм2. На цветной фотографии: около 30 тысяч точек на мм2.
Чувствительность: 5–14 фотонов для палочки и в 100–1000 раз больше для колбочки. Для сенсора – несколько фотонов (сенсор ICCD, intensified CCD, усиленный ПЗС-сенсор), для зерна высокочувствительной фотопленки – 4 фотона.
Разрешающая способность: Количество рецепторов сетчатки одного глаза – 130 миллионов. Количество пикселей сенсора обычного фотоаппарата – до 30 миллионов. Максимальный размер кадра на сегодняшний день имеют 80-мегапиксельные матрицы в цифровых задниках Phase One iq280: 53,7×40,4 мм. Разрешающая способность сенсора: от 200 линий на миллиметр (у крупноформатных цифровых фотокамер) до 70 линий на миллиметр (у web-камер и мобильных телефонов).
Получается, что по количеству пикселей и их средней плотности фотоаппараты догоняют глаз. Но вот разрешающая способность сетчатки в центре фовеа пока что в 2–8 раз выше, чем у сенсоров современных камер (если сравнивать только плотности рецепторов и пикселей, без учета «оптики»).
Как воспринимается яркость сцены фотоаппаратом и зрительной системой человека?
Зависимость воспринимаемой глазами яркости от фактической яркости предмета нелинейна. Для того чтобы почувствовать изменение яркости в темных тонах, достаточно очень небольшого изменения фактической яркости. Тогда как для того, чтобы почувствовать изменение яркости в светлых тонах, потребуется более сильное изменение фактической яркости. В такую нелинейность вносят свой вклад следующие факторы:
• переключение рецепторов: при низких яркостях работают палочки, а при более высоких яркостях палочки полностью насыщаются и работают только колбочки; на промежуточных уровнях яркости функционируют и те и другие;
• истощение пигмента рецепторов на высоких уровнях яркости;
• изменение чувствительности сетчатки к свету, осуществляемое на уровне нейронов сетчатки;
• когнитивные механизмы – регулирующие восприятие яркости на основании знания наблюдателем содержимого сцены. Например, мы избегаем смотреть на солнце или на огонь электросварки незащищенными глазами.
Благодаря всему этому наши глаза могут видеть в диапазоне яркостей, границы которого различаются в 224 раз, то есть более чем в 16 миллионов раз! При этом роль сужения зрачка относительно невелика. Максимальные изменения зрачка для здорового человека – от 1,8 мм до 7,5 мм, что соответствует изменению площади зрачка всего в 24 раз.
Теперь о яркости в числах.
Динамический диапазон (диапазон яркостей), воспринимаемый человеком: дневное зрение – 15 000: 1 (13 EV, exposure value), ночное зрение – 10 000 000: 1 (27 EV). Для сравнения, темная ночь: -6 EV, яркий солнечный свет: +22 EV. Контраст, воспроизводимый на бумаге: 8 EV, на пленке: 8–14 EV, воспринимаемый сенсорами цифровых камер: 8–14 EV, на экране монитора: 10 EV.
Снова сравним с фотоаппаратом. Для сенсора камеры зависимость воспринимаемой яркости от фактической яркости предмета линейна, за исключением краев воспринимаемого диапазона. Поэтому диапазон яркостей камеры с 14-битной разрядностью всего лишь 214, что менее 17 тысяч. Но и это только теоретически. На практике из-за наличия шума этот диапазон снижается до 29, что равно 512.
Следовательно, наши глаза лучше приспособлены для среды с широким диапазоном яркостей, чем наши фотоаппараты. Правда, нужно уточнить, что перепад яркостей, для которого темновая адаптация не превышает десятых долей секунды, составляет только 10–13 EV. Чтобы получить значение 27 EV для ночного зрения, приведенное выше, необходимо адаптироваться в течение получаса и более.
Фотоаппарат строит попиксельное отображение 3-мерного пейзажа на плоскость кадра по законам прямой линейной перспективы, которое затем обрабатывается программным обеспечением камеры и, возможно, пользователем с помощью компьютера, и воспроизводится на экране монитора или на каком-нибудь носителе (бумаге, пленке, ткани).
Система «глаз-мозг» превращает 3-мерный пейзаж в серию «кадров», каждый из которых содержит резкое отображение на плоскость (точнее, на внутреннюю поверхность сферы) только небольшого кусочка рассматриваемого пейзажа. Далее, структура границ яркостей и границ цвета каждого кадра превращается в частотно модулированный сигнал и подвергается Фурье-анализу с целью обнаружения только самых важных для мозга деталей. Вся остальная информация об изображении, вероятно, пропадает (не запоминается), а в случае появления необходимости – домысливается мозгом с помощью предыдущих знаний, а также интерполяции поступивших данных об изображении.
Обработанное таким образом изображение пейзажа помещается в память. Увиденная картинка не отображается в голове целиком, а составляется из набора только тех объектов или свойств, которые были важны в момент просмотра. В этот набор входят: суть сцены (общее описание), размещение объектов (или пятен) по сцене и некоторые важные детали опознанных объектов.
Наибольшая разница между двумя этими системами обработки изображений состоит в цели обработки. Зрительная система человека не предназначена для любования пейзажем. Для нее нужно рассортировать элементы пейзажа на важные и неважные и обработать только важные. Таким образом, на выходе фотоаппарата мы имеем попиксельное изображение (фотографию), удобное для просмотра человеком. А «на выходе» зрительной системы человека, то есть в его зрительной памяти, – «разобранное на части» изображение, удобное для анализа структуры картинки и содержащее минимум малосущественных деталей.
Полученная с помощью камеры и распечатанная фотография сделана опять же для человека, который рассматривает ее и снова превращает в разобранную на части картинку, но уже другим образом, с учетом того, что это все-таки не реальный пейзаж, а всего лишь картинка. И, может быть, с учетом того, как понял зритель замысел фотографа.
Поскольку принципы работы сравниваемых систем различны, то приведенные выше цифры трудно сопоставить. Чему ближе соответствует количество пикселей сенсора? Количеству рецепторов сетчатки? Но сигналы от рецепторов не используются напрямую для построения изображения. Они подвергаются структурному анализу и малосущественная часть информации, полученная от сетчатки, пропадает.
Может быть, количеству волокон зрительного нерва (1–1.5 миллиона), по которым визуальная информация передается в мозг? Тоже соответствия нет, потому что по этим волокнам изображение передается в виде серии «частичных» картинок, соответствующих разным положениям проекции на сетчатку относительно фовеа. Да еще и преобразованное в серии нервных импульсов.
Зрительная система человека умеет адаптироваться к условиям наблюдения (яркости, цвету освещения). Цифровые камеры тоже пытаются осуществить баланс белого с помощью разных алгоритмов (рассмотрим в другой главе ниже).
В отличие от фотоаппарата, наблюдаемое изображение в голове находится в виде разных срезов, начиная от выделенных границ и карты движущихся элементов, до распознанных объектов и их значения для наблюдателя. Благодаря наличию прямых и обратных нейронных связей между этими срезами, картинки постоянно уточняются и информация об изображении непрерывно обогащается. Интерпретация картинки высшими слоями зрительной коры сравнивается с картинкой, полученной сетчаткой. И становится ясно, куда надо посмотреть еще и что уточнить. Отсюда – тот большой объем информации, которую можно получить с помощью зрительной системы.
В конце главы сделаем небольшое лирическое отступление. А все-таки, какой крутой «гаджет» дан каждому из нас! Я имею в виду наши головы. Мы пользуемся ими всю жизнь, днем и ночью. В начале жизни эти «гаджеты» имеют только какие-то базовые прошивку и чипы. Но с течением времени прошивка непрерывно обновляется, скачиваются все новые и новые приложения, новые микросхемы появляются, а старые перекоммутируются.
Этот процесс происходит частично автоматически, по мере появления изменений в окружающей нас среде, которые мы замечаем и обдумываем, а частично управляется нашими желаниями, когда нам хочется узнать что-то конкретное или научиться делать что-то нужное, и мы добиваемся этого. Чем больше наполняется начинка нашего гаджета, тем более тонкие детали окружающей среды начинают привлекать наше внимание, хочется их понять и когда это удается, функционал гаджета снова обогащается.
Когда моя дочь училась в пятом классе, она меня спрашивала: «Зачем мне, будущему гуманитарию, учить математику?». Я отвечал, что когда решаешь задачку, мысли в голове протаптывают тропинку, ручейки мыслей пробивают русла. И когда формулы и математические определения забудутся, эти тропинки и русла останутся и будут помогать правильно думать.
Сейчас я бы добавил, что сформированные в процессе изучения школьной математики структуры мозга позволят увидеть будущие, возможно совсем не математические, обстоятельства под новым углом, дадут еще один срез конкретной жизненной ситуации.
Глава 2
Цветовые пространства и модели восприятия цвета
Получив некоторое представление о том, как работает зрительная система человека, перейдем к нашей основной теме – фотографии. Но сначала нужно напомнить суть основных понятий, относящихся к цвету и восприятию цвета человеком. В детали вдаваться не станем, а затронем только то, что будем использовать в остальной части этой книжки. Кто захочет, всегда сможет изучить любой вопрос более глубоко, отталкиваясь от упомянутых здесь терминов и воспользовавшись поиском в интернете.
Во многих случаях, хотя, может быть, и не всегда, художник или фотограф хочет, чтобы цвета его картины или фотографии воспринимались зрителем точно так же, как их видит сам автор. Независимо от того, рассматривается ли изображение в виде твердой копии или в виде картинки на экране. Да еще и независимо от условий просмотра (освещение, фон, геометрия просмотра, окружение), которые могут быть не такими, как у автора. Системы управления цветом в компьютерных программах как раз и призваны решить эту задачу настолько, насколько это возможно. Для понимания сути происходящего необходимо знакомство с азами науки о цвете, которые и излагаются в этой главе.
Конечно, сходные проблемы возникают и в других творческих профессиях. Передача нужного смысла слова (строчки, абзаца) от писателя или поэта к читателю. Передача впечатления от музыкального произведения от композитора к слушателю. В отличие от передачи цвета в последнем случае едва ли возможна какая-то формализация. Слишком многое зависит от культурного уровня и опыта читателя/слушателя. Впрочем, аналогия просматривается очень четко, так что, вероятно, все-таки это будет сделано. Но пока можно считать, что фотографам еще повезло. Или не повезло, смотря как к этому относится.
2.1. Цветовые пространства
Как известно, воспринимая видимый свет, человек ощущает его яркость (интенсивность) и еще нечто, называемое «цвет». Интенсивность можно измерить физическим прибором, а цвет – напрямую нет. Но для того, чтобы работать с цветом на компьютере, нужно сначала цвет оцифровать, то есть, каждому видимому цвету поставить в соответствие число (или несколько чисел).
Можно было бы характеризовать цвет видимого излучения его спектральным распределением энергии, которое можно измерить. Тем более что излучение с одним и тем же спектром воспринимается разными людьми с нормальным зрением как имеющее один и тот же цвет. Но в то же время существуют пары излучений с очень разными спектрами, которые человеком воспринимаются как имеющие совершенно одинаковый цвет (явление метамеризма). Кроме этого, ставить в соответствие цвету не числа, а функции, неудобно.
Как оцифровать цвет проще, помогают понять законы Грассмана (Hermann Grassmann), открытые эмпирически еще в 1853 году в экспериментах по смешиванию лучей света разных цветов:
1) цвет трехмерен, то есть одному цвету нужно ставить в соответствие три числа;
2) при непрерывном изменении цвета только одного из смешиваемых лучей цвет смеси тоже меняется непрерывно;
3) цвет смеси зависит только от смешиваемых цветов и не зависит от их спектров.
Отсюда следует, что все видимые цвета должны образовать некоторую непрерывную область (тело) в трехмерном пространстве. Каждая точка этого тела будет соответствовать определенному цвету. Если выбрать два разных цвета и соединить соответствующие им точки отрезком прямой, то этот отрезок будет определять все оттенки, которые можно получить, смешивая эти два цвета. Причем в случае линейного пространства пропорция смеси будет равна отношению длин частей отрезка, на которые цвет смеси делит его.
Поскольку отрезок, соединяющий два любых видимых цвета, содержит только видимые цвета, то он полностью находится внутри тела видимых цветов, а это значит, что это тело должно быть выпукло (без впадин и ямок).
По форме тело видимых цветов похоже на продолговатый фрукт, у которого один бок срезан. Точки поверхности «фрукта» (кроме среза) соответствуют монохромным цветам разной длины волны и разной интенсивности, то есть, имеющим максимальную насыщенность (монохромны, например, цвета радуги). Поверхность «отрезанной» части тела (кроме среза) соответствует «цветам» монохромных инфракрасных и ультрафиолетовых излучений, которые глаз не видит. Если выбрать какой-либо цвет на поверхности тела и понижать его насыщенность, добавляя все возрастающее количество белого цвета, то соответствующая точка начнет перемещаться вглубь тела и в пределе достигнет точки этого белого цвета, которая будет находиться где-то в середине «фрукта». Точки снаружи от поверхности, образованной цветами монохромных излучений, соответствуют «цветам», имеющим насыщенность бо́льшую, чем насыщенность монохромных цветов, что физически невозможно. Для получения такой насыщенности нужно было бы из монохромного цвета вычесть какое-то количество белого цвета, что физика не может сделать. А математика – пожалуйста.
Нейтрально серые цвета образуют линию, проходящую внутри тела видимых цветов и соединяющую самую темную точку (черную) с самой яркой (белой). Возникает важный вопрос, как определить, что такое нейтрально белый, серый и черный цвета. На глаз тут полагаться нельзя из-за хроматической адаптации (привыкнув к любому почти белому цвету, глаз начинает воспринимать его как чисто белый). Поэтому, работая с цветом математически, нужно каждый раз оговаривать, что в данном конкретном случае подразумевается под белым (и, как следствие, серыми и черным цветом). В теории черный цвет (излучение с нулевой интенсивностью) тоже имеет цветность, которую глаз, конечно, не видит.
Одну и ту же трехмерную фигуру (конечно, также как и фигуры любой другой размерности), можно рассматривать в различных координатных системах, линейных и нелинейных. Различные координатные системы, в которых может рассматриваться тело видимых цветов, называются цветовыми пространствами. Один и тот же цвет в разных цветовых пространствах записывается наборами разных чисел. В некоторых из этих пространств можно изобразить только часть видимых цветов и тело приобретает вид куба, конуса, биконуса или другую форму. Линейное преобразование цветового пространства соответствует тому, что мы как-то поворачиваем это тело и изменяем его размер равномерно и пропорционально. Нелинейное преобразование означает, что мы растягиваем или сжимаем тело видимых цветов так, что разные его части сжимаются или растягиваются по-разному.
Различных цветовых пространств (как и систем координат) можно придумать бесконечно много. На практике применяются только те из них, которые обладают некоторыми полезными свойствами. К общим свойствам цветовых пространств (ЦП) относятся:
• цветовой охват;
• линейность по восприятию;
• однородность по восприятию;
• зависимость от устройства;
• нормированность;
• точка белого и точка черного.
Цветовой охват (gamut, гамут, вкусное слово, думаю, оно приживется в русском языке) – это совокупность всех таких видимых цветов, которые могут быть представлены в данном ЦП. Кроме видимых цветов в некоторых ЦП могут быть представлены и физически невоспроизводимые цвета.
Линейность по восприятию (perceptually linear) означает, что изменение координат цвета приводит к изменению воспринимаемого цвета примерно в той же пропорции. Для однородного по восприятию цветового пространства (perceptually uniform), кроме того, близким разностям цветов соответствуют близкие по длине отрезки, соединяющие эти цвета.
Если при определении ЦП используются характеристики конкретного устройства (сканера, монитора, принтера), то такое пространство называется устройство-зависимым (или аппаратно-зависимым). Аппаратно-зависимое ЦП удобно для использования при работе с этим самым устройством. Если ЦП определяется с помощью величин, не связанных с каким-либо конкретным устройством, то оно называется устройство-независимым. Устройство-независимое ЦП предназначено для выполнения общих операций с цветом таких, как редактирование изображений или преобразования из ЦП одного устройства в ЦП другого устройства. Поскольку при этом отсутствуют ограничения, связанные с возможностями какого-либо устройства, то все такие операции могут быть выполнены без потерь.
Цветовой охват аппаратно-независимых ЦП обычно большой и может содержать физически нереализуемые цвета. Но даже если в процессе преобразования получится промежуточное изображение, в котором часть цветов окажутся физически нереализуемыми, при дальнейшей обработке эти цвета могут благополучно (и правильно!) вернуться в область воспроизводимых цветов.
При сравнении цветовых охватов устройств и цветовых пространств часто используется гамут Пойнтера (Michael R. Pointer). Гамут Пойнтера – это аппроксимация совокупности всех таких цветов, которые могут быть получены окрашиванием поверхности. То есть, с помощью вычитания цветов. Гамут Пойнтера является частью множества всех видимых цветов (которое получается сложением цветов).
Нормировку ЦП и выбор точек белого и черного обсудим в следующем параграфе.
2.2. Источники освещения и нормировка цветовых пространств
Вначале вернемся к вопросу о том, как объективно определить, что такое белый цвет. Для этого рассмотрим поверхность, которая отражает все длины волн видимого света полностью, без поглощения. Осветим такую поверхность излучением, которое имеет постоянный спектр, то есть, интенсивность излучения одна и та же для всех длин волн (физически измеряемая, а не воспринимаемая!). Естественно назвать цвет такой поверхности при таком освещении белым. Но при освещении этой же поверхности лампами накаливания, в первый момент она покажется желтоватой, а затем, после завершения процессов цветовой адаптации зрительной системы, станет казаться опять белой (возможно, с желтоватым оттенком).
Если сфотографировать какую-нибудь сцену, например, интерьер, освещенную некоторым источником света (illuminant, осветитель), и представить полученное изображение в каком-либо цветовом пространстве, то в качестве цветности точки белого этого ЦП нужно выбрать цветность этого источника освещения. Это позволит называть белыми те предметы, которые, как мы знаем, являются белыми, и будет находиться в согласии с восприятием цвета человеком (а именно, с механизмом хроматической адаптации). При этом результат будет соответствовать 100 %-й адаптации зрительной системы человека. Таким образом, чтобы исключить влияние цветности источника освещения на цвета предметов, нужно считать белым цвет источника освещения.
Поскольку в реальности встречается много разных вариантов освещения, то необходимо определить несколько типичных источников. Каждый источник полностью описывается своим спектром. Воспринимаемый цвет источника однозначно вычисляется по его спектру. Некоторым из осветителей можно поставить в соответствие цветовую температуру. Цветовая температура выражается в градусах Кельвина и равна температуре абсолютно черного тела, при которой его спектр излучения наиболее близок к спектру источника освещения. Стандартные источники освещения сгруппированы по сериям, которые обозначаются следующими буквами:
• A (лампы накаливания, 2856 К),
• D (дневной свет),
• E (постоянный спектр),
• F (флуоресцентные лампы),
• L (световые диоды) и другие.
Для фотографов особенный интерес представляет серия D (дневной свет, приведены также координаты цвета в пространстве CIEXYZ, см. ниже):
• D50 (свет горизонта, теплый дневной свет на восходе или закате, 5003 К), CIEXYZ=[0.9642, 1.0000, 0.8251 (или 0.8249)].
• D55 (дневной свет в середине утра или после обеда, 5503К), CIEXYZ= [0.9568, 1.0000, 0.9214].
• D65 (полуденный свет, состоит из прямого солнечного света и рассеянного света от ясного неба, 6504 К), CIEXYZ= [0.9504, 1.0000, 1.0888 (1.0889)].
• D75 (северное небо, пасмурное небо, 7504 К), CIEXYZ=[0.9496, 1.0000, 1.2261].
Цветности источников освещения серии D различаются:
• оттенками от желтого к голубому, учитывающими соотношение облачности и прямого солнечного света,
• оттенками от розового к зеленому, учитывающими наличие в атмосфере воды в виде пара или дымки.
Перейдем к точкам белого и черного цветовых пространств. Есть смысл отдельно рассматривать яркость и цветность этих точек. Если в качестве яркостей этих точек задать предельные значения, воспроизводимые на конкретном устройстве, то полученное ЦП будет аппаратно-зависимым. Цветность точки белого аппаратно-независимого ЦП обычно задается указанием стандартного источника освещения. Для некоторых аппаратно-независимых ЦП точки белого и черного не заданы, и клиппирование (замена цветов, выходящих за гамут, цветом, лежащим на границе гамута, см. ниже), вызванное их существованием, отсутствует.
Для многих реальных устройств цветности точек белого и черного не совпадают. Для мониторов на электронно-лучевой трубке цветность точки белого зависит от цветностей и относительных яркостей люминофоров, а цветность черного – от отражающих свойств поверхности экрана. Для принтера – соответственно, от цветности бумаги и от цветности чернил. Все это приводит к тому, что линия, содержащая нейтрально серые цвета не является прямой, а плавно изгибается во всех трех измерениях цветового пространства.
В ненормированном ЦП значения координат могут являться физически измеряемыми величинами, выраженными в каких-нибудь единицах, например, в канделах на квадратный метр для оси яркости. Такие значения являются абсолютными, то есть, имеющими самодостаточный смысл.
Для нормированного цветового пространства значения координат безразмерны и линейно преобразованы так, чтобы все они укладывались в отрезок значений с удобными для восприятия (и вычислений) границами. Обычно наибольшее возможное значение выбирают равным единице, 100 % или степени двойки без единицы, а наименьшее возможное значение – равным 0 или степени двойки без единицы с минусом (например, –127). Если для ЦП заданы точки белого или черного, то их координаты также могут служить наибольшими и наименьшими возможными значениями. Значения координат нормированного пространства являются относительными. Их смысл зависит еще и от нормировки, то есть, от того, что принято за граничные значения.
Иногда нормировка ЦП делается так, чтобы была разрешена яркость больше, чем яркость точки белого. Этот «запас» яркости используется для отображения бликов.
2.3. Цветовые модели
Цветовой моделью называют способ построения семейства цветовых пространств. Модели эти параметрические, поэтому, чтобы задать конкретное ЦП, входящее в эту модель, нужно задать конкретные значения параметров модели. Поскольку большинство параметров являются действительными числами, для каждой модели можно определить бесконечно много цветовых пространств. Для обработки фотографий чаще всего используются ЦП, входящие в следующие модели (в скобках перечислены параметры):
• цветовая модель RGB: цвет раскладывается на смесь трех базовых цветов: красный, зеленый и синий, и координатами служат коэффициенты этого разложения (параметры: три базовых цвета, точка белого, функция гамма-компрессии, см. ниже);
• цветовая модель CIELAB: одна координата цвета соответствует яркости, две остальные – цветности (параметр: точка белого);
• цветовая модель CMYK: цвет раскладывается на смесь четырех базовых цветов, голубой, лиловый, желтый и черный (параметры: три базовые цвета CMY, точка белого, алгоритм вычисления координат CMYK).
Вопросами, связанными с восприятием цвета, занимается Международная комиссия по освещению (CIE, Commission internationale de l'éclairage). Отсюда – начало аббревиатуры CIELAB и других.
Прежде чем рассматривать конкретные ЦП этих моделей, нужно описать еще два первичных ЦП, с которых все и началось. Поскольку цвет нельзя измерить физическим прибором, а можно только определить с помощью системы «глаз-мозг», то для того, чтобы сопоставить точкам какого-либо ЦП реальные цвета, без экспериментальных данных о восприятии цвета человеком не обойтись.
Поэтому, сначала опытным путем были получены функции, которые каждому монохромному излучению ставили в соответствие тот цвет, который человек видит, наблюдая это излучение. При этом использовались некоторые эталонные красный, зеленый и синий цвета (кардинальные стимулы). Наблюдаемый монохромный цвет записывался в виде трех чисел, равных таким интенсивностям этих эталонных цветов, при которых цвет смеси (на глаз) совпадал с наблюдаемым монохромным. Результаты усреднялись по некоторому числу наблюдателей с нормальным зрением. Интенсивности эталонных цветов были выбраны так, чтобы равные количества стимулов давали белый цвет, определенный стандартом, действующим в то время. В других аналогичных экспериментах использовался несколько иной способ определения интенсивностей эталонных цветов.
Используя полученные функции, оказалось возможным вычислять воспринимаемый цвет для любого спектра видимого излучения (благодаря законам Грассмана). Таким способом было построено CIERGB, первое ЦП, позволившее оцифровать восприятие цвета зрительной системой человека. Для системы CIERGB белым цветом считается цвет гипотетического равноэнергетического источника, который излучает равномерно на всех длинах волн видимого спектра. А координаты CIERGB были отнормированы так, что для цвета этого источника всегда выполнялось равенство R=G=B, смысл которого состоит в том, что белый цвет не должен быть смещен ни к одному из эталонных цветов.
Линейным преобразованием пространства CIERGB было получено ЦП CIEXYZ, которое оказалось более удобным, чем CIERGB, по следующим причинам.
• Координата Y в CIEXYZ выбрана так, чтобы ее значения задавали яркость цвета.
• Каждый из видимых человеком цветов отображается в этом ЦП так, что все три координаты X, Y, Z неотрицательны.
Кроме этого, CIEXYZ, как и многие другие ЦП, обладает следующими полезными свойствами.
• Если выбрать два цвета и соединить их отрезком, то точки этого отрезка будут соответствовать цветам смесей, которые можно получить, смешивая эти два цвета.
• Если выбрать три цвета и соединить их отрезками так, чтобы получился треугольник, то точки внутри треугольника будут соответствовать цветам смесей, которые можно получить, смешивая эти три цвета.
Пространство CIEXYZ не является однородным по восприятию. Двум сильно различающимся цветам могут соответствовать близкие точки и, наоборот, близким цветам могут соответствовать далекие друг от друга точки. Это ЦП не нормировано и координаты оси Y (яркость) измеряются в канделах на квадратный метр. Нормированный вариант CIEXYZ обозначается nCIEXYZ, в нем Y = 1 для точки белого.
Любопытно, что базовыми стимулами для CIEXYZ являются «цвета», которые не только не воспринимает человек, но и которые нельзя получить с помощью излучения с каким бы то ни было спектром. Но для математики, которая, отталкиваясь от физической реальности, описывает объекты, не существующие в природе, это обычное дело. ЦП CIEXYZ широко используется в качестве эталонного как в теории цвета, так и на практике, в чем легко убедиться, продолжая читать эту книжку.
2.4. Цветовая модель RGB
Перейдем к любимой фотографами цветовой модели RGB. Эта модель была предназначена для описания цветов, воспроизводимых типичными дисплеями на электронно-лучевой трубке. И, следовательно, ЦП этой модели являются устройство-зависимыми. Все ЦП этой модели – это определенные области пространства CIEXYZ, получаемые линейным преобразованием и, следовательно, как и CIEXYZ, являются неоднородными по восприятию. Действительно, если изобразить базовые цвета и цветовой охват какого-либо RGB-пространства в более однородном ЦП, таком как CIELAB, то станет видно, что эти базовые цвета обладают разной яркостью и насыщенностью.
В RGB-модели предполагается, что базовыми стимулами являются красный, зеленый и синий цвета, но не уточняется, какие именно. Если уточнить (и задать остальные параметры модели), то получим конкретное RGB-пространство. Пока уточнение не сделано, координаты цвета являются относительными, измеренными относительно базовых (неизвестных) цветов. В противном случае координаты цвета являются абсолютными, и такое RGB-пространство тоже называется абсолютным.
Другим параметром этой модели является точка белого, которая задает тот оттенок белого, который в этом ЦП будет считаться чисто белым. Если все три координаты равны, то для любого ЦП этой модели получим серый цвет, цветность которого равна цветности заданной точки белого, а яркость тем больше, чем больше это одинаковое значение координат. Все RGB-пространства нормированы так, что точка черного задается координатами {0, 0, 0}, а точка белого – {100 %, 100 %, 100 %}. Вместо 100 % может быть 255, 65535 и так далее, в зависимости от глубины цветности.
Последним параметром этой модели является функция гамма-компрессии. Такая функция описывает опять же свойство электронно-лучевой трубки: яркость пятна на экране примерно пропорциональна напряжению на электродах в степени 2.2. Если требуется, чтобы яркость пятна была пропорциональна значению rgb-координаты, то нужно каждое значение rgb-координаты предварительно возвести в степень 1/2.2. Это и будет функция гамма-компрессии. Разные RGB – пространства могут иметь функции сжатия с разными значениями гамма, не обязательно 2.2. Для случая отсутствия гамма-сжатия можно считать, что величина гамма равна единице. Применение гамма-компрессии приводит к повышению детализации в тенях за счет уменьшения таковой в светлых частях изображения, но об этом ниже.
Рассмотрим конкретные ЦП этой модели.
Пространство sRGB (standard RGB) определено стандартом IEC 61966–2–1, который фиксирует следующие величины параметров RGB-модели:
• конкретные базовые цвета в координатах CIEXYZ, которые примерно соответствуют цветам люминофоров, применяемых в типичных дисплеях на электронно-лучевой трубке;
• точку белого, соответствующую дневному свету D65;
• функцию гамма-компрессии, состоящую из линейной части в окрестности нуля и экспоненциальной части с гамма 2.4 вне этой окрестности, что в целом приблизительно соответствует гамме 2.2 на всем интервале.
Это ЦП полезно тем, что его цветовой охват примерно равен цветовому охвату типичного монитора на электронно-лучевой трубке. sRGB отлично подходит для изображений, предназначенных для интернета или для принтеров невысокого качества. В отличие от других RGB-пространств sRGB иногда называют независимым от устройства. Наверно, потому, что оно опирается на характеристики не одного, а целого класса устройств.
В тех случаях, когда есть файл изображения, но неизвестно, в каком из цветовых пространств даны его координаты, принято считать по умолчанию, что используется sRGB. К сожалению, разные компьютерные программы понимают под sRGB не совсем одно и то же. Если это критично, то в таких случаях всегда лучше принудительно использовать одно и то же определенное описание sRGB, взятое, например, из пакета файлов программы ArgyllCMS или программного обеспечения камер Canon (оба источника считаются точными).
Пространство Adobe RGB (1998) было создано с целью расширить цветовой охват sRGB так, чтобы в него вошли цвета, воспроизводимые на современных принтерах (в основном, в области светлых зеленых и голубых тонов). Пространство Adobe RGB отличается от sRGB тем, что зеленый базовый стимул отодвинут дальше от точки белого (становятся доступны более светлые значения зеленого, чем в sRGB) и используется более простая формула гамма-компрессии (без линейного участка). В результате Adobe RGB охватывает примерно 50 % видимых цветов, отображаемых в CIELAB (а sRGB – только 35 %). Это ЦП подходит для мониторов с широким цветовым охватом и для коммерческой печати. sRGB и Adobe RGB также используются в качестве рабочих пространств графических редакторов.
Пространство ProPhoto RGB или ROMM RGB (Reference Output Medium Metric, гамма = 1.8) используется при обработке фотоизображений высокого качества, особенно для печати на принтерах с широким цветовым охватом. Цветовой охват ProPhoto очень большой, более 90 % цветов, возможных в CIELAB, и практически 100 % цветов, встречающихся в реальном мире. Базовые цвета в ProPhoto выбраны так, чтобы минимизировать изменение цветности при нелинейных преобразованиях яркости. Расплачиваться за широкий охват пришлось тем, что около 13 % точек в нем являются псевдоцветами, то есть, не соответствуют реальным цветам. Использование ProPhoto RGB в качестве рабочего пространства графического редактора требует осторожности, так как для этого нужна большая глубина цветности и монитор с широким гамутом (иначе – работа вслепую).
Пространство scRGB использует те же самые базовые цвета и точки белого и черного, что и sRGB, но значения координат в нем могут больше единицы и меньше нуля (от -0.5 до примерно +7.5). Благодаря этому scRGB содержит бо́льшую часть цветов XYZ (кроме светлых зелено-голубых) и совместимо с sRGB. Кроме того, scRGB позволяет представлять изображения с диапазоном яркостей большим, чем это возможно в sRGB. Хотя и меньшим, чем в цветовых пространствах, предназначенных специально для HDR-изображений. Но цена этого удовольствия состоит в том, что около 80 % цветов scRGB нереализуемы физически. Для scRGB определены две кодировки: 12 бит на канал и 16 бит на канал. Это пространство используется в некоторых компонентах операционной системы Windows 7 (Direct3D, Windows Color System и другие).
Пространство RIMM RGB (Reference Input Medium Metric) предназначено для использования в качестве устройство-независимого пространства для обработки исходных raw-изображений, полученных с помощью обычных входных устройств, таких как цифровые камеры и сканеры. Изображения, закодированные в этом пространстве, могут быть помещены в архив в качестве исходных, не подвергавшихся редактированию (изменению цвета). Определены кодировки 8, 12 и 16 бит на канал. Базовые цвета в RIMM RGB те же, что и в ROMM RGB, которое, напомню, предназначено для редактирования изображений, уже переведенных из raw-формата (подвергавшихся редактированию).
В RIMM RGB предполагается, что цвета сцены воспринимаются при определенных условиях просмотра, в качестве которых выбраны типичные условия съемки на природе (точка белого D50, яркость не менее 1,600 кд/м2 и так далее). Это, конечно, не означает, что снимать нужно именно при таких условиях. Способ кодировки значений координат цвета для RIMM RGB задан исходя из свойств «обобщенного» входного устройства (базовые цвета, точки белого и черного и другие).
RGB-пространства могут быть преобразованы к полярным координатам. Целью такого преобразования является попытка приписать координатам цвета более понятный смысл, чем R, G, B, а именно: тон, насыщенность и яркость. Представить наглядно, как это делается, поможет следующее рассуждение. Возьмем какое-либо RGB-пространство. Напомню, что это – куб, в котором нейтрально серые цвета расположены на диагонали из вершины {0, 0, 0} в вершину {100 %, 100 %, 100 %}. Повернем этот куб так, чтобы эта диагональ стала вертикальной, а черная вершина куба оказалась внизу. Нелинейным преобразованием «скруглим» куб, чтобы он превратился в биконус. Получим цветовое пространство HSL. Остальные ЦП этой серии получаются другими нелинейными преобразованиями куба RGB, стоящего на вершине {0, 0, 0}.
Поскольку для перехода от RGB к полярным координатам используются примитивные формулы, не учитывающие особенности восприятия цвета человеком, то свойства полученных координат сильно отличаются от заявленных. Так, например в пространстве HSV (hue, saturation, value или HSB, brightness) среди точек, имеющих 100 %-е насыщение, светлые точки кажутся гораздо менее насыщенными, чем темные. В пространстве HSL (L – lightness) насыщенность фактически определена как доля от наибольшей насыщенности, возможной при данной яркости. Насыщенные желтый и голубой цвета, имеющие в этих пространствах одинаковые значения координат «яркость» и «насыщенность», на глаз воспринимаются как цвета с разной яркостью.
Для пространства HSV максимально увеличить координату V для какого-нибудь цвета означает получить самый яркий цвет для данной пары тон-насыщенность. Для пространства HSL максимально увеличить координату L означает получить белый цвет, независимо от значений остальных координат.
Такие «странности» приводят к тому, что вместо этих пространств стараются использовать цветовую модель CIELAB. Особенно тогда, когда важно четко отделить цветность от яркости.
В пространствах HSV, …сохраняется неоднородность по восприятию, присутствующая в исходных RGB-пространствах. Для того чтобы точно определить цвет, выраженный в координатах этих пространств, необходимо знать свойства того RGB-пространства, от которого они произведены (базовые цвета, точку белого и формулу гамма-коррекции).
В заключение приведем таблицу, содержащую значения некоторых параметров модели RGB для перечисленных выше цветовых пространств. В таблице даны значения координат CIEXYZ, пересчитанные по формулам x=X/(X+Y+Z), y=Y/(X+Y+Z).
На этом закончим краткий обзор модели RGB. Скажем еще, что существуют устройства, использующие цветовые модели с количеством базовых стимулов большим трех. Например, модели RYGB и RYGCB (в телевизорах фирмы Шарп). Гамут последней цветовой модели покрывает 99 % гамута Пойнтера.
2.5. Цветовые модели CIELAB и CMYK
В цветовой модели CIELAB сделана попытка учесть особенности восприятия цвета человеком. Все пространства этой модели получены определенным нелинейным преобразованием пространства CIEXYZ, подобранным так, чтобы улучшить соответствие тому, как человек воспринимает разности цветов. То есть, пространства CIELAB являются более однородными по восприятию, чем CIEXYZ и CIERGB. Другими словами, в CIELAB воспринимаемое различие между двумя близкими цветами приблизительно пропорционально расстоянию между соответствующими точками. Пространство CIELAB иногда записывается в виде L*a*b* с тем, чтобы подчеркнуть его отличие от цветового пространства Lab, которое было придумано Хантом ранее.
В модели CIELAB используется один параметр: точка белого. Иногда аббревиатура CIELAB означает не модель, а пространство с точкой белого, равной D50. Полезность пространства CIELAB объясняется следующими свойствами.
• Яркость (координата L*) отделена от цветности (координаты a* и b*). Поэтому манипулирование с яркостью и контрастом практически не затрагивает цветность. И наоборот.
• CIELAB является более однородным по восприятию, чем sRGB.
• Цветовой охват CIELAB включает в себя цветовые охваты sRGB, Adobe RGB и CMYK.
• Это пространство является устройство-независимым. То есть, цвета определены без учета возможностей какого-либо устройства, на котором они воспроизводятся или с помощью которого они считываются. Если же в качестве точки белого выбрана самая яркая точка, которую может воспроизвести какое-нибудь устройство, то такое пространство LAB уже окажется устройство-зависимым.
Это пространство нормировано: L*=0 для точки черного и L*=100 для точки белого. Для нейтрально серого цвета a*=0 и b*=0. CIELAB-пространства тоже могут быть представлены в полярных координатах, например, CIELCH.
Пространство CIELAB удобно использовать в качестве промежуточного формата для аппаратно-зависимых пространств. Из-за большого цветового охвата CIELAB все преобразования в нем следует проводить с глубиной цветности не менее, чем 16 бит на канал.
Другими примерами пространств, в которых яркость отделена от цветности, служат пространства, используемые при описании модели восприятия цвета CIECAM02. Модели CIECAM02 посвящен отдельный параграф ниже.
Перейдем к цветовой модели CMYK (произносится «смик»), которая моделирует отображение цветов принтерами и обычно является аппаратно-зависимой. Каждая тройка чернила-принтер-бумага в рамках этой модели может иметь свое собственное цветовое пространство. Смысл числовых значений координат CMYK по сравнению с RGB обратный: 0 – это максимальное количество цвета данного канала, 255 для 8-битной глубины цветности – это отсутствие цвета данного канала. Если преобразование RGB-координат в CMY-координаты элементарно простое, то пересчет из CMY в CMYK можно выполнить по-разному. Один из простейших вариантов: {C, M, Y} – > { K = min(C, M, Y), C – K, M – K, Y – K, }. Реальные варианты гораздо сложнее и учитывают многие характеристики чернил, бумаги, оборудования и даже температуру и влажность воздуха возле печатной машины.
В пространстве CMY нейтральные цвета определены как C = M = Y. В пространстве CMYK – как C = M = Y = 0.
Распечатанное изображение гораздо сильнее зависит от условий просмотра, чем изображение на экране монитора. Чтобы вычислить видимый цвет малого кусочка картинки, нужно взять спектр источника освещения и умножить его на спектральные коэффициенты отражения чернил, которыми закрашен этот кусочек, и просвечивающей сквозь них бумаги. Полученный спектр отраженного от этого кусочка света и позволит определить искомый цвет, воспринимаемый человеком. Усложняет дело то, что, если заменить источник освещения другим, имеющим тот же самый цвет, но другой спектр (метамерный), то видимый цвет кусочка может измениться!
Цветовой охват CMYK для обычных принтеров больше цветового охвата sRGB (в светло-голубых и светло-зеленых тонах), но меньше цветового охвата Adobe RGB (1998).
Четырехцветная печать CMYK не всегда может отобразить светлые насыщенные цвета. Поэтому часто используют шестицветную печать CcMmYK и даже еще более многоцветную.
А теперь вспомним то, о чем говорилось в предыдущей главе и опишем процессы, происходящие в сетчатке глаза, в терминах цветовых пространств. Рецепторы сетчатки реагируют на видимый цвет и выдают сигнал, похожий на значения координат в пространстве RGB (точнее, в пространстве «колбочковых ответов» LMS). Затем спектрально оппонентные ганглиозные клетки преобразуют rgb-сигнал, опять же приблизительно, в координаты CIELAB.
Зачем могло понадобиться использовать такие нетривиальные координаты в зрительной системе человека? Этот факт может быть объяснен тем, что цветовое зрение в процессе эволюции возникло на основе черно-белого. К рецепторам-палочкам, дающим сигнал только о яркости (значение координаты L*), добавились колбочки. Сигналы от трех видов колбочек (приблизительно – красный, зеленый и синий цвета) нейроны сетчатки преобразуют только в две дополнительные цветовые координаты a* (разность зеленого и красного) и b* (разность синего и желтого). Что вместе с координатой L* и дает цвет. В пространстве RGB объединить сигнал палочек и колбочек было бы сложнее. Простое добавление трех координат RGB к координате L привело бы к избыточности (четыре значения вместо трех). Упразднение координаты L и рецепторов-палочек вызвало бы потерю зрения в сумерках.
Кстати, то, что не бывает красно-зеленого и сине-желтого цветов, как раз и объясняется тем, что такие цвета невозможно описать в координатах a* и b*.
2.6. Колориметрические отображения
После того как были определены цветовые пространства, нужно объяснить, как преобразовывать изображения из одного цветового пространства в другое. В процессе компьютерной обработки неизбежно приходится это делать, явно или неявно. Так, картинка, полученная сканером или цифровой фотокамерой, представляет собой множество точек (пикселей), координаты которых даны в цветовом пространстве данного устройства. Эта картинка преобразуется в независящее от устройства рабочее цветовое пространство графического редактора. Затем, для просмотра – в цветовое пространство монитора. И, наконец, после обработки в редакторе – в цветовое пространство принтера. Если эти преобразования не делать, то камера запишет в файл одни цвета, монитор покажет другие, а принтер напечатает третьи, несмотря на то, что во всех трех случаях числовые значения координат цвета в файле будут одними и теми же. И останется только надеяться, что все три цветовых пространства не будут сильно различаться.
Но, как правило, цветовые охваты входного и выходного цветового пространства далеко не одинаковые. Например, как уже многократно упоминалось, некоторые светлые зелено-голубые оттенки обычный струйный принтер может воспроизвести, а обычный монитор – нет. Поэтому при переходе сохранить все цвета не удастся, и нужно решить, чем можно будет пожертвовать и каким образом.
Чтобы определить, каким цветом выходного пространства изобразить данный цвет входного (то есть, задать gamut mapping, соответствие цветовых охватов), таблицу соответствия, конечно, не составляют. Вместо этого задают алгоритм такого преобразования (это еще называется «вид колориметрического отображения» или «тип цветопередачи», rendering intent).
Для обработки пейзажей важны два следующих алгоритма преобразования цветовых пространств: перцептивный и колориметрический. Первый пытается сохранить общий вид картинки в ущерб точности цветов. Второй, наоборот, пытается точно воспроизвести цвета, даже если при этом общий вид картинки пострадает.
Колориметрических алгоритмов тоже два: относительный (относительно точки белого среды, то есть, бумаги, экрана монитора, пленки слайда или виртуальной среды аппаратно-независимого ЦП) и абсолютный. Абсолютный старается передать цвета без каких-либо изменений, а относительный – изменяет цвета так, чтобы точка белого входного пространства изображалась цветом точки белого выходного пространства.
В первом приближении эти алгоритмы можно описать так (для случая, когда цветовой охват выходного пространства меньше).
Перцептивное, или воспринимаемое, отображение равномерно (или S-образно) сжимает входное цветовое пространство так, чтобы оно целиком вошло в выходное. При этом изменяются все цвета, даже и те, которые входят в оба пространства и, вообще говоря, могли бы не изменяться при преобразовании. Сделано это для того, чтобы сохранить соотношение для всех цветов, а не только для воспроизводимых в выходном пространстве. Если не сжимать все цвета входного пространства, то чтобы «втиснуть» в выходное пространство новые цвета не было бы места. Таким образом, при перцептивном отображении сохраняется правильное соотношение между всеми цветами входного пространства, но теряется идентичность цветов из общей части обоих пространств (при переходе такие цвета тоже изменяются).
Сохранение соотношения всех цветов означает, что для любых двух цветов выполняется следующее:
• если до преобразования один цвет был светлее другого, то и после преобразования он останется светлее, хотя яркость обоих цветов может измениться;
• если до преобразования один цвет был насыщеннее другого, то и после преобразования он останется насыщеннее, хотя насыщенность обоих цветов может измениться;
• если до преобразования один цвет был, например, зеленее другого, то и после преобразования он останется зеленее, хотя цветовой тон обоих цветов может измениться.
При сжатии ЦП, контраст и насыщенность всегда падают. S-образное сжатие позволяет лучше (по сравнению с линейным случаем) сохранить контраст в средних тонах. Но за счет еще большего уменьшения контраста в темных и светлых частях изображения.
Разумеется, если выходное пространство больше входного, то перцептивное отображение растягивает входное цветовое пространство, а контраст и насыщенность при этом возрастают.
Все это только в первом приближении. В идеале перцептивное отображение должно использовать цветовой охват не всего входного пространства, а гамут конкретного изображения, представленного в этом пространстве. Последний часто существенно меньше, и требует меньшего сжатия и, следовательно, не такого сильного уменьшения насыщенности и контраста.
На практике перцептивное отображение использует некоторую промежуточную степень сжатия ЦП, которая зафиксирована в профиле соответствующего устройства. Такую степень каждый автор профиля определяет по-своему, исходя из цветового охвата устройства и некоторой оценки того цветового охвата, который обычно встречается в фотографиях.
Относительное колориметрическое отображение преобразует яркости линейно и так, чтобы точка белого входного пространства попала в точку белого выходного пространства. Таким образом, детали светлых частей изображения не будут потеряны, но за счет ухудшения других цветов. Так, если точка белого выходного пространства темнее, то и вся картинка станет темнее, и может произойти потеря деталей в тенях. Если цветности точек белого входного и выходного пространств разные, то цвета входного пространства изменяются соответственно. Например, если точка белого выходного пространства голубее, то все цвета входного пространства смещаются в голубую сторону.
Для того чтобы смягчить недостатки относительного отображения, применяют «компенсацию точки черного». Идея этого алгоритма состоит в том, чтобы с помощью линейного (или нелинейного) преобразования цвета в области теней добиться того, чтобы, дополнительно, точка черного входного пространства попала в точку черного выходного пространства. Таким образом, детали сохраняются и в светлых и в темных частях изображения, но падает общий контраст и насыщенность.
В том случае, когда точка черного выходного пространства светлее точки черного входного пространства, тени получаются светлее, а цвета в тенях менее насыщенными. В этом случае результат применения этого алгоритма можно представить как добавление небольшого количества белого цвета ко всем или только к темным цветам картинки (эффект тумана). Или вычитание (туман рассеялся), если точка черного выходного пространства темнее.
А что происходит с цветностью? В отличие от перцептивного отображения, при относительном отображении идентичность цветов из общей части обоих пространств сохраняется, но только в относительном смысле, относительно точки белого. Например, точка белого бумаги часто более желтая, чем точка белого монитора. Выравнивание точек белого приведет к тому, что области фотографии, выглядящие белыми на мониторе, будут напечатаны желтоватыми и все остальные цвета сдвинутся в желтую сторону на величину, равную разности между этими двумя точками белого. Кроме этого, поскольку в выходном пространстве нет места для цветов входного пространства, отсутствующих в выходном, то такие цвета заменяются наиболее близкими к ним цветами выходного пространства (например, с помощью понижения насыщенности). В результате происходит клиппирование цвета, то есть, два разных цвета входного пространства могут перейти в один и тот же цвет выходного пространства.
Если печатать картинку на бумаге разного оттенка с помощью относительного отображения, то принтер будет в каждом случае использовать одно и то же количество чернил для соответствующих точек изображения. Плотность красок будет одна и та же, но картинки, размещенные рядом друг с другом, могут выглядеть по-разному, потому что глаза не смогут одновременно адаптироваться к разным цветам бумаги и будут воспринимать цвета картинки в сумме с цветом бумаги. Если картинки сравнивать по очереди, так, чтобы глаза успевали переадаптироваться, то обнаружить разницу будет труднее.
Абсолютное колориметрическое отображение полностью сохраняет идентичность цветов из общей части обоих пространств, не учитывая различие точек белого и черного. В рассмотренном выше примере цвета, воспроизводимые и на мониторе и на принтере, будут напечатаны без изменений. Цвета, невоспроизводимые на принтере, будут клиппированы. В частности, области фотографии, выглядящие белыми на мониторе, будут напечатаны белыми, если белый цвет воспроизводится на принтере с желтоватой бумагой. Если же нет, то белый цвет будет клиппирован (например, заменен на желтоватый).
Если нужно посмотреть на экране монитора, как будет выглядеть эта же картинка, напечатанная на бумаге, то какое отображение следует использовать? Для простоты рассмотрим случай, когда цветовой охват картинки полностью вписывается в цветовой охват монитора. В случае абсолютного колориметрического отображения на экране воспроизведется желтоватый цвет бумаги, а для относительного – нет.
Абсолютное колориметрическое отображение используется, в частности, для того, чтобы напечатать картинку на одном принтере так, чтобы она выглядела так же, как если бы была напечатана на другом принтере или на печатной машине. При этом, если точка белого входного пространства темнее точки белого выходного, то белые области изображения будут напечатаны темнее, чем точка белого выходного пространства. При данном отображении, в отличие от относительного, могут возникать границы между пустым пространством (полями) и белыми областями картинки.
Если печатать картинку на бумаге разного цвета с помощью абсолютного отображения, то принтер учтет разные точки белого и будет использовать разные количества чернил для соответствующих точек изображения. Плотность красок будет разная, но картинки, размещенные рядом друг с другом, могут выглядеть одинаково.
Чтобы наглядно продемонстрировать разницу между двумя видами колориметрического отображения, я подкорректировал профиль принтера так, чтобы сместить точку белого в сторону желтого цвета. Точка белого в профиле была задана в пространстве CIEXYZ, поэтому я уменьшил значение координаты Z. На рисунке 2.1 показана получившаяся точка белого и результаты имитации распечатки принтера на экране монитора (softproof), для двух видов колориметрического отображения (река Немда, недалеко от города Советск, Кировская область).
Рис. 2.1. Имитация распечатки принтера на экране монитора с использованием разных колориметрических отображений: а) точка белого, заданная в профиле; б) абсолютное колориметрическое; в) относительное колориметрическое. Получено с помощью программы RawTherapee (пояснения в тексте).
Видим, что относительное колориметрическое отображение построило картинку относительно точки белого монитора, что привело к исчезновению влияния точки белого для принтера.
Так какой же вариант колориметрического отображения выбрать? Ответ на этот вопрос зависит от разных факторов:
• от цветового охвата конкретного изображения,
• от цели обработки изображения (нужного уровня цветовоспроизведения, см. ниже).
Например, если цвета, которые были бы клиппированы при относительном отображении, составляют незначительную часть данной картинки, и детали в этих цветах несущественны, то, возможно, следует выбрать именно этот вид отображения.
Понимая свойства колориметрических отображений, можно предвидеть (и подтвердить экспериментально), что произойдет с конкретным изображением. Упрощая, можно сказать, что перцептивное отображение изменяет все цвета, но сохраняет то, как изображение воспринимается, а колориметрическое сохраняет некоторые цвета, а другие портит. Перцептивное отображение вписывает изображение в цветовой охват и диапазон яркостей выходного пространства, а колориметрическое копирует цвета (для относительного – с учетом разницы между точками белого), которые находятся внутри цветового охвата выходного пространства, и минимальным образом искажает цвета, которые находятся вне его. Перцептивное отображение создает визуально-комфортное изображение, например, насыщенность может быть повышена, если выходное ЦП это позволяет. Перцептивное отображение используется, когда нужно правильно изобразить плавные переходы и градиенты цвета на границе цветового охвата выходного пространства. Колориметрическое (оба варианта) используется тогда, когда важнее обеспечить тождественность цветов. Но при этом не используются дополнительные цвета выходного ЦП (если они есть) и может произойти клиппирование цвета.
Если точки белого входного и выходного ЦП совпадают, то оба колориметрических отображения дадут одинаковый результат.
Если цветовой охват принтера очень большой (например, как у принтера Canon iPROGRAF PRO-500, использующего 11 видов чернил), то абсолютное колориметрическое отображение может дать более точную цветопередачу для фотографий.
Одним из подходов к повышению качества алгоритмов преобразования цветовых охватов состоит в том, что для одного ЦП задают многооболочечный цветовой охват (multishelled), состоящий из нескольких вложенных друг в друга цветовых охватов: справочного или типового (reference gamut), правдоподобного (plausible gamut) и возможного (possible gamut). И алгоритмы сопоставления цветовых охватов применяют разные правила для разных областей, на которые эти оболочки разбивают ЦП. Например, типовой гамут может иметь точку белого темнее точки белого правдоподобного гамута. Первая используется для чисто белого цвета, а вторая – для изображения бликов. Аналогично точка черного типового гамута может использоваться в качестве предела при изображении деталей в тенях, а точка черного правдоподобного гамута быть еще темнее.
Как определить, что нужно сделать с цветом конкретной фотографии, что можно, а что нельзя? Различают несколько вариантов подхода к решению этой проблемы. Выбор конкретного варианта (уровня цветовоспроизведения), естественно, зависит от того, как будет в дальнейшем использоваться изображение. Возможны следующие уровни цветовоспроизведения:
• произвольное (как получится),
• визуально-комфортное (приятное на вид, pleasing color reproduction),
• колориметрическое (используются калибровка и профилирование, условия просмотра одинаковы, см. следующий параграф),
• по восприятию (колориметрическое с учетом разных условий просмотра),
• приоритетное (целенаправленная манипуляция цветом ради достижения нужного эффекта, color preference reproduction),
• оптимальная репродукция: максимальное сохранение цветового тона, минимальное масштабирование светлоты с сохранением отношений и среднего уровня, масштабирование насыщенности с сохранением отношений.
В пейзажной фотографии чаще всего применяют визуально-комфортное и приоритетное цветовоспроизведение. Но повышение насыщенности и контраста в целях визуально-комфортного цветовоспроизведения является в то же время и частичным учетом разницы в условиях просмотра реального пейзажа и отпечатка фотоснимка, то есть цветовоспроизведением по восприятию.
Визуально-комфортному цветовоспроизведению способствует, помимо всего прочего, и применение формальных правил типа «правила третей» или правила «60–30–10». Последнее правило используется дизайнерами и состоит в том, что доминантный цвет должен занимать 60 % площади картинки, а два акцентирующих цвета – соответственно 30 % и 10 %. Не знаю, применимо ли это правило к снимкам пейзажей. Скажем, зелень – 60 %, синее небо – 30 % и что-нибудь необычное – 10 %?
2.7. Модели восприятия цвета
Колориметрические отображения, описанные в предыдущем разделе, определяли способ преобразования одного цветового пространства в другое. Модели восприятия цвета (color appearance model) используются для описания преобразования цвета с учетом не только разных цветовых охватов используемых пространств и разных точек белого, но и еще двух обстоятельств:
• условий просмотра конечного изображения (viewing conditions),
• возможного целенаправленного изменения цвета изображения (i preference adjustments).
Под целенаправленным изменением цвета изображения подразумевается намеренное искажение цвета для того, чтобы получить нужный эффект. Для пейзажей часто усиливают насыщенность оттенков, зелень листвы, синеву неба. В этих случаях считают более важным добиться желаемого впечатления, нежели воспроизвести реальные цвета.
К условиям просмотра относятся:
1) спектральное распределение энергии источника освещения (при просмотре),
2) уровень фотометрической яркости изображения, фона и окружения,
3) размер цветного образца, расстояние и геометрия просмотра,
4) степень адаптации зрительной системы наблюдателя.
То, какой цвет человек видит, рассматривая предмет, определяется не только спектральным распределением энергии отраженного света, но и размером, формой, структурой предмета, фоном, а также состоянием адаптации зрительной системы наблюдателя и его личным опытом предыдущих наблюдений этого предмета. Для того чтобы уменьшить влияние условий просмотра, художники, в частности, используют серый холст, а графические редакторы – темно-серый фон.
Кроме перечисленного на восприятие изображения оказывает влияние посторонний свет, отраженный от поверхности картинки (veiling glare), например, отблеск, вызванный глянцем. Такой отблеск осветляет и уменьшает контраст темных частей картинки.
Обнаружено много ситуаций, в которых воспринимаемый цвет, яркость, и другие свойства отличаются от фактических. Например:
• симультанный контраст (simultaneous contrast): изменение воспринимаемой яркости и цветового тона при изменении яркости и цвета фона;
• эффект Бецольда-Брюкке (Bezold-Brucke): изменение воспринимаемого цветового тона при изменении фотометрической яркости (luminance);
• эффект Эбнея (Abney): изменение воспринимаемого цветового тона при изменении насыщенности (например, при добавлении белого цвета);
• эффект Ханта (Hunt): увеличение воспринимаемой полноты цвета (colorfulness) с увеличением фотометрической яркости;
• эффект Стивенса (Stevens): увеличение воспринимаемого контраста (brightness contrast) с увеличением фотометрической яркости;
• эффект Бартлесона-Бренемана (Bartleson-Breneman): воспринимаемый контраст уменьшается при затемнении окружения (surround);
• эффект размера (color size effect): воспринимаемая яркость и цветность (lightness and chroma) увеличиваются с ростом размера цветового образца;
• эффект Гельмгольца-Кольрауша (Helmholtz—Kohlrausch): воспринимаемая яркость возрастает с ростом насыщенности.
Воспринимаемая яркость очень сильно зависит от степени адаптации зрительной системы к (изменившейся) яркости освещения. Если яркость освещения возросла, говорят об адаптации к свету, то есть, об уменьшении чувствительности зрительной системы. Если яркость освещения, наоборот, уменьшилась, говорят о темновой адаптации, то есть, об увеличении