Введение в техническое зрение презентация

Содержание

Слайд 2

Модель камеры Камера и человеческий глаз Восприятие света и цвета

Модель камеры
Камера и человеческий глаз
Восприятие света и цвета
Пиксели
Фильтрация изображений
Практическое задание: линейные

фильтры

Дальше

Слайд 3

Проективная геометрия и модели камеры Slides from Derek Hoiem, Alexei

Проективная геометрия и модели камеры

Slides from Derek Hoiem, Alexei Efros, Steve

Seitz, and David Forsyth

Сегодняшнее занятие

Слайд 4

Что нужно, чтобы сделать камеру?

Что нужно, чтобы сделать камеру?

Слайд 5

Какого роста женщина? Который мяч ближе? Как высоко установлена камера?

Какого роста женщина?

Который мяч ближе?

Как высоко установлена камера?

Как камера повёрнута?

Каково фокусное

расстояние?

Камера и реальный мир

Слайд 6

Давайте сделаем камеру Идея 1: поместим плёнку перед объектом Получим

Давайте сделаем камеру
Идея 1: поместим плёнку перед объектом
Получим ли мы изображение?

Почему?

Slide source: Seitz

Формирование изображения

Слайд 7

Идея 2: добавим барьер и отсечем почти все лучи Это

Идея 2: добавим барьер и отсечем почти все лучи
Это уменьшит размытие
Отверстие известно

как диафрагма (aperture)

Slide source: Seitz

Камера-обскура

Слайд 8

Figure from Forsyth f f = фокусное расстояние c =

Figure from Forsyth

f

f = фокусное расстояние
c = центр камеры (центр проекции)
Image

plane = картинная плоскость

c

Камера-обскура: модель

Слайд 9

Известна со времен Древнего Китая и Греции (Mo-Ti, China, 470BC

Известна со времен Древнего Китая и Греции (Mo-Ti, China, 470BC - 390BC)

Иллюстрация

Camera obscura

Настоящая камера обскура в Университете Северной Каролины
Photo by Seth Ilys

Камера-обскура: пре-камера

(лат. camera obscūra — «тёмная комната»)

Слайд 10

Lens Based Camera Obscura, 1568 Камера-обскура: применение (обводка)

Lens Based Camera Obscura, 1568

Камера-обскура: применение (обводка)

Слайд 11

Самая старая сохранившаяся фотография 8 часов, пьютерная (оловянная) пластина Жозеф

Самая старая сохранившаяся фотография
8 часов, пьютерная (оловянная) пластина

Жозеф Ньепс, 1826

Фотография первой

фотографии

Университет Техаса, Остин

Ньепс позже работал с Луи Дагером над созданием дагеротипов

Первые фотографии: Ньепс, 8 часов

Слайд 12

Первые фотографии: дагерротип, 20 минут 1864 1837

Первые фотографии: дагерротип, 20 минут

1864

1837

Слайд 13

Figures © Stephen E. Palmer, 2002 Трехмерный мир Двумерное изображение

Figures © Stephen E. Palmer, 2002

Трехмерный мир

Двумерное изображение

Изображение – отображение сцены

на плоскости

Машина для уменьшения размерности

Слайд 14

Slide source: Seitz Проекция может быть обманчива

Slide source: Seitz

Проекция может быть обманчива

Слайд 15

Slide source: Seitz Проекция может быть обманчива

Slide source: Seitz

Проекция может быть обманчива

Слайд 16

Что теряется? Длина (расстояние) Которые ближе? Кто выше? Проективная геометрия

Что теряется?
Длина (расстояние)

Которые ближе?

Кто выше?

Проективная геометрия

Слайд 17

Figure by David Forsyth B’ C’ A’ Расстояние не сохраняется

Figure by David Forsyth

B’

C’

A’

Расстояние не сохраняется

Слайд 18

Что теряется? Длина Углы Перпендикулярные? Параллельные? Проективная геометрия

Что теряется?
Длина
Углы

Перпендикулярные?

Параллельные?

Проективная геометрия

Слайд 19

Что сохраняется? Прямые линии остаются прямыми Проективная геометрия

Что сохраняется?
Прямые линии остаются прямыми

Проективная геометрия

Слайд 20

Параллельные в реальности линии пересекаются на кадре в точках схода, образующих… Точки схода

Параллельные в реальности линии пересекаются на кадре в точках схода, образующих…

Точки

схода
Слайд 21

Параллельные в реальности линии пересекаются на кадре в точках схода,

Параллельные в реальности линии пересекаются на кадре в точках схода, образующих… линию

горизонта

Точки схода и линия горизонта

Слайд 22

o Точка схода o Точка схода Линия горизонта Линия горизонта


o

Точка схода

o

Точка схода

Линия горизонта

Линия горизонта

Слайд 23

Slide from Efros, Photo from Criminisi Линия горизонта


Slide from Efros, Photo from Criminisi

Линия горизонта

Слайд 24

Photo from online Tate collection Линия горизонта

Photo from online Tate collection

Линия горизонта

Слайд 25

Линия горизонта

Линия горизонта

Слайд 26

Проекция: мировые координаты -> экранные координаты

Проекция: мировые координаты -> экранные координаты

Слайд 27

Преобразование к однородным координатам Однородные экранные координаты Однородные мировые координаты Преобразование ИЗ однородных координат Однородные координаты


Преобразование к однородным координатам

Однородные экранные координаты

Однородные мировые координаты

Преобразование ИЗ однородных координат

Однородные координаты

Слайд 28

Инвариантность к масштабу Точке в декартовых координатах соответствует луч в

Инвариантность к масштабу
Точке в декартовых координатах соответствует луч в однородных

Однородные координаты

Декартовы координаты

Однородные координаты

Слайд 29

Уравнение прямой: ax + by + c = 0 Добавить

Уравнение прямой: ax + by + c = 0
Добавить «1» для

перехода в однородные координаты
Прямая получается как векторное произведение двух точек
Пересечение прямых получается как векторное произведение прямых

Базовая геометрия однородных координат

Слайд 30

Декартовы: (Inf, Inf) Однородные: (1, 1, 0) Пересечение параллельных прямых

Декартовы: (Inf, Inf)
Однородные: (1, 1, 0)
Пересечение параллельных прямых

Декартовы: (Inf, Inf)
Однородные:

(1, 2, 0)

Ещё одна проблема, решаемая однородными координатами

Слайд 31

Slide Credit: Saverese x: Экранные координаты: (u,v,1) K: Внутренняя матрица

Slide Credit: Saverese

x: Экранные координаты: (u,v,1)
K: Внутренняя матрица (3x3)
R: Вращение (3x3)


t: Перенос (3x1)
X: Мировые координаты: (X,Y,Z,1)

Ow

iw

kw

jw

R,T

Матрица проекции

Слайд 32

Соотнесение множества видов Зачем это надо?

Соотнесение множества видов

Зачем это надо?

Слайд 33

Распознавание объектов (CVPR 2006) Зачем это надо?

Распознавание объектов (CVPR 2006)

Зачем это надо?

Слайд 34

Дополненная реальность (SIGGRAPH 2007) Оригинал Дополнение Зачем это надо?

Дополненная реальность (SIGGRAPH 2007)

Оригинал

Дополнение

Зачем это надо?

Слайд 35

K Slide Credit: Saverese Внутренние допущения Единичное соотношение Оптический центр

K

Slide Credit: Saverese

Внутренние допущения
Единичное соотношение
Оптический центр в (0,0)
Нет

перекоса

Внешние допущения
Нет поворота
Камера в (0,0,0)

Матрица проекции

Слайд 36

Внутренние допущения Единичное соотношение Нет перекоса Внешние допущения Нет поворота

Внутренние допущения
Единичное соотношение
Нет перекоса

Внешние допущения
Нет поворота
Камера в

(0,0,0)

Убираем допущения: известный оптический центр

Слайд 37

Внутренние допущения Нет перекоса Внешние допущения Нет поворота Камера в (0,0,0) Убираем допущения: квадратные пиксели

Внутренние допущения
Нет перекоса

Внешние допущения
Нет поворота
Камера в (0,0,0)

Убираем допущения:

квадратные пиксели
Слайд 38

Note: different books use different notation for parameters Внутренние допущения

Note: different books use different notation for parameters

Внутренние допущения

Внешние допущения
Нет

поворота
Камера в (0,0,0)

Убираем допущения: прямые пиксели

Слайд 39

Ow iw kw jw t R Убираем допущения: перенос и поворот камеры

Ow

iw

kw

jw

t

R

Убираем допущения: перенос и поворот камеры

Слайд 40

Внутренние допущения Внешние допущения Нет поворота Убираем допущения: перенос камеры

Внутренние допущения

Внешние допущения
Нет поворота

Убираем допущения: перенос камеры

Слайд 41

Поворот вокруг координатных осей, против час.стрелки: z Slide Credit: Saverese Трехмерный поворот точек

Поворот вокруг координатных осей, против час.стрелки:

z

Slide Credit: Saverese

Трехмерный поворот точек

Слайд 42

Убираем допущения: разрешаем поворот камеры

Убираем допущения: разрешаем поворот камеры

Слайд 43

5 6 Степени свободы

5

6

Степени свободы

Слайд 44

Vanishing Point = Projection from Infinity

Vanishing Point = Projection from Infinity

Слайд 45

Особый случай перспективной проекции Также называется параллельной проекцией Какова матрица

Особый случай перспективной проекции
Также называется параллельной проекцией
Какова матрица проекции?

Image

World

Slide by Steve Seitz

Ортографическая

проекция
Слайд 46

Особый случай перспективной проекции Размеры объектов малы по сравнению с

Особый случай перспективной проекции
Размеры объектов малы по сравнению с расстоянием до

камеры
Также называется «моделью слабой перспективы»
Какова матрица проекции?

Image

World

Slide by Steve Seitz

Масштабируемая ортографическая проекция

Слайд 47

Поле зрения (зум, фокусное расстояние)

Поле зрения (зум, фокусное расстояние)

Слайд 48

Suppose we have two 3D cubes on the ground facing

Suppose we have two 3D cubes on the ground facing the

viewer, one near, one far.
What would they look like in perspective?
What would they look like in weak perspective?

Photo credit: GazetteLive.co.uk

Слайд 49

Image from Martin Habbecke Коррекция дисторсии (undistort) За пределами камеры-обскуры: радиальная дисторсия

Image from Martin Habbecke

Коррекция дисторсии (undistort)

За пределами камеры-обскуры: радиальная дисторсия

Слайд 50

Точки схода и линия горизонта Модель камеры обскуры и матрица проекции Однородные координаты Что запомнить?

Точки схода и линия горизонта
Модель камеры обскуры и матрица проекции
Однородные координаты

Что

запомнить?
Слайд 51

Сделать из «зеркалки» камеру обскура Измерить угол зрения камеры Домашнее задание

Сделать из «зеркалки» камеру обскура
Измерить угол зрения камеры

Домашнее задание

Слайд 52

Adding a lens A lens focuses light onto the film

Adding a lens

A lens focuses light onto the film
There is a

specific distance at which objects are “in focus”
other points project to a “circle of confusion” in the image
Changing the shape of the lens changes this distance
Слайд 53

Focal length, aperture, depth of field A lens focuses parallel

Focal length, aperture, depth of field

A lens focuses parallel rays onto

a single focal point
focal point at a distance f beyond the plane of the lens
Aperture of diameter D restricts the range of rays

focal point

F

optical center
(Center Of Projection)

Slide source: Seitz

Слайд 54

Depth of field Changing the aperture size or focal length

Depth of field

Changing the aperture size or focal length affects depth

of field

f / 5.6

f / 32

Flower images from Wikipedia http://en.wikipedia.org/wiki/Depth_of_field

Slide source: Seitz

Слайд 55

Shrinking the aperture Why not make the aperture as small

Shrinking the aperture

Why not make the aperture as small as possible?
Less

light gets through
Diffraction effects

Slide by Steve Seitz

Слайд 56

Shrinking the aperture Slide by Steve Seitz

Shrinking the aperture

Slide by Steve Seitz

Слайд 57

Capturing Light… in man and machine CS 143: Computer Vision

Capturing Light… in man and machine

CS 143: Computer Vision
James Hays, Brown,

Fall 2013

Many slides by Alexei A. Efros

Слайд 58

Image Formation Digital Camera The Eye Film

Image Formation

Digital Camera

The Eye

Film

Слайд 59

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence Subsurface scattering Phosphorescence Interreflection

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

Слайд 60

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 61

A photon’s life choices Absorption Diffuse Reflection Reflection Transparency Refraction

A photon’s life choices

Absorption
Diffuse Reflection
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 62

A photon’s life choices Absorption Diffusion Specular Reflection Transparency Refraction

A photon’s life choices

Absorption
Diffusion
Specular Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 63

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 64

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 65

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ1

light source

λ2

Слайд 66

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

Слайд 67

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

t=1

light source

t=n

Слайд 68

A photon’s life choices Absorption Diffusion Reflection Transparency Refraction Fluorescence

A photon’s life choices

Absorption
Diffusion
Reflection
Transparency
Refraction
Fluorescence
Subsurface scattering
Phosphorescence
Interreflection

λ

light source

(Specular Interreflection)

Слайд 69

Lambertian Reflectance In computer vision, surfaces are often assumed to

Lambertian Reflectance

In computer vision, surfaces are often assumed to be ideal

diffuse reflectors with know dependence on viewing direction.
Слайд 70

Обратная трассировка лучей

Обратная трассировка лучей

Слайд 71

Digital camera A digital camera replaces film with a sensor

Digital camera

A digital camera replaces film with a sensor array
Each cell

in the array is light-sensitive diode that converts photons to electrons
Two common types
Charge Coupled Device (CCD)
CMOS
http://electronics.howstuffworks.com/digital-camera.htm

Slide by Steve Seitz

Слайд 72

Sensor Array CMOS sensor

Sensor Array

CMOS sensor

Слайд 73

Sampling and Quantization

Sampling and Quantization

Слайд 74

Interlace vs. progressive scan http://www.axis.com/products/video/camera/progressive_scan.htm Slide by Steve Seitz

Interlace vs. progressive scan

http://www.axis.com/products/video/camera/progressive_scan.htm

Slide by Steve Seitz

Слайд 75

Progressive scan http://www.axis.com/products/video/camera/progressive_scan.htm Slide by Steve Seitz

Progressive scan

http://www.axis.com/products/video/camera/progressive_scan.htm

Slide by Steve Seitz

Слайд 76

Interlace http://www.axis.com/products/video/camera/progressive_scan.htm Slide by Steve Seitz

Interlace

http://www.axis.com/products/video/camera/progressive_scan.htm

Slide by Steve Seitz

Слайд 77

Rolling Shutter

Rolling Shutter

Слайд 78

The Eye The human eye is a camera! Iris -

The Eye

The human eye is a camera!
Iris - colored annulus with

radial muscles
Pupil - the hole (aperture) whose size is controlled by the iris
What’s the “film”?

photoreceptor cells (rods and cones) in the retina

Slide by Steve Seitz

Слайд 79

The Retina

The Retina

Слайд 80

Retina up-close

Retina up-close

Слайд 81

What humans don’t have: tapetum lucidum

What humans don’t have: tapetum lucidum

Слайд 82

© Stephen E. Palmer, 2002 Cones cone-shaped less sensitive operate

© Stephen E. Palmer, 2002

Cones
cone-shaped
less sensitive
operate in

high light
color vision

Two types of light-sensitive receptors

Rods
rod-shaped
highly sensitive
operate at night
gray-scale vision

Слайд 83

Rod / Cone sensitivity

Rod / Cone sensitivity

Слайд 84

© Stephen E. Palmer, 2002 Distribution of Rods and Cones

© Stephen E. Palmer, 2002

Distribution of Rods and Cones

Night Sky: why

are there more stars off-center? Averted vision: http://en.wikipedia.org/wiki/Averted_vision
Слайд 85

Eye Movements Saccades Can be consciously controlled. Related to perceptual

Eye Movements

Saccades
Can be consciously controlled. Related to perceptual attention.
200ms to initiation,

20 to 200ms to carry out. Large amplitude.
Microsaccades
Involuntary. Smaller amplitude. Especially evident during prolonged fixation. Function debated.
Ocular microtremor (OMT)
involuntary. high frequency (up to 80Hz), small amplitude.
Слайд 86

Electromagnetic Spectrum http://www.yorku.ca/eye/photopik.htm Human Luminance Sensitivity Function

Electromagnetic Spectrum

http://www.yorku.ca/eye/photopik.htm

Human Luminance Sensitivity Function

Слайд 87

Why do we see light of these wavelengths? © Stephen

Why do we see light of these wavelengths?

© Stephen E. Palmer,

2002

…because that’s where the
Sun radiates EM energy

Visible Light

Слайд 88

The Physics of Light Any patch of light can be

The Physics of Light

Any patch of light can be completely described
physically

by its spectrum: the number of photons
(per time unit) at each wavelength 400 - 700 nm.

© Stephen E. Palmer, 2002

Слайд 89

The Physics of Light Some examples of the spectra of

The Physics of Light

Some examples of the spectra of light sources

©

Stephen E. Palmer, 2002
Слайд 90

The Physics of Light Some examples of the reflectance spectra

The Physics of Light

Some examples of the reflectance spectra of surfaces

Wavelength

(nm)

% Photons Reflected

© Stephen E. Palmer, 2002

Слайд 91

The Psychophysical Correspondence There is no simple functional description for

The Psychophysical Correspondence

There is no simple functional description for the perceived
color

of all lights under all viewing conditions, but …...

A helpful constraint:
Consider only physical spectra with normal distributions

© Stephen E. Palmer, 2002

Слайд 92

The Psychophysical Correspondence Mean Hue © Stephen E. Palmer, 2002

The Psychophysical Correspondence

Mean

Hue

© Stephen E. Palmer, 2002

Слайд 93

The Psychophysical Correspondence Variance Saturation © Stephen E. Palmer, 2002

The Psychophysical Correspondence

Variance

Saturation

© Stephen E. Palmer, 2002

Слайд 94

The Psychophysical Correspondence Area Brightness © Stephen E. Palmer, 2002

The Psychophysical Correspondence

Area

Brightness

© Stephen E. Palmer, 2002

Слайд 95

© Stephen E. Palmer, 2002 Three kinds of cones: Physiology

© Stephen E. Palmer, 2002

Three kinds of cones:

Physiology of Color Vision

Why are M and L cones so close?
Why are there 3?
Слайд 96

Impossible Colors Can you make the cones respond in ways

Impossible Colors

Can you make the cones respond in ways that typical

light spectra never would?
http://en.wikipedia.org/wiki/Impossible_colors
Слайд 97

Tetrachromatism Most birds, and many other animals, have cones for

Tetrachromatism

Most birds, and many other animals, have cones for ultraviolet light.
Some

humans, mostly female, seem to have slight tetrachromatism.

Bird cone responses

Слайд 98

More Spectra metamers

More Spectra

metamers

Слайд 99

Color Sensing in Camera (RGB) 3-chip vs. 1-chip: quality vs.

Color Sensing in Camera (RGB)

3-chip vs. 1-chip: quality vs. cost
Why more

green?

http://www.cooldictionary.com/words/Bayer-filter.wikipedia

Why 3 colors?

Slide by Steve Seitz

Слайд 100

Practical Color Sensing: Bayer Grid Estimate RGB at ‘G’ cells

Practical Color Sensing: Bayer Grid

Estimate RGB at ‘G’ cells from neighboring values

Slide

by Steve Seitz
Слайд 101

Color Image R G B

Color Image

R

G

B

Слайд 102

Images in Matlab Images represented as a matrix Suppose we

Images in Matlab

Images represented as a matrix
Suppose we have a NxM

RGB image called “im”
im(1,1,1) = top-left pixel value in R-channel
im(y, x, b) = y pixels down, x pixels to right in the bth channel
im(N, M, 3) = bottom-right pixel in B-channel
imread(filename) returns a uint8 image (values 0 to 255)
Convert to double format (values 0 to 1) with im2double

R

G

B

row

column

Слайд 103

Color spaces How can we represent color? http://en.wikipedia.org/wiki/File:RGB_illumination.jpg

Color spaces

How can we represent color?

http://en.wikipedia.org/wiki/File:RGB_illumination.jpg

Слайд 104

Color spaces: RGB Image from: http://en.wikipedia.org/wiki/File:RGB_color_solid_cube.png Some drawbacks Strongly correlated

Color spaces: RGB

Image from: http://en.wikipedia.org/wiki/File:RGB_color_solid_cube.png

Some drawbacks
Strongly correlated channels
Non-perceptual

Default

color space

R
(G=0,B=0)

G
(R=0,B=0)

B
(R=0,G=0)

Слайд 105

Color spaces: HSV Intuitive color space H (S=1,V=1) S (H=1,V=1) V (H=1,S=0)

Color spaces: HSV

Intuitive color space

H
(S=1,V=1)

S
(H=1,V=1)

V
(H=1,S=0)

Слайд 106

Color spaces: YCbCr Y (Cb=0.5,Cr=0.5) Cb (Y=0.5,Cr=0.5) Cr (Y=0.5,Cb=05) Y=0

Color spaces: YCbCr

Y
(Cb=0.5,Cr=0.5)

Cb
(Y=0.5,Cr=0.5)

Cr
(Y=0.5,Cb=05)

Y=0

Y=0.5

Y=1

Cb

Cr

Fast to compute, good for compression, used by TV

Слайд 107

Color spaces: L*a*b* “Perceptually uniform”* color space L (a=0,b=0) a (L=65,b=0) b (L=65,a=0)

Color spaces: L*a*b*

“Perceptually uniform”* color space

L
(a=0,b=0)

a
(L=65,b=0)

b
(L=65,a=0)

Слайд 108

If you had to choose, would you rather go without luminance or chrominance?

If you had to choose, would you rather go without luminance

or chrominance?
Слайд 109

If you had to choose, would you rather go without luminance or chrominance?

If you had to choose, would you rather go without luminance

or chrominance?
Слайд 110

Most information in intensity Only color shown – constant intensity

Most information in intensity

Only color shown – constant intensity

Слайд 111

Most information in intensity Only intensity shown – constant color

Most information in intensity

Only intensity shown – constant color

Слайд 112

Most information in intensity Original image

Most information in intensity

Original image

Слайд 113

Back to grayscale intensity

Back to grayscale intensity

Слайд 114

Восприятие света и цвета Камера и человеческий глаз Сенсоры и

Восприятие света и цвета
Камера и человеческий глаз
Сенсоры и пиксели
Фильтрация изображений
Практическое задание:

линейные фильтры

Дальше

Имя файла: Введение-в-техническое-зрение.pptx
Количество просмотров: 31
Количество скачиваний: 0