Detecção de Imagens
UFF - Visão Computacional e
Processamento de Imagens
PGCC - Mestrado em Ciência da Computação
Leonardo
Bruno Caheté Batista - MatrÃcula: M022100016
Profª Aura Conci

Introdução
Antes de
avaliarmos/analisarmos o comportamento de uma imagem e detectarmos informações válidas
nela, precisamos previamente definir como nossa visão capta estas informações, de que
forma estas imagens são formatadas e que técnicas podem ser utilizadas para auxiliar o
processamento das mesmas.
Um dos problemas
relativos ao estudo de como nós detectamos e processamos imagens visualmente está ligado
ao fato de que todas as pessoas executam esta tarefa diversas vezes ao dia. Qualquer
teoria ou modelo deve satisfazer nosso conhecimento intuitivo de como o processo funciona,
um processo que funciona de forma eficaz e eficiente. O olho humano é sempre comparado a
uma câmera e, em muitos casos, as similaridades são bem evidentes. Há, entretanto, uma
grande diferença: o processo de visualização. Na câmera, as imagens são produzidas no
filme através das mudanças fotoquÃmicas, enquanto que no olho humano as mudanças
fotoquÃmicas provocam impulsos nervosos que são transmitidos ao cérebro. Assim, o
cérebro interpreta estes impulsos como provenientes de objetos situados fora do corpo;
sendo impossÃvel perceber as imagens como se estivessem na retina. Até mesmo as imagens
geradas pelo efeito pós-imagem são projetadas para fora do corpo (ainda que de olhos
fechados).
As duas teorias sobre
visão aceitas mundialmente surgiram na Grécia. A teoria da Emanação propõe que o observador emite um espÃrito visual ou pneuma
originário do cérebro, passando pelo nervo ótico e sendo emanado ao
espaço como um cone de raios lineares. Este espÃrito visual então seria refletido de
volta aos olhos do observador pelos objetos existentes no mundo. Um argumento a favor
desta teoria era o fato de que os olhos dos gatos/cachorros brilhavam à noite
"emanando luz" (na verdade este brilho era um reflexo da retina!). Já a teoria
da Emissão afirma que a luz é composta de pequenas substâncias (átomos -
réplicas exatas) provenientes de corpos luminosos ou iluminados.
Apesar da visão
humana ser bem descrita num nÃvel neuroanatômico, o processamento da informação
realizado pela retina e pelo córtex visual do cérebro permanecem ainda hoje obscuros.
Processamento de Imagens
O processamento de
imagens surgiu da teoria de processamento de sinais e se tornou uma das múltiplas facetas
da teoria da informação. Uma imagem está para a representação ou descrição de um
objeto, pessoa ou cena, trazendo informações através de distribuições de intensidade
de luz. Sendo assim, a visão biológica é muito mais
sensÃvel à mudança de intensidade de luz do que à própria intensidade absoluta da luz
em si.
Mas o que
exatamente o olho humano extrai de informação ao contemplar uma cena ou imagem?
Qual é o objetivo da visão?
A visão nos permite
realizar três tarefas básicas:
Percepção do mundo;
Concepção de uma estratégia
para tomada de decisão;
Execução de uma ação.
Enquanto esta visão
é muito simples para nós humanos, foi provado por muitos especialistas que é muito
complexo ensinar a um computador a funcionar com um sistema de visão (mesmo rudimentar).
Uma causa disto é que até hoje não conseguimos explicar precisamente o processo da
percepção. Não podemos recuperar todas as informações de uma cena apenas pela sua
intensidade. Esta intensidade é, na verdade, resultado de uma combinação de
fatores como a superfÃcie de um objeto, fonte e direção de iluminação, luz ambiente,
condição atmosférica, entre outros.
Em muitas aplicações
de detecção de imagens, a a cena/imagem a ser processada é essencialmente
bi-dimensional, como nos casos de processamento de documentos, reconhecimento de
caracteres, inspeção de superfÃcie e sensoramento remoto. Um objeto consiste de
padrões ("features") e relacionamentos.
Um dos processos mais
importantes de detecção de partes constituintes de uma imagem é chamado de Segmentação,
e utiliza conceitos de casamento de padrões e técnicas de correlação or convolução
para detectar bordas, cantos, buracos e texturas. O processo de segmentação tenta
distinguir "backgrounds" e objetos através da detecção de regiões
"homogêneas" da cena/imagem observada, gerando dados simbólicos provenientes
de dados icônicos. Já o processo de Reconhecimento tenta achar algum relacionamento entre estes dados
simbólicos gerados.
Aplicações <
Abaixo estão alguns link
relacionados a áreas que utilizam na prática as técnicas de processamento e detecção
de imagens. O objetivo deste trabalho é oferecer um visão global de como o processamento
de imagens pode ser utilizado no cotidiano da humanidade, facilitando em muitos pontos a
tomada de certas decisões (de forma automatizada).