Download PDF
ads:
UNIVERSIDADE FEDERAL FLUMINENSE
ÉLDMAN DE OLIVEIRA NUNES
SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS
NITERÓI
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ÉLDMAN DE OLIVEIRA NUNES
SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS
Tese apresentada ao Curso de Pós-Graduação em
Computação da Universidade Federal Fluminense, como
requisito parcial para obtenção do Grau de Doutor. Área
de Concentração: Computação Visual e Interfaces.
Orientador: Profa. Dra. AURA CONCI
NITERÓI
2006
ads:
ÉLDMAN DE OLIVEIRA NUNES
SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS
Tese apresentada ao Curso de Pós-Graduação em
Computação da Universidade Federal Fluminense, como
requisito parcial para obtenção do Grau de Doutor. Área
de Concentração: Computação Visual e Interfaces.
Aprovada em 4 de agosto de 2006.
BANCA EXAMINADORA
___________________________________________________________________________
Profa.Dra. AURA CONCI - Orientadora
UFF
___________________________________________________________________________
Prof.Dr. ÁNGEL SÁNCHEZ CALLE
URJC
___________________________________________________________________________
Prof.Dr. ANTONIO ALBERTO FERNANDES DE OLIVEIRA
UFRJ
___________________________________________________________________________
Profa.Dra. HELENA CRISTINA DA GAMA LEITÃO
UFF
___________________________________________________________________________
Profa.Dra. REGINA CÉLIA PAULA LEAL TOLEDO
UFF
Niterói
2006
Ao meu pai e minha mãe,
Pelo exemplo de vida;
À minha esposa,
Pelo amor, amizade e auxílio;
Aos meus filhos,
Pela paciência e compreensão
DEDICO
AGRADECIMENTOS
À Professora Doutora Aura Conci, minha orientadora, por compartilhar idéias,
conhecimentos e experiências que efetivamente contribuíram para o meu
aperfeiçoamento técnico-especializado. Sua dedicação, incentivo e confiança em
muito excederam o relacionamento orientador-orientando.
Aos professores do corpo docente do Instituto de Computação da UFF pelos
conhecimentos transmitidos e pelas visíveis demonstrações de respeito e apreço.
Aos professores membros da banca examinadora pela avaliação crítica e sugestões
para o aperfeiçoamento da pesquisa.
A minha esposa Sandra Regina de Oliveira Nunes e ao meu irmão Eduardo de
Oliveira Nunes, pelo inestimável apoio, interesse e colaboração.
EPÍGRAFE
“Com Deus está a sabedoria e a força; Ele tem conselho e entendimento.”
Jó 12:13
LISTA DE FIGURAS
FIGURA 3.1 – Exemplos de texturas naturais, p.14
FIGURA 4.1 – Amostra de uma região com 7x7 pixels, p.51
FIGURA 4.2 – Classes de distância para região de 7x7 pixels da figura 4.1, p.51
FIGURA 4.3 – Seis grupos de pixels correspondentes às classes de distâncias, p. 52
FIGURA 4.4 – Diagrama de dispersão de amostras da classe 1 e 2 , p.54
FIGURA 4.5 – Um exemplo de espaço de busca, p.55
FIGURA 4.6 – Funcionamento de um algoritmo genético, p.56
FIGURA 4.7 – Cromossomo representado por um vetor, p.57
FIGURA 4.8 – Representação do cromossomo, p.57
FIGURA 4.9 – Diagrama de dispersão dos dados da tabela 4.2, p.59
FIGURA 4.10 – Faixa de inicialização heurística dos atributos preditivos, p.61
FIGURA 4.11 – Aptidão percentual para os dados da tabela 4.5, p.64
FIGURA 4.12 – Probabilidade de seleção proporcional à aptidão, p.69
FIGURA 4.13 – Probabilidade de sorteio – roleta normalizada, p.71
FIGURA 4.14 – Fluxograma da busca local proposta, p.72
FIGURA 4.15 – Esquema funcional de um algoritmo de clusterização, p.74
FIGURA 4.16 – Exemplo de árvore de clusters na clusterização hierárquica, p.76
FIGURA 4.17 – Aplicação do método k-means, p.78
FIGURA 4.18 – Clusterização das amostras baseado no valor do CVE em cada banda espectral, p.79
FIGURA 4.19 – Centróides das amostras de treinamento no espaço euclidiano tridimensional, p.80
FIGURA 5.1 – Imagem de teste após diversas transformações geométricas, p.81
FIGURA 5.2 – Classes de distâncias para uma matriz 5x5 pixels, p.82
FIGURA 5.3 – CVE para diferentes intensidades de pixels em amostra homogênea, p.83
FIGURA 5.4 – Teste com diferentes dimensões da janela de amostra, p.83
FIGURA 5.5 – Padrão com quatro classes de texturas com 32x32 pixels, p.84
FIGURA 5.6 – Teste de invariância à rotação e reflexão, p.85
FIGURA 5.7 – Decomposição das bandas do padrão da figura 5.5, p.86
FIGURA 5.8 – Diferentes combinações das bandas da figura 5.7, p.86
FIGURA 5.9 – Teste de variância à combinação de bandas, p.87
FIGURA 5.10 – Mosaico de texturas de pedras, p.87
FIGURA 5.11 – Segmentação do mosaico de pedras – experimento 1 e 2, p.90
FIGURA 5.12 – Aplicação do filtro de mediana com janela de tamanho de 3x3 pixels, p.91
FIGURA 5.13 – Bordas localizadas após a filtragem com filtro de mediana de 3x3 pixels, p.92
FIGURA 5.14 – Contorno real e contorno CVE (pedras), p.92
FIGURA 5.15 – Mosaico de texturas de papéis, p.93
FIGURA 5.16 – Segmentação do mosaico de papéis, p.93
FIGURA 5.17 – Filtragem do mosaico de papéis com filtros de diferentes dimensões, p.94
FIGURA 5.18 – Contorno localizado com diferentes tamanhos de janelas de filtragem, p.94
FIGURA 5.19 – Contorno real e contorno CVE (papéis), p.95
FIGURA 5.20 – Estrela de seis pontas, p.95
FIGURA 5.21 – Detalhe do contorno localizado com janelas de segmentação diferentes, p.96
FIGURA 5.22 – Contornos sobrepostos das figuras 5.21a. a 5.21d., p.97
FIGURA 5.23 – Mosaico de texturas de madeira, p.97
FIGURA 5.24 – Resultado da segmentação dos experimentos 1, 2 e 3, p.100
FIGURA 5.25 – Resultado da filtragem dos experimentos 1, 2 e 3, p.100
FIGURA 5.26 – Localização do contorno dos experimentos 1, 2 e 3, p.100
FIGURA 5.27 – Contorno real e contorno CVE (madeira), p.101
FIGURA 5.28 – Mosaico de texturas de água, p.102
FIGURA 5.29 – Resultado obtido com programa AGCTIM (texturas de água), p.103
FIGURA 5.30 – Resultado obtido com programa CTIM (texturas de água), p.104
FIGURA 5.31 – Contorno real e contorno CVE (água), p.104
FIGURA 5.32 – Mosaico de texturas de solo, p.105
FIGURA 5.33 – Resultado obtido com programa AGCTIM (texturas de solo), p.106
FIGURA 5.34 – Resultado obtido com programa CTIM (texturas de solo), p.106
FIGURA 5.35 – Contorno real e contorno CVE (solo), p.107
FIGURA 5.36 – Mosaico de texturas de vegetação, p.107
FIGURA 5.37 – Resultado obtido com programa AGCTIM (texturas de vegetação), p.108
FIGURA 5.38 – Resultado obtido com programa CTIM (texturas de vegetação), p.109
FIGURA 5.39 – Contorno real e contorno CVE (vegetação), p.109
FIGURA 5.40 – Linhas com diferentes inclinações formando a sigla UFF, p.112
FIGURA 5.41 – Contorno (azul) das letras UFF formadas com linhas de diferentes inclinações, p.113
FIGURA 5.42 – Comparação do método ICA e CVE, p.114
FIGURA 5.43 – Comparação do método MRMRF e CVE, p.115
FIGURA 5.44 – Imagem colorida de pimentões, p.116
FIGURA 5.45 – Segmentação e contorno dos pimentões obtidos com o programa CTIM, p.116
FIGURA 5.46 – Contornos dos pimentões obtidos com os programas SEGWIN e VISD, p.116
FIGURA 5.47 – Paisagem colorida, p.117
FIGURA 5.48 – Segmentação e contorno da paisagem obtidos com o programa CTIM, p.117
FIGURA 5.49 – Contornos da paisagem obtidos com os programas SEGWIN e VISD, p.118
FIGURA 5.50 – Imagem colorida – mandril, p.118
FIGURA 5.51 – Segmentação e contorno do mandril obtidos com o programa CTIM, p.118
FIGURA 5.52 – Contornos do mandril obtidos com os programas SEGWIN e VISD, p.119
FIGURA 5.53 – Imagem de melanoma, p.119
FIGURA 5.54 – Segmentação e contorno do melanoma obtidos com o programa CTIM, p.120
FIGURA 5.55 – Contornos do melanoma obtidos com os programas SEGWIN e VISD, p.120
FIGURA 5.56 – Imagem de células e resultado obtido com o programa CTIM, p.121
FIGURA 5.57 – Contorno das células obtidos com os programas SEGWIN e VISD , p.121
FIGURA 5.58 – Imagem da região da grande são paulo segmentada por diferentes programas, p.122
FIGURA 5.59 – Composições das bandas 1, 2, 3, 5 e 7, p.123
FIGURA 5.60 – Contorno de água (bandas _7,2,1) e vegetação (bandas_753), p.123
FIGURA 5.61 – Contornos aplicados à composição de bandas_ 3,2,1, p.124
LISTA DE TABELAS
TABELA 4.1– Calculo dos novos valores de intensidade, p.52
TABELA 4.2 – Dados para cálculo do CVE, p.53
TABELA 4.3 – Exemplo de medidas de textura para duas bandas, p.58
TABELA 4.4 – Intervalo dos atributos preditivos, p.60
TABELA 4.5 – Dados para simulação da roleta, p.63
TABELA 4.6 – Simulação da roleta – seleção do indivíduo, p.64
TABELA 4.7 – Exemplo de aptidões para utilização do método da roleta, p.69
TABELA 4.8 – Probabilidade segundo o método de seleção proporcional, p.69
TABELA 4.9 – Cálculo das novas aptidões e probabilidades dos indivíduos, p.70
TABELA 4.10 – Exemplo de semente, p.71
TABELA 5.1– Calculo do CVE – teste de rotação e reflexão, p.82
TABELA 5.2 – Número de amostras para os experimentos 1 e 2 (pedras), p.88
TABELA 5.3 – Matriz de classificação–conjunto de treinamento–experimento 1 (pedras), p.88
TABELA 5.4 – Matriz de classificação–conjunto de treinamento–experimento 2 (pedras), p.89
TABELA 5.5 – Matriz de classificação–conjunto de teste–experimento 1 (pedras), p.89
TABELA 5.6 – Matriz de classificação–conjunto de teste–experimento 2 (pedras), p.89
TABELA 5.7 – Matriz de classificação–conjunto de teste com filtro mediana–experimento 1(pedras), p.91
TABELA 5.8 – Matriz de classificação–conjunto de teste com filtro mediana–experimento 2 (pedras), p.91
TABELA 5.9 – Número de amostras e coeficiente de variação por canal (papéis), p.93
TABELA 5.10 – Matriz de classificação dos pixels (papéis), p.95
TABELA 5.11 – Espessura do contorno para diferentes tamanhos da janela de segmentação, p.96
TABELA 5.12 – Número de amostras e coeficiente de variação para o experimento 1 (madeiras), p.98
TABELA 5.13 – Número de amostras e coeficiente de variação para o experimento 2 (madeiras), p.98
TABELA 5.14 – Número de amostras e coeficiente de variação para o experimento 3 (madeiras), p.98
TABELA 5.15 – Matriz de classificação–conjunto de treinamento–experimento 1 (madeiras), p.99
TABELA 5.16 – Matriz de classificação–conjunto de treinamento–experimento 2 (madeiras), p.99
TABELA 5.17 – Matriz de classificação–conjunto de treinamento–experimento 3 (madeiras), p.99
TABELA 5.18 – Matriz de classificação dos pixels (madeira), p.101
TABELA 5.19 – Número de mostras selecionadas–conjunto de treinamento (água), p.102
TABELA 5.20 – Matriz de classificação dos pixels (água), p.105
TABELA 5.21 – Número de mostras selecionadas – conjunto de treinamento (solo), p.105
TABELA 5.22 – Matriz de classificação dos pixels (solo), p.107
TABELA 5.23 – Número de mostras selecionadas – conjunto de treinamento (vegetação), p.108
TABELA 5.24 – Matriz de classificação dos pixels (vegetação), p.110
SUMÁRIO
RESUMO, p.xii
ABSTRACT, p.xiii
1. INTRODUÇÃO, p.1
1.1. APRESENTAÇÃO DO PROBLEMA, p.1
1.2. OBJETIVOS DO TRABALHO, p.2
1.3. MÉTODO PROPOSTO, p.2
1.4. MOTIVAÇÃO, p.3
1.5. ORGANIZAÇÃO, p.4
2. TÉCNICAS DE SEGMENTAÇÃO DE IMAGENS, p.5
2.1. SEGMENTAÇÃO, p.5
2.1.1. Técnicas de segmentação baseadas em filtragem local, p.7
2.1.2. Técnicas de segmentação baseadas em limiarização, p.8
2.1.3. Técnicas de segmentação baseadas em crescimento de regiões, p.9
2.1.4. Técnicas de segmentação baseadas em divisão e fusão de regiões, p.10
2.1.5. Técnicas de segmentação baseadas em contornos ativos, p.10
2.1.6. Técnicas de segmentação baseadas em morfologia matemática, p.12
2.1.7. Técnicas de segmentação baseadas em textura, p.12
2.2. CONSIDERAÇÕES FINAIS, p.13
3. TEXTURA, p.14
3.1. CONCEITO DE TEXTURA, p.14
3.2. REVISÃO TEÓRICA, p.16
3.2.1. Abordagens estatísticas, p.17
3.2.1.1. Técnicas baseadas em momentos, p.17
3.2.1.2. Técnicas baseadas em análise de histograma, p.17
3.2.1.3. Ténicas baseadas em matrizes de co-ocorrência, p.19
3.2.1.4. Técnicas baseadas em funções de auto-correlação, p.20
3.2.1.5. Técnicas baseadas em modelos gaussianos, p.21
3.2.1.6. Técnicas baseadas em classificação bayesiana, p.23
3.2.2. Abordagens espectrais, p.24
3.2.3. Abordagens baseadas em modelos, p.24
3.2.4. Abordagens baseadas em filtragens, p.26
3.2.4.1. Técnicas baseadas em análise de componente, p.26
3.2.4.2. Técnicas baseadas em filtros gabor, p.27
3.2.4.3. Técnicas baseadas em transformação wavelets, p.29
3.2.5. Abordagens baseadas em transformação de watershed, p.34
3.2.6. Abordagens baseadas em análise de agrupamento (clusterização), p.34
3.2.7. Abordagens baseadas em características de cor/bordas/contornos, p.37
3.2.8. Abordagens mistas, p.39
3.2.9. Outras abordagens, p.41
3.2.9.1. Técnicas baseadas em modelagem multi-resolução, p.41
3.2.9.2. Técnicas baseadas em operadores lógicos e transformações geométricas, p.41
3.2.9.3. Técnicas baseadas em conceitos topológicos, p.42
3.2.9.4. Técnicas baseadas em modelo auto-regressivo, p.42
3.2.9.5. Técnicas baseadas em medidas de similaridade/distâncias, p.44
3.2.9.6. Técnicas baseadas em regras de associação, p.44
3.2.9.7. Técnicas baseadas em redes neurais, p.45
3.2.10. Comparação de abordagens, p.46
3.3. CONSIDERAÇÕES FINAIS, p.48
4. METODOLOGIA, p.49
4.1. MEDIDAS ESTATÍSTICAS, p.49
4.2. O COEFICIENTE DE VARIAÇÃO ESPACIAL, p.50
4.3. PROBLEMAS DE OTIMIZAÇÃO, p.53
4.4. IMPLEMENTAÇÃO COM ALGORITMOS GENÉTICOS, p.55
4.4.1. Funcionamento dos algoritmos genéticos, p.56
4.4.2. Representação cromossômica, p.57
4.4.3. Critério de inicialização, p.60
4.4.4. Avaliação do indivíduo (fitness), p.61
4.4.5. Critério de seleção, p.62
4.4.6. Operadores genéticos, p.64
4.4.7. Critério de substituição, p.67
4.4.8. Critério de parada, p.67
4.4.9. Parâmetros de influência, p.68
4.5. CLUSTERIZAÇÃO, p.74
4.5.1. Medidas de similaridade, p.75
4.5.2. Métodos de agrupamento, p.75
4.6. IMPLEMENTAÇÃO COM ALGORITMO K-MEANS, p.77
4.7. CONSIDERAÇÕES FINAIS, p.80
5. TESTES, RESULTADOS E DISCUSSÃO, p.81
5.1. TESTES TEÓRICOS, p.81
5.2. TESTES COM MOSAICOS DE TEXTURAS NATURAIS, p.84
5.2.1. Teste de invariância à transformação geométrica, p.84
5.2.2. Teste de invariância à ordem de combinação de bandas, p.85
5.2.3. Teste de variação do número de amostras, p.87
5.2.4. Teste de variação do tamanho da janela de filtragem, p.92
5.2.5. Teste de espessura da borda, p.94
5.2.6. Teste de variação do tamanho da janela de amostragem, p.97
5.2.7. Teste empregando algoritmos genéticos e algoritmo k-means, 102
5.3. TESTES COM IMAGENS REAIS, p.110
5.3.1. Teste com imagens monocromáticas, p.112
5.3.2. Teste com imagens coloridas, p.115
5.3.3. Teste com imagens obtidas com aparelhos médicos, p.119
5.3.4. Teste com imagens de satélites, p.121
5.4 DISCUSSÃO, p.124
5.5 CONSIDERAÇÕES FINAIS, p.125
6. CONCLUSÕES E PROPOSTAS FUTURAS, p.126
6.1 SUMÁRIO DE CONTRIBUIÇÕES, p.128
6.2 SUGESTÕES PARA TRABALHOS FUTUROS , p.129
REFERÊNCIAS BIBLIOGRÁFICAS, p.131
APENDICE A – DESCRIÇÃO DOS PROGRAMAS AGCTIM E CTIM, p. 144
xii
RESUMO
A segmentação de imagens por textura tem sido amplamente utilizada em análise de
imagens médicas, interpretação visual de imagens de sensoriamento remoto, inspeção de
qualidade industrial de produtos manufaturados, segmentação de documentos, busca de
imagens, sistemas de reconhecimento, etc. Muitos esquemas de classificação de textura
requerem uma área da imagem excessivamente grande para análise da textura, empregam um
grande número de características para representá-la ou utilizam técnicas que exigem
considerável esforço computacional. A detecção de bordas também é um fator importante no
processo de reconhecimento e interpretação de imagens. A determinação do contorno permite
definir propriedades como perímetro e forma do objeto, e representá-lo de maneira concisa.
Porém, em imagens reais, após a segmentação por texturas, a localização do contorno das
áreas segmentadas não é uma tarefa simples. Este trabalho apresenta um método de
segmentação que considera todas as bandas de informação da imagem em texturas naturais ou
sintéticas, permitindo a distinção de texturas com diversos aspectos. É proposto um novo
coeficiente (CVE - Coeficiente de Variação Espacial) para calcular os limites de regiões
pequenas ou grandes e classificar corretamente a borda da textura. O CVE considera a posição
espacial dos pixels no elemento de textura e as faixas de cor através de medidas estatísticas de
média e desvio padrão. Formulações baseadas em Algoritmos Genéticos e partição K-Means
foram desenvolvidas para gerar regras de classificação a partir de amostras de treinamento.
Estas podem ser usadas para diversos tipos de textura porque as regras relativas ao que será
identificado são completamente determinadas pelo usuário e adaptadas a cada situação. Para
verificar a aplicabilidade do coeficiente proposto, foram feitas diversas comparações com
outros resultados disponíveis na literatura, bem como, foram elaborados testes variados,
visando verificar os limites de eficiência e versatilidade do método, tanto em imagens reais
quanto em imagens sintéticas.
Palavras-chave: Segmentação. Textura. Imagens Multibandas.
xiii
ABSTRACT
Texture image segmentation texture has been thoroughly used in analysis of medical
images, visual interpretation of images of remote sensing, inspection of industrial quality of
manufactured products, segmentation of documents, recovery of images, recognition systems,
etc. Many schemes of texture classification request an excessively large image area for texture
analysis, they use a great number of characteristics to represent it or they use techniques that
demand considerable computational effort. Edge detection is also an important factor in the
process of image recognition and interpretation. The determination of the contour defines
properties as perimeter and form, allowing an object concise representation. However, in real
images, after the segmentation for textures, the edge location of the segmented areas is not a
simple task. This work presents a segmentation method that considers all the bands of
information of the image in natural or synthetic textures allowing distinction of textures with
several aspects. A new coefficient is proposed (CSV - Coefficient of Space Variation) to
calculate the limits of small or big areas and to classify correctly the border of the texture. The
CSV considers two informations: the space position of the pixels in the texture element and
the color strips through statistic measures of average and standard deviation. Approaches
based on Genetic Algorithms and on K-Means partition method were developed to generate
classification rules from training samples. These can be used for several texture types because
the rules relative to what will be identified are completely determined by the user and adapted
to each situation. In order to verify the applicability of the proposed method, several
comparisons with other available results in the literature were made, as well as varied tests
were elaborated aiming efficiency limits and versatility verification both in real images and in
synthetic images.
Keywords: Segmentation. Texture. Multiband Images.
Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF
N972 Nunes, Éldman de Oliveira.
Segmentação por textura em imagens multibandas / Éldman de
Oliveira Nunes. – Niterói, RJ : [s.n.], 2006.
154 f.
Orientador: Aura Conci.
Tese (Doutorado em Computação) - Universidade Federal
Fluminense, 2006.
1. Processamento de imagem. 2. Segmentação de imagens. 3.
Interfaces (Computação). 4. Computação visual. I. Título.
CDD 006.42
1 INTRODUÇÃO
Este capítulo introduz o problema da segmentação de regiões presentes em uma imagem por
textura. Também são apresentados: o método proposto para classificação de imagens
multiespectrais, a motivação da estratégia escolhida, os objetivos do trabalho e sua
organização.
1.1 APRESENTAÇÃO DO PROBLEMA
A segmentação visa à separação de uma imagem em suas partes constituintes. Esta é uma das
tarefas mais importantes e complexas em processamento de imagens. Importante porque as
etapas seguintes de identificação serão realizadas sobre as partes segmentadas, complexa
porque procura traduzir para o computador um processo cognitivo extremamente sofisticado
realizado através da visão humana. Assim, um cuidado considerável deve ser despendido
nesta etapa, pois, uma segmentação eficiente praticamente garante o sucesso de etapas
posteriores da análise de imagens como o seu reconhecimento (GONZALEZ; WOODS,
2000).
A textura pode ser definida como um padrão estatístico local de primitivas de textura no
domínio de observação de interesse (SENGUR; TURKOGLU; INCE, 2006). A textura é
freqüentemente usada como um descritor regional em análise de imagem e visão
computacional. Análise de textura é uma área de pesquisa importante com aplicações em
bibliotecas digitais, bancos de dados multimídia, imagens médicas, robótica, sensoriamento
remoto, controle de qualidade, etc. (XIANGYU YANG; JUN LIU, 2002; BASHAR;
MATSUMOTO; OHNISHI, 2003).
A segmentação de regiões de imagem baseada na textura é um problema comum em análise
de imagem. Ao ser selecionado um conjunto de características de textura, vários métodos para
segmentação da imagem em regiões podem ser aplicados. (CLAUSI; ED JERNIGAN, 2000;
2
EPIFANIO; AYALA, 2002; MALPICA; ORTUÑO; SANTOS, 2003). A maioria dos
trabalhos voltados a segmentação de regiões de imagem por textura se baseiam num modelo
matemático elaborado, incluindo, matrizes de co-ocorrência de nível-cinza, funções de auto-
correlação, campos aleatórios, filtros Gabor, Wavelets, etc. Tais modelos, normalmente,
possuem exigências computacionais elevadas (PASCHOS & PETROU, 2003).
Técnicas de segmentação e classificação baseadas em textura necessitam da definição de um
conjunto de medidas que a represente de forma efetiva. Este trabalho propõe uma nova
medida para quantificação da textura de uma região que considera o atributo textura em
diferentes combinações de bandas possíveis. Esta medida, denominada de Coeficiente de
Variação Espacial (CVE) é utilizada na geração de regras que servirão para segmentação de
imagens multibandas. Duas diferentes estratégias para criação das regras utilizando
Algoritmos Genéticos e algoritmo K-Means são modeladas e implementadas. Esta proposta
inovadora é caracterizada por sua simplicidade e flexibilidade, além de exigências
computacionais mais baixas que as dos algoritmos convencionais.
1.2 OBJETIVOS DO TRABALHO
Este trabalho procurou atender os seguintes objetivos:
- Realizar uma revisão teórica a fim de compreender os conceitos de segmentação,
textura, Algoritmos Genéticos e algoritmo K-Means;
- Definir um método para quantificar o conteúdo de textura de uma amostra;
- Definir um modelo de Algoritmo Genético para evolução de regras visando à
classificação de imagens multiespectrais;
- Implementar o modelo de Algoritmo Genético definido no objetivo anterior;
- Implementar o algoritmo K-Means para clusterização das amostras das classes;
- Desenvolver um sistema, visando à classificação de imagens multiespectrais;
- Realizar testes diversificados para avaliar o desempenho do modelo implementado.
1.3 MÉTODO PROPOSTO
O CVE de uma amostra de textura é obtido através de medidas estatísticas de posição (média)
e de dispersão (desvio padrão) e representa as coordenadas de um ponto no espaço
tridimensional (quando calculado para os canais red, green e blue). Assim, o problema
consiste em alocar cada uma das amostras das regiões de interesse nas classes
correspondentes, de forma a maximizar acertos ou minimizar erros de classificação.
3
Esta tarefa de classificação pode ser modelada como um problema de maximizar ou
minimizar uma função, cujas variáveis devem obedecer a certas restrições. Devido a
existência de um vasto espaço de busca e diversas soluções sujeitas a restrições, duas
metaheurísticas foram empregadas para reduzir a complexidade da solução do problema e
fornecer soluções sub-ótimas em tempo satisfatório.
A primeira meta heurísticas utiliza Algoritmos Genéticos (AG) para descobrir regras para as
classes, a partir de um conjunto de amostras de cada região de interesse. O AG formula regras
que permitam atribuir amostras às classes correspondentes, minimizando os erros de
classificação. Uma regra é representada por um cromossomo, assumindo a forma SE (T
1
, T
2
,
T
3,
) ENTÃO P, onde os atributos textura da imagem (T
1
, T
2
, T
3,
) estão representados
simbolicamente como condições para que a conclusão da regra, caracterizada por (P), seja
verdadeira. Baseado nesta hipótese, pode-se procurar obter regras que caracterizem uma
classe através de evolução genética.
A segunda estratégia utiliza o método de partição baseado em recolocação K-Means. As
amostras de cada textura de interesse são clusterizadas e as coordenadas do centróide. obtido
para cada cluster. compõe um vetor de característica da textura com dimensão igual ao
número de bandas espectrais consideradas. O vetor de centróides representando as classes de
texturas de interesse é utilizado para segmentação do restante da imagem. Apesar da presença
de componentes aleatórios, espera-se que as amostras de uma mesma textura apresentem uma
maior similaridade com as amostras pertencentes ao cluster correspondente (menor distância
euclidiana para este centróide).
1.4 MOTIVAÇÃO
A classificação de imagens baseada em características texturais têm sido amplamente
utilizada no meio científico e industrial. Em vários tipos de imagens médicas, as propriedades
de textura são importantes no auxílio ao diagnóstico, por exemplo, a caracterização do câncer
e a detecção de lesões. Nas imagens de sensoriamento remoto, o reconhecimento de texturas é
empregado na interpretação visual de imagens aumentando o desempenho dos classificadores.
Na inspeção de qualidade industrial, a detecção automatizada de produtos manufaturados
defeituosos baseado nas propriedades texturais evitam o trabalho tedioso da inspeção manual.
Muitas outras áreas como segmentação de documentos, busca de imagens baseadas no seu
conteúdo, sistemas de reconhecimento, etc. empregam métodos de análise baseado no perfil
textural que constitui a imagem.
4
Os Algoritmos Genéticos (AG’s) têm sido bem sucedidos em diversas aplicações,
particularmente em problemas de otimização (GOLDBERG, 1989; HOLLAND, 1992). Tais
problemas são caracterizados pela busca de boas soluções dentre um número elevado de
possíveis soluções (espaço de busca). AG’s tornam-se atrativos devido ao fato de não ser
necessário descrever como encontrar uma boa solução. Assim, a descoberta de padrões em
forma de regras através de algoritmos genéticos, revela-se um método promissor de
classificação de imagens.
O algoritmo de clusterização K-Means possui amplo emprego em problemas de otimização
(ZHANG; HSU; DAYAL, 2001). Este algoritmo tem um claro significado geométrico,
possibilitando o refinamento das soluções obtidas durante sua execução, melhorando
gradativamente a formação dos agrupamentos e permitindo a utilização do centróide como
elemento representativo de um cluster.
1.5 ORGANIZAÇÃO
Este trabalho está organizado como se segue. O capítulo 2, Técnicas de Segmentação de
Imagens, fornece uma classificação geral das técnicas mais comuns de segmentação de
imagens digitais. O capítulo 3, Textura, conceitua textura, bem como faz uma revisão dos
principais métodos de segmentação baseados em textura, disponíveis na literatura recente. O
capítulo 4, Metodologia, descreve o coeficiente proposto CVE para quantificação da textura
de uma região da imagem, bem como a modelagem do Algoritmo Genético e do algoritmo
K-Means utilizada para implementação do método de segmentação. O capítulo 5, Testes,
Resultados e Discussão, apresenta e discute os resultados dos diversos testes realizados com a
finalidade de avaliar o desempenho da metodologia adotada. O capítulo 6, Conclusão, destaca
as conclusões obtidas neste trabalho e levanta perspectivas de trabalhos futuros. Finalmente, o
apêndice “A”, Descrição do Programa, detalha os aplicativos desenvolvidos para a
implementação do método proposto.
2. TÉCNICAS DE SEGMENTAÇÃO DE IMAGENS
Este capítulo apresenta um resumo das técnicas mais comuns empregadas na segmentação de
imagens digitais.
2.1
SEGMENTAÇÃO
A segmentação é uma tarefa básica em processamento de imagens e visa à identificação e
separação de uma imagem em suas partes constituintes. Na segmentação, a imagem é dividida
em regiões com propriedades comuns (intensidade, cor, textura, etc). O nível de subdivisão da
imagem depende do objetivo que se pretende alcançar. A segmentação se encerra quando as
partes constituintes de interesse forem isoladas, o que requer o conhecimento prévio da natureza
da imagem. Assim, a segmentação é um problema orientado à aplicação, pois depende do
contexto (BERDER, 2003).
Formalmente, a segmentação de imagens é definida como um tratamento que visa particionar
uma imagem f em um subconjunto composto de
n
regiões
i
R tais que (COCQUEREZ, 1997):
ni
0
φ
i
Ri
φ
=
ji
RRjiji ;;,
i
i
Rf =
A segmentação é uma etapa crítica em processamento de imagens, pois, a eficiência obtida na
identificação e separação das regiões de interesse influencia os resultados das etapas
subseqüentes (GONZALEZ; WOODS, 2000). Como a segmentação não é um fim em si, sua
qualidade é determinada pela adequação das regiões extraídas aos tratamentos que serão
realizados nas próximas etapas.
6
Simular no computador o processo de seleção e agrupamento realizado pela visão humana na
identificação de regiões semelhantes é uma tarefa difícil. Várias dificuldades estão presentes: a
complexidade da textura, a não homogeneidade da iluminação (sombras próximas à borda), as
irregularidades e as imprecisões das regiões das bordas, etc. Não existe um modelo formal para a
segmentação, o processo é essencialmente empírico e deverá se ajustar a diferentes tipos de
imagens e necessidades (SCHWARTZ; PEDRINI, 2005).
Uma vez que a segmentação visa particionar uma imagem em regiões com propriedades comuns,
normalmente as técnicas de segmentação estão associadas ao conceito de região. Esta
caracterização pode muitas vezes estar completamente relacionada com a aplicação. Assim, uma
região pode ser vista como um conjunto de pixels conectados envolvidos por uma borda de
pixels criando um contorno ou, ainda, uma região pode ser definida como um conjunto de pixels
conectados por meio de uma condição de uniformidade.
Na primeira definição, a segmentação é realizada com base na descontinuidade, enquanto na
segunda definição, com base na similaridade (GONZALEZ; WOODS, 2000). Sob a perspectiva
da descontinuidade, a preocupação volta-se para obtenção de contornos conexos, a fim de que os
tratamentos subseqüentes à segmentação possam extrair, a partir da imagem segmentada,
propriedades como perímetro e a área das regiões. Sob a perspectiva da similaridade, a
preocupação volta-se para redução do número excessivo de sub-regiões não significativas que
pode levar a supersegmentação da imagem.
Atualmente, existe uma grande variedade de técnicas de segmentação de imagens que podem ser
classificadas de diferentes formas. Neste trabalho, as técnicas de segmentação foram
classificadas em sete grupos baseados em:
1. filtragem local;
2. limiarização;
3. crescimento de regiões;
4. divisão e fusão de regiões;
5. em contornos ativos;
6.
morfologia matemática; e
7. texturas.
7
2.1.1 Técnicas de segmentação baseadas em filtragem local
As técnicas para detecção de contornos visam detectar descontinuidades na imagem que podem
representar pontos, linhas e bordas de objetos. Elas assumem que as regiões a serem
segmentadas são suficientemente homogêneas e a transição entre regiões caracteriza-se pela
descontinuidade nos tons de cinza.
Nestas técnicas, um objeto pode ser entendido como uma região dentro de um contorno. Para
distinguir os objetos, detectam-se suas bordas (edge detection) e tenta-se construir uma região
conectada interior a partir delas. As bordas são regiões da imagem caracterizadas por uma
mudança brusca do nível de iluminação ou dos tons de cinza entre duas regiões. O contorno é
uma linha fechada formada pelas bordas de um objeto.
O processo de detecção de bordas baseado na descontinuidade da intensidade tonal consiste na
verificação da variação dos valores de luminosidade de uma imagem visando localizar e realçar
os pixels de borda, através da ampliação do contraste entre esta e o fundo.
Uma vez que uma borda é caracterizada por uma mudança no nível de luminosidade da cena
decorrente de uma descontinuidade na intensidade, um operador sensível a estas mudanças
atuará como um detector de bordas. Normalmente utiliza-se um operador de diferenciação, que é
baseado na noção de derivada, como os operadores Laplaciano, Prewitt, Roberts e Sobel.
A filtragem local utilizando convolução com máscaras é a maneira mais usual de verificação de
descontinuidades em uma imagem. A convolução com uma máscara de detecção de borda na
imagem original produzirá uma imagem gradiente com mesma dimensão que a imagem original,
porém contendo os valores da máscara de resposta ao invés do valor do pixel. Estes valores
podem ser comparados com o valor mínimo de limiar definido para determinar quais pixels são
mais prováveis de pertencerem a uma borda.
Entretanto, devido à presença de ruídos, iluminação não uniforme, textura e outras perturbações,
raramente o conjunto de pixels forma contornos completos. Assim, alguns procedimentos para
ligação de bordas são utilizados em conjunto com os algoritmos de detecção, a fim de reunir
pixels de bordas em contornos significativos.
A detecção de bordas é muito importante na segmentação, pois, uma vez localizado o contorno, é
possível definir propriedades como perímetro e forma do objeto de uma maneira concisa. Porém,
não é um processo simples, devido a grande variação de condições de iluminação das imagens
reais (SUMENGEN; MANJUNATH, 2005).
8
A formulação de um algoritmo de detecção de bordas que apresente um bom desempenho em
diferentes contextos é uma tarefa difícil (ZIOU; TABBONE, 1998). Vários operadores com
diferentes formulações matemáticas têm sido desenvolvidos para diversos propósitos.
2.1.2 Técnicas de segmentação baseadas em limiarização
A limiarização é um método de segmentação que se baseia na obtenção de limiares que separam
grupos de pixels de características semelhantes (HARALICK; SHAPIRO, 1992). O processo de
limiarização separa regiões de uma imagem quando esta apresenta duas classes (o fundo e o
objeto). Uma vez que a limiarização produz uma imagem binária como saída, ela também é
conhecida por binarização. A limiarização, muitas vezes, baseia-se na utilização do histograma
da imagem. No caso do objeto diferenciar-se em relação ao fundo, o histograma apresenta
distintamente duas classes na forma de dois picos (modas) separados por um “vale”.
Em sua forma mais simples, a limiarização realiza a partição do histograma, convertendo os
pixels cujo tom de cinza é maior ou igual a um valor de limiar (
T
) em brancos (ou pretos) e os
demais em pretos (ou brancos), gerando assim, uma imagem binária com duas classes, o fundo e
o objeto. Formalmente, a limiarização converte uma imagem de entrada
(
)
yxf ,
de
N
níveis de
cinza em uma imagem
(
)
yxg ,
, chamada de imagem limiarizada, com número de veis de cinza
menor do que N. Normalmente,
(
)
yxg ,
apresenta 2 níveis de cinza, equação (2.1):
(
)
(
)
(
)
{
}
TyxfseTyxfseyxg <= ,0;,1,
(2.1)
onde os pixels rotulados com 1 correspondem aos objetos, os rotulados com 0 correspondem ao
fundo e
T
é um valor de tom de cinza pré-definido, denominado limiar. Este limiar
T
localiza-
se em algum lugar do vale.
O principal problema da limiarização é selecionar um valor de
T
que proporcione a melhor
segmentação. Normalmente, a escolha do valor de
T
envolve várias tentativas. Devido à
iluminação irregular ao longo da cena (sombra), a não uniformidade nos tons do fundo e dos
objetos e a presença de vários objetos diferentes, raramente o histograma de imagens reais
apresenta dois picos distintos e disjuntos associados ao fundo e aos objetos (SONKA; HLAVAC;
BOYLE, 1999).
A binarização pode ser generalizada para considerar um número arbitrário de níveis. Geralmente,
a limiarização multinível é menos confiável do que a binarização em razão da dificuldade de
encontrar os vários
i
T
que efetivamente isolam regiões de interesse.
9
A limiarização pode ser vista como uma operação que envolve um teste com relação a uma
função
T
, equação (2.2):
(
)
(
)
[
]
yxfyxpyxTT ,,,,,=
(2.2)
Na equação (2.2),
(
)
yxf ,
é o tom de cinza original no ponto de coordenadas
(
)
yx,
,
(
)
yxp ,
indica uma propriedade local neste ponto, por exemplo, a média de seus vizinhos.
2.1.3 Técnicas de segmentação baseadas em crescimento de regiões
Crescimento de regiões é um processo interativo de agrupamento de pixels (e no caso de texturas
textons) em que regiões homogêneas e adjacentes no espaço são agrupadas (GATO; IMAR;
TOMMASELLI, 2001).
No início do processo de segmentação, a região pode ser um pixel ou um conjunto de pixels
(“semente”). Para cada região são calculados certos atributos que sejam considerados
representativos para a região, como por exemplo: cor, textura ou luminosidade. A agregação das
regiões é feita usando algum critério de similaridade ou de decisão.
Alguns problemas precisam ser considerados no processo de crescimento de regiões.
Inicialmente é necessário que a seleção de “sementes” represente adequadamente as regiões de
interesse. Também é preciso selecionar adequadamente as propriedades para a inclusão de
pontos nas várias regiões durante o processo de crescimento. Outro problema é o
estabelecimento de um critério de parada. O crescimento de uma região deveria parar quando
não houvesse mais pixel que satisfizesse os critérios de inclusão naquela região.
Uma vez que critérios como: intensidade, textura e cor são locais por natureza, não considerando
o histórico do processo de crescimento de região, critérios adicionais que utilizam o conceito de
tamanho, similaridade entre o pixel candidato e os pixels acrescidos até aquele momento e a
forma da região sendo operada são desejáveis para aumentar o poder do algoritmo de
crescimento de regiões (GONZALEZ; WOODS, 2000).
Normalmente, o crescimento de regiões emprega um conjunto de descritores baseados em
intensidade e em propriedades espaciais (como momentos e texturas) de uma única fonte de
imagens. Porém, a informação de conectividade ou de adjacência deve ser considerada no
processo de crescimento de regiões, pois o emprego destes descritores isoladamente pode
conduzir a resultados enganosos (GONZALEZ; WOODS, 2000).
10
2.1.4 Técnicas de segmentação baseadas em divisão e fusão de regiões
Separação e junção é um método que subdivide uma imagem em quatro blocos e testa cada um
destes blocos verificando se os pixels (ou textons) pertencentes aos mesmos atendem a algum
critério de homogeneidade.
Os blocos que atenderem ao critério não serão mais divididos. O bloco que não atender será
subdividido em blocos menores. Esse processo é repetido interativamente até um critério de
parada ser satisfeito. Em seguida, é realizada a junção dos blocos vizinhos que sejam
homogêneos (GONZALEZ; WOODS, 2000). Esse método geralmente é associado a uma
estrutura
quadtree
(ou seja, uma árvore em que cada possui exatamente quatro descendentes)
que possibilita decompor e agrupar partes de uma imagem (AZEVEDO; CONCI, 2003).
2.1.5 Técnicas de segmentação baseadas em contornos ativos
Proposto originalmente por Kass, Witkin & Terzopoulos (1988), os modelos de contornos ativos
são técnicas que visam à extração das bordas dos objetos da cena. Estas técnicas se caracterizam
pelo ajuste de uma curva (
spline
) sobre uma imagem definindo o contorno do objeto
segmentado. Geralmente são aplicados conjuntamente com técnicas de filtragem para detecção
de pontos de bordas.
A inicialização é realizada com um contorno de configuração arbitrária que evolui até se ajustar
ao objeto de interesse. Devido ao seu comportamento dinâmico, os contornos ativos são também
conhecidos como “modelos deformáveis”.
A evolução dos modelos deformáveis a partir da curva inicial é controlada pela ação de forças
internas e externas que atingem a posição de equilíbrio somente quando o modelo se aproxima
da borda do objeto de interesse. A energia interna (intrínsecas à geometria da curva) é
responsável por deformar a curva, enquanto a energia externa (derivadas da imagem) é
responsável por atrair à curva em direção a borda do objeto.
Existem dois tipos principais de modelos de contornos ativos encontrados na literatura
(GIRALDI, 2000): modelos
paramétricos
, como as
snakes,
propostas por Kass, Witkin &
Terzopoulos (1988), e modelos
geométricos
ou
implícitos,
propostos por Sethian (1987).
Os modelos Paramétricos consistem de uma curva (ou superfície) elástica que é capaz de se
conformar dinamicamente às bordas dos objetos na imagem em conseqüência das forças internas
(forças elásticas) e forças externas (forças da imagem e forças de restrição) (DUMITRAS;
VENETSANOPOULOS, 2001).
11
Estas forças podem ser determinadas em função de um processo de minimização global ou
baseadas somente em informação local. Os modelos paramétricos são mais intuitivos do que os
modelos implícitos, pois apresentam uma formulação matemática que integra num único
processo parâmetros como propriedades da imagem, estimativas iniciais das fronteiras,
propriedades de contorno desejadas e restrições conhecidas do tipo de imagem processada.
Nos modelos paramétricos, a curva possui uma posição inicial, especificada pelo usuário, e uma
função objetivo associada, denominada
energia
da snake
. A
energia da snake
é composta por
dois termos: um referente à energia interna da curva e o outro referente à energia externa.
A
energia interna
é inerente à própria curva, considerando aspectos físicos análogos como
elasticidade (capacidade da curva de se deformar sob a ação de uma força e retomar seu estado
original quando a força é removida) e rigidez (resistência da curva ao dobramento, ou seja,
desenvolvimento de pontos descontínuos). A
energia externa
ou do ambiente considera as
características da imagem, definido a partir de elementos de interesse (pontos de borda, texturas,
etc.) e outros aspectos opcionais, como forças de pressão.
A finalidade deste sistema de forças é atrair a curva (
snake
) em direção a uma borda, ficando em
equilíbrio estável sobre a mesma ao atingir o valor mínimo de energia do sistema (GIRALDI;
STRAUSS; OLIVEIRA, 2001).
Os modelos implícitos consistem em definir a
snake
como o conjunto de nível zero de funções
(
zero level set
) definidas num espaço de dimensão maior e resolver a cada passo uma equação de
movimento correspondente. Assim, em qualquer instante, a posição da curva será dada pelo nível
zero da função de nível dependente do tempo (SETHIAN, 1997).
Estes modelos são mais adequados para a recuperação de objetos com formas complexas e
topologias desconhecidas. Mas, são menos convenientes que os modelos paramétricos para
análise de forma, visualização, e interação com o usuário.
Uma dificuldade com as técnicas de segmentação baseadas em contornos ativos é a necessidade
de uma boa estimativa inicial do contorno procurado, a fim de garantir seu bom funcionamento.
Entretanto, essas técnicas possuem a vantagem de facilitar a incorporação de informações
conhecidas a priori sobre os contornos (topologia, suavidade, etc), ser extensível à superfícies se
movendo em um espaço tridimensional, bem como facilitar a interação com o usuário quando
houver necessidade (SETHIAN, 1999). Além disso, fornecem contornos conexos completamente
definidos dentro do domínio da imagem.
12
2.1.6 Técnicas de segmentação baseadas em morfologia matemática
O principio básico da Morfologia Matemática consiste em extrair informações relativas à
geometria e à topologia de um conjunto desconhecido de uma imagem, por meio da interação
deste, com um conjunto completamente definido e conhecido (forma e tamanho), chamado de
elemento estruturante (MATHERON, 1967).
A flexibilidade e também a maior dificuldade da Morfologia Matemática reside na escolha
adequada do elemento estruturante para a obtenção de bons resultados (FACON, 1996). Devido
ao amplo espectro de aplicações práticas e de sua simplicidade de implementação, a Morfologia
Matemática tornou-se uma importante metodologia para análise de imagens.
Na Morfologia Matemática, a principal ferramenta de segmentação é baseada na transformação
Watershed
, também conhecida como linha divisora de águas - LDA (BEUCHER
;
MEYER,
1993; VICENT; SOILE, 1991).
Nesta técnica, uma imagem monocromática é representada por uma superfície topográfica em
que os níveis de cinza indicam a altitude do ponto no relevo. Os mínimos em cada uma das
bacias são perfurados e a superfície topográfica é imersa em um lago com velocidade vertical
constante. Então, a superfície topográfica é gradualmente preenchida pela água que penetra nos
orifícios das bacias. Durante este preenchimento, dois ou mais fluxos vindos de mínimos
diferentes podem se unir. Os diques construídos na superfície para evitar que tal junção de águas
ocorra são denominados linhas
watersheds
.
A transformação
watershed
possui como vantagem a rapidez de processamento mesmo com
imagens grandes e complexas. Porém, são sensíveis às irregularidades presentes nas bordas das
regiões (que podem permitir vazamentos) e ao excessivo número de mínimos locais que
provocam uma supersegmentação da imagem.
Base de importantes métodos de segmentação, a técnica de simulação de imersão oferece um
campo fértil para implementação de novos algoritmos (ANDRADE, 1998).
2.1.7 Técnicas de segmentação baseadas em textura
Um importante descritor que tem contribuído na segmentação e classificação de imagens é a
textura. A segmentação por textura deve permitir a colocação em evidência dos motivos da
imagem, considerando-se as propriedades de regularidade e de repetição. O próximo capítulo
abordará os principais métodos de segmentação baseados em textura.
13
2.2 C
ONSIDERAÇÕES FINAIS
Este capítulo apresentou conceitos básicos sobre segmentação de imagens digitais por
descontinuidade (segmentação orientada à contorno) e por similaridade (segmentação orientada à
região). Abordadas de forma resumida, as principais técnicas de segmentação foram classificadas
em sete grupos: técnicas de segmentação baseadas em filtragem local, técnicas de segmentação
baseadas em limiarização, técnicas de segmentação baseadas em crescimento de regiões, técnicas
de segmentação baseadas em divisão e fusão de regiões, técnicas de segmentação baseadas em
contornos ativos, técnicas de segmentação baseadas em morfologia matemática e técnicas de
segmentação baseadas em texturas. Esta classificação não pretende ser exaustiva, pois,
atualmente existe uma enorme variedade de técnicas de segmentação de imagens digitais.
3. TEXTURA
Este capítulo apresenta conceitos básicos sobre texturas. A primeira seção desenvolve uma
conceituação de textura e a segunda seção faz uma revisão das técnicas de segmentação baseadas
em texturas da literatura recente.
3.1 C
ONCEITO DE
T
EXTURA
Um fator de grande relevância na análise de imagens é o reconhecimento de texturas
(MANJUNATH et al., 2001). Este processo sofisticado, realizado intuitivamente pela visão
humana, apresenta grande complexidade computacional (GONZALEZ; WOODS, 2000). A
textura está presente na maioria das imagens naturais. Na figura 3.1 podemos observar alguns
exemplos. Através da análise de texturas é possível distinguir regiões que apresentam as mesmas
características de refletância, e portando, mesmas cores em determinada combinação de bandas.
Isso torna a textura um excelente descritor regional capaz de contribuir na melhoria do processo
de reconhecimento, descrição e classificação de imagens (CHOI et al., 2002).
FIGURA 3.1 - Exemplos de texturas naturais e artificiais
15
A textura é um termo intuitivo e de largo emprego, mas apesar de sua importância, não possui
uma definição precisa. Ela refere-se a um padrão visual que possui algumas propriedades de
homogeneidade que não resultam simplesmente de uma cor ou intensidade. Ao contrário de
outras características, como o brilho, a textura não pode ser definida em um pixel, mas sim,
através de uma região ou conjunto de pixels. É uma propriedade de uma região que descreve o
padrão de variação de tons de cinza e cor numa determinada área. A textura é uma expressão
relacionada com as propriedades que representam a superfície de um objeto (NUNES; CONCI,
2003d).
Na literatura encontram-se diversas definições de textura. Haralick, Shanmugan & Dinstein
(1973) relacionam a definição de textura com o uso de coeficientes de uniformidade, densidade,
aspereza, regularidade, intensidade, dentre outras características da imagem. Para Sklansky
(1978), uma região em uma imagem apresenta uma textura única, se um conjunto de
características estatísticas ou outras propriedades locais da imagem forem constantes ou
aproximadamente periódicas, com pouca variação. Sonka, Hlavac & Boyle (1999) definem a
textura como algo que consiste de elementos mutuamente relacionados (a primitiva de textura,
que pode ser um pixel ou um conjunto de pixels). Gonzalez & Wood (2000) descrevem a textura
por medidas que quantificam suas propriedades de suavidade, rugosidade e regularidade.
Sengur, Turkoglu & Ince (2006) definem a textura como um padrão estatístico local de
primitivas de textura no domínio de interesse. Estes autores definem textura como um conceito
bidimensional, onde uma dimensão contém as propriedades primitivas da tonalidade e a outra,
corresponde aos relacionamentos espaciais entre elas.
Apesar de não existir uma definição única e precisa, nem uma aproximação matemática formal
para a quantificação da textura, as definições, vistas anteriormente associam à textura a
impressão de rugosidade e contraste, criada pela variação tonal ou pela repetição de padrões
visuais sobre uma região (TUCERYAN; JAIN, 1993). Esses padrões podem ser o resultado de
propriedades físicas de acabamento da superfície do objeto (nível de polimento ou rugosidade),
ou ser o resultado de diferenças de reflexão tal como a cor ou material da superfície.
A textura se caracteriza pela repetição de um modelo (texton) sobre uma região. Este modelo
pode ser repetido de forma precisa ou com variações (randômicas ou não) e ruídos sobre um
mesmo tema. Tamanho, formato, cor e orientação dos elementos do modelo podem variar sobre
as regiões, caracterizando diversidade de padrões de uma textura. A variação, encontrada na
forma como os textons se relacionam, deve ser suficiente para diferenciar duas texturas. Uma
região precisa possuir um tamanho grande o suficiente para exibir sua textura. Assim, este
16
tamanho não pode ser pequeno, se comparado com um texton. A definição do texton talvez seja a
característica mais importante em um método de segmentação por textura, especialmente,
quando o texton pode aparecer em resoluções ou escalas diferentes e sua caracterização como
um diferencial ou não, depende do contexto.
Algumas propriedades da textura são indicadas na literatura. Haralick (1979) classifica as
texturas como fortes ou fracas, sendo mais fortes quanto maior a sua regularidade, ou seja, a
interdependência das primitivas de textura. Sonka, Hlavac & Boyle (1999), asseguram que a
descrição da textura é dependente de escala. Castleman (1996) afirma que as texturas são
quantificadas, avaliando-se aspectos relativos à variação de tons de cinza em seções contidas na
imagem.
A análise de textura tem por objetivo estabelecer o relacionamento de vizinhança dos elementos
de textura e seu posicionamento em relação aos demais (conectividade), o número de elementos
por unidade espacial (densidade) e a sua regularidade (homogeneidade). Geralmente a análise de
textura é utilizada para segmentação, descrição, classificação, caracterização do formato e
réplica. A segmentação visa a divisão de uma imagem em regiões com mesmo perfil textural. A
descrição considera a extração de características baseadas na quantificação de seu conteúdo de
textura para discriminação entre classes de objetos. A classificação tem por objetivo a rotulação
de uma região com determinada textura, com base em exemplos de texturas conhecidas. A
descrição da forma emprega a informação de textura para derivar a geometria de uma superfície
tri-dimensional. A réplica descreve uma textura para sua reprodução adequada.
3.2 R
EVISÃO TEÓRICA
Esta seção apresenta uma revisão das principais técnicas de análise de texturas publicadas
recentemente. Na literatura encontra-se uma grande variedade de técnicas para descrever
texturas. Nesta revisão essas técnicas foram agrupadas em abordagens estatísticas, abordagens
espectrais, abordagens baseadas em modelos, abordagens baseadas em filtragem, abordagens
baseadas em transformação de watershed, abordagens baseadas em análise de agrupamentos,
abordagens baseadas em características de cor/bordas/contornos, abordagens mistas e outras
abordagens.
3.2.1 Abordagens estatísticas
Na abordagem estatística, a textura é definida por um conjunto de medidas locais extraídas do
padrão. As abordagens estatísticas descrevem a textura através de grandezas que as caracterizam
como suave, áspera, granular, etc.
17
3.2.1.1 Técnicas baseadas em momentos
Paschos (2000) afirma que a maioria das aproximações recentemente apresentadas para análise
de texturas coloridas são baseadas num modelo matemático elaborado, incluindo auto-correlação
de cruzamento, campos aleatórios e filtros Gabor multi-canal. O autor considera que as
exigências computacionais destas aproximações são normalmente altas. Apresenta um método
efetivo e simples para classificação de texturas coloridas. O método proposto utiliza o modelo de
cor XYZ (definido pelo CIE) de uma imagem e um conjunto correspondente de momentos
bidimensionais e tridimensionais para caracterizar uma textura colorida dada. A cor é descrita
por sua forma bi-dimensional, ou seja, o diagrama de cromaticidade junto com a distribuição bi-
dimensional de valores de cromaticidade associada. Usando apenas um pequeno número de
momentos, o método alcança taxas elevadas ao ser aplicado no reconhecimento de granito e
imagens de mármore.
Dong-Gyu Sim, Hae-Kwang Kim & Rae-Hong Park (2004) apresentam um descritor efetivo de
textura invariante à translação, escala e rotação para aplicações de recuperação de imagem
baseadas em texturas. Para achar a distância de emparelhamento mínimo entre dois descritores,
existindo descritores de freqüência-plana, são requeridos muitos cálculos de distância com toda
combinação possível de valores de escala e rotação porque eles não são invariantes à
transformação geométrica. Para resolver este problema, um novo descritor compacto é proposto,
que é teoricamente invariante a tais transformações geométricas. O descritor proposto é obtido
calculando primeiro o espectro de poder de uma imagem de textura original para invariância à
translação e, então, a imagem de espectro de poder é normalizada para invariância à escala.
Finalmente, são calculados momentos de Zernike modificados para invariância à rotação. O
algoritmo proposto é mais simples que os algoritmos convencionais em termos de complexidade
computacional. Os autores demonstram a efetividade do descritor proposto para recuperação de
textura invariante com vários conjuntos de texturas, comparando a precisão da recuperação com
os resultados obtidos com descritores convencionais.
3.2.1.2 Técnicas baseadas em análise de histograma
Para Ojala, Valkealahti & Pietikäinem (2001) as estatísticas de diferenças de cinza-nível foram
prosperamente usadas em vários estudos de análise de textura. Assim, propõem a utilização de
diferenças de nível-cinza e suas distribuições multidimensionais para descrição de textura.
Experiências com classificação de texturas complexas e segmentação supervisionada de textura
são apresentadas demonstrando que a aproximação proposta proporciona um desempenho muito
18
bom e robusto quando comparados com paradigmas populares como matrizes de co-ocorrência,
modelo de campo aleatório Gaussiano de Markov ou filtros Gabor.
Ojala, Pietikäinem & Mäenpää (2002) propõem um método baseado no reconhecimento de
certos padrões binários locais (local binary patterns), chamados “uniformes”. Estes padrões são
propriedades fundamentais da textura de imagem local e seu histograma de ocorrência evidencia
ser um potente descritor de textura. Os autores derivaram um operador invariante à rotação em
escala de cinza generalizada, que permite detectar os “padrões uniformes” em qualquer
quantização do espaço angular e para qualquer resolução espacial, além de apresentar um
método para combinar operadores múltiplos para análise multi-resolução.
Ginneken & Romeny (2003) generalizam imagens de desordem local (locally orderless images),
considerando histogramas locais de uma coleção de versões filtradas da imagem, estendendo-as
para unir às distribuições de probabilidade. Imagens de desordem local são famílias de três
espaços de escala entrelaçados que descrevem histogramas locais. Estas construções podem ser
usadas para derivar características de textura e são usadas por serem uma descrição mais geral de
dois métodos estabelecidos de classificação de textura: banco de filtros e matrizes de co-
ocorrência. Como todos os parâmetros de escala são estabelecidos explicitamente nesta
formulação, conjuntos de características de multi-resolução podem ser extraídos num modo
sistemático. Isto inclui novos tipos de análise multi-resolução, não somente baseado na escala
espacial, mas também no tamanho de janela e na escala de intensidade. Cada aproximação de
multi-resolução melhora o desempenho da classificação de textura. O melhor resultado é obtido
se uma aproximação de multi-resolução para todos os parâmetros de escala for usado. Isto é
demonstrado experimentalmente em um grande conjunto de dados com 1152 imagens e 72
classes de texturas.
Paschos & Petrou (2003) apresentam um método de classificação de textura colorida que utiliza
características extraídas do histograma de cor. Combinando pares de caixas e computando
proporções de contagens correspondentes, são criadas características de proporções que
caracterizam uma determinada textura colorida baseada em auto-correlação. É relatada a
obtenção de melhores resultados empregando o método proposto, quando comparados com os
resultados alcançados com o método de histograma de cor tradicional.
Jie Zhou, Leping Xin & David Zhang (2003) definem um histograma (Scale-orientation
histogram) para analisar o “direcionamento” e a “periodicidade”, duas das mais importantes
dimensões de determinação de textura em percepção humana. Este histograma é aplicado à
recuperação de textura em estudo de caso e os resultados experimentais ilustram sua efetividade.
19
Pietikäinen et al. (2004) propõem um novo método para reconhecer superfícies texturizadas 3D.
As texturas são modeladas com múltiplos histogramas de micro-textons, em vez de macro-
textons usados em estudos anteriores. Os micro-textons são extraídos através de um operador de
padrão binário de multi-resolução local (multiresolution local binary pattern operator). A
aproximação dos autores tem muitas vantagens se comparadas às aproximações anteriores e
provê o desempenho principal na classificação de texturas do banco de imagens de Columbia-
Utrecht, sob diversos pontos de visualização e diferentes direções de iluminação. Também provê
muitos resultados promissores na classificação de imagens de cena ao ar livre.
Montiel, Aguado & Nixon (2005) utilizam uma estratégia de discriminação não-paramétrica
baseada em características de textura caracterizadas por histogramas condicionais
unidimensionais. A proposta estende prévios esquemas de código de matriz de co-ocorrência,
considerando uma mistura de cor e informação contextual obtida de imagens binárias. Os autores
calculam distribuições em comum para identificar regiões representadas por pixels com
intensidade ou cor semelhantes. A motivação principal é obter uma caracterização compacta
satisfatória para aplicações que requerem treinamento on-line.
Heikkila & Pietikäinen (2006) usa um moderno e eficiente método baseado em textura para
modelar o fundo e detectar o movimento de objetos de uma seqüência de vídeo. Cada pixel é
modelado como um grupo de histogramas local de padrões binários adaptáveis (adaptive local
binary pattern histograms) que são calculados sobre uma região circular ao redor do pixel.
Segundo os autores, a aproximação proporciona muitas vantagens se comparadas ao estado-da-
arte. Resultados experimentais são apresentados para ilustrar a aplicabilidade do modelo
proposto.
3.2.1.3 Técnicas baseadas em matrizes de co-ocorrência
Al-Janobi (2001) apresenta um novo método de análise de textura que incorpora as propriedades
locais da matriz de co-ocorrência de nível- cinza (Gray-Level Co-occurrence Matrix - GLCM) e
métodos de espectro de textura (Texture Spectrum -
TS). As características de co-ocorrência
extraídas da matriz de textura em cruz diagonal provêm completa informação de textura sobre
uma imagem. O autor avalia o desempenho destas características separando os aspectos de
textura de imagens pictóricas. As características texturais do GLCM e TS foram comparadas
separando algumas das imagens de texturas naturais das fotos de textura de Brodatz.
Palm (2004) introduz matrizes de co-ocorrência integrativas como modernas características de
classificação de texturas coloridas. A notação estendida de co-ocorrência permite a comparação
20
entre os conceitos paralelos e integrados de textura e cor. O ganho de informação das novas
matrizes é comprovado quantitativamente através da distância de Kolmogorov e por experiências
de classificação extensas em dois conjuntos de dados. Aplicando-os ao espaço de cor RGB e
LUV, é estudada a combinação de cor e texturas sendo demonstrada a existência de padrões de
cores puras de intensidades independentes.
3.2.1.4 Técnicas baseadas em funções de auto-correlação
Em Suen & Healey (2000), a textura da imagem observada para uma superfície áspera tem uma
dependência complexa na iluminação e ângulos de visão devido aos efeitos distorção,
sombreamento local, inter-reflexões, sombreamento e oclusão dos elementos de superfície. Os
autores introduzem a dimensionalidade da superfície como uma representação da complexidade
visual de uma amostra de material. A dimensionalidade da superfície define o número de
texturas de bases que são requeridas para representar as texturas observadas para uma amostra,
como uma função de faixas de iluminação e ângulos de visão. Texturas de base são
representadas usando funções de correlação multibanda que consideram ambos, dentro e entre,
correlações de bandas de cor. Os autores examinam as propriedades da superfície de
dimensionalidade para materiais reais usando o banco de imagens Columbia Utrecht Reflectance
and Texture (CUReT). É demonstrado que o uso da informação de cor provê vantagens
significativas no reconhecimento de textura tridimensional.
Brochard, Khoudeir & Augereau (2001) apresenta um método para extração de características
invariantes em imagens texturizadas que sofre transformações afins, usando transformação da
função de auto-correlação (Autocorrelation Function - ACF), seguido por determinação de um
critério de invariância que é a soma dos coeficientes da matriz de correlação discreta.
Çarkacıoglu & Yarman-Vural (2003) apresentam um descritor de textura genérico (Statistical
Analysis of Structural Information - SASI) para representação de textura. O SASI está baseado
em estatísticas de coeficientes de auto-correlação de um grupo exclusivo, calculadas sobre
janelas de estruturas. SASI define um conjunto de janelas de grupo exclusivo para extrair e
medir várias propriedades estruturais de textura usando multi-resolução espacial.
Campisi et al. (2004 e 2006) apresentam um modelo baseado em procedimento de classificação
de textura. A textura é modelada como a produção de um sistema linear que considera uma
excitação binária que retém as características morfológicas de textura. A textura é especificada
por sua função de auto-correlação (Autocorrelation Function - ACF). Os autores demonstram
que as características extraídas da função de auto-correlação espacial da excitação binária, são
21
suficientes para representar a textura com propósitos de classificação. Técnicas baseadas em
momentos invariantes são empregadas para classificar a ACF.
3.2.1.5 Técnicas baseadas em modelos Gaussianos
Comer & Delp (2000) apresentam novos resultados relativos ao algoritmo para estimativa de
parâmetros simultâneos e segmentação de texturas em imagens (“Expectation-
Maximization/Maximization of the Posterior Marginals” - EM/MPM). O algoritmo de EM/MPM
usa um modelo de campo aleatório Gaussiano de Markov para os rótulos da classe de pixel e
alternadamente aproxima a estimativa de MPM dos rótulos de classe de pixel e calcula os
parâmetros do modelo de imagem observado. A meta do algoritmo de EM/MPM é minimizar o
valor esperado do número de pixels classificados erroneamente.
Çesmeli & Wang (2001) propõem um método composto de duas partes. A primeira parte
determina um moderno conjunto de características de texturas derivadas de um modelo de campo
aleatório Gaussiano de Markov (Gaussian–Markov Random Fields -
GMRF). Ao contrário da
aproximação baseada em um GMRF, este método não emprega os modelos de parâmetros como
características, nem requer a extração das características para um conjunto fixo de tipos de
textura a priori. A segunda parte é um vetor bidimensional de rede localmente excitatória e
globalmente inibitória (Locally Excitatory Globally Inhibitory Oscillator Networks - LEGION).
Após a filtragem para a supressão de ruídos, as características são usadas para determinar os
acoplamentos locais na rede. Quando LEGION funciona, os osciladores que correspondem à
mesma textura tendem a se sincronizar onde as regiões de diferentes texturas tendem a
corresponder à fases distintas.
Xiangyu Yang & Jun Liu (2001) utilizam um método não supervisionado de segmentação de
textura com o algoritmo de mudança média de um-passo (one-step mean shift algorithm
)
e o
contorno de campo aleatório Gaussiano de Markov (boundary Markov random field
)
. Para os
modelos de mistura Gaussiana, a mudança em média de um-passo é capaz de determinar os
pontos de limite que separam os componentes de distribuição Gaussiana vizinhos nos
histogramas. O algoritmo de mudança em média um-passo é capaz de prover um resultado
grosseiro de segmentação baseado no histograma da imagem. Para melhorar o resultado da
segmentação com restrições de suavidade, o contorno de campo aleatório Gaussiano de Markov
é introduzido. No contorno de campo aleatório Gaussiano de Markov, a distribuição logística
multinível (Multilevel Logistic Distribution - MLL) é empregada com a finalidade de suavizar
regiões com suas características de forma de região, e a informação de borda é acrescentada à
função de energia da distribuição DLL para preservar a descontinuidade das bordas.
22
Xiangyu Yang & Jun Liu (2002) usam um modelo de textura moderno chamado entropia
máxima do campo aleatório (Maximum Entropy Random Field - MERF). O MERF é um campo
aleatório construído com filtros de multi-resolução utilizando o método de entropia máxima
(Maximum Entropy
-
ME). Junto com sua distribuição de probabilidade, o MERF pode ser
considerado como uma distribuição de Gibbs. Os filtros de multi-resolução fazem um papel
central no MERF: eles definem a função potencial na distribuição de Gibbs do campo aleatório,
e eles podem ser usados para extrair características de textura em várias orientações e escalas. Os
experimentos de síntese de textura ilustram a utilização do MERF para descrever texturas. Os
experimentos de recuperação de textura comparam características baseadas no MERF com
características baseadas nos filtros Gabor e as características baseadas em multi-resolução auto-
regressiva, usando o banco de texturas de Brodatz. Os resultados indicam que as características
de MERF provêem a melhor precisão de recuperação de padrão.
Ozyildiz, Krahnstöver & Sharma (2002) apresentam uma formulação para fundir textura e cor
com a meta de localizar objetos em tempo real de uma maneira que torna a segmentação
confiável e com custo computacional baixo. Um campo aleatório auto binomial de Gibbs
Markov é usado para modelar a textura e uma distribuição Gaussiana 2D é usada para modelar a
cor. Isto permite uma fusão da probabilidade da textura e cor para adaptar a textura e a cor com o
passar do tempo, visando a localização de alvos móveis.
Em Te-Won Lee & Lewicki (2002), um algoritmo de classificação não supervisionado é
derivado por modelagem de dados observados com uma mistura de várias classes mutuamente
exclusivas que são descritas cada uma por combinações lineares independentes (densidades não-
Gaussianas). O algoritmo calcula a densidade de dados em cada classe usando funções
paramétricas não lineares que se ajustam à estrutura não-Gaussiana dos dados. Isto melhora a
precisão da classificação quando comparado com o padrão de modelos de misturas Gaussianas.
Quando aplicado à imagens, o algoritmo pode aprender códigos eficientes (funções de base) para
imagens que capturam estatísticamente a estrutura intrínsica significante das imagens. Esta
técnica é aplicada ao problema de classificação não supervisionada, segmentação e filtragem de
imagens. Os autores demonstram que este método foi efetivo na classificação de texturas de
imagem complexas, como cenas naturais e de texto, e na redução de ruídos e preenchimento de
pixels perdidos em imagens com estruturas complexas. Para os autores, a vantagem deste modelo
está no fato de que os códigos da imagem podem ser aprendidos com o aumento do número de
classes (o que provê maior flexibilidade na estrutura modelada) e por encontrar mais
características da imagem do que os modelos de mistura Gaussiana ou os algoritmos ICA
(standard independent component analysis).
23
Kato & Ting-Chuen Pong (2006) propõem um modelo de segmentação de imagem de campo
aleatório Gaussiano de Markov com objetivo de combinar características de cor e textura. O
sistema teórico depende da estimativa Bayesiana por otimização combinatória (com o método
simulated annealing). A segmentação é obtida pela classificação dos pixels em classes de pixels
diferentes. Estas classes são representadas através de distribuições Gaussianas multi-variadas. A
única hipótese sobre a natureza das características é que, um modelo de ruído aditivo Gaussiano
é satisfatório para descrever a distribuição de característica que pertence a uma determinada
classe. Os autores usam o modelo de cor CIE-L*u*v * perceptualmente uniformes como
características de cor e um conjunto de filtros Gabor como características de textura.
Tzagkarakis, Beferull-Lozano & Tsakalides (2006) apresentam um esquema de recuperação de
imagem invariante à rotação baseado na transformação da informação da textura por uma
pirâmide dirigível. Primeiro, os autores ajustaram a distribuição dos coeficientes de sub-banda
usando um modelo sub-Gaussiano alfa-estável (alpha-stable sub-Gaussian model) para capturar
seus comportamentos o Gaussianos. Então, os autores aplicaram um processo de normalização
em ordem para tornar os coeficientes Gaussianos. Como resultado, o passo de extração de
características consiste em calcular as covariâncias entre os coeficientes de pirâmide
normalizada. A semelhança entre duas imagens de texturas distintas é medida minimizando uma
versão invariante à rotação da divergência de Kullback-Leibler entre suas correspondentes
distribuições Gaussiana multi-variadas, onde a minimização é executada sobre um conjunto de
ângulos de rotação.
3.2.1.6 Técnicas baseadas em classificação bayesiana
Yong Huang, Kap Luk Chan & Zhihua Zhang (2003) propõem um método de classificação de
texturas baseado na integração de características multi-modelo através de redes Bayesianas.
Considerando que muitas texturas de imagem exibem propriedades estruturais e estatísticas, dois
conjuntos de características baseados em dois modelos de textura (modelo Gabor e modelo de
Campo Aleatório Gaussiano de Markov) são usados para descrever as propriedades de imagem
em estrutura e em estatísticas. Então, um classificador de redes Bayesianas é usado para
combinar estes dois conjuntos de características junto com suas medidas de confiança individual
para classificação de textura.
Lipowezky (2006) apresenta uma nova aproximação para a cor à imagens aéreas ou espaciais em
escala de cinza. O método proposto está baseado em uma premissa simples: texturas semelhantes
deveriam ter distribuições de cor semelhantes. Esta premissa é formalizada usando classificação
24
de textura Bayesiana de imagens de escala cinza (destino) com um conjunto de protótipos
texturais para imagens coloridas (fonte).
3.2.2 Abordagens espectrais
A abordagem espectral baseia-se em propriedades do espectro de Fourier, sendo principalmente
utilizadas na detecção de periodicidade global, através da identificação de picos de alta energia
no espectro da imagem.
Tao-I. Hsu, Jiann Ling Kuo, & Wilson (2000) descrevem um algoritmo de segmentação de
textura que foi projetado usando um algoritmo cooperativo dentro da estrutura da Transformada
de Fourier Multi-Resolução (Multiresolution Fourier Transform - MFT). O espectro de
magnitude da MFT é empregado como espaço de característica em que a detecção dos limites da
textura é calculado por meio da combinação de informação de borda e propriedades de região.
Um pré-processamento de suavização é aplicado, primeiro às magnitudes de MFT para reduzir
as flutuações de textura, seguido pelo operador Sobel, executado nas magnitudes da MFT para
dar uma estimativa de limite de textura. O refinamento da estimativa do limite é realizado
utilizando probabilidades de ligação de limite e probabilidade de ligação de região de uma
maneira interativa. Os autores apresentam os resultados obtidos com várias texturas sintéticas e
naturais que ilustram a efetividade do esquema.
Frye & Ledley (2000) avaliam que muitas das numerosas medidas de textura estão baseadas em
decomposição do sinal de espaço-freqüência; estes incluem filtros Gabor e métodos baseados em
wavelet. A transformada discreta de cosseno (Discrete Cosine Transformation -
DCT) extrai
componentes de freqüência espacial (spatial-frequency
-
SF) de uma região de imagem local.
Usando DCT, os autores derivam uma representação de SF para uma região de interesse (Region
Of Interest
-
ROI) cercando cada pixel da imagem. Também demonstram que os coeficientes de
DCT podem representar um SF como uma combinação de vários coeficientes de DCT,
dependendo da liberdade máxima da forma de onda SF para o começo da ROI. São apresentados
exemplos que mostram como este DCT insensível à mudança (DCT Shift-Insensitive - DCTSIS)
pode ser usado como um descritor visando classificar regiões de textura de imagens.
3.2.3 Abordagens baseadas em modelos
As abordagens baseadas em modelos utilizam o conceito de dimensão fractal para quantificar a
densidade dos fractais no espaço métrico em que são definidas e, assim, determinar a rugosidade
de uma textura.
25
Conci & Nunes, 2001; Nunes, 2001; Nunes & Conci, 2001, 2003c, 2003d e 2003e propõem o
método CDC (Contagem de D-Cubos) para determinar à dimensão fractal de texturas em
imagens multidimensionais. O método é uma extensão dos conceitos expostos pelo método
MDBC (Differencial Box Couting Modified), com a vantagem de permitir o cálculo da dimensão
fractal de imagens de qualquer dimensão.
Kasparis et al. (2001) propõem uma nova aproximação à segmentação de imagens em escala de
cinza texturizadas baseada em imagem pré-filtrada e características fractais. Tradicionalmente,
os métodos de decomposição do banco de filtros consideram a energia em cada faixa como
característica textural, parâmetro este que é altamente dependente na intensidade da imagem. Os
autores usam características baseadas em fractais que dependem mais de características texturais,
ao invés de informação de intensidade. Para reduzir o número total de características usadas na
segmentação, a significação de cada característica é examinada e as características menos
significantes não são utilizadas no processo de agrupamento. O algoritmo K-means, comumente
usado, é estendido a um K-means interativo através de uma janela de tamanho variável que
preserva detalhes de limite. O número de agrupamentos que usam uma aproximação hierárquica
melhorada e que ignora a informação ao redor das bordas da região é calculado.
Charalampidis & Kasparis (2002) introduzem um conjunto de características invariantes à
rotação para segmentação e classificação de textura baseado na extensão das características de
dimensão fractal (Fractal Dimension - FD). A FD extrai informação de aspereza das imagens,
considerando todas as escalas disponíveis de uma vez. Os autores consideram uma única escala
de cada vez, de forma que texturas com propriedades dependentes de escala são caracterizadas
satisfatoriamente. Características de escala única são combinadas com características de escala
múltipla para uma representação textural mais completa. São empregados wavelets para a
computação de características aproximadas de escala única e múltipla, por causa de sua
habilidade para extrair informação para resoluções diferentes. As características são extraídas em
direções múltiplas usando wavelets direcional, e o vetor de característica é finalmente
transformado para um vetor de características invariantes à rotação que retém a informação
direcional da textura. Um algoritmo K-means interativo é usado para segmentação. Uma forma
simplificada de um classificador Bayesiano é usado para classificação. O uso do conjunto de
característica de aspereza resulta em desempenho de segmentação de alta qualidade. Além disso,
é mostrado que o conjunto de características de aspereza exibe uma taxa de classificação mais
alta que outros vetores de característica apresentados no trabalho dos autores.
26
Novianto, Suzuki & Maeda (2003) apresentam um algoritmo para calcular a dimensão fractal
local (local fractal dimension - LFD) de imagens texturizadas. O algoritmo é estabelecido por
uma aproximação experimental baseada no método do cobertor (blanket method). O método
proposto usa o próximo número ótimo de cobertores para obter o LFD para uma pequena janela
local. A robustez do método proposto para calcular o LFD que utiliza uma janela local de 3×3
pixels é confirmada através de avaliações experimentais. O LFD é utilizado em um algoritmo de
segmentação de imagem que demonstra a capacidade da segmentação áspera de boas regiões de
texturas em imagens naturais.
Para Yong Xia, Dagan Feng & Rongchun Zhao (2006) a Análise Multifractal está ficando
mais popular em comunidades de segmentação de imagem na qual a estimativa da dimensão
multifractal, baseada em contagem de caixas (box-counting), são comumente usadas. Porém,
apesar de sua eficiência computational, o esquema de partição regular usado por vários métodos
intrínsecos de contagem de caixa, produz resultados menos precisos. Os autores propõem um
algoritmo para estimar a dimensão multifractal baseado na morfologia matemática e em um
conjunto de novos descritores multifractais, nomeados Local Morphological Multifractal
Exponents. Estes descritores são definidos para caracterizar as propriedades de escalas locais de
texturas. É utilizada uma série de elementos de estruturas cúbicas e um esquema de dilatação
interativa, de forma que a complexidade computacional das operações morfológicas podem ser
tremendamente reduzida. O algoritmo proposto e os métodos baseados em contagem de caixa
tem sido aplicados à segmentação de mosaicos de textura e imagens reais. Os resultados
comparativos demonstram que a estimação da dimensão multifractal morfológica pode
diferenciar imagens de textura mais efetivamente e pode prover segmentações mais robustas.
3.2.4 Abordagens baseadas em filtragens
As abordagens baseadas em filtragens utilizam filtros multi-resolução para modelar a textura no
domínio da freqüência espacial.
3.2.4.1 Técnicas baseadas em análise de componente
Jenssen & Eltoft (2003) apresentam a Análise de Componente Independente (Independent
Component Analysis - ICA) de imagens texturizadas como uma técnica computacional para criar
um novo banco de dados de filtros para segmentação de textura. Os autores demonstram que os
filtros de ICA podem capturar as propriedades inerentes das imagens texturizadas. Os novos
filtros são semelhantes aos filtros Gabor, mas parecem ser mais ricos no sentido de que suas
27
respostas de freqüência podem ser mais complexas. Estas propriedades permitem usar o banco
de filtros ICA para criar características de energia visando à segmentação efetiva de texturas.
Chengjun Liu & Wechsler
(2001) introduzem uma nova codificação de face e método de
reconhecimento, o classificador EFC (Enhanced Fisher Classifier) que emprega o modelo EFM
(Enhanced Fisher linear discriminant Model) em forma integrada e características de textura. A
forma codifica as características geométricas de uma face, enquanto a textura provê uma imagem
normalizada de forma-livre. Primeiramente, as dimensionalidades da forma e dos espaços de
textura são reduzidas usando análise de componente principal (principal component analysis)
restringida pelo EFM para generalização realçada (enhanced generalization). Então, a forma
reduzida e as características de textura correspondentes são combinadas através de um
procedimento de normalização para formar as características integradas que serão processadas
pelo EFM para reconhecimento de face.
3.2.4.2 Técnicas baseadas em filtros gabor
Clausi & Ed Jernigan (2000) apresentam uma abrangente classificação e comparação de
diferentes técnicas de segmentação usadas para produzir características de textura através de
filtros Gabor. Estas técnicas são baseadas em implementações já existentes e em métodos
inovadores. Os autores consideram a caracterização funcional dos filtros e a extração de
características, baseada nas saídas produzidas pelo filtro puro.
Paschos (2001) compara os modelos RGB, L*a*b * e HSV em função de suas efetividades para
análise de textura colorida. Para o autor, um crescente número de trabalhos tem demonstrado que
a utilização de informação de cor em análise de textura pode ser muito importante e benéfica
para esquemas de reconhecimento. A metodologia apresentada utiliza uma família de filtros
Gabor especialmente voltada para medir orientações e tamanhos específicos de cada textura
colorida. A performance de classificação de cada espaço de cor é efetivamente medida. O autor
apresenta os resultados experimentais obtidos com uma variedade de imagens de textura
colorida.
Grigorescu, Petkov & Kruizinga (2002) comparam características de texturas, baseadas no
espectro de energia local, obtidas por um banco de filtros Gabor. As características diferem no
tipo de pós-processamento não linear que é aplicado ao espectro de energia local. As seguintes
características foram consideradas: energia Gabor, momentos complexos e características do
operador de célula de grade (grating cell operator features). O critério Pescador (Fisher
criterion) e a comparação dos resultados da classificação foram métodos utilizados para
28
comparar a capacidade dos operadores em produzir agrupamentos de vetores de características
distintas para texturas diferentes.
Huawu Deng; Kap Luk Chan & Jun Liu (2003) aplicam a equação Poisson ao modelo de
texturas de imagem, construindo funções de fonte de calor específica e condições de bordas. A
equação Poisson é uma classe de equações diferenciais parciais que descrevem uma distribuição
de temperatura de estado-sólido em um objeto limitado. A função de fonte de calor pode ser
considerada como uma função de transformação de imagem tal que, um conjunto de
características de textura para diferentes freqüências e orientações possa ser extraído da imagem
transformada junto com o uso de um banco de filtros wavelet de Gabor. Este conjunto de
características permite um desempenho melhor na recuperação da textura da imagem, do que o
alcançado quando se utiliza às características obtidas diretamente da textura da imagem original.
Manthalkar, Biswas & Chatter (2003b) utilizam características de textura invariantes à rotação
derivadas do filtro simétrico Gabor aplicado em imagens de textura. A característica usada é
modificada pela média do desvio absoluto mínimo. São classificadas 60 texturas de Brodatz
giradas em 12 direções diferentes. Um número igual de amostras é usado durante a fase de
treinamento e teste. Os autores demonstram os resultados obtidos na segmentação de imagens de
textura (com texturas giradas), utilizando estas características.
Clausi & Huang Deng (2005) apresenta um método para melhorar o reconhecimento de textura,
baseado na combinação de filtro Gabor e características de probabilidade de co-ocorrência de
nível cinza (Grey Level Co-occurrence Probability - GLCP). O conjunto de características
combinadas utiliza a capacidade do filtro Gabor de capturar com precisão a informação de
textura de baixa e média freqüência e a capacidade do GLCP na informação de textura de alta
freqüência. Os métodos de avaliação incluem a comparação do espaço de características
separadamente e a comparação das taxas de classificação da imagem segmentada. É
demonstrado que a utilização dos conjuntos de características combinadas produzem uma melhor
separação do espaço de características, como também, uma melhor precisão na segmentação,
quando comparados com os resultados obtidos com os conjuntos de características separadas.
Chen Sagiv, Sochen & Zeevi (2006) aplicam filtros Gabor voltados para um conjunto de
orientações, escalas e freqüências de uma imagem para criar o espaço da característica Gabor.
Um distribuidor bidimencional em uma variedade Riemanniana de características locais é
extraído através de um mecanismo difusor de base Beltrami, considerando algoritmos de
segmentação de texturas por contornos ativos.
29
3.2.4.3 Técnicas baseadas em transformação wavelet
Para Angel & Morris (2000) analisar cenas naturais é difícil quando características de textura e
contorno estão presentes. O problema de construir modelos de contornos satisfatórios de tais
imagens é composto, dado os resultados de segmentação de região de textura em localização
pobre das bordas e representações de bordas multiescala, que não podem sempre separar
características de contornos salientes da desordem textural irrelevante. Para superar estes
problemas, os autores apresentam um moderno algoritmo que primeiramente cria uma
representação da borda multiescala, usando a transformação wavelet de Mallat e, então,
recombina o mapa de borda para cada escala para criar um único mapa de contorno, onde a
desordem textural é minimizada. A seguir, este algoritmo é aplicado em imagens naturais e
sintéticas que contêm características de contorno para diferentes escalas espaciais e texturas com
variados espaços de freqüência e orientação. Os resultados mostram que as características
texturais e o contorno podem ser separados para cada escala, e o mapa de contorno resultante
serve como uma representação mais efetiva, na qual a localização subseqüente e as tarefas de
reconhecimento são baseadas.
Para Hsi-Chia Hsin (2000) a transformada wavelet (packet) tem sido extensamente usada para
análise de textura. Porém, as características extraídas de texturas semelhantes com orientações
simétricas são indistinguíveis. O autor desenvolve a chamada transformada wavelet (packet)
modulada, que pode ser implementada eficazmente pelos algoritmos estruturados de pirâmide
(árvore) convencional. O desempenho desta nova transformada é demonstrado na segmentação
de texturas do banco de texturas de Brodatz em uma imagem aérea de São Francisco.
Choi & Baraniuk (2001) introduzem um novo algoritmo de segmentação de textura de imagem,
HMTseg, baseado em wavelets e o modelo de árvore escondida Markov (hidden Markov tree
model - HMT). O HMT é um gráfico probabilístico de árvore-estruturada que captura as
propriedades estatísticas dos coeficientes da transformada de wavelet . Desde que o HMT é
particularmente bem adequado às imagens que contêm singularidades (bordas e cumes), ele
provê um bom classificador para distinguir entre texturas. Utilizando a estrutura de árvore
inerente do HMT de wavelet e seu rápido treinamento e algoritmos de computação de
probabilidade, os autores executam a classificação de textura para uma gama de escalas
diferentes. Então, fundem estas classificações de multiscala usando um gráfico probabilistico
Bayesiano para obter segmentações finais confiáveis.
Noda, Shirazi & Kawaguchi (2002) motivados pela não redundância seletivamente direcional e
de natureza altamente discriminativa da representação de wavelet, apresentam um algoritmo de
30
segmentação de imagem texturizada não supervisionada, baseado em um modelo estocástico
multiscala que modela sobre a decomposição de wavelet da imagem. O modelo, usa campos
aleatórios de Markov estocástico, captura dependências estatísticas de intra-escala sobre a
imagem decomposta de wavelet, além das dependências de inter-escala e intra-escala sobre a
imagem de região de multi-resolução correspondente.
Do & Vetterli (2002) tratam de uma visão estatística do problema de recuperação de textura
combinando as duas tarefas relacionadas, isto é, a extração de características (Feature Extraction
- FE) e medida de semelhança (Similarity Measurement - SM), em conjunto com um esquema de
modelagem e classificação. Os autores afirmam que utilizar um estimador consistente de
parâmetros de modelo de textura para o passo FE, seguido de computar a distância Kullback-
Leibler (KLD) entre modelos calculados para o passo SM, é assintoticamente ótimo em termos
de probabilidade de erro de recuperação. O esquema estatístico conduz a um novo método de
recuperação de textura baseado em wavelet, que está fundamentado na modelagem precisa da
distribuição marginal de coeficientes wavelet usando densidade Gaussiana generalizada
(Generalized Gaussian Density - GGD) e na existência uma forma fechada para o KLD entre
GGDs. O método proposto provê maior precisão e flexibilidade em capturar informação de
textura, enquanto sua forma simplificada tem uma semelhança íntima com os métodos existentes
que usam distribuição de energia no domínio de freqüência para identificar texturas. Resultados
experimentais em um banco de dados de 640 imagens de textura indicam que o novo método
melhora significativamente as taxas de recuperação se comparado com aproximações
tradicionais, enquanto retém níveis semelhantes de complexidade computacional.
Huang & Dai (2003) apresentam um eficiente sistema de recuperação de imagem com alto
desempenho de precisão, baseado em duas modernas características: o vetor de declive de sub-
banda composto (composite sub-band gradient vector) e o string padrão de distribuição de
energia (energy distribution pattern string). Ambas as características são geradas das sub-
imagens de uma decomposição de wavelet da imagem original. Um mecanismo fuzzy baseado
em strings padrão de distribuição de energia, serve como um filtro para rapidamente remover
imagens não desejadas no banco de dados de consideração adicional. As imagens passadas no
filtro são comparadas com a imagem em questão, baseado em vetores de declive de sub-banda
compostos, que são extremamente poderosos para separar texturas detalhadas.
Manthalkar, Biswas & Chatterji (2003a) propõem moderna rotação e características de escala
invariante usando transformada wavelet packet discreta. O desempenho de classificação é
testado em um conjunto de 15 texturas do banco de texturas de Brodatz giradas em 12 direções e
31
para cinco escalas que cruzam uma oitava. É testado o desempenho de classificação para
diferentes bancos de filtro wavelet, para a rotação proposta e características de escala invariante.
Uma aplicação destas características para identificação de manuscrito é ilustrada.
Bashar, Matsumoto & Ohnishi (2003) abordam uma aproximação baseada na transformada
wavelet discreta e conceito de escala espacial. A estrutura de imagens de desordem local (Locally
Orderless Images - LOIs) são integrados com os coeficientes de transformada para obter um
método flexível para segmentação de textura. Comparado à intensidade (domínio de espaço), os
coeficientes wavelet parecem ser mais confiáveis com respeito à imunidade de ruído e à
facilidade de formação de característica. Conseqüentemente, os autores representam cada valor
de coeficiente discreto como uma função de densidade de probabilidade para formar imagens
isophote. Cada imagem isophote é então envolvida com um Gaussiano para formar LOIs que
especificam um histograma local em cada ponto de transformada. Este LOIs, ou momentos
estatísticos computados de LOIs, podem ser considerados como características de textura. Uma
experiência com os bancos de dados do padrão de textura Brodatz e VisTex demonstram o
desempenho superior do LOIs, baseado em wavelet comparado aos momentos baseados em LOI
convencionais ou características de energia wavelet e Gabor. A elegância da aproximação está na
maior flexibilidade em produzir resultados de segmentação. Um simples classificador de
distância mínima e a análise da matriz de confusão confirmam os atributos acima.
Aujol, Aubert & Blanc-Feraud (2003)
apresentam um modelo de classificação supervisionada
baseado em uma aproximação de variação. Este modelo é especificamente dedicado às imagens
texturizadas. O objetivo dos autores é adquirir uma partição de uma imagem, composta de
regiões de textura separadas por interfaces regulares. Cada tipo de textura define uma classe.
Uma transformada wavelet packet é usada para analisar as texturas, caracterizadas pela sua
distribuição de energia em cada sub-banda. Para segmentar uma imagem de acordo com as
classes, as regiões e suas interfaces são modeladas, através de funções de conjunto de veis. Os
autores formulam uma função nestes conjuntos de veis, cuja minimização define a
classificação ótima de acordo com a textura. Um sistema de PDEs acoplados é deduzido da
função. Resolvendo este sistema, cada região evolui de acordo com seus coeficientes de wavelet
e interage com as regiões vizinhas em ordem, para obter uma partição com contornos regulares.
São mostradas experiências em imagens sintéticas e reais.
Chi-Man Pun (2003) sugere uma efetiva característica de textura invariante à rotação wavelet
polar para recuperação de imagem. O processo de extração de característica envolve uma
transformada polar seguido por uma adaptável transformada wavelet packet invariante à troca da
32
fila. A transformada polar converte uma determinada imagem em invariante à rotação, exceto a
imagem de fila-trocada. Esta é passada por uma adaptável transformada wavelet packet
invariante à troca da fila, a fim de gerar algumas sub-bandas de coeficientes wavelet invariante à
rotação, com respeito à uma função de custo de informação. Uma assinatura de energia é
computada para cada sub-banda destes coeficientes wavelet. Para reduzir dimensionalidade de
característica, somente as assinaturas de energia wavelet polar mais dominantes são selecionadas
como vetor de característica para recuperação de imagem. Todo o processo de extração de
característica é bastante eficiente e envolve somente complexidade O(n·logn). Resultados
experimentais mostram que esta característica de textura invariante à rotação é efetiva e supera
os outros algoritmos de recuperação de imagem.
Para Qing Xu, Jie Yang & Siyi Ding (2005), o modelo WD HMM (wavelet-domain hidden
Markov model), em particular o HMT (hidden Markov tree) tem alcançado resultados
encorajadores na análise de textura em escala de cinza. Para análise de textura colorida, o
modelo WD HMM (wavelet-domínio Markov escondido modelam) pode ser usado somente para
modelar individualmente planos de cor diferentes, assumindo que eles são independentes uns dos
outros. Porém, esta suposição geral não é realista. Os autores mostram que os coeficientes de
wavelet têm certas interdependências entre planos de cor. Assim, apresentam uma moderna
aproximação para modelar as dependências entre planos de cor, bem como as escalas de
interações cruzadas. Na aproximação proposta, os coeficientes de wavelet de mesma localização,
escala e sub-banda,, exceto diferentes planos de cor, são agrupados em um vetor. Então, os
autores propõe um modelo MGMM (multivariate Gaussian mixture model) para aproximar a
distribuição marginal dos vetores de coeficiente de wavelet em uma escala e capturar as
interações de diferentes planos de cor. Além disso, a dependência estatística entre escalas
diferentes é capturada pela matriz de transição da árvore escondida de Markov (transition matrix
of the hidden Markov tree). Usando esta aproximação, os autores melhoraram o desempenho do
WD HMM na classificação de texturas coloridas.
Shutao Li & Shawe-Taylor (2005) investigam o problema da classificação de textura com
características multi-resolução individuais e combinadas (wavelet dyadic, wavelet frame, wavelet
Gabor) e pirâmide dirigível (steerable pyramid). SVMs (Support vector machines) são usadas
como classificadores.
Jafari-Khouzani & Soltanian-Zadeh (2005a) apresentam uma nova aproximação à classificação
de textura invariante à rotação. A aproximação proposta se beneficia do fato de que a maioria
dos padrões de textura ou tem direcionalidade (texturas anisotrópicas) ou não está com uma
33
direção específica (texturas isotrópicas). As características de energia de wavelet de texturas
direcionais mudam significativamente quando a imagem é girada. Porém, para as imagens
isotrópicas, as características de wavelet não são sensíveis à rotação. Então, para as texturas
direcionais, é essencial calcular as características de wavelet ao longo de uma direção específica.
Na aproximação proposta, a transformada de Radon é primeiramente empregada para detectar a
direção principal da textura. Então, a textura é girada para colocar sua direção principal à zero
graus. Uma transformada de wavelet é aplicada à imagem girada para extrair características de
textura. Esta aproximação proporciona um espaço característico com pequena variabilidade
intra-classe e, assim, boa separação entre classes diferentes. O desempenho do método é avaliado
usando três conjuntos de textura. Resultados experimentais mostram a superioridade da
aproximação proposta comparados com alguns métodos existentes.
Jafari-Khouzani & Soltanian-Zadeh (2005b) - propõem uma nova técnica de análise de textura
invariante à rotação usando transformada wavelet e Radon. Esta técnica utiliza a transformada
Radon para converter rotação à translação e, então, aplica uma transformada wavelet invariante à
translação ao resultado para extrair características de textura. Um classificador de vizinhos mais
próximos (k-nearest neighbors) é empregado para classificar padrões de textura. Os autores
propõem um método para achar o ótimo número de projeções para a transformada Radon e
mostram que as características extraídas geram um eficiente espaço de caracteristica ortogonal.
Também demonstram que as características propostas extraem informação local e direcional dos
padrões de textura. Para testar e avaliar o método, os autores empregam vários conjuntos de
texturas junto com diferentes bases wavelet. Resultados experimentais mostram a superioridade
do método proposto e sua robustez ao ruído branco aditivo em comparação com alguns recentes
métodos de análise de textura.
Scharcanski (2005) expõe um novo método para análise de textura estocástica de multi-
resolução, interpretação e discriminação, baseado na transformada wavelet. Uma medida de
distância de multi-resolução para texturas estocástica é proposta, e aplicações do método na
indústria têxtil são informadas.
Peiling et al. (2006) propõem conjunto de características invariante à rotação e à escala baseados
em transformada Radon e análise de multiescala. Transformada Radon é usada para projetar a
imagem ao espaço 1-D, e então, as linhas da matriz de projeção são transformadas por uma
transformada wavelet 1-D adaptável, assim a matriz de características invariantes à escala é
derivada no domínio wavelet Radon. Análise Multiescala é empregada para a matriz de
características, e os valores de energia em diferentes escalas são provados não somente serem
34
invariantes à escala e à rotação da imagem, mas também refletem as diferentes distribuições de
energia da imagem de textura em diferentes escalas. Na fase de classificação, um classificador de
Mahalanobis é usado para classificar 25 classes de texturas naturais distintas. Os autores
apresentam resultados experimentais usando conjuntos de imagem de teste com orientações e
escalas diferentes, que demonstram elevada taxa de reconhecimento médio para invariância à
rotação e escala.
3.2.5 Abordagens baseadas em transformação de watershed
A Transformação Watershed, também conhecida como linha divisora de águas - LDA (MEYER,
1993; SOILE, 1991) é a principal ferramenta de segmentação morfológica.
Malpica, Ortuño & Santos (2003) apresentam uma extensão do algoritmo de watershed, usando
um vetor gradiente (vector gradient) e métodos de fusão (multivariate region merging methods).
O algoritmo usa um conjunto de imagens de textura, e depende somente de um parâmetro
ajustável. Os autores apresentam resultados em um conjunto padrão de imagens sintéticas e em
texturas de imagens médicas, usando diferentes parâmetros de texturas e critérios de fusão.
Para Hill, Canagarajah & Bull (2003) a transformação de watershed é uma ferramenta bem
estabelecida para a segmentação de imagens. Porém, a segmentação watershed freqüentemente
não é efetiva para regiões de imagens texturizadas perceptualmente homogêneas. Para segmentar
tais regiões corretamente, os autores introduzem o conceito de “gradiente de textura”.
Informação de textura e seu gradiente são extraídos usando uma moderna forma não dizimada de
transformação de wavelet complexa. Um moderno algoritmo marcador de localização é
subseqüentemente usado para localizar significantes regiões homogêneas texturizadas ou não
texturizadas. Então, o método usa um marcador dirigido de transformação watershed para
segmentar as regiões identificadas corretamente. O algoritmo combinado produz textura efetiva e
segmentação baseada em intensidades aplicáveis à recuperação de imagem baseada em
conteúdo.
3.2.6 Abordagens baseadas em análise de agrupamento (clusterização)
O objetivo da clusterização é agrupar os elementos de um conjunto de tal forma que os grupos
formados sejam constituídos por elementos que possuam maior similaridade com os elementos
do mesmo grupo do que com qualquer dos elementos de outros grupos.
Mirmehdi & Petrou (2000) descrevem uma aproximação para segmentação perceptual de
texturas de imagens coloridas. O método utiliza como entrada uma representação multiescala da
35
imagem de textura, gerada por um algoritmo suavizador multibanda. Este algoritmo é baseado
em medidas psicofísicas humanas de aparência de cor. A segmentação inicial é realizada
aplicando um algoritmo de agrupamento à imagem de nível mais áspero de alisamento. Então, os
agrupamentos segmentados são reestruturados para isolar os centros dos agrupamentos (zonas
nas quais os pixels são definitivamente associados com a mesma região). Os pixels da imagem
que representam os centros dos agrupamentos são usados para formar histogramas 3D de cor.
Estes histogramas são usados para designação probabilística de todos os outros pixels no centro
dos agrupamentos, visando formar agrupamentos maiores e categorizar o restante da imagem.
Então, o processo de disposição dos histogramas de cor e designação probabilistica dos pixels
aos agrupamentos é propagado por níveis mais finos de alisamento até que uma segmentação
completa é realizada ao nível mais alto de resolução.
Luo, Andreas & Savakis (2001) propõem uma aproximação de segmentação de textura em duas
fases, onde um mapa de segmentação inicial é obtido através de agrupamento não
supervisionado de características auto-regressivas de multiresoluções simultâneas
(Multiresolution Simultaneous Autoregressive - MRSAR) seguido por uma classificação não-
supervisionada de características de wavelet. As regiões de "alta confiança" e "baixa confiança"
são identificadas baseadas no resultado da segmentação MRSAR que usa erosão morfológica
multinível. O classificador de segunda-fase é treinado pelas "amostras de alta-confiança" e é
usado para reclassificar somente os "pixels de baixa-confiança".
Clausi (2002) propõe um algoritmo de agrupamento de “pesca” robusto e não supervisionado (K-
means Iterative Fisher - KIF) aplicado ao problema de segmentação de textura de imagem. O
algoritmo KIF envolve dois passos. No primeiro, o algoritmo K-means é aplicado. No segundo,
as tarefas da classe K-means são usadas para calcular parâmetros requeridos por um FLD (Fisher
linear discriminant discriminante linear pescador). O FLD é aplicado interativamente para
melhorar a solução. A combinação do K-means e do interativo FLD é chamado de algoritmo
KIF. O algoritmo hierárquico binário KIF é completamente não supervisionado, não requer
nenhum conhecimento anterior do número de classes, é uma solução não-paramétrica, e é
computacionalmente eficiente quando comparado com outros métodos usados para agrupar
soluções de segmentação de imagem de textura. Filtros Gabor e probabilidades de co-ocorrência
são usados como características de textura.
Fischer & Buhmann (2003) propõem um método de agrupamento perceptual. O agrupamento
perceptual organiza partes da imagem em grupos baseados em medidas de semelhança plausíveis
psicofisicamente. O método proposto enfatiza a conexão de elementos de imagem por mediação
36
de elementos, em vez de favorecer alta semelhança mútua. Este princípio de agrupamento rende
resultados de agrupamento superiores quando os objetos são distribuídos em grande variedade
estendida em um espaço de característica de baixa-dimensão, e não como nuvens de pontos
locais. Além de extrair estruturas conectadas, os objetos são separados como pontos fora do
padrão (outliers) quando eles estão muito longe de qualquer estrutura de agrupamento. Para este
princípio de organização de percepção, a função objetivo é otimizada por um algoritmo
aglomerativo rápido.
Sánchez-Yáñez, Kurmyshev & Cuevas (2003) usam uma aproximação estatística baseada na
representação de coordenadas de agrupamentos de imagens para classificação e reconhecimento
de imagens texturizadas. A habilidade do descritor para capturar as características estatísticas de
espaço de uma imagem é explorada. Uma binarização precisa, mas não restringida, para pré-
processamento da imagem é feita por um algoritmo de agrupamento fuzzy. Um histograma de
espectro normalizado da representação da coordenada de agrupamento é usado como um vetor
de característica única, e um classificador de distância mínima simples é utilizado para
propósitos de classificação. Usando o tamanho e o número de sub-imagens para geração de
protótipo e o tamanho das imagens de teste como parâmetros na aprendizagem e fases de
reconhecimento, os autores estabelecem regiões de classificação segura no espaço de parâmetros
da sub-imagem. Os resultados dos testes de classificação demonstraram o alto desempenho do
método proposto que pode ter aplicação industrial para classificação de textura.
Sánchez-Yáñez, Kurmyshev & Fernández (2003) utilizam um classificador de uma classe para
formar classes com uma homogeneidade requerida em relação às características de imagens de
textura fornecidas. O método proposto é baseado no espaço de característica de representação de
coordenadas de agrupamentos (Coordinated Clusters Representation - CCR). A densidade de
uma classe de imagens no espaço de caracteristicas CCR é determinada pela variância da classe,
além de ser controlada por um parâmetro de ajuste empírico. Experimentos com imagens de
textura de granitos polidos, em nível de cinza, do banco de texturas de Brodatz e "Rosa Porriño",
demonstram o alto desempenho de discriminação do método proposto.
Kurmyshev & Sánchez-Yáñez (2005) estendem uma aproximação para análises de textura de
nível cinza para imagens coloridas. Os autores propõem três classificadores de textura de cor que
usam o espaço de características CCR (Coordinated Clusters Representation). A informação
textural é derivada do plano de luminância, através de transformação de coordenadas de
agrupamentos com características de crominância, tratadas separadamente. Os classificadores
diferem, basicamente, no uso dos espaços de cores RGB e YIQ. O objetivo principal dos autores
37
é avaliar quantitativamente o desempenho dos classificadores por meio de experimento
comparativo com um conjunto de imagens coloridas VisTex e OuTex. Os resultados
experimentais indicam que os novos classificadores são rápidos e tão eficientes quanto outras
técnicas de análise de textura para o mesmo conjunto de imagens.
Hammouche & Postaire (2006) consideram a analogia entre segmentação de imagem e análise de
agrupamento. Os autores propõem uma adaptação de medidas estatísticas de textura, visando
descrever uma distribuição de espaço de observações multidimensionais. A idéia principal é
considerar os núcleos de agrupamentos como domínios caracterizados pelas suas texturas
específicas no espaço de dados. A distribuição dos pontos de dados é primeiramente descrita
como um histograma multidimensional definido em uma ordem regular multidimensional de
pontos de amostra. Para avaliar uma textura multidimensional localmente, é introduzida uma
matriz de co-ocorrência que caracteriza a distribuição local dos pontos dos dados no espaço de
dados multidimensional. Podem ser computadas várias características de textura local desta
matriz de co-ocorrência. Tal matriz acumula informação de espaço e estatística na distribuição
de dados nas vizinhanças dos pontos de amostras. São selecionadas características de textura de
acordo com sua habilidade para separar distribuições diferentes de pontos de dados. Os pontos de
amostra onde a textura subjacente local é avaliada são caracterizados em classes de texturas
diferentes. Os pontos nomeados a estas classes, considerados como os núcleos dos
agrupamentos, tendem a formar componentes conectados no espaço de dados.
Yuzhong Wang, Jie Yang & Ningsong Peng (2006) propõe melhorias na aproximação da
segmentação do valor de “J” (Segmentation of color-texture regions in images and vídeo - JSEG)
para segmentação não supervisionada de cor e textura. O "J-image" corresponde a um mapa-
classe da imagem com elevados e baixos valores de rótulos de classes de cor que correspondem a
um possível limite de uma região. Em vez do algoritmo de quantização de cor usado em JSEG,
um método de classificação automático que utiliza agrupamento de meia-mudança adaptativa
(Adaptive Mean-Shift - AMS). É aplicado para agrupamento não paramétrico aleatório. Os
resultados dos agrupamentos são usados para construir a modelagem de mistura Gaussiana para
o cálculo do valor de J-soft. O algoritmo de crescimento de região usado em JSEG é então
aplicado na segmentação da imagem baseado na multi-escala J-soft. Experimentos mostram que
o método melhorado supera as limitações do JSEG com sucesso e é mais robusto.
3.2.7 Abordagens baseadas em características de cor/bordas/contornos
Nesta subseção foram agrupadas as cnicas que utilizam características de cor e contornos para
segmentação de texturas.
38
Deng & Manjunath (2001) empregam um método para segmentação não supervisionada de
regiões de texturas coloridas em imagens e vídeo. Este método, que os autores nomearam de
JSEG, consiste de dois passos independentes: quantização de cor e segmentação espacial. No
primeiro passo, as cores na imagem são quantizadas para várias classes representativas que
podem ser usadas para diferenciar regiões na imagem. Então, os pixels da imagem são
substituídos por seus rótulos de classe de cores correspondentes, formando um mapa de classe da
imagem ("J-imagem"). Neste mapa, valores altos e baixos correspondem a possíveis limites e
interiores de regiões de texturas coloridas. O foco do trabalho está na segmentação espacial,
onde um critério para janelas locais deslizantes é aplicado ao mapa de classe, definindo uma
"boa segmentação". Em seguida, um método de crescimento da região é empregado para
segmentar a imagem, baseado na “J-imagem” multi-escala. Experiências mostram a robustez do
algoritmo JSEG em imagens reais e de vídeo.
Kan-Min Chen & Shu-Yuan Chen (2002) propõem um novo método para segmentação textura
colorida que utiliza distribuições de características. Primeiro, as distribuições de cor e
características de borda locais são usadas para derivar uma medida de homogeneidade para
regiões de texturas coloridas. Então, um método grosso-para-fino (coarse-to-fine) baseado na
medida de homogeneidade é empregado para alcançar a meta de segmentação de textura
colorida. O método proposto unifica cor e características de borda para resolver o problema de
segmentação de textura colorida, ao invés de simplesmente estender a análise de textura de nível-
cinza para imagens coloridas ou analisar somente a interação de espaço de cores na vizinhança.
Além disso, o método proposto é simples, mas eficaz. O tempo de execução é rápido, a taxa de
erro é baixa e os resultados da segmentação para cenas naturais são visualmente satisfatórios.
Finalmente, o método proposto não requer nenhum conhecimento a priori sobre o número e tipos
de texturas ou sobre o número de regiões. Os autores demonstram a viabilidade e a efetividade
do método através de várias experiências.
Cheng-Hao Yao & Shu-Yuan Chen (2003) utilizam um novo método para recuperação de textura
colorida através de características de borda e cor. O método proposto combina características de
borda e cor, em vez de analisar somente características de cor. Primeiro, as distribuições de cor e
padrões de bordas locais são usados para derivar uma medida de semelhança para um par de
texturas. Então, um método de recuperação baseado na medida de semelhança é proposto para
recuperar imagens de textura de um banco de dados de texturas coloridas. Finalmente, a medida
de semelhança é estendida para recuperar regiões de textura de um banco de dados de imagens
naturais.
39
Petrou, Piroddi & Talebpour (2006) apresentam metodologia para reconhecer texturas de dados
amostrados irregularmente. Os autores utilizam características construídas da transformação de
rastro (trace transform) que representa imagens com valores funcionais ao longo de linhas de
traçado melhor que dos valores do brilho em pontos da amostragem. Uma vez que classificação
de textura pode ser executada usando linha, ao invés de representações de ponto, não há nenhum
problema em usar dados amostrados irregularmente. A análise é executada usando linhas de
traçado identificadas pela Transformada de Hough.
3.2.8 Abordagens mistas
Nesta subseção foram agrupadas abordagens que combinam diferentes técnicas.
Pietikäinen, Ojala & Xu (2000) aplicam uma aproximação de classificação baseada em
distribuição e um conjunto de medidas de textura recentemente desenvolvidas para classificação
de textura invariante à rotação. O desempenho da aproximação é comparado ao obtido com o
famoso modelo de aproximação de campo aleatório auto-regressivo de simetria circular
(Circular -Symmetric Autoregressive Random Field - CSAR). Um problema de classificação de
quinze diferentes texturas do banco de texturas de Brodatz complexas e sete ângulos de rotação é
usado nas experiências. Os resultados dos autores mostram um desempenho muito melhor que as
características de CSAR. Uma análise detalhada das matrizes de confusão e dos ângulos de
rotação das amostras produz várias observações interessantes sobre o problema de classificação e
as características usadas neste estudo.
Shutao Li et al. (2003) afirmam que em anos recentes, SVMs (support vector machines) tem
demonstrado desempenho excelente em uma variedade de problemas de reconhecimento de
padrões. Os autores aplicam SVMs para classificação de textura, usando características
invariantes à translação, geradas por transformação wavelet discreta. Para aliviar o problema de
selecionar o parâmetro de núcleo certo no SVM, os autores usaram um esquema de fusão
baseado no SVMs múltiplos, cada um com uma diferente configuração do parâmetro de núcleo.
Comparado ao classificador de Bayes tradicional e learning vector quantization algorithm,
SVMs múltiplos produziu a classificação mais precisa utilizando texturas do banco de texturas
de Brodatz.
Muneeswaran et al. (2005) abordam um novo conjunto de características invariantes à escala e à
rotação para classificação de textura de imagem, combinado com um conjunto de características
invariantes (Combined Invariant Feature - CIF). É uma integração de wavelets bruta como
Gaussiana (ou Chapéu Mexicano), e ortogonal wavelets como Daubechies, para alcançar uma
40
alta qualidade de conjunto de características invariante à escala e à rotação. A invariância à
rotação é alcançada usando este dois wavelets com suas propriedades direcionais e a invariância
à escala por um método que é uma extensão às características da dimensão fractal (Fractal
Dimension - FD). O primeiro e segundo parâmetro de ordem estatístico e entrópico caracterizam
a qualidade das características extraídas. Além disso, é apresentada uma comparação que mostra
a mais alta taxa de reconhecimento alcançada com o método recentemente proposto para o
conjunto de 6.720 amostras colecionadas de 105 diferentes texturas do banco de texturas de
Brodatz, Vistek, Indezine e algumas imagens adicionais coletadas de outras fontes de imagens
coloridas reais e indexadas.
Pappas, Junqing Chen & Mojsilovic (2005) propõem uma nova aproximação para segmentação
de imagem baseado em características de baixo nível para cor e textura, visando à segmentação
de cenas naturais, nas quais a cor e a textura de cada segmento não exibam características
estatísticas uniformes. A aproximação proposta combina conhecimento de percepção humana
com uma compreensão de sinais característicos para segmentar cenas naturais em regiões
perceptualmente uniformes. A aproximação proposta está baseada em dois tipos de
características de baixos níveis adaptáveis espacialmente. A primeira descreve a composição
local de cor em termos de cores dominantes espacialmente adaptáveis, e a segunda, descreve as
características de espaço do componente de escala cinza da textura. Juntas, elas provêem uma
caracterização simples e efetiva de textura que o algoritmo proposto usa para obter segmentações
robustas, acuradas e precisas. As segmentações resultantes carregam informação semântica que
podem ser usadas para recuperação baseada em conteúdo. O desempenho dos algoritmos
propostos é demonstrado no domínio de imagens fotográficas, inclusive de baixa-resolução,
degradada e imagens comprimidas.
Para Puig & Garcia (2006) os classificadores e segmentadores de textura baseados em pixel são
tipicamente baseados na combinação de métodos de extração de características de textura que
pertencem a uma única família (por exemplo, filtros Gabor). Porém, a combinação de métodos
de textura de famílias diferentes tem produzido melhores resultados de classificação
quantitativamente e qualitativamente. Dado um conjunto de múltiplos métodos de extração de
características de textura de famílias diferentes, os autores apresentam um novo esquema de
seleção de característica de textura que automaticamente determina um reduzido subconjunto de
métodos, cuja integração produz resultados de classificação comparáveis àqueles obtidos quando
todos os todos disponíveis são integrados, mas com um custo computacional
significativamente mais baixo. Experiências com texturas do banco de texturas de Brodatz e de
imagens reais ao ar livre, mostram que o esquema de seleção proposto é mais vantajoso que
41
conhecidos algoritmos de seleção de características de propósitos gerais aplicados para o mesmo
problema.
3.2.9 Outras Abordagens
Esta subseção reúne abordagens diversas que não se enquadraram em nenhuma das categorias
anteriores.
3.2.9.1 Técnicas baseadas em modelagem multi-resolução
Conforme Lei Wang & Jun Liu (2000), a segmentação de textura permanece um assunto
fundamental em análise de imagem de baixo vel, reconhecimento de padrão e visão
computacional. Para os autores, o problema da segmentação de textura pode ser resolvido em
duas direções: modelo ajustável (model fitting) e classificação não-paramétrica (non-parametric
classification). A utilização da modelagem multi-resolução MRF (MRMRF) na segmentação de
textura é proposta e um moderno método de estimação do parâmetro MRMRF baseado em
aproximação de MCMC (Markov chain Monte Carlo) é apresentado. Os resultados
experimentais demonstram que o método é satisfatório para segmentar imagens texturizadas.
3.2.9.2 Técnicas baseadas em operadores lógicos e transformações geométricas
Manian, Vasquez & Katiyar (2000) introduz um novo algoritmo baseado em operadores lógicos
para classificação de texturas. Os operadores construídos de blocos de construção lógica são
aplicados à imagens de textura e um ótimo conjunto de seis operadores é selecionado baseado
em suas habilidades de discriminação de textura. Então, as respostas são convertidas para
matrizes de desvio padrão computadas sobre uma janela deslizante. Zonas características das
amostras são computadas dessas matrizes. Um processo de seleção de características é aplicado e
o novo conjunto de características é usado para classificação de textura. Os autores apresentam a
classificação de várias imagens de textura naturais e sintéticas, demonstrando o excelente
desempenho do método de operador gico. A superioridade computational e a precisão da
classificação do algoritmo são demonstradas através da comparação com outros métodos
populares de classificação de texturas.
Jianguo Zhang & Tieniu Tan (2003) propõe um novo método de extrair a assinatura da textura
considerando transformações afins invariantes para recuperação de imagem baseada em
conteúdo (Content-Based Affine Invariant Image Retrieval -
CBAIR). O algoritmo proposto
explora as assinaturas espectrais das imagens de textura. Baseado na representação espectral,
assinaturas de distribuições de espectro de orientação invariantes à escala são extraídas. Vetor de
42
distribuição de cumes (Peaks distribution vector - PDV), obtido de distribuições de assinatura,
captura a invariância de propriedades de textura para transformação afim. O PDV é usado para
medir a semelhança entre texturas.
Lazebnik, Schmid & Ponce (2005) introduz uma representação satisfatória de textura para
reconhecer imagens de superfícies texturizadas sob uma gama extensa de transformações, como
mudanças de ponto de visualização e deformações não rígidas (isto é, não apenas translações e
rotações). Na fase de extração de características, um conjunto disperso de regiões afins de Harris
e Laplace é encontrado na imagem. Cada uma destas regiões pode ser entendida como um
elemento de textura que tem uma forma elíptica característica e um padrão de aparência distinto.
Este padrão é capturado por um processo invariante à transformações afins de forma
normalizada, seguido pela computação de dois descritores originais: spin image e o descritor
RIFT. Quando a invariância afim não é requerida, a forma elíptica original serve como uma
característica discriminativa adicional para reconhecimento de textura. A proposta é testada
usando o banco de textura de Brodatz.
3.2.9.3 Técnicas baseadas em conceitos topológicos
Epifanio & Ayala (2002) sugerem uma estrutura global para classificação de textura baseada na
teoria de conjunto fechado aleatório. Nesta aproximação, uma textura binária é considerada
como um resultado de um conjunto fechado aleatório. Alguns descritores distribucionais deste
modelo estocástico são usados como características de textura para classificar a textura binária,
em particular distribuições de contatos esféricos e lineares e funções K”. Se uma textura de
escala cinza tiver que ser classificada, então a textura original é reduzida a um conjunto fechado
aleatório multivariado, onde cada componente (um diferente conjunto aleatório) corresponde
com aqueles pixels, verificando uma propriedade local. Novamente, alguns descritores
funcionais do conjunto fechado aleatório multivariado podem ser usados para descrever e
classificar a textura de escala cinza. Foram utilizadas distribuições de contatos esféricos e
lineares, marginais e cruzados e funções K. Os autores realizam validações experimentais usando
o banco de texturas de Brodatz.
3.2.9.4 Técnicas baseadas em modelo auto-regressivo
Bandera et al. (2001) propõem um novo método de segmentação baseado em textura com três
estágios que, usando técnicas de multi-resolução, provê alta velocidade computacional. A
novidade principal da aproximação é que a proximidade espacial tem uma importância
progressivamente decrescente nos mais baixos níveis de resolução, quando segmenta
43
hierarquicamente a estrutura de dados. O método alcança baixas taxas de erro e não requer
nenhum conhecimento sobre o número de texturas na imagem.
Khotanzad & Hernandez (2003) descrevem um sistema de recuperação de imagem baseado em
cor e textura que permite pesquisar um banco de dados de imagem e encontrar imagens
semelhantes à uma imagem pré-definida. A informação de cor e textura é obtida através da
modelagem com o modelo de campo aleatório auto-regressivo multiespectral simultâneo
(Multispectral Simultaneous Autoregressive - MSAR). O conteúdo genérico de cor é
caracterizado por proporções médias de amostras de cor. O processo de recuperação envolve a
segmentação da imagem em regiões uniformes de texturas de cor, usando uma aproximação de
agrupamento de histograma não supervisionado, que utiliza a combinação de MSAR e
características de cor. O conteúdo de cor e textura, a localização, a área e a forma das regiões
segmentadas são usados para desenvolver medidas de semelhança que descrevem a proximidade
entre uma imagem de questão e imagens do banco de dados. Estes atributos são derivados do
ajuste máximo quadrático e elíptico para cada região segmentada. A medida de semelhança
proposta pelos autores combina todos estes atributos para classificar a proximidade das imagens.
Alata & Ramananjarasoa (2005) propõem algumas melhorias para um algoritmo de segmentação
de imagem não supervisado usando um quarto do plano 2-D de modelo auto-regressivo. O
algoritmo de segmentação trabalha em duas fases: A primeira fase consiste em uma estimativa
do número de texturas e os parâmetros de modelos associados com cada textura existente. A
estimativa é alcançada minimizando um critério de probabilidade que inclui um termo de
penalidade como os utilizados em critérios de informação (Information Criteria - IC). A segunda
fase trata da máxima estimativa posterior do campo de rótulo através do método simulated
annealing.
Kung-Hao Liang & Tjahjadi
(2006) tratam de dois assuntos desafiadores em segmentação de
textura em multi-escala não supervisionada: determinar resoluções espaciais e de características
adequadas para diferentes regiões da imagem, e utilizar diferentes resoluções para cruzar
informação. O centro de uma textura homogênea é analisado usando resolução espacial grosseira
e sua borda é detectada usando resolução espacial fina para localizar os limites com precisão. A
extração das características de textura é alcançada por uma pirâmide de multi-resolução. Os
valores das características são integrados adaptativamente em resoluções de cruzamento. O
número de texturas é determinado automaticamente, usando o critério de relação de variância.
Resultados experimentais em imagens sintéticas e reais demonstram a melhoria em desempenho
do esquema multi-escala proposto sobre aproximações de escala únicas.
44
3.2.9.5 Técnicas baseadas em medidas de similaridade/distâncias
Para Hao He & Yan Qiu Chen (2000) muitos métodos de segmentação de textura na literatura
assumem que as mudanças de intensidade podem ser atribuídas à própria textura. Porém, as
imagens do mundo real podem conter amplas faixas de gradação de intensidade que não estão
associadas com a textura local, como as causadas pela iluminação do ambiente e por câmeras.
Para superar este problema, os autores propõem um método de segmentação de textura não
supervisionado. Enfatizando as relações de espaço entre os pixels de textura adjacente, o
algoritmo proposto começa por um conjunto de pixels de semente e a região de textura é gerada,
incluindo os pixels semelhantes. Para suprimir a influência de ruídos, uma atenção especial é
dada ao critério da semelhança. Além disso, para satisfazer a exigência da segmentação não
supervisionada, o limiar (threshold) na conferência da semelhança é automaticamente
determinada através da aplicação interativa do algoritmo. Os autores apresentam os resultados
experimentais obtidos em texturas de imagens do banco de texturas de Brodatz e imagens do
mundo real.
Reyes-Aldasoro & Bhalerao (2006) apresentam uma metodologia de seleção de características
baseada em um moderno espaço de Bhattacharyya para o problema de segmentação de textura. O
espaço de Bhattacharyya é construído para as distâncias de Bhattacharyya de diferentes medidas
extraídas com filtros sub-bandas de amostras de treinamento. As distribuições marginais do
espaço de Bhattacharyya apresentam uma seqüência das sub-bandas mais discriminantes que
podem ser usadas como um caminho para um algoritmo de envoltura. Quando esta seleção de
característica é usada com um algoritmo de classificação de multi-resolução em um conjunto
padrão de mosaicos de textura, produz os mais baixos erros de má classificação relatados.
3.2.9.6 Técnicas baseadas em regras de associação
Rushing et al. (2001) propõem um novo tipo de característica de textura baseado em regras de
associação. Regras de associação foram usadas em aplicações como análise de mercado, para
capturar relações existentes entre artigos em grandes conjuntos de dados. É mostrado que regras
de associação podem ser adaptadas para capturar freqüência de ocorrências de estruturas locais
em imagens. Regras de associação capturam informação estrutural e estatística, e
automaticamente, identifica as estruturas que ocorrem mais freqüentemente e relações que têm
poder discriminativo significante. Os autores descrevem métodos para classificação e
segmentação de imagens por textura que usam regras de associação como características de
textura. Os autores demonstram que regras de associação de características podem distinguir
45
pares de textura em primeira, segunda e terceira ordens estatísticas e pares de textura que não são
facilmente discriminadas visualmente.
Rushing et al. (2002) descrevem um novo tipo de característica de textura baseado em regras de
associação. Regras de associação têm sido usadas em aplicações como análise de Mercado para
capturar relações presentes entre itens nos grandes conjuntos de dados. Os autores demonstram
que regras de associação podem ser adaptadas para capturar freqüência de ocorrências de
estruturas locais em imagens. A freqüência da ocorrência de estruturas pode ser usada para
caracterizar a textura. Os autores descrevem métodos para segmentação de imagens por textura
baseado em regras de associação de características.
3.2.9.7 Técnicas baseadas em Redes Neurais
Jinsang Kim & Tom Chen (2001) apresentam um método de segmentação que permite
identificar regiões homogêneas para representar objetos de nível mais altos, visando
classificações baseada em conteúdo. O esquema proposto extrai características múltiplas, como
movimento e textura, na base de pixel. Diferentes pesos são aplicados para cada componente de
características em função de medidas de confiança do movimento. O esquema proposto consiste
de duas fases. Na primeira fase, um espaço de características ltiplo é transformado para um
espaço de rótulo unidimensional, usando um método de agrupamento baseado em rede neural de
mapas de características de auto-organização (Self-Organizing Feature Maps - SOFM). Na
segunda fase, as saídas da rede neural são fundidas para gerar a resolução da segmentação
desejada. Os resultados experimentais e a análise de desempenho demonstram a validez do
esquema proposto.
Rohrmus (2005) introduz modernas características geométricas de texturas para descoberta
automática de defeitos de textura. Estas características são invariantes a tranformações
geométricas e adaptáveis à textura. Uma função algébrica é combinada sobre intensidades locais,
vizinhos circulares na imagem e análise de textura anisotrópica (padrões de textura com
direcionalidade). A adaptabilidade é alcançada pela otimização deste núcleo de características e
coeficientes adicionais, através de uma simples minimização de energia, restringida por uma
medida de discriminação de textura (Fisher criterion). Uma rede neural (multilayer perceptron
network) treinada com um algoritmo backpropagation classifica as texturas localmente. A
aproximação proposta contém propriedades novas (teoricamente implícito, invariâncias múltiplas
e uma adaptabilidade automática e específica das características para as imagens de textura),
normalmente incomuns nas teorias de reconhecimento de padrões. Os experimentos realizados
46
alcançam altas taxas de precisão no reconhecimento de um conjunto de texturas do banco de
texturas de Brodatz.
Avci (2006) usa uma Rede Neural WNN-ANE (Wavelet Neural Network based on Adaptive
Norm) para aumentar a efetividade do algoritmo de extração de características invariante à escala
WSF (Best Wavelet Statistical Features (WSF)–Wavelet Co-occurrence Features (WCF)). A
eficiência do método proposto foi comprovada através de experimentos exaustivos realizados
com texturas de Brodatz.
Sengur, Turkoglu & Ince (2006) descrevem o uso de redes neurais wavelet packet (wavelet
packet neural networks - WPNN) para o problema de classificação de textura. O esquema
proposto é composto de um extrator de características wavelet packet e um classificador multi-
layer perceptron. Características de energia e entropia são integradas ao extrator de característica
wavelet. Os estudos experimentais executados mostram a efetividade da estrutura WPNN. A taxa
de sucesso global é aproximadamente de 95%.
3.2.10 Comparação de abordagens
Nesta subseção foram reunidos trabalhos que realizam uma avaliação comparativa de diferentes
abordagens para segmentação de texturas.
García-Sevilla & Petrou (2001) comparam sistematicamente e avaliam quatro métodos diferentes
de classificação de textura (baseado em wavelet, matrizes baseadas em co-ocorrência,
histogramas baseados em 1D, modelo baseado em modelos Booleanos 1D) com respeito aos seus
desempenhos em identificar texturas de amostras pequenas e irregulares.
Rubner et al. (2001) comparam empiricamente nove famílias de medidas de dissimilaridade de
imagem que estão baseadas em distribuições de características de cor e textura, somando mais de
1000 horas de CPU de experimentos computacionais. Avaliações quantitativas de desempenhos
são dadas para classificação, recuperação de imagem e tarefas de segmentação para uma larga
variedade de parâmetros de medida de dissimilaridade. É demonstrado como a seleção de uma
medida baseada em avaliação de larga escala, melhora substancialmente a qualidade de
classificação, recuperação e segmentação não supervisionada de cor e imagens de textura.
Drimbarean & Whelan (2001) focalizam a classificação de imagens de textura com cor. O
objetivo principal dos autores foi determinar a contribuição da informação de cor ao desempenho
da classificação global. Três aproximações (transformação local linear, filtro Gabor e a
aproximação de co-ocorrência) para a análise de textura de escala cinza são estendidas para as
47
imagens coloridas. Elas são avaliadas de uma maneira quantitativa por meio de uma experiência
comparativa, utilizando um conjunto de imagens coloridas. Os autores também investigam o
efeito da utilização de diferentes espaços de cores e a contribuição de cor e características de
textura de forma separada e conjunta. O critério de avaliação é a precisão da classificação por
meio de um classificador de rede neural baseado em Learning Vector Quantization.
Jianguo Zhang & Tieniu Tan (2002) realizam um estudo sobre a importância da análise de
textura invariante. Os autores abordam aproximações de análise de textura, cujos desempenhos
não são afetados por translação, rotação e transformação afins ou de perspectiva. Algoritmos
existentes de análise de textura invariante são cuidadosamente estudados e classificados em três
categorias: métodos estatísticos, métodos baseados em modelos e métodos estruturais. Cada
aproximação é revisada de acordo com sua classificação. Seus méritos e desvantagens são
delineados.
Segundo Mäenpää & Pietikäinen (2004), as aproximações atuais para análise de textura colorida
podem ser grosseiramente divididas em duas categorias: métodos que processam cor e textura
separadamente e métodos que consideram cor e textura associadamente. Os autores avaliam
empiricamente ambas as aproximações com um grande conjunto de texturas coloridas naturais.
O desempenho dos métodos de classificação coloridos e em escala de cinza são comparados e os
métodos de textura e cor separados, são comparados com os métodos de textura e cor
combinados, em condições de iluminação estática e variada.
Soltanian-Zadeh, Rafiee-Rad & Pourabdollah-Nejad (2004) apresentam uma comparação e
avaliação do desempenho de quatro texturas diferentes e métodos de extração de característica de
forma para classificação de microcalcificações benignas e malignas em mamogramas. Para 103
regiões contendo agrupamentos de microcalcificação, texturas e características de forma, foram
extraídas usando quatro aproximações: quantificadores de forma convencional; método baseado
em co-ocorrência de Haralick; transformações de wavelet; e transformações de multi-wavelet.
Para cada conjunto de características, a característica mais discriminante e seus pesos ótimos
foram encontrados através de algoritmos genéticos, permitindo a comparação do desempenho de
cada aproximação.
Para Chih-Fong Tsai (2005), as características espectrais de imagens, como filtros Gabor e
transformada wavelet, podem ser usados para classificação de textura em imagem. Assim, um
classificador pode ser treinado, a partir de um conjunto de treinamento, com características de
texturas rotuladas e, posteriormente, classificar texturas não rotuladas em classes pré-definidas.
O propósito do autor é duplo. Primeiro, investigar o desempenho da classificação usando filtros
48
Gabor, transformação wavelet e suas combinações na representação de característica de textura
de imagens de paisagem. Um classificador k-NN (k-nearest neighbor) e SVM (support vector
machine) também são comparados. Segundo, três classificadores k-NN e três SVMs são
combinados respectivamente, em que cada um dos três classificadores combinados usam uma
das três representações de características de texturas acima, para ver se a combinação de
classificadores múltiplos melhora o desempenho da classificação da imagem de paisagem em
relação à utilização de um classificador único.
3.3 C
ONSIDERAÇÕES
F
INAIS
Este capítulo apresentou conceitos básicos sobre texturas. Foram descritas, brevemente, diversas
abordagens existentes na literatura recente para análise de textura. O próximo capítulo abordará a
metodologia proposta para quantificação de textura de uma região.
4. METODOLOGIA
Este capítulo apresenta um novo método de segmentação de imagens multiespectrais baseado
em sua textura. A primeira seção fornece noções sobre medidas estatísticas. A segunda seção
aborda o coeficiente proposto para quantificação de textura, denominado Coeficiente de
Variação Espacial. A terceira seção trata de problemas de otimização. A quarta seção detalha
a modelagem do algoritmo genético (AG). Na quinta seção, métodos de clusterização são
considerados. A sexta seção descreve a modelagem do algoritmo Kmeans.
4.1. MEDIDAS ESTATÍSTICAS
Para analisar as tendências de características da distribuição de valores das amostras de uma
classe, isoladamente, ou comparativamente com as outras, é necessário introduzir conceitos
que se expressem através de números que permitam interpretar essas tendências. Esses
conceitos são elementos típicos da distribuição: as medidas de posição, de dispersão, de
assimetria e curtose.
As medidas de posição ou de tendência central constituem uma forma mais sintética de
apresentar os resultados contidos nos dados observados (valor dos elementos da classe), pois
representam um valor central, em torno do qual os dados se concentram. A média, equação
(4.1), a mais comum das medidas de posição, é o quociente da divisão da soma dos valores da
variável,
xi
, pelo número deles,
n
:
n
xi
n
i
x
=
=
1
__
(4.1)
Entretanto, a utilização de uma medida de posição para substituir um conjunto de dados é
insuficiente para sintetizar a informação nele contida, pois ainda que seja capaz de representar
50
uma série de valores, não descreve por si mesma o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõe o conjunto.
Portanto, para sintetizarmos eficientemente a informação de um conjunto de dados, é
necessário associar a medida de posição uma medida de dispersão, que vai informar como
estes dados se comportam em torno da medida de posição empregada. Chama-se de dispersão
ou variabilidade, a maior ou menor diversificação dos valores de uma variável em torno de
um valor de tendência central, tomado como ponto de comparação.
Para obter um único número que represente a dispersão dos dados, utiliza-se a Variância, que
é a soma dos quadrados dos desvios dividida pelo número de observações. A Variância é uma
medida quantitativa da dispersão de um conjunto de dados ao redor da sua média. Porém, a
Variância possui o inconveniente de ser expressa em unidades ao quadrado, o que causa
algumas dificuldades de interpretação. Assim, para resolver este problema, trabalha-se com o
Desvio Padrão, que é a raiz quadrada da variância, equação (4.2) :
n
x
n
i
i
x
dp
=
=
1
2
__
)(
(4.2)
4.2. O COEFICIENTE DE VARIAÇÃO ESPACIAL
Esta seção apresenta um novo coeficiente para quantificação de textura de uma região,
denominado de Coeficiente de Variação Espacial (CVE). O CVE quantifica a característica de
textura através de medidas estatísticas que descrevem as variações espaciais de intensidade ou
cor. Duas medidas são empregadas: uma medida de posição (média) e uma medida de
dispersão (desvio padrão) do conjunto de pixels pertencentes à região da imagem a ser
segmentada (NUNES; CONCI, 2005b).
As medidas de posição ou tendência central apresentam os resultados contidos num conjunto
de dados de uma forma mais sintética, mas, sua utilização isolada é insuficiente para substituir
tal conjunto, sendo necessário associar uma medida de dispersão à medida de posição
empregada. Porém, a utilização das medidas de posição e dispersão para quantificação da
textura de uma região da imagem tem a desvantagem de não considerar a posição relativa dos
pixels uns em relação aos outros (KOLLER; SAHAMI, 1996). Isto, porque a textura não se
caracteriza apenas pela tonalidade dos pixels de uma região, mas também pelos
relacionamentos espaciais entre eles. Assim, o CVE leva em consideração não apenas a
distribuição de intensidades dos pixels, mas também sua distribuição espacial pelas classes de
distâncias.
51
O cálculo do CVE inicia com a definição de um conjunto de amostras de treinamento para
cada região de interesse. Essas amostras são extraídas da imagem, através de janelas de
tamanho
M
M
×
(
33
×
,
55
×
,...,
21
21
×
), definido pelo usuário. Para exemplificar o cálculo do
CVE, considere a figura 4.1 que ilustra uma região de
77
×
pixels com seus níveis de
intensidade nos canais R, G e B.
FIGURA 4.1 – Amostra de uma região com
77
×
pixels
Para cada amostra de tamanho
M
M
×
, determina-se o conjunto de intensidades dos pixels por
classe de distância e por canal considerado. A métrica
4
D
(também conhecida como métrica
Manhatan
,
cityblock
ou
quarteirão
) é utilizada para calcular a distância de cada pixel ao pixel
central da amostra. A figura 4.2 representa com as mesmas cores os pixels com mesma
distância
(
)
qpD ,
4
de cada pixel
(
)
tsq ,
em relação ao pixel central
(
)
yxp ,
, calculadas por
meio da equação (4.3).
||||),(
4
tysxqpD +=
(4.3)
onde
x
e
y
são as coordenadas do pixel central e
s
e
t
, as coordenadas do pixel considerado.
FIGURA 4.2. Classes de distâncias para região de 7x7 pixels da figura 4.1
Para a amostra da figura 4.2, existem seis grupos de pixels, correspondendo às seis diferentes
distâncias possíveis. A figura 4.3 representa as classes em função da distância máxima
considerando o canal red. A classe seguinte engloba os valores das classes anteriores
(
n
Classe
= conjunto de pixels com
nD
4
).
52
FIGURA 4.3 – Seis grupos de pixels correspondentes às classes de distâncias
Para permitir uma maior caracterização das variações do coeficiente de uma amostra para
diferentes combinações de suas bandas o valor da intensidade do pixel em um determinado
canal (
R
,
G
ou
B
) é substituído por um novo valor considerando os outros dois canais,
conforme tabela 4.1.
TABELA
4.1
Cálculo dos novos valores de intensidade
CANAL R G B
OriginaleIntensidadc _
175 168 143
a 168 143 175
b 143 175 168
22
)1( ++= bax
221,269 226,771 243,282
))1(( += batgArcoy
0,862 0,682 0,803
yxd
×
=
190,772 154,729
c
154,729 195,316 190,772
d
195,316 190,772 154,729
22
)1( ++= dcx
259,618 229,076 242,876
))1(( += dctgArcoy
0,740 0,823 0,630
yxeIntensidadNova
_
192,040 188,594 152,902
53
Por exemplo, o valor da intensidade do pixel no canal
R
- 175 (posição - 0,0 da matriz da
figura 4.2a será substituído pelo resultado do cálculo considerando as intensidades do canal
G
- 168 e
B
- 143, ou seja, o novo valor será 192,040. O mesmo procedimento será realizado
para todos os pixels das matrizes substituindo o valor de suas intensidades. Este procedimento
foi adotado, visando permitir a distinção de texturas resultantes de diferentes combinações da
ordem dos canais RGB.
Em seguida, a média e o desvio padrão para cada conjunto de pixels são calculados. O CVE
de cada classe de distância é obtido combinando a média e o desvio padrão de cada conjunto
através da equação (4.4), cujo valor único (CVE, da classe) preserva a informação de ambas
as medidas combinadas.
22
)1()
1
( ++×
+
= dpmd
dp
md
tanArcoCVE
(4.4)
onde md é a média das intensidades dos valores e
dp
seu desvio padrão.
Finalmente, a média e o desvio padrão dos CVE de cada classe de distância são novamente
combinados pela equação (4.4) resultando no CVE da amostra da região de interesse. A tabela
4.2 apresenta a média, o desvio padrão e o CVE para os dados da figura 4.2a.
TABELA
4.2
Dados para cálculo do CVE
Classe de
distancia
md dp
+1
CVE
md
CVE
dp+1
CVE
CVE
Textura
1 102,500 12,522 149,651
2 100,500 15,880 143,878
3 101,375 25,327 138,552
4 104,167 31,938 138,729
5 107,273 35,226 141,532
6 110,313 38,712 144,182
142,754 4,791
219,
572
4.3. PROBLEMAS DE OTIMIZAÇÃO
O CVE de uma amostra de textura é calculado para os canais RGB. O valor do CVE em cada
canal define uma coordenada do espaço euclideano para amostra considerada. Assim, uma
amostra com os canais RGB possuirá uma coordenada (
RED
CVE
,
GREEN
CVE
,
BLUE
CVE
),
caracterizando um ponto no espaço tridimensional. Considerando dois distintos canais
espectrais, o conjunto de amostras de treinamento das classes podem ser visualizadas através
de um diagrama de dispersão, figura 4.4.
54
FIGURA 4.4 Diagrama de dispersão de amostras da classe 1 e 2
Ainda que o usuário tenha selecionado amostras representativas das classes, é possível que
ocorra uma zona de amostras com características de CVE’s comuns, devido a complexidade
dos padrões das texturas. Assim, é necessário definir um procedimento para realizar a
separação das amostras em grupos distintos, baseado em algum critério de similaridade.
A busca por uma melhor distribuição das amostras entre classes pode ser considerada um
problema complexo de otimização que envolve tipicamente três componentes: variáveis,
restrições e função objetivo. As variáveis descrevem os vários aspectos do problema. As
restrições delimitam os valores válidos para as variáveis. A função objetivo envolve a
minimização de erros ou maximização de acertos de classificação, sendo também empregada
para medir a qualidade de uma solução gerada.
A finalidade da otimização é encontrar, num espaço de busca multidimensional, onde são
consideradas todas as possibilidades de solução de um determinado problema, um conjunto de
valores que, ao serem aplicados às variáveis do problema, permitam minimizar (ou
maximizar) uma função cujas variáveis devem obedecer às restrições impostas. Encontrar
soluções ótimas ou aproximadas para problemas de otimização NP-Difícil está longe de ser
uma tarefa fácil. Problemas desta complexidade são caracterizados por não linearidade,
ruídos, descontinuidades ou espaço de busca extremamente grande, como exemplificado na
figura 4.5. O emprego de métodos convencionais normalmente torna-se inviável em virtude
do enorme esforço computacional exigido para sua solução.
Neste trabalho, foram implementados dois procedimentos para realizar a separação das
amostras em grupos distintos: algoritmos genéticos e clusterização com algoritmo
K-Means
.
As próximas seções irão detalhar cada uma destas implementações.
55
FIGURA 4.5 - Um exemplo de espaço de busca
4.4. IMPLEMENTAÇÃO COM ALGORITMOS GENÉTICOS
Algoritmos Genéticos são modelos estocásticos e probabilísticos de busca e otimização,
inspirados na evolução natural e na genética, aplicados a problemas complexos de otimização.
Metaheuristicas como os algoritmos genéticos (AG’s), são estratégias adequadas para solução
de problemas desta natureza (NUNES; CONCI, 2003a). Estas estratégias empregam
mecanismos de busca que combinam escolhas aleatórias com o conhecimento obtido em
resultados anteriores. Guiando-se através do espaço de pesquisa do problema, evitam paradas
prematuras em ótimos locais e proporcionam, conseqüentemente, melhores soluções. Os
algoritmos genéticos não garantem a solução ótima, mas fornecem soluções próximas, ou
aceitáveis, além de serem mais facilmente aplicados em problemas complexos com muitas
variáveis e restrições ou com grandes espaços de busca (NUNES; CONCI, 2003b).
Como conseqüência da observação da natureza, em que as espécies lutam constantemente
pela sobrevivência através de sua adaptação ao ambiente, foram estabelecidos os princípios da
seleção natural e da genética:
- Cada indivíduo transmite aos seus descendentes os seus traços característicos (genéticos);
- Numa população existem indivíduos com características diferentes;
- Os indivíduos com melhores características (mais adaptados) tendem a reproduzir-se mais,
assim uma população caminha no sentido da existência de um maior mero de elementos
mais adaptados;
- Ao longo do tempo, a acumulação de pequenas variações pode originar o aparecimento de
novas espécies com melhor capacidade de sobrevivência;
- Processos de troca e aparecimento de novo material genético podem concorrer para uma
melhor adaptabilidade.
56
A segmentação de imagens utilizando algoritmos genéticos, tipicamente, envolve a rotulação
dos pixels pertencentes a uma mesma região baseado em algum critério de similaridade (nível
de cinza, cor do pixels ou região de textura em comum). Roncero (2005) apresenta um
método de segmentação de imagens utilizando algoritmos genéticos para otimizar uma função
de similaridade que é baseada na intensidade e na posição espacial do pixel. Diferentes
propostas empregando algoritmos genéticos para segmentação de imagens podem ser
encontradas na literatura (YOKOO; HAGIWARA, 1996; YOSHIMURA MOTOHIDE;
SHUNICHIRO OE, 1996; ANDREY, 1999; JING-HAO XUE
et al
., 2001; HWANG
et al.
2001; YEN; NITHIANANDAN, 2002; ZHENG; KONG; NAHAVANDI, 2002; NUNES;
CONCI, 2005). Mais informações sobre AG e sua base matemática podem ser encontrados
em (HOLLAND, 1986; GOLDBERG, 1989).
4.4.1. Funcionamento dos algoritmos genéticos
Um AG age sobre um conjunto (população) de indivíduos (cromossomos), cada um
representando uma possível solução do problema. Ao longo do processo evolutivo, os
cromossomos são avaliados e selecionados para reprodução e sobrevivência. Os cromossomos
com melhores avaliações possuirão maiores chances de serem selecionados para reprodução
de uma nova geração. Nesta etapa, poderão sofrer alterações genéticas baseadas em
operadores de cruzamento e mutação. Este processo se repete até atingir o número pré-
determinado de gerações ou algum outro critério de parada, conforme ilustrado na figura 4.6.
FIGURA 4.6 - Funcionamento de um algoritmo genético
A modelagem do algoritmo genético envolve a definição da representação cromossômica, do
critério de inicialização da população, da forma de avaliação do indivíduo, do critério de
seleção, dos operadores genéticos de cruzamento e mutação, do critério de substituição, do
critério de parada e dos parâmetros de influência.
57
4.4.2. Representação cromossômica
A representação ou codificação do cromossomo é a primeira etapa na utilização de um AG na
solução de problemas. Tradicionalmente, os cromossomos são representados genotípicamente
por vetores binários, inteiros ou reais, conforme ilustra a figura 4.7. Cada elemento do vetor
(gene) representa uma determinada característica (genótipo) ou variável do problema. Os
genes combinados representam as características do indivíduo (fenótipo) considerado como
uma possível solução do problema.
FIGURA 4.7 – Cromossomo representado por um vetor
Na representação cromossômica adotada, um cromossomo traduz uma regra de associação
que define as características de uma classe. Uma regra de associação tem a forma
SE
(
A
1
e
A
2
e...
A
n
)
ENTÃO
P
, onde o conjunto {
A
1
,
A
2
, ...
A
n
} representa os atributos preditivos e,
P
representa o valor do atributo objetivo. Os atributos preditivos assumem valores mapeados
num conjunto de números reais. Os atributos preditivos definem as características de textura
em cada uma das três bandas do espectro visível.
A figura 4.8 mostra a representação de um cromossomo para a tarefa de classificação.
Existem três atributos preditivos para textura. Cada atributo representa o valor do descritor de
textura para um dos canais: R, G ou B. Cada atributo possui dois campos: um valor mínimo e
um valor máximo. Os valores mínimo e ximo representam os limites inferiores e
superiores da faixa em que um atributo preditivo está inserido.
Atributos Preditivos (Textura)
Canal red Canal green Canal blue
Atributo 1 Atributo 2 Atributo 3
Min Max Min Max Min Max
FIGURA 4.8 - Representação do cromossomo
Com essa representação pode-se formular regras da seguinte forma:
58
SE (((Atributo 1
mín 1) E (Atributo 1
máx 1) E
(Atributo 2
mín 2) E (Atributo 2
máx 2) E
(Atributo 3
mín 3) E (Atributo 3
máx 3))
ENTÃO Atributo Objetivo = P
onde o atributo
n
(
n
= 1, 2 ou 3) indica característica de textura nos canais R, G e B,
respectivamente. Os valores mín
n
e máx
n
(n = 1, 2 e 3)
indicam os valores mínimos e
máximos de cada atributo preditivo, e P é o valor do Atributo Objetivo, ou seja, a classe a que
pertence o pixel.
A forma de representação foi escolhida em função da facilidade de interpretação, visto que é
intuitiva a visualização de um domínio de variáveis na forma de intervalo. Além disso, esta
representação, por sua simplicidade, permite a utilização de operadores genéticos
notoriamente conhecidos, tornando fácil sua manipulação.
Uma vez selecionado as medidas de textura, um vetor de padrões torna-se a completa
representação de cada amostra física. Assim, cada amostra torna-se um ponto no espaço
euclidiano tridimensional. Como as medidas de textura variam para cada amostra, variarão
também os vetores de padrões que descrevem os objetos. Esta variação ocorre não somente
entre diferentes classes, mas também dentro de cada classe. Entretanto, considerando que o
usuário tenha selecionado pixels representativos das classes 1 e 2 (classificação
supervisionada), o grau de associação entre os pixels de mesma classe será maior do que o
grau de associação entre os pixels de classes distintas.
A tabela 4.3 apresenta, de forma ilustrativa, as medidas de textura de 20 pixels selecionados
como conjunto de treinamento. Foram escolhidos dez pixels de amostra para classe 1 e dez
pixels de amostra para classe 2. Foram utilizados duas bandas para fins de visualização.
TABELA 4.3
Exemplo de medidas de textura para duas bandas
Classe 1 Classe 2
Classe
canal Red canal Green
canal Blue
canal Red canal Green
canal Blue
1 303,304 713,477 14,480 46,835 430,301 54,558
2 281,981 697,696 7,668 40,313 415,714 44,692
3 282,312 663,630 14,405 47,909 408,161 51,186
4 299,173 702,162 17,395 60,867 406,212 65,664
5 298,780 679,034 17,611 66,744 363,177 68,972
6 292,154 690,311 25,492 62,994 418,749 69,247
7 306,373 700,891 19,831 62,705 428,524 71,946
8 276,273 676,228 11,303 70,692 412,931 79,898
9 256,955 636,934 16,328 75,777 409,654 84,478
10 299,864 684,195 27,083 83,471 369,943 92,507
59
A figura 4.9 apresenta diagrama de dispersão (canais Red e Green) resultante dos dados da
tabela 4.2. Verifica-se a relevância da seleção adequada de características, pois, o grau de
separação entre as classes depende fortemente da escolha das medidas dos padrões
selecionadas para uma aplicação.
FIGURA 4.9 – Diagrama de dispersão dos dados da tabela 4.2
A partir de um conjunto de treinamento, o algoritmo genético busca evoluir regras de
associação que permitam classificar corretamente o maior número de pixels de cada classe.
Uma regra de associação define um relacionamento entre atributos preditivos (a condição de
uma regra - parte
SE
) definido pelo descritor de textura; e um atributo objetivo (conseqüência
- parte
ENTÃO
) que define a classe a que pertence o pixel.
A partir dos dados da tabela 4.2 seriam geradas as seguintes regras para classe 1 e 2:
Regra para Classe 1
SE (CVE Canal Red
256,955) E (CVE Canal Red
306,373) E
(CVE Canal Green
636,934) E (CVE Canal Green
713,477)
ENTÃO CLASSE 1 Pixel central (janela)
Regra para Classe 2
SE (CVE Canal Red
40,313) E (CVE Canal Red
83,471) E
(CVE Canal Green
363,177) E (CVE Canal Green
430,301)
ENTÃO CLASSE 2 Pixel central (janela)
Assim, é possível criar uma imagem temática através da aplicação destas regras sobre cada
pixel da imagem.
60
4.4.3. Critério de inicialização
O critério de inicialização da população define como deve ser construída a população inicial
com a qual iniciará o algoritmo genético. Normalmente, a população inicial de indivíduos ou
cromossomos é realizada de forma aleatória. Neste trabalho, optou-se por uma inicialização
pela
Faixa de Valores do Atributo
. Neste caso, buscou-se introduzir, logo no início,
indivíduos interessantes, com soluções aproximadas. Tal método ajuda a restringir o espaço
de busca do algoritmo genético. Espaço de busca é o conjunto das soluções possíveis ou
viáveis do problema a ser otimizado.
A inicialização pela faixa de valores do atributo consiste em escolher um valor para o atributo
preditivo dentro da faixa de valores do atributo que ocorrem para o atributo objetivo
especificado. Considerando os valores da amostras do conjunto de treinamento constantes da
tabela 4.3. A inicialização heurística restringe a faixa de valores do atributo para os valores
mínimo e máximo das amostras do conjunto de treinamento que pertençam a uma mesma
classe, tabela 4.4.
TABELA 4.4
Intervalo dos atributos preditivos
Descritor de Textura (CVE)
Canal Red Canal Green Canal Blue
Min Max Media Min Max Media Min Max Media
Classe
256,955
306,373
281,664 636,934 713,477 675,205 7,668 27,083 17,375
1
40,313 83,471 61,892 363,177 430,301 396,739 44,692 92,507 68,599
2
Uma vez obtido os valores máximo e mínimo, calcula-se o valor médio de um atributo
preditivo. O algoritmo genético inicializará a população escolhendo aleatoriamente um valor
na faixa [Valor Mínimo; Valor Médio] e um valor na faixa [Valor Médio; Valor Máximo].
Essa inicialização possui a vantagem de restringir o espaço de busca. Além disso, a
probabilidade dos valores dos atributos ocorrerem dentro da faixa de valores dos genes é
maior, particularmente englobando o valor médio. Evita-se assim, a geração de regras cujos
valores dos genes não são representativos.
Para o cálculo do valor médio, calcula-se a média encontrada para todos os atributos
preditivos apenas considerando-se as amostras que possuem o valor do atributo objetivo igual
ao valor especificado. O AG permite ainda que o usuário forneça uma taxa de tolerância ao
intervalo válido para geração aleatória do atributo preditivo.
61
A figura 4.10 representa esquematicamente a faixa de inicialização heurística dos atributos
preditivos dos indivíduos da população inicial.
Valor médio
Valor máximo do atributo
Tolerância
Tolerância
Valor máximo com tolerância
Valor mínimo com tolerância
Valor mínimo do atributo
FIGURA 4.10 - Faixa de inicialização heurística dos atributos preditivos
4.4.4. Avaliação do indivíduo (fitness)
A avaliação da população é realizada pela função de aptidão (
fitness
), que deve refletir a
qualidade de um indivíduo em solucionar o problema. Em problemas de otimização, a função
de aptidão está intimamente ligada à função objetivo que se quer maximizar ou minimizar.
Por ser responsável pela avaliação da qualidade de cada solução, a seleção da função de
aptidão é considerada uma etapa crítica do processo, pois interfere diretamente na
performance de um AG (SANKAR; WANG, 1996).
A equação (4.5), selecionada neste trabalho para servir como função de avaliação, considera o
número de amostras cobertas pela regra através de sua acurácia e abrangência. Assim, o
fitness será o resultado da multiplicação da acurácia pela abrangência em relação à medida de
de textura.
texturaaabrangêncitexturaacuráciaAptidão
×
=
(4.5)
A acurácia de uma regra é uma medida empregada para verificar a qualidade de uma solução
em função do grau de certeza, ou confiança, obtido por meio de um conjunto de exemplos, ou
seja, é o grau que mede quanto a regra descoberta se aplica às amostras (KLÖSGEN;
ZYTKOW, 1996).
Seja
C
um conjunto de atributos preditivos (condição da regra) e
P
, a previsão, ou classe da
amostra. Uma regra de associação da forma
PENTÃOCSE
tem uma boa acurácia, sempre
que a equação (4.6) tiver um valor “aceitável”.
62
|)~||(|
||
PCPC
PC
Acurácia
+
= (
4.6)
Ou seja, a acurácia é igual ao número de registros que satisfazem
C
e
P
dividido pelo total
de registros que satisfazem
C
. Assim, o valor máximo (melhor resultado) é 100%, indicando
que a regra abrange todas as amostras de uma mesma classe, logo, não existe erro de
classificação.
Porém, na ocorrência de conflitos, representado por
|~|
PC
, uma regra abrange registros
que satisfazem
C
, mas não caracterizam a classe meta/objetivo,
P
. Nessa situação, o valor
da acurácia pode compreender o intervalo [0 a 100], cabendo ao usuário definir se esse valor é
aceitável ou não.
A abrangência de uma regra é definida como sendo o número de registros que satisfazem
C
e
P
dividido pelo total de registros que satisfazem
P
, equação (4.7):
|)|~|(|
||
PCPC
PC
aAbrangênci
+
= (4.7)
A abrangência mede a quantidade de registros cobertos por uma determinada regra. Como a
acurácia, seu valor máximo é 100%, indicando que todos os possíveis registros de uma
determinada classe meta foram cobertos por essa regra.
Quando a parcela ||~
PC
for diferente de zero, o valor da abrangência estará no intervalo
[0, 100], indicando que ainda existem registros da classe meta não cobertos por essa regra.
Baseado nas definições de acurácia e abrangência, conclui-se que a qualidade de uma regra é
resultante da maximização destes dois valores.
4.4.5. Critério de seleção
O processo de seleção baseia-se no princípio da sobrevivência dos melhores indivíduos. O
AG deve conduzir o processo de busca de forma a favorecer os indivíduos mais aptos. Assim,
os cromossomos com melhor aptidão deverão possuir maior probabilidade de serem
selecionados aos pares para reprodução.
Por meio da reprodução, os indivíduos com alta aptidão transferem seu material genético para
próxima geração, enquanto os indivíduos com baixa aptidão são descartados da população.
63
Existem diversos esquemas de seleção. Neste trabalho, optou-se pelo esquema conhecido
como seleção proporcional, onde a probabilidade de um indivíduo ser selecionado para
reprodução é proporcional à medida de sua aptidão relativa à população.
Neste caso, a probabilidade
i
p
do indivíduo
i
a
ser selecionado, é dada pela equação (4.8):
=
=
n
j
j
i
af
af
i
p
1
)(
)(
(4.8)
onde
f
é a função de aptidão e
n
o tamanho da população.
Neste método, cada indivíduo da população é representado numa roleta com uma fatia
proporcional ao seu índice de aptidão. Assim, os indivíduos com alta aptidão recebem uma
porção maior da roleta, enquanto os de baixa recebem uma porção proporcionalmente menor.
Finalmente, simula-se um sorteio girando-se a roleta para escolher os indivíduos que
participarão do processo de reprodução.
A forma utilizada para simular a roleta consistiu em ordenar os indivíduos pelo valor de sua
aptidão, calcular a aptidão percentual em relação à população, calcular a aptidão percentual
acumulada e selecionar dois pais para reprodução a partir de um número aleatório gerado no
intervalo de 0 e 100.
Para ilustrar este processo considere os dados da tabela 4.5.
TABELA 4.5
Dados para simulação da roleta
Ordem Aptidão
Aptidão
Ordenada
Aptidão
Percentual
Aptidão
Percentual
Acumulada
1 0,24 0,75 35,89 35,89
2 0,39 0,53 25,36 61,24
3 0,18 0,39 18,66 79,90
4 0,53 0,24 11,48 91,39
5 0,75 0,18 8,61 100,00
Somatório 2,09 100,00
Conforme a equação (4.8), a probabilidade de um indivíduo ser selecionado para reprodução é
proporcional à medida de sua aptidão relativa à população (aptidão percentual), representado
no gráfico da figura 4.11.
64
FIGURA 4.11 - Aptidão percentual para os dados da tabela 4.5
A população é percorrida na ordem, enquanto o número aleatório gerado for maior do que a
aptidão percentual acumulada. Quando a condição não for mais satisfeita, será selecionado o
indivíduo anterior, cuja aptidão percentual acumulada atendeu a condição. Como no exemplo
da tabela 4.6.
TABELA 4.6
Simulação da Roleta – seleção do indivíduo
Número Aleatório 24 42 70 85 95
Indivíduo Selecionado 1 2 3 4 5
4.4.6. Operadores genéticos
Os operadores genéticos são responsáveis pela transformação da população ao longo de
sucessivas gerações, visando produzir uma solução que seja satisfatória no final do processo.
Os operadores genéticos atuam na reprodução criando e/ou alterando indivíduos e são
essenciais para a diversificação da população.
Basicamente, existem dois operadores genéticos: cruzamento (
crossover)
e mutação. O
cruzamento é um operador genético predominante, enquanto a mutação é um operador
genético secundário. Assim, a probabilidade de aplicação do operador de cruzamento deve ser
maior do que a do operador de mutação.
O cruzamento ou
crossover
é o operador genético responsável pela recombinação das
características dos pais durante a reprodução. Este operador permite que novas gerações
herdem características dos seus ancestrais e possibilita o surgimento de novas soluções a
partir da mistura de material genético dos pais.
65
Os tipos de operadores de cruzamento utilizados neste trabalho foram: o Cruzamento de um
Ponto, o Cruzamento Uniforme e o Cruzamento Aritmético.
No Cruzamento de um Ponto, um ponto de cruzamento é escolhido aleatoriamente e, a partir
deste ponto, as informações genéticas dos pais são combinadas numa nova solução. Um filho
é gerado pela combinação das informações anteriores a este ponto em um dos pais, com as
informações posteriores a este ponto no outro pai, como ilustrado no exemplo a seguir:
No Cruzamento
Uniforme, um novo filho é gerado a partir de uma máscara criada
randomicamente com valores 0 ou 1. As posições com valor 0 terão seus valores copiados do
Pai 1 nos atributos correspondentes. As posições com valor 1 terão seus valores copiados do
Pai 2 nos atributos correspondentes, como ilustrado no exemplo a seguir:
No Cruzamento
Aritmético, um novo filho é gerado a partir da média aritmética dos atributos
de seus pais, como ilustrado no exemplo a seguir:
66
O operador genético de mutação é o responsável pela introdução e manutenção da diversidade
genética da população. Este operador altera arbitrariamente um gene, possibilitando introduzir
novos elementos na população.
A mutação assegura que a probabilidade de se chegar a qualquer ponto do espaço de busca
nunca será zero, além de contornar o problema de mínimos locais, pois com este mecanismo,
altera-se levemente a direção da busca. Os tipos de operadores de mutação utilizados neste
trabalho foram: Mutação Simples, Mutação por Adição e Mutação por Translocação.
Na Mutação Simples, ilustrada no exemplo a seguir, uma posição é selecionada
arbitrariamente e o valor mínimo e máximo deste atributo é substituído pelo valor resultante
das equações (4.9) e (4.10), respectivamente.
β
=
ValorMédiom
(4.9)
β
+
=
ValorMédioM
(4.10)
onde
ValorMédio
corresponde ao valor médio do atributo, considerando todas as amostras da
classe e β é calculado pela equação (4.11):
tolerânciaMinMax
=
)(
β
(4.11)
onde
Max
e
Min
são os valores máximo e mínimo do atributo, considerando todas as
amostras da classe e
tolerância
é uma taxa de acréscimo selecionado pelo usuário.
67
Na Mutação por Adição, uma posição é selecionada arbitrariamente e o valor da equação
(4.12) é subtraído do valor mínimo do atributo e adicionado ao valor máximo.
nMinMax
/)(
=
λ
(4.12)
onde
Max
e
Min
são os valores máximo e mínimo do atributo selecionado e
n
é um número
aleatório.
Na mutação por translocação, uma posição é selecionada aleatoriamente, a fim de realizar a
permutação dos valores dos atributos entre os pais, gerando dois filhos com o material
genético combinado, como ilustrado no exemplo a seguir:
4.4.7. Critério de substituição
O critério de substituição diz respeito à maneira pela qual os indivíduos criados são inseridos
na população. Neste trabalho, dentre os diversos processos existentes, optou-se pela
substituição de toda a população por novos indivíduos gerados após o processo de seleção e
reprodução.
4.4.8. Critério de parada
O critério de parada define o parâmetro que será utilizado para encerrar o processo de
evolução genética. Os critérios implementados neste trabalho foram:
Número de Gerações
encerra a evolução quando o algoritmo atingir o mero de gerações
informadas pelo usuário.
68
Estabilização
encerra a evolução quando a aptidão do melhor indivíduo se mantiver
constante pelo número de gerações informadas pelo usuário.
Acurácia/Abrangência
– encerra a evolução quando a acurácia e abrangência do melhor
indivíduo atingir o valor informado pelo usuário.
4.4.9. Parâmetros de influência
Um AG possui diversos parâmetros que podem ser configurados para melhorar sua
performance. Como a influência de cada parâmetro no desempenho do algoritmo depende das
características particulares do problema, a otimização desses parâmetros dependerá da
realização de um grande número de testes.
É relevante que a população inicial contenha cromossomos suficientemente variados a fim de
evitar a convergência prematura. Idealmente um AG deve convergir sem perda de diversidade
genética. Assim, suas chances de encontrar o ótimo global são aumentadas, além de evitar
parada prematura em locais ótimos.
A eficiência e o desempenho global dos AGs são afetadas pelo tamanho da população.
Geralmente uma grande população permite uma cobertura representativa do domínio do
problema e fornece diversidade para prevenir convergências prematuras, mas exigem maiores
recursos computacionais e tempo de processamento. Uma pequena população pode
comprometer o desempenho, uma vez que fornece uma pequena cobertura do espaço de busca
do problema.
A taxa de cruzamento afeta a velocidade de introdução de novas estruturas na população.
Quanto maior for esta taxa, mais rapidamente novas estruturas serão introduzidas. Porém,
uma taxa muito alta pode significar perda de estruturas de alta aptidão. Enquanto que um
valor baixo pode tornar a convergência demasiadamente lenta. Uma taxa de mutação baixa
previne a estagnação em ótimos locais, além de possibilitar que se alcance qualquer ponto do
espaço de busca. Já uma taxa de mutação alta torna a busca essencialmente aleatória.
O algoritmo genético desenvolvido neste trabalho, apêndice A” (Descrição dos Programas
AGCTIM e CTIM), permite ao usuário configurar o tamanho da população, a taxa de
cruzamento e mutação, dentre outros parâmetros, visando aumentar o seu desempenho. Além
disso, foram desenvolvidas e aplicadas as seguintes técnicas: Normalização Linear, Elitismo,
Sementes, Busca Local e Interpolação Adaptativa.
69
Uma desvantagem do método de seleção proporcional é possuir alta variância. Assim, o
método da roleta pode selecionar rias vezes para reprodução um mesmo cromossomo,
devido a sua alta aptidão, diminuindo a diversidade da população. Esta desvantagem pode
produzir uma convergência prematura do algoritmo para uma solução que não seja a ideal, ou
então, pode tornar as aptidões muito semelhantes entre si numa etapa avançada da evolução,
provocando a estagnação do algoritmo em conseqüência da baixa pressão seletiva.
Considere, por exemplo, as aptidões constantes da tabela 4.7.
TABELA 4.7
Exemplo de aptidões para utilização do método da roleta
Ranking 6 5 4 3 2 1
Aptidão (fitness) 0,99 0,2 0,2 0,15 0,1 0,05
Se fizermos as chances de sorteio dos indivíduos proporcionais às suas aptidões, por meio do
emprego da equação (4.8), obteremos as probabilidades da tabela 4.8.
TABELA 4.8
Probabilidade segundo o método de seleção proporcional
Ranking 6 5 4 3 2 1
Aptidão (fitness) 0,99 0,2 0,2 0,15 0,1 0,05
Probabilidade 58,6 11,8 11,8 8,9 5,9 3,0
A probabilidade do super-indivíduo (cromossomo que possui uma avaliação muito melhor
que a dos demais) com aptidão 0,99 ser escolhido para reprodução é tão grande, que ele será
selecionado várias vezes para cruzar consigo mesmo, conforme é possível observar no gráfico
da figura 4.12. Dessa forma, é provável que não sejam gerados novos indivíduos e nem
ocorram novas combinações de material genético diferente. Em conseqüência, a população
tende a ficar semelhante a um único indivíduo não ótimo e ocorre o fenômeno da
convergência prematura, isto é, a população pára de evoluir.
FIGURA 4.12 - Probabilidade de seleção proporcional à aptidão
70
A Normalização Linear permite distribuir linearmente as aptidões dos indivíduos entre valores
máximo e mínimo, evitando este problema, equação (4.13):
(
)
1tan ×+=
ii
RANKIncrementoteConsMinaNormalizadAptidão
(4.13)
onde
Min
corresponde à aptidão mínima e
IncrementoteCons
tan corresponde à diferença
de aptidão entre 2 elementos consecutivos no ranking, é obtida pela equação (4.14):
(
)
( )
1
tan
=
DifAptidõesNum
MinMax
IncrementoteCons (4.14)
onde
(
)
MinMax
é a diferença entre o valor máximo e o valor mínimo das aptidões e
DifAptidõesNum corresponde ao número de aptidões diferentes (ou seja, o número de
aptidões sem repetição).
Considerando os dados da tabela 4.8 e definindo que a aptidão máxima será 100 e a mínima
10, existem 5 aptidões diferentes (0,99 - 0,20 - 0,15 - 0,10 - 0,05);
(
)
( )
(
)
5,22
4
90
15
10100
1
tan ==
=
=
DifAptidõesNum
MinMax
IncrementoteCons
(
)
(
)
15,22101tan ×+=×+=
iii
RANKRANKIncrementoteConsMinaNormalizadAptidão
A tabela 4.9 apresenta o cálculo das novas aptidões e probabilidades dos indivíduos.
TABELA 4.9
Cálculo das novas aptidões e probabilidades dos indivíduos
Aptidão 0,99 0,2 0,2 0,15 0,1 0,05
Ranking 5 4 4 3 2 1
Normalização 100,0 77,5 77,5 55,0 32,5 10,0
Probabilidade 28,4 22,0 22,0 15,6 9,2 2,8
Dessa forma, os valores das aptidões variam linearmente entre 100 e 10, distribuindo melhor
as chances de sorteio dos indivíduos, figura 4.13. Este procedimento diminui as chances de
um superindivíduo ser sorteado diversas vezes e causar uma convergência prematura.
71
FIGURA 4.13 – Probabilidade de sorteio – roleta normalizada
No algoritmo genético geracional ocorre a perda de bons indivíduos em virtude de toda a
geração (de pais) ser integralmente substituída por outra mais nova (de filhos). A fim de evitar
a convergência prematura decorrente da falta de convivência entre indivíduos de diferentes
gerações, optou-se por empregar o método denominado de elitismo, ou seja, o melhor
indivíduo de uma geração é copiado para geração seguinte.
Uma semente é um cromossomo que representa uma boa solução. Ao inicializar um novo
experimento, este cromossomo é inserido na população inicial a fim de contribuir com seu
material genético no início do processo evolutivo. Neste trabalho, caso o usuário selecione a
opção de inserção de semente, será inserido na população inicial um cromossomo cujos
atributos assumirão os valores correspondentes aos limites superior e inferior do atributo,
considerando todas as amostras da classe considerada, conforme ilustrado na tabela 4.10.
TABELA 4.10
Exemplo de semente
Amostras
Descritor de Textura (CVE)
Atributo 1 - Red Atributo 2 - Green Atributo 3 - Blue
Min Max Min Max Min Max
122,5 144,1 200,2 231,7 240,0 247,8
118,2
140,3
198,3
237,6
225,9
250,2
127,9 139,8 203,5 229,4 232,8 254,1
131,0 138,4 199,1 227,1 245,2 253,9
120,7
145,7
204,5
245,9
232,6
255,0
Semente
Descritor de Textura (CVE)
Atributo 1 - Red Atributo 2 - Green Atributo 3 - Blue
Min Max Min Max Min Max
118,2 145,7 198,3 245,9 225,9 255,0
72
A busca local é um procedimento heurístico que visa refinar uma solução encontrada. Neste
trabalho, a busca local consiste em encontrar a melhor avaliação para os genes
correspondentes aos valores mínimo e máximo de cada atributo para um novo cromossomo
gerado no processo de reprodução, conforme fluxograma da figura 4.14.
gene
Mínimo ou
Máximo ?
Minimo = Mínimo -1
Repita até o último gene
Máximo = Máximo+1
Percorra todas as
amostras e calcule
a aptidão do gene
Aptidão <=
aptidão
anterior ?
Selecione um novo gene
Incremente ou
decremente 1
(minimo ou
máximo) conforme
o caso
Fim
SIM
NÃO
Mínimo Máximo
Melhor gene =
gene atual
Último
gene ?
Busca Local
SIM
NÃO
FIGURA 4.14 – Fluxograma da busca local proposta
73
Assim, a busca local considera cada gene separadamente. Nos genes correspondentes aos
valores mínimos de cada atributo, a busca local decrementa uma unidade e aplica este novo
valor mínimo a todas as amostras das classes existentes, calculando o valor da aptidão deste
gene. Caso esta aptidão seja melhor que a anterior, este valor é armazenado e o valor mínimo
é novamente decrementado.
Caso a aptidão não se altere ou piore, a busca local passa para o próximo gene, guardando o
melhor valor encontrado. Se este novo gene for correspondente ao valor máximo do atributo,
a busca local realiza o mesmo processo descrito anteriormente com a diferença que, ao invés
de decrementar uma unidade, ela passa a incrementar uma unidade. Após todos os genes
serem analisados, os valores máximo e mínimo passam a assumir os valores das melhores
avaliações de cada gene encontrados no processo.
Um importante fator para o bom desempenho de um AG é a manutenção da diversidade da
população ao longo das gerações. Para controlar a diversidade é necessário um mecanismo de
determinação das probabilidades de sobrevivência, pois, um exacerbado favorecimento dos
indivíduos mais aptos implicará na diminuição da variedade da população e causará uma
possível convergência prematura para um ótimo local.
Assim, foi implementado um mecanismo de determinação de probabilidades de sobrevivência
dos indivíduos mais aptos, baseado na pressão seletiva, equação (4.15) :
i
i
i
iaAptidãoMéd
AptidãoMax
ivaessãoSelet =Pr (4.15)
onde
i
AptidãoMax é o valor da maior aptidão do cromossomo da população na
i
geração e
i
iaAptidãoMéd é a média das aptidões dos cromossomos da população na
i
geração .
Através da manutenção do valor da pressão seletiva em torno de 1.5, procura-se manter a
diversidade dos indivíduos relativamente uniforme em cada geração. Valores maiores
provocariam o surgimento de super-indivíduos que poderiam levar a uma convergência
prematura para um ótimo local. Valores menores poderiam estagnar a busca por falta de
diversidade de material genético. A diversidade torna-se nula quando a pressão seletiva for
igual a 1, correspondendo à situação na qual todos os indivíduos da população são iguais.
A interpolação adaptativa proposta neste trabalho, realiza a seleção randômica dos diversos
operadores genéticos programados e, baseado na pressão seletiva da população em uma
74
geração, altera a probabilidade de ocorrência destes operadores (conforme valores a seguir) a
fim de manter a pressão seletiva dentro de uma faixa considerada ideal ao longo de todo o
processo evolutivo.
Pressão Seletiva <1.4
Pressão Seletiva >1.6
Taxa de cruzamento entre 70% e 100%
Taxa de cruzamento entre 50% e 60%
Taxa de mutação entre 10% e 20%
Taxa de mutação entre 1% e 5%
Taxa de busca local entre 25% e 50%
Taxa de busca local entre 5% e 25%
4.5. CLUSTERIZAÇÃO
Dado um conjunto ,X um problema de Clusterização consiste em se agrupar os objetos
(elementos) de
X
de modo que objetos mais similares fiquem no mesmo cluster (grupo) e os
objetos menos similares sejam alocados para clusters distintos, figura 4.15.
FIGURA 4.15 - Esquema funcional de um algoritmo de clusterização
Problemas de clusterização podem ser definidos formalmente da seguinte maneira (OCHI,
2004):
Dado um conjunto com
n
elementos
{
}
n
XXXX ...,,
2,1
= , o problema de clusterização
consiste na obtenção de um conjunto de k clusters,
{
}
ki
CCCC ,...,,
2
= , tal que haja uma
maior similaridade entre os elementos contidos em um cluster
i
C do que qualquer um destes
com os elementos de um dos demais clusters do conjunto C . O conjunto C é considerado
uma clusterização com k clusters caso as condições das equações (4.16 - 4.18) sejam
satisfeitas:
k
i
i
XC
1=
=
(4.16
)
kiparaC
i
1:, (4.17)
jikjiparaCC
ji
= ,,1:, (4.18)
75
Se o valor de k for conhecido, o problema é referenciado na literatura como problema de k-
clusterização” (FASULO, 1999). Caso contrário, o problema é referenciado como problema
de clusterização automáticae a obtenção do valor de k faz parte do processo de solução
(DOVAL; MANCORIDIS; MITCHELL, 1999). A clusterização é uma ferramenta útil para o
estudo e compreensão do comportamento de dados em diferentes situações e tem sido
empregadas na solução de diversos problemas nas mais variadas áreas do conhecimento.
4.5.1. Medidas de Similaridade
O objetivo da clusterização é agrupar os elementos de um conjunto de tal forma que os grupos
formados sejam constituídos por elementos que possuam maior similaridade com os
elementos do mesmo grupo do que com qualquer dos elementos de outros grupos.
Para medir o quanto um elemento é similar a outro, a fim de determinar se devem pertencer
ou não a um mesmo cluster, são utilizadas medidas de similaridade. O critério de similaridade
mais comum quando se utilizam atributos numéricos baseia-se nas funções de distância.
Para empregar estas funções é preciso representar cada elemento como um vetor no espaço
n
dimensional das características. Neste caso, quanto menor for à distância entre um par de
elementos, maior é a similaridade entre eles. Espera-se que à distância entre objetos de um
mesmo agrupamento seja significativamente menor do que à distância entre objetos de
agrupamentos diferentes.
Dentre as medidas de distância mais utilizadas, encontram-se a distância “city-block
(para
1
=
r
) e a distância euclidiana (para
2
=
r
), equação (4.19):
r
n
l
r
jlilji
xxXXd
1
1
),(
=
=
(4.19)
4.5.2. Métodos de Agrupamento
A busca pela melhor solução no espaço de soluções possíveis torna o processo de
clusterização num problema NP-Difícil. A utilização de métodos exatos para obtenção da
solução ótima fica impraticável, uma vez que a verificação exaustiva de todas as
configurações de agrupamentos possíveis é computacionalmente inviável.
aproximadamente
( ) ( )
n
i
k
i
ik
i
k
k
=0
1
!
1
maneiras de repartir
n
elementos em k
agrupamentos.
76
Por exemplo, existem os seguintes números de soluções possíveis para se combinar 10
elementos, 100 elementos e 1000 elementos em 2 clusters, respectivamente: 512 soluções,
6,33825 x10
29
soluções e 5,3575x10
300
soluções.
A fim de reduzir a complexidade na solução do problema, utilizam-se metaheurísticas
capazes de fornecer soluções sub-ótimas em tempo satisfatório. Entretanto, as metaheurísticas
são normalmente desenvolvidas para certas classes de problemas, não sendo genéricas o
suficiente para obter bons resultados em toda gama de aplicações de clusterização existentes.
Na literatura são encontradas diversas metaheurísticas para a solução de problemas de
clusterização (BERKHIN, 2002), basicamente elas podem ser classificadas em métodos
hierárquicos e métodos de particionamento (FASULO, 1999).
Os Métodos Hierárquicos se dividem em Métodos Hierárquicos Aglomerativos (bottom-up) e
Métodos Hierárquicos Divisivos (top-down).
Os Métodos Hierárquicos Aglomerativos (bottom-up) iniciam com
n
clusters de um elemento
e os clusters vizinhos são agregados até que o mero desejado de clusters seja alcançado. Os
Métodos Hierárquicos Divisivos (top-down) iniciam com um cluster de
n
componentes que é
dividido sucessivamente até que o número de cluster desejado seja alcançado.
Os Métodos Hierárquicos geram uma hierarquia de clusters, normalmente representada
através de uma estrutura em árvore, conforme exemplificado na figura 4.16.
FIGURA 4.16 – Exemplo de árvore de clusters na clusterização hierárquica
Os algoritmos de clusterização hierárquica possuem a vantagem de lidarem com qualquer
medida de similaridade e são aplicáveis a qualquer tipo de atributo (numérico ou categórico).
Porém, tem como desvantagem o fato de não revisitarem os clusters construídos. Ou seja, no
método hierárquico aglomerativo, uma vez realizado a fusão de dois objetos dentro de um
77
cluster, estes não mais serão separados, permanecendo até o final do procedimento juntos no
mesmo cluster. De igual forma, no método hierárquico divisivo, uma vez separados dois
objetos, eles não mais serão agrupados em um mesmo cluster (BERKHIN, 2002). Em
imagens de satélite, devido ao grande número de objetos (pixels) presentes, esta variação
raramente é utilizada por ser mais custosa computacionalmente (RICHARDS, 1999).
Os Métodos de Partição Baseados em Recolocação tem por objetivo particionar um conjunto
de dados com
n
elementos em k grupos distintos de forma a minimizar um critério
escolhido. Estes métodos tentam descobrir novos clusters realocando interativamente pontos
entre os subconjuntos, de forma a melhorar os clusters gradualmente, o que não ocorre nos
métodos hierárquicos.
Freqüentemente, os métodos de particionamento encontram clusters com qualidade superior
(maior similaridade interna) aos dos encontrados pelos métodos hierárquicos (NG; HAN,
1994). Devido a este melhor desempenho, os algoritmos de particionamento normalmente são
mais empregados. Dentre eles, os que são baseados em um ponto central (média dos atributos
dos objetos - k-means) (ZHANG; HSU; DAYAL, 2001) ou em um objeto representativo para
o cluster (k-medoids) (KAUFMAN; ROUSSEEUW, 2005).
A qualidade do resultado obtido com os métodos de particionamento depende da seleção
coerente das seguintes variáveis: escolha dos atributos, homogeneização das variáveis,
medidas de similaridade, critérios de agrupamento, escolha do algoritmo, e definição do
número de clusters.
4.6. IMPLEMENTAÇÃO COM ALGORITMO K-MEANS
Nesta seção, são apresentados os aspectos computacionais do algoritmo K-Means proposto
para o problema de classificação de padrões em imagens multiespectrais.
K-means é um método amplamente difundido, existindo muitas variações propostas na
literatura e diversos nomes (K-médias, isodata, ou migração de médias). Em Sensoriamento
Remoto, ele é bastante utilizado para executar procedimentos de classificação não
supervisionada de imagens de satélite (SCHOWENGERDT, 1997).
K-means é um método de partição baseado em recolocação que necessita da definição a priori
do número de agrupamentos k . O critério de custo a ser minimizado é definido em função da
distância dos elementos em relação aos centros dos agrupamentos.
78
Usualmente, este critério é a soma residual dos quadrados das distâncias, geralmente a
distância euclidiana. Entende-se por soma residual dos quadrados, a soma dos quadrados das
distâncias dos elementos ao centróide do seu cluster. Para toda partição, a soma residual dos
quadrados, será a soma de todas as somas dos quadrados das distâncias de cada grupo. Quanto
menor for este valor, mais homogêneos serão os objetos dentro de cada grupo e melhor será a
partição (COELHO; EBECKEN, 2001).
O elemento representativo de um cluster é o seu centróide, que possui um valor médio para os
atributos considerados, relativos a todos os elementos do cluster. A utilização do centróide
como elemento representativo de um cluster é conveniente apenas para atributos numéricos e
possui um significado geométrico e estatístico claro, podendo, entretanto, receber muita
influência de um único elemento que se encontre próximo à fronteira do cluster.
A partir de uma estimativa inicial das coordenadas dos centros dos agrupamentos (centróides),
o algoritmo calcula a distância de cada ponto do conjunto a estes centróides. A seguir, o
algoritmo aloca cada elemento do conjunto em um grupo, de acordo com a menor distância ao
centróide correspondente. A nova estimativa das coordenadas dos centróides é calculada pela
média aritmética das coordenadas dos pontos associados a cada grupo, figura 4.17.
FIGURA 4.17 - Aplicação do método k-means
79
O método K-means é sensível ao particionamento inicial realizado, em virtude da escolha das
coordenadas dos k centróides dos clusters ser feita inicialmente de forma aleatória. A partir
deste primeiro particionamento, o algoritmo realiza uma busca de um ponto de máximo para o
seu critério de parada. Não garantias de que o algoritmo encontre o ximo global, sendo
possível encontrar distintas soluções em diferentes execuções do algoritmo.
O K-means é um tipo de algoritmo de classificação, que pode ser utilizado para a classificação
não-supersionada. Abaixo é apresentado um algoritmo básico:
(1) Determinar as posições iniciais dos k centróides dos clusters;
(2) Alocar cada elemento ao cluster do centróide mais próximo;
(3) Recalcular os centros dos clusters a partir dos elementos alocados;
(4) Repetir os passos de 2 a 4 segundo algum critério de convergência.
Na implementação desenvolvida, inicialmente é necessário selecionar um conjunto de
amostras de treinamento para cada região de interesse. Essas amostras são regiões da imagem
obtidas por janelas de tamanho
M
M
×
(
33
×
,
55
×
,...,
21
21
×
) definido pelo usuário. Cada
amostra selecionada passa a representar um ponto no espaço euclidiano tridimensional. As
coordenadas dos pontos são definidas pelo valor do CVE da região de amostra calculados
para cada canal RGB (
RED
CVE
,
GREEN
CVE
,
BLUE
CVE
). Então, as amostras do conjunto de
treinamento são agrupadas por meio do algoritmo de clusterização K-means.
A fim de evitar um número excessivo de amostras, somente amostras com coordenadas
significativas são incluídas no grupo de amostras de treinamento. Entende-se por valores
significativos, uma amostra cuja coordenada provoque uma alteração na configuração do
cluster. Em seguida, é realizada a clusterização das amostras e os centróides das classes são
calculados por meio do algoritmo K-Means, figura 4.18.
FIGURA 4.18 Clusterização das amostras baseado no valor do CVE em cada banda espectral
80
Finalmente, os valores dos centróides (CVE’s para os canais RGB) são utilizados na
classificação do restante da imagem, figura 4.19.
FIGURA 4.19 Centróides das amostras de treinamento no espaço euclidiano tridimensional
O método proposto utiliza um processo de classificação híbrida, com a realização de uma
classificação supervisionada inicial das amostras de treinamento para obtenção dos centróides
dos clusters, seguido de uma classificação não supervisionada do restante da imagem, baseado
na distância das amostras de teste a estes centróides.
Para segmentar somente textura de interesse na imagem, é verificado se a distância da amostra
de teste é maior do que uma distância de tolerância. Caso esta distância seja menor, o pixel
será rotulado com a cor da classe correspondente. Caso contrário, ele permanecerá com sua
cor original. O critério de tolerância adotado foi a maior distância da amostra de treinamento
ao centro do seu cluster.
4.7. CONSIDERAÇÕES FINAIS
Este capítulo apresentou o coeficiente proposto para quantificação da textura de uma região,
bem como, as duas abordagens desenvolvidas para sua utilização na segmentação por textura.
A primeira abordagem utilizou Algoritmos Genéticos para geração de regras de classificação,
baseado na faixa de valores do CVE para amostras de treinamento. A segunda abordagem
utilizou o método de partição, baseado em recolocação, K-Means para clusterização das
amostras de treinamento. As coordenadas dos centróides das classes passam, então, a serem
utilizadas na segmentação do restante da imagem. O Apêndice “A” apresenta as principais
funcionalidades dos programas desenvolvidos (algoritmo genéticos e K-Means), suas
possibilidades, limitações e particularidades de ordem conceitual e cnica. O próximo
capítulo descreverá os testes e resultados alcançados com a estratégia exposta.
5. TESTES, RESULTADOS E DISCUSSÃO
Este capítulo apresenta os resultados dos testes realizados para examinar as características de
desempenho do coeficiente de textura desenvolvido (CVE), seus limites de utilização e sua
aplicabilidade em diversas situações. Foram projetados testes teóricos, testes com mosaico de
texturas naturais, testes com texturas de imagens reais, testes com imagens obtidas por
equipamentos médicos e testes com imagens de satélites. Testes comparativos foram
realizados para confrontar os resultados da metodologia proposta com os de outras técnicas
disponíveis na literatura.
5.1. TESTES TEÓRICOS
A fim de verificar o desempenho do coeficiente de variação espacial na discriminação de
texturas coloridas foram realizados testes teóricos experimentais. O teste de invariância do
CVE à rotação e à reflexão da imagem, pode ser visto na figura 5.1.
FIGURA 5.1 Imagem de teste após diversas transformações geométricas
82
A figura 5.1a é uma imagem colorida de tamanho
55
×
pixels, nas cores azul, verde, roxo,
vermelho, amarelo e banco, distribuídas de tal forma a possibilitar a visualização das
transformações geométricas realizadas. As figuras 5.1b. e 5.1c. correspondem a figura 5.1a.
refletida verticalmente e horizontalmente, respectivamente. As figura 5.1d. e 5.1e. resultam
da rotação da figura 5.1a. de 90
°
e 180
°
no sentido horário, respectivamente. A figura 5.1f. é
resultante da rotação da figura 5.1a. de 45
°
no sentido horário.
A tabela 5.1 apresenta os valores do CVE calculado para estas imagens. Observando-a
verifica-se que o valor do CVE calculado para o flip horizontal, flip vertical, rotação de 90º e
180º não sofreu alteração, mostrando a invariância do CVE a essas transformações
geométricas da imagem.
TABELA
5.1
Cálculo do CVE – testes de rotação e reflexão
CVE
Figura Ação
R G B
5.1a Imagem original 421,936
300,094
326,386
5.1b Flip vertical 421,936
300,094
326,386
5.1c Flip horizontal 421,936
300,094
326,386
5.1d Rotação 90º horários 421,936
300,094
326,386
5.1e Rotação 180º horários 421,936
300,094
326,386
5.1f Rotação 45º horários 466,793
439,793
459,001
No cálculo da rotação de 45º, figura 5.1f, o CVE sofre alteração em virtude da perda de
informação (dentro da janela de tamanho 55
×
pixels) decorrente desse tipo de transformação.
Isso ocorre por que o CVE trabalha com classes de distâncias (
Manhatan
,
cityblock
ou
quarteirão
, figura 5.2), a mudança de valores de intensidade do pixel entre classes de
distâncias provoca a alteração do CVE.
FIGURA 5.2 Classes de distâncias para uma matriz
55
×
pixels
83
O próximo teste avaliou o comportamento do CVE diante da mudança dos níveis de
intensidade do pixel na janela de amostras. Para isso utilizou-se uma imagem de tamanho
77
×
pixels, onde todos os pixels sempre possuíam os mesmos valores de intensidade que os
outros. O valor do CVE foi calculado para cada mudança de intensidade (variando a
intensidade do conjunto de pixels de 0 a 255). A figura 5.3 apresenta os valores de CVE
obtidos conforme o valor da intensidade dos pixels na janela de amostra. Este teste permitiu
verificar que o CVE pode distinguir regiões de pixels com intensidade homogênea para toda a
escala de intensidade considerada (0 - 255). Assim, diferentes regiões em escala de cinza ou
cor (homogêneas) podem ser facilmente discriminadas.
ESCALA CVE
0
30
60
90
120
150
180
210
240
270
300
330
360
390
420
450
480
510
540
570
600
630
1 16 31 46 61 76 91 106 121 136 151 166 181 196 211 226 241 256
INTENSIDADE
CVE
FIGURA 5.3 CVE para diferentes intensidades de pixels em amostra homogênea
O próximo teste avaliou o comportamento da mudança do tamanho da janela considerando
amostras com pixels de intensidade iguais (neste exemplo, com valor de intensidade dos
pixels igual a 255, ou seja, três imagens brancas). As figuras 5.4a, 5.4b e 5.4c apresentam
diferentes dimensões de janelas ( 33
×
, 55
×
, 77
×
, respectivamente, das matrizes das imagens
brancas em um canal) com as intensidade e classes de distâncias destacadas em colorido.
FIGURA 5.4 Teste com diferentes dimensões da janela de amostra.
84
O valor do CVE calculado para as três matrizes, figura 5.4, foi igual a
626,623
. Para janelas
com pixels de mesma intensidade (níveis de intensidade homogêneos) o valor do CVE não
sofre alteração com a mudança de escala, pois a variância e o desvio padrão das intensidades
nas classes de distâncias são nulos. Numa amostra com níveis de intensidade heterogêneos, a
mudança do tamanho da janela implicará na alteração do valor do CVE em função da
alteração dos valores existentes nas classes (variabilidade dentro das classes de distâncias).
5.2. TESTES COM MOSAICO DE TEXTURAS NATURAIS
A fim de aprofundar os testes experimentais realizados na seção anterior, foram realizados nas
subseções 5.2.1 e 5.2.2 testes de invariância à rotação e à reflexão, variância à combinação de
bandas, segmentação e localização do contorno considerando mosaicos de diferentes texturas
extraídas de imagens de satélite.
As seções 5.2.3 a 5.2.7 apresentam diversos testes com mosaicos de diferentes texturas
naturais reais (pedra, madeira, papel, água, solo e vegetação) construídas com a finalidade de
verificar o desempenho do método na segmentação de texturas complexas. Foram alterados os
seguintes parâmetros: número de amostras do conjunto de treinamento, tamanho da janela de
filtragem, espessura das bordas, tamanho da janela de amostragem e algoritmo de
segmentação empregado.
5.2.1. Teste de invariância à transformação geométrica
A figura 5.5 apresenta uma imagem sintética de
6464
×
pixels composta por quatro texturas
com tamanho de
3232
×
pixels cada, retiradas de imagens de satélite (classes A, B, C e D).
Este padrão é rotacionado e refletido de diferentes formas, sendo depois colocado sobre um
fundo com outra cena de satélite para compor a figura 5.6a. com
256256
×
pixels, que será
usada no teste invariância à transformação geométrica.
FIGURA 5.5 – Padrão com quatro classes de texturas com
3232
×
pixels
85
Este teste visa identificar as quatro classes de textura na imagem diante de diferentes
transformações. Não se espera que uma textura deixe de ser identificada e reconhecida por
estar em posição e direção angular diferente da usual. Este teste foi projetado para mostrar
que a medida aqui proposta atende a esta característica esperada de um identificador de
textura.
Para obtenção da solução, foram selecionadas amostras com janela de tamanho 33
×
pixels
(18 amostras da classe “A”, 20 amostras da classe “B”, 17 amostras da classe “C” e 18
amostras da classe “D”) que serviram de conjunto de treinamento para definição das regras de
segmentação de cada classe.
O resultado deste teste pode ser observado na figura 5.6b. Na identificação das classes, a
classe da textura “A” será identificada pela cor amarela, a classe da textura “B” pela cor
laranja, a classe da textura “C” pela cor vinho e a classe da textura “D” pela cor ciano.
Verifica-se que as rotações e translações não afetaram o reconhecimento da distribuição de
texturas presentes na imagem.
FIGURA 5.6 – Teste de invariância à rotação e reflexão
5.2.2. Teste de variância à ordem de combinação de bandas
As imagens multiespectrais podem ser visualizadas na forma de composições coloridas de três
bandas associadas aos canais red, green e blue. As diferentes bandas espectrais dos sensores
têm aplicações distintas em estudos de sensoriamento remoto. A combinação adequada dessas
bandas em função do conhecimento do comportamento dos alvos facilita a identificação de
regiões através da representação da informação em diferentes cores.
86
O CVE foi projetado para considerar não apenas as informações das bandas, mas também a
ordem como elas estão associadas aos canais red, green e blue. Esta característica busca
reproduzir a percepção humana das variações de cores provocadas pelas diferentes
composições (NUNES; CONCI, 2003e).
Assim, um segundo teste foi projetado para mostrar como o CVE se comporta quanto à ordem
de combinação das bandas. A figura 5.7 apresenta o padrão da figura 5.5 (cada textura com
3232
×
pixels) decomposto nos canais red, green e blue. A figura 5.8 apresenta seis diferentes
associações das bandas da figura 5.7.
FIGURA 5.7 Decomposição das bandas do padrão da figura 5.5
FIGURA 5.8 Diferentes combinações das bandas da figura 5.7
Para cada uma das quatro texturas originais do padrão da figura 5.5, foram selecionadas
amostras com janela de tamanho 33
×
pixels que serviram de conjunto de treinamento para
definição dos regras de cada classe (18 amostras da classe “A”, 20 da classe “B”, 17 da classe
“C” e 18 da classe “D”). A classe da textura “Aserá identificada pela cor amarela, a classe
da textura “B” pela cor laranja, a classe da textura “C” pela cor vinho e a classe da textura
“D” pela cor ciano.
87
A figura 5.9a com tamanho de 64192
×
pixels, foi gerada a partir da união dos padrões da
figura 5.8. O resultado do teste de variância à combinação de bandas pode ser observado na
figura 5.9b. Verifica-se que as diferentes combinações de bandas afetaram o reconhecimento
da distribuição de classes de cor presentes na imagem.
FIGURA 5.9 Teste de variância à combinação de bandas
Observa-se na figura 5.9b que apenas o padrão da classe “A foi consideravelmente
segmentado em diferentes combinações das bandas. Isso foi causado pela similaridade dos
níveis de intensidade dos pixels nas bandas red, green e blue para esta classe (a classe “A” se
aproxima de uma imagem em escala de cinza). Independente das combinações das bandas
para este padrão, a sensação das cores sofre muito pouca alteração (tons de cinza).
5.2.3. Teste de variação do número de amostras
A figura 5.10 apresenta um mosaico de nove texturas de pedras com 300300
×
pixels. Cada
textura que compõe os mosaico possui 100100
×
pixels e demonstram a complexidade de
variação tonal existente. Através de uma janela de tamanho de 55
×
pixels foram selecionadas
amostras para dois experimentos nas quantidade indicadas na tabela 5.2.
FIGURA 5.10 Mosaico de texturas de pedras
88
TABELA
5.2
Número de amostras para os experimentos 1 e 2 (pedras)
NÚMERO DE AMOSTRAS
CLASSE
EXPERIMENTO 1 EXPERIMENTO 2
A 19 9
B 10 5
C 13 6
D 17 8
E 12 6
F 17 8
G 14 7
H 12 6
I 15 7
A variação do número de amostras selecionadas por classe de texturas é decorrente de uma
estratégia de implementação que visa diminuir o número de amostras necessárias ao conjunto
de treinamento. Amostras cujo valor de CVE estejam dentro da faixa de valores máximo e
mínimo do CVE das amostras extraídas, considerando a mesma classe, são descartadas por
não alterarem tais limites, conforme discutido na seção 4.6. Isto significa que cada amostra,
representada por um ponto no espaço tridimensional, que não altere a configuração do
contorno do agrupamento no espaço, são interiores ao agrupamento e não acrescentam
informação relevante. Assim, texturas homogêneas necessitam de um número menor de
amostras em relação às texturas heterogêneas.
As tabelas 5.3 e 5.4 apresentam as matrizes de classificação das amostras de pedras para o
conjunto de treinamento do experimento 1 e experimento 2, respectivamente. A matriz de
classificação apresenta a distribuição de porcentagem de amostras classificadas corretamente,
erroneamente e não classificados (NC). Uma matriz de classificação ideal deve apresentar os
valores da diagonal principal próximos a 100%, indicando que não houve confusão entre as
classes.
TABELA
5.3
Matriz de classificação – conjunto de treinamento – experimento 1 (pedras)
89
TABELA
5.4
Matriz de classificação – conjunto de treinamento – experimento 2 (pedras)
Observando a tabela 5.4, percebe-se que a classe I”, do segundo experimento, teve 14,29%
de suas amostras (1 amostra de 7), erroneamente classificada na classe “C”.
Após a segmentação da imagem da figura 5.10 com as regras geradas na fase de treinamento
para o experimento 1 e 2, obteve-se as matrizes de classificação dos pixels do conjunto de
teste para os experimentos 1 e 2, indicado na tabela 5.5 e 5.6, respectivamente.
TABELA
5.5
Matriz de classificação – conjunto de teste – experimento 1 (pedras)
TABELA
5.6
Matriz de classificação – conjunto de teste – experimento 2 (pedras)
90
Comparando os resultados apresentados nas tabelas 5.5 e 5.6, verifica-se que o experimento 1
obteve melhor classificação nas classes “A”, “D”, “E”, “H” e I”, enquanto o experimento 2
saiu-se melhor na classificação das classes “B”, “C”, “F” e “G”.
Porém, verifica-se na tabela 5.6 que a qualidade da classificação das amostras da classe I”
teve sensível degradação. A textura da classe “I”, dentre as nove texturas do mosaico, foi
grandemente afetada pela redução de 15 para 7 amostras do conjunto de treinamento, devido a
grande variância interna de seu padrão.
O resultado da segmentação da imagem com as regras geradas com os conjuntos de
treinamento dos experimentos 1 e 2 pode ser observado na figura 5.11. Confirma-se
visualmente a perda da qualidade da classificação da textura da classe I”, do experimento 2,
resultante da redução do número de amostras do conjunto de treinamento.
Conclui-se que o método proposto necessita de um menor número de amostras representativas
para o conjunto de treinamento no caso de texturas homogêneas (com menor variância interna
do padrão) em relação a texturas heterogêneas (com maior variância interna do padrão).
FIGURA 5.11 Segmentação do mosaico de pedras – experimento 1 e 2
As figuras 5.12a. e 5.12b. apresentam o resultado da filtragem das figuras 5.11a. e 5.11b,
respectivamente, por um filtro de mediana com janela de tamanho de 33
×
pixels. Pode-se
notar o preenchimento das regiões interiores e eliminação de arestas. A operação de filtragem
é realizada somente nos pixels classificados através de uma nova imagem gerada pelo
aplicativo sem os pixels não segmentados (fundo branco).
91
FIGURA 5.12 Aplicação do filtro de mediana com janela de tamanho de
33
×
pixels.
As tabelas 5.7 e 5.8 mostram a matriz de classificação dos pixels do conjunto de teste após
aplicação do filtro de mediana, com janela de tamanho de 33
×
pixels, para os experimentos 1
e 2, respectivamente. Comparando a tabela 5.5 com a tabela 5.7, experimento 1, e
comparando a tabela 5.6 com a tabela 5.8, experimento 2, verifica-se na diagonal principal
que o percentual de erros de classificação diminuiu para todas as classes, o que indica a
adequação do filtro implementado para estes experimentos.
TABELA 5.7
Matriz de classificação – conjunto de teste com filtro de mediana – experimento 1 (pedras)
TABELA 5.8
Matriz de classificação – conjunto de teste com filtro de mediana – experimento 2 (pedras)
92
A figura 5.13 apresenta o contorno localizado para as diferentes classes de texturas presentes
na imagem da figura 5.10. Repare que o filtro utilizado reduziu a confusão na definição das
bordas para ambos os experimentos.
FIGURA 5.13 – Bordas localizadas após a filtragem com filtro de mediana de
33
×
pixels
A figura 5.14 apresenta o contorno real e o contorno localizado com o método CVE para as
diferentes classes de texturas de pedras presentes na figura 5.10.
FIGURA 5.14 – Contorno real e contorno CVE (pedras)
5.2.4. Teste de variação do tamanho da janela de filtragem
A figura 5.15 apresenta uma imagem de 200200
×
pixels formando um mosaico de oito
texturas de papéis. Através de uma janela de tamanho de 33
×
pixels foram selecionadas
amostras na quantidade indicada na tabela 5.9. Esta tabela também apresenta o coeficiente de
variação para o conjunto de amostras selecionadas. Cada coluna representa o coeficiente de
variação das amostras de cada classe por canal R, G ou B.
93
FIGURA 5.15 Mosaico de texturas de papéis
TABELA
5.9
Número de amostras e coeficiente de variação por canal (papéis)
Verifica-se na tabela 5.9 que o coeficiente de variação do conjunto de amostras das classes
“A” a “H”, nos canais R, G e B apresentaram baixos valores, indicando que estas texturas são
homogêneas (pequena variância interna dos padrões). Após a segmentação da imagem da
figura 5.15, com as regras geradas na fase de treinamento, obteve-se a imagem da figura 5.16.
FIGURA 5.16 Segmentação do mosaico de papéis
94
As figuras 5.17a., 5.17b. e 5.17c. apresentam o resultado da filtragem da figura 5.16 por um
filtro mediana com janela de 33
×
, 55
×
e 77
×
pixels, respectivamente. Pode-se notar o
preenchimento das regiões interiores e eliminação de arestas. A operação de filtragem é
realizada somente nos pixels classificados através de uma nova imagem gerada pelo
aplicativo, sem os pixels não segmentados (fundo branco).
FIGURA 5.17 Filtragem do mosaico de papéis com filtros de diferentes dimensões
A figura 5.18 apresenta o contorno localizado para o mosaico de texturas de papeis após a
filtragem com janelas de diferentes tamanhos, conforme ilustrado na figura 5.17. Para este
experimento, verifica-se que a janela de filtragem de tamanho de 77
×
pixels foi a que
possibilitou o melhor resultado visual dos limites das bordas.
Conclui-se que o efeito da variação da janela de filtragem é de fechamento de vazios
interiores e eliminação de arestas. O tamanho da janela mais conveniente dependerá de cada
caso.
FIGURA 5.18 Contorno localizado com diferentes tamanhos de janelas de filtragem
A figura 5.19 apresenta o contorno real e o contorno localizado com o método CVE para as
diferentes classes de texturas de papéis presentes na figura 5.15. A tabela 5.10 apresenta a
matriz de classificação dos pixels para o resultado verificado na imagem 5.19.
95
FIGURA 5.19 – Contorno real e contorno CVE (papéis)
TABELA
5.10
Matriz de Classificação dos pixels (papéis)
CLASSE A B C D E F G H
A 88,9
0,0
0,0
0,0
0,0
0,0
0,0
0,0
B
7,9
99,9
0,0
0,0
0,0
0,0
0,0
0,0
C
0,0
0,0
95,7
0,0
0,0
0,0
0,2
0,0
D
0,0
0,0
3,2
99,7
0,0
0,0
0,0
0,0
E
0,0
0,0
0,0
0,0
99,9
0,0
0,0
0,0
F
0,0
0,1
0,0
0,0
0,0
100,0
0,4
0,0
G
0,0
0,0
0,0
0,0
0,0
0,0
99,4
0,0
H
0,0
0,0
0,0
0,0
0,0
0,0
0,0
99,8
Não Classificado
3,2
0,0
1,1
0,3
0,1
0,0
0,0
0,2
5.2.5. Teste de espessura da borda
Neste teste foram encontrados distintos contornos para o objeto da figura 5.20, imagem com
269249
×
pixels, considerando quatro diferentes tamanhos de janela de segmentação ( 33
×
,
55
×
,
77
×
e
99
×
pixels).
FIGURA 5.20 Estrela de seis pontas
96
O propósito deste teste é medir o efeito da variação do tamanho da janela de segmentação
utilizada em relação à espessura do contorno localizado, conforme a tabela 5.11. A figura 5.21
apresenta os contornos localizados com o tamanho da janela de segmentação selecionada para
localização da borda. A figura 5.22 apresenta os contornos das figuras 5.21a. a 5.21d.
sobrepostos.
TABELA
5.11
Espessura do contorno para diferentes tamanhos da janela de segmentação
Tamanho da Janela Número pixels da borda
Contorno
3x3 1
5x5 2
7x7 3
9x9 4
FIGURA 5.21 Detalhe do contorno localizado com janelas de segmentação diferentes
97
FIGURA 5.22 - Contornos sobrepostos das figuras 5.21a. a 5.21d.
Conclui-se a partir deste teste que o aumento da espessura da borda ocorre na direção do
interior do objeto segmentado. O aumento da espessura da borda não ultrapassa a área do
objeto, pois o contorno mais externo é o definido para espessura de um pixel (cor vermelha).
Essa propriedade indica que o método proposto preserva a confiabilidade da segmentação,
independentemente da espessura selecionada para o contorno.
5.2.6. Teste de variação do tamanho da janela de amostragem
A figura 5.23 apresenta um imagem de 200200
×
pixels formando um mosaico de oito
texturas de madeiras. Foram selecionadas amostras para três experimentos. O experimento 1
empregou janela de amostragem com tamanho de 33
×
pixels, o experimento 2 empregou
janela de amostragem com tamanho de 55
×
pixels e o experimento 3, janela de amostragem
com tamanho de 77
×
pixels.
FIGURA 5.23 Mosaico de texturas de madeira
As tabelas 5.12, 5.13 e 5.14 apresentam o número de amostras selecionadas e o coeficiente de
variação destas amostras para o experimento 1, 2 e 3, respectivamente.
98
TABELA
5.12
Número de amostras e coeficiente de variação para o experimento 1 (madeiras)
TABELA
5.13
Número de amostras e coeficiente de variação para o experimento 2
(madeiras)
TABELA
5.14
Número de amostras e coeficiente de variação para o experimento 3 (madeiras)
Observando os coeficientes de variação dos experimentos, verifica-se que algumas texturas
possuem um padrão mais heterogêneo do que outras. Durante a seleção das amostras, o
usuário deve ter o cuidado de obter uma variância suficiente para representar o conjunto, além
de evitar amostras que fujam excessivamente do padrão. O apêndice “A” (Descrição dos
Programas AGCTIM e CTIM) apresenta mais detalhes sobre como realizar esta seleção no
aplicativo desenvolvido.
As tabelas 5.15, 5.16 e 5.17 apresentam as matrizes de classificação das amostras de madeiras
para o conjunto de treinamento do experimento 1, experimento 2 e experimento 3,
respectivamente.
99
TABELA
5.15
Matriz de classificação – conjunto de treinamento – experimento 1 (madeiras)
TABELA
5.16
Matriz de classificação – conjunto de treinamento – experimento 2 (madeiras)
TABELA
5.17
Matriz de classificação – conjunto de treinamento – experimento 3 (madeiras)
Observando as tabelas 5.15, 5.16 e 5.17 verifica-se que houve maior confusão na classificação
das amostras do experimento 1, janela de seleção de 33
×
pixels.
Os resultados das segmentações da imagem da figura 5.23 com as regras geradas a partir dos
conjuntos de treinamento dos experimentos 1, 2 e 3 podem ser observados na figura 5.24.
100
FIGURA 5.24 Resultado da segmentação dos experimentos 1, 2 e 3
Os resultados das operações de filtragem com filtro de mediana das imagens da figura 5.24
podem ser observados na figura 5.25.
FIGURA 5.25 Resultado da filtragem dos experimentos 1, 2 e 3
A figura 5.26 apresenta os contornos localizados para as texturas, considerando os
conjuntos de treinamento dos experimentos 1, 2 e 3.
FIGURA 5.26 Localização do contorno dos experimentos 1, 2 e 3
101
Observando as imagens das figuras 5.24, 5.25 e 5.26, pode-se verificar que a classe “B” foi
melhor segmentada pelo experimento 1. Para os demais experimentos, esta classe teve grande
perda de informação. Verificando as tabelas 5.12, 5.13 e 5.14, nota-se que os experimentos 2
e 3 tiveram uma variância extremamente alta no coeficiente de variação do CVE do canal
Blue. Provavelmente, uma amostra fora do padrão foi selecionada, prejudicando a regra
gerada por este conjunto de treinamento.
Ainda, observando as imagens das figuras 5.24, 5.25 e 5.26, pode-se verificar que o
experimento 3 obteve melhor segmentação para as classes “D”, “F e “G” (padrões mais
heterogêneos). Uma vez que algumas texturas são influenciadas pela resolução, quando
houver padrões heterogêneos, deve-se utilizar janelas maiores, a fim de melhor representar a
textura. Porém, a escolha de janelas de segmentação maiores implicam no afastamento dos
limites das bordas, conforme exposto na seção 5.2.4.
A figura 5.27 apresenta o contorno real e o contorno localizado com o método CVE para as
diferentes classes de texturas de madeiras presentes na figura 5.23. A tabela 5.18 apresenta a
matriz de classificação dos pixels para o resultado verificado na imagem 5.27.
FIGURA 5.27 – Contorno real e contorno CVE (madeira)
TABELA
5.18
Matriz de Classificação dos pixels (madeira)
CLASSE A B C D E F G H
A 97,7
0,0
0,0
0,0
0,0
0,2
0,0
0,0
B
0,0
71,9
0,0
0,0
0,0
0,0
0,0
0,0
C
0,0
0,0
73,6
0,0
0,0
0,0
0,0
0,0
D
0,0
0,0
0,0
98,7
0,0
0,1
4,2
2,0
E
0,0
0,0
0,0
0,0
85,4
0,1
0,0
0,0
F
0,0
0,0
0,0
0,0
13,6
97,9
0,0
0,0
G
0,0
0,0
0,0
0,0
0,0
0,0
94,3
0,0
H
0,0
0,0
0,0
0,0
0,0
0,0
0,5
93,3
Não Classificado
2,3
28,1
26,4
1,3
0,9
1,7
1,1
4,7
102
5.2.7. Testes empregando algoritmos genéticos e algoritmo k-means
A próxima série de testes emprega mosaicos com diferentes texturas naturais reais extraídas
de imagens de satélite (Landsat -7 TM). Os mosaicos foram construídos com a finalidade de
verificar o desempenho do método na presença de outras texturas com cores e padrões bem
similares. Cada imagem possui tamanho de 200200
×
pixels e contém um mosaico de oito
diferentes classes de texturas (água, solo e vegetação).
Nesta série de testes foram comparados os resultados das regras geradas pelo programas
AGCTIM (Algoritmo Genético de Classificação de Texturas em Imagens Multiespectrais) e
do programa CTIM (Clusterização de Texturas em Imagens Multiespectrais) desenvolvidos
neste trabalho para implementar o coeficiente CVE proposto. Para realização dos testes com
ambos os programas foram utilizados seus parâmetros
default
, conforme descrito no apêndice
A (Descrição dos Programas AGCTIM e CTIM).
A figura 5.28 apresenta um mosaico de oito texturas de água. Para ambos os programas foram
selecionadas amostras com janela de tamanho de 33
×
pixels e nas quantidade indicadas na
tabela 5.19.
FIGURA 5.28 Mosaico de texturas de água
TABELA
5.19
Número de amostras selecionadas – conjunto de treinamento (água)
NÚMERO DE AMOSTRAS
CLASSE
AGCTIM/ CTIM
A 24
B 14
C 10
D 2
E 20
F 3
G 25
H 25
103
A seguir, são ilustradas as regras geradas para classificação das amostras da classe “A” pelo
AGCTIM e pelo CTIM, respectivamente:
-------- AGCTIM-------------
SE
(
)
097,192602,144
Re
dCanal
CVE E
(
)
346,502927,433
GreenCanal
CVE E
(
)
506,538850,508
BlueCanal
CVE ENTÃO
Pixel central da janela de segmentação recebe rótulo de cor da classe “A”
-------- CTIM------------------
SE 070,38
AmostradaCVE
Distância para o
(
)
894,693;549,510;831,168
""
=
AClasse
Centróide
ENTÃO
Pixel central da janela de segmentação recebe rótulo de cor da classe “A”
onde as coordenadas do centróide da classe “A” são definidas pelos valores do
BlueCanalGreenCanaldCanal
CVECVECVE ,,
Re
do conjunto de amostras de treinamento.
-----------------------------------
A figura 5.29 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa AGCTIM.
FIGURA 5.29 Resultado obtido com o programa AGCTIM (texturas de água)
104
A figura 5.30 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa CTIM. Observa-se neste teste que o resultado da segmentação com
CTIM foi superior visualmente ao alcançado pelo AGCTIM (com parâmetros default).
FIGURA 5.30 Resultado obtido com o programa CTIM (texturas de água)
A figura 5.31 apresenta o contorno real e o contorno localizado com o programa CTIM para
as diferentes classes de texturas de água presentes na figura 5.28. A tabela 5.20 apresenta a
matriz de classificação dos pixels para o resultado verificado na imagem 5.31.
FIGURA 5.31 – Contorno real e contorno CVE (água)
105
TABELA
5.20
Matriz de Classificação dos pixels (água)
CLASSE A B C D E F G H
A 87,6
0,0
0,0
0,0
0,0
0,0
0,0
0,0
B
0,0
96,0
0,0
0,0
0,0
0,0
0,0
0,0
C
0,0
0,0
92,4
0,0
0,0
0,0
0,0
0,0
D
0,0
0,0
0,0
99,9
0,0
0,0
0,0
0,0
E
0,0
0,0
0,0
0,0
99,7
0,0
0,0
0,0
F
0,0
0,0
0,0
0,0
0,1
95,2
0,0
0,0
G
0,0
0,0
0,0
0,0
0,0
0,0
96,2
1,5
H
0,0
0,0
0,0
0,0
0,0
0,0
0,0
98,1
Não Classificado
12,4
4,0
7,6
0,1
0,1
4,8
3,8
0,4
A figura 5.32 apresenta um mosaico de oito texturas de solo. Para ambos os programas foram
selecionadas amostras com janela de tamanho de
11
11
×
pixels e nas quantidade indicadas na
tabela 5.21.
FIGURA 5.32 Mosaico de texturas de solo
TABELA
5.21
Número de amostras selecionadas – conjunto de treinamento (solo)
NÚMERO DE AMOSTRAS
CLASSE
AGCTIM/ CTIM
A 8
B 10
C 9
D 14
E 17
F 10
G 9
H 12
A figura 5.33 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa AGCTIM.
106
FIGURA 5.33 Resultado obtido com o programa AGCTIM (texturas de solo)
A figura 5.34 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa CTIM.
FIGURA 5.34 Resultado obtido com o programa CTIM (texturas de solo)
107
A figura 5.35 apresenta o contorno real e o contorno localizado com o programa CTIM para
as diferentes classes de texturas de solo presentes na figura 5.32. A tabela 5.22 apresenta a
matriz de classificação dos pixels para o resultado verificado na imagem 5.35.
FIGURA 5.35 – Contorno real e contorno CVE (solo)
TABELA
5.22
Matriz de Classificação dos pixels (solo)
CLASSE A B C D E F G H
A 79,3
0,0
0,0
0,0
0,0
0,0
0,0
0,0
B
0,0
90,3
7,4
0,2
0,0
0,8
0,0
0,0
C
0,0
0,0
88,2
0,0
0,0
4,8
0,0
0,0
D
0,0
0,0
0,0
92,1
0,0
0,0
0,0
0,0
E
0,0
0,0
0,0
0,0
85,0
0,0
0,0
0,0
F
0,0
8,6
2,3
7,1
0,0
93,0
0,0
0,0
G
0,0
0,0
0,0
0,0
0,0
0,0
93,3
0,0
H
0,0
0,0
0,0
0,0
0,0
0,0
0,0
99,0
Não Classificado
20,7
1,1
2,1
0,6
15,0
1,5
6,7
1,0
Neste segundo teste, verifica-se que o resultado da segmentação com CTIM, novamente foi
superior visualmente ao alcançado pelo AGCTIM (com parâmetros
default
).
A figura 5.36 apresenta um mosaico de oito texturas de vegetação. Para ambos os programas
foram selecionadas amostras com janela de tamanho de 77
×
pixels e nas quantidade
indicadas na tabela 5.23.
FIGURA 5.36 Mosaico de texturas de vegetação
108
TABELA
5.23
Número de amostras selecionadas – conjunto de treinamento (vegetação)
NÚMERO DE AMOSTRAS
CLASSE
AGCTIM/ CTIM
A 26
B 13
C 17
D 16
E 12
F 11
G 14
H 16
A figura 5.37 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa AGCTIM.
FIGURA 5.37 Resultado obtido com o programa AGCTIM (texturas de vegetação)
A figura 5.38 apresenta o resultado da segmentação, filtragem e localização das bordas
utilizando o programa CTIM.
109
FIGURA 5.38 Resultado obtido com o programa CTIM (texturas de vegetação)
Também neste teste, o resultado da segmentação com CTIM foi visualmente superior ao
alcançado pelo AGCTIM (com parâmetros
default
).
A figura 5.39 apresenta o contorno real e o contorno localizado com o programa CTIM para
as diferentes classes de texturas de vegetação presentes na figura 5.36. A tabela 5.24 apresenta
a matriz de classificação dos pixels para o resultado verificado na imagem 5.39.
FIGURA 5.39 – Contorno real e contorno CVE (vegetação)
110
TABELA
5.24
Matriz de Classificação dos pixels (vegetação)
CLASSE A B C D E F G H
A 90,7
0,0
0,0
0,0
0,0
0,0
0,0
0,0
B
0,0
89,4
3,4
2,4
0,0
0,0
0,0
0,9
C
0,0
0,0
95,9
4,1
0,0
0,0
0,0
0,0
D
0,0
0,0
0,0
86,1
0,0
0,0
0,0
0,0
E
1,9
0,0
0,0
0,0
96,1
0,0
0,0
0,0
F
0,0
0,0
0,0
0,0
0,0
86,1
0,0
0,0
G
0,0
0,0
0,0
0,0
0,0
0,0
93,9
0,0
H
0,0
0,7
0,0
0,0
0,0
0,0
0,0
90,9
Não Classificado
7,5
9,9
0,7
7,4
3,9
13,9
6,1
8,2
5.3. TESTES COM IMAGENS REAIS
Esta seção ilustra diversas aplicações possíveis com a utilização da técnica proposta neste
trabalho envolvendo diferentes tipos de imagens: imagens monocromáticas, imagens
coloridas, imagens obtidas com equipamentos médicos e imagens de satélite. Embora o
conjunto de testes da seção anterior seja mais complexo, estes envolvem situações reais onde
a segmentação é utilizada em comparações com outros modelos.
Para realização de testes comparativos foram utilizados os programas CTIM (Classificador de
Texturas Multiespectrais), que implementa o CVE (Coeficiente de Variação Espacial)
(NUNES; CONCI, 2006), através do algoritmo
K-Means
.
Além de três programas disponíveis na Internet, o SEGWIN, desenvolvido pelo grupo JSEG
(
Segmentation of color-texture regions in images and vídeo
), obtido em
http://vision.ece.ucsb.edu/segmentation/jseg/ jsegcolor.html. O VISD (
Variational Image
Segmentation demo
), obtido em http://aakash.ece.ucsb.edu/ imdiffuse/segment.aspx e o
SPRING (CÂMARA
et al
., 1996), desenvolvido pelo INPE (Instituto Nacional de Pesquisas
Espaciais), obtido em http://www.inpe.br.
Também foram comparados os resultados com os disponíveis na literatura utilizando o
método ICA (
Independent Component Analysis
) (JENSSEN; ELTOFT, 2003) e o modelo
MRMRF (
Multiresolution Markov Random Fields
) com estimação do parâmetro MRMRF
baseado em aproximação de MCMC (
Markov Chain Monte Carlo
) (LEI WANG; JUN LIU,
2000)
O SEGWIN separa a segmentação em dois estágios processados independentemente:
quantização da cor e segmentação espacial. No primeiro estágio, as cores da imagem são
quantizadas em diversas classes de representação que podem ser usadas para diferenciar as
111
regiões na imagem. Esta quantização é executada no espaço de cor sozinho, sem considerar a
distribuição espacial. Em seguida, as cores do pixel da imagem são substituídas por suas
etiquetas correspondentes da classe da cor, dando assim, forma a um mapa-classe da imagem.
O foco principal está na segmentação espacial, onde um critério para uma segmentação
"adequada" que usa o mapa-classe é proposto. Adotando um critério para janela local no
mapa-classe obtêm-se uma "J-imagem", em que elevados e baixos valores correspondem a um
possível limite e interior de uma região. Um método de crescimento de região é usado então
para segmentar a imagem baseado num “J-imagem” multi-escala (DENG; MANJUNATH,
2001).
O VISD utiliza em seu processo de segmentação a difusão de imagem baseada em um campo
de vetor de borda. Se a imagem é indicada como uma imagem de textura, então,
características de textura Gabor são calculadas para 3 escalas e 4 orientações. Depois que as
características de imagem foram calculadas (textura, cor e nível de cinza), elas são filtradas.
Um campo de vetor de borda é calculado a partir destas características usando diferenças
direcionais (não gradientes). No próximo passo, uma função de borda é calculada deste campo
de vetor resolvendo a equação de Poisson
gEVF
=
. . Esta equação é encontrada
minimizando uma função de custo
2
min GEVFE = . O último passo é uma difusão da
imagem. A equação diferencial parcial para a difusão é dada por :
IgkIS
t
I
+=
.
onde, EVFS :
,
é função de borda,
k
é a curvatura dos conjuntos nivelados.
O SPRING inicialmente rotula cada pixel como uma região distinta. Então, calcula um
critério de similaridade para cada par de regiões adjacentes espacialmente. O critério de
similaridade baseia-se em um teste de hipótese estatístico que testa a média entre as regiões.
A seguir, divide a imagem em um conjunto de sub-imagens e então, realiza a união entre elas,
segundo um limiar de agregação definido.
Os filtros de ICA (
Independent Component Analysis
) propostos por (JENSSEN; ELTOFT,
2003) podem capturar as propriedades inerentes das imagens texturizadas. Segundo os
autores, os novos filtros são semelhantes aos filtros Gabor, mas parecem ser mais ricos no
sentido de que suas respostas de freqüência podem ser mais complexas. Estas propriedades
permitem usar o banco de filtros ICA para criar características de energia, visando à
segmentação efetiva de texturas.
112
A teoria dos Campos aleatórios de Markov (
MRF - Markov random fields
) é um ramo da
teoria de probabilidade utilizada para analisar as dependências espaciais ou contextuais de
fenômenos físicos. No modelo MRF, uma textura é considerada ser uma realização de um
MRF e modelar uma textura é especificar as probabilidades condicionais correspondentes ou
parâmetros potenciais de um grupo exclusivo de Gibbs. Características de textura
correspondem aos parâmetros de textura MRF e a extração de características é equivalente à
estimação do parâmetro. Segundo os autores, é difícil ajustar um único MRF a cada padrão de
textura. Além de ser inexato considerar uma textura como uma realização de um único MRF,
uma vez que modelos MRF somente são satisfatórios para descrever as micro-texturas.
Para os autores, a desvantagem de modelos de MRF tradicionais é que a vizinhança é
limitada. Na decomposição de
wavelet
ortogonal como Haar ou
wavelet
de Daubechies, sub-
bandas não redundantes podem ser obtidas nas diferentes escalas e direções. Assim, essas sub-
bandas podem ser usadas para representar a imagem original completamente. Por outro lado,
essas sub-bandas são sub-amostras com a transformada discreta de
Wavelet
. Portanto, a
estrutura da textura, representada por uma informação de duas longas distâncias de pixels na
imagem original, podem se tornar as vizinhas imediatas nas imagens de sub-bandas nos níveis
mais altos. Isto conduz a um novo modelo que utiliza todas as sub-bandas em diferentes
escalas e direções. Dessa forma, os autores combinaram filtros de multiresolução e campo
aleatório Gibbs, denominando este modelo de MRMRF (
Multiresolution Markov Random
Fields
) com estimação do parâmetro MRMRF baseado em aproximação de MCMC (
Markov
Chain Monte Carlo
).
5.3.1. Teste com Imagens Monocromáticas
A figura 5.40 apresenta uma imagem monocromática (
200400
×
pixels) com letras compostas
por segmentos de linhas diagonais em inclinações de 45º, e 90º graus formando a sigla
UFF. O teste visa comparar o desempenho do CVE na determinação do contorno das letras
com o de outros programas de segmentação por cor e textura disponíveis ao público.
FIGURA 5.40 Linhas com diferentes inclinações formando a sigla UFF
113
A figura 5.41a apresenta o resultado alcançado pelo programa SEGWIN e a figura 5.41b o
resultado alcançado pelo programa VISD. A figura 5.41c. mostra o resultado obtido com a o
programa CTIM que utiliza o CVE.
Para este teste foram selecionadas 14 amostras com janela de tamanho de
77
×
pixels para
classe “letras”. Um filtro de mediana com janela de
33
×
pixels foi aplicado ao resultado da
segmentação. Observando o contorno localizado pelo CVE, verifica-se que o resultado
apresenta perfeita definição dos limites das letras (contorno em cor azul).
FIGURA 5.41 Contorno (azul) das letras UFF formadas com linhas de diferentes inclinações
A Fig. 5.42a apresenta uma imagem monocromática (
157200
×
pixels) composta por texturas
de Brodatz D53 (padrão interno) e D49, usada como exemplo por (JENSSEN; ELTOFT,
2003) na segmentação de texturas com o método ICA (Independent Component Analysis). A
fig. 5.42b apresenta a segmentação da imagem da figura 5.42a com 20 filtros do banco ICA,
alcançando uma porcentagem de erro de 3,5%. A curva sólida branca marca o verdadeiro
limite entre os dois padrões de textura.
A Fig. 5.42c mostra o resultado obtido com o método CVE. Para este teste foram selecionadas
30 amostras de cada classe de textura, através de uma janela de tamanho
11
11
×
pixels. Um
filtro de mediana, com janela de tamanho de
77
×
pixels, foi aplicado ao resultado da
segmentação resultando na imagem da figura 5.42d.
A figura 5.42e mostra o contorno localizado com CVE após a filtragem. A figura 5.42f.
114
apresenta a sobreposição do contorno obtido com a segmentação usando o método CVE
(curva azul e vermelha um para cada classe) com o contorno verdadeiro (curva sólida
branca) entre as duas classes de textura. É possível verificar que o contorno localizado com
CVE esteve muito próximo do contorno real.
FIGURA 5.42 Comparação do método ICA e CVE: a) Imagem composta por texturas de Brodatz
D53 (padrão interno) e D49; b) Segmentação com ICA (cor preta) e contorno real (cor branca);
c) Segmentação com CVE sem filtragem; d) Segmentação com CVE com filtragem; e) Contorno
localizado com CVE; f) Contorno com CVE (colorido) sobreposto ao contorno real (cor branca).
A Fig. 5.43a apresenta uma imagem monocromática (
310305
×
pixels) constituída por três
regiões de texturas de Brodatz (D55 - Fundo, D77 - polígono e D84 - quadrado) usada por
(LEI WANG; JUN LIU, 2000). Os autores apresentam o modelo MRMRF (Multiresolution
Markov Random Fields) com estimação do parâmetro MRMRF baseado em aproximação de
MCMC (Markov Chain Monte Carlo) para segmentação de textura.
A Fig. 5.43b mostra o resultado obtido com o modelo MRMRF. A aproximação proposta tem
a vantagem de não requerer treinamento para segmentação das texturas (método não
supervisionado). Porém, a aplicação do método MCMC para estimação de parâmetro
MRMRF possui elevado custo computacional.
A Fig. 5.43c apresenta a segmentação da imagem da fig.5.43a utilizando o método CVE.
115
Para este teste foram selecionadas 30 amostras de cada classe de textura, através de uma
janela de tamanho
11
11
×
pixels. Um filtro de mediana, com janela de tamanho de
99
×
pixels,
foi aplicado ao resultado da segmentação, figura 5.43d. O contorno localizado pelo método
proposto pode ser observado nas figuras 5.43e e 5.43f.
FIGURA 5.43 Comparação do método MRMRF e CVE: a) Mosaico de três regiões de texturas de
Brodatz (D55 - Fundo, D77 - polígono e D84 - quadrado); b) Segmentação baseado em MRMRF;
c) Segmentação com CVE sem filtragem; d) Segmentação com CVE com filtragem; e) Contorno
localizado com CVE; f) Contorno CVE sobreposto a imagem da figura 5.43a.
5.3.1. Teste com imagens coloridas
A figura 5.44 apresenta uma imagem Pepper colorida de pimentões com
512512
×
pixels.
Foram extraídas, com janela de tamanho de 33
×
pixels, as seguintes quantidades de amostras
para o conjunto de treinamento, bem como atribuído as cores às classes: 31 amostras da classe
verduras verde, área e contorno em amarelo; e 30 amostras de verduras vermelhas, área e
contorno em azul.
Após a segmentação, um filtro de mediana de tamanho de 33
×
pixels foi aplicado e, em
seguida, foi localizado o contorno. A figura 5.45 apresenta o resultado obtido com o programa
CTIM.
116
FIGURA 5.44 Imagem colorida de pimentões
FIGURA 5.45 – Segmentação e contorno dos pimentões obtidos com o programa CTIM
Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados
nas figuras 5.46a e 5.46b, respectivamente.
FIGURA 5.46 – Contornos das verduras obtidos com os programas SEGWIN e VISD
117
A figura 5.47 apresenta uma imagem colorida de uma paisagem com 480640
×
pixels. Foram
extraídas, com janela de seleção de 77
×
pixels, as seguintes quantidades de amostras para o
conjunto de treinamento, bem como atribuído as cores às classes: 21 amostras da classe céu,
área e contorno em azul; 16 amostras da classe areia, área e contorno em vermelho; 25
amostras da classe água, área e contorno em amarelo; 24 amostras da classe vegetação, área e
contorno em verde; 9 amostras da classe cascalho, área e contorno em roxo e 25 amostras da
classe vegetação seca, área e contorno em marrom.
FIGURA 5.47 Paisagem colorida
Após a segmentação, um filtro de mediana de com tamanho de 33
×
pixels foi aplicado e, em
seguida, foi localizado o contorno. A figura 5.48 apresenta o resultado obtido com o programa
CTIM.
FIGURA 5.48 – Segmentação e contorno da paisagem obtidos com o programa CTIM
Os resultados obtidos pelo programa SEGWIN e o programa VISD podem ser observados nas
figuras 5.49a e 5.49b, respectivamente.
118
FIGURA 5.49 – Contornos da paisagem obtidos com os programas SEGWIN e VISD
A figura 5.50 apresenta a imagem Mandril colorida com 512512
×
pixels. Ela apresenta
diferentes texturas complexas e muitas nuanças de cores. Foram extraídas 20 amostras com
janela de tamanho de
77
×
pixels para seis classes de textura: pele preta – contorno roxo; pêlo
e olhos amarelos contorno amarelo; pele azul contorno azul escuro; pele vermelha
contorno vinho; pêlo amarelo/preto – contorno verde claro; pêlo branco – contorno azul claro.
FIGURA 5.50 Imagem colorida - Mandril
O resultado obtido pelo coeficiente CVE pode ser visto na figura 5.51. Um filtro de mediana
com janela
33
×
foi aplicado ao resultado da segmentação resultando numa imagem com boa
definição dos limites das classes.
FIGURA 5.51 Segmentação e contorno do mandril obtidos com o programa CTIM
119
As figuras 5.52a e 5.52b apresentam o resultado obtido pelo programa SEGWIN e pelo
programa VISD, respectivamente.
FIGURA 5.52 – Contornos do mandril obtidos com os programas SEGWIN e VISD
5.3.2. Teste com imagens obtidas com aparelhos médicos
A figura 5.53 apresenta uma imagem colorida de um melanoma médio (câncer de pele) com
256256
×
pixels. Foram extraídas, com janela de tamanho de 33
×
pixels, 20 amostras da
classe melanoma, área e contorno em azul para compor o conjunto de treinamento. Após a
segmentação, um filtro de mediana de 33
×
pixels foi aplicado e, em seguida, foi localizado o
contorno.
FIGURA 5.53 – Imagem de melanoma
A figura 5.54 apresenta o resultado obtido com o programa CTIM. É possível verificar uma
perfeita segmentação do melanoma, figura 5.54a.
As figuras 5.54b e 5.54c apresentam o contorno localizado com bordas de espessura de um
pixel, resultando numa imagem com boa definição dos limites do melanoma.
120
FIGURA 5.54 – Segmentação e contorno do melanoma obtidos com o programa CTIM
Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados
nas figuras 5.55a e 5.55b, respectivamente.
FIGURA 5.55 – Contornos do melanoma obtidos com os programas SEGWIN e VISD
A figura 5.56a apresenta uma imagem colorida de células de sangue com 329494
×
pixels.
Foram extraídas, com janela de tamanho de 33
×
pixels, as seguintes quantidades de amostras
para o conjunto de treinamento, bem como atribuído as cores às classes: 19 amostras da classe
células, área e contorno em azul; 20 amostras da classe membrana, área e contorno em verde e
12 amostras da classe núcleo, área e contorno em vermelho.
Após a segmentação, um filtro de mediana de tamanho de 33
×
pixels foi aplicado, figura
5.56b e, em seguida, foi localizado o contorno, figura 5.56c. A figura 5.56d apresenta o
resultado obtido com o programa CTIM, verifica-se pelo contorno encontrado, que as células
presentes foram corretamente classificadas, mesmo no caso de regiões pequenas.
121
FIGURA 5.56 – Imagem de células e resultado obtido com o programa CTIM
Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados
nas figuras 5.57a e 5.57b, respectivamente.
FIGURA 5.57 – Contorno das células obtidos com os programas SEGWIN e VISD
5.3.3. Teste com imagens de satélite
Finalmente, dois testes foram realizados empregando imagens de satélite para verificar o
desempenho do método diante de imagens com texturas multiespectrais complexas. As
figuras 5.58a, 5.58b, 5.58c e 5.58d apresentam o resultado da segmentação de uma imagem da
grande São Paulo e cidades de Santos e São Vicente, no estado brasileiro de São Paulo, obtida
em http://www.dgi.inpe.br/html/ShowImagesLandsat.htm, com os programas SEGWIN,
VISD, SPRING e CTIM, respectivamente. A figura 5.58 é de 512512
×
pixels e foi adquirida
em 27/04/2000, pelo satélite CBERS, sensor IRMSS, composição RGB (bandas 2,1,3) e Base
154/Ponto 127.
122
FIGURA 5.58 – Imagem da região da grande são paulo segmentada por diferentes programas
Para este teste os programas SEGWIN e VISD utilizaram seus parâmetros
default
. O
programa SPRING utilizou o método de crescimento de regiões com similaridade 50 e área
(pixels) igual a 100. O programa CTIM utilizou 14 amostras da classe região urbana, com
janela de tamanho de 33
×
pixels.
O programa VISD apresentou uma maior segmentação da região urbana, necessitando de
ajustes em seus parâmetros internos para reduzir a supersegmentação. O programa SEGWIN
obteve melhor definição de limites do que o programa VISD, mas incluiu grandes áreas de
vegetação. O programa SPRING obteve melhor definição de limites do que os programas
anteriores, porém incluiu principalmente regiões de rios. O programa CTIM conseguiu obter
muito boa definição do contorno da classe região urbana.
123
As figuras 5.59a, 5.59b e 5.59c apresentam três composições coloridas da região de
Florianópolis-SC, utilizando as bandas 1, 2, 3, 5 e 7 do satélite Landsat, obtidas em
http://www.engesat.com.br, com tamanho de 600600
×
pixels.
Foram extraídas, com janela de tamanho de 33
×
pixels, as seguintes quantidades de amostras
para os conjuntos de treinamento, bem como atribuído as cores às classes: 20 amostras da
classe água turva da imagem 5.59b, contorno amarelo; 20 amostras da classe vegetação escura
da imagem 5.59c, contorno rosa.
O propósito é obter as amostras das regiões de interesse na composição de bandas mais
adequada para visualização do objeto alvo.
FIGURA 5.59 – Composições das bandas 1, 2, 3, 5 e 7
As figuras 5.60a e 5.60b apresentam os contornos obtidos para as classes água turva
(bandas_721) e vegetação escura (bandas_753), respectivamente.
FIGURA 5.60 – Contorno de água (bandas _7,2,1) e vegetação (bandas_753)
124
A figura 5.61 apresenta a imagem da figura 5.59a (bandas_321) com os contornos obtidos
para água turva da banda _721, figura 5.60a e para vegetação escura da banda_753, figura
5.60b.
FIGURA 5.61– Contornos aplicados à composição de bandas_ 3,2,1
Este teste demonstra a flexibilidade do método proposto, pois é possível gerar regras para
mesma imagem em diferentes resoluções e gerar contornos obtidos em diferentes
composições de bandas. Assim, pode-se extrair amostras de bandas que apresentem melhor
visualização das regiões de interesse para gerar as regras de classificação e utilizar os
contornos obtidos para diversas combinações e análises.
5.4. DISCUSSÃO
A fim de verificar as possibilidades e limitações do coeficiente proposto, considerando as
estratégias de implementação com algoritmos genéticos e algoritmo
K-Means,
este capítulo
apresentou diversos testes empregando imagens teóricas, mosaico de texturas naturais,
imagens monocromáticas, imagens coloridas e imagens de satélites.
125
Os testes realizados com imagens monocromáticas (visualizadas em apenas um canal)
constituídas de letras obtiveram excelente resultado de segmentação e determinação do
contorno. Porém, a segmentação de texturas em imagens monocromáticas com nível de
intensidade equalizados apresentou grande percentual de confusão. O CVE não foi capaz de
diferenciar satisfatoriamente estas texturas devido a similaridade de variação existente entre
as classes. Entretanto, este problema foi contornado empregando mais canais espectrais da
mesma cena (não equalizados).
Os testes realizados com texturas coloridas heterogêneas apresentaram maior possibilidade de
confusão entre as diferentes classes, devido a grande variância interna do padrão (diversidade
de cores). Este tipo de textura exigiu janelas de extração de amostras com tamanhos maiores
para melhorar o resultado da segmentação.
Nos testes realizados, o desempenho do método de partição baseado em recolocação
K-Means
superou o desempenho do método implementado com algoritmos genéticos, tanto na
velocidade de execução quanto na qualidade da segmentação. Entretanto, a implementação
com algoritmos genéticos permite muitas possibilidades de aperfeiçoamentos.
5.5. CONSIDERAÇÕES FINAIS
Este capítulo apresentou diversos testes realizados para medir a eficiência e as limitações do
Coeficiente de Variação Espacial (CVE) proposto. Foram realizados testes com diferentes
tipos de imagens e com diferentes parâmetros de funcionamento. Podemos concluir, pelos
testes realizados, que o CVE conseguiu segmentar e localizar o contorno de diversas classes
de texturas de forma satisfatória, comparativamente com os resultados obtidos com outros
programas disponíveis para segmentação de texturas e com outros resultados encontrados na
literatura.
7. REFERÊNCIAS BIBLIOGRÁFICAS
ALATA, O. & RAMANANJARASOA, C., Unsupervised textured image segmentation using 2-D quarter plane
autoregressive model with four prediction supports, Pattern Recognition Letters, v. 26, n. 8, pp. 1069-1081, 2005.
AL-JANOBI, A., Performance evaluation of cross-diagonal texture matrix method of texture analysis, Pattern
Recognition, v. 34, n. 1, pp. 171-180, 2001.
ANDRADE, M. C., Um Método Topológico de Segmentação de Imagens por Atributos, Belo Horizonte, 1998, 140
p., Tese de Doutorado em Ciência da Computação, Universidade Federal de Minas Gerais, Instituto de Ciências
Exatas, Departamento de Ciência da Computação, Belo Horizonte, 1998.
ANDREY, P., Selectionist Relaxation: Genetic Algorithms Applied to Image Segmentation, Image and Vision
Computing, Elsevier Science B.V., v.17, n. 3-4, pp.175-187, 1999.
ANGEL, P. & MORRIS, C., Analyzing the Mallat Wavelet Transform to Delineate Contour and Textural Features,
Computer Vision and Image Understanding, v. 80, n. 3, pp. 267-288, 2000.
AUJOL, J.-F.; AUBERT, G. & BLANC-FERAUD, L., Wavelet-based level set evolution for classification of
textured images, Image Processing, IEEE Transactions on, v. 12, n. 12, pp.1634-1641, 2003.
AVCI, E., An expert system based on Wavelet Neural Network-Adaptive Norm Entropy for scale invariant texture
classification, Expert Systems with Applications In Press, Corrected Proof, vailable online 10 Fev 2006.
AZEVEDO, E. & CONCI, A., Computação Gráfica: teoria e prática, Rio de Janeiro: Campus, 384 p., 2003.
AZEVEDO, E., CONCI, A., Computação Gráfica: Teoria e prática, Rio de Janeiro: Editora Campus (Elsevier),
2003, 384 p.
BANDERA, A.; URDIALES, C.; ARREBOLA, F. & SANDOVAL, F., Scale-dependent hierarchical unsupervised
segmentation of textured images, Pattern Recognition Letters, v. 22, n. 2, pp. 171-181, 2001.
BASHAR, M. K.; MATSUMOTO, T. & OHNISHI, N., Wavelet transform-based locally orderless images for
texture segmentation, Pattern Recognition Letters, v. 24, n. 15, pp. 2633-2650, 2003.
132
BERDER, T.C., Classificação e Recuperação de Imagens por Cor Utilizando Técnicas de Inteligência Artificial,
São Leopoldo, 2003, 125p., Dissertação de Mestrado em Computação Aplicada, UNISINOS, São Leopoldo, 2003.
BERKHIN, P., Survey of Clustering Data Mining Techniques, Technical report, San Jose: Accrue Software, 2002.
Disponível em: http://citeseer.nj.nec.com/berkhin02survey.html.
BEUCHER, S. & MEYER, F., The morphological approach to segmentation: the watershed transformation,
Mathematical Morphology in Image Processing, New York: Marcel Dekker Inc, Ed E. R. Dougherty, cap. 12, pp.
433-481, 1993.
BEZDEK, J. C. & PAL, S. K., Eds., Fuzzy Models for Pattern Recognition: Methods that Search for Structures in
Data, New York: IEEE Press, 539 p., 1992.
BROCHARD, J.; KHOUDEIR, M. & AUGEREAU, B., Invariant feature extraction for 3D texture analysis using
the autocorrelation function, Pattern Recognition Letters, v. 22, n. 6-7 , pp. 759-768, 2001.
CAMARA, G.; SOUZA, R.C.M.; FREITAS U.M. & GARRIDO J., SPRING: Integrating remote sensing and GIS
by object-oriented data modelling, Computers & Graphics, v. 20, n. 3, pp. 395-403, 1996.
CAMPISI, P.; COLONNESE, S.; PANCI, G. & SCARANO, G., Reduced complexity rotation invariant texture
classification using a blind deconvolution approach, Pattern Analysis and Machine Intelligence, IEEE Transactions
on, v. 28, n. 1, pp.145- 149, 2006.
CAMPISI, P.; NERI, A.; PANCI, G. & SCARANO, G., Robust rotation-invariant texture classification using a
model based approach, Image Processing, IEEE Transactions on, v. 13, n. 6, pp.782- 791, 2004.
ÇARKACIOGLU, A. & YARMAN-VURAL, F., SASI: a generic texture descriptor for image retrieval, Pattern
Recognition, v. 36, n. 11, pp. 2615-2633, 2003.
CASTLEMAN, K.R., Digital Image Processing, 2 ed., New Jersey: Prentice Hall Inc, 1996, 667 p.
ÇESMELI, E. & WANG, D., Texture Segmentation Using Gaussian–Markov Random Fields and Neural Oscillator
Networks, IEEE Transactions On Neural Networks, v. 12, n. 2, 2001.
CHARALAMPIDIS, D. & KASPARIS, T. , Wavelet-based rotational invariant roughness features for texture
classification and segmentation, Image Processing, IEEE Transactions on, Aug 2002, v. 11, n. 8, pp.825- 837,
2002.
CHEN SAGIV; SOCHEN, N. A. & ZEEVI, Y. Y., Integrated Active Contours for Texture Segmentation, IEEE
Transactions On Image Processing, v. 15, n. 6, 2006.
CHENG-HAO YAO & SHU-YUAN CHEN, Retrieval of translated, rotated and scaled color textures, Pattern
Recognition, vol. 36, n. 4 , pp. 913-929, 2003.
CHENGJUN LIU & WECHSLER, H., A shape- and texture-based enhanced Fisher classifier for facerecognition,
Image Processing, IEEE Transactions on, v. 10, n. 4, pp.598-608, 2001.
133
CHIH-FONG TSAI, Image mining by spectral features: A case study of scenery image classification, Expert
Systems with Applications In Press, Corrected Proof, Available online Dez 2005.
CHI-MAN PUN, Rotation-invariant texture feature for image retrieval, Computer Vision and Image
Understanding, v. 89, n. 1, pp. 24-43, 2003.
CHOI, H. & BARANIUK, R.G., Multiscale image segmentation using wavelet-domain hidden Markov models,
Image Processing, IEEE Transactions on, v. 10, n. 9, pp.1309-1321, 2001.
CHOI, Y.; WON, C.S.; RO, Y.M. & MANJUNATH, B.S., Texture Descriptors, Introduction to MPEG-7,
Multimedia Content Description Interface, Eds. B.S.Manjunath, P.Salembier & T.Sikora, John Wiley & Sons, Ltd.,
2002.
CLAUSI, D. A. K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture
segmentation, Pattern Recognition ,v. 35, n. 9, pp. 1959-1972, 2002.
CLAUSI, D. A. & ED JERNIGAN, M., Designing Gabor filters for optimal texture separability, Pattern
Recognition, v. 33, n. 11, pp. 1835-1849, 2000.
CLAUSI, D.A. & HUANG DENG, Design-based texture feature fusion using Gabor filters and co-occurrence
probabilities, Image Processing, IEEE Transactions on, v. 14, n. 7, pp.925- 936, 2005
COCQUEREZ, J. P. & PHILIPP S., Analyse d’Images: Filtrage et Segmentation, Ed. Dunod, 1997, 457p.
COELHO, P.S.S. & EBECKEN, N.F.F., “Segmentação de Dados em um mero Desconhecido de Grupos Usando
Algoritmos Genéticos”, in: SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL (XXXIII SBPO), 2001,
Campos do Jordão, 2001. Disponível em : http://professores.ibmecrj.br/psergio/papers/genclum.pdf
COMER, M.L. & DELP, E.J., The EM/MPM algorithm for segmentation of textured images: analysisand further
experimental results, Thomson Consumer Electron., Image Processing, IEEE Transactions on, v. 9, n. 10, pp.1731-
1744, 2000.
CONCI, A. & NUNES, E.O., Multi-bands Image Analysis Using Local Fractal Dimension, In: PROCEEDINGS OF
XIV SIBIGRAPI BRASILIAN SYMPOSIO ON COMPUTION GRAPHICS (SIBGRAPI 01), 2001, Florianópolis:
Image Proc. and Vision, 2001, pp.91-98.
DENG Y. & MANJUNATH, B.S., Unsupervised Segmentation of Color-texture Regions in Images and Video, in:
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE (PAMI 01), 2001, v. 23,
n. 8, pp. 800-810, 2001.
DO, M.N. & VETTERLI, M., Wavelet-based texture retrieval using generalized Gaussian densityand Kullback-
Leibler distance, Image Processing, IEEE Transactions on, v. 11, n. 2, pp.146-158, 2002.
DONG-GYU SIM; HAE-KWANG KIM & RAE-HONG PARK, Invariant texture retrieval using modified Zernike
moments, Image and Vision Computing, v. 22, n. 4, pp. 331-342, 2004.
134
DOVAL, D.; MANCORIDIS, S. & MITCHELL, B.S., Automatic Clustering of Software Systems using a Genetic
Algorithm, In: INTERNATIONAL CONFERENCE ON SOFTWARE TOOLS AND ENGINEERING PRACTICE
(STEP '99), 1999, Pittsburgh, 1999, pp.73-91.
DRIMBAREAN, A. & WHELAN, P. F., Experiments in colour texture analysis, Pattern Recognition Letters, v. 22,
n. 10, pp. 1161-1167, 2001.
DUMITRAS, A.; VENETSANOPOULOS, A. N., A comparative study of snake models with application to object
shape description in bi-level and gray-level images, in: PROCEEDINGS OF IEEE-EURASIP WORKSHOP ON
NONLINEAR SIGNAL AND IMAGE PROCESSING, 2001, Baltimore, 2001.
EPIFANIO, I. & AYALA, G., A random set view of texture classification, Image Processing, IEEE Transactions
on, v. 11, n. 8, pp. 859- 867, 2002.
FACON, J., Morfologia Matemática: Teoria e Exemplos, ed. Universitária Champagnat, Paraná: PUC/Pr, 1996.
FASULO, D., An analysis of recent work on clustering algorithms. Technical Report 01-03-02, Seattle: Department
of Computer Science and Engineering, University of Washington, Abr. 1999. Disponível em:
http://citeseer.nj.nec.com/fasulo99analysi.html.
FEO, T. & M. RESENDE, Greedy Randomized Adaptive Search Procedures, J. of Global Optimization 6, pp. 109–
133, 1995.
FEO, T. & RESENDE, M., A probabilistic Heuristic for a Computationally Difficult Set Covering Problem,
Operations Research Letters 8, pp. 67–71, 1989.
FISCHER, B. & BUHMANN, J.M., Path-based clustering for grouping of smooth curves and texture
segmentation, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 25, n. 4, pp.513-518, 2003.
FRYE, R. E. & LEDLEY, R. S., Texture discrimination using discrete cosine transformation shift-insensitive
(DCTSIS) descriptors, Pattern Recognition, v. 33, n. 10, pp. 1585-1598, 2000.
GARCÍA-SEVILLA, P. & PETROU, M., Analysis of Irregularly Shaped Texture Regions, Computer Vision and
Image Understanding, v. 84, n. 1, pp. 62-76, 2001.
GATO, H.E.R., IMAR, N.N. & TOMMASELLI, A.M.G., Uma Abordagem Semi-Automática para Extração de
Feições Cartográficas, Revista Brasileira de Cartografia, n.53, pp.16-28, 2001.
GINNEKEN, B. V. & ROMENY, B. M. T. H., Multi-scale texture classification from generalized locally orderless
images, Pattern Recognition, v. 36, n. 4 , pp. 899-911, 2003.
GIRALDI, G. A., T-Snakes Duais e Inicialização de Modelos Deformáveis, Rio de Janeiro, 2000, 251 p., Tese de
Doutorado em Ciências em Engenharia de Sistemas e Computação, Universidade Federal do Rio de Janeiro, Rio de
Janeiro, 2000.
135
GIRALDI, G.A.; STRAUSS, E. & OLIVEIRA, A.A., A Boundary Extraction Method Based on Dual-T-Snakes and
Dynamic Programming, in IEEE Computer Society Conference on Computer Vision and Pattern Recognition
(CVPR 2000), 2000, Hilton Head Island, 2000, pp. 1044-1049.
GLOVER, F. & M. LAGUNA, Tabu Search, Kluwer Academic Publishers, 1997.
GLOVER, F., Tabu Search – Part I, ORSA J. on Computing 1, pp. 190–206, 1989.
GLOVER, F., Tabu Search – Part II, ORSA J. on Computing 2, pp. 4–32, 1990.
GOLDBERG, D.E., Genetic Algorithms in Search, Optimization, and Machine Learning, Reading, Massachusetts:
Addison-Wesley Publishing Company, Inc., 1989.
GONZALEZ, R.C. & WOODS, R.E., Processamento de Imagens Digitais, São Paulo: Edgard Blucher, 2000, 509 p.
GRIGORESCU, S.E.; PETKOV, N. & KRUIZINGA, P., Comparison of texture features based on Gabor filters,
Image Processing, IEEE Transactions on, v. 11, n. 10, pp.1160- 1167, 2002.
HAMMOUCHE, M. D. & POSTAIRE, J.G., A clustering method based on multidimensional texture analysis,
Pattern Recognition, v. 39, n. 7, pp. 1265-1277, 2006.
HANSEN, P. & MLADENOVI´C, N., An Introduction to Variable Neighborhood Search, Kluwer Academic
Publishers, Eds. S. Voss, S. Martello, I. H. Osman, and C. Roucairol , Meta-heuristics, Advances and trends in
local search paradigms for optimization, pp. 433–458, 1998.
HAO HE & YAN QIU CHEN, Unsupervised texture segmentation using resonance algorithm for natural scenes,
Pattern Recognition Letters, v. 21, n. 8 , pp. 741-757, 2000.
HARALICK, R.M. & SHAPIRO, L.G., Texture, Computer and Robot Vision, New York: Addison-Wesley
Publishing Company, v.1, pp.453-494, 1992.
HARALICK, R.M., Statistical and Structural Approaches to Texture, Proceedings of The IEEE, v.67, n. 5, pp.786-
80, 1979.
HARALICK, R.M.; SHANMUGAN, K. & DINSTEIN, I., Texture Features for Image Classification, IEEE
Transaction On Systems, Man And Cybernetics (SMC-3), v.6, n. 3, pp.610-621, 1973.
HAYKIN, S., Neural Networks: A Comprehensive Foundation. New York: Prentice Hall, 2 ed., 842 p., 1998.
HEIKKILA, M. & PIETIKAINEN, M., Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 28,
n. 4, pp.657- 662, 2006.
HILL, P.R.; CANAGARAJAH, C.N. & BULL, D.R., Image segmentation using a texture gradient based watershed
transform, Image Processing, IEEE Transactions on, v. 12, n. 12, pp.1618- 1633, 2003.
136
HOLLAND, J.H., Escaping Brittleness: the Possibilities of General Purpose Learning Algorithms Applied to
Parallel Rule-based Systems, Machine Learning, an artificial intelligence approach (Morgan Kaufmann), Los
Altos: R. Michalski, Eds. J. Carbonell, & T. Mitchell, v. 2, pp. 593-623, 1986.
HOLLAND, J.H., Genetic Algorithms, New York: Scientific American, 1992, v. 267, n. 1, pp. 44-50.
HSI-CHIA HSIN, Texture segmentation using modulated wavelet transform, Image Processing, IEEE Transactions
on, v. 9, n. 7, pp.1299-1302, 2000.
HUANG, P. W. & DAI, S. K., Image retrieval by texture similarity, Pattern Recognition, v. 36, n. 3, pp. 665-679,
2003.
HUAWU DENG; KAP LUK CHAN & JUN LIU, The Poisson equation for image texture modeling, Pattern
Recognition Letters, v. 24, n. 9-10, pp. 1571-1582, 2003.
HWANG, S.W.; KIM,E.Y.; PARK, S.H. & KIM, H. J., Object Extraction and Tracking Using Genetic Algorithms,
in: INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2001), 2001, Thessaloniki: IEEE Signal
Processing Society, 2001, v. 2, pp.383-86.
JAFARI-KHOUZANI, K. & SOLTANIAN-ZADEH, H., Radon transform orientation estimation for rotation
invariant texture analysis, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 27, n. 6, pp.1004-
1008, 2005a.
JAFARI-KHOUZANI, K. & SOLTANIAN-ZADEH, H., Rotation-invariant multiresolution texture analysis using
Radon and wavelet transforms, Image Processing, IEEE Transactions on, v. 14, n. 6, pp.783- 795, 2005b.
JENSSEN, R. & ELTOFT, T., Independent component analysis for texture segmentation, Pattern Recognition, v.
36, n. 10 , pp. 2301-2315, 2003.
JIANGUO ZHANG & TIENIU TAN, Affine invariant classification and retrieval of texture images, Pattern
Recognition v, pp. 657-664, 2003.
JIANGUO ZHANG & TIENIU TAN, Brief review of invariant texture analysis methods, Pattern Recognition, v.
35, n. 3, pp. 735-747, 2002.
JIE ZHOU, LEPING XIN & DAVID ZHANG, Scale-orientation histogram for texture image retrieval, Pattern
Recognition, v. 36, n. 4 , pp. 1061-1063, 2003.
JING-HAO XUE; SU RUAN; MORETTI, B.; REVENU, M. & BLOYET, D., Knowledge-based Segmentation and
Labeling of Brain Structures from MRI Images, Pattern Recognition Letters, Elsevier Science B.V., v.22, n. 3-4,
pp.395–405, 2001.
JINSANG KIM & TOM CHEN, Multiple feature clustering for image sequence segmentation, Pattern Recognition
Letters, v. 22, n. 11, pp. 1207-1217, 2001.
137
KAN-MIN CHEN & SHU-YUAN CHEN, Color texture segmentation using feature distributions, Pattern
Recognition Letters, v. 23, n. 7 , pp. 755-771, 2002.
KASPARIS, T.; CHARALAMPIDIS,D.; GEORGIOPOULOS, M. & ROLLAND, J., Segmentation of textured
images based on fractals and image filtering, Pattern Recognition, v. 34, n. 10, pp. 1963-1973, 2001.
KASS, M., WITKIN A., & TERZOPOULOS, D., Snakes: Active Contour Models, International Journal of
Computer Vision, v. 1, n. 41, pp. 321-331, 1988.
KATO, Z. & TING-CHUEN PONG, A Markov random field image segmentation model for color textured images,
Image and Vision Computing, In Press, Corrected Proof, Available online, 2006.
KAUFMAN, L. & ROUSSEEUW, P.J., Finding Groups in Data: an Introduction to Cluster Analysis, 2 ed., Wiley-
Interscience, 2005, 368 p.
KHOTANZAD, A. & HERNANDEZ O. J., Color image retrieval using multispectral random field texture model
and color content features, Pattern Recognition, v. 36, n. 8, pp. 1679-1694, 2003.
KIRKPATRICK, S., Optimization by Simulated Annealing: Quantitative Studies, J. of Statistical Physics 34, pp.
975–986, 1984.
KLÖSGEN, W. & ZYTKOW, J. M., Knowledge Discovery in Databases Terminology, Advances In Knowledge
Discovery and Data Mining (AAAI Press/The MIT Press), Cambridge: U.M.Fayyad, G. P.Shapiro, P.Smyth, &
R.Uthurusamy, pp.573-592, 1996.
KOLLER, D. & SAHAMI, M., Toward Optimal Feature Selection, Proceedings of XIII International Conference
Machine Learning, pp. 129-134, 1996.
KUNG-HAO LIANG, & TJAHJADI, T., Adaptive scale fixing for multiscale texture segmentation, Image
Processing, IEEE Transactions on, v. 15, n. 1, pp.249- 256, 2006.
KURMYSHEV, E. V. & SANCHEZ-YANEZ, R. E., Comparative experiment with colour texture classifiers using
the CCR feature space, Pattern Recognition Letters, v. 26, n. 9, pp. 1346-1353, 2005.
LAZEBNIK, S.; SCHMID, C. & PONCE, J. , A sparse texture representation using local affine regions, Pattern
Analysis and Machine Intelligence, IEEE Transactions on, v. 27, n. 8, pp. 1265-1278, 2005.
LEI WANG & JUN LIU, Texture segmentation based on MRMRF modeling, Pattern Recognition Letters, v. 21, n.
2, pp. 189-200, 2000.
LIPOWEZKY, U., Grayscale aerial and space image colorization using texture classification, Pattern Recognition
Letters, v. 27, n. 4, pp. 275-286, 2006.
LUO, J.; ANDREAS, A.E. & SAVAKIS, E., Self-supervised texture segmentation using complementary types of
features, Pattern Recognition, v. 34, n. 11, pp. 2071-2082, 2001.
138
MÄENPÄÄ, T. & PIETIKÄINEN, M., Classification with color and texture: jointly or separately?, Pattern
Recognition, v. 37, n. 8, pp. 1629-1640, 2004.
MALPICA, N.; ORTUÑO, J. E. & SANTOS, A., A multichannel watershed-based algorithm for supervised texture
segmentation, Pattern Recognition Letters, v. 24, n. 9-10, pp. 1545-1554, 2003.
MANIAN, V.; VASQUEZ, R. & KATIYAR, P., Texture classification using logical operators, Image Processing,
IEEE Transactions on, v. 9, n. 10, pp.1693-1703, 2000.
MANJUNATH, B.S.; OHM, J.R.; VINODI, V. V. & YAMADA, A., “Color and Texture Descriptors”, in: IEEE
TRANS. CIRCUITS AND SYSTEMS FOR VIDEO TECNOLOGY, 2001, n. especial em MPEG-7, v.11, n.6, pp.
703-715, 2001.
MANTHALKAR, R.; BISWAS P. K. & CHATTERJI, B. N., Rotation and scale invariant texture features using
discrete wavelet packet transform, Pattern Recognition Letters, v. 24, n. 14, pp. 2455-2462, 2003a.
MANTHALKAR, R.; BISWAS, P. K. & CHATTERJI, B. N., Rotation invariant texture classification using even
symmetric Gabor filters, Pattern Recognition Letters, v. 24, n. 12, pp. 2061-2068, 2003b.
MATHERON, G., Elements Pour une Theorie des Millieux Poreux, Paris: Masson et Cie, 1967, 166 p.
MIRMEHDI, M. & PETROU, M., Segmentation of color textures, Pattern Analysis and Machine Intelligence,
IEEE Transactions on, v. 22, n. 2, pp.142-159, 2000.
MONTIEL, E.; AGUADO, A. S. & NIXON, M. S., Texture classification via conditional histograms, Pattern
Recognition Letters, vol. 26, n. 11 , pp. 1740-1751, 2005.
MUNEESWARAN, K.; GANESAN, L.; ARUMUGAM, S. & SOUNDAR, K. R., Texture classification with
combined rotation and scale invariant wavelet features, Pattern Recognition, v. 38, n. 10, pp. 1495-1506, 2005.
NG, R.T. & HAN, J., Efficient and Effective Clustering Methods for Spatial Data Mining, In: TWENTIETH
INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASE, 1994, Santiago, 1994, pp.144-155
NODA, H.; SHIRAZI, M. N. & KAWAGUCHI, E., MRF-based texture segmentation using wavelet decomposed
images, Pattern Recognition, v. 35, n. 4, pp. 771-782, 2002.
NOVIANTO, S.; SUZUKI, Y. & MAEDA , J., Near optimum estimation of local fractal dimension for image
segmentation, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 365-374, 2003.
NUNES, E.O. & CONCI, A., Algoritmos Genéticos para Classificação Temática de Imagens Multiespectrais, in:
VIII SIMPÓSIO DE PESQUISA OPERACIONAL DA MARINHA (SPOLM 05), 2005, Rio de Janeiro: anais do
SPOLM 05, 2005a, v.1, pp.15-30.
NUNES, E.O. & CONCI, A., Determinação da Dimensão Fractal de Conjunto de Pontos às Imagens de Satélites, in:
CONGRESSO TEMÁTICO DE APLICAÇÕES EM DINÂMICA E CONTROLE (APPLICON) DA
SOCIEDADE BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL (SBMAC), 2001, São
139
Carlos, Rio de Janeiro: Aplicações em Dinâmica e Controle (ABCM/SBMAC), Eds. J. M. Balthazar, V.A. Oliveira,
G.N. Silca & J. M. Rosário, 2001, 1 ed., v. 1, pp. 106-128.
NUNES, E.O. & CONCI, A., Implementação de Algoritmos Genéticos no Balanceamento Interativo de Linhas de
Montagem, in: VI SIMPÓSIO DE PESQUISA OPERACIONAL DA MARINHA/VII SIMPÓSIO DE LOGÍSTICA
DA MARINHA (SPOLM 03), 2003, Rio de Janeiro: anais do SPOLM 03, 2003a, v.1, pp.79-91.
NUNES, E.O. & CONCI, A., O Coeficiente de Hurst e o Coeficiente de Variação Espacial na Segmentação de
Texturas Multiespectrais, in: IV CONGRESSO TEMÁTICO DE APLICAÇÕES DE DINÂMICA E CONTROLE
(DINCON 2005) DA SOCIEDADE BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL
(SBMAC), 2003, Petrópolis: anais do DINCON 2005, Série Arquimedes, v.4, Eds. J.M.Balthazar, G.N.da Silva,
M.Tsuchida, M.Boaventura, L.S.Goes & J.D.S.Silva, pp.1089-1096, 2005b.
NUNES, E.O. & CONCI, A., Otimização de Linhas de Montagem por Algoritmos Genéticos: Análise,
Aperfeiçoamento e Implementação, in: XXXV SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL DA
SOCIEDADE BRASILEIRA DE PESQUISA OPERACIONAL, 2003, Natal: resumo e ster SBPO/SOBRAPO,
v.1, pp.100-101, 2003b.
NUNES, E.O. & CONCI, A., Segmentação por Textura e Localização de Contorno em Regiões em Imagens
Multibandas, IEEE American Latina, aceito em out 2006.
NUNES, E.O. & CONCI, A., Segmenting Multi Bands Images by Color and Texture Analysis, in: PROCEEDINGS
10TH INTERNATIONAL WORKSHOP ON SYSTEMS, SIGNALS AND IMAGE PROCESSING IWSSIP 03,
2003, Prague, Anais Recent Trends in Multimedia Information Processing, Eds. B. Simak & P. Zahradnik, 2003c,
pp. 231-234.
NUNES, E.O. & CONCI, A., Técnicas de Descrição Regional Baseadas em Textura, In: II CONGRESSO
TEMÁTICO DE APLICAÇÕES DE DINÂMICA E CONTROLE (DINCON 2003) DA SOCIEDADE
BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL (SBMAC), 2003, São José dos Campos:
anais do DINCON 2003, Série Arquimedes, v. 2, Eds. J. M. Balthazar, G.N. da Silva, M.Tsuchida, M. Boaventura,
L. S. Goes & J. D. S. Silva, 2003d.
NUNES, E.O. & CONCI, A., Texture Segmentation Considering Multi Band, Multi Resolution and Affine Invariant
Roughness, in: XVI BRAZILIAN SYMPOSIUM ON COMPUTER GRAPHICS AND IMAGE PROCESSING
(SIBGRAPI 03), 2003, São Carlos, pp. 254-258, 2003e.
NUNES, E.O., Emprego da Dimensão Fractal para Análise de Texturas em Imagens Multiespectrais. Niterói, 2001,
103 p., Dissertação de Mestrado em Computação, Instituto de Computação, Universidade Federal Fluminense,
Niterói, 2001.
OCHI, L.S., Problemas de Clusterização em Mineração de Dados, In: ENCONTRO REGIONAL DE
INFORMÁTICA RJ/ES (ERI 2004), Vitoria: SBC/Regional RJ-ES, 2004, Anais (em CD-ROM) do ERI 2004
RJ/ES, v.1, pp.1-46, 2004.
140
OJALA, T.; VALKEALAHTI, K.; OJA, E. & PIETIKÄINEN, M., Texture discrimination with multidimensional
distributions of signed gray-level differences, Pattern Recognition, v. 34, n. 3, pp. 727-739, 2001.
OJALA, T.; PIETIKÄINEN, M. & MÄENPÄÄ, T., Multiresolution gray-scale and rotation invariant texture
classification with local binary patterns, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 24, n.
7, pp. 971-987, 2002.
OZYILDIZ, E.; KRAHNSTÖVER, N. & SHARMA R., Adaptive texture and color segmentation for tracking
moving objects, Pattern Recognition, v. 35, n. 10, pp. 2013-2029, 2002.
PALM, C., Color texture classification by integrative Co-occurrence matrices, Pattern Recognition, v. 37, n. 5, pp.
965-976, 2004.
PAPPAS, JUNQING CHEN, MOJSILOVIC, T.N. , A. Rogowitz, B.E., Adaptive perceptual color-texture image
segmentation, Image Processing, IEEE Transactions on, v. 14, n. 10, pp.1524- 1536, 2005.
PASCHOS, G. & PETROU M., Histogram ratio features for color texture classification, Pattern Recognition
Letters, v. 24, n. 1-3 , pp. 309-314, 2003.
PASCHOS, G., Fast color texture recognition using chromaticity moments, Pattern Recognition Letters, v. 21, n. 9,
pp. 837-841, 2000.
PASCHOS, G., Perceptually uniform color spaces for color texture analysis: anempirical evaluation, Image
Processing, IEEE Transactions on, v. 10, n. 6, pp.932-937, 2001.
PEILING CUI; JUNHONG LI; QUAN PAN & HONGCAI ZHANG, Rotation and scaling invariant texture
classification based on Radon transform and multiscale analysis, Pattern Recognition Letters, v. 27, n. 5, pp. 408-
413, 2006.
PETROU, M.; PIRODDI, R. & TALEBPOUR, A., Texture recognition from sparsely and irregularly sampled data,
Computer Vision and Image Understanding, v. 102, n. 1, pp. 95-104, 2006.
PIETIKÄINEN, M.; NURMELA, T.; MÄENPÄÄ, T. & TURTINEN, M., View-based recognition of real-world
textures, Pattern Recognition, v. 37, n. 2 , pp. 313-323, 2004.
PIETIKÄINEN, M.; OJALA, T. & XU, Z., Rotation-invariant texture classification using feature distributions,
Pattern Recognition, v. 33, n. 1, pp. 43-52, 2000.
PUIG, D. & GARCIA, M. A., Automatic texture feature selection for image pixel classification, Pattern
Recognition, vol. 39, n. 11, pp. 1996-2009, 2006.
QING XU; JIE YANG & SIYI DING, Color texture analysis using the wavelet-based hidden Markov model,
Pattern Recognition Letters, v. 26, n. 11, pp. 1710-1719, 2005.
REYES-ALDASORO, C.C. & BHALERAO. A., The Bhattacharyya space for feature selection and its application
to texture segmentation, Pattern Recognition, v. 39, n. 5, pp. 812-826, 2006.
141
RICHARDS, J.A & JIA, X., Remote Sensing Digital Image Analysis: An Introduction, 3ªed. Berlin: Springer-
Verlag, 1999.
ROHRMUS, D.R., Invariant and adaptive geometrical texture features for defect detection and classification,
Pattern Recognition, v. 38, n. 10, pp. 1546-1559, 2005.
RONCERO, V.G., Um Estudo de Segmentação de Imagens Baseado em um Método de Computação Evolucionária,
Rio de Janeiro, 2005, 70 p., Dissertação de Mestrado em Engenharia Elétrica, Rio de Janeiro, 2005.
RUBNER, Y.; PUZICHA J.; TOMASI, C. & BUHMANN, J. M., Empirical Evaluation of Dissimilarity Measures
for Color and Texture, Computer Vision and Image Understanding, v. 84, n. 1, pp. 25-43, 2001.
RUSHING, J.A.; RANGANATH, H.; HINKE, T.H. & GRAVES, S.J., Image segmentation using association rule
features, Image Processing, IEEE Transactions on, v. 11, n. 5, pp.558- 567, 2002.
RUSHING, J.A.; RANGANATH, H.S.; HINKE, T.H. & GRAVES, S.J., Using association rules as texture features,
Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 23, n. 8, pp.845-858, 2001.
SÁNCHEZ-YÁÑEZ, R. E.; KURMYSHEV, E. V. & CUEVAS, F. J., A framework for texture classification using
the coordinated clusters representation, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 21-31, 2003.
SÁNCHEZ-YÁÑEZ, R. E.; KURMYSHEV, E. V. & FERNÁNDEZ, A., One-class texture classifier in the CCR
feature space, Pattern Recognition Letters, v. 24, n. 9-10, pp. 1503-1511, 2003.
SANKAR, K.P. & WANG, P.P., Genetic algorithms for Pattern Recognition, CRC Press, Inc., 1996, 336p.
SCHARCANSKI, J., Stochastic texture analysis for monitoring stochastic processes in industry, Pattern
Recognition Letters, v. 26, n. 11, pp. 1701-1709, 2005.
SCHOWENGERDT, R.A., Remote Sensing, Models and Methods for Image Processing, 2 ed., San Diego:
Academic Press, 1997, 522 p.
SCHWARTZ, W.R. & PEDRINI, H., Segmentação de Imagens de Terrenos Baseada na Associação de
Características de Textura com Dependência Espacial Modelada por Campo Aleatório de Markov, in: XII
SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 2005, Goiânia: anais do XII Simpósio Brasileiro de
Sensoriamento Remoto (INPE), pp.4311-4318, 2005.
SENGUR, A., TURKOGLU, I. & INCE, M. C., Wavelet packet neural networks for texture classification, Expert
Systems with Applications In Press, Corrected Proof, Available online Jan 2006.
SETHIAN, J. A., Level Set Methods and Fast Marching Methods: Evolving Interfaces in Computational Geometry,
Fluid Mechanics, Computer Vision and Material Science, 2 ed., Cambridge: Cambridge University Press, 1999.
SETHIAN, J. A., Numerical Methods for Propagating Fronts, Variational Methods for Free Surface Interfaces,
Proceedings of the Vallambrosa Conference, 1987.
142
SETHIAN, J. A., Tracking Interfaces with Level Sets, American Scientist, v. 85, pp. 254-263, 1997.
SHUTAO LI & SHAWE-TAYLOR, J., Comparison and fusion of multiresolution features for texture classification,
Pattern Recognition Letters, v. 26, n. 5, pp. 633-638, 20005.
SHUTAO LI; KWOK, J. T., HAILONG ZHU & YAONAN WANG, Texture classification using the support vector
machines, Pattern Recognition, v. 36, n. 12, pp. 2883-2893, 2003.
SKLANSKY, J., Image Segmentation and Feature Extraction, IEEE Transactions on Systems, Man, and
Cybernetics, v.13, n.5, pp.907-916, 1978.
SOLTANIAN-ZADEH, H.; RAFIEE-RAD, F. & POURABDOLLAH-NEJAD D, S., Comparison of multiwavelet,
wavelet, Haralick, and shape features for microcalcification classification in mammograms, Pattern Recognition, v.
37, n. 10, pp. 1973-1986, 2004.
SONKA, M.; HLAVAC, V. & BOYLE, R., Image Processing, Analysis, and Machine Vision, 2 ed., v.1, Pacific
Grove: PWS Publishing, 1999, 750p.
SUEN, P.H. & HEALEY, G., The analysis and recognition of real-world textures in threedimensions, Pattern
Analysis and Machine Intelligence, IEEE Transactions on, v. 22, n. 5, pp.491-503, 2000.
SUMENGEN, B. & MANJUNATH, B.S., Multi-scale Edge Detection and Image Segmentation, in: EUROPEAN
SIGNAL PROCESSING CONFERENCE (EUSIPCO), 2005, Antalya. Disponível em http://vision.ece.ucsb.edu/
publications/view_abstract.cgi?207
TAO-I. HSU, JIANN LING KUO, & WILSON, R., A multiresolution texture gradient method for unsupervised
segmentation, Pattern Recognition, v. 33, n. 11, pp. 1819-1833, 2000.
TE-WON LEE & LEWICKI, M.S., Unsupervised image classification, segmentation, and enhancementusing ICA
mixture models, Image Processing, IEEE Transactions on, v. 11, n. 3, pp.270-279, 2002.
TUCERYAN, M. & JAIN, A.K., Texture Analysis, Handbook of Pattern Recognition and Computer Vision, World
Scientific Publishing Company, Singapore: World Scientific, Eds. C.H.Chen, L.F.Pau & P.S.P.Wang, pp.235-276,
1993.
TZAGKARAKIS, G.; BEFERULL-LOZANO, B. & TSAKALIDES, P., Rotation-Invariant Texture Retrieval With
Gaussianized Steerable Pyramids, Image Processing, IEEE Transactions on, v. 15, n. 9, pp.2702- 2718, 2006.
VICENT, L. & SOILE, P., Watersheds in Digital Spaces: An Efficient Algorithm Based on Immersion Simulations,
IEEE Transactions on PAMI, v. 13, n. 6: pp. 583-598, 1991.
XIANGYU YANG & JUN LIU, Maximum entropy random fields for texture analysis, Pattern Recognition Letters,
v. 23, n. 1-3 , pp. 93-101, 2002.
XIANGYU YANG & JUN LIU, Unsupervised texture segmentation with one-step mean shift and boundary Markov
random fields, Pattern Recognition Letters, v. 22, n. 10, pp. 1073-1081, 2001.
143
YEN, G.G. & NITHIANANDAN, N., Facial Feature Extraction Using Genetic Algorithm, in: PROCEEDINGS OF
THE CONGRESS ON EVOLUTIONARY COMPUTATION, 2002, Honolulu: IEEE, 2002, v. 2, pp.1895-1900.
YOKOO, Y. & HAGIWARA, M., Human Faces Detection Method using Genetic Algorithm, in: PROCEEDINGS
OF THE IEEE INTERNATIONAL CONFERENCE ON EVOLUTIONARY COMPUTATION, (ICEC 96), 1996,
Nagoya: IEEE , 1996, pp.113-118.
YONG HUANG; KAP LUK CHAN & ZHIHUA ZHANG, Texture classification by multi-model feature integration
using Bayesian networks, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 393-401, 2003.
YONG XIA; DAGAN FENG & RONGCHUN ZHAO, Morphology-based multifractal estimation for texture
segmentation, Image Processing, IEEE Transactions on, v. 15, n. 3, pp.614- 623, 2006.
YOSHIMURA MOTOHIDE & SHUNICHIRO OE, A Method of Distance Texture Image Segmentation by Genetic
Algorithms, in: PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON EVOLUTIONARY
COMPUTATION (ICEC 96), 1996, Nagoya: IEEE , 1996, pp.125-130.
YUZHONG WANG; JIE YANG & NINGSONG PENG, Unsupervised color–texture segmentation based on soft
criterion with adaptive mean-shift clustering, Pattern Recognition Letters , v. 27, n. 5, pp. 386-392, 2006.
ZHANG, B.; HSU, M. & DAYAL, U., K-harmonic Means - A Spatial Clustering Algorithm with Bossting, In:
PROC. INTERNATIONAL WORKSHOP ON TEMPORAL, SPATIAL AND SPATIO-TEMPORAL DATA
MINING (TSDM2000), 2000, Lyon: Lecture Notes in Artificial Intelligence, Eds. J.F.Roddick & K.Hornsby, v.
2001, pp.31-45.
ZHANG, B.; HSU, M. & DAYAL, U., K-harmonic Means - A Spatial Clustering Algorithm with Bossting,
Temporal, Spatial and Spatio-Temporal Data Mining, Lecture Notes in Artificial Intelligence, Berlin: Springer, Eds.
J.F.Roddick & K.Hornsby, pp.31-45, 2001.
ZHENG, H.; KONG, L.X. & NAHAVANDI, S., Automatic Inspection of Metallic Surface Defects using Genetic
Algorithms, Journal of Materials Processing Technology, v.125-126, pp.427–433, 2002.
ZIOU, D. & TABBONE, S., Edge Detection Techniques - An Overview, International Journal of Pattern
Recognition and Image Analysis, v.8, n.4, pp.537-559, 1998.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo