( PDF ) Segmentação por textura em imagens multibandas

Download PDF

ads:

UNIVERSIDADE FEDERAL FLUMINENSE

ÉLDMAN DE OLIVEIRA NUNES

SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS

NITERÓI

2006

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

ÉLDMAN DE OLIVEIRA NUNES

SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS

Tese apresentada ao Curso de Pós-Graduação em

Computação da Universidade Federal Fluminense, como

requisito parcial para obtenção do Grau de Doutor. Área

de Concentração: Computação Visual e Interfaces.

Orientador: Profa. Dra. AURA CONCI

NITERÓI

2006

ads:

ÉLDMAN DE OLIVEIRA NUNES

SEGMENTAÇÃO POR TEXTURA EM IMAGENS MULTIBANDAS

Tese apresentada ao Curso de Pós-Graduação em

Computação da Universidade Federal Fluminense, como

requisito parcial para obtenção do Grau de Doutor. Área

de Concentração: Computação Visual e Interfaces.

Aprovada em 4 de agosto de 2006.

BANCA EXAMINADORA

___________________________________________________________________________

Profa.Dra. AURA CONCI - Orientadora

UFF

___________________________________________________________________________

Prof.Dr. ÁNGEL SÁNCHEZ CALLE

URJC

___________________________________________________________________________

Prof.Dr. ANTONIO ALBERTO FERNANDES DE OLIVEIRA

UFRJ

___________________________________________________________________________

Profa.Dra. HELENA CRISTINA DA GAMA LEITÃO

UFF

___________________________________________________________________________

Profa.Dra. REGINA CÉLIA PAULA LEAL TOLEDO

UFF

Niterói

2006

Ao meu pai e minha mãe,

Pelo exemplo de vida;

À minha esposa,

Pelo amor, amizade e auxílio;

Aos meus filhos,

Pela paciência e compreensão

DEDICO

AGRADECIMENTOS

À Professora Doutora Aura Conci, minha orientadora, por compartilhar idéias,

conhecimentos e experiências que efetivamente contribuíram para o meu

aperfeiçoamento técnico-especializado. Sua dedicação, incentivo e confiança em

muito excederam o relacionamento orientador-orientando.

Aos professores do corpo docente do Instituto de Computação da UFF pelos

conhecimentos transmitidos e pelas visíveis demonstrações de respeito e apreço.

Aos professores membros da banca examinadora pela avaliação crítica e sugestões

para o aperfeiçoamento da pesquisa.

A minha esposa Sandra Regina de Oliveira Nunes e ao meu irmão Eduardo de

Oliveira Nunes, pelo inestimável apoio, interesse e colaboração.

EPÍGRAFE

“Com Deus está a sabedoria e a força; Ele tem conselho e entendimento.”

Jó 12:13

LISTA DE FIGURAS

FIGURA 3.1 – Exemplos de texturas naturais, p.14

FIGURA 4.1 – Amostra de uma região com 7x7 pixels, p.51

FIGURA 4.2 – Classes de distância para região de 7x7 pixels da figura 4.1, p.51

FIGURA 4.3 – Seis grupos de pixels correspondentes às classes de distâncias, p. 52

FIGURA 4.4 – Diagrama de dispersão de amostras da classe 1 e 2 , p.54

FIGURA 4.5 – Um exemplo de espaço de busca, p.55

FIGURA 4.6 – Funcionamento de um algoritmo genético, p.56

FIGURA 4.7 – Cromossomo representado por um vetor, p.57

FIGURA 4.8 – Representação do cromossomo, p.57

FIGURA 4.9 – Diagrama de dispersão dos dados da tabela 4.2, p.59

FIGURA 4.10 – Faixa de inicialização heurística dos atributos preditivos, p.61

FIGURA 4.11 – Aptidão percentual para os dados da tabela 4.5, p.64

FIGURA 4.12 – Probabilidade de seleção proporcional à aptidão, p.69

FIGURA 4.13 – Probabilidade de sorteio – roleta normalizada, p.71

FIGURA 4.14 – Fluxograma da busca local proposta, p.72

FIGURA 4.15 – Esquema funcional de um algoritmo de clusterização, p.74

FIGURA 4.16 – Exemplo de árvore de clusters na clusterização hierárquica, p.76

FIGURA 4.17 – Aplicação do método k-means, p.78

FIGURA 4.18 – Clusterização das amostras baseado no valor do CVE em cada banda espectral, p.79

FIGURA 4.19 – Centróides das amostras de treinamento no espaço euclidiano tridimensional, p.80

FIGURA 5.1 – Imagem de teste após diversas transformações geométricas, p.81

FIGURA 5.2 – Classes de distâncias para uma matriz 5x5 pixels, p.82

FIGURA 5.3 – CVE para diferentes intensidades de pixels em amostra homogênea, p.83

FIGURA 5.4 – Teste com diferentes dimensões da janela de amostra, p.83

FIGURA 5.5 – Padrão com quatro classes de texturas com 32x32 pixels, p.84

FIGURA 5.6 – Teste de invariância à rotação e reflexão, p.85

FIGURA 5.7 – Decomposição das bandas do padrão da figura 5.5, p.86

FIGURA 5.8 – Diferentes combinações das bandas da figura 5.7, p.86

FIGURA 5.9 – Teste de variância à combinação de bandas, p.87

FIGURA 5.10 – Mosaico de texturas de pedras, p.87

FIGURA 5.11 – Segmentação do mosaico de pedras – experimento 1 e 2, p.90

FIGURA 5.12 – Aplicação do filtro de mediana com janela de tamanho de 3x3 pixels, p.91

FIGURA 5.13 – Bordas localizadas após a filtragem com filtro de mediana de 3x3 pixels, p.92

FIGURA 5.14 – Contorno real e contorno CVE (pedras), p.92

FIGURA 5.15 – Mosaico de texturas de papéis, p.93

FIGURA 5.16 – Segmentação do mosaico de papéis, p.93

FIGURA 5.17 – Filtragem do mosaico de papéis com filtros de diferentes dimensões, p.94

FIGURA 5.18 – Contorno localizado com diferentes tamanhos de janelas de filtragem, p.94

FIGURA 5.19 – Contorno real e contorno CVE (papéis), p.95

FIGURA 5.20 – Estrela de seis pontas, p.95

FIGURA 5.21 – Detalhe do contorno localizado com janelas de segmentação diferentes, p.96

FIGURA 5.22 – Contornos sobrepostos das figuras 5.21a. a 5.21d., p.97

FIGURA 5.23 – Mosaico de texturas de madeira, p.97

FIGURA 5.24 – Resultado da segmentação dos experimentos 1, 2 e 3, p.100

FIGURA 5.25 – Resultado da filtragem dos experimentos 1, 2 e 3, p.100

FIGURA 5.26 – Localização do contorno dos experimentos 1, 2 e 3, p.100

FIGURA 5.27 – Contorno real e contorno CVE (madeira), p.101

FIGURA 5.28 – Mosaico de texturas de água, p.102

FIGURA 5.29 – Resultado obtido com programa AGCTIM (texturas de água), p.103

FIGURA 5.30 – Resultado obtido com programa CTIM (texturas de água), p.104

FIGURA 5.31 – Contorno real e contorno CVE (água), p.104

FIGURA 5.32 – Mosaico de texturas de solo, p.105

FIGURA 5.33 – Resultado obtido com programa AGCTIM (texturas de solo), p.106

FIGURA 5.34 – Resultado obtido com programa CTIM (texturas de solo), p.106

FIGURA 5.35 – Contorno real e contorno CVE (solo), p.107

FIGURA 5.36 – Mosaico de texturas de vegetação, p.107

FIGURA 5.37 – Resultado obtido com programa AGCTIM (texturas de vegetação), p.108

FIGURA 5.38 – Resultado obtido com programa CTIM (texturas de vegetação), p.109

FIGURA 5.39 – Contorno real e contorno CVE (vegetação), p.109

FIGURA 5.40 – Linhas com diferentes inclinações formando a sigla UFF, p.112

FIGURA 5.41 – Contorno (azul) das letras UFF formadas com linhas de diferentes inclinações, p.113

FIGURA 5.42 – Comparação do método ICA e CVE, p.114

FIGURA 5.43 – Comparação do método MRMRF e CVE, p.115

FIGURA 5.44 – Imagem colorida de pimentões, p.116

FIGURA 5.45 – Segmentação e contorno dos pimentões obtidos com o programa CTIM, p.116

FIGURA 5.46 – Contornos dos pimentões obtidos com os programas SEGWIN e VISD, p.116

FIGURA 5.47 – Paisagem colorida, p.117

FIGURA 5.48 – Segmentação e contorno da paisagem obtidos com o programa CTIM, p.117

FIGURA 5.49 – Contornos da paisagem obtidos com os programas SEGWIN e VISD, p.118

FIGURA 5.50 – Imagem colorida – mandril, p.118

FIGURA 5.51 – Segmentação e contorno do mandril obtidos com o programa CTIM, p.118

FIGURA 5.52 – Contornos do mandril obtidos com os programas SEGWIN e VISD, p.119

FIGURA 5.53 – Imagem de melanoma, p.119

FIGURA 5.54 – Segmentação e contorno do melanoma obtidos com o programa CTIM, p.120

FIGURA 5.55 – Contornos do melanoma obtidos com os programas SEGWIN e VISD, p.120

FIGURA 5.56 – Imagem de células e resultado obtido com o programa CTIM, p.121

FIGURA 5.57 – Contorno das células obtidos com os programas SEGWIN e VISD , p.121

FIGURA 5.58 – Imagem da região da grande são paulo segmentada por diferentes programas, p.122

FIGURA 5.59 – Composições das bandas 1, 2, 3, 5 e 7, p.123

FIGURA 5.60 – Contorno de água (bandas _7,2,1) e vegetação (bandas_753), p.123

FIGURA 5.61 – Contornos aplicados à composição de bandas_ 3,2,1, p.124

LISTA DE TABELAS

TABELA 4.1– Calculo dos novos valores de intensidade, p.52

TABELA 4.2 – Dados para cálculo do CVE, p.53

TABELA 4.3 – Exemplo de medidas de textura para duas bandas, p.58

TABELA 4.4 – Intervalo dos atributos preditivos, p.60

TABELA 4.5 – Dados para simulação da roleta, p.63

TABELA 4.6 – Simulação da roleta – seleção do indivíduo, p.64

TABELA 4.7 – Exemplo de aptidões para utilização do método da roleta, p.69

TABELA 4.8 – Probabilidade segundo o método de seleção proporcional, p.69

TABELA 4.9 – Cálculo das novas aptidões e probabilidades dos indivíduos, p.70

TABELA 4.10 – Exemplo de semente, p.71

TABELA 5.1– Calculo do CVE – teste de rotação e reflexão, p.82

TABELA 5.2 – Número de amostras para os experimentos 1 e 2 (pedras), p.88

TABELA 5.3 – Matriz de classificação–conjunto de treinamento–experimento 1 (pedras), p.88

TABELA 5.4 – Matriz de classificação–conjunto de treinamento–experimento 2 (pedras), p.89

TABELA 5.5 – Matriz de classificação–conjunto de teste–experimento 1 (pedras), p.89

TABELA 5.6 – Matriz de classificação–conjunto de teste–experimento 2 (pedras), p.89

TABELA 5.7 – Matriz de classificação–conjunto de teste com filtro mediana–experimento 1(pedras), p.91

TABELA 5.8 – Matriz de classificação–conjunto de teste com filtro mediana–experimento 2 (pedras), p.91

TABELA 5.9 – Número de amostras e coeficiente de variação por canal (papéis), p.93

TABELA 5.10 – Matriz de classificação dos pixels (papéis), p.95

TABELA 5.11 – Espessura do contorno para diferentes tamanhos da janela de segmentação, p.96

TABELA 5.12 – Número de amostras e coeficiente de variação para o experimento 1 (madeiras), p.98

TABELA 5.13 – Número de amostras e coeficiente de variação para o experimento 2 (madeiras), p.98

TABELA 5.14 – Número de amostras e coeficiente de variação para o experimento 3 (madeiras), p.98

TABELA 5.15 – Matriz de classificação–conjunto de treinamento–experimento 1 (madeiras), p.99

TABELA 5.16 – Matriz de classificação–conjunto de treinamento–experimento 2 (madeiras), p.99

TABELA 5.17 – Matriz de classificação–conjunto de treinamento–experimento 3 (madeiras), p.99

TABELA 5.18 – Matriz de classificação dos pixels (madeira), p.101

TABELA 5.19 – Número de mostras selecionadas–conjunto de treinamento (água), p.102

TABELA 5.20 – Matriz de classificação dos pixels (água), p.105

TABELA 5.21 – Número de mostras selecionadas – conjunto de treinamento (solo), p.105

TABELA 5.22 – Matriz de classificação dos pixels (solo), p.107

TABELA 5.23 – Número de mostras selecionadas – conjunto de treinamento (vegetação), p.108

TABELA 5.24 – Matriz de classificação dos pixels (vegetação), p.110

SUMÁRIO

RESUMO, p.xii

ABSTRACT, p.xiii

1. INTRODUÇÃO, p.1

1.1. APRESENTAÇÃO DO PROBLEMA, p.1

1.2. OBJETIVOS DO TRABALHO, p.2

1.3. MÉTODO PROPOSTO, p.2

1.4. MOTIVAÇÃO, p.3

1.5. ORGANIZAÇÃO, p.4

2. TÉCNICAS DE SEGMENTAÇÃO DE IMAGENS, p.5

2.1. SEGMENTAÇÃO, p.5

2.1.1. Técnicas de segmentação baseadas em filtragem local, p.7

2.1.2. Técnicas de segmentação baseadas em limiarização, p.8

2.1.3. Técnicas de segmentação baseadas em crescimento de regiões, p.9

2.1.4. Técnicas de segmentação baseadas em divisão e fusão de regiões, p.10

2.1.5. Técnicas de segmentação baseadas em contornos ativos, p.10

2.1.6. Técnicas de segmentação baseadas em morfologia matemática, p.12

2.1.7. Técnicas de segmentação baseadas em textura, p.12

2.2. CONSIDERAÇÕES FINAIS, p.13

3. TEXTURA, p.14

3.1. CONCEITO DE TEXTURA, p.14

3.2. REVISÃO TEÓRICA, p.16

3.2.1. Abordagens estatísticas, p.17

3.2.1.1. Técnicas baseadas em momentos, p.17

3.2.1.2. Técnicas baseadas em análise de histograma, p.17

3.2.1.3. Ténicas baseadas em matrizes de co-ocorrência, p.19

3.2.1.4. Técnicas baseadas em funções de auto-correlação, p.20

3.2.1.5. Técnicas baseadas em modelos gaussianos, p.21

3.2.1.6. Técnicas baseadas em classificação bayesiana, p.23

3.2.2. Abordagens espectrais, p.24

3.2.3. Abordagens baseadas em modelos, p.24

3.2.4. Abordagens baseadas em filtragens, p.26

3.2.4.1. Técnicas baseadas em análise de componente, p.26

3.2.4.2. Técnicas baseadas em filtros gabor, p.27

3.2.4.3. Técnicas baseadas em transformação wavelets, p.29

3.2.5. Abordagens baseadas em transformação de watershed, p.34

3.2.6. Abordagens baseadas em análise de agrupamento (clusterização), p.34

3.2.7. Abordagens baseadas em características de cor/bordas/contornos, p.37

3.2.8. Abordagens mistas, p.39

3.2.9. Outras abordagens, p.41

3.2.9.1. Técnicas baseadas em modelagem multi-resolução, p.41

3.2.9.2. Técnicas baseadas em operadores lógicos e transformações geométricas, p.41

3.2.9.3. Técnicas baseadas em conceitos topológicos, p.42

3.2.9.4. Técnicas baseadas em modelo auto-regressivo, p.42

3.2.9.5. Técnicas baseadas em medidas de similaridade/distâncias, p.44

3.2.9.6. Técnicas baseadas em regras de associação, p.44

3.2.9.7. Técnicas baseadas em redes neurais, p.45

3.2.10. Comparação de abordagens, p.46

3.3. CONSIDERAÇÕES FINAIS, p.48

4. METODOLOGIA, p.49

4.1. MEDIDAS ESTATÍSTICAS, p.49

4.2. O COEFICIENTE DE VARIAÇÃO ESPACIAL, p.50

4.3. PROBLEMAS DE OTIMIZAÇÃO, p.53

4.4. IMPLEMENTAÇÃO COM ALGORITMOS GENÉTICOS, p.55

4.4.1. Funcionamento dos algoritmos genéticos, p.56

4.4.2. Representação cromossômica, p.57

4.4.3. Critério de inicialização, p.60

4.4.4. Avaliação do indivíduo (fitness), p.61

4.4.5. Critério de seleção, p.62

4.4.6. Operadores genéticos, p.64

4.4.7. Critério de substituição, p.67

4.4.8. Critério de parada, p.67

4.4.9. Parâmetros de influência, p.68

4.5. CLUSTERIZAÇÃO, p.74

4.5.1. Medidas de similaridade, p.75

4.5.2. Métodos de agrupamento, p.75

4.6. IMPLEMENTAÇÃO COM ALGORITMO K-MEANS, p.77

4.7. CONSIDERAÇÕES FINAIS, p.80

5. TESTES, RESULTADOS E DISCUSSÃO, p.81

5.1. TESTES TEÓRICOS, p.81

5.2. TESTES COM MOSAICOS DE TEXTURAS NATURAIS, p.84

5.2.1. Teste de invariância à transformação geométrica, p.84

5.2.2. Teste de invariância à ordem de combinação de bandas, p.85

5.2.3. Teste de variação do número de amostras, p.87

5.2.4. Teste de variação do tamanho da janela de filtragem, p.92

5.2.5. Teste de espessura da borda, p.94

5.2.6. Teste de variação do tamanho da janela de amostragem, p.97

5.2.7. Teste empregando algoritmos genéticos e algoritmo k-means, 102

5.3. TESTES COM IMAGENS REAIS, p.110

5.3.1. Teste com imagens monocromáticas, p.112

5.3.2. Teste com imagens coloridas, p.115

5.3.3. Teste com imagens obtidas com aparelhos médicos, p.119

5.3.4. Teste com imagens de satélites, p.121

5.4 DISCUSSÃO, p.124

5.5 CONSIDERAÇÕES FINAIS, p.125

6. CONCLUSÕES E PROPOSTAS FUTURAS, p.126

6.1 SUMÁRIO DE CONTRIBUIÇÕES, p.128

6.2 SUGESTÕES PARA TRABALHOS FUTUROS , p.129

REFERÊNCIAS BIBLIOGRÁFICAS, p.131

APENDICE A – DESCRIÇÃO DOS PROGRAMAS AGCTIM E CTIM, p. 144

xii

RESUMO

A segmentação de imagens por textura tem sido amplamente utilizada em análise de

imagens médicas, interpretação visual de imagens de sensoriamento remoto, inspeção de

qualidade industrial de produtos manufaturados, segmentação de documentos, busca de

imagens, sistemas de reconhecimento, etc. Muitos esquemas de classificação de textura

requerem uma área da imagem excessivamente grande para análise da textura, empregam um

grande número de características para representá-la ou utilizam técnicas que exigem

considerável esforço computacional. A detecção de bordas também é um fator importante no

processo de reconhecimento e interpretação de imagens. A determinação do contorno permite

definir propriedades como perímetro e forma do objeto, e representá-lo de maneira concisa.

Porém, em imagens reais, após a segmentação por texturas, a localização do contorno das

áreas segmentadas não é uma tarefa simples. Este trabalho apresenta um método de

segmentação que considera todas as bandas de informação da imagem em texturas naturais ou

sintéticas, permitindo a distinção de texturas com diversos aspectos. É proposto um novo

coeficiente (CVE - Coeficiente de Variação Espacial) para calcular os limites de regiões

pequenas ou grandes e classificar corretamente a borda da textura. O CVE considera a posição

espacial dos pixels no elemento de textura e as faixas de cor através de medidas estatísticas de

média e desvio padrão. Formulações baseadas em Algoritmos Genéticos e partição K-Means

foram desenvolvidas para gerar regras de classificação a partir de amostras de treinamento.

Estas podem ser usadas para diversos tipos de textura porque as regras relativas ao que será

identificado são completamente determinadas pelo usuário e adaptadas a cada situação. Para

verificar a aplicabilidade do coeficiente proposto, foram feitas diversas comparações com

outros resultados disponíveis na literatura, bem como, foram elaborados testes variados,

visando verificar os limites de eficiência e versatilidade do método, tanto em imagens reais

quanto em imagens sintéticas.

Palavras-chave: Segmentação. Textura. Imagens Multibandas.

xiii

ABSTRACT

Texture image segmentation texture has been thoroughly used in analysis of medical

images, visual interpretation of images of remote sensing, inspection of industrial quality of

manufactured products, segmentation of documents, recovery of images, recognition systems,

etc. Many schemes of texture classification request an excessively large image area for texture

analysis, they use a great number of characteristics to represent it or they use techniques that

demand considerable computational effort. Edge detection is also an important factor in the

process of image recognition and interpretation. The determination of the contour defines

properties as perimeter and form, allowing an object concise representation. However, in real

images, after the segmentation for textures, the edge location of the segmented areas is not a

simple task. This work presents a segmentation method that considers all the bands of

information of the image in natural or synthetic textures allowing distinction of textures with

several aspects. A new coefficient is proposed (CSV - Coefficient of Space Variation) to

calculate the limits of small or big areas and to classify correctly the border of the texture. The

CSV considers two informations: the space position of the pixels in the texture element and

the color strips through statistic measures of average and standard deviation. Approaches

based on Genetic Algorithms and on K-Means partition method were developed to generate

classification rules from training samples. These can be used for several texture types because

the rules relative to what will be identified are completely determined by the user and adapted

to each situation. In order to verify the applicability of the proposed method, several

comparisons with other available results in the literature were made, as well as varied tests

were elaborated aiming efficiency limits and versatility verification both in real images and in

synthetic images.

Keywords: Segmentation. Texture. Multiband Images.

Ficha Catalográfica elaborada pela Biblioteca da Escola de Engenharia e Instituto de Computação da UFF

N972 Nunes, Éldman de Oliveira.

Segmentação por textura em imagens multibandas / Éldman de

Oliveira Nunes. – Niterói, RJ : [s.n.], 2006.

154 f.

Orientador: Aura Conci.

Tese (Doutorado em Computação) - Universidade Federal

Fluminense, 2006.

1. Processamento de imagem. 2. Segmentação de imagens. 3.

Interfaces (Computação). 4. Computação visual. I. Título.

CDD 006.42

1 INTRODUÇÃO

Este capítulo introduz o problema da segmentação de regiões presentes em uma imagem por

textura. Também são apresentados: o método proposto para classificação de imagens

multiespectrais, a motivação da estratégia escolhida, os objetivos do trabalho e sua

organização.

1.1 APRESENTAÇÃO DO PROBLEMA

A segmentação visa à separação de uma imagem em suas partes constituintes. Esta é uma das

tarefas mais importantes e complexas em processamento de imagens. Importante porque as

etapas seguintes de identificação serão realizadas sobre as partes segmentadas, complexa

porque procura traduzir para o computador um processo cognitivo extremamente sofisticado

realizado através da visão humana. Assim, um cuidado considerável deve ser despendido

nesta etapa, pois, uma segmentação eficiente praticamente garante o sucesso de etapas

posteriores da análise de imagens como o seu reconhecimento (GONZALEZ; WOODS,

2000).

A textura pode ser definida como um padrão estatístico local de primitivas de textura no

domínio de observação de interesse (SENGUR; TURKOGLU; INCE, 2006). A textura é

freqüentemente usada como um descritor regional em análise de imagem e visão

computacional. Análise de textura é uma área de pesquisa importante com aplicações em

bibliotecas digitais, bancos de dados multimídia, imagens médicas, robótica, sensoriamento

remoto, controle de qualidade, etc. (XIANGYU YANG; JUN LIU, 2002; BASHAR;

MATSUMOTO; OHNISHI, 2003).

A segmentação de regiões de imagem baseada na textura é um problema comum em análise

de imagem. Ao ser selecionado um conjunto de características de textura, vários métodos para

segmentação da imagem em regiões podem ser aplicados. (CLAUSI; ED JERNIGAN, 2000;

EPIFANIO; AYALA, 2002; MALPICA; ORTUÑO; SANTOS, 2003). A maioria dos

trabalhos voltados a segmentação de regiões de imagem por textura se baseiam num modelo

matemático elaborado, incluindo, matrizes de co-ocorrência de nível-cinza, funções de auto-

correlação, campos aleatórios, filtros Gabor, Wavelets, etc. Tais modelos, normalmente,

possuem exigências computacionais elevadas (PASCHOS & PETROU, 2003).

Técnicas de segmentação e classificação baseadas em textura necessitam da definição de um

conjunto de medidas que a represente de forma efetiva. Este trabalho propõe uma nova

medida para quantificação da textura de uma região que considera o atributo textura em

diferentes combinações de bandas possíveis. Esta medida, denominada de Coeficiente de

Variação Espacial (CVE) é utilizada na geração de regras que servirão para segmentação de

imagens multibandas. Duas diferentes estratégias para criação das regras utilizando

Algoritmos Genéticos e algoritmo K-Means são modeladas e implementadas. Esta proposta

inovadora é caracterizada por sua simplicidade e flexibilidade, além de exigências

computacionais mais baixas que as dos algoritmos convencionais.

1.2 OBJETIVOS DO TRABALHO

Este trabalho procurou atender os seguintes objetivos:

- Realizar uma revisão teórica a fim de compreender os conceitos de segmentação,

textura, Algoritmos Genéticos e algoritmo K-Means;

- Definir um método para quantificar o conteúdo de textura de uma amostra;

- Definir um modelo de Algoritmo Genético para evolução de regras visando à

classificação de imagens multiespectrais;

- Implementar o modelo de Algoritmo Genético definido no objetivo anterior;

- Implementar o algoritmo K-Means para clusterização das amostras das classes;

- Desenvolver um sistema, visando à classificação de imagens multiespectrais;

- Realizar testes diversificados para avaliar o desempenho do modelo implementado.

1.3 MÉTODO PROPOSTO

O CVE de uma amostra de textura é obtido através de medidas estatísticas de posição (média)

e de dispersão (desvio padrão) e representa as coordenadas de um ponto no espaço

tridimensional (quando calculado para os canais red, green e blue). Assim, o problema

consiste em alocar cada uma das amostras das regiões de interesse nas classes

correspondentes, de forma a maximizar acertos ou minimizar erros de classificação.

Esta tarefa de classificação pode ser modelada como um problema de maximizar ou

minimizar uma função, cujas variáveis devem obedecer a certas restrições. Devido a

existência de um vasto espaço de busca e diversas soluções sujeitas a restrições, duas

metaheurísticas foram empregadas para reduzir a complexidade da solução do problema e

fornecer soluções sub-ótimas em tempo satisfatório.

A primeira meta heurísticas utiliza Algoritmos Genéticos (AG) para descobrir regras para as

classes, a partir de um conjunto de amostras de cada região de interesse. O AG formula regras

que permitam atribuir amostras às classes correspondentes, minimizando os erros de

classificação. Uma regra é representada por um cromossomo, assumindo a forma SE (T

, T

) ENTÃO P, onde os atributos textura da imagem (T

, T

) estão representados

simbolicamente como condições para que a conclusão da regra, caracterizada por (P), seja

verdadeira. Baseado nesta hipótese, pode-se procurar obter regras que caracterizem uma

classe através de evolução genética.

A segunda estratégia utiliza o método de partição baseado em recolocação K-Means. As

amostras de cada textura de interesse são clusterizadas e as coordenadas do centróide. obtido

para cada cluster. compõe um vetor de característica da textura com dimensão igual ao

número de bandas espectrais consideradas. O vetor de centróides representando as classes de

texturas de interesse é utilizado para segmentação do restante da imagem. Apesar da presença

de componentes aleatórios, espera-se que as amostras de uma mesma textura apresentem uma

maior similaridade com as amostras pertencentes ao cluster correspondente (menor distância

euclidiana para este centróide).

1.4 MOTIVAÇÃO

A classificação de imagens baseada em características texturais têm sido amplamente

utilizada no meio científico e industrial. Em vários tipos de imagens médicas, as propriedades

de textura são importantes no auxílio ao diagnóstico, por exemplo, a caracterização do câncer

e a detecção de lesões. Nas imagens de sensoriamento remoto, o reconhecimento de texturas é

empregado na interpretação visual de imagens aumentando o desempenho dos classificadores.

Na inspeção de qualidade industrial, a detecção automatizada de produtos manufaturados

defeituosos baseado nas propriedades texturais evitam o trabalho tedioso da inspeção manual.

Muitas outras áreas como segmentação de documentos, busca de imagens baseadas no seu

conteúdo, sistemas de reconhecimento, etc. empregam métodos de análise baseado no perfil

textural que constitui a imagem.

Os Algoritmos Genéticos (AG’s) têm sido bem sucedidos em diversas aplicações,

particularmente em problemas de otimização (GOLDBERG, 1989; HOLLAND, 1992). Tais

problemas são caracterizados pela busca de boas soluções dentre um número elevado de

possíveis soluções (espaço de busca). AG’s tornam-se atrativos devido ao fato de não ser

necessário descrever como encontrar uma boa solução. Assim, a descoberta de padrões em

forma de regras através de algoritmos genéticos, revela-se um método promissor de

classificação de imagens.

O algoritmo de clusterização K-Means possui amplo emprego em problemas de otimização

(ZHANG; HSU; DAYAL, 2001). Este algoritmo tem um claro significado geométrico,

possibilitando o refinamento das soluções obtidas durante sua execução, melhorando

gradativamente a formação dos agrupamentos e permitindo a utilização do centróide como

elemento representativo de um cluster.

1.5 ORGANIZAÇÃO

Este trabalho está organizado como se segue. O capítulo 2, Técnicas de Segmentação de

Imagens, fornece uma classificação geral das técnicas mais comuns de segmentação de

imagens digitais. O capítulo 3, Textura, conceitua textura, bem como faz uma revisão dos

principais métodos de segmentação baseados em textura, disponíveis na literatura recente. O

capítulo 4, Metodologia, descreve o coeficiente proposto CVE para quantificação da textura

de uma região da imagem, bem como a modelagem do Algoritmo Genético e do algoritmo

K-Means utilizada para implementação do método de segmentação. O capítulo 5, Testes,

Resultados e Discussão, apresenta e discute os resultados dos diversos testes realizados com a

finalidade de avaliar o desempenho da metodologia adotada. O capítulo 6, Conclusão, destaca

as conclusões obtidas neste trabalho e levanta perspectivas de trabalhos futuros. Finalmente, o

apêndice “A”, Descrição do Programa, detalha os aplicativos desenvolvidos para a

implementação do método proposto.

2. TÉCNICAS DE SEGMENTAÇÃO DE IMAGENS

Este capítulo apresenta um resumo das técnicas mais comuns empregadas na segmentação de

imagens digitais.

2.1

SEGMENTAÇÃO

A segmentação é uma tarefa básica em processamento de imagens e visa à identificação e

separação de uma imagem em suas partes constituintes. Na segmentação, a imagem é dividida

em regiões com propriedades comuns (intensidade, cor, textura, etc). O nível de subdivisão da

imagem depende do objetivo que se pretende alcançar. A segmentação se encerra quando as

partes constituintes de interesse forem isoladas, o que requer o conhecimento prévio da natureza

da imagem. Assim, a segmentação é um problema orientado à aplicação, pois depende do

contexto (BERDER, 2003).

Formalmente, a segmentação de imagens é definida como um tratamento que visa particionar

uma imagem f em um subconjunto composto de

regiões

R tais que (COCQUEREZ, 1997):

≤

≠∀

=≠∀

RRjiji ;;,



Rf =

A segmentação é uma etapa crítica em processamento de imagens, pois, a eficiência obtida na

identificação e separação das regiões de interesse influencia os resultados das etapas

subseqüentes (GONZALEZ; WOODS, 2000). Como a segmentação não é um fim em si, sua

qualidade é determinada pela adequação das regiões extraídas aos tratamentos que serão

realizados nas próximas etapas.

Simular no computador o processo de seleção e agrupamento realizado pela visão humana na

identificação de regiões semelhantes é uma tarefa difícil. Várias dificuldades estão presentes: a

complexidade da textura, a não homogeneidade da iluminação (sombras próximas à borda), as

irregularidades e as imprecisões das regiões das bordas, etc. Não existe um modelo formal para a

segmentação, o processo é essencialmente empírico e deverá se ajustar a diferentes tipos de

imagens e necessidades (SCHWARTZ; PEDRINI, 2005).

Uma vez que a segmentação visa particionar uma imagem em regiões com propriedades comuns,

normalmente as técnicas de segmentação estão associadas ao conceito de região. Esta

caracterização pode muitas vezes estar completamente relacionada com a aplicação. Assim, uma

região pode ser vista como um conjunto de pixels conectados envolvidos por uma borda de

pixels criando um contorno ou, ainda, uma região pode ser definida como um conjunto de pixels

conectados por meio de uma condição de uniformidade.

Na primeira definição, a segmentação é realizada com base na descontinuidade, enquanto na

segunda definição, com base na similaridade (GONZALEZ; WOODS, 2000). Sob a perspectiva

da descontinuidade, a preocupação volta-se para obtenção de contornos conexos, a fim de que os

tratamentos subseqüentes à segmentação possam extrair, a partir da imagem segmentada,

propriedades como perímetro e a área das regiões. Sob a perspectiva da similaridade, a

preocupação volta-se para redução do número excessivo de sub-regiões não significativas que

pode levar a supersegmentação da imagem.

Atualmente, existe uma grande variedade de técnicas de segmentação de imagens que podem ser

classificadas de diferentes formas. Neste trabalho, as técnicas de segmentação foram

classificadas em sete grupos baseados em:

1. filtragem local;

2. limiarização;

3. crescimento de regiões;

4. divisão e fusão de regiões;

5. em contornos ativos;

morfologia matemática; e

7. texturas.

2.1.1 Técnicas de segmentação baseadas em filtragem local

As técnicas para detecção de contornos visam detectar descontinuidades na imagem que podem

representar pontos, linhas e bordas de objetos. Elas assumem que as regiões a serem

segmentadas são suficientemente homogêneas e a transição entre regiões caracteriza-se pela

descontinuidade nos tons de cinza.

Nestas técnicas, um objeto pode ser entendido como uma região dentro de um contorno. Para

distinguir os objetos, detectam-se suas bordas (edge detection) e tenta-se construir uma região

conectada interior a partir delas. As bordas são regiões da imagem caracterizadas por uma

mudança brusca do nível de iluminação ou dos tons de cinza entre duas regiões. O contorno é

uma linha fechada formada pelas bordas de um objeto.

O processo de detecção de bordas baseado na descontinuidade da intensidade tonal consiste na

verificação da variação dos valores de luminosidade de uma imagem visando localizar e realçar

os pixels de borda, através da ampliação do contraste entre esta e o fundo.

Uma vez que uma borda é caracterizada por uma mudança no nível de luminosidade da cena

decorrente de uma descontinuidade na intensidade, um operador sensível a estas mudanças

atuará como um detector de bordas. Normalmente utiliza-se um operador de diferenciação, que é

baseado na noção de derivada, como os operadores Laplaciano, Prewitt, Roberts e Sobel.

A filtragem local utilizando convolução com máscaras é a maneira mais usual de verificação de

descontinuidades em uma imagem. A convolução com uma máscara de detecção de borda na

imagem original produzirá uma imagem gradiente com mesma dimensão que a imagem original,

porém contendo os valores da máscara de resposta ao invés do valor do pixel. Estes valores

podem ser comparados com o valor mínimo de limiar definido para determinar quais pixels são

mais prováveis de pertencerem a uma borda.

Entretanto, devido à presença de ruídos, iluminação não uniforme, textura e outras perturbações,

raramente o conjunto de pixels forma contornos completos. Assim, alguns procedimentos para

ligação de bordas são utilizados em conjunto com os algoritmos de detecção, a fim de reunir

pixels de bordas em contornos significativos.

A detecção de bordas é muito importante na segmentação, pois, uma vez localizado o contorno, é

possível definir propriedades como perímetro e forma do objeto de uma maneira concisa. Porém,

não é um processo simples, devido a grande variação de condições de iluminação das imagens

reais (SUMENGEN; MANJUNATH, 2005).

A formulação de um algoritmo de detecção de bordas que apresente um bom desempenho em

diferentes contextos é uma tarefa difícil (ZIOU; TABBONE, 1998). Vários operadores com

diferentes formulações matemáticas têm sido desenvolvidos para diversos propósitos.

2.1.2 Técnicas de segmentação baseadas em limiarização

A limiarização é um método de segmentação que se baseia na obtenção de limiares que separam

grupos de pixels de características semelhantes (HARALICK; SHAPIRO, 1992). O processo de

limiarização separa regiões de uma imagem quando esta apresenta duas classes (o fundo e o

objeto). Uma vez que a limiarização produz uma imagem binária como saída, ela também é

conhecida por binarização. A limiarização, muitas vezes, baseia-se na utilização do histograma

da imagem. No caso do objeto diferenciar-se em relação ao fundo, o histograma apresenta

distintamente duas classes na forma de dois picos (modas) separados por um “vale”.

Em sua forma mais simples, a limiarização realiza a partição do histograma, convertendo os

pixels cujo tom de cinza é maior ou igual a um valor de limiar (

) em brancos (ou pretos) e os

demais em pretos (ou brancos), gerando assim, uma imagem binária com duas classes, o fundo e

o objeto. Formalmente, a limiarização converte uma imagem de entrada

(

)

yxf ,

níveis de

cinza em uma imagem

(

)

yxg ,

, chamada de imagem limiarizada, com número de níveis de cinza

menor do que N. Normalmente,

(

)

yxg ,

apresenta 2 níveis de cinza, equação (2.1):

(

)

(

)

(

)

{

}

TyxfseTyxfseyxg <≥= ,0;,1,

(2.1)

onde os pixels rotulados com 1 correspondem aos objetos, os rotulados com 0 correspondem ao

fundo e

é um valor de tom de cinza pré-definido, denominado limiar. Este limiar

localiza-

se em algum lugar do vale.

O principal problema da limiarização é selecionar um valor de

que proporcione a melhor

segmentação. Normalmente, a escolha do valor de

envolve várias tentativas. Devido à

iluminação irregular ao longo da cena (sombra), a não uniformidade nos tons do fundo e dos

objetos e a presença de vários objetos diferentes, raramente o histograma de imagens reais

apresenta dois picos distintos e disjuntos associados ao fundo e aos objetos (SONKA; HLAVAC;

BOYLE, 1999).

A binarização pode ser generalizada para considerar um número arbitrário de níveis. Geralmente,

a limiarização multinível é menos confiável do que a binarização em razão da dificuldade de

encontrar os vários

que efetivamente isolam regiões de interesse.

A limiarização pode ser vista como uma operação que envolve um teste com relação a uma

função

, equação (2.2):

(

)

(

)

[

]

yxfyxpyxTT ,,,,,=

(2.2)

Na equação (2.2),

(

)

yxf ,

é o tom de cinza original no ponto de coordenadas

(

)

yx,

(

)

yxp ,

indica uma propriedade local neste ponto, por exemplo, a média de seus vizinhos.

2.1.3 Técnicas de segmentação baseadas em crescimento de regiões

Crescimento de regiões é um processo interativo de agrupamento de pixels (e no caso de texturas

textons) em que regiões homogêneas e adjacentes no espaço são agrupadas (GATO; IMAR;

TOMMASELLI, 2001).

No início do processo de segmentação, a região pode ser um pixel ou um conjunto de pixels

(“semente”). Para cada região são calculados certos atributos que sejam considerados

representativos para a região, como por exemplo: cor, textura ou luminosidade. A agregação das

regiões é feita usando algum critério de similaridade ou de decisão.

Alguns problemas precisam ser considerados no processo de crescimento de regiões.

Inicialmente é necessário que a seleção de “sementes” represente adequadamente as regiões de

interesse. Também é preciso selecionar adequadamente as propriedades para a inclusão de

pontos nas várias regiões durante o processo de crescimento. Outro problema é o

estabelecimento de um critério de parada. O crescimento de uma região deveria parar quando

não houvesse mais pixel que satisfizesse os critérios de inclusão naquela região.

Uma vez que critérios como: intensidade, textura e cor são locais por natureza, não considerando

o histórico do processo de crescimento de região, critérios adicionais que utilizam o conceito de

tamanho, similaridade entre o pixel candidato e os pixels acrescidos até aquele momento e a

forma da região sendo operada são desejáveis para aumentar o poder do algoritmo de

crescimento de regiões (GONZALEZ; WOODS, 2000).

Normalmente, o crescimento de regiões emprega um conjunto de descritores baseados em

intensidade e em propriedades espaciais (como momentos e texturas) de uma única fonte de

imagens. Porém, a informação de conectividade ou de adjacência deve ser considerada no

processo de crescimento de regiões, pois o emprego destes descritores isoladamente pode

conduzir a resultados enganosos (GONZALEZ; WOODS, 2000).

2.1.4 Técnicas de segmentação baseadas em divisão e fusão de regiões

Separação e junção é um método que subdivide uma imagem em quatro blocos e testa cada um

destes blocos verificando se os pixels (ou textons) pertencentes aos mesmos atendem a algum

critério de homogeneidade.

Os blocos que atenderem ao critério não serão mais divididos. O bloco que não atender será

subdividido em blocos menores. Esse processo é repetido interativamente até um critério de

parada ser satisfeito. Em seguida, é realizada a junção dos blocos vizinhos que sejam

homogêneos (GONZALEZ; WOODS, 2000). Esse método geralmente é associado a uma

estrutura

quadtree

(ou seja, uma árvore em que cada nó possui exatamente quatro descendentes)

que possibilita decompor e agrupar partes de uma imagem (AZEVEDO; CONCI, 2003).

2.1.5 Técnicas de segmentação baseadas em contornos ativos

Proposto originalmente por Kass, Witkin & Terzopoulos (1988), os modelos de contornos ativos

são técnicas que visam à extração das bordas dos objetos da cena. Estas técnicas se caracterizam

pelo ajuste de uma curva (

spline

) sobre uma imagem definindo o contorno do objeto

segmentado. Geralmente são aplicados conjuntamente com técnicas de filtragem para detecção

de pontos de bordas.

A inicialização é realizada com um contorno de configuração arbitrária que evolui até se ajustar

ao objeto de interesse. Devido ao seu comportamento dinâmico, os contornos ativos são também

conhecidos como “modelos deformáveis”.

A evolução dos modelos deformáveis a partir da curva inicial é controlada pela ação de forças

internas e externas que atingem a posição de equilíbrio somente quando o modelo se aproxima

da borda do objeto de interesse. A energia interna (intrínsecas à geometria da curva) é

responsável por deformar a curva, enquanto a energia externa (derivadas da imagem) é

responsável por atrair à curva em direção a borda do objeto.

Existem dois tipos principais de modelos de contornos ativos encontrados na literatura

(GIRALDI, 2000): modelos

paramétricos

, como as

snakes,

propostas por Kass, Witkin &

Terzopoulos (1988), e modelos

geométricos

implícitos,

propostos por Sethian (1987).

Os modelos Paramétricos consistem de uma curva (ou superfície) elástica que é capaz de se

conformar dinamicamente às bordas dos objetos na imagem em conseqüência das forças internas

(forças elásticas) e forças externas (forças da imagem e forças de restrição) (DUMITRAS;

VENETSANOPOULOS, 2001).

Estas forças podem ser determinadas em função de um processo de minimização global ou

baseadas somente em informação local. Os modelos paramétricos são mais intuitivos do que os

modelos implícitos, pois apresentam uma formulação matemática que integra num único

processo parâmetros como propriedades da imagem, estimativas iniciais das fronteiras,

propriedades de contorno desejadas e restrições conhecidas do tipo de imagem processada.

Nos modelos paramétricos, a curva possui uma posição inicial, especificada pelo usuário, e uma

função objetivo associada, denominada

energia

da snake

. A

energia da snake

é composta por

dois termos: um referente à energia interna da curva e o outro referente à energia externa.

energia interna

é inerente à própria curva, considerando aspectos físicos análogos como

elasticidade (capacidade da curva de se deformar sob a ação de uma força e retomar seu estado

original quando a força é removida) e rigidez (resistência da curva ao dobramento, ou seja,

desenvolvimento de pontos descontínuos). A

energia externa

ou do ambiente considera as

características da imagem, definido a partir de elementos de interesse (pontos de borda, texturas,

etc.) e outros aspectos opcionais, como forças de pressão.

A finalidade deste sistema de forças é atrair a curva (

snake

) em direção a uma borda, ficando em

equilíbrio estável sobre a mesma ao atingir o valor mínimo de energia do sistema (GIRALDI;

STRAUSS; OLIVEIRA, 2001).

Os modelos implícitos consistem em definir a

snake

como o conjunto de nível zero de funções

(

zero level set

) definidas num espaço de dimensão maior e resolver a cada passo uma equação de

movimento correspondente. Assim, em qualquer instante, a posição da curva será dada pelo nível

zero da função de nível dependente do tempo (SETHIAN, 1997).

Estes modelos são mais adequados para a recuperação de objetos com formas complexas e

topologias desconhecidas. Mas, são menos convenientes que os modelos paramétricos para

análise de forma, visualização, e interação com o usuário.

Uma dificuldade com as técnicas de segmentação baseadas em contornos ativos é a necessidade

de uma boa estimativa inicial do contorno procurado, a fim de garantir seu bom funcionamento.

Entretanto, essas técnicas possuem a vantagem de facilitar a incorporação de informações

conhecidas a priori sobre os contornos (topologia, suavidade, etc), ser extensível à superfícies se

movendo em um espaço tridimensional, bem como facilitar a interação com o usuário quando

houver necessidade (SETHIAN, 1999). Além disso, fornecem contornos conexos completamente

definidos dentro do domínio da imagem.

2.1.6 Técnicas de segmentação baseadas em morfologia matemática

O principio básico da Morfologia Matemática consiste em extrair informações relativas à

geometria e à topologia de um conjunto desconhecido de uma imagem, por meio da interação

deste, com um conjunto completamente definido e conhecido (forma e tamanho), chamado de

elemento estruturante (MATHERON, 1967).

A flexibilidade e também a maior dificuldade da Morfologia Matemática reside na escolha

adequada do elemento estruturante para a obtenção de bons resultados (FACON, 1996). Devido

ao amplo espectro de aplicações práticas e de sua simplicidade de implementação, a Morfologia

Matemática tornou-se uma importante metodologia para análise de imagens.

Na Morfologia Matemática, a principal ferramenta de segmentação é baseada na transformação

Watershed

, também conhecida como linha divisora de águas - LDA (BEUCHER

;

MEYER,

1993; VICENT; SOILE, 1991).

Nesta técnica, uma imagem monocromática é representada por uma superfície topográfica em

que os níveis de cinza indicam a altitude do ponto no relevo. Os mínimos em cada uma das

bacias são perfurados e a superfície topográfica é imersa em um lago com velocidade vertical

constante. Então, a superfície topográfica é gradualmente preenchida pela água que penetra nos

orifícios das bacias. Durante este preenchimento, dois ou mais fluxos vindos de mínimos

diferentes podem se unir. Os diques construídos na superfície para evitar que tal junção de águas

ocorra são denominados linhas

watersheds

A transformação

watershed

possui como vantagem a rapidez de processamento mesmo com

imagens grandes e complexas. Porém, são sensíveis às irregularidades presentes nas bordas das

regiões (que podem permitir vazamentos) e ao excessivo número de mínimos locais que

provocam uma supersegmentação da imagem.

Base de importantes métodos de segmentação, a técnica de simulação de imersão oferece um

campo fértil para implementação de novos algoritmos (ANDRADE, 1998).

2.1.7 Técnicas de segmentação baseadas em textura

Um importante descritor que tem contribuído na segmentação e classificação de imagens é a

textura. A segmentação por textura deve permitir a colocação em evidência dos motivos da

imagem, considerando-se as propriedades de regularidade e de repetição. O próximo capítulo

abordará os principais métodos de segmentação baseados em textura.

2.2 C

ONSIDERAÇÕES FINAIS

Este capítulo apresentou conceitos básicos sobre segmentação de imagens digitais por

descontinuidade (segmentação orientada à contorno) e por similaridade (segmentação orientada à

região). Abordadas de forma resumida, as principais técnicas de segmentação foram classificadas

em sete grupos: técnicas de segmentação baseadas em filtragem local, técnicas de segmentação

baseadas em limiarização, técnicas de segmentação baseadas em crescimento de regiões, técnicas

de segmentação baseadas em divisão e fusão de regiões, técnicas de segmentação baseadas em

contornos ativos, técnicas de segmentação baseadas em morfologia matemática e técnicas de

segmentação baseadas em texturas. Esta classificação não pretende ser exaustiva, pois,

atualmente existe uma enorme variedade de técnicas de segmentação de imagens digitais.

3. TEXTURA

Este capítulo apresenta conceitos básicos sobre texturas. A primeira seção desenvolve uma

conceituação de textura e a segunda seção faz uma revisão das técnicas de segmentação baseadas

em texturas da literatura recente.

3.1 C

ONCEITO DE

EXTURA

Um fator de grande relevância na análise de imagens é o reconhecimento de texturas

(MANJUNATH et al., 2001). Este processo sofisticado, realizado intuitivamente pela visão

humana, apresenta grande complexidade computacional (GONZALEZ; WOODS, 2000). A

textura está presente na maioria das imagens naturais. Na figura 3.1 podemos observar alguns

exemplos. Através da análise de texturas é possível distinguir regiões que apresentam as mesmas

características de refletância, e portando, mesmas cores em determinada combinação de bandas.

Isso torna a textura um excelente descritor regional capaz de contribuir na melhoria do processo

de reconhecimento, descrição e classificação de imagens (CHOI et al., 2002).

FIGURA 3.1 - Exemplos de texturas naturais e artificiais

A textura é um termo intuitivo e de largo emprego, mas apesar de sua importância, não possui

uma definição precisa. Ela refere-se a um padrão visual que possui algumas propriedades de

homogeneidade que não resultam simplesmente de uma cor ou intensidade. Ao contrário de

outras características, como o brilho, a textura não pode ser definida em um pixel, mas sim,

através de uma região ou conjunto de pixels. É uma propriedade de uma região que descreve o

padrão de variação de tons de cinza e cor numa determinada área. A textura é uma expressão

relacionada com as propriedades que representam a superfície de um objeto (NUNES; CONCI,

2003d).

Na literatura encontram-se diversas definições de textura. Haralick, Shanmugan & Dinstein

(1973) relacionam a definição de textura com o uso de coeficientes de uniformidade, densidade,

aspereza, regularidade, intensidade, dentre outras características da imagem. Para Sklansky

(1978), uma região em uma imagem apresenta uma textura única, se um conjunto de

características estatísticas ou outras propriedades locais da imagem forem constantes ou

aproximadamente periódicas, com pouca variação. Sonka, Hlavac & Boyle (1999) definem a

textura como algo que consiste de elementos mutuamente relacionados (a primitiva de textura,

que pode ser um pixel ou um conjunto de pixels). Gonzalez & Wood (2000) descrevem a textura

por medidas que quantificam suas propriedades de suavidade, rugosidade e regularidade.

Sengur, Turkoglu & Ince (2006) definem a textura como um padrão estatístico local de

primitivas de textura no domínio de interesse. Estes autores definem textura como um conceito

bidimensional, onde uma dimensão contém as propriedades primitivas da tonalidade e a outra,

corresponde aos relacionamentos espaciais entre elas.

Apesar de não existir uma definição única e precisa, nem uma aproximação matemática formal

para a quantificação da textura, as definições, vistas anteriormente associam à textura a

impressão de rugosidade e contraste, criada pela variação tonal ou pela repetição de padrões

visuais sobre uma região (TUCERYAN; JAIN, 1993). Esses padrões podem ser o resultado de

propriedades físicas de acabamento da superfície do objeto (nível de polimento ou rugosidade),

ou ser o resultado de diferenças de reflexão tal como a cor ou material da superfície.

A textura se caracteriza pela repetição de um modelo (texton) sobre uma região. Este modelo

pode ser repetido de forma precisa ou com variações (randômicas ou não) e ruídos sobre um

mesmo tema. Tamanho, formato, cor e orientação dos elementos do modelo podem variar sobre

as regiões, caracterizando diversidade de padrões de uma textura. A variação, encontrada na

forma como os textons se relacionam, deve ser suficiente para diferenciar duas texturas. Uma

região precisa possuir um tamanho grande o suficiente para exibir sua textura. Assim, este

tamanho não pode ser pequeno, se comparado com um texton. A definição do texton talvez seja a

característica mais importante em um método de segmentação por textura, especialmente,

quando o texton pode aparecer em resoluções ou escalas diferentes e sua caracterização como

um diferencial ou não, depende do contexto.

Algumas propriedades da textura são indicadas na literatura. Haralick (1979) classifica as

texturas como fortes ou fracas, sendo mais fortes quanto maior a sua regularidade, ou seja, a

interdependência das primitivas de textura. Sonka, Hlavac & Boyle (1999), asseguram que a

descrição da textura é dependente de escala. Castleman (1996) afirma que as texturas são

quantificadas, avaliando-se aspectos relativos à variação de tons de cinza em seções contidas na

imagem.

A análise de textura tem por objetivo estabelecer o relacionamento de vizinhança dos elementos

de textura e seu posicionamento em relação aos demais (conectividade), o número de elementos

por unidade espacial (densidade) e a sua regularidade (homogeneidade). Geralmente a análise de

textura é utilizada para segmentação, descrição, classificação, caracterização do formato e

réplica. A segmentação visa a divisão de uma imagem em regiões com mesmo perfil textural. A

descrição considera a extração de características baseadas na quantificação de seu conteúdo de

textura para discriminação entre classes de objetos. A classificação tem por objetivo a rotulação

de uma região com determinada textura, com base em exemplos de texturas conhecidas. A

descrição da forma emprega a informação de textura para derivar a geometria de uma superfície

tri-dimensional. A réplica descreve uma textura para sua reprodução adequada.

3.2 R

EVISÃO TEÓRICA

Esta seção apresenta uma revisão das principais técnicas de análise de texturas publicadas

recentemente. Na literatura encontra-se uma grande variedade de técnicas para descrever

texturas. Nesta revisão essas técnicas foram agrupadas em abordagens estatísticas, abordagens

espectrais, abordagens baseadas em modelos, abordagens baseadas em filtragem, abordagens

baseadas em transformação de watershed, abordagens baseadas em análise de agrupamentos,

abordagens baseadas em características de cor/bordas/contornos, abordagens mistas e outras

abordagens.

3.2.1 Abordagens estatísticas

Na abordagem estatística, a textura é definida por um conjunto de medidas locais extraídas do

padrão. As abordagens estatísticas descrevem a textura através de grandezas que as caracterizam

como suave, áspera, granular, etc.

3.2.1.1 Técnicas baseadas em momentos

Paschos (2000) afirma que a maioria das aproximações recentemente apresentadas para análise

de texturas coloridas são baseadas num modelo matemático elaborado, incluindo auto-correlação

de cruzamento, campos aleatórios e filtros Gabor multi-canal. O autor considera que as

exigências computacionais destas aproximações são normalmente altas. Apresenta um método

efetivo e simples para classificação de texturas coloridas. O método proposto utiliza o modelo de

cor XYZ (definido pelo CIE) de uma imagem e um conjunto correspondente de momentos

bidimensionais e tridimensionais para caracterizar uma textura colorida dada. A cor é descrita

por sua forma bi-dimensional, ou seja, o diagrama de cromaticidade junto com a distribuição bi-

dimensional de valores de cromaticidade associada. Usando apenas um pequeno número de

momentos, o método alcança taxas elevadas ao ser aplicado no reconhecimento de granito e

imagens de mármore.

Dong-Gyu Sim, Hae-Kwang Kim & Rae-Hong Park (2004) apresentam um descritor efetivo de

textura invariante à translação, escala e rotação para aplicações de recuperação de imagem

baseadas em texturas. Para achar a distância de emparelhamento mínimo entre dois descritores,

existindo descritores de freqüência-plana, são requeridos muitos cálculos de distância com toda

combinação possível de valores de escala e rotação porque eles não são invariantes à

transformação geométrica. Para resolver este problema, um novo descritor compacto é proposto,

que é teoricamente invariante a tais transformações geométricas. O descritor proposto é obtido

calculando primeiro o espectro de poder de uma imagem de textura original para invariância à

translação e, então, a imagem de espectro de poder é normalizada para invariância à escala.

Finalmente, são calculados momentos de Zernike modificados para invariância à rotação. O

algoritmo proposto é mais simples que os algoritmos convencionais em termos de complexidade

computacional. Os autores demonstram a efetividade do descritor proposto para recuperação de

textura invariante com vários conjuntos de texturas, comparando a precisão da recuperação com

os resultados obtidos com descritores convencionais.

3.2.1.2 Técnicas baseadas em análise de histograma

Para Ojala, Valkealahti & Pietikäinem (2001) as estatísticas de diferenças de cinza-nível foram

prosperamente usadas em vários estudos de análise de textura. Assim, propõem a utilização de

diferenças de nível-cinza e suas distribuições multidimensionais para descrição de textura.

Experiências com classificação de texturas complexas e segmentação supervisionada de textura

são apresentadas demonstrando que a aproximação proposta proporciona um desempenho muito

bom e robusto quando comparados com paradigmas populares como matrizes de co-ocorrência,

modelo de campo aleatório Gaussiano de Markov ou filtros Gabor.

Ojala, Pietikäinem & Mäenpää (2002) propõem um método baseado no reconhecimento de

certos padrões binários locais (local binary patterns), chamados “uniformes”. Estes padrões são

propriedades fundamentais da textura de imagem local e seu histograma de ocorrência evidencia

ser um potente descritor de textura. Os autores derivaram um operador invariante à rotação em

escala de cinza generalizada, que permite detectar os “padrões uniformes” em qualquer

quantização do espaço angular e para qualquer resolução espacial, além de apresentar um

método para combinar operadores múltiplos para análise multi-resolução.

Ginneken & Romeny (2003) generalizam imagens de desordem local (locally orderless images),

considerando histogramas locais de uma coleção de versões filtradas da imagem, estendendo-as

para unir às distribuições de probabilidade. Imagens de desordem local são famílias de três

espaços de escala entrelaçados que descrevem histogramas locais. Estas construções podem ser

usadas para derivar características de textura e são usadas por serem uma descrição mais geral de

dois métodos estabelecidos de classificação de textura: banco de filtros e matrizes de co-

ocorrência. Como todos os parâmetros de escala são estabelecidos explicitamente nesta

formulação, conjuntos de características de multi-resolução podem ser extraídos num modo

sistemático. Isto inclui novos tipos de análise multi-resolução, não somente baseado na escala

espacial, mas também no tamanho de janela e na escala de intensidade. Cada aproximação de

multi-resolução melhora o desempenho da classificação de textura. O melhor resultado é obtido

se uma aproximação de multi-resolução para todos os parâmetros de escala for usado. Isto é

demonstrado experimentalmente em um grande conjunto de dados com 1152 imagens e 72

classes de texturas.

Paschos & Petrou (2003) apresentam um método de classificação de textura colorida que utiliza

características extraídas do histograma de cor. Combinando pares de caixas e computando

proporções de contagens correspondentes, são criadas características de proporções que

caracterizam uma determinada textura colorida baseada em auto-correlação. É relatada a

obtenção de melhores resultados empregando o método proposto, quando comparados com os

resultados alcançados com o método de histograma de cor tradicional.

Jie Zhou, Leping Xin & David Zhang (2003) definem um histograma (Scale-orientation

histogram) para analisar o “direcionamento” e a “periodicidade”, duas das mais importantes

dimensões de determinação de textura em percepção humana. Este histograma é aplicado à

recuperação de textura em estudo de caso e os resultados experimentais ilustram sua efetividade.

Pietikäinen et al. (2004) propõem um novo método para reconhecer superfícies texturizadas 3D.

As texturas são modeladas com múltiplos histogramas de micro-textons, em vez de macro-

textons usados em estudos anteriores. Os micro-textons são extraídos através de um operador de

padrão binário de multi-resolução local (multiresolution local binary pattern operator). A

aproximação dos autores tem muitas vantagens se comparadas às aproximações anteriores e

provê o desempenho principal na classificação de texturas do banco de imagens de Columbia-

Utrecht, sob diversos pontos de visualização e diferentes direções de iluminação. Também provê

muitos resultados promissores na classificação de imagens de cena ao ar livre.

Montiel, Aguado & Nixon (2005) utilizam uma estratégia de discriminação não-paramétrica

baseada em características de textura caracterizadas por histogramas condicionais

unidimensionais. A proposta estende prévios esquemas de código de matriz de co-ocorrência,

considerando uma mistura de cor e informação contextual obtida de imagens binárias. Os autores

calculam distribuições em comum para identificar regiões representadas por pixels com

intensidade ou cor semelhantes. A motivação principal é obter uma caracterização compacta

satisfatória para aplicações que requerem treinamento on-line.

Heikkila & Pietikäinen (2006) usa um moderno e eficiente método baseado em textura para

modelar o fundo e detectar o movimento de objetos de uma seqüência de vídeo. Cada pixel é

modelado como um grupo de histogramas local de padrões binários adaptáveis (adaptive local

binary pattern histograms) que são calculados sobre uma região circular ao redor do pixel.

Segundo os autores, a aproximação proporciona muitas vantagens se comparadas ao estado-da-

arte. Resultados experimentais são apresentados para ilustrar a aplicabilidade do modelo

proposto.

3.2.1.3 Técnicas baseadas em matrizes de co-ocorrência

Al-Janobi (2001) apresenta um novo método de análise de textura que incorpora as propriedades

locais da matriz de co-ocorrência de nível- cinza (Gray-Level Co-occurrence Matrix - GLCM) e

métodos de espectro de textura (Texture Spectrum -

TS). As características de co-ocorrência

extraídas da matriz de textura em cruz diagonal provêm completa informação de textura sobre

uma imagem. O autor avalia o desempenho destas características separando os aspectos de

textura de imagens pictóricas. As características texturais do GLCM e TS foram comparadas

separando algumas das imagens de texturas naturais das fotos de textura de Brodatz.

Palm (2004) introduz matrizes de co-ocorrência integrativas como modernas características de

classificação de texturas coloridas. A notação estendida de co-ocorrência permite a comparação

entre os conceitos paralelos e integrados de textura e cor. O ganho de informação das novas

matrizes é comprovado quantitativamente através da distância de Kolmogorov e por experiências

de classificação extensas em dois conjuntos de dados. Aplicando-os ao espaço de cor RGB e

LUV, é estudada a combinação de cor e texturas sendo demonstrada a existência de padrões de

cores puras de intensidades independentes.

3.2.1.4 Técnicas baseadas em funções de auto-correlação

Em Suen & Healey (2000), a textura da imagem observada para uma superfície áspera tem uma

dependência complexa na iluminação e ângulos de visão devido aos efeitos distorção,

sombreamento local, inter-reflexões, sombreamento e oclusão dos elementos de superfície. Os

autores introduzem a dimensionalidade da superfície como uma representação da complexidade

visual de uma amostra de material. A dimensionalidade da superfície define o número de

texturas de bases que são requeridas para representar as texturas observadas para uma amostra,

como uma função de faixas de iluminação e ângulos de visão. Texturas de base são

representadas usando funções de correlação multibanda que consideram ambos, dentro e entre,

correlações de bandas de cor. Os autores examinam as propriedades da superfície de

dimensionalidade para materiais reais usando o banco de imagens Columbia Utrecht Reflectance

and Texture (CUReT). É demonstrado que o uso da informação de cor provê vantagens

significativas no reconhecimento de textura tridimensional.

Brochard, Khoudeir & Augereau (2001) apresenta um método para extração de características

invariantes em imagens texturizadas que sofre transformações afins, usando transformação da

função de auto-correlação (Autocorrelation Function - ACF), seguido por determinação de um

critério de invariância que é a soma dos coeficientes da matriz de correlação discreta.

Çarkacıoglu & Yarman-Vural (2003) apresentam um descritor de textura genérico (Statistical

Analysis of Structural Information - SASI) para representação de textura. O SASI está baseado

em estatísticas de coeficientes de auto-correlação de um grupo exclusivo, calculadas sobre

janelas de estruturas. SASI define um conjunto de janelas de grupo exclusivo para extrair e

medir várias propriedades estruturais de textura usando multi-resolução espacial.

Campisi et al. (2004 e 2006) apresentam um modelo baseado em procedimento de classificação

de textura. A textura é modelada como a produção de um sistema linear que considera uma

excitação binária que retém as características morfológicas de textura. A textura é especificada

por sua função de auto-correlação (Autocorrelation Function - ACF). Os autores demonstram

que as características extraídas da função de auto-correlação espacial da excitação binária, são

suficientes para representar a textura com propósitos de classificação. Técnicas baseadas em

momentos invariantes são empregadas para classificar a ACF.

3.2.1.5 Técnicas baseadas em modelos Gaussianos

Comer & Delp (2000) apresentam novos resultados relativos ao algoritmo para estimativa de

parâmetros simultâneos e segmentação de texturas em imagens (“Expectation-

Maximization/Maximization of the Posterior Marginals” - EM/MPM). O algoritmo de EM/MPM

usa um modelo de campo aleatório Gaussiano de Markov para os rótulos da classe de pixel e

alternadamente aproxima a estimativa de MPM dos rótulos de classe de pixel e calcula os

parâmetros do modelo de imagem observado. A meta do algoritmo de EM/MPM é minimizar o

valor esperado do número de pixels classificados erroneamente.

Çesmeli & Wang (2001) propõem um método composto de duas partes. A primeira parte

determina um moderno conjunto de características de texturas derivadas de um modelo de campo

aleatório Gaussiano de Markov (Gaussian–Markov Random Fields -

GMRF). Ao contrário da

aproximação baseada em um GMRF, este método não emprega os modelos de parâmetros como

características, nem requer a extração das características para um conjunto fixo de tipos de

textura a priori. A segunda parte é um vetor bidimensional de rede localmente excitatória e

globalmente inibitória (Locally Excitatory Globally Inhibitory Oscillator Networks - LEGION).

Após a filtragem para a supressão de ruídos, as características são usadas para determinar os

acoplamentos locais na rede. Quando LEGION funciona, os osciladores que correspondem à

mesma textura tendem a se sincronizar onde as regiões de diferentes texturas tendem a

corresponder à fases distintas.

Xiangyu Yang & Jun Liu (2001) utilizam um método não supervisionado de segmentação de

textura com o algoritmo de mudança média de um-passo (one-step mean shift algorithm

)

e o

contorno de campo aleatório Gaussiano de Markov (boundary Markov random field

)

. Para os

modelos de mistura Gaussiana, a mudança em média de um-passo é capaz de determinar os

pontos de limite que separam os componentes de distribuição Gaussiana vizinhos nos

histogramas. O algoritmo de mudança em média um-passo é capaz de prover um resultado

grosseiro de segmentação baseado no histograma da imagem. Para melhorar o resultado da

segmentação com restrições de suavidade, o contorno de campo aleatório Gaussiano de Markov

é introduzido. No contorno de campo aleatório Gaussiano de Markov, a distribuição logística

multinível (Multilevel Logistic Distribution - MLL) é empregada com a finalidade de suavizar

regiões com suas características de forma de região, e a informação de borda é acrescentada à

função de energia da distribuição DLL para preservar a descontinuidade das bordas.

Xiangyu Yang & Jun Liu (2002) usam um modelo de textura moderno chamado entropia

máxima do campo aleatório (Maximum Entropy Random Field - MERF). O MERF é um campo

aleatório construído com filtros de multi-resolução utilizando o método de entropia máxima

(Maximum Entropy

ME). Junto com sua distribuição de probabilidade, o MERF pode ser

considerado como uma distribuição de Gibbs. Os filtros de multi-resolução fazem um papel

central no MERF: eles definem a função potencial na distribuição de Gibbs do campo aleatório,

e eles podem ser usados para extrair características de textura em várias orientações e escalas. Os

experimentos de síntese de textura ilustram a utilização do MERF para descrever texturas. Os

experimentos de recuperação de textura comparam características baseadas no MERF com

características baseadas nos filtros Gabor e as características baseadas em multi-resolução auto-

regressiva, usando o banco de texturas de Brodatz. Os resultados indicam que as características

de MERF provêem a melhor precisão de recuperação de padrão.

Ozyildiz, Krahnstöver & Sharma (2002) apresentam uma formulação para fundir textura e cor

com a meta de localizar objetos em tempo real de uma maneira que torna a segmentação

confiável e com custo computacional baixo. Um campo aleatório auto binomial de Gibbs

Markov é usado para modelar a textura e uma distribuição Gaussiana 2D é usada para modelar a

cor. Isto permite uma fusão da probabilidade da textura e cor para adaptar a textura e a cor com o

passar do tempo, visando a localização de alvos móveis.

Em Te-Won Lee & Lewicki (2002), um algoritmo de classificação não supervisionado é

derivado por modelagem de dados observados com uma mistura de várias classes mutuamente

exclusivas que são descritas cada uma por combinações lineares independentes (densidades não-

Gaussianas). O algoritmo calcula a densidade de dados em cada classe usando funções

paramétricas não lineares que se ajustam à estrutura não-Gaussiana dos dados. Isto melhora a

precisão da classificação quando comparado com o padrão de modelos de misturas Gaussianas.

Quando aplicado à imagens, o algoritmo pode aprender códigos eficientes (funções de base) para

imagens que capturam estatísticamente a estrutura intrínsica significante das imagens. Esta

técnica é aplicada ao problema de classificação não supervisionada, segmentação e filtragem de

imagens. Os autores demonstram que este método foi efetivo na classificação de texturas de

imagem complexas, como cenas naturais e de texto, e na redução de ruídos e preenchimento de

pixels perdidos em imagens com estruturas complexas. Para os autores, a vantagem deste modelo

está no fato de que os códigos da imagem podem ser aprendidos com o aumento do número de

classes (o que provê maior flexibilidade na estrutura modelada) e por encontrar mais

características da imagem do que os modelos de mistura Gaussiana ou os algoritmos ICA

(standard independent component analysis).

Kato & Ting-Chuen Pong (2006) propõem um modelo de segmentação de imagem de campo

aleatório Gaussiano de Markov com objetivo de combinar características de cor e textura. O

sistema teórico depende da estimativa Bayesiana por otimização combinatória (com o método

simulated annealing). A segmentação é obtida pela classificação dos pixels em classes de pixels

diferentes. Estas classes são representadas através de distribuições Gaussianas multi-variadas. A

única hipótese sobre a natureza das características é que, um modelo de ruído aditivo Gaussiano

é satisfatório para descrever a distribuição de característica que pertence a uma determinada

classe. Os autores usam o modelo de cor CIE-L*u*v * perceptualmente uniformes como

características de cor e um conjunto de filtros Gabor como características de textura.

Tzagkarakis, Beferull-Lozano & Tsakalides (2006) apresentam um esquema de recuperação de

imagem invariante à rotação baseado na transformação da informação da textura por uma

pirâmide dirigível. Primeiro, os autores ajustaram a distribuição dos coeficientes de sub-banda

usando um modelo sub-Gaussiano alfa-estável (alpha-stable sub-Gaussian model) para capturar

seus comportamentos não Gaussianos. Então, os autores aplicaram um processo de normalização

em ordem para tornar os coeficientes Gaussianos. Como resultado, o passo de extração de

características consiste em calcular as covariâncias entre os coeficientes de pirâmide

normalizada. A semelhança entre duas imagens de texturas distintas é medida minimizando uma

versão invariante à rotação da divergência de Kullback-Leibler entre suas correspondentes

distribuições Gaussiana multi-variadas, onde a minimização é executada sobre um conjunto de

ângulos de rotação.

3.2.1.6 Técnicas baseadas em classificação bayesiana

Yong Huang, Kap Luk Chan & Zhihua Zhang (2003) propõem um método de classificação de

texturas baseado na integração de características multi-modelo através de redes Bayesianas.

Considerando que muitas texturas de imagem exibem propriedades estruturais e estatísticas, dois

conjuntos de características baseados em dois modelos de textura (modelo Gabor e modelo de

Campo Aleatório Gaussiano de Markov) são usados para descrever as propriedades de imagem

em estrutura e em estatísticas. Então, um classificador de redes Bayesianas é usado para

combinar estes dois conjuntos de características junto com suas medidas de confiança individual

para classificação de textura.

Lipowezky (2006) apresenta uma nova aproximação para a cor à imagens aéreas ou espaciais em

escala de cinza. O método proposto está baseado em uma premissa simples: texturas semelhantes

deveriam ter distribuições de cor semelhantes. Esta premissa é formalizada usando classificação

de textura Bayesiana de imagens de escala cinza (destino) com um conjunto de protótipos

texturais para imagens coloridas (fonte).

3.2.2 Abordagens espectrais

A abordagem espectral baseia-se em propriedades do espectro de Fourier, sendo principalmente

utilizadas na detecção de periodicidade global, através da identificação de picos de alta energia

no espectro da imagem.

Tao-I. Hsu, Jiann Ling Kuo, & Wilson (2000) descrevem um algoritmo de segmentação de

textura que foi projetado usando um algoritmo cooperativo dentro da estrutura da Transformada

de Fourier Multi-Resolução (Multiresolution Fourier Transform - MFT). O espectro de

magnitude da MFT é empregado como espaço de característica em que a detecção dos limites da

textura é calculado por meio da combinação de informação de borda e propriedades de região.

Um pré-processamento de suavização é aplicado, primeiro às magnitudes de MFT para reduzir

as flutuações de textura, seguido pelo operador Sobel, executado nas magnitudes da MFT para

dar uma estimativa de limite de textura. O refinamento da estimativa do limite é realizado

utilizando probabilidades de ligação de limite e probabilidade de ligação de região de uma

maneira interativa. Os autores apresentam os resultados obtidos com várias texturas sintéticas e

naturais que ilustram a efetividade do esquema.

Frye & Ledley (2000) avaliam que muitas das numerosas medidas de textura estão baseadas em

decomposição do sinal de espaço-freqüência; estes incluem filtros Gabor e métodos baseados em

wavelet. A transformada discreta de cosseno (Discrete Cosine Transformation -

DCT) extrai

componentes de freqüência espacial (spatial-frequency

SF) de uma região de imagem local.

Usando DCT, os autores derivam uma representação de SF para uma região de interesse (Region

Of Interest

ROI) cercando cada pixel da imagem. Também demonstram que os coeficientes de

DCT podem representar um SF como uma combinação de vários coeficientes de DCT,

dependendo da liberdade máxima da forma de onda SF para o começo da ROI. São apresentados

exemplos que mostram como este DCT insensível à mudança (DCT Shift-Insensitive - DCTSIS)

pode ser usado como um descritor visando classificar regiões de textura de imagens.

3.2.3 Abordagens baseadas em modelos

As abordagens baseadas em modelos utilizam o conceito de dimensão fractal para quantificar a

densidade dos fractais no espaço métrico em que são definidas e, assim, determinar a rugosidade

de uma textura.

Conci & Nunes, 2001; Nunes, 2001; Nunes & Conci, 2001, 2003c, 2003d e 2003e propõem o

método CDC (Contagem de D-Cubos) para determinar à dimensão fractal de texturas em

imagens multidimensionais. O método é uma extensão dos conceitos expostos pelo método

MDBC (Differencial Box Couting Modified), com a vantagem de permitir o cálculo da dimensão

fractal de imagens de qualquer dimensão.

Kasparis et al. (2001) propõem uma nova aproximação à segmentação de imagens em escala de

cinza texturizadas baseada em imagem pré-filtrada e características fractais. Tradicionalmente,

os métodos de decomposição do banco de filtros consideram a energia em cada faixa como

característica textural, parâmetro este que é altamente dependente na intensidade da imagem. Os

autores usam características baseadas em fractais que dependem mais de características texturais,

ao invés de informação de intensidade. Para reduzir o número total de características usadas na

segmentação, a significação de cada característica é examinada e as características menos

significantes não são utilizadas no processo de agrupamento. O algoritmo K-means, comumente

usado, é estendido a um K-means interativo através de uma janela de tamanho variável que

preserva detalhes de limite. O número de agrupamentos que usam uma aproximação hierárquica

melhorada e que ignora a informação ao redor das bordas da região é calculado.

Charalampidis & Kasparis (2002) introduzem um conjunto de características invariantes à

rotação para segmentação e classificação de textura baseado na extensão das características de

dimensão fractal (Fractal Dimension - FD). A FD extrai informação de aspereza das imagens,

considerando todas as escalas disponíveis de uma vez. Os autores consideram uma única escala

de cada vez, de forma que texturas com propriedades dependentes de escala são caracterizadas

satisfatoriamente. Características de escala única são combinadas com características de escala

múltipla para uma representação textural mais completa. São empregados wavelets para a

computação de características aproximadas de escala única e múltipla, por causa de sua

habilidade para extrair informação para resoluções diferentes. As características são extraídas em

direções múltiplas usando wavelets direcional, e o vetor de característica é finalmente

transformado para um vetor de características invariantes à rotação que retém a informação

direcional da textura. Um algoritmo K-means interativo é usado para segmentação. Uma forma

simplificada de um classificador Bayesiano é usado para classificação. O uso do conjunto de

característica de aspereza resulta em desempenho de segmentação de alta qualidade. Além disso,

é mostrado que o conjunto de características de aspereza exibe uma taxa de classificação mais

alta que outros vetores de característica apresentados no trabalho dos autores.

Novianto, Suzuki & Maeda (2003) apresentam um algoritmo para calcular a dimensão fractal

local (local fractal dimension - LFD) de imagens texturizadas. O algoritmo é estabelecido por

uma aproximação experimental baseada no método do cobertor (blanket method). O método

proposto usa o próximo número ótimo de cobertores para obter o LFD para uma pequena janela

local. A robustez do método proposto para calcular o LFD que utiliza uma janela local de 3×3

pixels é confirmada através de avaliações experimentais. O LFD é utilizado em um algoritmo de

segmentação de imagem que demonstra a capacidade da segmentação áspera de boas regiões de

texturas em imagens naturais.

Para Yong Xia, Dagan Feng & Rongchun Zhao (2006) a Análise Multifractal está ficando

mais popular em comunidades de segmentação de imagem na qual a estimativa da dimensão

multifractal, baseada em contagem de caixas (box-counting), são comumente usadas. Porém,

apesar de sua eficiência computational, o esquema de partição regular usado por vários métodos

intrínsecos de contagem de caixa, produz resultados menos precisos. Os autores propõem um

algoritmo para estimar a dimensão multifractal baseado na morfologia matemática e em um

conjunto de novos descritores multifractais, nomeados Local Morphological Multifractal

Exponents. Estes descritores são definidos para caracterizar as propriedades de escalas locais de

texturas. É utilizada uma série de elementos de estruturas cúbicas e um esquema de dilatação

interativa, de forma que a complexidade computacional das operações morfológicas podem ser

tremendamente reduzida. O algoritmo proposto e os métodos baseados em contagem de caixa

tem sido aplicados à segmentação de mosaicos de textura e imagens reais. Os resultados

comparativos demonstram que a estimação da dimensão multifractal morfológica pode

diferenciar imagens de textura mais efetivamente e pode prover segmentações mais robustas.

3.2.4 Abordagens baseadas em filtragens

As abordagens baseadas em filtragens utilizam filtros multi-resolução para modelar a textura no

domínio da freqüência espacial.

3.2.4.1 Técnicas baseadas em análise de componente

Jenssen & Eltoft (2003) apresentam a Análise de Componente Independente (Independent

Component Analysis - ICA) de imagens texturizadas como uma técnica computacional para criar

um novo banco de dados de filtros para segmentação de textura. Os autores demonstram que os

filtros de ICA podem capturar as propriedades inerentes das imagens texturizadas. Os novos

filtros são semelhantes aos filtros Gabor, mas parecem ser mais ricos no sentido de que suas

respostas de freqüência podem ser mais complexas. Estas propriedades permitem usar o banco

de filtros ICA para criar características de energia visando à segmentação efetiva de texturas.

Chengjun Liu & Wechsler

(2001) introduzem uma nova codificação de face e método de

reconhecimento, o classificador EFC (Enhanced Fisher Classifier) que emprega o modelo EFM

(Enhanced Fisher linear discriminant Model) em forma integrada e características de textura. A

forma codifica as características geométricas de uma face, enquanto a textura provê uma imagem

normalizada de forma-livre. Primeiramente, as dimensionalidades da forma e dos espaços de

textura são reduzidas usando análise de componente principal (principal component analysis)

restringida pelo EFM para generalização realçada (enhanced generalization). Então, a forma

reduzida e as características de textura correspondentes são combinadas através de um

procedimento de normalização para formar as características integradas que serão processadas

pelo EFM para reconhecimento de face.

3.2.4.2 Técnicas baseadas em filtros gabor

Clausi & Ed Jernigan (2000) apresentam uma abrangente classificação e comparação de

diferentes técnicas de segmentação usadas para produzir características de textura através de

filtros Gabor. Estas técnicas são baseadas em implementações já existentes e em métodos

inovadores. Os autores consideram a caracterização funcional dos filtros e a extração de

características, baseada nas saídas produzidas pelo filtro puro.

Paschos (2001) compara os modelos RGB, L*a*b * e HSV em função de suas efetividades para

análise de textura colorida. Para o autor, um crescente número de trabalhos tem demonstrado que

a utilização de informação de cor em análise de textura pode ser muito importante e benéfica

para esquemas de reconhecimento. A metodologia apresentada utiliza uma família de filtros

Gabor especialmente voltada para medir orientações e tamanhos específicos de cada textura

colorida. A performance de classificação de cada espaço de cor é efetivamente medida. O autor

apresenta os resultados experimentais obtidos com uma variedade de imagens de textura

colorida.

Grigorescu, Petkov & Kruizinga (2002) comparam características de texturas, baseadas no

espectro de energia local, obtidas por um banco de filtros Gabor. As características diferem no

tipo de pós-processamento não linear que é aplicado ao espectro de energia local. As seguintes

características foram consideradas: energia Gabor, momentos complexos e características do

operador de célula de grade (grating cell operator features). O critério Pescador (Fisher

criterion) e a comparação dos resultados da classificação foram métodos utilizados para

comparar a capacidade dos operadores em produzir agrupamentos de vetores de características

distintas para texturas diferentes.

Huawu Deng; Kap Luk Chan & Jun Liu (2003) aplicam a equação Poisson ao modelo de

texturas de imagem, construindo funções de fonte de calor específica e condições de bordas. A

equação Poisson é uma classe de equações diferenciais parciais que descrevem uma distribuição

de temperatura de estado-sólido em um objeto limitado. A função de fonte de calor pode ser

considerada como uma função de transformação de imagem tal que, um conjunto de

características de textura para diferentes freqüências e orientações possa ser extraído da imagem

transformada junto com o uso de um banco de filtros wavelet de Gabor. Este conjunto de

características permite um desempenho melhor na recuperação da textura da imagem, do que o

alcançado quando se utiliza às características obtidas diretamente da textura da imagem original.

Manthalkar, Biswas & Chatter (2003b) utilizam características de textura invariantes à rotação

derivadas do filtro simétrico Gabor aplicado em imagens de textura. A característica usada é

modificada pela média do desvio absoluto mínimo. São classificadas 60 texturas de Brodatz

giradas em 12 direções diferentes. Um número igual de amostras é usado durante a fase de

treinamento e teste. Os autores demonstram os resultados obtidos na segmentação de imagens de

textura (com texturas giradas), utilizando estas características.

Clausi & Huang Deng (2005) apresenta um método para melhorar o reconhecimento de textura,

baseado na combinação de filtro Gabor e características de probabilidade de co-ocorrência de

nível cinza (Grey Level Co-occurrence Probability - GLCP). O conjunto de características

combinadas utiliza a capacidade do filtro Gabor de capturar com precisão a informação de

textura de baixa e média freqüência e a capacidade do GLCP na informação de textura de alta

freqüência. Os métodos de avaliação incluem a comparação do espaço de características

separadamente e a comparação das taxas de classificação da imagem segmentada. É

demonstrado que a utilização dos conjuntos de características combinadas produzem uma melhor

separação do espaço de características, como também, uma melhor precisão na segmentação,

quando comparados com os resultados obtidos com os conjuntos de características separadas.

Chen Sagiv, Sochen & Zeevi (2006) aplicam filtros Gabor voltados para um conjunto de

orientações, escalas e freqüências de uma imagem para criar o espaço da característica Gabor.

Um distribuidor bidimencional em uma variedade Riemanniana de características locais é

extraído através de um mecanismo difusor de base Beltrami, considerando algoritmos de

segmentação de texturas por contornos ativos.

3.2.4.3 Técnicas baseadas em transformação wavelet

Para Angel & Morris (2000) analisar cenas naturais é difícil quando características de textura e

contorno estão presentes. O problema de construir modelos de contornos satisfatórios de tais

imagens é composto, dado os resultados de segmentação de região de textura em localização

pobre das bordas e representações de bordas multiescala, que não podem sempre separar

características de contornos salientes da desordem textural irrelevante. Para superar estes

problemas, os autores apresentam um moderno algoritmo que primeiramente cria uma

representação da borda multiescala, usando a transformação wavelet de Mallat e, então,

recombina o mapa de borda para cada escala para criar um único mapa de contorno, onde a

desordem textural é minimizada. A seguir, este algoritmo é aplicado em imagens naturais e

sintéticas que contêm características de contorno para diferentes escalas espaciais e texturas com

variados espaços de freqüência e orientação. Os resultados mostram que as características

texturais e o contorno podem ser separados para cada escala, e o mapa de contorno resultante

serve como uma representação mais efetiva, na qual a localização subseqüente e as tarefas de

reconhecimento são baseadas.

Para Hsi-Chia Hsin (2000) a transformada wavelet (packet) tem sido extensamente usada para

análise de textura. Porém, as características extraídas de texturas semelhantes com orientações

simétricas são indistinguíveis. O autor desenvolve a chamada transformada wavelet (packet)

modulada, que pode ser implementada eficazmente pelos algoritmos estruturados de pirâmide

(árvore) convencional. O desempenho desta nova transformada é demonstrado na segmentação

de texturas do banco de texturas de Brodatz em uma imagem aérea de São Francisco.

Choi & Baraniuk (2001) introduzem um novo algoritmo de segmentação de textura de imagem,

HMTseg, baseado em wavelets e o modelo de árvore escondida Markov (hidden Markov tree

model - HMT). O HMT é um gráfico probabilístico de árvore-estruturada que captura as

propriedades estatísticas dos coeficientes da transformada de wavelet . Desde que o HMT é

particularmente bem adequado às imagens que contêm singularidades (bordas e cumes), ele

provê um bom classificador para distinguir entre texturas. Utilizando a estrutura de árvore

inerente do HMT de wavelet e seu rápido treinamento e algoritmos de computação de

probabilidade, os autores executam a classificação de textura para uma gama de escalas

diferentes. Então, fundem estas classificações de multiscala usando um gráfico probabilistico

Bayesiano para obter segmentações finais confiáveis.

Noda, Shirazi & Kawaguchi (2002) motivados pela não redundância seletivamente direcional e

de natureza altamente discriminativa da representação de wavelet, apresentam um algoritmo de

segmentação de imagem texturizada não supervisionada, baseado em um modelo estocástico

multiscala que modela sobre a decomposição de wavelet da imagem. O modelo, usa campos

aleatórios de Markov estocástico, captura dependências estatísticas de intra-escala sobre a

imagem decomposta de wavelet, além das dependências de inter-escala e intra-escala sobre a

imagem de região de multi-resolução correspondente.

Do & Vetterli (2002) tratam de uma visão estatística do problema de recuperação de textura

combinando as duas tarefas relacionadas, isto é, a extração de características (Feature Extraction

- FE) e medida de semelhança (Similarity Measurement - SM), em conjunto com um esquema de

modelagem e classificação. Os autores afirmam que utilizar um estimador consistente de

parâmetros de modelo de textura para o passo FE, seguido de computar a distância Kullback-

Leibler (KLD) entre modelos calculados para o passo SM, é assintoticamente ótimo em termos

de probabilidade de erro de recuperação. O esquema estatístico conduz a um novo método de

recuperação de textura baseado em wavelet, que está fundamentado na modelagem precisa da

distribuição marginal de coeficientes wavelet usando densidade Gaussiana generalizada

(Generalized Gaussian Density - GGD) e na existência uma forma fechada para o KLD entre

GGDs. O método proposto provê maior precisão e flexibilidade em capturar informação de

textura, enquanto sua forma simplificada tem uma semelhança íntima com os métodos existentes

que usam distribuição de energia no domínio de freqüência para identificar texturas. Resultados

experimentais em um banco de dados de 640 imagens de textura indicam que o novo método

melhora significativamente as taxas de recuperação se comparado com aproximações

tradicionais, enquanto retém níveis semelhantes de complexidade computacional.

Huang & Dai (2003) apresentam um eficiente sistema de recuperação de imagem com alto

desempenho de precisão, baseado em duas modernas características: o vetor de declive de sub-

banda composto (composite sub-band gradient vector) e o string padrão de distribuição de

energia (energy distribution pattern string). Ambas as características são geradas das sub-

imagens de uma decomposição de wavelet da imagem original. Um mecanismo fuzzy baseado

em strings padrão de distribuição de energia, serve como um filtro para rapidamente remover

imagens não desejadas no banco de dados de consideração adicional. As imagens passadas no

filtro são comparadas com a imagem em questão, baseado em vetores de declive de sub-banda

compostos, que são extremamente poderosos para separar texturas detalhadas.

Manthalkar, Biswas & Chatterji (2003a) propõem moderna rotação e características de escala

invariante usando transformada wavelet packet discreta. O desempenho de classificação é

testado em um conjunto de 15 texturas do banco de texturas de Brodatz giradas em 12 direções e

para cinco escalas que cruzam uma oitava. É testado o desempenho de classificação para

diferentes bancos de filtro wavelet, para a rotação proposta e características de escala invariante.

Uma aplicação destas características para identificação de manuscrito é ilustrada.

Bashar, Matsumoto & Ohnishi (2003) abordam uma aproximação baseada na transformada

wavelet discreta e conceito de escala espacial. A estrutura de imagens de desordem local (Locally

Orderless Images - LOIs) são integrados com os coeficientes de transformada para obter um

método flexível para segmentação de textura. Comparado à intensidade (domínio de espaço), os

coeficientes wavelet parecem ser mais confiáveis com respeito à imunidade de ruído e à

facilidade de formação de característica. Conseqüentemente, os autores representam cada valor

de coeficiente discreto como uma função de densidade de probabilidade para formar imagens

isophote. Cada imagem isophote é então envolvida com um Gaussiano para formar LOIs que

especificam um histograma local em cada ponto de transformada. Este LOIs, ou momentos

estatísticos computados de LOIs, podem ser considerados como características de textura. Uma

experiência com os bancos de dados do padrão de textura Brodatz e VisTex demonstram o

desempenho superior do LOIs, baseado em wavelet comparado aos momentos baseados em LOI

convencionais ou características de energia wavelet e Gabor. A elegância da aproximação está na

maior flexibilidade em produzir resultados de segmentação. Um simples classificador de

distância mínima e a análise da matriz de confusão confirmam os atributos acima.

Aujol, Aubert & Blanc-Feraud (2003)

apresentam um modelo de classificação supervisionada

baseado em uma aproximação de variação. Este modelo é especificamente dedicado às imagens

texturizadas. O objetivo dos autores é adquirir uma partição de uma imagem, composta de

regiões de textura separadas por interfaces regulares. Cada tipo de textura define uma classe.

Uma transformada wavelet packet é usada para analisar as texturas, caracterizadas pela sua

distribuição de energia em cada sub-banda. Para segmentar uma imagem de acordo com as

classes, as regiões e suas interfaces são modeladas, através de funções de conjunto de níveis. Os

autores formulam uma função nestes conjuntos de níveis, cuja minimização define a

classificação ótima de acordo com a textura. Um sistema de PDEs acoplados é deduzido da

função. Resolvendo este sistema, cada região evolui de acordo com seus coeficientes de wavelet

e interage com as regiões vizinhas em ordem, para obter uma partição com contornos regulares.

São mostradas experiências em imagens sintéticas e reais.

Chi-Man Pun (2003) sugere uma efetiva característica de textura invariante à rotação wavelet

polar para recuperação de imagem. O processo de extração de característica envolve uma

transformada polar seguido por uma adaptável transformada wavelet packet invariante à troca da

fila. A transformada polar converte uma determinada imagem em invariante à rotação, exceto a

imagem de fila-trocada. Esta é passada por uma adaptável transformada wavelet packet

invariante à troca da fila, a fim de gerar algumas sub-bandas de coeficientes wavelet invariante à

rotação, com respeito à uma função de custo de informação. Uma assinatura de energia é

computada para cada sub-banda destes coeficientes wavelet. Para reduzir dimensionalidade de

característica, somente as assinaturas de energia wavelet polar mais dominantes são selecionadas

como vetor de característica para recuperação de imagem. Todo o processo de extração de

característica é bastante eficiente e envolve somente complexidade O(n·logn). Resultados

experimentais mostram que esta característica de textura invariante à rotação é efetiva e supera

os outros algoritmos de recuperação de imagem.

Para Qing Xu, Jie Yang & Siyi Ding (2005), o modelo WD HMM (wavelet-domain hidden

Markov model), em particular o HMT (hidden Markov tree) tem alcançado resultados

encorajadores na análise de textura em escala de cinza. Para análise de textura colorida, o

modelo WD HMM (wavelet-domínio Markov escondido modelam) pode ser usado somente para

modelar individualmente planos de cor diferentes, assumindo que eles são independentes uns dos

outros. Porém, esta suposição geral não é realista. Os autores mostram que os coeficientes de

wavelet têm certas interdependências entre planos de cor. Assim, apresentam uma moderna

aproximação para modelar as dependências entre planos de cor, bem como as escalas de

interações cruzadas. Na aproximação proposta, os coeficientes de wavelet de mesma localização,

escala e sub-banda,, exceto diferentes planos de cor, são agrupados em um vetor. Então, os

autores propõe um modelo MGMM (multivariate Gaussian mixture model) para aproximar a

distribuição marginal dos vetores de coeficiente de wavelet em uma escala e capturar as

interações de diferentes planos de cor. Além disso, a dependência estatística entre escalas

diferentes é capturada pela matriz de transição da árvore escondida de Markov (transition matrix

of the hidden Markov tree). Usando esta aproximação, os autores melhoraram o desempenho do

WD HMM na classificação de texturas coloridas.

Shutao Li & Shawe-Taylor (2005) investigam o problema da classificação de textura com

características multi-resolução individuais e combinadas (wavelet dyadic, wavelet frame, wavelet

Gabor) e pirâmide dirigível (steerable pyramid). SVMs (Support vector machines) são usadas

como classificadores.

Jafari-Khouzani & Soltanian-Zadeh (2005a) apresentam uma nova aproximação à classificação

de textura invariante à rotação. A aproximação proposta se beneficia do fato de que a maioria

dos padrões de textura ou tem direcionalidade (texturas anisotrópicas) ou não está com uma

direção específica (texturas isotrópicas). As características de energia de wavelet de texturas

direcionais mudam significativamente quando a imagem é girada. Porém, para as imagens

isotrópicas, as características de wavelet não são sensíveis à rotação. Então, para as texturas

direcionais, é essencial calcular as características de wavelet ao longo de uma direção específica.

Na aproximação proposta, a transformada de Radon é primeiramente empregada para detectar a

direção principal da textura. Então, a textura é girada para colocar sua direção principal à zero

graus. Uma transformada de wavelet é aplicada à imagem girada para extrair características de

textura. Esta aproximação proporciona um espaço característico com pequena variabilidade

intra-classe e, assim, boa separação entre classes diferentes. O desempenho do método é avaliado

usando três conjuntos de textura. Resultados experimentais mostram a superioridade da

aproximação proposta comparados com alguns métodos existentes.

Jafari-Khouzani & Soltanian-Zadeh (2005b) - propõem uma nova técnica de análise de textura

invariante à rotação usando transformada wavelet e Radon. Esta técnica utiliza a transformada

Radon para converter rotação à translação e, então, aplica uma transformada wavelet invariante à

translação ao resultado para extrair características de textura. Um classificador de vizinhos mais

próximos (k-nearest neighbors) é empregado para classificar padrões de textura. Os autores

propõem um método para achar o ótimo número de projeções para a transformada Radon e

mostram que as características extraídas geram um eficiente espaço de caracteristica ortogonal.

Também demonstram que as características propostas extraem informação local e direcional dos

padrões de textura. Para testar e avaliar o método, os autores empregam vários conjuntos de

texturas junto com diferentes bases wavelet. Resultados experimentais mostram a superioridade

do método proposto e sua robustez ao ruído branco aditivo em comparação com alguns recentes

métodos de análise de textura.

Scharcanski (2005) expõe um novo método para análise de textura estocástica de multi-

resolução, interpretação e discriminação, baseado na transformada wavelet. Uma medida de

distância de multi-resolução para texturas estocástica é proposta, e aplicações do método na

indústria têxtil são informadas.

Peiling et al. (2006) propõem conjunto de características invariante à rotação e à escala baseados

em transformada Radon e análise de multiescala. Transformada Radon é usada para projetar a

imagem ao espaço 1-D, e então, as linhas da matriz de projeção são transformadas por uma

transformada wavelet 1-D adaptável, assim a matriz de características invariantes à escala é

derivada no domínio wavelet Radon. Análise Multiescala é empregada para a matriz de

características, e os valores de energia em diferentes escalas são provados não somente serem

invariantes à escala e à rotação da imagem, mas também refletem as diferentes distribuições de

energia da imagem de textura em diferentes escalas. Na fase de classificação, um classificador de

Mahalanobis é usado para classificar 25 classes de texturas naturais distintas. Os autores

apresentam resultados experimentais usando conjuntos de imagem de teste com orientações e

escalas diferentes, que demonstram elevada taxa de reconhecimento médio para invariância à

rotação e escala.

3.2.5 Abordagens baseadas em transformação de watershed

A Transformação Watershed, também conhecida como linha divisora de águas - LDA (MEYER,

1993; SOILE, 1991) é a principal ferramenta de segmentação morfológica.

Malpica, Ortuño & Santos (2003) apresentam uma extensão do algoritmo de watershed, usando

um vetor gradiente (vector gradient) e métodos de fusão (multivariate region merging methods).

O algoritmo usa um conjunto de imagens de textura, e depende somente de um parâmetro

ajustável. Os autores apresentam resultados em um conjunto padrão de imagens sintéticas e em

texturas de imagens médicas, usando diferentes parâmetros de texturas e critérios de fusão.

Para Hill, Canagarajah & Bull (2003) a transformação de watershed é uma ferramenta bem

estabelecida para a segmentação de imagens. Porém, a segmentação watershed freqüentemente

não é efetiva para regiões de imagens texturizadas perceptualmente homogêneas. Para segmentar

tais regiões corretamente, os autores introduzem o conceito de “gradiente de textura”.

Informação de textura e seu gradiente são extraídos usando uma moderna forma não dizimada de

transformação de wavelet complexa. Um moderno algoritmo marcador de localização é

subseqüentemente usado para localizar significantes regiões homogêneas texturizadas ou não

texturizadas. Então, o método usa um marcador dirigido de transformação watershed para

segmentar as regiões identificadas corretamente. O algoritmo combinado produz textura efetiva e

segmentação baseada em intensidades aplicáveis à recuperação de imagem baseada em

conteúdo.

3.2.6 Abordagens baseadas em análise de agrupamento (clusterização)

O objetivo da clusterização é agrupar os elementos de um conjunto de tal forma que os grupos

formados sejam constituídos por elementos que possuam maior similaridade com os elementos

do mesmo grupo do que com qualquer dos elementos de outros grupos.

Mirmehdi & Petrou (2000) descrevem uma aproximação para segmentação perceptual de

texturas de imagens coloridas. O método utiliza como entrada uma representação multiescala da

imagem de textura, gerada por um algoritmo suavizador multibanda. Este algoritmo é baseado

em medidas psicofísicas humanas de aparência de cor. A segmentação inicial é realizada

aplicando um algoritmo de agrupamento à imagem de nível mais áspero de alisamento. Então, os

agrupamentos segmentados são reestruturados para isolar os centros dos agrupamentos (zonas

nas quais os pixels são definitivamente associados com a mesma região). Os pixels da imagem

que representam os centros dos agrupamentos são usados para formar histogramas 3D de cor.

Estes histogramas são usados para designação probabilística de todos os outros pixels no centro

dos agrupamentos, visando formar agrupamentos maiores e categorizar o restante da imagem.

Então, o processo de disposição dos histogramas de cor e designação probabilistica dos pixels

aos agrupamentos é propagado por níveis mais finos de alisamento até que uma segmentação

completa é realizada ao nível mais alto de resolução.

Luo, Andreas & Savakis (2001) propõem uma aproximação de segmentação de textura em duas

fases, onde um mapa de segmentação inicial é obtido através de agrupamento não

supervisionado de características auto-regressivas de multiresoluções simultâneas

(Multiresolution Simultaneous Autoregressive - MRSAR) seguido por uma classificação não-

supervisionada de características de wavelet. As regiões de "alta confiança" e "baixa confiança"

são identificadas baseadas no resultado da segmentação MRSAR que usa erosão morfológica

multinível. O classificador de segunda-fase é treinado pelas "amostras de alta-confiança" e é

usado para reclassificar somente os "pixels de baixa-confiança".

Clausi (2002) propõe um algoritmo de agrupamento de “pesca” robusto e não supervisionado (K-

means Iterative Fisher - KIF) aplicado ao problema de segmentação de textura de imagem. O

algoritmo KIF envolve dois passos. No primeiro, o algoritmo K-means é aplicado. No segundo,

as tarefas da classe K-means são usadas para calcular parâmetros requeridos por um FLD (Fisher

linear discriminant – discriminante linear pescador). O FLD é aplicado interativamente para

melhorar a solução. A combinação do K-means e do interativo FLD é chamado de algoritmo

KIF. O algoritmo hierárquico binário KIF é completamente não supervisionado, não requer

nenhum conhecimento anterior do número de classes, é uma solução não-paramétrica, e é

computacionalmente eficiente quando comparado com outros métodos usados para agrupar

soluções de segmentação de imagem de textura. Filtros Gabor e probabilidades de co-ocorrência

são usados como características de textura.

Fischer & Buhmann (2003) propõem um método de agrupamento perceptual. O agrupamento

perceptual organiza partes da imagem em grupos baseados em medidas de semelhança plausíveis

psicofisicamente. O método proposto enfatiza a conexão de elementos de imagem por mediação

de elementos, em vez de favorecer alta semelhança mútua. Este princípio de agrupamento rende

resultados de agrupamento superiores quando os objetos são distribuídos em grande variedade

estendida em um espaço de característica de baixa-dimensão, e não como nuvens de pontos

locais. Além de extrair estruturas conectadas, os objetos são separados como pontos fora do

padrão (outliers) quando eles estão muito longe de qualquer estrutura de agrupamento. Para este

princípio de organização de percepção, a função objetivo é otimizada por um algoritmo

aglomerativo rápido.

Sánchez-Yáñez, Kurmyshev & Cuevas (2003) usam uma aproximação estatística baseada na

representação de coordenadas de agrupamentos de imagens para classificação e reconhecimento

de imagens texturizadas. A habilidade do descritor para capturar as características estatísticas de

espaço de uma imagem é explorada. Uma binarização precisa, mas não restringida, para pré-

processamento da imagem é feita por um algoritmo de agrupamento fuzzy. Um histograma de

espectro normalizado da representação da coordenada de agrupamento é usado como um vetor

de característica única, e um classificador de distância mínima simples é utilizado para

propósitos de classificação. Usando o tamanho e o número de sub-imagens para geração de

protótipo e o tamanho das imagens de teste como parâmetros na aprendizagem e fases de

reconhecimento, os autores estabelecem regiões de classificação segura no espaço de parâmetros

da sub-imagem. Os resultados dos testes de classificação demonstraram o alto desempenho do

método proposto que pode ter aplicação industrial para classificação de textura.

Sánchez-Yáñez, Kurmyshev & Fernández (2003) utilizam um classificador de uma classe para

formar classes com uma homogeneidade requerida em relação às características de imagens de

textura fornecidas. O método proposto é baseado no espaço de característica de representação de

coordenadas de agrupamentos (Coordinated Clusters Representation - CCR). A densidade de

uma classe de imagens no espaço de caracteristicas CCR é determinada pela variância da classe,

além de ser controlada por um parâmetro de ajuste empírico. Experimentos com imagens de

textura de granitos polidos, em nível de cinza, do banco de texturas de Brodatz e "Rosa Porriño",

demonstram o alto desempenho de discriminação do método proposto.

Kurmyshev & Sánchez-Yáñez (2005) estendem uma aproximação para análises de textura de

nível cinza para imagens coloridas. Os autores propõem três classificadores de textura de cor que

usam o espaço de características CCR (Coordinated Clusters Representation). A informação

textural é derivada do plano de luminância, através de transformação de coordenadas de

agrupamentos com características de crominância, tratadas separadamente. Os classificadores

diferem, basicamente, no uso dos espaços de cores RGB e YIQ. O objetivo principal dos autores

é avaliar quantitativamente o desempenho dos classificadores por meio de experimento

comparativo com um conjunto de imagens coloridas VisTex e OuTex. Os resultados

experimentais indicam que os novos classificadores são rápidos e tão eficientes quanto outras

técnicas de análise de textura para o mesmo conjunto de imagens.

Hammouche & Postaire (2006) consideram a analogia entre segmentação de imagem e análise de

agrupamento. Os autores propõem uma adaptação de medidas estatísticas de textura, visando

descrever uma distribuição de espaço de observações multidimensionais. A idéia principal é

considerar os núcleos de agrupamentos como domínios caracterizados pelas suas texturas

específicas no espaço de dados. A distribuição dos pontos de dados é primeiramente descrita

como um histograma multidimensional definido em uma ordem regular multidimensional de

pontos de amostra. Para avaliar uma textura multidimensional localmente, é introduzida uma

matriz de co-ocorrência que caracteriza a distribuição local dos pontos dos dados no espaço de

dados multidimensional. Podem ser computadas várias características de textura local desta

matriz de co-ocorrência. Tal matriz acumula informação de espaço e estatística na distribuição

de dados nas vizinhanças dos pontos de amostras. São selecionadas características de textura de

acordo com sua habilidade para separar distribuições diferentes de pontos de dados. Os pontos de

amostra onde a textura subjacente local é avaliada são caracterizados em classes de texturas

diferentes. Os pontos nomeados a estas classes, considerados como os núcleos dos

agrupamentos, tendem a formar componentes conectados no espaço de dados.

Yuzhong Wang, Jie Yang & Ningsong Peng (2006) propõe melhorias na aproximação da

segmentação do valor de “J” (Segmentation of color-texture regions in images and vídeo - JSEG)

para segmentação não supervisionada de cor e textura. O "J-image" corresponde a um mapa-

classe da imagem com elevados e baixos valores de rótulos de classes de cor que correspondem a

um possível limite de uma região. Em vez do algoritmo de quantização de cor usado em JSEG,

um método de classificação automático que utiliza agrupamento de meia-mudança adaptativa

(Adaptive Mean-Shift - AMS). É aplicado para agrupamento não paramétrico aleatório. Os

resultados dos agrupamentos são usados para construir a modelagem de mistura Gaussiana para

o cálculo do valor de J-soft. O algoritmo de crescimento de região usado em JSEG é então

aplicado na segmentação da imagem baseado na multi-escala J-soft. Experimentos mostram que

o método melhorado supera as limitações do JSEG com sucesso e é mais robusto.

3.2.7 Abordagens baseadas em características de cor/bordas/contornos

Nesta subseção foram agrupadas as técnicas que utilizam características de cor e contornos para

segmentação de texturas.

Deng & Manjunath (2001) empregam um método para segmentação não supervisionada de

regiões de texturas coloridas em imagens e vídeo. Este método, que os autores nomearam de

JSEG, consiste de dois passos independentes: quantização de cor e segmentação espacial. No

primeiro passo, as cores na imagem são quantizadas para várias classes representativas que

podem ser usadas para diferenciar regiões na imagem. Então, os pixels da imagem são

substituídos por seus rótulos de classe de cores correspondentes, formando um mapa de classe da

imagem ("J-imagem"). Neste mapa, valores altos e baixos correspondem a possíveis limites e

interiores de regiões de texturas coloridas. O foco do trabalho está na segmentação espacial,

onde um critério para janelas locais deslizantes é aplicado ao mapa de classe, definindo uma

"boa segmentação". Em seguida, um método de crescimento da região é empregado para

segmentar a imagem, baseado na “J-imagem” multi-escala. Experiências mostram a robustez do

algoritmo JSEG em imagens reais e de vídeo.

Kan-Min Chen & Shu-Yuan Chen (2002) propõem um novo método para segmentação textura

colorida que utiliza distribuições de características. Primeiro, as distribuições de cor e

características de borda locais são usadas para derivar uma medida de homogeneidade para

regiões de texturas coloridas. Então, um método grosso-para-fino (coarse-to-fine) baseado na

medida de homogeneidade é empregado para alcançar a meta de segmentação de textura

colorida. O método proposto unifica cor e características de borda para resolver o problema de

segmentação de textura colorida, ao invés de simplesmente estender a análise de textura de nível-

cinza para imagens coloridas ou analisar somente a interação de espaço de cores na vizinhança.

Além disso, o método proposto é simples, mas eficaz. O tempo de execução é rápido, a taxa de

erro é baixa e os resultados da segmentação para cenas naturais são visualmente satisfatórios.

Finalmente, o método proposto não requer nenhum conhecimento a priori sobre o número e tipos

de texturas ou sobre o número de regiões. Os autores demonstram a viabilidade e a efetividade

do método através de várias experiências.

Cheng-Hao Yao & Shu-Yuan Chen (2003) utilizam um novo método para recuperação de textura

colorida através de características de borda e cor. O método proposto combina características de

borda e cor, em vez de analisar somente características de cor. Primeiro, as distribuições de cor e

padrões de bordas locais são usados para derivar uma medida de semelhança para um par de

texturas. Então, um método de recuperação baseado na medida de semelhança é proposto para

recuperar imagens de textura de um banco de dados de texturas coloridas. Finalmente, a medida

de semelhança é estendida para recuperar regiões de textura de um banco de dados de imagens

naturais.

Petrou, Piroddi & Talebpour (2006) apresentam metodologia para reconhecer texturas de dados

amostrados irregularmente. Os autores utilizam características construídas da transformação de

rastro (trace transform) que representa imagens com valores funcionais ao longo de linhas de

traçado melhor que dos valores do brilho em pontos da amostragem. Uma vez que classificação

de textura pode ser executada usando linha, ao invés de representações de ponto, não há nenhum

problema em usar dados amostrados irregularmente. A análise é executada usando linhas de

traçado identificadas pela Transformada de Hough.

3.2.8 Abordagens mistas

Nesta subseção foram agrupadas abordagens que combinam diferentes técnicas.

Pietikäinen, Ojala & Xu (2000) aplicam uma aproximação de classificação baseada em

distribuição e um conjunto de medidas de textura recentemente desenvolvidas para classificação

de textura invariante à rotação. O desempenho da aproximação é comparado ao obtido com o

famoso modelo de aproximação de campo aleatório auto-regressivo de simetria circular

(Circular -Symmetric Autoregressive Random Field - CSAR). Um problema de classificação de

quinze diferentes texturas do banco de texturas de Brodatz complexas e sete ângulos de rotação é

usado nas experiências. Os resultados dos autores mostram um desempenho muito melhor que as

características de CSAR. Uma análise detalhada das matrizes de confusão e dos ângulos de

rotação das amostras produz várias observações interessantes sobre o problema de classificação e

as características usadas neste estudo.

Shutao Li et al. (2003) afirmam que em anos recentes, SVMs (support vector machines) tem

demonstrado desempenho excelente em uma variedade de problemas de reconhecimento de

padrões. Os autores aplicam SVMs para classificação de textura, usando características

invariantes à translação, geradas por transformação wavelet discreta. Para aliviar o problema de

selecionar o parâmetro de núcleo certo no SVM, os autores usaram um esquema de fusão

baseado no SVMs múltiplos, cada um com uma diferente configuração do parâmetro de núcleo.

Comparado ao classificador de Bayes tradicional e learning vector quantization algorithm,

SVMs múltiplos produziu a classificação mais precisa utilizando texturas do banco de texturas

de Brodatz.

Muneeswaran et al. (2005) abordam um novo conjunto de características invariantes à escala e à

rotação para classificação de textura de imagem, combinado com um conjunto de características

invariantes (Combined Invariant Feature - CIF). É uma integração de wavelets bruta como

Gaussiana (ou Chapéu Mexicano), e ortogonal wavelets como Daubechies, para alcançar uma

alta qualidade de conjunto de características invariante à escala e à rotação. A invariância à

rotação é alcançada usando este dois wavelets com suas propriedades direcionais e a invariância

à escala por um método que é uma extensão às características da dimensão fractal (Fractal

Dimension - FD). O primeiro e segundo parâmetro de ordem estatístico e entrópico caracterizam

a qualidade das características extraídas. Além disso, é apresentada uma comparação que mostra

a mais alta taxa de reconhecimento alcançada com o método recentemente proposto para o

conjunto de 6.720 amostras colecionadas de 105 diferentes texturas do banco de texturas de

Brodatz, Vistek, Indezine e algumas imagens adicionais coletadas de outras fontes de imagens

coloridas reais e indexadas.

Pappas, Junqing Chen & Mojsilovic (2005) propõem uma nova aproximação para segmentação

de imagem baseado em características de baixo nível para cor e textura, visando à segmentação

de cenas naturais, nas quais a cor e a textura de cada segmento não exibam características

estatísticas uniformes. A aproximação proposta combina conhecimento de percepção humana

com uma compreensão de sinais característicos para segmentar cenas naturais em regiões

perceptualmente uniformes. A aproximação proposta está baseada em dois tipos de

características de baixos níveis adaptáveis espacialmente. A primeira descreve a composição

local de cor em termos de cores dominantes espacialmente adaptáveis, e a segunda, descreve as

características de espaço do componente de escala cinza da textura. Juntas, elas provêem uma

caracterização simples e efetiva de textura que o algoritmo proposto usa para obter segmentações

robustas, acuradas e precisas. As segmentações resultantes carregam informação semântica que

podem ser usadas para recuperação baseada em conteúdo. O desempenho dos algoritmos

propostos é demonstrado no domínio de imagens fotográficas, inclusive de baixa-resolução,

degradada e imagens comprimidas.

Para Puig & Garcia (2006) os classificadores e segmentadores de textura baseados em pixel são

tipicamente baseados na combinação de métodos de extração de características de textura que

pertencem a uma única família (por exemplo, filtros Gabor). Porém, a combinação de métodos

de textura de famílias diferentes tem produzido melhores resultados de classificação

quantitativamente e qualitativamente. Dado um conjunto de múltiplos métodos de extração de

características de textura de famílias diferentes, os autores apresentam um novo esquema de

seleção de característica de textura que automaticamente determina um reduzido subconjunto de

métodos, cuja integração produz resultados de classificação comparáveis àqueles obtidos quando

todos os métodos disponíveis são integrados, mas com um custo computacional

significativamente mais baixo. Experiências com texturas do banco de texturas de Brodatz e de

imagens reais ao ar livre, mostram que o esquema de seleção proposto é mais vantajoso que

conhecidos algoritmos de seleção de características de propósitos gerais aplicados para o mesmo

problema.

3.2.9 Outras Abordagens

Esta subseção reúne abordagens diversas que não se enquadraram em nenhuma das categorias

anteriores.

3.2.9.1 Técnicas baseadas em modelagem multi-resolução

Conforme Lei Wang & Jun Liu (2000), a segmentação de textura permanece um assunto

fundamental em análise de imagem de baixo nível, reconhecimento de padrão e visão

computacional. Para os autores, o problema da segmentação de textura pode ser resolvido em

duas direções: modelo ajustável (model fitting) e classificação não-paramétrica (non-parametric

classification). A utilização da modelagem multi-resolução MRF (MRMRF) na segmentação de

textura é proposta e um moderno método de estimação do parâmetro MRMRF baseado em

aproximação de MCMC (Markov chain Monte Carlo) é apresentado. Os resultados

experimentais demonstram que o método é satisfatório para segmentar imagens texturizadas.

3.2.9.2 Técnicas baseadas em operadores lógicos e transformações geométricas

Manian, Vasquez & Katiyar (2000) introduz um novo algoritmo baseado em operadores lógicos

para classificação de texturas. Os operadores construídos de blocos de construção lógica são

aplicados à imagens de textura e um ótimo conjunto de seis operadores é selecionado baseado

em suas habilidades de discriminação de textura. Então, as respostas são convertidas para

matrizes de desvio padrão computadas sobre uma janela deslizante. Zonas características das

amostras são computadas dessas matrizes. Um processo de seleção de características é aplicado e

o novo conjunto de características é usado para classificação de textura. Os autores apresentam a

classificação de várias imagens de textura naturais e sintéticas, demonstrando o excelente

desempenho do método de operador lógico. A superioridade computational e a precisão da

classificação do algoritmo são demonstradas através da comparação com outros métodos

populares de classificação de texturas.

Jianguo Zhang & Tieniu Tan (2003) propõe um novo método de extrair a assinatura da textura

considerando transformações afins invariantes para recuperação de imagem baseada em

conteúdo (Content-Based Affine Invariant Image Retrieval -

CBAIR). O algoritmo proposto

explora as assinaturas espectrais das imagens de textura. Baseado na representação espectral,

assinaturas de distribuições de espectro de orientação invariantes à escala são extraídas. Vetor de

distribuição de cumes (Peaks distribution vector - PDV), obtido de distribuições de assinatura,

captura a invariância de propriedades de textura para transformação afim. O PDV é usado para

medir a semelhança entre texturas.

Lazebnik, Schmid & Ponce (2005) introduz uma representação satisfatória de textura para

reconhecer imagens de superfícies texturizadas sob uma gama extensa de transformações, como

mudanças de ponto de visualização e deformações não rígidas (isto é, não apenas translações e

rotações). Na fase de extração de características, um conjunto disperso de regiões afins de Harris

e Laplace é encontrado na imagem. Cada uma destas regiões pode ser entendida como um

elemento de textura que tem uma forma elíptica característica e um padrão de aparência distinto.

Este padrão é capturado por um processo invariante à transformações afins de forma

normalizada, seguido pela computação de dois descritores originais: spin image e o descritor

RIFT. Quando a invariância afim não é requerida, a forma elíptica original serve como uma

característica discriminativa adicional para reconhecimento de textura. A proposta é testada

usando o banco de textura de Brodatz.

3.2.9.3 Técnicas baseadas em conceitos topológicos

Epifanio & Ayala (2002) sugerem uma estrutura global para classificação de textura baseada na

teoria de conjunto fechado aleatório. Nesta aproximação, uma textura binária é considerada

como um resultado de um conjunto fechado aleatório. Alguns descritores distribucionais deste

modelo estocástico são usados como características de textura para classificar a textura binária,

em particular distribuições de contatos esféricos e lineares e funções “K”. Se uma textura de

escala cinza tiver que ser classificada, então a textura original é reduzida a um conjunto fechado

aleatório multivariado, onde cada componente (um diferente conjunto aleatório) corresponde

com aqueles pixels, verificando uma propriedade local. Novamente, alguns descritores

funcionais do conjunto fechado aleatório multivariado podem ser usados para descrever e

classificar a textura de escala cinza. Foram utilizadas distribuições de contatos esféricos e

lineares, marginais e cruzados e funções K. Os autores realizam validações experimentais usando

o banco de texturas de Brodatz.

3.2.9.4 Técnicas baseadas em modelo auto-regressivo

Bandera et al. (2001) propõem um novo método de segmentação baseado em textura com três

estágios que, usando técnicas de multi-resolução, provê alta velocidade computacional. A

novidade principal da aproximação é que a proximidade espacial tem uma importância

progressivamente decrescente nos mais baixos níveis de resolução, quando segmenta

hierarquicamente a estrutura de dados. O método alcança baixas taxas de erro e não requer

nenhum conhecimento sobre o número de texturas na imagem.

Khotanzad & Hernandez (2003) descrevem um sistema de recuperação de imagem baseado em

cor e textura que permite pesquisar um banco de dados de imagem e encontrar imagens

semelhantes à uma imagem pré-definida. A informação de cor e textura é obtida através da

modelagem com o modelo de campo aleatório auto-regressivo multiespectral simultâneo

(Multispectral Simultaneous Autoregressive - MSAR). O conteúdo genérico de cor é

caracterizado por proporções médias de amostras de cor. O processo de recuperação envolve a

segmentação da imagem em regiões uniformes de texturas de cor, usando uma aproximação de

agrupamento de histograma não supervisionado, que utiliza a combinação de MSAR e

características de cor. O conteúdo de cor e textura, a localização, a área e a forma das regiões

segmentadas são usados para desenvolver medidas de semelhança que descrevem a proximidade

entre uma imagem de questão e imagens do banco de dados. Estes atributos são derivados do

ajuste máximo quadrático e elíptico para cada região segmentada. A medida de semelhança

proposta pelos autores combina todos estes atributos para classificar a proximidade das imagens.

Alata & Ramananjarasoa (2005) propõem algumas melhorias para um algoritmo de segmentação

de imagem não supervisado usando um quarto do plano 2-D de modelo auto-regressivo. O

algoritmo de segmentação trabalha em duas fases: A primeira fase consiste em uma estimativa

do número de texturas e os parâmetros de modelos associados com cada textura existente. A

estimativa é alcançada minimizando um critério de probabilidade que inclui um termo de

penalidade como os utilizados em critérios de informação (Information Criteria - IC). A segunda

fase trata da máxima estimativa posterior do campo de rótulo através do método simulated

annealing.

Kung-Hao Liang & Tjahjadi

(2006) tratam de dois assuntos desafiadores em segmentação de

textura em multi-escala não supervisionada: determinar resoluções espaciais e de características

adequadas para diferentes regiões da imagem, e utilizar diferentes resoluções para cruzar

informação. O centro de uma textura homogênea é analisado usando resolução espacial grosseira

e sua borda é detectada usando resolução espacial fina para localizar os limites com precisão. A

extração das características de textura é alcançada por uma pirâmide de multi-resolução. Os

valores das características são integrados adaptativamente em resoluções de cruzamento. O

número de texturas é determinado automaticamente, usando o critério de relação de variância.

Resultados experimentais em imagens sintéticas e reais demonstram a melhoria em desempenho

do esquema multi-escala proposto sobre aproximações de escala únicas.

3.2.9.5 Técnicas baseadas em medidas de similaridade/distâncias

Para Hao He & Yan Qiu Chen (2000) muitos métodos de segmentação de textura na literatura

assumem que as mudanças de intensidade podem ser atribuídas à própria textura. Porém, as

imagens do mundo real podem conter amplas faixas de gradação de intensidade que não estão

associadas com a textura local, como as causadas pela iluminação do ambiente e por câmeras.

Para superar este problema, os autores propõem um método de segmentação de textura não

supervisionado. Enfatizando as relações de espaço entre os pixels de textura adjacente, o

algoritmo proposto começa por um conjunto de pixels de semente e a região de textura é gerada,

incluindo os pixels semelhantes. Para suprimir a influência de ruídos, uma atenção especial é

dada ao critério da semelhança. Além disso, para satisfazer a exigência da segmentação não

supervisionada, o limiar (threshold) na conferência da semelhança é automaticamente

determinada através da aplicação interativa do algoritmo. Os autores apresentam os resultados

experimentais obtidos em texturas de imagens do banco de texturas de Brodatz e imagens do

mundo real.

Reyes-Aldasoro & Bhalerao (2006) apresentam uma metodologia de seleção de características

baseada em um moderno espaço de Bhattacharyya para o problema de segmentação de textura. O

espaço de Bhattacharyya é construído para as distâncias de Bhattacharyya de diferentes medidas

extraídas com filtros sub-bandas de amostras de treinamento. As distribuições marginais do

espaço de Bhattacharyya apresentam uma seqüência das sub-bandas mais discriminantes que

podem ser usadas como um caminho para um algoritmo de envoltura. Quando esta seleção de

característica é usada com um algoritmo de classificação de multi-resolução em um conjunto

padrão de mosaicos de textura, produz os mais baixos erros de má classificação relatados.

3.2.9.6 Técnicas baseadas em regras de associação

Rushing et al. (2001) propõem um novo tipo de característica de textura baseado em regras de

associação. Regras de associação foram usadas em aplicações como análise de mercado, para

capturar relações existentes entre artigos em grandes conjuntos de dados. É mostrado que regras

de associação podem ser adaptadas para capturar freqüência de ocorrências de estruturas locais

em imagens. Regras de associação capturam informação estrutural e estatística, e

automaticamente, identifica as estruturas que ocorrem mais freqüentemente e relações que têm

poder discriminativo significante. Os autores descrevem métodos para classificação e

segmentação de imagens por textura que usam regras de associação como características de

textura. Os autores demonstram que regras de associação de características podem distinguir

pares de textura em primeira, segunda e terceira ordens estatísticas e pares de textura que não são

facilmente discriminadas visualmente.

Rushing et al. (2002) descrevem um novo tipo de característica de textura baseado em regras de

associação. Regras de associação têm sido usadas em aplicações como análise de Mercado para

capturar relações presentes entre itens nos grandes conjuntos de dados. Os autores demonstram

que regras de associação podem ser adaptadas para capturar freqüência de ocorrências de

estruturas locais em imagens. A freqüência da ocorrência de estruturas pode ser usada para

caracterizar a textura. Os autores descrevem métodos para segmentação de imagens por textura

baseado em regras de associação de características.

3.2.9.7 Técnicas baseadas em Redes Neurais

Jinsang Kim & Tom Chen (2001) apresentam um método de segmentação que permite

identificar regiões homogêneas para representar objetos de nível mais altos, visando

classificações baseada em conteúdo. O esquema proposto extrai características múltiplas, como

movimento e textura, na base de pixel. Diferentes pesos são aplicados para cada componente de

características em função de medidas de confiança do movimento. O esquema proposto consiste

de duas fases. Na primeira fase, um espaço de características múltiplo é transformado para um

espaço de rótulo unidimensional, usando um método de agrupamento baseado em rede neural de

mapas de características de auto-organização (Self-Organizing Feature Maps - SOFM). Na

segunda fase, as saídas da rede neural são fundidas para gerar a resolução da segmentação

desejada. Os resultados experimentais e a análise de desempenho demonstram a validez do

esquema proposto.

Rohrmus (2005) introduz modernas características geométricas de texturas para descoberta

automática de defeitos de textura. Estas características são invariantes a tranformações

geométricas e adaptáveis à textura. Uma função algébrica é combinada sobre intensidades locais,

vizinhos circulares na imagem e análise de textura anisotrópica (padrões de textura com

direcionalidade). A adaptabilidade é alcançada pela otimização deste núcleo de características e

coeficientes adicionais, através de uma simples minimização de energia, restringida por uma

medida de discriminação de textura (Fisher criterion). Uma rede neural (multilayer perceptron

network) treinada com um algoritmo backpropagation classifica as texturas localmente. A

aproximação proposta contém propriedades novas (teoricamente implícito, invariâncias múltiplas

e uma adaptabilidade automática e específica das características para as imagens de textura),

normalmente incomuns nas teorias de reconhecimento de padrões. Os experimentos realizados

alcançam altas taxas de precisão no reconhecimento de um conjunto de texturas do banco de

texturas de Brodatz.

Avci (2006) usa uma Rede Neural WNN-ANE (Wavelet Neural Network based on Adaptive

Norm) para aumentar a efetividade do algoritmo de extração de características invariante à escala

WSF (Best Wavelet Statistical Features (WSF)–Wavelet Co-occurrence Features (WCF)). A

eficiência do método proposto foi comprovada através de experimentos exaustivos realizados

com texturas de Brodatz.

Sengur, Turkoglu & Ince (2006) descrevem o uso de redes neurais wavelet packet (wavelet

packet neural networks - WPNN) para o problema de classificação de textura. O esquema

proposto é composto de um extrator de características wavelet packet e um classificador multi-

layer perceptron. Características de energia e entropia são integradas ao extrator de característica

wavelet. Os estudos experimentais executados mostram a efetividade da estrutura WPNN. A taxa

de sucesso global é aproximadamente de 95%.

3.2.10 Comparação de abordagens

Nesta subseção foram reunidos trabalhos que realizam uma avaliação comparativa de diferentes

abordagens para segmentação de texturas.

García-Sevilla & Petrou (2001) comparam sistematicamente e avaliam quatro métodos diferentes

de classificação de textura (baseado em wavelet, matrizes baseadas em co-ocorrência,

histogramas baseados em 1D, modelo baseado em modelos Booleanos 1D) com respeito aos seus

desempenhos em identificar texturas de amostras pequenas e irregulares.

Rubner et al. (2001) comparam empiricamente nove famílias de medidas de dissimilaridade de

imagem que estão baseadas em distribuições de características de cor e textura, somando mais de

1000 horas de CPU de experimentos computacionais. Avaliações quantitativas de desempenhos

são dadas para classificação, recuperação de imagem e tarefas de segmentação para uma larga

variedade de parâmetros de medida de dissimilaridade. É demonstrado como a seleção de uma

medida baseada em avaliação de larga escala, melhora substancialmente a qualidade de

classificação, recuperação e segmentação não supervisionada de cor e imagens de textura.

Drimbarean & Whelan (2001) focalizam a classificação de imagens de textura com cor. O

objetivo principal dos autores foi determinar a contribuição da informação de cor ao desempenho

da classificação global. Três aproximações (transformação local linear, filtro Gabor e a

aproximação de co-ocorrência) para a análise de textura de escala cinza são estendidas para as

imagens coloridas. Elas são avaliadas de uma maneira quantitativa por meio de uma experiência

comparativa, utilizando um conjunto de imagens coloridas. Os autores também investigam o

efeito da utilização de diferentes espaços de cores e a contribuição de cor e características de

textura de forma separada e conjunta. O critério de avaliação é a precisão da classificação por

meio de um classificador de rede neural baseado em Learning Vector Quantization.

Jianguo Zhang & Tieniu Tan (2002) realizam um estudo sobre a importância da análise de

textura invariante. Os autores abordam aproximações de análise de textura, cujos desempenhos

não são afetados por translação, rotação e transformação afins ou de perspectiva. Algoritmos

existentes de análise de textura invariante são cuidadosamente estudados e classificados em três

categorias: métodos estatísticos, métodos baseados em modelos e métodos estruturais. Cada

aproximação é revisada de acordo com sua classificação. Seus méritos e desvantagens são

delineados.

Segundo Mäenpää & Pietikäinen (2004), as aproximações atuais para análise de textura colorida

podem ser grosseiramente divididas em duas categorias: métodos que processam cor e textura

separadamente e métodos que consideram cor e textura associadamente. Os autores avaliam

empiricamente ambas as aproximações com um grande conjunto de texturas coloridas naturais.

O desempenho dos métodos de classificação coloridos e em escala de cinza são comparados e os

métodos de textura e cor separados, são comparados com os métodos de textura e cor

combinados, em condições de iluminação estática e variada.

Soltanian-Zadeh, Rafiee-Rad & Pourabdollah-Nejad (2004) apresentam uma comparação e

avaliação do desempenho de quatro texturas diferentes e métodos de extração de característica de

forma para classificação de microcalcificações benignas e malignas em mamogramas. Para 103

regiões contendo agrupamentos de microcalcificação, texturas e características de forma, foram

extraídas usando quatro aproximações: quantificadores de forma convencional; método baseado

em co-ocorrência de Haralick; transformações de wavelet; e transformações de multi-wavelet.

Para cada conjunto de características, a característica mais discriminante e seus pesos ótimos

foram encontrados através de algoritmos genéticos, permitindo a comparação do desempenho de

cada aproximação.

Para Chih-Fong Tsai (2005), as características espectrais de imagens, como filtros Gabor e

transformada wavelet, podem ser usados para classificação de textura em imagem. Assim, um

classificador pode ser treinado, a partir de um conjunto de treinamento, com características de

texturas rotuladas e, posteriormente, classificar texturas não rotuladas em classes pré-definidas.

O propósito do autor é duplo. Primeiro, investigar o desempenho da classificação usando filtros

Gabor, transformação wavelet e suas combinações na representação de característica de textura

de imagens de paisagem. Um classificador k-NN (k-nearest neighbor) e SVM (support vector

machine) também são comparados. Segundo, três classificadores k-NN e três SVMs são

combinados respectivamente, em que cada um dos três classificadores combinados usam uma

das três representações de características de texturas acima, para ver se a combinação de

classificadores múltiplos melhora o desempenho da classificação da imagem de paisagem em

relação à utilização de um classificador único.

3.3 C

ONSIDERAÇÕES

INAIS

Este capítulo apresentou conceitos básicos sobre texturas. Foram descritas, brevemente, diversas

abordagens existentes na literatura recente para análise de textura. O próximo capítulo abordará a

metodologia proposta para quantificação de textura de uma região.

4. METODOLOGIA

Este capítulo apresenta um novo método de segmentação de imagens multiespectrais baseado

em sua textura. A primeira seção fornece noções sobre medidas estatísticas. A segunda seção

aborda o coeficiente proposto para quantificação de textura, denominado Coeficiente de

Variação Espacial. A terceira seção trata de problemas de otimização. A quarta seção detalha

a modelagem do algoritmo genético (AG). Na quinta seção, métodos de clusterização são

considerados. A sexta seção descreve a modelagem do algoritmo Kmeans.

4.1. MEDIDAS ESTATÍSTICAS

Para analisar as tendências de características da distribuição de valores das amostras de uma

classe, isoladamente, ou comparativamente com as outras, é necessário introduzir conceitos

que se expressem através de números que permitam interpretar essas tendências. Esses

conceitos são elementos típicos da distribuição: as medidas de posição, de dispersão, de

assimetria e curtose.

As medidas de posição ou de tendência central constituem uma forma mais sintética de

apresentar os resultados contidos nos dados observados (valor dos elementos da classe), pois

representam um valor central, em torno do qual os dados se concentram. A média, equação

(4.1), a mais comum das medidas de posição, é o quociente da divisão da soma dos valores da

variável,

, pelo número deles,



(4.1)

Entretanto, a utilização de uma medida de posição para substituir um conjunto de dados é

insuficiente para sintetizar a informação nele contida, pois ainda que seja capaz de representar

uma série de valores, não descreve por si mesma o grau de homogeneidade ou

heterogeneidade que existe entre os valores que compõe o conjunto.

Portanto, para sintetizarmos eficientemente a informação de um conjunto de dados, é

necessário associar a medida de posição uma medida de dispersão, que vai informar como

estes dados se comportam em torno da medida de posição empregada. Chama-se de dispersão

ou variabilidade, a maior ou menor diversificação dos valores de uma variável em torno de

um valor de tendência central, tomado como ponto de comparação.

Para obter um único número que represente a dispersão dos dados, utiliza-se a Variância, que

é a soma dos quadrados dos desvios dividida pelo número de observações. A Variância é uma

medida quantitativa da dispersão de um conjunto de dados ao redor da sua média. Porém, a

Variância possui o inconveniente de ser expressa em unidades ao quadrado, o que causa

algumas dificuldades de interpretação. Assim, para resolver este problema, trabalha-se com o

Desvio Padrão, que é a raiz quadrada da variância, equação (4.2) :



−

)(

(4.2)

4.2. O COEFICIENTE DE VARIAÇÃO ESPACIAL

Esta seção apresenta um novo coeficiente para quantificação de textura de uma região,

denominado de Coeficiente de Variação Espacial (CVE). O CVE quantifica a característica de

textura através de medidas estatísticas que descrevem as variações espaciais de intensidade ou

cor. Duas medidas são empregadas: uma medida de posição (média) e uma medida de

dispersão (desvio padrão) do conjunto de pixels pertencentes à região da imagem a ser

segmentada (NUNES; CONCI, 2005b).

As medidas de posição ou tendência central apresentam os resultados contidos num conjunto

de dados de uma forma mais sintética, mas, sua utilização isolada é insuficiente para substituir

tal conjunto, sendo necessário associar uma medida de dispersão à medida de posição

empregada. Porém, a utilização das medidas de posição e dispersão para quantificação da

textura de uma região da imagem tem a desvantagem de não considerar a posição relativa dos

pixels uns em relação aos outros (KOLLER; SAHAMI, 1996). Isto, porque a textura não se

caracteriza apenas pela tonalidade dos pixels de uma região, mas também pelos

relacionamentos espaciais entre eles. Assim, o CVE leva em consideração não apenas a

distribuição de intensidades dos pixels, mas também sua distribuição espacial pelas classes de

distâncias.

O cálculo do CVE inicia com a definição de um conjunto de amostras de treinamento para

cada região de interesse. Essas amostras são extraídas da imagem, através de janelas de

tamanho

(

,...,

), definido pelo usuário. Para exemplificar o cálculo do

CVE, considere a figura 4.1 que ilustra uma região de

pixels com seus níveis de

intensidade nos canais R, G e B.

FIGURA 4.1 – Amostra de uma região com

pixels

Para cada amostra de tamanho

, determina-se o conjunto de intensidades dos pixels por

classe de distância e por canal considerado. A métrica

(também conhecida como métrica

Manhatan

cityblock

quarteirão

) é utilizada para calcular a distância de cada pixel ao pixel

central da amostra. A figura 4.2 representa com as mesmas cores os pixels com mesma

distância

(

)

qpD ,

de cada pixel

(

)

tsq ,

em relação ao pixel central

(

)

yxp ,

, calculadas por

meio da equação (4.3).

||||),(

tysxqpD −+−=

(4.3)

onde

são as coordenadas do pixel central e

, as coordenadas do pixel considerado.

FIGURA 4.2. Classes de distâncias para região de 7x7 pixels da figura 4.1

Para a amostra da figura 4.2, existem seis grupos de pixels, correspondendo às seis diferentes

distâncias possíveis. A figura 4.3 representa as classes em função da distância máxima

considerando o canal red. A classe seguinte engloba os valores das classes anteriores

(

Classe

= conjunto de pixels com

nD ≤

FIGURA 4.3 – Seis grupos de pixels correspondentes às classes de distâncias

Para permitir uma maior caracterização das variações do coeficiente de uma amostra para

diferentes combinações de suas bandas o valor da intensidade do pixel em um determinado

canal (

) é substituído por um novo valor considerando os outros dois canais,

conforme tabela 4.1.

TABELA

4.1

Cálculo dos novos valores de intensidade

CANAL R G B

OriginaleIntensidadc _

175 168 143

a 168 143 175

b 143 175 168

)1( ++= bax

221,269 226,771 243,282

))1(( += batgArcoy

0,862 0,682 0,803

yxd

190,772 154,729

154,729 195,316 190,772

195,316 190,772 154,729

)1( ++= dcx

259,618 229,076 242,876

))1(( += dctgArcoy

0,740 0,823 0,630

yxeIntensidadNova

192,040 188,594 152,902

Por exemplo, o valor da intensidade do pixel no canal

- 175 (posição - 0,0 da matriz da

figura 4.2a será substituído pelo resultado do cálculo considerando as intensidades do canal

- 168 e

- 143, ou seja, o novo valor será 192,040. O mesmo procedimento será realizado

para todos os pixels das matrizes substituindo o valor de suas intensidades. Este procedimento

foi adotado, visando permitir a distinção de texturas resultantes de diferentes combinações da

ordem dos canais RGB.

Em seguida, a média e o desvio padrão para cada conjunto de pixels são calculados. O CVE

de cada classe de distância é obtido combinando a média e o desvio padrão de cada conjunto

através da equação (4.4), cujo valor único (CVE, da classe) preserva a informação de ambas

as medidas combinadas.

)1()

( ++×

= dpmd

tanArcoCVE

(4.4)

onde md é a média das intensidades dos valores e

seu desvio padrão.

Finalmente, a média e o desvio padrão dos CVE de cada classe de distância são novamente

combinados pela equação (4.4) resultando no CVE da amostra da região de interesse. A tabela

4.2 apresenta a média, o desvio padrão e o CVE para os dados da figura 4.2a.

TABELA

4.2

Dados para cálculo do CVE

Classe de

distancia

md dp

CVE

dp+1

CVE

Textura

1 102,500 12,522 149,651

2 100,500 15,880 143,878

3 101,375 25,327 138,552

4 104,167 31,938 138,729

5 107,273 35,226 141,532

6 110,313 38,712 144,182

142,754 4,791

219,

572

4.3. PROBLEMAS DE OTIMIZAÇÃO

O CVE de uma amostra de textura é calculado para os canais RGB. O valor do CVE em cada

canal define uma coordenada do espaço euclideano para amostra considerada. Assim, uma

amostra com os canais RGB possuirá uma coordenada (

RED

CVE

GREEN

CVE

BLUE

CVE

caracterizando um ponto no espaço tridimensional. Considerando dois distintos canais

espectrais, o conjunto de amostras de treinamento das classes podem ser visualizadas através

de um diagrama de dispersão, figura 4.4.

FIGURA 4.4 – Diagrama de dispersão de amostras da classe 1 e 2

Ainda que o usuário tenha selecionado amostras representativas das classes, é possível que

ocorra uma zona de amostras com características de CVE’s comuns, devido a complexidade

dos padrões das texturas. Assim, é necessário definir um procedimento para realizar a

separação das amostras em grupos distintos, baseado em algum critério de similaridade.

A busca por uma melhor distribuição das amostras entre classes pode ser considerada um

problema complexo de otimização que envolve tipicamente três componentes: variáveis,

restrições e função objetivo. As variáveis descrevem os vários aspectos do problema. As

restrições delimitam os valores válidos para as variáveis. A função objetivo envolve a

minimização de erros ou maximização de acertos de classificação, sendo também empregada

para medir a qualidade de uma solução gerada.

A finalidade da otimização é encontrar, num espaço de busca multidimensional, onde são

consideradas todas as possibilidades de solução de um determinado problema, um conjunto de

valores que, ao serem aplicados às variáveis do problema, permitam minimizar (ou

maximizar) uma função cujas variáveis devem obedecer às restrições impostas. Encontrar

soluções ótimas ou aproximadas para problemas de otimização NP-Difícil está longe de ser

uma tarefa fácil. Problemas desta complexidade são caracterizados por não linearidade,

ruídos, descontinuidades ou espaço de busca extremamente grande, como exemplificado na

figura 4.5. O emprego de métodos convencionais normalmente torna-se inviável em virtude

do enorme esforço computacional exigido para sua solução.

Neste trabalho, foram implementados dois procedimentos para realizar a separação das

amostras em grupos distintos: algoritmos genéticos e clusterização com algoritmo

K-Means

As próximas seções irão detalhar cada uma destas implementações.

FIGURA 4.5 - Um exemplo de espaço de busca

4.4. IMPLEMENTAÇÃO COM ALGORITMOS GENÉTICOS

Algoritmos Genéticos são modelos estocásticos e probabilísticos de busca e otimização,

inspirados na evolução natural e na genética, aplicados a problemas complexos de otimização.

Metaheuristicas como os algoritmos genéticos (AG’s), são estratégias adequadas para solução

de problemas desta natureza (NUNES; CONCI, 2003a). Estas estratégias empregam

mecanismos de busca que combinam escolhas aleatórias com o conhecimento obtido em

resultados anteriores. Guiando-se através do espaço de pesquisa do problema, evitam paradas

prematuras em ótimos locais e proporcionam, conseqüentemente, melhores soluções. Os

algoritmos genéticos não garantem a solução ótima, mas fornecem soluções próximas, ou

aceitáveis, além de serem mais facilmente aplicados em problemas complexos com muitas

variáveis e restrições ou com grandes espaços de busca (NUNES; CONCI, 2003b).

Como conseqüência da observação da natureza, em que as espécies lutam constantemente

pela sobrevivência através de sua adaptação ao ambiente, foram estabelecidos os princípios da

seleção natural e da genética:

- Cada indivíduo transmite aos seus descendentes os seus traços característicos (genéticos);

- Numa população existem indivíduos com características diferentes;

- Os indivíduos com melhores características (mais adaptados) tendem a reproduzir-se mais,

assim uma população caminha no sentido da existência de um maior número de elementos

mais adaptados;

- Ao longo do tempo, a acumulação de pequenas variações pode originar o aparecimento de

novas espécies com melhor capacidade de sobrevivência;

- Processos de troca e aparecimento de novo material genético podem concorrer para uma

melhor adaptabilidade.

A segmentação de imagens utilizando algoritmos genéticos, tipicamente, envolve a rotulação

dos pixels pertencentes a uma mesma região baseado em algum critério de similaridade (nível

de cinza, cor do pixels ou região de textura em comum). Roncero (2005) apresenta um

método de segmentação de imagens utilizando algoritmos genéticos para otimizar uma função

de similaridade que é baseada na intensidade e na posição espacial do pixel. Diferentes

propostas empregando algoritmos genéticos para segmentação de imagens podem ser

encontradas na literatura (YOKOO; HAGIWARA, 1996; YOSHIMURA MOTOHIDE;

SHUNICHIRO OE, 1996; ANDREY, 1999; JING-HAO XUE

et al

., 2001; HWANG

et al.

2001; YEN; NITHIANANDAN, 2002; ZHENG; KONG; NAHAVANDI, 2002; NUNES;

CONCI, 2005). Mais informações sobre AG e sua base matemática podem ser encontrados

em (HOLLAND, 1986; GOLDBERG, 1989).

4.4.1. Funcionamento dos algoritmos genéticos

Um AG age sobre um conjunto (população) de indivíduos (cromossomos), cada um

representando uma possível solução do problema. Ao longo do processo evolutivo, os

cromossomos são avaliados e selecionados para reprodução e sobrevivência. Os cromossomos

com melhores avaliações possuirão maiores chances de serem selecionados para reprodução

de uma nova geração. Nesta etapa, poderão sofrer alterações genéticas baseadas em

operadores de cruzamento e mutação. Este processo se repete até atingir o número pré-

determinado de gerações ou algum outro critério de parada, conforme ilustrado na figura 4.6.

FIGURA 4.6 - Funcionamento de um algoritmo genético

A modelagem do algoritmo genético envolve a definição da representação cromossômica, do

critério de inicialização da população, da forma de avaliação do indivíduo, do critério de

seleção, dos operadores genéticos de cruzamento e mutação, do critério de substituição, do

critério de parada e dos parâmetros de influência.

4.4.2. Representação cromossômica

A representação ou codificação do cromossomo é a primeira etapa na utilização de um AG na

solução de problemas. Tradicionalmente, os cromossomos são representados genotípicamente

por vetores binários, inteiros ou reais, conforme ilustra a figura 4.7. Cada elemento do vetor

(gene) representa uma determinada característica (genótipo) ou variável do problema. Os

genes combinados representam as características do indivíduo (fenótipo) considerado como

uma possível solução do problema.

FIGURA 4.7 – Cromossomo representado por um vetor

Na representação cromossômica adotada, um cromossomo traduz uma regra de associação

que define as características de uma classe. Uma regra de associação tem a forma

(

e...

)

ENTÃO

, onde o conjunto {

, ...

} representa os atributos preditivos e,

representa o valor do atributo objetivo. Os atributos preditivos assumem valores mapeados

num conjunto de números reais. Os atributos preditivos definem as características de textura

em cada uma das três bandas do espectro visível.

A figura 4.8 mostra a representação de um cromossomo para a tarefa de classificação.

Existem três atributos preditivos para textura. Cada atributo representa o valor do descritor de

textura para um dos canais: R, G ou B. Cada atributo possui dois campos: um valor mínimo e

um valor máximo. Os valores mínimo e máximo representam os limites inferiores e

superiores da faixa em que um atributo preditivo está inserido.

Atributos Preditivos (Textura)

Canal red Canal green Canal blue

Atributo 1 Atributo 2 Atributo 3

Min Max Min Max Min Max

FIGURA 4.8 - Representação do cromossomo

Com essa representação pode-se formular regras da seguinte forma:

SE (((Atributo 1

≥

mín 1) E (Atributo 1

≤

máx 1) E

(Atributo 2

≥

mín 2) E (Atributo 2

≤

máx 2) E

(Atributo 3

≥

mín 3) E (Atributo 3

≤

máx 3))

ENTÃO Atributo Objetivo = P

onde o atributo

(

= 1, 2 ou 3) indica característica de textura nos canais R, G e B,

respectivamente. Os valores mín

e máx

(n = 1, 2 e 3)

indicam os valores mínimos e

máximos de cada atributo preditivo, e P é o valor do Atributo Objetivo, ou seja, a classe a que

pertence o pixel.

A forma de representação foi escolhida em função da facilidade de interpretação, visto que é

intuitiva a visualização de um domínio de variáveis na forma de intervalo. Além disso, esta

representação, por sua simplicidade, permite a utilização de operadores genéticos

notoriamente conhecidos, tornando fácil sua manipulação.

Uma vez selecionado as medidas de textura, um vetor de padrões torna-se a completa

representação de cada amostra física. Assim, cada amostra torna-se um ponto no espaço

euclidiano tridimensional. Como as medidas de textura variam para cada amostra, variarão

também os vetores de padrões que descrevem os objetos. Esta variação ocorre não somente

entre diferentes classes, mas também dentro de cada classe. Entretanto, considerando que o

usuário tenha selecionado pixels representativos das classes 1 e 2 (classificação

supervisionada), o grau de associação entre os pixels de mesma classe será maior do que o

grau de associação entre os pixels de classes distintas.

A tabela 4.3 apresenta, de forma ilustrativa, as medidas de textura de 20 pixels selecionados

como conjunto de treinamento. Foram escolhidos dez pixels de amostra para classe 1 e dez

pixels de amostra para classe 2. Foram utilizados duas bandas para fins de visualização.

TABELA 4.3

Exemplo de medidas de textura para duas bandas

Classe 1 Classe 2

Classe

canal Red canal Green

canal Blue

canal Red canal Green

canal Blue

1 303,304 713,477 14,480 46,835 430,301 54,558

2 281,981 697,696 7,668 40,313 415,714 44,692

3 282,312 663,630 14,405 47,909 408,161 51,186

4 299,173 702,162 17,395 60,867 406,212 65,664

5 298,780 679,034 17,611 66,744 363,177 68,972

6 292,154 690,311 25,492 62,994 418,749 69,247

7 306,373 700,891 19,831 62,705 428,524 71,946

8 276,273 676,228 11,303 70,692 412,931 79,898

9 256,955 636,934 16,328 75,777 409,654 84,478

10 299,864 684,195 27,083 83,471 369,943 92,507

A figura 4.9 apresenta diagrama de dispersão (canais Red e Green) resultante dos dados da

tabela 4.2. Verifica-se a relevância da seleção adequada de características, pois, o grau de

separação entre as classes depende fortemente da escolha das medidas dos padrões

selecionadas para uma aplicação.

FIGURA 4.9 – Diagrama de dispersão dos dados da tabela 4.2

A partir de um conjunto de treinamento, o algoritmo genético busca evoluir regras de

associação que permitam classificar corretamente o maior número de pixels de cada classe.

Uma regra de associação define um relacionamento entre atributos preditivos (a condição de

uma regra - parte

) definido pelo descritor de textura; e um atributo objetivo (conseqüência

- parte

ENTÃO

) que define a classe a que pertence o pixel.

A partir dos dados da tabela 4.2 seriam geradas as seguintes regras para classe 1 e 2:

Regra para Classe 1

SE (CVE Canal Red

≥

256,955) E (CVE Canal Red

≤

306,373) E

(CVE Canal Green

≥

636,934) E (CVE Canal Green

≤

713,477)

ENTÃO CLASSE 1  Pixel central (janela)

Regra para Classe 2

SE (CVE Canal Red

≥

40,313) E (CVE Canal Red

≤

83,471) E

(CVE Canal Green

≥

363,177) E (CVE Canal Green

≤

430,301)

ENTÃO CLASSE 2  Pixel central (janela)

Assim, é possível criar uma imagem temática através da aplicação destas regras sobre cada

pixel da imagem.

4.4.3. Critério de inicialização

O critério de inicialização da população define como deve ser construída a população inicial

com a qual iniciará o algoritmo genético. Normalmente, a população inicial de indivíduos ou

cromossomos é realizada de forma aleatória. Neste trabalho, optou-se por uma inicialização

pela

Faixa de Valores do Atributo

. Neste caso, buscou-se introduzir, logo no início,

indivíduos interessantes, com soluções aproximadas. Tal método ajuda a restringir o espaço

de busca do algoritmo genético. Espaço de busca é o conjunto das soluções possíveis ou

viáveis do problema a ser otimizado.

A inicialização pela faixa de valores do atributo consiste em escolher um valor para o atributo

preditivo dentro da faixa de valores do atributo que ocorrem para o atributo objetivo

especificado. Considerando os valores da amostras do conjunto de treinamento constantes da

tabela 4.3. A inicialização heurística restringe a faixa de valores do atributo para os valores

mínimo e máximo das amostras do conjunto de treinamento que pertençam a uma mesma

classe, tabela 4.4.

TABELA 4.4

Intervalo dos atributos preditivos

Descritor de Textura (CVE)

Canal Red Canal Green Canal Blue

Min Max Media Min Max Media Min Max Media

Classe

256,955

306,373

281,664 636,934 713,477 675,205 7,668 27,083 17,375

40,313 83,471 61,892 363,177 430,301 396,739 44,692 92,507 68,599

Uma vez obtido os valores máximo e mínimo, calcula-se o valor médio de um atributo

preditivo. O algoritmo genético inicializará a população escolhendo aleatoriamente um valor

na faixa [Valor Mínimo; Valor Médio] e um valor na faixa [Valor Médio; Valor Máximo].

Essa inicialização possui a vantagem de restringir o espaço de busca. Além disso, a

probabilidade dos valores dos atributos ocorrerem dentro da faixa de valores dos genes é

maior, particularmente englobando o valor médio. Evita-se assim, a geração de regras cujos

valores dos genes não são representativos.

Para o cálculo do valor médio, calcula-se a média encontrada para todos os atributos

preditivos apenas considerando-se as amostras que possuem o valor do atributo objetivo igual

ao valor especificado. O AG permite ainda que o usuário forneça uma taxa de tolerância ao

intervalo válido para geração aleatória do atributo preditivo.

A figura 4.10 representa esquematicamente a faixa de inicialização heurística dos atributos

preditivos dos indivíduos da população inicial.

Valor médio

Valor máximo do atributo

Tolerância

Valor máximo com tolerância

Valor mínimo com tolerância

Valor mínimo do atributo

FIGURA 4.10 - Faixa de inicialização heurística dos atributos preditivos

4.4.4. Avaliação do indivíduo (fitness)

A avaliação da população é realizada pela função de aptidão (

fitness

), que deve refletir a

qualidade de um indivíduo em solucionar o problema. Em problemas de otimização, a função

de aptidão está intimamente ligada à função objetivo que se quer maximizar ou minimizar.

Por ser responsável pela avaliação da qualidade de cada solução, a seleção da função de

aptidão é considerada uma etapa crítica do processo, pois interfere diretamente na

performance de um AG (SANKAR; WANG, 1996).

A equação (4.5), selecionada neste trabalho para servir como função de avaliação, considera o

número de amostras cobertas pela regra através de sua acurácia e abrangência. Assim, o

fitness será o resultado da multiplicação da acurácia pela abrangência em relação à medida de

de textura.

texturaaabrangêncitexturaacuráciaAptidão

(4.5)

A acurácia de uma regra é uma medida empregada para verificar a qualidade de uma solução

em função do grau de certeza, ou confiança, obtido por meio de um conjunto de exemplos, ou

seja, é o grau que mede quanto a regra descoberta se aplica às amostras (KLÖSGEN;

ZYTKOW, 1996).

Seja

um conjunto de atributos preditivos (condição da regra) e

, a previsão, ou classe da

amostra. Uma regra de associação da forma

PENTÃOCSE

tem uma boa acurácia, sempre

que a equação (4.6) tiver um valor “aceitável”.

|)~||(|

PCPC

Acurácia

∩+∩

∩

= (

4.6)

Ou seja, a acurácia é igual ao número de registros que satisfazem

dividido pelo total

de registros que satisfazem

. Assim, o valor máximo (melhor resultado) é 100%, indicando

que a regra abrange todas as amostras de uma mesma classe, logo, não existe erro de

classificação.

Porém, na ocorrência de conflitos, representado por

|~|

∩

, uma regra abrange registros

que satisfazem

, mas não caracterizam a classe meta/objetivo,

. Nessa situação, o valor

da acurácia pode compreender o intervalo [0 a 100], cabendo ao usuário definir se esse valor é

aceitável ou não.

A abrangência de uma regra é definida como sendo o número de registros que satisfazem

dividido pelo total de registros que satisfazem

, equação (4.7):

|)|~|(|

PCPC

aAbrangênci

∩+∩

∩

= (4.7)

A abrangência mede a quantidade de registros cobertos por uma determinada regra. Como a

acurácia, seu valor máximo é 100%, indicando que todos os possíveis registros de uma

determinada classe meta foram cobertos por essa regra.

Quando a parcela ||~

∩

for diferente de zero, o valor da abrangência estará no intervalo

[0, 100], indicando que ainda existem registros da classe meta não cobertos por essa regra.

Baseado nas definições de acurácia e abrangência, conclui-se que a qualidade de uma regra é

resultante da maximização destes dois valores.

4.4.5. Critério de seleção

O processo de seleção baseia-se no princípio da sobrevivência dos melhores indivíduos. O

AG deve conduzir o processo de busca de forma a favorecer os indivíduos mais aptos. Assim,

os cromossomos com melhor aptidão deverão possuir maior probabilidade de serem

selecionados aos pares para reprodução.

Por meio da reprodução, os indivíduos com alta aptidão transferem seu material genético para

próxima geração, enquanto os indivíduos com baixa aptidão são descartados da população.

Existem diversos esquemas de seleção. Neste trabalho, optou-se pelo esquema conhecido

como seleção proporcional, onde a probabilidade de um indivíduo ser selecionado para

reprodução é proporcional à medida de sua aptidão relativa à população.

Neste caso, a probabilidade

do indivíduo

ser selecionado, é dada pela equação (4.8):



)(

(4.8)

onde

é a função de aptidão e

o tamanho da população.

Neste método, cada indivíduo da população é representado numa roleta com uma fatia

proporcional ao seu índice de aptidão. Assim, os indivíduos com alta aptidão recebem uma

porção maior da roleta, enquanto os de baixa recebem uma porção proporcionalmente menor.

Finalmente, simula-se um sorteio girando-se a roleta para escolher os indivíduos que

participarão do processo de reprodução.

A forma utilizada para simular a roleta consistiu em ordenar os indivíduos pelo valor de sua

aptidão, calcular a aptidão percentual em relação à população, calcular a aptidão percentual

acumulada e selecionar dois pais para reprodução a partir de um número aleatório gerado no

intervalo de 0 e 100.

Para ilustrar este processo considere os dados da tabela 4.5.

TABELA 4.5

Dados para simulação da roleta

Ordem Aptidão

Aptidão

Ordenada

Aptidão

Percentual

Aptidão

Percentual

Acumulada

1 0,24 0,75 35,89 35,89

2 0,39 0,53 25,36 61,24

3 0,18 0,39 18,66 79,90

4 0,53 0,24 11,48 91,39

5 0,75 0,18 8,61 100,00

Somatório 2,09 100,00

Conforme a equação (4.8), a probabilidade de um indivíduo ser selecionado para reprodução é

proporcional à medida de sua aptidão relativa à população (aptidão percentual), representado

no gráfico da figura 4.11.

FIGURA 4.11 - Aptidão percentual para os dados da tabela 4.5

A população é percorrida na ordem, enquanto o número aleatório gerado for maior do que a

aptidão percentual acumulada. Quando a condição não for mais satisfeita, será selecionado o

indivíduo anterior, cuja aptidão percentual acumulada atendeu a condição. Como no exemplo

da tabela 4.6.

TABELA 4.6

Simulação da Roleta – seleção do indivíduo

Número Aleatório 24 42 70 85 95

Indivíduo Selecionado 1 2 3 4 5

4.4.6. Operadores genéticos

Os operadores genéticos são responsáveis pela transformação da população ao longo de

sucessivas gerações, visando produzir uma solução que seja satisfatória no final do processo.

Os operadores genéticos atuam na reprodução criando e/ou alterando indivíduos e são

essenciais para a diversificação da população.

Basicamente, existem dois operadores genéticos: cruzamento (

crossover)

e mutação. O

cruzamento é um operador genético predominante, enquanto a mutação é um operador

genético secundário. Assim, a probabilidade de aplicação do operador de cruzamento deve ser

maior do que a do operador de mutação.

O cruzamento ou

crossover

é o operador genético responsável pela recombinação das

características dos pais durante a reprodução. Este operador permite que novas gerações

herdem características dos seus ancestrais e possibilita o surgimento de novas soluções a

partir da mistura de material genético dos pais.

Os tipos de operadores de cruzamento utilizados neste trabalho foram: o Cruzamento de um

Ponto, o Cruzamento Uniforme e o Cruzamento Aritmético.

No Cruzamento de um Ponto, um ponto de cruzamento é escolhido aleatoriamente e, a partir

deste ponto, as informações genéticas dos pais são combinadas numa nova solução. Um filho

é gerado pela combinação das informações anteriores a este ponto em um dos pais, com as

informações posteriores a este ponto no outro pai, como ilustrado no exemplo a seguir:

No Cruzamento

Uniforme, um novo filho é gerado a partir de uma máscara criada

randomicamente com valores 0 ou 1. As posições com valor 0 terão seus valores copiados do

Pai 1 nos atributos correspondentes. As posições com valor 1 terão seus valores copiados do

Pai 2 nos atributos correspondentes, como ilustrado no exemplo a seguir:

No Cruzamento

Aritmético, um novo filho é gerado a partir da média aritmética dos atributos

de seus pais, como ilustrado no exemplo a seguir:

O operador genético de mutação é o responsável pela introdução e manutenção da diversidade

genética da população. Este operador altera arbitrariamente um gene, possibilitando introduzir

novos elementos na população.

A mutação assegura que a probabilidade de se chegar a qualquer ponto do espaço de busca

nunca será zero, além de contornar o problema de mínimos locais, pois com este mecanismo,

altera-se levemente a direção da busca. Os tipos de operadores de mutação utilizados neste

trabalho foram: Mutação Simples, Mutação por Adição e Mutação por Translocação.

Na Mutação Simples, ilustrada no exemplo a seguir, uma posição é selecionada

arbitrariamente e o valor mínimo e máximo deste atributo é substituído pelo valor resultante

das equações (4.9) e (4.10), respectivamente.

−

ValorMédiom

(4.9)

ValorMédioM

(4.10)

onde

ValorMédio

corresponde ao valor médio do atributo, considerando todas as amostras da

classe e β é calculado pela equação (4.11):

tolerânciaMinMax

∗

−

)(

(4.11)

onde

Max

Min

são os valores máximo e mínimo do atributo, considerando todas as

amostras da classe e

tolerância

é uma taxa de acréscimo selecionado pelo usuário.

Na Mutação por Adição, uma posição é selecionada arbitrariamente e o valor da equação

(4.12) é subtraído do valor mínimo do atributo e adicionado ao valor máximo.

nMinMax

/)(

−

(4.12)

onde

Max

Min

são os valores máximo e mínimo do atributo selecionado e

é um número

aleatório.

Na mutação por translocação, uma posição é selecionada aleatoriamente, a fim de realizar a

permutação dos valores dos atributos entre os pais, gerando dois filhos com o material

genético combinado, como ilustrado no exemplo a seguir:

4.4.7. Critério de substituição

O critério de substituição diz respeito à maneira pela qual os indivíduos criados são inseridos

na população. Neste trabalho, dentre os diversos processos existentes, optou-se pela

substituição de toda a população por novos indivíduos gerados após o processo de seleção e

reprodução.

4.4.8. Critério de parada

O critério de parada define o parâmetro que será utilizado para encerrar o processo de

evolução genética. Os critérios implementados neste trabalho foram:

Número de Gerações

– encerra a evolução quando o algoritmo atingir o número de gerações

informadas pelo usuário.

Estabilização

– encerra a evolução quando a aptidão do melhor indivíduo se mantiver

constante pelo número de gerações informadas pelo usuário.

Acurácia/Abrangência

– encerra a evolução quando a acurácia e abrangência do melhor

indivíduo atingir o valor informado pelo usuário.

4.4.9. Parâmetros de influência

Um AG possui diversos parâmetros que podem ser configurados para melhorar sua

performance. Como a influência de cada parâmetro no desempenho do algoritmo depende das

características particulares do problema, a otimização desses parâmetros dependerá da

realização de um grande número de testes.

É relevante que a população inicial contenha cromossomos suficientemente variados a fim de

evitar a convergência prematura. Idealmente um AG deve convergir sem perda de diversidade

genética. Assim, suas chances de encontrar o ótimo global são aumentadas, além de evitar

parada prematura em locais ótimos.

A eficiência e o desempenho global dos AGs são afetadas pelo tamanho da população.

Geralmente uma grande população permite uma cobertura representativa do domínio do

problema e fornece diversidade para prevenir convergências prematuras, mas exigem maiores

recursos computacionais e tempo de processamento. Uma pequena população pode

comprometer o desempenho, uma vez que fornece uma pequena cobertura do espaço de busca

do problema.

A taxa de cruzamento afeta a velocidade de introdução de novas estruturas na população.

Quanto maior for esta taxa, mais rapidamente novas estruturas serão introduzidas. Porém,

uma taxa muito alta pode significar perda de estruturas de alta aptidão. Enquanto que um

valor baixo pode tornar a convergência demasiadamente lenta. Uma taxa de mutação baixa

previne a estagnação em ótimos locais, além de possibilitar que se alcance qualquer ponto do

espaço de busca. Já uma taxa de mutação alta torna a busca essencialmente aleatória.

O algoritmo genético desenvolvido neste trabalho, apêndice “A” (Descrição dos Programas

AGCTIM e CTIM), permite ao usuário configurar o tamanho da população, a taxa de

cruzamento e mutação, dentre outros parâmetros, visando aumentar o seu desempenho. Além

disso, foram desenvolvidas e aplicadas as seguintes técnicas: Normalização Linear, Elitismo,

Sementes, Busca Local e Interpolação Adaptativa.

Uma desvantagem do método de seleção proporcional é possuir alta variância. Assim, o

método da roleta pode selecionar várias vezes para reprodução um mesmo cromossomo,

devido a sua alta aptidão, diminuindo a diversidade da população. Esta desvantagem pode

produzir uma convergência prematura do algoritmo para uma solução que não seja a ideal, ou

então, pode tornar as aptidões muito semelhantes entre si numa etapa avançada da evolução,

provocando a estagnação do algoritmo em conseqüência da baixa pressão seletiva.

Considere, por exemplo, as aptidões constantes da tabela 4.7.

TABELA 4.7

Exemplo de aptidões para utilização do método da roleta

Ranking 6 5 4 3 2 1

Aptidão (fitness) 0,99 0,2 0,2 0,15 0,1 0,05

Se fizermos as chances de sorteio dos indivíduos proporcionais às suas aptidões, por meio do

emprego da equação (4.8), obteremos as probabilidades da tabela 4.8.

TABELA 4.8

Probabilidade segundo o método de seleção proporcional

Ranking 6 5 4 3 2 1

Aptidão (fitness) 0,99 0,2 0,2 0,15 0,1 0,05

Probabilidade 58,6 11,8 11,8 8,9 5,9 3,0

A probabilidade do super-indivíduo (cromossomo que possui uma avaliação muito melhor

que a dos demais) com aptidão 0,99 ser escolhido para reprodução é tão grande, que ele será

selecionado várias vezes para cruzar consigo mesmo, conforme é possível observar no gráfico

da figura 4.12. Dessa forma, é provável que não sejam gerados novos indivíduos e nem

ocorram novas combinações de material genético diferente. Em conseqüência, a população

tende a ficar semelhante a um único indivíduo não ótimo e ocorre o fenômeno da

convergência prematura, isto é, a população pára de evoluir.

FIGURA 4.12 - Probabilidade de seleção proporcional à aptidão

A Normalização Linear permite distribuir linearmente as aptidões dos indivíduos entre valores

máximo e mínimo, evitando este problema, equação (4.13):

(

)

1tan −×+=

RANKIncrementoteConsMinaNormalizadAptidão

(4.13)

onde

Min

corresponde à aptidão mínima e

IncrementoteCons

tan corresponde à diferença

de aptidão entre 2 elementos consecutivos no ranking, é obtida pela equação (4.14):

(

)

( )

tan

−

DifAptidõesNum

MinMax

IncrementoteCons (4.14)

onde

(

)

MinMax −

é a diferença entre o valor máximo e o valor mínimo das aptidões e

DifAptidõesNum corresponde ao número de aptidões diferentes (ou seja, o número de

aptidões sem repetição).

Considerando os dados da tabela 4.8 e definindo que a aptidão máxima será 100 e a mínima

10, existem 5 aptidões diferentes (0,99 - 0,20 - 0,15 - 0,10 - 0,05);

(

)

( )

(

)

5,22

10100

tan ==

−

DifAptidõesNum

MinMax

IncrementoteCons

(

)

(

)

15,22101tan −×+=−×+=

iii

RANKRANKIncrementoteConsMinaNormalizadAptidão

A tabela 4.9 apresenta o cálculo das novas aptidões e probabilidades dos indivíduos.

TABELA 4.9

Cálculo das novas aptidões e probabilidades dos indivíduos

Aptidão 0,99 0,2 0,2 0,15 0,1 0,05

Ranking 5 4 4 3 2 1

Normalização 100,0 77,5 77,5 55,0 32,5 10,0

Probabilidade 28,4 22,0 22,0 15,6 9,2 2,8

Dessa forma, os valores das aptidões variam linearmente entre 100 e 10, distribuindo melhor

as chances de sorteio dos indivíduos, figura 4.13. Este procedimento diminui as chances de

um superindivíduo ser sorteado diversas vezes e causar uma convergência prematura.

FIGURA 4.13 – Probabilidade de sorteio – roleta normalizada

No algoritmo genético geracional ocorre a perda de bons indivíduos em virtude de toda a

geração (de pais) ser integralmente substituída por outra mais nova (de filhos). A fim de evitar

a convergência prematura decorrente da falta de convivência entre indivíduos de diferentes

gerações, optou-se por empregar o método denominado de elitismo, ou seja, o melhor

indivíduo de uma geração é copiado para geração seguinte.

Uma semente é um cromossomo que representa uma boa solução. Ao inicializar um novo

experimento, este cromossomo é inserido na população inicial a fim de contribuir com seu

material genético no início do processo evolutivo. Neste trabalho, caso o usuário selecione a

opção de inserção de semente, será inserido na população inicial um cromossomo cujos

atributos assumirão os valores correspondentes aos limites superior e inferior do atributo,

considerando todas as amostras da classe considerada, conforme ilustrado na tabela 4.10.

TABELA 4.10

Exemplo de semente

Amostras

Descritor de Textura (CVE)

Atributo 1 - Red Atributo 2 - Green Atributo 3 - Blue

Min Max Min Max Min Max

122,5 144,1 200,2 231,7 240,0 247,8

118,2

140,3

198,3

237,6

225,9

250,2

127,9 139,8 203,5 229,4 232,8 254,1

131,0 138,4 199,1 227,1 245,2 253,9

120,7

145,7

204,5

245,9

232,6

255,0

Semente

Descritor de Textura (CVE)

Atributo 1 - Red Atributo 2 - Green Atributo 3 - Blue

Min Max Min Max Min Max

118,2 145,7 198,3 245,9 225,9 255,0

A busca local é um procedimento heurístico que visa refinar uma solução encontrada. Neste

trabalho, a busca local consiste em encontrar a melhor avaliação para os genes

correspondentes aos valores mínimo e máximo de cada atributo para um novo cromossomo

gerado no processo de reprodução, conforme fluxograma da figura 4.14.

gene

Mínimo ou

Máximo ?

Minimo = Mínimo -1

Repita até o último gene

Máximo = Máximo+1

Percorra todas as

amostras e calcule

a aptidão do gene

Aptidão <=

aptidão

anterior ?

Selecione um novo gene

Incremente ou

decremente 1

(minimo ou

máximo) conforme

o caso

Fim

SIM

NÃO

Mínimo Máximo

Melhor gene =

gene atual

Último

gene ?

Busca Local

SIM

NÃO

FIGURA 4.14 – Fluxograma da busca local proposta

Assim, a busca local considera cada gene separadamente. Nos genes correspondentes aos

valores mínimos de cada atributo, a busca local decrementa uma unidade e aplica este novo

valor mínimo a todas as amostras das classes existentes, calculando o valor da aptidão deste

gene. Caso esta aptidão seja melhor que a anterior, este valor é armazenado e o valor mínimo

é novamente decrementado.

Caso a aptidão não se altere ou piore, a busca local passa para o próximo gene, guardando o

melhor valor encontrado. Se este novo gene for correspondente ao valor máximo do atributo,

a busca local realiza o mesmo processo descrito anteriormente com a diferença que, ao invés

de decrementar uma unidade, ela passa a incrementar uma unidade. Após todos os genes

serem analisados, os valores máximo e mínimo passam a assumir os valores das melhores

avaliações de cada gene encontrados no processo.

Um importante fator para o bom desempenho de um AG é a manutenção da diversidade da

população ao longo das gerações. Para controlar a diversidade é necessário um mecanismo de

determinação das probabilidades de sobrevivência, pois, um exacerbado favorecimento dos

indivíduos mais aptos implicará na diminuição da variedade da população e causará uma

possível convergência prematura para um ótimo local.

Assim, foi implementado um mecanismo de determinação de probabilidades de sobrevivência

dos indivíduos mais aptos, baseado na pressão seletiva, equação (4.15) :

iaAptidãoMéd

AptidãoMax

ivaessãoSelet =Pr (4.15)

onde

AptidãoMax é o valor da maior aptidão do cromossomo da população na

geração e

iaAptidãoMéd é a média das aptidões dos cromossomos da população na

geração .

Através da manutenção do valor da pressão seletiva em torno de 1.5, procura-se manter a

diversidade dos indivíduos relativamente uniforme em cada geração. Valores maiores

provocariam o surgimento de super-indivíduos que poderiam levar a uma convergência

prematura para um ótimo local. Valores menores poderiam estagnar a busca por falta de

diversidade de material genético. A diversidade torna-se nula quando a pressão seletiva for

igual a 1, correspondendo à situação na qual todos os indivíduos da população são iguais.

A interpolação adaptativa proposta neste trabalho, realiza a seleção randômica dos diversos

operadores genéticos programados e, baseado na pressão seletiva da população em uma

geração, altera a probabilidade de ocorrência destes operadores (conforme valores a seguir) a

fim de manter a pressão seletiva dentro de uma faixa considerada ideal ao longo de todo o

processo evolutivo.

Pressão Seletiva <1.4

Pressão Seletiva >1.6

Taxa de cruzamento entre 70% e 100%

Taxa de cruzamento entre 50% e 60%

Taxa de mutação entre 10% e 20%

Taxa de mutação entre 1% e 5%

Taxa de busca local entre 25% e 50%

Taxa de busca local entre 5% e 25%

4.5. CLUSTERIZAÇÃO

Dado um conjunto ,X um problema de Clusterização consiste em se agrupar os objetos

(elementos) de

de modo que objetos mais similares fiquem no mesmo cluster (grupo) e os

objetos menos similares sejam alocados para clusters distintos, figura 4.15.

FIGURA 4.15 - Esquema funcional de um algoritmo de clusterização

Problemas de clusterização podem ser definidos formalmente da seguinte maneira (OCHI,

2004):

Dado um conjunto com

elementos

{

}

XXXX ...,,

2,1

= , o problema de clusterização

consiste na obtenção de um conjunto de k clusters,

{

}

CCCC ,...,,

= , tal que haja uma

maior similaridade entre os elementos contidos em um cluster

C do que qualquer um destes

com os elementos de um dos demais clusters do conjunto C . O conjunto C é considerado

uma clusterização com k clusters caso as condições das equações (4.16 - 4.18) sejam

satisfeitas:



(4.16

)

kiparaC

≤≤∅≠ 1:, (4.17)

jikjiparaCC

≠≤≤∅=∩ ,,1:, (4.18)

Se o valor de k for conhecido, o problema é referenciado na literatura como “problema de k-

clusterização” (FASULO, 1999). Caso contrário, o problema é referenciado como “problema

de clusterização automática” e a obtenção do valor de k faz parte do processo de solução

(DOVAL; MANCORIDIS; MITCHELL, 1999). A clusterização é uma ferramenta útil para o

estudo e compreensão do comportamento de dados em diferentes situações e tem sido

empregadas na solução de diversos problemas nas mais variadas áreas do conhecimento.

4.5.1. Medidas de Similaridade

O objetivo da clusterização é agrupar os elementos de um conjunto de tal forma que os grupos

formados sejam constituídos por elementos que possuam maior similaridade com os

elementos do mesmo grupo do que com qualquer dos elementos de outros grupos.

Para medir o quanto um elemento é similar a outro, a fim de determinar se devem pertencer

ou não a um mesmo cluster, são utilizadas medidas de similaridade. O critério de similaridade

mais comum quando se utilizam atributos numéricos baseia-se nas funções de distância.

Para empregar estas funções é preciso representar cada elemento como um vetor no espaço

dimensional das características. Neste caso, quanto menor for à distância entre um par de

elementos, maior é a similaridade entre eles. Espera-se que à distância entre objetos de um

mesmo agrupamento seja significativamente menor do que à distância entre objetos de

agrupamentos diferentes.

Dentre as medidas de distância mais utilizadas, encontram-se a distância “city-block ”

(para

) e a distância euclidiana (para

), equação (4.19):

jlilji

xxXXd

),(













−=



(4.19)

4.5.2. Métodos de Agrupamento

A busca pela melhor solução no espaço de soluções possíveis torna o processo de

clusterização num problema NP-Difícil. A utilização de métodos exatos para obtenção da

solução ótima fica impraticável, uma vez que a verificação exaustiva de todas as

configurações de agrupamentos possíveis é computacionalmente inviável. Há

aproximadamente

( ) ( )

−













−



maneiras de repartir

elementos em k

agrupamentos.

Por exemplo, existem os seguintes números de soluções possíveis para se combinar 10

elementos, 100 elementos e 1000 elementos em 2 clusters, respectivamente: 512 soluções,

6,33825 x10

soluções e 5,3575x10

300

soluções.

A fim de reduzir a complexidade na solução do problema, utilizam-se metaheurísticas

capazes de fornecer soluções sub-ótimas em tempo satisfatório. Entretanto, as metaheurísticas

são normalmente desenvolvidas para certas classes de problemas, não sendo genéricas o

suficiente para obter bons resultados em toda gama de aplicações de clusterização existentes.

Na literatura são encontradas diversas metaheurísticas para a solução de problemas de

clusterização (BERKHIN, 2002), basicamente elas podem ser classificadas em métodos

hierárquicos e métodos de particionamento (FASULO, 1999).

Os Métodos Hierárquicos se dividem em Métodos Hierárquicos Aglomerativos (bottom-up) e

Métodos Hierárquicos Divisivos (top-down).

Os Métodos Hierárquicos Aglomerativos (bottom-up) iniciam com

clusters de um elemento

e os clusters vizinhos são agregados até que o número desejado de clusters seja alcançado. Os

Métodos Hierárquicos Divisivos (top-down) iniciam com um cluster de

componentes que é

dividido sucessivamente até que o número de cluster desejado seja alcançado.

Os Métodos Hierárquicos geram uma hierarquia de clusters, normalmente representada

através de uma estrutura em árvore, conforme exemplificado na figura 4.16.

FIGURA 4.16 – Exemplo de árvore de clusters na clusterização hierárquica

Os algoritmos de clusterização hierárquica possuem a vantagem de lidarem com qualquer

medida de similaridade e são aplicáveis a qualquer tipo de atributo (numérico ou categórico).

Porém, tem como desvantagem o fato de não revisitarem os clusters construídos. Ou seja, no

método hierárquico aglomerativo, uma vez realizado a fusão de dois objetos dentro de um

cluster, estes não mais serão separados, permanecendo até o final do procedimento juntos no

mesmo cluster. De igual forma, no método hierárquico divisivo, uma vez separados dois

objetos, eles não mais serão agrupados em um mesmo cluster (BERKHIN, 2002). Em

imagens de satélite, devido ao grande número de objetos (pixels) presentes, esta variação

raramente é utilizada por ser mais custosa computacionalmente (RICHARDS, 1999).

Os Métodos de Partição Baseados em Recolocação tem por objetivo particionar um conjunto

de dados com

elementos em k grupos distintos de forma a minimizar um critério

escolhido. Estes métodos tentam descobrir novos clusters realocando interativamente pontos

entre os subconjuntos, de forma a melhorar os clusters gradualmente, o que não ocorre nos

métodos hierárquicos.

Freqüentemente, os métodos de particionamento encontram clusters com qualidade superior

(maior similaridade interna) aos dos encontrados pelos métodos hierárquicos (NG; HAN,

1994). Devido a este melhor desempenho, os algoritmos de particionamento normalmente são

mais empregados. Dentre eles, os que são baseados em um ponto central (média dos atributos

dos objetos - k-means) (ZHANG; HSU; DAYAL, 2001) ou em um objeto representativo para

o cluster (k-medoids) (KAUFMAN; ROUSSEEUW, 2005).

A qualidade do resultado obtido com os métodos de particionamento depende da seleção

coerente das seguintes variáveis: escolha dos atributos, homogeneização das variáveis,

medidas de similaridade, critérios de agrupamento, escolha do algoritmo, e definição do

número de clusters.

4.6. IMPLEMENTAÇÃO COM ALGORITMO K-MEANS

Nesta seção, são apresentados os aspectos computacionais do algoritmo K-Means proposto

para o problema de classificação de padrões em imagens multiespectrais.

K-means é um método amplamente difundido, existindo muitas variações propostas na

literatura e diversos nomes (K-médias, isodata, ou migração de médias). Em Sensoriamento

Remoto, ele é bastante utilizado para executar procedimentos de classificação não

supervisionada de imagens de satélite (SCHOWENGERDT, 1997).

K-means é um método de partição baseado em recolocação que necessita da definição a priori

do número de agrupamentos k . O critério de custo a ser minimizado é definido em função da

distância dos elementos em relação aos centros dos agrupamentos.

Usualmente, este critério é a soma residual dos quadrados das distâncias, geralmente a

distância euclidiana. Entende-se por soma residual dos quadrados, a soma dos quadrados das

distâncias dos elementos ao centróide do seu cluster. Para toda partição, a soma residual dos

quadrados, será a soma de todas as somas dos quadrados das distâncias de cada grupo. Quanto

menor for este valor, mais homogêneos serão os objetos dentro de cada grupo e melhor será a

partição (COELHO; EBECKEN, 2001).

O elemento representativo de um cluster é o seu centróide, que possui um valor médio para os

atributos considerados, relativos a todos os elementos do cluster. A utilização do centróide

como elemento representativo de um cluster é conveniente apenas para atributos numéricos e

possui um significado geométrico e estatístico claro, podendo, entretanto, receber muita

influência de um único elemento que se encontre próximo à fronteira do cluster.

A partir de uma estimativa inicial das coordenadas dos centros dos agrupamentos (centróides),

o algoritmo calcula a distância de cada ponto do conjunto a estes centróides. A seguir, o

algoritmo aloca cada elemento do conjunto em um grupo, de acordo com a menor distância ao

centróide correspondente. A nova estimativa das coordenadas dos centróides é calculada pela

média aritmética das coordenadas dos pontos associados a cada grupo, figura 4.17.

FIGURA 4.17 - Aplicação do método k-means

O método K-means é sensível ao particionamento inicial realizado, em virtude da escolha das

coordenadas dos k centróides dos clusters ser feita inicialmente de forma aleatória. A partir

deste primeiro particionamento, o algoritmo realiza uma busca de um ponto de máximo para o

seu critério de parada. Não há garantias de que o algoritmo encontre o máximo global, sendo

possível encontrar distintas soluções em diferentes execuções do algoritmo.

O K-means é um tipo de algoritmo de classificação, que pode ser utilizado para a classificação

não-supersionada. Abaixo é apresentado um algoritmo básico:

(1) Determinar as posições iniciais dos k centróides dos clusters;

(2) Alocar cada elemento ao cluster do centróide mais próximo;

(3) Recalcular os centros dos clusters a partir dos elementos alocados;

(4) Repetir os passos de 2 a 4 segundo algum critério de convergência.

Na implementação desenvolvida, inicialmente é necessário selecionar um conjunto de

amostras de treinamento para cada região de interesse. Essas amostras são regiões da imagem

obtidas por janelas de tamanho

(

,...,

) definido pelo usuário. Cada

amostra selecionada passa a representar um ponto no espaço euclidiano tridimensional. As

coordenadas dos pontos são definidas pelo valor do CVE da região de amostra calculados

para cada canal RGB (

RED

CVE

GREEN

CVE

BLUE

CVE

). Então, as amostras do conjunto de

treinamento são agrupadas por meio do algoritmo de clusterização K-means.

A fim de evitar um número excessivo de amostras, somente amostras com coordenadas

significativas são incluídas no grupo de amostras de treinamento. Entende-se por valores

significativos, uma amostra cuja coordenada provoque uma alteração na configuração do

cluster. Em seguida, é realizada a clusterização das amostras e os centróides das classes são

calculados por meio do algoritmo K-Means, figura 4.18.

FIGURA 4.18 – Clusterização das amostras baseado no valor do CVE em cada banda espectral

Finalmente, os valores dos centróides (CVE’s para os canais RGB) são utilizados na

classificação do restante da imagem, figura 4.19.

FIGURA 4.19 – Centróides das amostras de treinamento no espaço euclidiano tridimensional

O método proposto utiliza um processo de classificação híbrida, com a realização de uma

classificação supervisionada inicial das amostras de treinamento para obtenção dos centróides

dos clusters, seguido de uma classificação não supervisionada do restante da imagem, baseado

na distância das amostras de teste a estes centróides.

Para segmentar somente textura de interesse na imagem, é verificado se a distância da amostra

de teste é maior do que uma distância de tolerância. Caso esta distância seja menor, o pixel

será rotulado com a cor da classe correspondente. Caso contrário, ele permanecerá com sua

cor original. O critério de tolerância adotado foi a maior distância da amostra de treinamento

ao centro do seu cluster.

4.7. CONSIDERAÇÕES FINAIS

Este capítulo apresentou o coeficiente proposto para quantificação da textura de uma região,

bem como, as duas abordagens desenvolvidas para sua utilização na segmentação por textura.

A primeira abordagem utilizou Algoritmos Genéticos para geração de regras de classificação,

baseado na faixa de valores do CVE para amostras de treinamento. A segunda abordagem

utilizou o método de partição, baseado em recolocação, K-Means para clusterização das

amostras de treinamento. As coordenadas dos centróides das classes passam, então, a serem

utilizadas na segmentação do restante da imagem. O Apêndice “A” apresenta as principais

funcionalidades dos programas desenvolvidos (algoritmo genéticos e K-Means), suas

possibilidades, limitações e particularidades de ordem conceitual e técnica. O próximo

capítulo descreverá os testes e resultados alcançados com a estratégia exposta.

5. TESTES, RESULTADOS E DISCUSSÃO

Este capítulo apresenta os resultados dos testes realizados para examinar as características de

desempenho do coeficiente de textura desenvolvido (CVE), seus limites de utilização e sua

aplicabilidade em diversas situações. Foram projetados testes teóricos, testes com mosaico de

texturas naturais, testes com texturas de imagens reais, testes com imagens obtidas por

equipamentos médicos e testes com imagens de satélites. Testes comparativos foram

realizados para confrontar os resultados da metodologia proposta com os de outras técnicas

disponíveis na literatura.

5.1. TESTES TEÓRICOS

A fim de verificar o desempenho do coeficiente de variação espacial na discriminação de

texturas coloridas foram realizados testes teóricos experimentais. O teste de invariância do

CVE à rotação e à reflexão da imagem, pode ser visto na figura 5.1.

FIGURA 5.1 – Imagem de teste após diversas transformações geométricas

A figura 5.1a é uma imagem colorida de tamanho

pixels, nas cores azul, verde, roxo,

vermelho, amarelo e banco, distribuídas de tal forma a possibilitar a visualização das

transformações geométricas realizadas. As figuras 5.1b. e 5.1c. correspondem a figura 5.1a.

refletida verticalmente e horizontalmente, respectivamente. As figura 5.1d. e 5.1e. resultam

da rotação da figura 5.1a. de 90

e 180

no sentido horário, respectivamente. A figura 5.1f. é

resultante da rotação da figura 5.1a. de 45

no sentido horário.

A tabela 5.1 apresenta os valores do CVE calculado para estas imagens. Observando-a

verifica-se que o valor do CVE calculado para o flip horizontal, flip vertical, rotação de 90º e

180º não sofreu alteração, mostrando a invariância do CVE a essas transformações

geométricas da imagem.

TABELA

5.1

Cálculo do CVE – testes de rotação e reflexão

CVE

Figura Ação

R G B

5.1a Imagem original 421,936

300,094

326,386

5.1b Flip vertical 421,936

300,094

326,386

5.1c Flip horizontal 421,936

300,094

326,386

5.1d Rotação 90º horários 421,936

300,094

326,386

5.1e Rotação 180º horários 421,936

300,094

326,386

5.1f Rotação 45º horários 466,793

439,793

459,001

No cálculo da rotação de 45º, figura 5.1f, o CVE sofre alteração em virtude da perda de

informação (dentro da janela de tamanho 55

pixels) decorrente desse tipo de transformação.

Isso ocorre por que o CVE trabalha com classes de distâncias (

Manhatan

cityblock

quarteirão

, figura 5.2), a mudança de valores de intensidade do pixel entre classes de

distâncias provoca a alteração do CVE.

FIGURA 5.2 – Classes de distâncias para uma matriz

pixels

O próximo teste avaliou o comportamento do CVE diante da mudança dos níveis de

intensidade do pixel na janela de amostras. Para isso utilizou-se uma imagem de tamanho

pixels, onde todos os pixels sempre possuíam os mesmos valores de intensidade que os

outros. O valor do CVE foi calculado para cada mudança de intensidade (variando a

intensidade do conjunto de pixels de 0 a 255). A figura 5.3 apresenta os valores de CVE

obtidos conforme o valor da intensidade dos pixels na janela de amostra. Este teste permitiu

verificar que o CVE pode distinguir regiões de pixels com intensidade homogênea para toda a

escala de intensidade considerada (0 - 255). Assim, diferentes regiões em escala de cinza ou

cor (homogêneas) podem ser facilmente discriminadas.

ESCALA CVE

120

150

180

210

240

270

300

330

360

390

420

450

480

510

540

570

600

630

1 16 31 46 61 76 91 106 121 136 151 166 181 196 211 226 241 256

INTENSIDADE

CVE

FIGURA 5.3 – CVE para diferentes intensidades de pixels em amostra homogênea

O próximo teste avaliou o comportamento da mudança do tamanho da janela considerando

amostras com pixels de intensidade iguais (neste exemplo, com valor de intensidade dos

pixels igual a 255, ou seja, três imagens brancas). As figuras 5.4a, 5.4b e 5.4c apresentam

diferentes dimensões de janelas ( 33

, 55

, 77

, respectivamente, das matrizes das imagens

brancas em um canal) com as intensidade e classes de distâncias destacadas em colorido.

FIGURA 5.4 –Teste com diferentes dimensões da janela de amostra.

O valor do CVE calculado para as três matrizes, figura 5.4, foi igual a

626,623

. Para janelas

com pixels de mesma intensidade (níveis de intensidade homogêneos) o valor do CVE não

sofre alteração com a mudança de escala, pois a variância e o desvio padrão das intensidades

nas classes de distâncias são nulos. Numa amostra com níveis de intensidade heterogêneos, a

mudança do tamanho da janela implicará na alteração do valor do CVE em função da

alteração dos valores existentes nas classes (variabilidade dentro das classes de distâncias).

5.2. TESTES COM MOSAICO DE TEXTURAS NATURAIS

A fim de aprofundar os testes experimentais realizados na seção anterior, foram realizados nas

subseções 5.2.1 e 5.2.2 testes de invariância à rotação e à reflexão, variância à combinação de

bandas, segmentação e localização do contorno considerando mosaicos de diferentes texturas

extraídas de imagens de satélite.

As seções 5.2.3 a 5.2.7 apresentam diversos testes com mosaicos de diferentes texturas

naturais reais (pedra, madeira, papel, água, solo e vegetação) construídas com a finalidade de

verificar o desempenho do método na segmentação de texturas complexas. Foram alterados os

seguintes parâmetros: número de amostras do conjunto de treinamento, tamanho da janela de

filtragem, espessura das bordas, tamanho da janela de amostragem e algoritmo de

segmentação empregado.

5.2.1. Teste de invariância à transformação geométrica

A figura 5.5 apresenta uma imagem sintética de

6464

pixels composta por quatro texturas

com tamanho de

3232

pixels cada, retiradas de imagens de satélite (classes A, B, C e D).

Este padrão é rotacionado e refletido de diferentes formas, sendo depois colocado sobre um

fundo com outra cena de satélite para compor a figura 5.6a. com

256256

pixels, que será

usada no teste invariância à transformação geométrica.

FIGURA 5.5 – Padrão com quatro classes de texturas com

3232

pixels

Este teste visa identificar as quatro classes de textura na imagem diante de diferentes

transformações. Não se espera que uma textura deixe de ser identificada e reconhecida por

estar em posição e direção angular diferente da usual. Este teste foi projetado para mostrar

que a medida aqui proposta atende a esta característica esperada de um identificador de

textura.

Para obtenção da solução, foram selecionadas amostras com janela de tamanho 33

pixels

(18 amostras da classe “A”, 20 amostras da classe “B”, 17 amostras da classe “C” e 18

amostras da classe “D”) que serviram de conjunto de treinamento para definição das regras de

segmentação de cada classe.

O resultado deste teste pode ser observado na figura 5.6b. Na identificação das classes, a

classe da textura “A” será identificada pela cor amarela, a classe da textura “B” pela cor

laranja, a classe da textura “C” pela cor vinho e a classe da textura “D” pela cor ciano.

Verifica-se que as rotações e translações não afetaram o reconhecimento da distribuição de

texturas presentes na imagem.

FIGURA 5.6 – Teste de invariância à rotação e reflexão

5.2.2. Teste de variância à ordem de combinação de bandas

As imagens multiespectrais podem ser visualizadas na forma de composições coloridas de três

bandas associadas aos canais red, green e blue. As diferentes bandas espectrais dos sensores

têm aplicações distintas em estudos de sensoriamento remoto. A combinação adequada dessas

bandas em função do conhecimento do comportamento dos alvos facilita a identificação de

regiões através da representação da informação em diferentes cores.

O CVE foi projetado para considerar não apenas as informações das bandas, mas também a

ordem como elas estão associadas aos canais red, green e blue. Esta característica busca

reproduzir a percepção humana das variações de cores provocadas pelas diferentes

composições (NUNES; CONCI, 2003e).

Assim, um segundo teste foi projetado para mostrar como o CVE se comporta quanto à ordem

de combinação das bandas. A figura 5.7 apresenta o padrão da figura 5.5 (cada textura com

3232

pixels) decomposto nos canais red, green e blue. A figura 5.8 apresenta seis diferentes

associações das bandas da figura 5.7.

FIGURA 5.7 – Decomposição das bandas do padrão da figura 5.5

FIGURA 5.8 – Diferentes combinações das bandas da figura 5.7

Para cada uma das quatro texturas originais do padrão da figura 5.5, foram selecionadas

amostras com janela de tamanho 33

pixels que serviram de conjunto de treinamento para

definição dos regras de cada classe (18 amostras da classe “A”, 20 da classe “B”, 17 da classe

“C” e 18 da classe “D”). A classe da textura “A” será identificada pela cor amarela, a classe

da textura “B” pela cor laranja, a classe da textura “C” pela cor vinho e a classe da textura

“D” pela cor ciano.

A figura 5.9a com tamanho de 64192

pixels, foi gerada a partir da união dos padrões da

figura 5.8. O resultado do teste de variância à combinação de bandas pode ser observado na

figura 5.9b. Verifica-se que as diferentes combinações de bandas afetaram o reconhecimento

da distribuição de classes de cor presentes na imagem.

FIGURA 5.9 – Teste de variância à combinação de bandas

Observa-se na figura 5.9b que apenas o padrão da classe “A” foi consideravelmente

segmentado em diferentes combinações das bandas. Isso foi causado pela similaridade dos

níveis de intensidade dos pixels nas bandas red, green e blue para esta classe (a classe “A” se

aproxima de uma imagem em escala de cinza). Independente das combinações das bandas

para este padrão, a sensação das cores sofre muito pouca alteração (tons de cinza).

5.2.3. Teste de variação do número de amostras

A figura 5.10 apresenta um mosaico de nove texturas de pedras com 300300

pixels. Cada

textura que compõe os mosaico possui 100100

pixels e demonstram a complexidade de

variação tonal existente. Através de uma janela de tamanho de 55

pixels foram selecionadas

amostras para dois experimentos nas quantidade indicadas na tabela 5.2.

FIGURA 5.10 – Mosaico de texturas de pedras

TABELA

5.2

Número de amostras para os experimentos 1 e 2 (pedras)

NÚMERO DE AMOSTRAS

CLASSE

EXPERIMENTO 1 EXPERIMENTO 2

A 19 9

B 10 5

C 13 6

D 17 8

E 12 6

F 17 8

G 14 7

H 12 6

I 15 7

A variação do número de amostras selecionadas por classe de texturas é decorrente de uma

estratégia de implementação que visa diminuir o número de amostras necessárias ao conjunto

de treinamento. Amostras cujo valor de CVE estejam dentro da faixa de valores máximo e

mínimo do CVE das amostras já extraídas, considerando a mesma classe, são descartadas por

não alterarem tais limites, conforme discutido na seção 4.6. Isto significa que cada amostra,

representada por um ponto no espaço tridimensional, que não altere a configuração do

contorno do agrupamento no espaço, são interiores ao agrupamento e não acrescentam

informação relevante. Assim, texturas homogêneas necessitam de um número menor de

amostras em relação às texturas heterogêneas.

As tabelas 5.3 e 5.4 apresentam as matrizes de classificação das amostras de pedras para o

conjunto de treinamento do experimento 1 e experimento 2, respectivamente. A matriz de

classificação apresenta a distribuição de porcentagem de amostras classificadas corretamente,

erroneamente e não classificados (NC). Uma matriz de classificação ideal deve apresentar os

valores da diagonal principal próximos a 100%, indicando que não houve confusão entre as

classes.

TABELA

5.3

Matriz de classificação – conjunto de treinamento – experimento 1 (pedras)

TABELA

5.4

Matriz de classificação – conjunto de treinamento – experimento 2 (pedras)

Observando a tabela 5.4, percebe-se que a classe “I”, do segundo experimento, teve 14,29%

de suas amostras (1 amostra de 7), erroneamente classificada na classe “C”.

Após a segmentação da imagem da figura 5.10 com as regras geradas na fase de treinamento

para o experimento 1 e 2, obteve-se as matrizes de classificação dos pixels do conjunto de

teste para os experimentos 1 e 2, indicado na tabela 5.5 e 5.6, respectivamente.

TABELA

5.5

Matriz de classificação – conjunto de teste – experimento 1 (pedras)

TABELA

5.6

Matriz de classificação – conjunto de teste – experimento 2 (pedras)

Comparando os resultados apresentados nas tabelas 5.5 e 5.6, verifica-se que o experimento 1

obteve melhor classificação nas classes “A”, “D”, “E”, “H” e “I”, enquanto o experimento 2

saiu-se melhor na classificação das classes “B”, “C”, “F” e “G”.

Porém, verifica-se na tabela 5.6 que a qualidade da classificação das amostras da classe “I”

teve sensível degradação. A textura da classe “I”, dentre as nove texturas do mosaico, foi

grandemente afetada pela redução de 15 para 7 amostras do conjunto de treinamento, devido a

grande variância interna de seu padrão.

O resultado da segmentação da imagem com as regras geradas com os conjuntos de

treinamento dos experimentos 1 e 2 pode ser observado na figura 5.11. Confirma-se

visualmente a perda da qualidade da classificação da textura da classe “I”, do experimento 2,

resultante da redução do número de amostras do conjunto de treinamento.

Conclui-se que o método proposto necessita de um menor número de amostras representativas

para o conjunto de treinamento no caso de texturas homogêneas (com menor variância interna

do padrão) em relação a texturas heterogêneas (com maior variância interna do padrão).

FIGURA 5.11 – Segmentação do mosaico de pedras – experimento 1 e 2

As figuras 5.12a. e 5.12b. apresentam o resultado da filtragem das figuras 5.11a. e 5.11b,

respectivamente, por um filtro de mediana com janela de tamanho de 33

pixels. Pode-se

notar o preenchimento das regiões interiores e eliminação de arestas. A operação de filtragem

é realizada somente nos pixels classificados através de uma nova imagem gerada pelo

aplicativo sem os pixels não segmentados (fundo branco).

FIGURA 5.12 – Aplicação do filtro de mediana com janela de tamanho de

pixels.

As tabelas 5.7 e 5.8 mostram a matriz de classificação dos pixels do conjunto de teste após

aplicação do filtro de mediana, com janela de tamanho de 33

pixels, para os experimentos 1

e 2, respectivamente. Comparando a tabela 5.5 com a tabela 5.7, experimento 1, e

comparando a tabela 5.6 com a tabela 5.8, experimento 2, verifica-se na diagonal principal

que o percentual de erros de classificação diminuiu para todas as classes, o que indica a

adequação do filtro implementado para estes experimentos.

TABELA 5.7

Matriz de classificação – conjunto de teste com filtro de mediana – experimento 1 (pedras)

TABELA 5.8

Matriz de classificação – conjunto de teste com filtro de mediana – experimento 2 (pedras)

A figura 5.13 apresenta o contorno localizado para as diferentes classes de texturas presentes

na imagem da figura 5.10. Repare que o filtro utilizado reduziu a confusão na definição das

bordas para ambos os experimentos.

FIGURA 5.13 – Bordas localizadas após a filtragem com filtro de mediana de

pixels

A figura 5.14 apresenta o contorno real e o contorno localizado com o método CVE para as

diferentes classes de texturas de pedras presentes na figura 5.10.

FIGURA 5.14 – Contorno real e contorno CVE (pedras)

5.2.4. Teste de variação do tamanho da janela de filtragem

A figura 5.15 apresenta uma imagem de 200200

pixels formando um mosaico de oito

texturas de papéis. Através de uma janela de tamanho de 33

pixels foram selecionadas

amostras na quantidade indicada na tabela 5.9. Esta tabela também apresenta o coeficiente de

variação para o conjunto de amostras selecionadas. Cada coluna representa o coeficiente de

variação das amostras de cada classe por canal R, G ou B.

FIGURA 5.15 – Mosaico de texturas de papéis

TABELA

5.9

Número de amostras e coeficiente de variação por canal (papéis)

Verifica-se na tabela 5.9 que o coeficiente de variação do conjunto de amostras das classes

“A” a “H”, nos canais R, G e B apresentaram baixos valores, indicando que estas texturas são

homogêneas (pequena variância interna dos padrões). Após a segmentação da imagem da

figura 5.15, com as regras geradas na fase de treinamento, obteve-se a imagem da figura 5.16.

FIGURA 5.16 – Segmentação do mosaico de papéis

As figuras 5.17a., 5.17b. e 5.17c. apresentam o resultado da filtragem da figura 5.16 por um

filtro mediana com janela de 33

, 55

e 77

pixels, respectivamente. Pode-se notar o

preenchimento das regiões interiores e eliminação de arestas. A operação de filtragem é

realizada somente nos pixels classificados através de uma nova imagem gerada pelo

aplicativo, sem os pixels não segmentados (fundo branco).

FIGURA 5.17 – Filtragem do mosaico de papéis com filtros de diferentes dimensões

A figura 5.18 apresenta o contorno localizado para o mosaico de texturas de papeis após a

filtragem com janelas de diferentes tamanhos, conforme ilustrado na figura 5.17. Para este

experimento, verifica-se que a janela de filtragem de tamanho de 77

pixels foi a que

possibilitou o melhor resultado visual dos limites das bordas.

Conclui-se que o efeito da variação da janela de filtragem é de fechamento de vazios

interiores e eliminação de arestas. O tamanho da janela mais conveniente dependerá de cada

caso.

FIGURA 5.18 – Contorno localizado com diferentes tamanhos de janelas de filtragem

A figura 5.19 apresenta o contorno real e o contorno localizado com o método CVE para as

diferentes classes de texturas de papéis presentes na figura 5.15. A tabela 5.10 apresenta a

matriz de classificação dos pixels para o resultado verificado na imagem 5.19.

FIGURA 5.19 – Contorno real e contorno CVE (papéis)

TABELA

5.10

Matriz de Classificação dos pixels (papéis)

CLASSE A B C D E F G H

A 88,9

0,0

7,9

99,9

0,0

95,7

0,0

0,2

0,0

3,2

99,7

0,0

99,9

0,0

0,1

0,0

100,0

0,4

0,0

99,4

0,0

99,8

Não Classificado

3,2

0,0

1,1

0,3

0,1

0,0

0,2

5.2.5. Teste de espessura da borda

Neste teste foram encontrados distintos contornos para o objeto da figura 5.20, imagem com

269249

pixels, considerando quatro diferentes tamanhos de janela de segmentação ( 33

pixels).

FIGURA 5.20 – Estrela de seis pontas

O propósito deste teste é medir o efeito da variação do tamanho da janela de segmentação

utilizada em relação à espessura do contorno localizado, conforme a tabela 5.11. A figura 5.21

apresenta os contornos localizados com o tamanho da janela de segmentação selecionada para

localização da borda. A figura 5.22 apresenta os contornos das figuras 5.21a. a 5.21d.

sobrepostos.

TABELA

5.11

Espessura do contorno para diferentes tamanhos da janela de segmentação

Tamanho da Janela Número pixels da borda

Contorno

3x3 1

5x5 2

7x7 3

9x9 4

FIGURA 5.21 – Detalhe do contorno localizado com janelas de segmentação diferentes

FIGURA 5.22 - Contornos sobrepostos das figuras 5.21a. a 5.21d.

Conclui-se a partir deste teste que o aumento da espessura da borda ocorre na direção do

interior do objeto segmentado. O aumento da espessura da borda não ultrapassa a área do

objeto, pois o contorno mais externo é o definido para espessura de um pixel (cor vermelha).

Essa propriedade indica que o método proposto preserva a confiabilidade da segmentação,

independentemente da espessura selecionada para o contorno.

5.2.6. Teste de variação do tamanho da janela de amostragem

A figura 5.23 apresenta um imagem de 200200

pixels formando um mosaico de oito

texturas de madeiras. Foram selecionadas amostras para três experimentos. O experimento 1

empregou janela de amostragem com tamanho de 33

pixels, o experimento 2 empregou

janela de amostragem com tamanho de 55

pixels e o experimento 3, janela de amostragem

com tamanho de 77

pixels.

FIGURA 5.23 – Mosaico de texturas de madeira

As tabelas 5.12, 5.13 e 5.14 apresentam o número de amostras selecionadas e o coeficiente de

variação destas amostras para o experimento 1, 2 e 3, respectivamente.

TABELA

5.12

Número de amostras e coeficiente de variação para o experimento 1 (madeiras)

TABELA

5.13

Número de amostras e coeficiente de variação para o experimento 2

(madeiras)

TABELA

5.14

Número de amostras e coeficiente de variação para o experimento 3 (madeiras)

Observando os coeficientes de variação dos experimentos, verifica-se que algumas texturas

possuem um padrão mais heterogêneo do que outras. Durante a seleção das amostras, o

usuário deve ter o cuidado de obter uma variância suficiente para representar o conjunto, além

de evitar amostras que fujam excessivamente do padrão. O apêndice “A” (Descrição dos

Programas AGCTIM e CTIM) apresenta mais detalhes sobre como realizar esta seleção no

aplicativo desenvolvido.

As tabelas 5.15, 5.16 e 5.17 apresentam as matrizes de classificação das amostras de madeiras

para o conjunto de treinamento do experimento 1, experimento 2 e experimento 3,

respectivamente.

TABELA

5.15

Matriz de classificação – conjunto de treinamento – experimento 1 (madeiras)

TABELA

5.16

Matriz de classificação – conjunto de treinamento – experimento 2 (madeiras)

TABELA

5.17

Matriz de classificação – conjunto de treinamento – experimento 3 (madeiras)

Observando as tabelas 5.15, 5.16 e 5.17 verifica-se que houve maior confusão na classificação

das amostras do experimento 1, janela de seleção de 33

pixels.

Os resultados das segmentações da imagem da figura 5.23 com as regras geradas a partir dos

conjuntos de treinamento dos experimentos 1, 2 e 3 podem ser observados na figura 5.24.

100

FIGURA 5.24 – Resultado da segmentação dos experimentos 1, 2 e 3

Os resultados das operações de filtragem com filtro de mediana das imagens da figura 5.24

podem ser observados na figura 5.25.

FIGURA 5.25 – Resultado da filtragem dos experimentos 1, 2 e 3

A figura 5.26 apresenta os contornos localizados para as texturas, considerando os

conjuntos de treinamento dos experimentos 1, 2 e 3.

FIGURA 5.26 – Localização do contorno dos experimentos 1, 2 e 3

101

Observando as imagens das figuras 5.24, 5.25 e 5.26, pode-se verificar que a classe “B” foi

melhor segmentada pelo experimento 1. Para os demais experimentos, esta classe teve grande

perda de informação. Verificando as tabelas 5.12, 5.13 e 5.14, nota-se que os experimentos 2

e 3 tiveram uma variância extremamente alta no coeficiente de variação do CVE do canal

Blue. Provavelmente, uma amostra fora do padrão foi selecionada, prejudicando a regra

gerada por este conjunto de treinamento.

Ainda, observando as imagens das figuras 5.24, 5.25 e 5.26, pode-se verificar que o

experimento 3 obteve melhor segmentação para as classes “D”, “F” e “G” (padrões mais

heterogêneos). Uma vez que algumas texturas são influenciadas pela resolução, quando

houver padrões heterogêneos, deve-se utilizar janelas maiores, a fim de melhor representar a

textura. Porém, a escolha de janelas de segmentação maiores implicam no afastamento dos

limites das bordas, conforme exposto na seção 5.2.4.

A figura 5.27 apresenta o contorno real e o contorno localizado com o método CVE para as

diferentes classes de texturas de madeiras presentes na figura 5.23. A tabela 5.18 apresenta a

matriz de classificação dos pixels para o resultado verificado na imagem 5.27.

FIGURA 5.27 – Contorno real e contorno CVE (madeira)

TABELA

5.18

Matriz de Classificação dos pixels (madeira)

CLASSE A B C D E F G H

A 97,7

0,0

0,2

0,0

71,9

0,0

73,6

0,0

98,7

0,0

0,1

4,2

2,0

0,0

85,4

0,1

0,0

13,6

97,9

0,0

94,3

0,0

0,5

93,3

Não Classificado

2,3

28,1

26,4

1,3

0,9

1,7

1,1

4,7

102

5.2.7. Testes empregando algoritmos genéticos e algoritmo k-means

A próxima série de testes emprega mosaicos com diferentes texturas naturais reais extraídas

de imagens de satélite (Landsat -7 TM). Os mosaicos foram construídos com a finalidade de

verificar o desempenho do método na presença de outras texturas com cores e padrões bem

similares. Cada imagem possui tamanho de 200200

pixels e contém um mosaico de oito

diferentes classes de texturas (água, solo e vegetação).

Nesta série de testes foram comparados os resultados das regras geradas pelo programas

AGCTIM (Algoritmo Genético de Classificação de Texturas em Imagens Multiespectrais) e

do programa CTIM (Clusterização de Texturas em Imagens Multiespectrais) desenvolvidos

neste trabalho para implementar o coeficiente CVE proposto. Para realização dos testes com

ambos os programas foram utilizados seus parâmetros

default

, conforme descrito no apêndice

A (Descrição dos Programas AGCTIM e CTIM).

A figura 5.28 apresenta um mosaico de oito texturas de água. Para ambos os programas foram

selecionadas amostras com janela de tamanho de 33

pixels e nas quantidade indicadas na

tabela 5.19.

FIGURA 5.28 – Mosaico de texturas de água

TABELA

5.19

Número de amostras selecionadas – conjunto de treinamento (água)

NÚMERO DE AMOSTRAS

CLASSE

AGCTIM/ CTIM

A 24

B 14

C 10

D 2

E 20

F 3

G 25

H 25

103

A seguir, são ilustradas as regras geradas para classificação das amostras da classe “A” pelo

AGCTIM e pelo CTIM, respectivamente:

-------- AGCTIM-------------

(

)

097,192602,144

≤≤

dCanal

CVE E

(

)

346,502927,433 ≤≤

GreenCanal

CVE E

(

)

506,538850,508 ≤≤

BlueCanal

CVE ENTÃO

Pixel central da janela de segmentação recebe rótulo de cor da classe “A”

-------- CTIM------------------

SE 070,38≤

AmostradaCVE

Distância para o

(

)

894,693;549,510;831,168

AClasse

Centróide

ENTÃO

Pixel central da janela de segmentação recebe rótulo de cor da classe “A”

onde as coordenadas do centróide da classe “A” são definidas pelos valores do

BlueCanalGreenCanaldCanal

CVECVECVE ,,

do conjunto de amostras de treinamento.

-----------------------------------

A figura 5.29 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa AGCTIM.

FIGURA 5.29 – Resultado obtido com o programa AGCTIM (texturas de água)

104

A figura 5.30 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa CTIM. Observa-se neste teste que o resultado da segmentação com

CTIM foi superior visualmente ao alcançado pelo AGCTIM (com parâmetros default).

FIGURA 5.30 – Resultado obtido com o programa CTIM (texturas de água)

A figura 5.31 apresenta o contorno real e o contorno localizado com o programa CTIM para

as diferentes classes de texturas de água presentes na figura 5.28. A tabela 5.20 apresenta a

matriz de classificação dos pixels para o resultado verificado na imagem 5.31.

FIGURA 5.31 – Contorno real e contorno CVE (água)

105

TABELA

5.20

Matriz de Classificação dos pixels (água)

CLASSE A B C D E F G H

A 87,6

0,0

96,0

0,0

92,4

0,0

99,9

0,0

99,7

0,0

0,1

95,2

0,0

96,2

1,5

0,0

98,1

Não Classificado

12,4

4,0

7,6

0,1

4,8

3,8

0,4

A figura 5.32 apresenta um mosaico de oito texturas de solo. Para ambos os programas foram

selecionadas amostras com janela de tamanho de

pixels e nas quantidade indicadas na

tabela 5.21.

FIGURA 5.32 – Mosaico de texturas de solo

TABELA

5.21

Número de amostras selecionadas – conjunto de treinamento (solo)

NÚMERO DE AMOSTRAS

CLASSE

AGCTIM/ CTIM

A 8

B 10

C 9

D 14

E 17

F 10

G 9

H 12

A figura 5.33 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa AGCTIM.

106

FIGURA 5.33 – Resultado obtido com o programa AGCTIM (texturas de solo)

A figura 5.34 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa CTIM.

FIGURA 5.34 – Resultado obtido com o programa CTIM (texturas de solo)

107

A figura 5.35 apresenta o contorno real e o contorno localizado com o programa CTIM para

as diferentes classes de texturas de solo presentes na figura 5.32. A tabela 5.22 apresenta a

matriz de classificação dos pixels para o resultado verificado na imagem 5.35.

FIGURA 5.35 – Contorno real e contorno CVE (solo)

TABELA

5.22

Matriz de Classificação dos pixels (solo)

CLASSE A B C D E F G H

A 79,3

0,0

90,3

7,4

0,2

0,0

0,8

0,0

88,2

0,0

4,8

0,0

92,1

0,0

85,0

0,0

8,6

2,3

7,1

0,0

93,0

0,0

93,3

0,0

99,0

Não Classificado

20,7

1,1

2,1

0,6

15,0

1,5

6,7

1,0

Neste segundo teste, verifica-se que o resultado da segmentação com CTIM, novamente foi

superior visualmente ao alcançado pelo AGCTIM (com parâmetros

default

A figura 5.36 apresenta um mosaico de oito texturas de vegetação. Para ambos os programas

foram selecionadas amostras com janela de tamanho de 77

pixels e nas quantidade

indicadas na tabela 5.23.

FIGURA 5.36 – Mosaico de texturas de vegetação

108

TABELA

5.23

Número de amostras selecionadas – conjunto de treinamento (vegetação)

NÚMERO DE AMOSTRAS

CLASSE

AGCTIM/ CTIM

A 26

B 13

C 17

D 16

E 12

F 11

G 14

H 16

A figura 5.37 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa AGCTIM.

FIGURA 5.37 – Resultado obtido com o programa AGCTIM (texturas de vegetação)

A figura 5.38 apresenta o resultado da segmentação, filtragem e localização das bordas

utilizando o programa CTIM.

109

FIGURA 5.38 – Resultado obtido com o programa CTIM (texturas de vegetação)

Também neste teste, o resultado da segmentação com CTIM foi visualmente superior ao

alcançado pelo AGCTIM (com parâmetros

default

A figura 5.39 apresenta o contorno real e o contorno localizado com o programa CTIM para

as diferentes classes de texturas de vegetação presentes na figura 5.36. A tabela 5.24 apresenta

a matriz de classificação dos pixels para o resultado verificado na imagem 5.39.

FIGURA 5.39 – Contorno real e contorno CVE (vegetação)

110

TABELA

5.24

Matriz de Classificação dos pixels (vegetação)

CLASSE A B C D E F G H

A 90,7

0,0

89,4

3,4

2,4

0,0

0,9

0,0

95,9

4,1

0,0

86,1

0,0

1,9

0,0

96,1

0,0

86,1

0,0

93,9

0,0

0,7

0,0

90,9

Não Classificado

7,5

9,9

0,7

7,4

3,9

13,9

6,1

8,2

5.3. TESTES COM IMAGENS REAIS

Esta seção ilustra diversas aplicações possíveis com a utilização da técnica proposta neste

trabalho envolvendo diferentes tipos de imagens: imagens monocromáticas, imagens

coloridas, imagens obtidas com equipamentos médicos e imagens de satélite. Embora o

conjunto de testes da seção anterior seja mais complexo, estes envolvem situações reais onde

a segmentação é utilizada em comparações com outros modelos.

Para realização de testes comparativos foram utilizados os programas CTIM (Classificador de

Texturas Multiespectrais), que implementa o CVE (Coeficiente de Variação Espacial)

(NUNES; CONCI, 2006), através do algoritmo

K-Means

Além de três programas disponíveis na Internet, o SEGWIN, desenvolvido pelo grupo JSEG

(

Segmentation of color-texture regions in images and vídeo

), obtido em

http://vision.ece.ucsb.edu/segmentation/jseg/ jsegcolor.html. O VISD (

Variational Image

Segmentation demo

), obtido em http://aakash.ece.ucsb.edu/ imdiffuse/segment.aspx e o

SPRING (CÂMARA

et al

., 1996), desenvolvido pelo INPE (Instituto Nacional de Pesquisas

Espaciais), obtido em http://www.inpe.br.

Também foram comparados os resultados com os disponíveis na literatura utilizando o

método ICA (

Independent Component Analysis

) (JENSSEN; ELTOFT, 2003) e o modelo

MRMRF (

Multiresolution Markov Random Fields

) com estimação do parâmetro MRMRF

baseado em aproximação de MCMC (

Markov Chain Monte Carlo

) (LEI WANG; JUN LIU,

2000)

O SEGWIN separa a segmentação em dois estágios processados independentemente:

quantização da cor e segmentação espacial. No primeiro estágio, as cores da imagem são

quantizadas em diversas classes de representação que podem ser usadas para diferenciar as

111

regiões na imagem. Esta quantização é executada no espaço de cor sozinho, sem considerar a

distribuição espacial. Em seguida, as cores do pixel da imagem são substituídas por suas

etiquetas correspondentes da classe da cor, dando assim, forma a um mapa-classe da imagem.

O foco principal está na segmentação espacial, onde um critério para uma segmentação

"adequada" que usa o mapa-classe é proposto. Adotando um critério para janela local no

mapa-classe obtêm-se uma "J-imagem", em que elevados e baixos valores correspondem a um

possível limite e interior de uma região. Um método de crescimento de região é usado então

para segmentar a imagem baseado num “J-imagem” multi-escala (DENG; MANJUNATH,

2001).

O VISD utiliza em seu processo de segmentação a difusão de imagem baseada em um campo

de vetor de borda. Se a imagem é indicada como uma imagem de textura, então,

características de textura Gabor são calculadas para 3 escalas e 4 orientações. Depois que as

características de imagem foram calculadas (textura, cor e nível de cinza), elas são filtradas.

Um campo de vetor de borda é calculado a partir destas características usando diferenças

direcionais (não gradientes). No próximo passo, uma função de borda é calculada deste campo

de vetor resolvendo a equação de Poisson

gEVF

∆

∇

. . Esta equação é encontrada

minimizando uma função de custo

min GEVFE ∇−= . O último passo é uma difusão da

imagem. A equação diferencial parcial para a difusão é dada por :

IgkIS

∇+∇=

∂

→

onde, EVFS :

→

é função de borda,

é a curvatura dos conjuntos nivelados.

O SPRING inicialmente rotula cada pixel como uma região distinta. Então, calcula um

critério de similaridade para cada par de regiões adjacentes espacialmente. O critério de

similaridade baseia-se em um teste de hipótese estatístico que testa a média entre as regiões.

A seguir, divide a imagem em um conjunto de sub-imagens e então, realiza a união entre elas,

segundo um limiar de agregação definido.

Os filtros de ICA (

Independent Component Analysis

) propostos por (JENSSEN; ELTOFT,

2003) podem capturar as propriedades inerentes das imagens texturizadas. Segundo os

autores, os novos filtros são semelhantes aos filtros Gabor, mas parecem ser mais ricos no

sentido de que suas respostas de freqüência podem ser mais complexas. Estas propriedades

permitem usar o banco de filtros ICA para criar características de energia, visando à

segmentação efetiva de texturas.

112

A teoria dos Campos aleatórios de Markov (

MRF - Markov random fields

) é um ramo da

teoria de probabilidade utilizada para analisar as dependências espaciais ou contextuais de

fenômenos físicos. No modelo MRF, uma textura é considerada ser uma realização de um

MRF e modelar uma textura é especificar as probabilidades condicionais correspondentes ou

parâmetros potenciais de um grupo exclusivo de Gibbs. Características de textura

correspondem aos parâmetros de textura MRF e a extração de características é equivalente à

estimação do parâmetro. Segundo os autores, é difícil ajustar um único MRF a cada padrão de

textura. Além de ser inexato considerar uma textura como uma realização de um único MRF,

uma vez que modelos MRF somente são satisfatórios para descrever as micro-texturas.

Para os autores, a desvantagem de modelos de MRF tradicionais é que a vizinhança é

limitada. Na decomposição de

wavelet

ortogonal como Haar ou

wavelet

de Daubechies, sub-

bandas não redundantes podem ser obtidas nas diferentes escalas e direções. Assim, essas sub-

bandas podem ser usadas para representar a imagem original completamente. Por outro lado,

essas sub-bandas são sub-amostras com a transformada discreta de

Wavelet

. Portanto, a

estrutura da textura, representada por uma informação de duas longas distâncias de pixels na

imagem original, podem se tornar as vizinhas imediatas nas imagens de sub-bandas nos níveis

mais altos. Isto conduz a um novo modelo que utiliza todas as sub-bandas em diferentes

escalas e direções. Dessa forma, os autores combinaram filtros de multiresolução e campo

aleatório Gibbs, denominando este modelo de MRMRF (

Multiresolution Markov Random

Fields

) com estimação do parâmetro MRMRF baseado em aproximação de MCMC (

Markov

Chain Monte Carlo

5.3.1. Teste com Imagens Monocromáticas

A figura 5.40 apresenta uma imagem monocromática (

200400

pixels) com letras compostas

por segmentos de linhas diagonais em inclinações de 45º, 0º e 90º graus formando a sigla

UFF. O teste visa comparar o desempenho do CVE na determinação do contorno das letras

com o de outros programas de segmentação por cor e textura disponíveis ao público.

FIGURA 5.40 – Linhas com diferentes inclinações formando a sigla UFF

113

A figura 5.41a apresenta o resultado alcançado pelo programa SEGWIN e a figura 5.41b o

resultado alcançado pelo programa VISD. A figura 5.41c. mostra o resultado obtido com a o

programa CTIM que utiliza o CVE.

Para este teste foram selecionadas 14 amostras com janela de tamanho de

pixels para

classe “letras”. Um filtro de mediana com janela de

pixels foi aplicado ao resultado da

segmentação. Observando o contorno localizado pelo CVE, verifica-se que o resultado

apresenta perfeita definição dos limites das letras (contorno em cor azul).

FIGURA 5.41 – Contorno (azul) das letras UFF formadas com linhas de diferentes inclinações

A Fig. 5.42a apresenta uma imagem monocromática (

157200

pixels) composta por texturas

de Brodatz D53 (padrão interno) e D49, usada como exemplo por (JENSSEN; ELTOFT,

2003) na segmentação de texturas com o método ICA (Independent Component Analysis). A

fig. 5.42b apresenta a segmentação da imagem da figura 5.42a com 20 filtros do banco ICA,

alcançando uma porcentagem de erro de 3,5%. A curva sólida branca marca o verdadeiro

limite entre os dois padrões de textura.

A Fig. 5.42c mostra o resultado obtido com o método CVE. Para este teste foram selecionadas

30 amostras de cada classe de textura, através de uma janela de tamanho

pixels. Um

filtro de mediana, com janela de tamanho de

pixels, foi aplicado ao resultado da

segmentação resultando na imagem da figura 5.42d.

A figura 5.42e mostra o contorno localizado com CVE após a filtragem. A figura 5.42f.

114

apresenta a sobreposição do contorno obtido com a segmentação usando o método CVE

(curva azul e vermelha – um para cada classe) com o contorno verdadeiro (curva sólida

branca) entre as duas classes de textura. É possível verificar que o contorno localizado com

CVE esteve muito próximo do contorno real.

FIGURA 5.42 – Comparação do método ICA e CVE: a) Imagem composta por texturas de Brodatz

D53 (padrão interno) e D49; b) Segmentação com ICA (cor preta) e contorno real (cor branca);

c) Segmentação com CVE sem filtragem; d) Segmentação com CVE com filtragem; e) Contorno

localizado com CVE; f) Contorno com CVE (colorido) sobreposto ao contorno real (cor branca).

A Fig. 5.43a apresenta uma imagem monocromática (

310305

pixels) constituída por três

regiões de texturas de Brodatz (D55 - Fundo, D77 - polígono e D84 - quadrado) usada por

(LEI WANG; JUN LIU, 2000). Os autores apresentam o modelo MRMRF (Multiresolution

Markov Random Fields) com estimação do parâmetro MRMRF baseado em aproximação de

MCMC (Markov Chain Monte Carlo) para segmentação de textura.

A Fig. 5.43b mostra o resultado obtido com o modelo MRMRF. A aproximação proposta tem

a vantagem de não requerer treinamento para segmentação das texturas (método não

supervisionado). Porém, a aplicação do método MCMC para estimação de parâmetro

MRMRF possui elevado custo computacional.

A Fig. 5.43c apresenta a segmentação da imagem da fig.5.43a utilizando o método CVE.

115

Para este teste foram selecionadas 30 amostras de cada classe de textura, através de uma

janela de tamanho

pixels. Um filtro de mediana, com janela de tamanho de

pixels,

foi aplicado ao resultado da segmentação, figura 5.43d. O contorno localizado pelo método

proposto pode ser observado nas figuras 5.43e e 5.43f.

FIGURA 5.43 – Comparação do método MRMRF e CVE: a) Mosaico de três regiões de texturas de

Brodatz (D55 - Fundo, D77 - polígono e D84 - quadrado); b) Segmentação baseado em MRMRF;

c) Segmentação com CVE sem filtragem; d) Segmentação com CVE com filtragem; e) Contorno

localizado com CVE; f) Contorno CVE sobreposto a imagem da figura 5.43a.

5.3.1. Teste com imagens coloridas

A figura 5.44 apresenta uma imagem Pepper colorida de pimentões com

512512

pixels.

Foram extraídas, com janela de tamanho de 33

pixels, as seguintes quantidades de amostras

para o conjunto de treinamento, bem como atribuído as cores às classes: 31 amostras da classe

verduras verde, área e contorno em amarelo; e 30 amostras de verduras vermelhas, área e

contorno em azul.

Após a segmentação, um filtro de mediana de tamanho de 33

pixels foi aplicado e, em

seguida, foi localizado o contorno. A figura 5.45 apresenta o resultado obtido com o programa

CTIM.

116

FIGURA 5.44 – Imagem colorida de pimentões

FIGURA 5.45 – Segmentação e contorno dos pimentões obtidos com o programa CTIM

Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados

nas figuras 5.46a e 5.46b, respectivamente.

FIGURA 5.46 – Contornos das verduras obtidos com os programas SEGWIN e VISD

117

A figura 5.47 apresenta uma imagem colorida de uma paisagem com 480640

pixels. Foram

extraídas, com janela de seleção de 77

pixels, as seguintes quantidades de amostras para o

conjunto de treinamento, bem como atribuído as cores às classes: 21 amostras da classe céu,

área e contorno em azul; 16 amostras da classe areia, área e contorno em vermelho; 25

amostras da classe água, área e contorno em amarelo; 24 amostras da classe vegetação, área e

contorno em verde; 9 amostras da classe cascalho, área e contorno em roxo e 25 amostras da

classe vegetação seca, área e contorno em marrom.

FIGURA 5.47 – Paisagem colorida

Após a segmentação, um filtro de mediana de com tamanho de 33

pixels foi aplicado e, em

seguida, foi localizado o contorno. A figura 5.48 apresenta o resultado obtido com o programa

CTIM.

FIGURA 5.48 – Segmentação e contorno da paisagem obtidos com o programa CTIM

Os resultados obtidos pelo programa SEGWIN e o programa VISD podem ser observados nas

figuras 5.49a e 5.49b, respectivamente.

118

FIGURA 5.49 – Contornos da paisagem obtidos com os programas SEGWIN e VISD

A figura 5.50 apresenta a imagem Mandril colorida com 512512

pixels. Ela apresenta

diferentes texturas complexas e muitas nuanças de cores. Foram extraídas 20 amostras com

janela de tamanho de

pixels para seis classes de textura: pele preta – contorno roxo; pêlo

e olhos amarelos – contorno amarelo; pele azul – contorno azul escuro; pele vermelha –

contorno vinho; pêlo amarelo/preto – contorno verde claro; pêlo branco – contorno azul claro.

FIGURA 5.50 – Imagem colorida - Mandril

O resultado obtido pelo coeficiente CVE pode ser visto na figura 5.51. Um filtro de mediana

com janela

foi aplicado ao resultado da segmentação resultando numa imagem com boa

definição dos limites das classes.

FIGURA 5.51 – Segmentação e contorno do mandril obtidos com o programa CTIM

119

As figuras 5.52a e 5.52b apresentam o resultado obtido pelo programa SEGWIN e pelo

programa VISD, respectivamente.

FIGURA 5.52 – Contornos do mandril obtidos com os programas SEGWIN e VISD

5.3.2. Teste com imagens obtidas com aparelhos médicos

A figura 5.53 apresenta uma imagem colorida de um melanoma médio (câncer de pele) com

256256

pixels. Foram extraídas, com janela de tamanho de 33

pixels, 20 amostras da

classe melanoma, área e contorno em azul para compor o conjunto de treinamento. Após a

segmentação, um filtro de mediana de 33

pixels foi aplicado e, em seguida, foi localizado o

contorno.

FIGURA 5.53 – Imagem de melanoma

A figura 5.54 apresenta o resultado obtido com o programa CTIM. É possível verificar uma

perfeita segmentação do melanoma, figura 5.54a.

As figuras 5.54b e 5.54c apresentam o contorno localizado com bordas de espessura de um

pixel, resultando numa imagem com boa definição dos limites do melanoma.

120

FIGURA 5.54 – Segmentação e contorno do melanoma obtidos com o programa CTIM

Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados

nas figuras 5.55a e 5.55b, respectivamente.

FIGURA 5.55 – Contornos do melanoma obtidos com os programas SEGWIN e VISD

A figura 5.56a apresenta uma imagem colorida de células de sangue com 329494

pixels.

Foram extraídas, com janela de tamanho de 33

pixels, as seguintes quantidades de amostras

para o conjunto de treinamento, bem como atribuído as cores às classes: 19 amostras da classe

células, área e contorno em azul; 20 amostras da classe membrana, área e contorno em verde e

12 amostras da classe núcleo, área e contorno em vermelho.

Após a segmentação, um filtro de mediana de tamanho de 33

pixels foi aplicado, figura

5.56b e, em seguida, foi localizado o contorno, figura 5.56c. A figura 5.56d apresenta o

resultado obtido com o programa CTIM, verifica-se pelo contorno encontrado, que as células

presentes foram corretamente classificadas, mesmo no caso de regiões pequenas.

121

FIGURA 5.56 – Imagem de células e resultado obtido com o programa CTIM

Os resultados obtidos pelo programa SEGWIN e pelo programa VISD podem ser observados

nas figuras 5.57a e 5.57b, respectivamente.

FIGURA 5.57 – Contorno das células obtidos com os programas SEGWIN e VISD

5.3.3. Teste com imagens de satélite

Finalmente, dois testes foram realizados empregando imagens de satélite para verificar o

desempenho do método diante de imagens com texturas multiespectrais complexas. As

figuras 5.58a, 5.58b, 5.58c e 5.58d apresentam o resultado da segmentação de uma imagem da

grande São Paulo e cidades de Santos e São Vicente, no estado brasileiro de São Paulo, obtida

em http://www.dgi.inpe.br/html/ShowImagesLandsat.htm, com os programas SEGWIN,

VISD, SPRING e CTIM, respectivamente. A figura 5.58 é de 512512

pixels e foi adquirida

em 27/04/2000, pelo satélite CBERS, sensor IRMSS, composição RGB (bandas 2,1,3) e Base

154/Ponto 127.

122

FIGURA 5.58 – Imagem da região da grande são paulo segmentada por diferentes programas

Para este teste os programas SEGWIN e VISD utilizaram seus parâmetros

default

. O

programa SPRING utilizou o método de crescimento de regiões com similaridade 50 e área

(pixels) igual a 100. O programa CTIM utilizou 14 amostras da classe região urbana, com

janela de tamanho de 33

pixels.

O programa VISD apresentou uma maior segmentação da região urbana, necessitando de

ajustes em seus parâmetros internos para reduzir a supersegmentação. O programa SEGWIN

obteve melhor definição de limites do que o programa VISD, mas incluiu grandes áreas de

vegetação. O programa SPRING obteve melhor definição de limites do que os programas

anteriores, porém incluiu principalmente regiões de rios. O programa CTIM conseguiu obter

muito boa definição do contorno da classe região urbana.

123

As figuras 5.59a, 5.59b e 5.59c apresentam três composições coloridas da região de

Florianópolis-SC, utilizando as bandas 1, 2, 3, 5 e 7 do satélite Landsat, obtidas em

http://www.engesat.com.br, com tamanho de 600600

pixels.

Foram extraídas, com janela de tamanho de 33

pixels, as seguintes quantidades de amostras

para os conjuntos de treinamento, bem como atribuído as cores às classes: 20 amostras da

classe água turva da imagem 5.59b, contorno amarelo; 20 amostras da classe vegetação escura

da imagem 5.59c, contorno rosa.

O propósito é obter as amostras das regiões de interesse na composição de bandas mais

adequada para visualização do objeto alvo.

FIGURA 5.59 – Composições das bandas 1, 2, 3, 5 e 7

As figuras 5.60a e 5.60b apresentam os contornos obtidos para as classes água turva

(bandas_721) e vegetação escura (bandas_753), respectivamente.

FIGURA 5.60 – Contorno de água (bandas _7,2,1) e vegetação (bandas_753)

124

A figura 5.61 apresenta a imagem da figura 5.59a (bandas_321) com os contornos obtidos

para água turva da banda _721, figura 5.60a e para vegetação escura da banda_753, figura

5.60b.

FIGURA 5.61– Contornos aplicados à composição de bandas_ 3,2,1

Este teste demonstra a flexibilidade do método proposto, pois é possível gerar regras para

mesma imagem em diferentes resoluções e gerar contornos obtidos em diferentes

composições de bandas. Assim, pode-se extrair amostras de bandas que apresentem melhor

visualização das regiões de interesse para gerar as regras de classificação e utilizar os

contornos obtidos para diversas combinações e análises.

5.4. DISCUSSÃO

A fim de verificar as possibilidades e limitações do coeficiente proposto, considerando as

estratégias de implementação com algoritmos genéticos e algoritmo

K-Means,

este capítulo

apresentou diversos testes empregando imagens teóricas, mosaico de texturas naturais,

imagens monocromáticas, imagens coloridas e imagens de satélites.

125

Os testes realizados com imagens monocromáticas (visualizadas em apenas um canal)

constituídas de letras obtiveram excelente resultado de segmentação e determinação do

contorno. Porém, a segmentação de texturas em imagens monocromáticas com nível de

intensidade equalizados apresentou grande percentual de confusão. O CVE não foi capaz de

diferenciar satisfatoriamente estas texturas devido a similaridade de variação existente entre

as classes. Entretanto, este problema foi contornado empregando mais canais espectrais da

mesma cena (não equalizados).

Os testes realizados com texturas coloridas heterogêneas apresentaram maior possibilidade de

confusão entre as diferentes classes, devido a grande variância interna do padrão (diversidade

de cores). Este tipo de textura exigiu janelas de extração de amostras com tamanhos maiores

para melhorar o resultado da segmentação.

Nos testes realizados, o desempenho do método de partição baseado em recolocação

K-Means

superou o desempenho do método implementado com algoritmos genéticos, tanto na

velocidade de execução quanto na qualidade da segmentação. Entretanto, a implementação

com algoritmos genéticos permite muitas possibilidades de aperfeiçoamentos.

5.5. CONSIDERAÇÕES FINAIS

Este capítulo apresentou diversos testes realizados para medir a eficiência e as limitações do

Coeficiente de Variação Espacial (CVE) proposto. Foram realizados testes com diferentes

tipos de imagens e com diferentes parâmetros de funcionamento. Podemos concluir, pelos

testes realizados, que o CVE conseguiu segmentar e localizar o contorno de diversas classes

de texturas de forma satisfatória, comparativamente com os resultados obtidos com outros

programas disponíveis para segmentação de texturas e com outros resultados encontrados na

literatura.

7. REFERÊNCIAS BIBLIOGRÁFICAS

ALATA, O. & RAMANANJARASOA, C., Unsupervised textured image segmentation using 2-D quarter plane

autoregressive model with four prediction supports, Pattern Recognition Letters, v. 26, n. 8, pp. 1069-1081, 2005.

AL-JANOBI, A., Performance evaluation of cross-diagonal texture matrix method of texture analysis, Pattern

Recognition, v. 34, n. 1, pp. 171-180, 2001.

ANDRADE, M. C., Um Método Topológico de Segmentação de Imagens por Atributos, Belo Horizonte, 1998, 140

p., Tese de Doutorado em Ciência da Computação, Universidade Federal de Minas Gerais, Instituto de Ciências

Exatas, Departamento de Ciência da Computação, Belo Horizonte, 1998.

ANDREY, P., Selectionist Relaxation: Genetic Algorithms Applied to Image Segmentation, Image and Vision

Computing, Elsevier Science B.V., v.17, n. 3-4, pp.175-187, 1999.

ANGEL, P. & MORRIS, C., Analyzing the Mallat Wavelet Transform to Delineate Contour and Textural Features,

Computer Vision and Image Understanding, v. 80, n. 3, pp. 267-288, 2000.

AUJOL, J.-F.; AUBERT, G. & BLANC-FERAUD, L., Wavelet-based level set evolution for classification of

textured images, Image Processing, IEEE Transactions on, v. 12, n. 12, pp.1634-1641, 2003.

AVCI, E., An expert system based on Wavelet Neural Network-Adaptive Norm Entropy for scale invariant texture

classification, Expert Systems with Applications In Press, Corrected Proof, vailable online 10 Fev 2006.

AZEVEDO, E. & CONCI, A., Computação Gráfica: teoria e prática, Rio de Janeiro: Campus, 384 p., 2003.

AZEVEDO, E., CONCI, A., Computação Gráfica: Teoria e prática, Rio de Janeiro: Editora Campus (Elsevier),

2003, 384 p.

BANDERA, A.; URDIALES, C.; ARREBOLA, F. & SANDOVAL, F., Scale-dependent hierarchical unsupervised

segmentation of textured images, Pattern Recognition Letters, v. 22, n. 2, pp. 171-181, 2001.

BASHAR, M. K.; MATSUMOTO, T. & OHNISHI, N., Wavelet transform-based locally orderless images for

texture segmentation, Pattern Recognition Letters, v. 24, n. 15, pp. 2633-2650, 2003.

132

BERDER, T.C., Classificação e Recuperação de Imagens por Cor Utilizando Técnicas de Inteligência Artificial,

São Leopoldo, 2003, 125p., Dissertação de Mestrado em Computação Aplicada, UNISINOS, São Leopoldo, 2003.

BERKHIN, P., Survey of Clustering Data Mining Techniques, Technical report, San Jose: Accrue Software, 2002.

Disponível em: http://citeseer.nj.nec.com/berkhin02survey.html.

BEUCHER, S. & MEYER, F., The morphological approach to segmentation: the watershed transformation,

Mathematical Morphology in Image Processing, New York: Marcel Dekker Inc, Ed E. R. Dougherty, cap. 12, pp.

433-481, 1993.

BEZDEK, J. C. & PAL, S. K., Eds., Fuzzy Models for Pattern Recognition: Methods that Search for Structures in

Data, New York: IEEE Press, 539 p., 1992.

BROCHARD, J.; KHOUDEIR, M. & AUGEREAU, B., Invariant feature extraction for 3D texture analysis using

the autocorrelation function, Pattern Recognition Letters, v. 22, n. 6-7 , pp. 759-768, 2001.

CAMARA, G.; SOUZA, R.C.M.; FREITAS U.M. & GARRIDO J., SPRING: Integrating remote sensing and GIS

by object-oriented data modelling, Computers & Graphics, v. 20, n. 3, pp. 395-403, 1996.

CAMPISI, P.; COLONNESE, S.; PANCI, G. & SCARANO, G., Reduced complexity rotation invariant texture

classification using a blind deconvolution approach, Pattern Analysis and Machine Intelligence, IEEE Transactions

on, v. 28, n. 1, pp.145- 149, 2006.

CAMPISI, P.; NERI, A.; PANCI, G. & SCARANO, G., Robust rotation-invariant texture classification using a

model based approach, Image Processing, IEEE Transactions on, v. 13, n. 6, pp.782- 791, 2004.

ÇARKACIOGLU, A. & YARMAN-VURAL, F., SASI: a generic texture descriptor for image retrieval, Pattern

Recognition, v. 36, n. 11, pp. 2615-2633, 2003.

CASTLEMAN, K.R., Digital Image Processing, 2 ed., New Jersey: Prentice Hall Inc, 1996, 667 p.

ÇESMELI, E. & WANG, D., Texture Segmentation Using Gaussian–Markov Random Fields and Neural Oscillator

Networks, IEEE Transactions On Neural Networks, v. 12, n. 2, 2001.

CHARALAMPIDIS, D. & KASPARIS, T. , Wavelet-based rotational invariant roughness features for texture

classification and segmentation, Image Processing, IEEE Transactions on, Aug 2002, v. 11, n. 8, pp.825- 837,

2002.

CHEN SAGIV; SOCHEN, N. A. & ZEEVI, Y. Y., Integrated Active Contours for Texture Segmentation, IEEE

Transactions On Image Processing, v. 15, n. 6, 2006.

CHENG-HAO YAO & SHU-YUAN CHEN, Retrieval of translated, rotated and scaled color textures, Pattern

Recognition, vol. 36, n. 4 , pp. 913-929, 2003.

CHENGJUN LIU & WECHSLER, H., A shape- and texture-based enhanced Fisher classifier for facerecognition,

Image Processing, IEEE Transactions on, v. 10, n. 4, pp.598-608, 2001.

133

CHIH-FONG TSAI, Image mining by spectral features: A case study of scenery image classification, Expert

Systems with Applications In Press, Corrected Proof, Available online Dez 2005.

CHI-MAN PUN, Rotation-invariant texture feature for image retrieval, Computer Vision and Image

Understanding, v. 89, n. 1, pp. 24-43, 2003.

CHOI, H. & BARANIUK, R.G., Multiscale image segmentation using wavelet-domain hidden Markov models,

Image Processing, IEEE Transactions on, v. 10, n. 9, pp.1309-1321, 2001.

CHOI, Y.; WON, C.S.; RO, Y.M. & MANJUNATH, B.S., Texture Descriptors, Introduction to MPEG-7,

Multimedia Content Description Interface, Eds. B.S.Manjunath, P.Salembier & T.Sikora, John Wiley & Sons, Ltd.,

2002.

CLAUSI, D. A. K-means Iterative Fisher (KIF) unsupervised clustering algorithm applied to image texture

segmentation, Pattern Recognition ,v. 35, n. 9, pp. 1959-1972, 2002.

CLAUSI, D. A. & ED JERNIGAN, M., Designing Gabor filters for optimal texture separability, Pattern

Recognition, v. 33, n. 11, pp. 1835-1849, 2000.

CLAUSI, D.A. & HUANG DENG, Design-based texture feature fusion using Gabor filters and co-occurrence

probabilities, Image Processing, IEEE Transactions on, v. 14, n. 7, pp.925- 936, 2005

COCQUEREZ, J. P. & PHILIPP S., Analyse d’Images: Filtrage et Segmentation, Ed. Dunod, 1997, 457p.

COELHO, P.S.S. & EBECKEN, N.F.F., “Segmentação de Dados em um Número Desconhecido de Grupos Usando

Algoritmos Genéticos”, in: SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL (XXXIII SBPO), 2001,

Campos do Jordão, 2001. Disponível em : http://professores.ibmecrj.br/psergio/papers/genclum.pdf

COMER, M.L. & DELP, E.J., The EM/MPM algorithm for segmentation of textured images: analysisand further

experimental results, Thomson Consumer Electron., Image Processing, IEEE Transactions on, v. 9, n. 10, pp.1731-

1744, 2000.

CONCI, A. & NUNES, E.O., Multi-bands Image Analysis Using Local Fractal Dimension, In: PROCEEDINGS OF

XIV SIBIGRAPI BRASILIAN SYMPOSIO ON COMPUTION GRAPHICS (SIBGRAPI 01), 2001, Florianópolis:

Image Proc. and Vision, 2001, pp.91-98.

DENG Y. & MANJUNATH, B.S., Unsupervised Segmentation of Color-texture Regions in Images and Video, in:

IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE (PAMI 01), 2001, v. 23,

n. 8, pp. 800-810, 2001.

DO, M.N. & VETTERLI, M., Wavelet-based texture retrieval using generalized Gaussian densityand Kullback-

Leibler distance, Image Processing, IEEE Transactions on, v. 11, n. 2, pp.146-158, 2002.

DONG-GYU SIM; HAE-KWANG KIM & RAE-HONG PARK, Invariant texture retrieval using modified Zernike

moments, Image and Vision Computing, v. 22, n. 4, pp. 331-342, 2004.

134

DOVAL, D.; MANCORIDIS, S. & MITCHELL, B.S., Automatic Clustering of Software Systems using a Genetic

Algorithm, In: INTERNATIONAL CONFERENCE ON SOFTWARE TOOLS AND ENGINEERING PRACTICE

(STEP '99), 1999, Pittsburgh, 1999, pp.73-91.

DRIMBAREAN, A. & WHELAN, P. F., Experiments in colour texture analysis, Pattern Recognition Letters, v. 22,

n. 10, pp. 1161-1167, 2001.

DUMITRAS, A.; VENETSANOPOULOS, A. N., A comparative study of snake models with application to object

shape description in bi-level and gray-level images, in: PROCEEDINGS OF IEEE-EURASIP WORKSHOP ON

NONLINEAR SIGNAL AND IMAGE PROCESSING, 2001, Baltimore, 2001.

EPIFANIO, I. & AYALA, G., A random set view of texture classification, Image Processing, IEEE Transactions

on, v. 11, n. 8, pp. 859- 867, 2002.

FACON, J., Morfologia Matemática: Teoria e Exemplos, ed. Universitária Champagnat, Paraná: PUC/Pr, 1996.

FASULO, D., An analysis of recent work on clustering algorithms. Technical Report 01-03-02, Seattle: Department

of Computer Science and Engineering, University of Washington, Abr. 1999. Disponível em:

http://citeseer.nj.nec.com/fasulo99analysi.html.

FEO, T. & M. RESENDE, Greedy Randomized Adaptive Search Procedures, J. of Global Optimization 6, pp. 109–

133, 1995.

FEO, T. & RESENDE, M., A probabilistic Heuristic for a Computationally Difficult Set Covering Problem,

Operations Research Letters 8, pp. 67–71, 1989.

FISCHER, B. & BUHMANN, J.M., Path-based clustering for grouping of smooth curves and texture

segmentation, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 25, n. 4, pp.513-518, 2003.

FRYE, R. E. & LEDLEY, R. S., Texture discrimination using discrete cosine transformation shift-insensitive

(DCTSIS) descriptors, Pattern Recognition, v. 33, n. 10, pp. 1585-1598, 2000.

GARCÍA-SEVILLA, P. & PETROU, M., Analysis of Irregularly Shaped Texture Regions, Computer Vision and

Image Understanding, v. 84, n. 1, pp. 62-76, 2001.

GATO, H.E.R., IMAR, N.N. & TOMMASELLI, A.M.G., Uma Abordagem Semi-Automática para Extração de

Feições Cartográficas, Revista Brasileira de Cartografia, n.53, pp.16-28, 2001.

GINNEKEN, B. V. & ROMENY, B. M. T. H., Multi-scale texture classification from generalized locally orderless

images, Pattern Recognition, v. 36, n. 4 , pp. 899-911, 2003.

GIRALDI, G. A., T-Snakes Duais e Inicialização de Modelos Deformáveis, Rio de Janeiro, 2000, 251 p., Tese de

Doutorado em Ciências em Engenharia de Sistemas e Computação, Universidade Federal do Rio de Janeiro, Rio de

Janeiro, 2000.

135

GIRALDI, G.A.; STRAUSS, E. & OLIVEIRA, A.A., A Boundary Extraction Method Based on Dual-T-Snakes and

Dynamic Programming, in IEEE Computer Society Conference on Computer Vision and Pattern Recognition

(CVPR 2000), 2000, Hilton Head Island, 2000, pp. 1044-1049.

GLOVER, F. & M. LAGUNA, Tabu Search, Kluwer Academic Publishers, 1997.

GLOVER, F., Tabu Search – Part I, ORSA J. on Computing 1, pp. 190–206, 1989.

GLOVER, F., Tabu Search – Part II, ORSA J. on Computing 2, pp. 4–32, 1990.

GOLDBERG, D.E., Genetic Algorithms in Search, Optimization, and Machine Learning, Reading, Massachusetts:

Addison-Wesley Publishing Company, Inc., 1989.

GONZALEZ, R.C. & WOODS, R.E., Processamento de Imagens Digitais, São Paulo: Edgard Blucher, 2000, 509 p.

GRIGORESCU, S.E.; PETKOV, N. & KRUIZINGA, P., Comparison of texture features based on Gabor filters,

Image Processing, IEEE Transactions on, v. 11, n. 10, pp.1160- 1167, 2002.

HAMMOUCHE, M. D. & POSTAIRE, J.G., A clustering method based on multidimensional texture analysis,

Pattern Recognition, v. 39, n. 7, pp. 1265-1277, 2006.

HANSEN, P. & MLADENOVI´C, N., An Introduction to Variable Neighborhood Search, Kluwer Academic

Publishers, Eds. S. Voss, S. Martello, I. H. Osman, and C. Roucairol , Meta-heuristics, Advances and trends in

local search paradigms for optimization, pp. 433–458, 1998.

HAO HE & YAN QIU CHEN, Unsupervised texture segmentation using resonance algorithm for natural scenes,

Pattern Recognition Letters, v. 21, n. 8 , pp. 741-757, 2000.

HARALICK, R.M. & SHAPIRO, L.G., Texture, Computer and Robot Vision, New York: Addison-Wesley

Publishing Company, v.1, pp.453-494, 1992.

HARALICK, R.M., Statistical and Structural Approaches to Texture, Proceedings of The IEEE, v.67, n. 5, pp.786-

80, 1979.

HARALICK, R.M.; SHANMUGAN, K. & DINSTEIN, I., Texture Features for Image Classification, IEEE

Transaction On Systems, Man And Cybernetics (SMC-3), v.6, n. 3, pp.610-621, 1973.

HAYKIN, S., Neural Networks: A Comprehensive Foundation. New York: Prentice Hall, 2 ed., 842 p., 1998.

HEIKKILA, M. & PIETIKAINEN, M., Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 28,

n. 4, pp.657- 662, 2006.

HILL, P.R.; CANAGARAJAH, C.N. & BULL, D.R., Image segmentation using a texture gradient based watershed

transform, Image Processing, IEEE Transactions on, v. 12, n. 12, pp.1618- 1633, 2003.

136

HOLLAND, J.H., Escaping Brittleness: the Possibilities of General Purpose Learning Algorithms Applied to

Parallel Rule-based Systems, Machine Learning, an artificial intelligence approach (Morgan Kaufmann), Los

Altos: R. Michalski, Eds. J. Carbonell, & T. Mitchell, v. 2, pp. 593-623, 1986.

HOLLAND, J.H., Genetic Algorithms, New York: Scientific American, 1992, v. 267, n. 1, pp. 44-50.

HSI-CHIA HSIN, Texture segmentation using modulated wavelet transform, Image Processing, IEEE Transactions

on, v. 9, n. 7, pp.1299-1302, 2000.

HUANG, P. W. & DAI, S. K., Image retrieval by texture similarity, Pattern Recognition, v. 36, n. 3, pp. 665-679,

2003.

HUAWU DENG; KAP LUK CHAN & JUN LIU, The Poisson equation for image texture modeling, Pattern

Recognition Letters, v. 24, n. 9-10, pp. 1571-1582, 2003.

HWANG, S.W.; KIM,E.Y.; PARK, S.H. & KIM, H. J., Object Extraction and Tracking Using Genetic Algorithms,

in: INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2001), 2001, Thessaloniki: IEEE Signal

Processing Society, 2001, v. 2, pp.383-86.

JAFARI-KHOUZANI, K. & SOLTANIAN-ZADEH, H., Radon transform orientation estimation for rotation

invariant texture analysis, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 27, n. 6, pp.1004-

1008, 2005a.

JAFARI-KHOUZANI, K. & SOLTANIAN-ZADEH, H., Rotation-invariant multiresolution texture analysis using

Radon and wavelet transforms, Image Processing, IEEE Transactions on, v. 14, n. 6, pp.783- 795, 2005b.

JENSSEN, R. & ELTOFT, T., Independent component analysis for texture segmentation, Pattern Recognition, v.

36, n. 10 , pp. 2301-2315, 2003.

JIANGUO ZHANG & TIENIU TAN, Affine invariant classification and retrieval of texture images, Pattern

Recognition v, pp. 657-664, 2003.

JIANGUO ZHANG & TIENIU TAN, Brief review of invariant texture analysis methods, Pattern Recognition, v.

35, n. 3, pp. 735-747, 2002.

JIE ZHOU, LEPING XIN & DAVID ZHANG, Scale-orientation histogram for texture image retrieval, Pattern

Recognition, v. 36, n. 4 , pp. 1061-1063, 2003.

JING-HAO XUE; SU RUAN; MORETTI, B.; REVENU, M. & BLOYET, D., Knowledge-based Segmentation and

Labeling of Brain Structures from MRI Images, Pattern Recognition Letters, Elsevier Science B.V., v.22, n. 3-4,

pp.395–405, 2001.

JINSANG KIM & TOM CHEN, Multiple feature clustering for image sequence segmentation, Pattern Recognition

Letters, v. 22, n. 11, pp. 1207-1217, 2001.

137

KAN-MIN CHEN & SHU-YUAN CHEN, Color texture segmentation using feature distributions, Pattern

Recognition Letters, v. 23, n. 7 , pp. 755-771, 2002.

KASPARIS, T.; CHARALAMPIDIS,D.; GEORGIOPOULOS, M. & ROLLAND, J., Segmentation of textured

images based on fractals and image filtering, Pattern Recognition, v. 34, n. 10, pp. 1963-1973, 2001.

KASS, M., WITKIN A., & TERZOPOULOS, D., Snakes: Active Contour Models, International Journal of

Computer Vision, v. 1, n. 41, pp. 321-331, 1988.

KATO, Z. & TING-CHUEN PONG, A Markov random field image segmentation model for color textured images,

Image and Vision Computing, In Press, Corrected Proof, Available online, 2006.

KAUFMAN, L. & ROUSSEEUW, P.J., Finding Groups in Data: an Introduction to Cluster Analysis, 2 ed., Wiley-

Interscience, 2005, 368 p.

KHOTANZAD, A. & HERNANDEZ O. J., Color image retrieval using multispectral random field texture model

and color content features, Pattern Recognition, v. 36, n. 8, pp. 1679-1694, 2003.

KIRKPATRICK, S., Optimization by Simulated Annealing: Quantitative Studies, J. of Statistical Physics 34, pp.

975–986, 1984.

KLÖSGEN, W. & ZYTKOW, J. M., Knowledge Discovery in Databases Terminology, Advances In Knowledge

Discovery and Data Mining (AAAI Press/The MIT Press), Cambridge: U.M.Fayyad, G. P.Shapiro, P.Smyth, &

R.Uthurusamy, pp.573-592, 1996.

KOLLER, D. & SAHAMI, M., Toward Optimal Feature Selection, Proceedings of XIII International Conference

Machine Learning, pp. 129-134, 1996.

KUNG-HAO LIANG, & TJAHJADI, T., Adaptive scale fixing for multiscale texture segmentation, Image

Processing, IEEE Transactions on, v. 15, n. 1, pp.249- 256, 2006.

KURMYSHEV, E. V. & SANCHEZ-YANEZ, R. E., Comparative experiment with colour texture classifiers using

the CCR feature space, Pattern Recognition Letters, v. 26, n. 9, pp. 1346-1353, 2005.

LAZEBNIK, S.; SCHMID, C. & PONCE, J. , A sparse texture representation using local affine regions, Pattern

Analysis and Machine Intelligence, IEEE Transactions on, v. 27, n. 8, pp. 1265-1278, 2005.

LEI WANG & JUN LIU, Texture segmentation based on MRMRF modeling, Pattern Recognition Letters, v. 21, n.

2, pp. 189-200, 2000.

LIPOWEZKY, U., Grayscale aerial and space image colorization using texture classification, Pattern Recognition

Letters, v. 27, n. 4, pp. 275-286, 2006.

LUO, J.; ANDREAS, A.E. & SAVAKIS, E., Self-supervised texture segmentation using complementary types of

features, Pattern Recognition, v. 34, n. 11, pp. 2071-2082, 2001.

138

MÄENPÄÄ, T. & PIETIKÄINEN, M., Classification with color and texture: jointly or separately?, Pattern

Recognition, v. 37, n. 8, pp. 1629-1640, 2004.

MALPICA, N.; ORTUÑO, J. E. & SANTOS, A., A multichannel watershed-based algorithm for supervised texture

segmentation, Pattern Recognition Letters, v. 24, n. 9-10, pp. 1545-1554, 2003.

MANIAN, V.; VASQUEZ, R. & KATIYAR, P., Texture classification using logical operators, Image Processing,

IEEE Transactions on, v. 9, n. 10, pp.1693-1703, 2000.

MANJUNATH, B.S.; OHM, J.R.; VINODI, V. V. & YAMADA, A., “Color and Texture Descriptors”, in: IEEE

TRANS. CIRCUITS AND SYSTEMS FOR VIDEO TECNOLOGY, 2001, n. especial em MPEG-7, v.11, n.6, pp.

703-715, 2001.

MANTHALKAR, R.; BISWAS P. K. & CHATTERJI, B. N., Rotation and scale invariant texture features using

discrete wavelet packet transform, Pattern Recognition Letters, v. 24, n. 14, pp. 2455-2462, 2003a.

MANTHALKAR, R.; BISWAS, P. K. & CHATTERJI, B. N., Rotation invariant texture classification using even

symmetric Gabor filters, Pattern Recognition Letters, v. 24, n. 12, pp. 2061-2068, 2003b.

MATHERON, G., Elements Pour une Theorie des Millieux Poreux, Paris: Masson et Cie, 1967, 166 p.

MIRMEHDI, M. & PETROU, M., Segmentation of color textures, Pattern Analysis and Machine Intelligence,

IEEE Transactions on, v. 22, n. 2, pp.142-159, 2000.

MONTIEL, E.; AGUADO, A. S. & NIXON, M. S., Texture classification via conditional histograms, Pattern

Recognition Letters, vol. 26, n. 11 , pp. 1740-1751, 2005.

MUNEESWARAN, K.; GANESAN, L.; ARUMUGAM, S. & SOUNDAR, K. R., Texture classification with

combined rotation and scale invariant wavelet features, Pattern Recognition, v. 38, n. 10, pp. 1495-1506, 2005.

NG, R.T. & HAN, J., Efficient and Effective Clustering Methods for Spatial Data Mining, In: TWENTIETH

INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASE, 1994, Santiago, 1994, pp.144-155

NODA, H.; SHIRAZI, M. N. & KAWAGUCHI, E., MRF-based texture segmentation using wavelet decomposed

images, Pattern Recognition, v. 35, n. 4, pp. 771-782, 2002.

NOVIANTO, S.; SUZUKI, Y. & MAEDA , J., Near optimum estimation of local fractal dimension for image

segmentation, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 365-374, 2003.

NUNES, E.O. & CONCI, A., Algoritmos Genéticos para Classificação Temática de Imagens Multiespectrais, in:

VIII SIMPÓSIO DE PESQUISA OPERACIONAL DA MARINHA (SPOLM 05), 2005, Rio de Janeiro: anais do

SPOLM 05, 2005a, v.1, pp.15-30.

NUNES, E.O. & CONCI, A., Determinação da Dimensão Fractal de Conjunto de Pontos às Imagens de Satélites, in:

1º CONGRESSO TEMÁTICO DE APLICAÇÕES EM DINÂMICA E CONTROLE (APPLICON) DA

SOCIEDADE BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL (SBMAC), 2001, São

139

Carlos, Rio de Janeiro: Aplicações em Dinâmica e Controle (ABCM/SBMAC), Eds. J. M. Balthazar, V.A. Oliveira,

G.N. Silca & J. M. Rosário, 2001, 1 ed., v. 1, pp. 106-128.

NUNES, E.O. & CONCI, A., Implementação de Algoritmos Genéticos no Balanceamento Interativo de Linhas de

Montagem, in: VI SIMPÓSIO DE PESQUISA OPERACIONAL DA MARINHA/VII SIMPÓSIO DE LOGÍSTICA

DA MARINHA (SPOLM 03), 2003, Rio de Janeiro: anais do SPOLM 03, 2003a, v.1, pp.79-91.

NUNES, E.O. & CONCI, A., O Coeficiente de Hurst e o Coeficiente de Variação Espacial na Segmentação de

Texturas Multiespectrais, in: IV CONGRESSO TEMÁTICO DE APLICAÇÕES DE DINÂMICA E CONTROLE

(DINCON 2005) DA SOCIEDADE BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL

(SBMAC), 2003, Petrópolis: anais do DINCON 2005, Série Arquimedes, v.4, Eds. J.M.Balthazar, G.N.da Silva,

M.Tsuchida, M.Boaventura, L.S.Goes & J.D.S.Silva, pp.1089-1096, 2005b.

NUNES, E.O. & CONCI, A., Otimização de Linhas de Montagem por Algoritmos Genéticos: Análise,

Aperfeiçoamento e Implementação, in: XXXV SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL DA

SOCIEDADE BRASILEIRA DE PESQUISA OPERACIONAL, 2003, Natal: resumo e pôster SBPO/SOBRAPO,

v.1, pp.100-101, 2003b.

NUNES, E.O. & CONCI, A., Segmentação por Textura e Localização de Contorno em Regiões em Imagens

Multibandas, IEEE American Latina, aceito em out 2006.

NUNES, E.O. & CONCI, A., Segmenting Multi Bands Images by Color and Texture Analysis, in: PROCEEDINGS

10TH INTERNATIONAL WORKSHOP ON SYSTEMS, SIGNALS AND IMAGE PROCESSING – IWSSIP 03,

2003, Prague, Anais Recent Trends in Multimedia Information Processing, Eds. B. Simak & P. Zahradnik, 2003c,

pp. 231-234.

NUNES, E.O. & CONCI, A., Técnicas de Descrição Regional Baseadas em Textura, In: II CONGRESSO

TEMÁTICO DE APLICAÇÕES DE DINÂMICA E CONTROLE (DINCON 2003) DA SOCIEDADE

BRASILEIRA DE MATEMÁTICA APLICADA E COMPUTACIONAL (SBMAC), 2003, São José dos Campos:

anais do DINCON 2003, Série Arquimedes, v. 2, Eds. J. M. Balthazar, G.N. da Silva, M.Tsuchida, M. Boaventura,

L. S. Goes & J. D. S. Silva, 2003d.

NUNES, E.O. & CONCI, A., Texture Segmentation Considering Multi Band, Multi Resolution and Affine Invariant

Roughness, in: XVI BRAZILIAN SYMPOSIUM ON COMPUTER GRAPHICS AND IMAGE PROCESSING

(SIBGRAPI 03), 2003, São Carlos, pp. 254-258, 2003e.

NUNES, E.O., Emprego da Dimensão Fractal para Análise de Texturas em Imagens Multiespectrais. Niterói, 2001,

103 p., Dissertação de Mestrado em Computação, Instituto de Computação, Universidade Federal Fluminense,

Niterói, 2001.

OCHI, L.S., Problemas de Clusterização em Mineração de Dados, In: ENCONTRO REGIONAL DE

INFORMÁTICA RJ/ES (ERI 2004), Vitoria: SBC/Regional RJ-ES, 2004, Anais (em CD-ROM) do ERI 2004

RJ/ES, v.1, pp.1-46, 2004.

140

OJALA, T.; VALKEALAHTI, K.; OJA, E. & PIETIKÄINEN, M., Texture discrimination with multidimensional

distributions of signed gray-level differences, Pattern Recognition, v. 34, n. 3, pp. 727-739, 2001.

OJALA, T.; PIETIKÄINEN, M. & MÄENPÄÄ, T., Multiresolution gray-scale and rotation invariant texture

classification with local binary patterns, Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 24, n.

7, pp. 971-987, 2002.

OZYILDIZ, E.; KRAHNSTÖVER, N. & SHARMA R., Adaptive texture and color segmentation for tracking

moving objects, Pattern Recognition, v. 35, n. 10, pp. 2013-2029, 2002.

PALM, C., Color texture classification by integrative Co-occurrence matrices, Pattern Recognition, v. 37, n. 5, pp.

965-976, 2004.

PAPPAS, JUNQING CHEN, MOJSILOVIC, T.N. , A. Rogowitz, B.E., Adaptive perceptual color-texture image

segmentation, Image Processing, IEEE Transactions on, v. 14, n. 10, pp.1524- 1536, 2005.

PASCHOS, G. & PETROU M., Histogram ratio features for color texture classification, Pattern Recognition

Letters, v. 24, n. 1-3 , pp. 309-314, 2003.

PASCHOS, G., Fast color texture recognition using chromaticity moments, Pattern Recognition Letters, v. 21, n. 9,

pp. 837-841, 2000.

PASCHOS, G., Perceptually uniform color spaces for color texture analysis: anempirical evaluation, Image

Processing, IEEE Transactions on, v. 10, n. 6, pp.932-937, 2001.

PEILING CUI; JUNHONG LI; QUAN PAN & HONGCAI ZHANG, Rotation and scaling invariant texture

classification based on Radon transform and multiscale analysis, Pattern Recognition Letters, v. 27, n. 5, pp. 408-

413, 2006.

PETROU, M.; PIRODDI, R. & TALEBPOUR, A., Texture recognition from sparsely and irregularly sampled data,

Computer Vision and Image Understanding, v. 102, n. 1, pp. 95-104, 2006.

PIETIKÄINEN, M.; NURMELA, T.; MÄENPÄÄ, T. & TURTINEN, M., View-based recognition of real-world

textures, Pattern Recognition, v. 37, n. 2 , pp. 313-323, 2004.

PIETIKÄINEN, M.; OJALA, T. & XU, Z., Rotation-invariant texture classification using feature distributions,

Pattern Recognition, v. 33, n. 1, pp. 43-52, 2000.

PUIG, D. & GARCIA, M. A., Automatic texture feature selection for image pixel classification, Pattern

Recognition, vol. 39, n. 11, pp. 1996-2009, 2006.

QING XU; JIE YANG & SIYI DING, Color texture analysis using the wavelet-based hidden Markov model,

Pattern Recognition Letters, v. 26, n. 11, pp. 1710-1719, 2005.

REYES-ALDASORO, C.C. & BHALERAO. A., The Bhattacharyya space for feature selection and its application

to texture segmentation, Pattern Recognition, v. 39, n. 5, pp. 812-826, 2006.

141

RICHARDS, J.A & JIA, X., Remote Sensing Digital Image Analysis: An Introduction, 3ªed. Berlin: Springer-

Verlag, 1999.

ROHRMUS, D.R., Invariant and adaptive geometrical texture features for defect detection and classification,

Pattern Recognition, v. 38, n. 10, pp. 1546-1559, 2005.

RONCERO, V.G., Um Estudo de Segmentação de Imagens Baseado em um Método de Computação Evolucionária,

Rio de Janeiro, 2005, 70 p., Dissertação de Mestrado em Engenharia Elétrica, Rio de Janeiro, 2005.

RUBNER, Y.; PUZICHA J.; TOMASI, C. & BUHMANN, J. M., Empirical Evaluation of Dissimilarity Measures

for Color and Texture, Computer Vision and Image Understanding, v. 84, n. 1, pp. 25-43, 2001.

RUSHING, J.A.; RANGANATH, H.; HINKE, T.H. & GRAVES, S.J., Image segmentation using association rule

features, Image Processing, IEEE Transactions on, v. 11, n. 5, pp.558- 567, 2002.

RUSHING, J.A.; RANGANATH, H.S.; HINKE, T.H. & GRAVES, S.J., Using association rules as texture features,

Pattern Analysis and Machine Intelligence, IEEE Transactions on, v. 23, n. 8, pp.845-858, 2001.

SÁNCHEZ-YÁÑEZ, R. E.; KURMYSHEV, E. V. & CUEVAS, F. J., A framework for texture classification using

the coordinated clusters representation, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 21-31, 2003.

SÁNCHEZ-YÁÑEZ, R. E.; KURMYSHEV, E. V. & FERNÁNDEZ, A., One-class texture classifier in the CCR

feature space, Pattern Recognition Letters, v. 24, n. 9-10, pp. 1503-1511, 2003.

SANKAR, K.P. & WANG, P.P., Genetic algorithms for Pattern Recognition, CRC Press, Inc., 1996, 336p.

SCHARCANSKI, J., Stochastic texture analysis for monitoring stochastic processes in industry, Pattern

Recognition Letters, v. 26, n. 11, pp. 1701-1709, 2005.

SCHOWENGERDT, R.A., Remote Sensing, Models and Methods for Image Processing, 2 ed., San Diego:

Academic Press, 1997, 522 p.

SCHWARTZ, W.R. & PEDRINI, H., Segmentação de Imagens de Terrenos Baseada na Associação de

Características de Textura com Dependência Espacial Modelada por Campo Aleatório de Markov, in: XII

SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 2005, Goiânia: anais do XII Simpósio Brasileiro de

Sensoriamento Remoto (INPE), pp.4311-4318, 2005.

SENGUR, A., TURKOGLU, I. & INCE, M. C., Wavelet packet neural networks for texture classification, Expert

Systems with Applications In Press, Corrected Proof, Available online Jan 2006.

SETHIAN, J. A., Level Set Methods and Fast Marching Methods: Evolving Interfaces in Computational Geometry,

Fluid Mechanics, Computer Vision and Material Science, 2 ed., Cambridge: Cambridge University Press, 1999.

SETHIAN, J. A., Numerical Methods for Propagating Fronts, Variational Methods for Free Surface Interfaces,

Proceedings of the Vallambrosa Conference, 1987.

142

SETHIAN, J. A., Tracking Interfaces with Level Sets, American Scientist, v. 85, pp. 254-263, 1997.

SHUTAO LI & SHAWE-TAYLOR, J., Comparison and fusion of multiresolution features for texture classification,

Pattern Recognition Letters, v. 26, n. 5, pp. 633-638, 20005.

SHUTAO LI; KWOK, J. T., HAILONG ZHU & YAONAN WANG, Texture classification using the support vector

machines, Pattern Recognition, v. 36, n. 12, pp. 2883-2893, 2003.

SKLANSKY, J., Image Segmentation and Feature Extraction, IEEE Transactions on Systems, Man, and

Cybernetics, v.13, n.5, pp.907-916, 1978.

SOLTANIAN-ZADEH, H.; RAFIEE-RAD, F. & POURABDOLLAH-NEJAD D, S., Comparison of multiwavelet,

wavelet, Haralick, and shape features for microcalcification classification in mammograms, Pattern Recognition, v.

37, n. 10, pp. 1973-1986, 2004.

SONKA, M.; HLAVAC, V. & BOYLE, R., Image Processing, Analysis, and Machine Vision, 2 ed., v.1, Pacific

Grove: PWS Publishing, 1999, 750p.

SUEN, P.H. & HEALEY, G., The analysis and recognition of real-world textures in threedimensions, Pattern

Analysis and Machine Intelligence, IEEE Transactions on, v. 22, n. 5, pp.491-503, 2000.

SUMENGEN, B. & MANJUNATH, B.S., Multi-scale Edge Detection and Image Segmentation, in: EUROPEAN

SIGNAL PROCESSING CONFERENCE (EUSIPCO), 2005, Antalya. Disponível em http://vision.ece.ucsb.edu/

publications/view_abstract.cgi?207

TAO-I. HSU, JIANN LING KUO, & WILSON, R., A multiresolution texture gradient method for unsupervised

segmentation, Pattern Recognition, v. 33, n. 11, pp. 1819-1833, 2000.

TE-WON LEE & LEWICKI, M.S., Unsupervised image classification, segmentation, and enhancementusing ICA

mixture models, Image Processing, IEEE Transactions on, v. 11, n. 3, pp.270-279, 2002.

TUCERYAN, M. & JAIN, A.K., Texture Analysis, Handbook of Pattern Recognition and Computer Vision, World

Scientific Publishing Company, Singapore: World Scientific, Eds. C.H.Chen, L.F.Pau & P.S.P.Wang, pp.235-276,

1993.

TZAGKARAKIS, G.; BEFERULL-LOZANO, B. & TSAKALIDES, P., Rotation-Invariant Texture Retrieval With

Gaussianized Steerable Pyramids, Image Processing, IEEE Transactions on, v. 15, n. 9, pp.2702- 2718, 2006.

VICENT, L. & SOILE, P., Watersheds in Digital Spaces: An Efficient Algorithm Based on Immersion Simulations,

IEEE Transactions on PAMI, v. 13, n. 6: pp. 583-598, 1991.

XIANGYU YANG & JUN LIU, Maximum entropy random fields for texture analysis, Pattern Recognition Letters,

v. 23, n. 1-3 , pp. 93-101, 2002.

XIANGYU YANG & JUN LIU, Unsupervised texture segmentation with one-step mean shift and boundary Markov

random fields, Pattern Recognition Letters, v. 22, n. 10, pp. 1073-1081, 2001.

143

YEN, G.G. & NITHIANANDAN, N., Facial Feature Extraction Using Genetic Algorithm, in: PROCEEDINGS OF

THE CONGRESS ON EVOLUTIONARY COMPUTATION, 2002, Honolulu: IEEE, 2002, v. 2, pp.1895-1900.

YOKOO, Y. & HAGIWARA, M., Human Faces Detection Method using Genetic Algorithm, in: PROCEEDINGS

OF THE IEEE INTERNATIONAL CONFERENCE ON EVOLUTIONARY COMPUTATION, (ICEC 96), 1996,

Nagoya: IEEE , 1996, pp.113-118.

YONG HUANG; KAP LUK CHAN & ZHIHUA ZHANG, Texture classification by multi-model feature integration

using Bayesian networks, Pattern Recognition Letters, v. 24, n. 1-3 , pp. 393-401, 2003.

YONG XIA; DAGAN FENG & RONGCHUN ZHAO, Morphology-based multifractal estimation for texture

segmentation, Image Processing, IEEE Transactions on, v. 15, n. 3, pp.614- 623, 2006.

YOSHIMURA MOTOHIDE & SHUNICHIRO OE, A Method of Distance Texture Image Segmentation by Genetic

Algorithms, in: PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON EVOLUTIONARY

COMPUTATION (ICEC 96), 1996, Nagoya: IEEE , 1996, pp.125-130.

YUZHONG WANG; JIE YANG & NINGSONG PENG, Unsupervised color–texture segmentation based on soft

criterion with adaptive mean-shift clustering, Pattern Recognition Letters , v. 27, n. 5, pp. 386-392, 2006.

ZHANG, B.; HSU, M. & DAYAL, U., K-harmonic Means - A Spatial Clustering Algorithm with Bossting, In:

PROC. INTERNATIONAL WORKSHOP ON TEMPORAL, SPATIAL AND SPATIO-TEMPORAL DATA

MINING (TSDM2000), 2000, Lyon: Lecture Notes in Artificial Intelligence, Eds. J.F.Roddick & K.Hornsby, v.

2001, pp.31-45.

ZHANG, B.; HSU, M. & DAYAL, U., K-harmonic Means - A Spatial Clustering Algorithm with Bossting,

Temporal, Spatial and Spatio-Temporal Data Mining, Lecture Notes in Artificial Intelligence, Berlin: Springer, Eds.

J.F.Roddick & K.Hornsby, pp.31-45, 2001.

ZHENG, H.; KONG, L.X. & NAHAVANDI, S., Automatic Inspection of Metallic Surface Defects using Genetic

Algorithms, Journal of Materials Processing Technology, v.125-126, pp.427–433, 2002.

ZIOU, D. & TABBONE, S., Edge Detection Techniques - An Overview, International Journal of Pattern

Recognition and Image Analysis, v.8, n.4, pp.537-559, 1998.

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo