( PDF ) Analisando o desempenho do ClassAge: um sistema multiagentes para classificação de padrões

Download PDF

ads:

Universidade Federal do Rio Grande do Norte

Centro de Ciências Exatas e da Terra

Departamento de Informática e Matemática Aplicada

Programa de Pós-Graduação em Sistemas e Computação

Analisando o desempenho do ClassAge: Um Sistema

Multiagentes para Classiﬁcação de Padrões

Márjory Cristiany da Costa Abreu

Natal

Outubro de 2006

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

Universidade Federal do Rio Grande do Norte

Centro de Ciências Exatas e da Terra

Departamento de Informática e Matemática Aplicada

Programa de Pós-Graduação em Sistemas e Computação

Analisando o desempenho do ClassAge: Um Sistema

Multiagentes para Classiﬁcação de Padrões

Dissertação de mestrado submetida ao Pro-

grama de Pós-Graduação em Sistemas e Com-

putação do Departamento de Informática e

Matemática Aplicada da Universidade Federal

do Rio Grande do Norte como parte dos req-

uisitos para a obtenção do grau de Mestre em

Sistemas e Computação (MSc.).

Márjory Cristiany da Costa Abreu

Profa. Dra. Anne Magály de Paula Canuto

Orientador

Natal, Outubro de 2006

ads:

Divisão de Serviços Técnicos

Catalogação da Publicação na Fonte. UFRN / Biblioteca Central Zila Mamede

ABREU, Márjory Cristiany da

Analisando o desempenho do ClassAge: Um Sistema Multiagentes para

Classiﬁcação de Padrões / Márjory Cristiany da Costa Abreu- Natal, RN, 2006.

133 f. : il.

Orientadora: Profa. Dra. Anne Magály de Paula Canuto.

Dissertação (Mestrado) – Universidade Federal do Rio Grande do Norte.

Centro de Ciências Exatas e da Terra. Programa de Pós-graduação em Sistemas

e Computação.

1. Sistemas Multiagentes – Dissertação. 2. Métodos de classiﬁcação –

Dissertação. 3. Métodos de Negociação – Dissertação. 4. Sistemas multiclassi-

ﬁcadores - Dissertação. 5. Ensemble – Dissertação. I. Canuto, Anne Magály de

Paula. II. Título.

RN/UF/BCZM CDU 004.78

Analisando o desempenho do ClassAge: Um Sistema

Multiagentes para Classiﬁcação de Padrões

Márjory Cristiany da Costa Abreu

’Esta dissertação de mestrado foi avaliada e considerada aprovada pelo Programa de Pós-

Graduação em Sistemas e Computação do Departamento de Informática e Matemática

Aplicada da Universidade Federal do Rio Grande do Norte.’

Profa. Dra. Anne Magály de Paula Canuto

Orientador

Banca Examinadora:

Profa. Dra. Anne Magály de Paula Canuto

Presidente

Prof. Dr. André Carlos Ponce de Leon Ferreira de Carvalho

Prof. Dr. André Maurício Cunha Campos

iii

Este trabalho é dedicado à Francisco das Chagas Abreu (painho) e Maria Aparecida

Costa Abreu (mainha).

AGRADECIMENTOS

Eu não poderia começar os agradecimentos dessa dissertação de outra forma senão

agradecendo a Deus e a Nossa Senhora Aparecida, que estão sempre presentes na minha

vida e se manifestam da maneira mais maravilhosa, sempre me mostrando o caminho

certo a seguir e sempre me dando forças, esperança e coragem para que eu realize meus

sonhos.

Existem duas pessoas sem as quais a maioria das minhas realizações não seriam pos-

síveis. Essas pessoas me ensinaram a ter responsabilidade e a jamais desistir dos meus

sonhos e ideais, mesmo que o caminho para atingi-los parecesse extremamente difcil.

Eles sempre estiveram ao meu lado, me dando força para que eu pudesse seguir a diante.

Agradeço ao meu Pai, Francisco das Chagas Abreu, e à minha Mãe, Maria Apare-

cida Costa Abreu, por tudo o que vocês me ﬁzeram, por tudo o que vocês me tornaram.

OBRIGADA!

Agradeço a minha orientadora e amiga, professora Anne Magaly de Paula Canuto,

por acreditar na minha capacidade de produção, embora, muitas vezes, nem eu mesmo

acreditasse nisso. Agradeço pelo apoio, pelas broncas, pela cobrança, pela conﬁança,

pela compreenção, enﬁm, por tudo. Sinto-me privilegiada por ter a honra de conhecer e

trabalhar com uma proﬁssional de tão grande competência e de tamanha grandeza. Sem

dúvida esse trabalho não seria possível sem seu incentivo.

É possível realizar alguma coisa sem amor? É possível crescer sem uma pessoa para

dividir as alegrias e as tristezas da vida? Quero agradecer ao meu amor, à pessoa que está

ao meu lado desde de 2002 e que tem sido o apoio, que tem tido compreenção, que tem

me aturado nos momentos mais estressantes, que tem estado comigo nos momentos mais

felizes. Quero agradecer a Carlos Eduardo da Silva ou Carioca ou Kaduardo ou apenas

Mô! Obrigado, meu amor! Por tudo que já vivemos juntos e por tudo que ainda vamos

viver juntos, por que ainda temos um doutorado e o resto da vida pela frente.

Agradeço, também, aos meus amigos Ivanilson Ninho, Jorgiano, Fellipão pelos mem-

oráveis almoços no MidWay e cafés no São Bras. Agradeço aos meus irmãos de orienta-

dora Pow, Laura e Raul por terem tido a paciência de ler a minha dissertação. :D Agradeço

aos meus amigos de DIMAp, além dos meus irmãos de orientadora: Fred, Girão, Bruno

Cruz, Laurindo, Gilbran, Lucas, Isanio, Toba, Nazário, Jones pelas muitas horas de T.O.

que me ﬁzeram rir bastante depois de um dia cansativo de trabalho.

Agradeço a CAPES, Coordenação de Aperfeiçoamento de Pessoal de Nível Superior,

pelo apoio ﬁnanceiro que foi indispensável para a conclusão deste trabalho.

Resumo

A utilização de sistemas baseados no paradigma dos agentes para resolução de prob-

lemas de reconhecimento de padrões vem sendo propostos com o intuito de resolver, ou

atenuar, o problema de tomada de decisão centralizada dos sistemas multi-classiﬁcadores

e, como consequência, melhorar sua capacidade de classiﬁcação. Com a intenção de

solucionar este problema, o Sistema NeurAge foi proposto. Este sistema é composto por

agentes neurais que podem se comunicar e negociar um resultado comum para padrões de

teste. No Sistema NeurAge, os métodos de negociação são muito importantes para prover

uma melhor precisão ao sistema, pois os agentes necessitam alcançar a melhor solução e

resolver conﬂitos, quando estes existem, em relação a um problema. Esta dissertação ap-

resenta uma extensão do Sistema NeurAge que pode utilizar qualquer tipo de classiﬁcador

e agora será chamado de Sistema ClassAge. Aqui é feita uma análise do comportamento

do Sistema ClassAge diante de várias modiﬁcações na topologia e nas conﬁgurações dos

componentes deste sistema.

Área de Concentração: Inteligência Computacional

Palavras-chave: Sistemas Multiagentes; Métodos de Classiﬁcação; Métodos de Negoci-

ação; Sistemas Multi-Classiﬁcadores; Ensemble.

Abstract

The use of multi-agent systems for classiﬁcation tasks has been proposed in order to

overcome some drawbacks of multi-classiﬁer systems and, as a consequence, to improve

performance of suchsystems. As a result, the NeurAge system was proposed. This system

is composed by several neural agents which communicate and negotiate a common result

for the testing patterns. In the NeurAge system, a negotiation method is very important to

the overall performance of the system since the agents need to reach and agreement about

a problem when there is a conﬂict among the agents. This thesis presents an extensive

analysis of the NeurAge System where it is used all kind of classiﬁers. This systems is

now named ClassAge System. It is aimed to analyze the reaction of this system to some

modiﬁcations in its topology and conﬁguration.

Area of Concentration: Computational Intelligence

Key words: Multi-Agent Systems; Classiﬁcation Methods; Negotiation Methods; Multi-

Classﬁers Systems; Ensemble.

vii

Sumário

1 Introdução 1

1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Estado da Arte 7

2.1 Sistemas Multiagente (SMA) . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1 Sistema Multiagentes Reativos . . . . . . . . . . . . . . . . . . . 9

2.1.2 Sistemas Multiagentes Cognitivos . . . . . . . . . . . . . . . . . 10

2.2 Sistemas Multi-Classiﬁcador (SMC) . . . . . . . . . . . . . . . . . . . . 11

2.2.1 Sistemas Modulares . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.2 Sistemas Paralelos . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.3 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3.1 Sistemas Multi-Classiﬁcadores . . . . . . . . . . . . . . . . . . . 15

2.3.2 Sistemas Multiagentes . . . . . . . . . . . . . . . . . . . . . . . 17

3 O Sistema NeurAge e Suas Características 23

3.1 Um Sistema Multiagente para Classiﬁcação . . . . . . . . . . . . . . . . 24

3.2 Agente Classiﬁcador do Sistema NeurAge . . . . . . . . . . . . . . . . . 26

3.3 Métodos de Negociação . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

viii

3.3.1 Método de Negociação Baseado na Teoria dos Jogos . . . . . . . 29

3.3.2 Método de Negociação Baseado no Leilão . . . . . . . . . . . . . 33

3.3.3 Método de Negociação Baseado na Sensibilidade . . . . . . . . . 37

4 Detalhamento da Investigação 43

4.1 Primeiros Resultados do Sistema NeurAge . . . . . . . . . . . . . . . . . 43

4.2 Metodologia do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.1 Validação Cruzada . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.2 Análise Estatística . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2.3 Medidas de Diversidade . . . . . . . . . . . . . . . . . . . . . . 47

4.2.4 Métodos de Classiﬁcação . . . . . . . . . . . . . . . . . . . . . . 50

4.2.5 Bases de Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.2.6 Métodos de Combinação . . . . . . . . . . . . . . . . . . . . . . 57

4.2.7 Métodos Baseados em Seleção . . . . . . . . . . . . . . . . . . . 59

4.2.8 Topologias dos Sistemas . . . . . . . . . . . . . . . . . . . . . . 61

5 Experimentos e Análises de Resultados 63

5.1 Métodos Individuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 Sistemas com Três Componentes . . . . . . . . . . . . . . . . . . . . . . 65

5.2.1 Métodos de Combinação ou Fusão para Sistemas com Três Com-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2.2 Métodos Baseados em Seleção para Sistemas com Três Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.2.3 Métodos de Negociação para Sistemas com Três Componentes . . 70

5.2.4 Negociação versus Combinação para Sistemas com Três Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2.5 Diversidade para Sistemas com Três Componentes . . . . . . . . 73

5.3 Sistemas com Cinco Componentes . . . . . . . . . . . . . . . . . . . . . 74

5.3.1 Métodos de Combinaçãoou Fusão para Sistemas com Cinco Com-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

5.3.2 Métodos Baseados em Seleção para Sistemas com Cinco Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.3.3 Métodos de Negociação para Sistemas com Cinco Componentes . 78

5.3.4 Negociação versus Combinação para Sistemas com Cinco Com-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5.3.5 Diversidade para Sistemas com Cinco Componentes . . . . . . . 81

5.4 Sistemas com Sete Componentes . . . . . . . . . . . . . . . . . . . . . . 82

5.4.1 Métodos de Combinação ou Fusão para Sistemas com Sete Com-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5.4.2 Métodos Baseados em Seleção para Sistemas com Sete Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.4.3 Métodos de Negociação para Sistemas com Sete Componentes . . 87

5.4.4 Negociação versus Combinação para Sistemas com Sete Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.4.5 Diversidade para Sistemas com Sete Componentes . . . . . . . . 90

5.5 Sistemas com Nove Componentes . . . . . . . . . . . . . . . . . . . . . 91

5.5.1 Métodos de Combinaçãoou Fusão para Sistemas com NoveCom-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5.5.2 Métodos Baseados em Seleção para Sistemas com Nove Compo-

nentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.5.3 Métodos de Negociação para Sistemas com Nove Componentes . 95

5.5.4 Negociação versus Combinação para Sistemas com Nove Com-

ponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

5.5.5 Diversidade para Sistemas com Nove Componentes . . . . . . . . 98

5.6 Discussão dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 100

5.6.1 Tamanho dos Sistemas . . . . . . . . . . . . . . . . . . . . . . . 100

5.6.2 Estrutura dos Sistemas . . . . . . . . . . . . . . . . . . . . . . . 100

5.6.3 Métodos de Combinação . . . . . . . . . . . . . . . . . . . . . . 101

5.6.4 Métodos de Seleção . . . . . . . . . . . . . . . . . . . . . . . . 104

5.6.5 Métodos de Negociação . . . . . . . . . . . . . . . . . . . . . . 107

5.6.6 Sensibilidade nos Sistemas . . . . . . . . . . . . . . . . . . . . . 110

5.6.7 Diversidade nos Sistemas . . . . . . . . . . . . . . . . . . . . . . 110

5.6.8 Negociação versus Combinação . . . . . . . . . . . . . . . . . . 112

6 Considerações Finais 115

6.1 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

A 128

Lista de Figuras

2.1 Modelo de um Sistema Multi-Classiﬁcador Modular . . . . . . . . . . . 14

2.2 Modelo de um Sistema Multi-Classiﬁcador Paralelo . . . . . . . . . . . . 14

3.1 Modelo de um Sistema Multi-Classiﬁcador Paralelo Tradicional . . . . . 25

3.2 Eliminação do Módulo de Combinação do Sistema Multi-Classiﬁcador . . 25

3.3 Arquitetura Interna de Um Agente Classiﬁcador . . . . . . . . . . . . . . 27

5.1 Resultados dos Métodos de Fusão para base A (breast cancer) . . . . . . 101

5.2 Resultados dos Métodos de Fusão para base B (imagem) . . . . . . . . . 101

5.3 Resultados dos Métodos de Fusão para base C (proteínas) . . . . . . . . . 102

5.4 Resultados dos Métodos de Fusão para base D (splice) . . . . . . . . . . 102

5.5 Resultados dos Métodos de Fusão para base E (wisconsin) . . . . . . . . 103

5.6 Resultados dos Métodos de Seleção para base A (breast cancer) . . . . . 104

5.7 Resultados dos Métodos de Seleção para base B (imagem) . . . . . . . . 104

5.8 Resultados dos Métodos de Seleção para base C (proteínas) . . . . . . . . 105

5.9 Resultados dos Métodos de Seleção para base D (splice) . . . . . . . . . 105

5.10 Resultados dos Métodos de Seleção para base E (wisconsin) . . . . . . . 106

5.11 Resultados dos Métodos de Negociação para base A (breast cancer) . . . 107

5.12 Resultados dos Métodos de Negociação para base B (imagem) . . . . . . 107

5.13 Resultados dos Métodos de Negociação para base C (proteínas) . . . . . . 108

5.14 Resultados dos Métodos de Negociação para base D (splice) . . . . . . . 109

xii

5.15 Resultados dos Métodos de Negociação para base E (wisconsin) . . . . . 109

5.16 Medidas de Diversidade Dupla-Falsa para todas as bases . . . . . . . . . 110

5.17 Medidas de Diversidade de Entropia para todas as bases . . . . . . . . . . 111

5.18 Medidas de Diversidade Q Estatístico para todas as bases . . . . . . . . . 111

5.19 Comparação entre os Melhores Mérodos de Seleção, Negociação e Fusão

para a base A (breast cancer) . . . . . . . . . . . . . . . . . . . . . . . . 112

5.20 Comparação entre os Melhores Mérodos de Seleção, Negociação e Fusão

para a base B (imagem) . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.21 Comparação entre os Melhores Mérodos de Seleção, Negociação e Fusão

para a base C (proteínas) . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.22 Comparação entre os Melhores Mérodos de Seleção, Negociação e Fusão

para a base D (splice) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5.23 Comparação entre os Melhores Mérodos de Seleção, Negociação e Fusão

para a base E (wisconsin) . . . . . . . . . . . . . . . . . . . . . . . . . . 114

A.1 Resumo dos Resultados para a base A (breast cancer) . . . . . . . . . . . 129

A.2 Resumo dos Resultados para a base B (imagem) . . . . . . . . . . . . . . 130

A.3 Resumo dos Resultados para a base C (proteínas) . . . . . . . . . . . . . 131

A.4 Resumo dos Resultados para a base D (splice) . . . . . . . . . . . . . . . 132

A.5 Resumo dos Resultados para a base E (wisconsin) . . . . . . . . . . . . . 133

xiii

Lista de Tabelas

3.1 Matriz de Payoff. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2 Matriz de Payoff para o NeurAge. . . . . . . . . . . . . . . . . . . . . . . 30

3.3 Conﬁabilidades dos dois Agentes. . . . . . . . . . . . . . . . . . . . . . 32

3.4 Aplicação da Matriz de Payoff para o NeurAge. . . . . . . . . . . . . . . 33

3.5 Matriz de Custo do Leilão. . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.6 Análise de Sensibilidade dos Agentes. . . . . . . . . . . . . . . . . . . . 41

3.7 Média de Treinamento para Todos os Atributos. . . . . . . . . . . . . . . 41

3.8 Distância absoluta entre os atributos do padrão de teste e da média de

treinamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.9 Ordem decrescente da distância entre os atributos. . . . . . . . . . . . . . 42

4.1 Resultados do Trabalho (Abreu, 2005). . . . . . . . . . . . . . . . . . . . 44

4.2 Características das Bases de Dados deste trabalho. . . . . . . . . . . . . . 54

4.3 Representação Numérica da Base de Dados de Imagem. . . . . . . . . . . 55

4.4 Distribuição de padrões da Base de Dados de Proteínas. . . . . . . . . . . 56

5.1 Porcentagem dos Acertos e Desvio Padrão dos Métodos Individuais. . . . 65

5.2 Método baseado em Fusão para Sistemas com Três Componentes. . . . . 67

5.3 Método baseado em Seleção para Sistemas com Três Componentes. . . . 69

5.4 Método de Negociação para Sistemas com Três Componentes. . . . . . . 71

5.5 Valores de p para os testes estatísticos entre os melhores métodos de ne-

gociação e os de fusão e seleção para sistemas com Três Componentes. . 72

xiv

5.6 Medidas de Diversidade para Sistemas com Três Componentes. . . . . . . 73

5.7 Método baseado em Fusão para Sistemas com Cinco Componentes. . . . 75

5.8 Método baseado em Seleção para Sistemas com Cinco Componentes. . . 77

5.9 Método de Negociação para Sistemas com Cinco Componentes. . . . . . 79

5.10 Teste de Hipótese entre os melhores métodos de seleção e fusão com o

melhor método de negociação para sistemas com Cinco Componentes. . . 80

5.11 Medidas de Diversidade para Sistemas com Cinco Componentes. . . . . . 81

5.12 Método baseado em Fusão para Sistemas com Sete Componentes. . . . . 84

5.13 Método baseado em Seleção para Sistemas com Sete Componentes. . . . 86

5.14 Método de Negociação para Sistemas com Sete Componentes. . . . . . . 88

5.15 Teste de Hipótese entre os melhores métodos de seleção e fusão com o

melhor método de negociação para sistemas com Sete Componentes. . . . 89

5.16 Medidas de Diversidade para Sistemas com Sete Componentes. . . . . . . 90

5.17 Método baseado em Fusão para Sistemas com Nove Componentes. . . . . 93

5.18 Método baseado em Seleção para Sistemas com Nove Componentes. . . . 94

5.19 Método de Negociação para Sistemas com Nove Componentes. . . . . . . 96

5.20 Teste de Hipótese entre os melhores métodos de seleção e fusão com o

melhor método de negociação para sistemas com Nove Componentes. . . 98

5.21 Medidas de Diversidade para Sistemas com Nove Componentes. . . . . . 99

Lista de Siglas

• ClassAge: Classiﬁer Agent System.

• DCS: Dynamic Classiﬁer Selection.

• DCS-DT: Dynamic Classiﬁer Selection - Decision-Theoretic.

• DCS-MCB: Dynamic Classiﬁer Selection - Multiple Classiﬁer Behaviour.

• FuzzyMLP: Fuzzy Multi-Layer Perceptron.

• IREP: Incremental Reduced Erro Pruning.

• JRip: Optimized IREP.

• K-nn: K-nearest neighbors.

• LCA: Local Class Accuracy.

• MLP: Multi-Layer Perceptron.

• NeurAge: Neural Agent System.

• RBF: Radial Basis Function.

• SMA: Sistemas Multi-Agente.

• SMC: Sistemas Multi-Classiﬁcadores.

• SVM: Suport Vector Machine.

xvi

Capítulo 1

Introdução

A necessidade dos pesquisadores que trabalham com mineração de dados de terem um

sistema computacional que trabalhe com o reconhecimento de padrões de forma eﬁci-

ente, precisa e com alto desempenho motivou o interesse pelo estudo na área de métodos

de reconhecimento de padrões (Cho, 1999). Apesar desses sistemas conseguirem resulta-

dos satisfatórios, eles não estavam, muitas vezes, resolvendo as tarefas de reconhecimnto

de padrões de maneira eﬁciente. Aﬁm de obter um melhor desempenho de um sistema de

reconhecimento de padrões, utilizam-se vários tipos de classiﬁcadores trabalhando con-

juntamente, dando origem ao termo Sistema Multi-Classiﬁcador (SMC) (Ho et al., 1994).

Os Sistemas Multi-Classiﬁcadores podem ser de dois tipos: Modular e Paralelo (Mit-

chell, 1997). O primeiro acontece quando cada um dos classiﬁcadores ou um conjunto

de classiﬁcadores é responsável por solucionar uma parte do problema e depois enviar

suas respostas para um método de combinação comum. Já os Paralelos funcionam de ma-

neira que todos os classiﬁcadores resolvem o mesmo problema e enviam suas respostas,

mais uma vez, para um combinador comum. Neste trabalho, a abordagem paralela será

analisada.

Dentre as aplicações mais recentes dos SMCs existentes na literatura podem-se citar

como exemplo, o reconhecimento de fala (Mukhopadhyay et al., 2003), reconhecimento

de caracteres (Heutte et al., 2004), reconhecimento de intenção (objetivo) (Zhou, 2002),

reconhecimento de faces (Lemieux and Parizeau, 2003), reconhecimento de emoção (Pe-

trushin, 2000), reconhecimento de sinais em ambiente de internet (Park et al., 2002),

biométricas (Shou-Jue and Xu, 2003), classiﬁcação de regras (Sirlantzis et al., 2002a), re-

conhecimento de imagem (Giacinto and Roli, 2001), classiﬁcação de proteínas (Tan et al.,

2003), dentre outros.

Na abordagem paralela, a escolha do método combinador, ou seja, o método que re-

aliza a tomada de decisão do sistema, é muito complicada, pois pequenas alterações na

1. Introdução 2

estrutura do sistema podem resultar em relevantes alterações no seu desempenho (Abreu

et al., 2004). O fato de um SMC possuir um método de tomada de decisão centralizado

faz com que esse tipo de sistema se torne dependente pois, independentemente dos classi-

ﬁcadores que o sistema estará trabalhando, a tomada de decisão sempre dependerá de um

único método de combinação (Abreu and Canuto, 2006).

Com o objetivode solucionar o problema de tomada de decisão centralizada dos SMC,

de maneira mais natural, tentou-se encontrar uma forma que tornasse o funcionamento e

a arquitetura desses sistemas mais ﬂexíveis. Diante de uma primeira análise, pode-se con-

siderar um SMC como sendo um Sistema Multiagentes sem uma estrutura organizacional

pré-deﬁnida, onde cada classiﬁcador é considerado um agente e o módulo combinador é,

também, um agente que, sozinho, encontrava a solução do sistema a partir dos resultados

de cada agente.

A idéia mais simples para descentralizar o processo de tomada de decisão centralizada

dos SMCs vistos, agora, como SMAs foi retirar o método de combinação desse sistema.

Para isso, os classiﬁcadores precisariam se comunicar. Diante disso, observou-se que a

comunicação entre os classiﬁcadores poderia resolver este problema, uma vez que se eles

se comunicam, eles podem concluir, mais precisamente, o resultado do sistema. A me-

lhor maneira é transformar os Sistemas Multi-Classiﬁcadores em Sistemas Multiagentes

(Abreu et al., 2006a).

Na nova visão dos SMC, os classiﬁcadores podem se comunicar e decidir a solução

do sistema sem a necessidade de consultar o módulo de tomada de decisão. Sendo assim,

agora eles são vistos como entidades autônomas que são capazes de tomar decisões, ana-

lisar as outras entidades e compartilhar informações. Logo, observou-se que a solução

para isto era utilizar Agentes Inteligentes, pois estes já possuem todas estas caracterís-

ticas. Sendo assim, a utilização dos conceitos dos SMA para a resolução de problemas

de reconhecimento de padrões ﬁcou sendo viável e um novo termo foi criado, Sistemas

Multiagente para Classiﬁcação (Abreu et al., 2004). O sistema agora é mais dinâmico,

autônomo, distribuído e possui um desempenho mais eﬁcaz.

O Sistema NeurAge (Neural Agents System), um Sistema Multiagente Neural para

Classiﬁcação (Abreu et al., 2004), (Abreu, 2005) foi proposto para utilizar o conceito de

agentes trabalhando com reconhecimendo de padrões. Este sistema possui vários agentes

com a capacidade de realização de reconhecimento de padrões. Inicialmente, eles rece-

bem uma entrada do ambiente e cada um, individualmente, calcula sua saída. Após esta

etapa, cada um dos agentes compara sua saída com os demais, tentando contestar as saídas

dos outros, se essas saídas não forem iguais a dele. Quando acontece uma discordância,

o agente que está negociando tenta persuadir os demais agentes a mudarem de opinião. A

negociação termina quando os agentes conseguem chegar a uma opinião comum.

1. Introdução 3

Diante do que foi explicado anteriormente, observa-se que existe a necessidade de

comunicação entre os agentes do NeurAge. Isto faz com que o uso de protocolos de

negociação seja necessário para o funcionamento do sistema (Wooldridge, 2002). Sendo

assim, os mecanismos de negociação são parte importante para o bom funcionamento des-

tes sistemas. É importante, também, que esses protocolos de negociação sejam eﬁcientes

e que possam trabalhar com todas as informações que os agentes fornecem, tornando o

sistema mais seguro e conﬁável (Dunne et al., 2003).

Este trabalho propõe explorar melhor o Sistema NeurAge, abrangendo extensões tanto

a nível de componentes do sistema quanto a nível de protocolos de negociação. Uma das

extensões é o uso de outros tipos de classiﬁcadores além dos neurais. Com isso esse

sistema passa a ser conhecido como o Sistema ClassAge (Classiﬁer Agents System), um

sistema multiagente para reconhecimento de padrões que pode conter qualquer tipo de

classiﬁcador em sua arquitetura.

1.1 Motivação

Na proposta inicial do Sistema NeurAge, foram utilizadas as conﬁgurações de sistema

mostradas a seguir:

• Todos os teste do Sistema NeurAge inicial foram realizados com apenas agentes

neurais contendo o apenas o método de classiﬁcação MLP (Multi-Layer Perceptron)

(Park et al., 2002);

• O tamanho do sistema era ﬁxado em quatro agentes;

• Os três métodos de negociação que foram adaptados neste trabalho foram o Baseado

na Teoria dos Jogos, o Baseado no Leilão e Baseado na Sensibilidade; e

• Foram utilizadas três bases de dados, duas delas balanceadas e com quantidade de

padrões suﬁciente para um treinamento adequado e a terceira era desbalanceada

com uma menor quantidade de padrões para um treinamento adequado.

Os resultados dos métodos de negociação foram comparados com os resultados de

dois métodos de combinação centralizados: Soma e Voto. Além disso, foi utilizado o teste

de hipótese para fazer uma comparação estatística entre os métodos. Para os métodos

Soma e Voto obteve-se sempre um desempenho superior ao desempenho dos métodos

individuais, mas inferior aos métodos de negociação. Dentre os métodos de negociação,

o que obteve o melhor desempenho para todos os experimentos foi o método baseado na

sensibilidade.

1. Introdução 4

Apesar dos resultados serem satisfatórios a uma primeira vista, pode ser observado

que a pesquisa não se apronfundou o suﬁciente nas diversas possibilidades de cada um

dos parâmetros citados anteriormente. Isso serviu como motivação para este trabalho, de

forma que está sendo proposto o uso desse sistema de forma mais aprofundada. Acredita-

se que os resultados a serem obtidos serão ainda melhores que os atuais.

1.2 Objetivos

Como foi mostrado anteriormente, o principal objetivo desse trabalho é investigar o de-

sempenho do Sistema ClassAge diante de várias modiﬁcações do seus principais parâ-

metros. Logo, este sistema deve ser submentido a diversas situações com o intuito de

observar a sua reação diante das modiﬁcações propostas. A seguir serão citados os sub-

objetivos propostos por este trabalho.

• Como primeiro sub-objetivo, analisar-se-á outros tipos de classiﬁcadores, pois os

trabalhos realizados em (Abreu, 2005) e (Abreu et al., 2004) utilizaram apenas

classiﬁcadores neurais, mais especiﬁcamente, Redes Neurais MLP (Multi-Layer

Perceptron). Neste trabalho, serão utilizados as Árvores de Decisão, as Máquinas

de Vetores Suportes, as Redes RBF (Radial Basis Function), os k-vizinhos mais

próximos, o método JRip e a Rede Fuzzy MLP.

• Outro sub-objetivo proposto é trabalhar com sistemas de tamanho variado, porque

em (Abreu, 2005) e (Abreu et al., 2004) foi utilizado apenas um Sistema Multiagen-

tes com quatro agentes. Neste trabalho, serão feitos experimentos com três, cinco,

sete e nove agentes para que se possa observar a reação do sistema a essa variação

na sua quantidade de agentes. Além disso, será observado o comportamento do

sistema quando se tem variações nos tipos de classiﬁcadores.

• Mais um sub-objetivo é comparar os métodos de negociação com outros métodos

de combinação. Isso é importante, pois uma boa maneira de avaliar o desempe-

nho dos métodos de negociação aplicados ao reconhecimento de padrões é fazer

comparações com Sistemas Multi-Classiﬁcador. Em (Abreu, 2005) e (Abreu et al.,

2004) os métodos de negociação só foram comparados a Soma e a Votação. Neste

trabalho, além do Voto e da Soma, serão utilizados outros métodos combinadores,

como, por exemplo, Redes MLP, Redes Fuzzy MLP, a Média, a Mediana e o Naive

Bayes.

• Um outro sub-objetivo é comparar os métodos de negociação com métodos basea-

dos em seleção. Da mesma maneira que é importante comparar-se os métodos de

1. Introdução 5

negociação com os métodos de combinação; é importante comparar também com

os métodos de seleção. No trabalho inicial não foi feita nenhuma comparação com

métodos de seleção. Neste trabalho serão utilizados os métodos DCS’s (Dynamic

Classiﬁer Selection) com três variações (DCS-MCB, DCS-LA e DCS-DT).

• E, como último sub-objetivo, serão utilizadas outras bases de dados. Em (Abreu,

2005) e (Abreu et al., 2004) foram utilizadas três bases de dados para avaliação.

Uma delas era desbalanceada e as outras duas eram balanceadas, porém todas pos-

suiam um grande número de exemplos. Aqui, nesta dissertação, serão trabalhadas

cinco bases de dados, pois assim, pode-se observar se o desempenho deste sistema

é dependente dos dados ou não.

Em suma, esta dissertação tem como principal objetivo fazer uma análise mais deta-

lhada do Sistema NeurAge. Como conseqüência desta análise, este sistema passará a ser

conhecido como ClassAge, pois o mesmo englobará agentes classiﬁcadores, podendo ser

neurais ou não.

1.3 Organização do Trabalho

Nesta dissertação, existem seis capítulos os quais estão organizados da maneira exposta a

seguir.

• No capítulo 1, uma breve introdução do que será mostrado, a motivação e os obje-

tivos do trabalho são feitos;

• No capítulo 2, o embasamento teórico do trabalho é exposto, além de fazer uma

mostra do estado da arte na área de pesquisa em que o trabalho se encontra, apre-

sentando os principais trabalhos que foram feitos;

• No capítulo 3, uma explanação sobre o Sistema NeurAge e de suas principais ca-

racterísticas é feita. Além disso, é apresentada uma explicação de cada método de

negociação utilizado, assim como as adaptações sofridas por estes métodos;

• No capítulo 4, a proposta principal do trabalho é mostrada, assim como também, as

etapas de desenvolvimento, a metodologia dos experimentos e uma breve explica-

ção de cada etapa;

• No capítulo5, os resultados são apresentados, assim como são apresentadas análises

destes para cada uma das bases de dados escolhidas, assim como as conﬁgurações

que foram utilizadas;

1. Introdução 6

• No capítulo 6, um comentário é feito sobre trabalho de forma geral e as suas consi-

derações;

• E, por ﬁm, é apresentada a bibliograﬁa deste trabalho.

Capítulo 2

Estado da Arte

O estudo dos Sistemas Multiagentes (SMA) para classiﬁcação é considerado um tópico

recente da Inteligência Artiﬁcial, pois mistura conceitos de Sistemas Multiagentes com

conceitos de Sistemas Multi-Classiﬁcadores (SMC) para realizar tarefas de reconheci-

mento de padrões. É possível encontrar alguns trabalhos relacionados a esse tópico, mas

que utilizam abordagens diferentes. Apesar disso, nenhum desses trabalhos utiliza con-

ceitos de negociação como solução deste problema.

Neste capítulo serão introduzidos os principais conceitos relacionados a Sistemas

Multiagentes e Sistemas Multi-classiﬁcadores. Além disso, serão citados e comentados

alguns dos principais trabalhos sobre estes tópicos e os trabalhos mais recentes que utili-

zam SMA para reconhecimento de padrões.

As seções 2.1 e 2.2 apresentam o embasamento teórico necessário para explicar o mo-

delo de Agente Classiﬁcador. Por ﬁm, na Seção 2.3 é feita uma apresentação sobre os

principais trabalhos que existem na literatura e utilizam os agentes para resolver proble-

mas de reconhecimento de padrões.

2.1 Sistemas Multiagente (SMA)

Não existe uma deﬁnição para agente que seja aceita por toda a comunidade de Inteligên-

cia Artiﬁcial. Uma deﬁnição inicial proposta por (Ferber and Gasser, 1991), é que um

agente é uma entidade real ou abstrata que é capaz de agir sobre ela mesma e sobre seu

ambiente. Em geral, o agente dispõe de uma representação parcial deste ambiente em um

universo multiagentes e ele pode se comunicar com os demais agentes. O comportamento

desse agente é conseqüência de suas observações, de seu conhecimento e das interações

com os demais agentes. Ou seja, um Agente Inteligente é um sistema computacional que

2. Estado da Arte 8

está em um ambiente deﬁnido, onde é capaz de realizar ações autônomas neste ambiente

para que um determinado objetivo seja alcançado (Wooldridge, 2002).

As deﬁnições propostas anteriormente preocupam-se com os mecanismos internos

para o tratamento de cada agente, não estabelecendo o tipo de comunicação possível nem

a granularidade dos agentes. Em (Rezende, 2002), tem-se uma deﬁnição que ressalta

o aspecto da identidade de cada agente onde um agente é uma entidade que pode ser

associada a uma identidade única e que é capaz de realizar tarefas formalizadas. Um

agente pode ser considerado como um meio que produz um certo número de ações a

partir dos conhecimentos e mecanismos internos que lhe são próprios.

Denomina-se interação entre agentes ou entre agente/ambiente uma troca de informa-

ções, que pode ser realizada de forma direta (comunicação explícita) ou de modo indireto

(emissão de sinais através do ambiente). Uma organização deﬁne todas as restrições apli-

cadas aos agentes pertencentes a uma determinada sociedade, ou seja, os meios dos quais

o projetista do sistema pode garantir que cada agente desejará e realizará a resolução dos

problemas propostos (Petrushin, 2000).

A partir disso, dado um determinado sistema, denomina-se agente cada uma de suas

entidades ditas ativas. Este conjunto de agentes forma uma sociedade. As entidades pas-

sivas serão designadas pelo termo ambiente. Um agente recebe informações e raciocina

sobre o ambiente, sobre outros agentes e decide quais ações deve realizar e quais objeti-

vos deve seguir. Um agente é uma entidade ativa, ou seja, capaz de controlar suas ações,

diferentemente das noções estáticas tais como módulos, conjunto de regras e bases de

conhecimentos (Toda et al., 2001).

Um conjunto de ações pré-deﬁnidas é associado a cada um dos agentes e essas ações

representam a sua capacidade de modiﬁcar o ambiente. O grande dilema é o agente de-

cidir qual ação será mais satisfatória para que o seu objetivo seja alcançado (Vuurpijl

and Schomaker, 1998a). De forma geral, as principais capacidades que um sistema deve

possuir para ser considerado um Agente Inteligente são: reatividade, proatividade e habi-

lidade social.

• Reatividade é a capacidade de perceber o ambiente e responder de forma oportuna

às mudanças que ocorrem nele aﬁm de satisfazer algum objetivo.

• Proatividade é a capacidade de possuir comportamento dirigido diretamente a um

determinado objetivo. O agente faz um exame da iniciativa e pondera se essa ação

ajudará de forma satisfatória o cumprimento dos seus objetivos.

• Habilidade Social é a capacidade de interagir com o ambiente e com outros agentes

a ﬁm de satisfazer seus objetivos.

2. Estado da Arte 9

Os Sistemas Multiagentes (SMA) são sistemas que possuem vários agentes, cada um

com seu objetivo ou função. Eles trabalham, em geral, por um objetivo comum e esse

objetivo comum não necessariamente é igual aos objetivos individuais de cada agente.

Pelo fato de assumir-se que eles são autônomos, eles devem ser capazes de coordenar di-

namicamente suas atividades e cooperar uns com os outros para que o objetivo do sistema

seja alcançado (Raje et al., 1998).

Pode-se deﬁnir um sistema como sendo multiagente quando ele possui determinadas

características: um ambiente, um conjunto de agentes, um conjunto de objetos, as relações

que podem existir entre esses agentes e os objetos ou entre os próprios agentes e um

conjunto de operações que podem ser realizadas (Li et al., 2005b).

Em relação ao tipo de agente contido no sistema, os SMA podem ser caracterizados

didaticamente em duas classes, que serão apresentadas a seguir. A primeira denomina-

se Sistemas Multiagentes Reativos e trabalha com o desenvolvimento de sistemas que

utilizam um grande número de agentes simples para a resolução de um determinado pro-

blema. A segunda abordagem, denominada Sistemas Multiagentes Cognitivos trabalha

com poucos agentes que realizam tarefas mais complexas que os primeiros.

2.1.1 Sistema Multiagentes Reativos

Em geral, SMAs reativos são baseados em modelos de organização biológica ou etológica

(formigas, cupins, abelhas, etc.). O modelo de funcionamento de um agente reativo é

formado pelo par Estímulo-Resposta, ou seja, Ação-Reação. As principais características

deste tipo de agente e dos sistemas onde eles se encontram são destacadas a seguir e

podem ser encontradas mais detalhadamente em (Ferber and Gasser, 1991).

• Não há representação explícita do conhecimento: o conhecimento dos agentes é

implícito (as suas regras de comportamento) e sua manifestação se externa através

do seu comportamento em interação com os demais agentes;

• Não há representação interna do ambiente: o comportamento (resposta) de cada

agente é baseado no que ele percebe (estímulo) a cada instante. Não há uma repre-

sentação interna explícita do ambiente;

• Não há memória das ações: os agentes reativos não mantém nenhum tipo de his-

tórico de suas ações, ou seja, o resultado de uma determinada ação passada não

inﬂuencia diretamente na decisão de uma ação futura;

• Organização etológica: a forma de organização dos SMA reativos é similar à ob-

servada por animais que vivem em grandes comunidades;

2. Estado da Arte 10

• Grande número de membros: em geral, os SMA reativos possuem um grande nú-

mero de agentes, com populações que podem chegar à ordem de milhares de mem-

bros.

Em suma, os agentes reativos são muito simples e não possuem representação do seu

ambiente. Suas reações dependem unicamente de sua percepção deste ambiente. Na

Inteligência Artiﬁcial clássica, por exemplo, deﬁne-se um problema de uma maneira glo-

bal, criando métodos de resolução que se aplicam diretamente e exclusivamente sobre

esta deﬁnição. Os modelos de SMAs Reativos, por outro lado, concebem o problema

como sendo um conjunto de agentes interagindo entre si, onde cada um destes possui

seus próprios objetivos individuais. Uma forma usual de representar os comportamentos

dos agentes é por meio de um conjunto de regras.

2.1.2 Sistemas Multiagentes Cognitivos

Em geral, os SMAs cognitivos são baseados em modelos de organização social, de soci-

edades humanas: grupos, hierarquias, mercados etc. Esses Agentes Cognitivos, segundo

(Ferber and Gasser, 1991), possuem uma representação explícita do ambiente e dos mem-

bros da comunidade e podem raciocinar sobre as ações tomadas no passado e planejar as

futuras ações. Os Agentes Cognitivos podem ainda interagir com os demais membros da

comunidade através de linguagens e protocolos de comunicação complexos, estratégias

soﬁsticadas de negociação etc. As principais características dos Sistemas Multiagentes

Cognitivos são citadas a seguir.

• Representação explícita do ambiente e dos outros agentes da sociedade;

• Podem manter um histórico das interações e ações passadas e, graças a esta memó-

ria, são capazes de planejar suas ações futuras;

• Seu sistema de percepção, que permite examinar o ambiente, e o de comunicação,

que permite a troca de mensagens entre agentes, são distintos. A comunicação

entre agentes pode ser realizada de modo direto, através do envio e recebimento de

mensagens;

• Seu mecanismo de controle é deliberativo. Os agentes cognitivos raciocinam e

decidem em conjunto sobre quais ações devem ser executadas, que planos seguir e

que objetivos devem alcançar;

• Os modelos de organização dos SMA cognitivos, em geral, são modelos sociológi-

cos, como, por exemplo, as organizações humanas;

2. Estado da Arte 11

• Um SMA cognitivo contém, usualmente, poucos agentes, na ordem de algumas

dezenas, no máximo.

Esses agentes normalmente apresentam elevada complexidade computacional e são

caracterizados por apresentar um comportamento inteligente tanto em uma Comunidade

de Agentes quanto isoladamente. Estas comunidades geralmente são compostas por um

pequeno número de participantes. Os agentes autônomos possuem um alto grau de deter-

minação, eles podem decidir por motivações próprias, quando e sob que condições suas

ações devem ser tomadas. Em muitos casos estes agentes precisam interagir com outros

agentes autônomos para atingir seus objetivos, por não possuirem habilidades ou recursos

suﬁcientes para solucionar seus problemas sozinhos ou ainda pela interdependência em

relação a outros agentes.

Os objetivos das interações entre agentes são para fazer outros agentes tomarem suas

decisões conscientes do que podem causar aos demais agentes (como por exemplo execu-

tar um serviço em particular), modiﬁcar uma linha de ação planejada, ou ainda atingir um

acordo sobre ações conjuntas. Uma vez que estes agentes não possuem um controle di-

reto sobre os outros faz-se necessário utilizar uma estratégia de cooperação para aglutinar

outros agentes autônomos na realização de uma dada tarefa formando assim um sistema

multiagente para solução de problemas através de ação cooperativa (Mukhopadhyay et al.,

2003).

De forma geral, pode-se dizer que os agentes cognitivos, diferentemente dos reati-

vos, possuem uma representação explícita e detalhada, além de possuir um histórico no

qual ele se baseia para tomar suas decisões. Por outro lado, os agentes reativos, diferente-

mente dos cognitivos, possuem uma comunicação indireta e um controle não deliberativo,

fazendo com que seja necessário uma quantidade considerável de agentes no sistema para

produzir, de forma emergente, um comportamento complexo.

2.2 Sistemas Multi-Classiﬁcador (SMC)

Com o crescimento da pesquisa na área de reconhecimento de padrões, o uso de classi-

ﬁcadores individuais se tornou pouco eﬁciente na maioria dos problemas complexos (Ho

et al., 1994). Diante disso, sistemas de classiﬁcação baseados na combinação de saídas de

um conjunto de diferentes classiﬁcadores vêm sendo usados como solução e estão alcan-

çando alta eﬁcácia (Roli and Giacinto, 2002). Sistemas Multi-Classiﬁcador (SMC) são

sistemas compostos de vários classiﬁcadores.

A combinação de classiﬁcadores explora a idéia que diferentes classiﬁcadores, espe-

cialistas ou módulos de reconhecimento podem oferecer informação complementar sobre

2. Estado da Arte 12

padrões a serem classiﬁcados (Canuto, 2001). Isso facilita o trabalho do módulo que

faz o papel de combinador, pois ele tem algumas opniões formadas através de diferentes

ângulos de observação sobre o mesmo padrão de entrada.

Como já foi dito, um SMC é formado por diferentes classiﬁcadores, ou algoritmos de

classiﬁcação, e uma função para a combinação das saídas desses classiﬁcadores. Estes

sistemas funcionam recebendo um dado externo, processando-o e emitindo uma resposta.

Esta resposta é direcionada a um classiﬁcador especial que executa a combinação destas

respostas e toma a decisão de qual é a melhor solução para o sistema, considerando todas

as informações fornecidas pelos demais classiﬁcadores (Cho, 1999).

A condição suﬁciente e necessária para um SMC ser mais eﬁcaz que qualquer de seus

membros, além da escolha adequada do método de combinação, é que seus classiﬁcado-

res sejam eﬁcazes e diversiﬁcados (Tan et al., 2003). A diversidade entre algoritmos de

classiﬁcação é somente a diferença entre os seus erros produzidos. Esta diversidade pode

ser medida entre dois classiﬁcadores ou entre conjuntos de classiﬁcadores, por exemplo.

Um classiﬁcador eﬁcaz é aquele que possui uma taxa de acerto melhor que uma simples

decisão aleatória. Existem três razões que justiﬁcam que é possível construir bons SMC,

ou seja, classiﬁcadores com pequenas diversidades (Yang et al., 2004).

• A primeira delas é estatística. Um algoritmo de aprendizado pode ser visto como

a busca, dentro de um espaço de hipóteses, para identiﬁcar a melhor resposta. O

problema estatístico começa quando o conjunto de dados de treinamento é muito

pequeno quando comparado com o tamanho do espaço hipotético. Sem dados suﬁ-

cientes, o algoritmo pode encontrar muitas hipóteses diferentes, mas que possuem a

mesma exatidão (Smits, 2002). Construindo um SMC diferente dos classiﬁcadores

exatos, o algoritmo pode fazer uma média das saídas e reduzir o risco da escolha da

classiﬁcação errada.

• A segunda razão é computacional. Muitos algoritmos de aprendizado trabalham

baseado em buscas locais que devem culminar em um ótimo local. Por exemplo,

redes neurais empregam o gradiente descendente para minimizar uma função de

erro sobre o conjunto de treinamento. Em todos os casos, se existe um conjunto

de treinamento suﬁciente, isto faz com que seja difícil, computacionalmente, para

o algoritmo encontrar a melhor hipótese (Sirlantzis et al., 2002b). Um SMC cons-

truído para fazer uma busca local iniciada por muitos diferentes pontos deve prover

uma melhor aproximação da função real desconhecida que qualquer um dos classi-

ﬁcadores individuais.

• A terceira razão é representacional. Em muitas aplicações de aprendizado de má-

quina, a função real do problema não pode se representada por nenhuma das hi-

2. Estado da Arte 13

póteses. A representação é complicada porque existem muitos algoritmos no qual

o espaço de hipóteses é possível para todos os classiﬁcadores ao mesmo tempo

(Sirlantzis and Fairhurst, 2001). Sendo assim, dado um conjunto de treinamento

suﬁciente, os algoritmos irão explorar o espaço de todos os possíveis classiﬁcado-

res.

Como foi citado anteriormente, um SMC possui um mecanismo de combinação que

recebe as saídas dos classiﬁcadores individuaise decide qual será a saída do sistema. A es-

colha desse mecanismo nem sempre é trivial e inﬂuencia diretamente o desempenho ﬁnal

do sistema. As características presentes no sistema criado serão diretamente dependentes

das características do problema a ser atacado (Kang and Lee, 2000). Esse mecanismo

pode ser uma única função em arquiteturas paralelas ou múltiplas funções para uma ar-

quitetura serial. A existência do modulo de combinação, que necessita de todas as saídas

dos classiﬁcadores para poder gerar a saída ﬁnal, pode tornar o sistema pouco ﬂexível,

pois torna a tomada de decisão um processo centralizado.

Existem alguns tipos de Sistemas Multi-Classiﬁcador que podem ser citados. De

acordo com a sua arquitetura interna, no mais alto nível de abstração, eles podem ser

Modular ou Paralelo (Ensemble ou Comitês) (Lemieux and Parizeau, 2003). Eles serão

explicados nas seções 2.2.1 e 2.2.2.

2.2.1 Sistemas Modulares

O termo modular é usado quando uma tarefa é decomposta em um número de sub-tarefas

e a solução da tarefa completa requer a contribuição de todos os módulos do sistema.

Neste caso, os SMCs Modulares são aqueles em que existem vários especialistas den-

tro do sistema e cada um deles executa uma tarefa em uma determinada área diferente.

Eles trabalham dividindo a tarefa a ser realizada em partes e cada uma dessas partes é

responsabilidade de um grupo de classiﬁcadores. A ﬁgura 2.1 mostra como seria a dispo-

sição dos classiﬁcadores nessa abordagem.

2. Estado da Arte 14

Figura 2.1: Modelo de um Sistema Multi-Classiﬁcador Modular

2.2.2 Sistemas Paralelos

O termo paralelo, também conhecido como Ensemble ou Comitês é usado para a combi-

nação redundante de um conjunto de classiﬁcadores. Os componentes classiﬁcadores são

redundantes de maneira que cada classiﬁcador provê a solução para a mesma tarefa.

Figura 2.2: Modelo de um Sistema Multi-Classiﬁcador Paralelo

2. Estado da Arte 15

Neste caso, os SMC Paralelos são aqueles em que todos os especialistas podem, cada

um de maneira diferente, responder ao mesmo estímulo externo. Não existe divisão de

tarefas. Todos os classiﬁcadores possuem a mesma responsabilidade. A ﬁgura 2.2 mostra

como seria a disposição dos classiﬁcadores nessa abordagem.

2.3 Trabalhos Relacionados

Existem muitos trabalhos relacionados com SMA, SMC e Sistemas Multiagentes para

reconhecimento de padrões que podem ser citados.

Dentro da abordagem desta dissertação, ou seja os trabalhos que envolvem Sistemas

Multiagentes para classiﬁcação, existem duas linhas básicas: aqueles que subdividem as

tarefas entre os agentes, de forma que cada agente é responsável por uma tarefa diferente,

similares a SMC Modular e aqueles em que os todos os agentes possuem a mesma tarefa,

similares a Ensemble ou Comitês.

Na Seção 2.3.1 são mostrados os trabalhos mais recentes sobre Sistemas de multiplos

classiﬁcadores. Na Seção 2.3.2 são mostrados os trabalhos mais recentes sobre Sistemas

Multiagentes, onde serão também mostrados os principais trabalhos relacionados com

Sistemas Multiagentes para Classiﬁcação.

2.3.1 Sistemas Multi-Classiﬁcadores

Como já foi mencionado anteriormente, os Sistemas Multi-Classiﬁcadores podem ser di-

vididos em dois tipos: Sistema Modulares e Sistemas Paralelos. Nas seções 2.3.1.1 e

2.3.1.2 são apresentados os trabalhos mais recentes e relevantes para esta dissertação que

estão relacionados com os dois tipos de SMC.

2.3.1.1 Sistemas Classiﬁcadores Modulares

Como já foi falado anteriormente, Sistemas Multi-classiﬁcadores Modulares são aqueles

em que cada agente, ou conjunto de agentes, possui uma determinada tarefa diferente das

dos demais. Dentre os principais trabalhos existentes na literatura relacionados com esta

abordagem, pode-se citar, por exemplo, (Shou-Jue and Xu, 2003), (Brewer et al., 2003),

(Heutte et al., 2004), (Vuurpijl and Schomaker, 1998b), (Mukhopadhyay et al., 2003),

(Peng et al., 2001), (Fairhust et al., 1989), (Sirlantzis et al., 2002a), dentre outros.

2. Estado da Arte 16

Em (Shou-Jue and Xu, 2003), por exemplo, um novo modelo teórico dos princípios

do Reconhecimento de Padrões foi proposto. Este modelo é baseado na importância da

cognição relacionada com a importância da classiﬁcação no Reconhecimento de Padrões

estatístico tradicional. Além disso, ele é mais próximo das funções humanas que o Reco-

nhecimento de Padrões tradicional que utiliza a separação ótima como princípio básico.

Aqui ele utiliza os sistemas modulares para trabalhar com essa distinção de tarefas. Então

esse novo modelo é chamado de Biomimetic Pattern Recognition (BPR). Sua matemática

básica é aplicada na análise topológica de um conjunto de exemplos em um alto espaço

dimensional.

Já em (Brewer et al., 2003) um sistema de classiﬁcação é utilizado para analisar os

bancos de dados que armazenam dados colhidos de ﬂorestas como vegetação, animais,

dentre outras coisas. Os componentes desse sistema incluem uma estratiﬁcação ecogeo-

gráﬁca, a produção de objetos de imagens através da segmentação de imagens, a incor-

poração de dados de imagem multi-temporal e detecção de mudanças e a utilização de

múltiplos classiﬁcadores para diferentes níveis de hierarquia de classiﬁcação. Neste sis-

tema, é criado um classiﬁcador para reconhecer cada região ou característica deste banco

de dados.

Ainda nesta mesma linha, em (Heutte et al., 2004) e (Vuurpijl and Schomaker, 1998b)

o processo de classiﬁcação é dividido em estágios e cada estágio é associado a um tipo

de classiﬁcador. Assim as tarefas são divididas e cada classiﬁcador ﬁca responsável por

solucionar uma determinada parte do problema.

Em SMC Modulares, é possível utilizar técnicas de otimização para melhorar o seu

desempenho. Em (Sirlantzis et al., 2002a), por exemplo, é introduzido um Sistema Multi-

Classiﬁcador que incorpora um algoritmo genético de forma a prover uma seleção simul-

tânea e dinâmica não somente nos participantes da classiﬁcação, mas também na regra de

combinação utilizada. É explorada a eﬁciência do algorimo evolucionário em relação ao

comportamento da conﬁguração dos especialistas resultante.

2.3.1.2 Sistemas Classiﬁcadores Paralelos

Os Sistemas Multi-classiﬁcadores Paralelos, que também são conhecidos como Ensem-

bles, como também já foi citado anteriormente, são aqueles em que todos os classiﬁcado-

res do sistema possuem a mesma tarefa. Dentre os trabalhos mais recentes encontrados na

literatura, pode-se citar (Li et al., 2005a), (Prudent and Ennaji, 2005), (Chen et al., 2005),

(Abreu et al., 2005a), (Abreu et al., 2005a) e (Abreu et al., 2005f), dentre outros.

E em Sistemas Inteligentes (Rezende, 2002) existe uma grande série de aplicações

dentro de classiﬁcadores. Neles é explicado com funcionam os classiﬁcadores, que são

2. Estado da Arte 17

os algoritmos responsáveis por solucionar problemas e como funcionam o combinadores,

que são responsáveis por combinar os resultados dos classicadores e produzir uma saída

para o sistema.

Já em (Prudent and Ennaji, 2005) é introduzido um novo esquema para a resolução de

tarefas de reconhecimento de padrões de forma geral. Esse esquema foi desenvolvido uti-

lizando um Sistema Multi-Classiﬁcador. A distribuição do processo respeita a topologia

dos dados e suas características no espaço, tudo isso para encontrar decisões conﬁáveis.

Para isso, foi utilizado uma rede auto-organizável que provê um grafo que representa

a topologia dos dados. Durante o processo de decisão este grafo é usado para ativar o

classiﬁcador apropriado entre um conjuto de especialistas.

Em (Chen et al., 2005) foi feita uma investigação das edições de independência e

diversidade entre os classiﬁcadores individuais participando de um esquema de multi-

classiﬁcador de fusão. É apresentado uma deﬁnição formal da independência estatística

dos classiﬁcadores. Neste trabalho, cada classiﬁcador tenta resolver o mesmo problema e

o combinador ﬁnal é um método de fusão que escolhe a melhor saída.

E em (Abreu et al., 2005a) foram feitos experimentos utilizando a ferramenta Weka

(Witten and Frank, 2000). Foram utilizados vários métodos de classiﬁcação aplicados

na base SCOP de dobra de proteínas (Blake and Merz, 1998). Nele foram utilizados os

métodos de combinação: Stacking, StackingC e Votação. Já, como métodos de classiﬁca-

ção, na tarefa de predição das classes de estrutura de proteínas, foram utilizados: Árvore

de Decisão, k-Vizinhos mais Próximos, Naive Bayes, Máquinas de Vetores de Suporte e

Redes Neurais. Neste trabalho foi observado que sistemas de multiclassiﬁcação tem um

desempenho melhor que os classiﬁcadores individuais de forma geral.

Seguindo a mesma linha, em (Abreu et al., 2005a) e em (Abreu et al., 2005f) fo-

ram feitos trabalhos, mais uma vez utilizando a base de dados de proteínas (Blake and

Merz, 1998). Neles são feitas alguns experimentos com SMC Híbridos e Não Híbridos,

utilizando um conjunto de tipos diferentes de classiﬁcadores e um conjunto diferente de

combinadores. Eles são trabalhos que analisam e avaliam resultados de forma diferente,

mudando os tipos de experimentos que são realizados e os tipos de comparações que são

feitas entre eles. Todos os experimentos foram realizados na plataforma Weka (Witten

and Frank, 2000).

2.3.2 Sistemas Multiagentes

Como já foi mencionado anteriormente, os Sistemas Multiagentes podem ser divididos

em dois tipos: Sistema Reativos e Sistemas Cognitivos. Nas seções 2.3.2.1 e 2.3.2.2

2. Estado da Arte 18

são apresentados os trabalhos mais recentes e relevantes para esta dissertação que estão

relacionados com os dois tipos de SMA. Na Seção 2.3.2.3 são mostrados os trabalhos

mais atuais que abordam o reconhecimento de padrões solucionado por SMA.

2.3.2.1 Sistemas Multiagentes Reativos

Como citado anteriormente, os Sistemas Multiagentes Reativos são aqueles no qual o mo-

delo de funcionamento do agente é formado pelo par Estímulo-Resposta (Ação-Reação).

Ou seja, ele possuireações pré-deﬁnidas que são ativadas quando ele reconhece que sofreu

ações que também são pré-deﬁnidas. Como principais trabalhos presentes na literatura no

momento, pode-se citar (Anja, 2003), (Lawley et al., 2003), (Waller and Dodds, 1999),

(Panwai and Dia, 2005), (Neves and Oliveira, 1998), (Corchado et al., 1997), (Popovici

et al., 2005), (Popovici et al., 2004), dentre outros.

Em (Anja, 2003), por exemplo, é mostrado que uma das tarefas dos agentes na Internet

seria fechar contratos de interesse por conta própria. O fechamento de contratos é sujeito

a responsabilidades, pois não existe diferença entre o mundo real e o virtual. Exatamente

como no mundo real, existem duas fases no fechamento do contrato, a fase pré-contratual

e a contratual. A responsabilidadede ambas é diferente. Assim, os métodos de negociação

para agentes precisam saber distinguir essas duas fases e saber o que fazer em cada uma

delas.

Já em (Lawley et al., 2003) é mostrado como o mecanismo de negociação permite

usuários controlarem os níveis de Qualidade de Serviço que lhes são requisitados. Isso é

feito através de um protocolo de negociação automático que identiﬁca termos aceitáveis

mutualmente em Grades de Serviço de Notiﬁcação. Esse protocolo resolve os problemas

de informações destacadas entre a disseminação e as preferências do usuário.

Em (Waller and Dodds, 1999), por outro lado, apresenta uma aplicação dos agentes

reativos na análise e construção de avatares humanos na utilização de ferramentas de rea-

lidade virtual. Normalmente as ferramentas usadas não possuem informações de fatores

humanos, isto é solucionado adicionando um planejamento avançado que pode prover ao

avatar se construir automaticamente.

As aplicações da robótica atualmente utilizam agentes reativos como base, como pode

ser observado em (Neves and Oliveira, 1998). Neste trabalho, é feita uma proposta de

desenvolvimento de uma plataforma móvel em um robô autônomo e móvel que é capaz

de executar diversas tarefas em diferentes ambientes e, além disso, é capaz de agregar

novas capacidades.

Outra área que pode-se encontrar grande utilização de agentes reativos é em sistemas

2. Estado da Arte 19

desenvolvidos para crianças, como pode ser visto em (Popovici et al., 2004). Neste traba-

lho apresenta um ambiente virtual educacional que é usado no ensino fundamental como

uma ferramenta suplementar para ensinar as crianças. Neste ambiente, as crianças criam

avatares e interagem entre si tomando decisões utilizando mecanismos cooperativos.

2.3.2.2 Sistemas Multiagentes Cognitivos

Diferente dos Sistemas Multiagentes Reativos, os Cognitivos, como já foi citado anterior-

mente, são sistemas muito mais complexos e apurados. Eles possuem uma representação

do ambiente detalhada e possuem uma memória, o que possibilita a consulta a experiên-

cias anteriores na hora da tomada de decisão. Eles são mais adequados para representação

humana exatamente por possuirem as características enumeradas anteriormente. Como al-

guns dos trabalhos existentes na literatura atualmente, pode-se citar (Dunne et al., 2003),

(Dunne, 2004), (Farrugia, 2002), (Miao et al., 2002), (Ogata, 2002), (Fletcher, 2006),

(Ayesh and Cowell, 2004), (van Otterlo et al., 2003), (Kawamura, 2002), (Davis, 2000),

(Boella and van der Torre, 2004), (Leong and Chunyan, 2005), dentre outros.

Em (Dunne et al., 2003) foi feito um estudo sobre a complexidade do uso de SMA

como o pricípio de implementação de contrato de negociação no comércio de Internet.

Além disso foi observado a complexidade desse uso na negociação de Internet como o

modelo abstrato, considerando que o conjunto de agentes possuem uma coleção de re-

cursos compartilhados entre eles. Eles tentam construir um benefício mútuo de relocação

desses recursos. A simples procura de negociação é aquela em que cada agente transfere

exatamente um recurso para outro. Isso é chamado de O-contracts.

Já em (Dunne, 2004) são examinadas as propriedades do modelo de alocação de re-

cursos onde é considerado um número de alternativas de noções de racionalidade. En-

quanto isso, é conhecido que impondo restrições de racionalidade e da estrutura a forma

de mudança destes recursos deve ser suﬁciente para realizar toda a realocação durante a

negociação.

E em (Farrugia, 2002) é mostrado que antes que os agentes baseados em Internet

pudessem entender negociação, eles precisavam concordar com protocolos de alto nível

baseados na lógica do sistema. A comunidade da Websemantic está desenvolvendo um

conjunto de estados para a interoperabilidade entre software de agentes baseados em In-

ternet e linguagens com semânticas bem deﬁnidas. Porém, não está claro como essas

linguagens podem ser usadas para compreenção da negociação. Logo, nesse trabalho a

lógica de sistema é mostrada como solução para este problema.

Um uso bastante comum de agentes cognitivos, também, é no ambiente de Internet.

Existe uma crescente necessidade de vários web-services, comércio eletrônico e negócios

2. Estado da Arte 20

feitos pela Internet que provenham recomendações costumizadas dos seus clientes. Em

(Miao et al., 2002) é proposto um novo tipo de agente de recomendação personalizado

utilizando agentes cognitivos baseados em fusão. Estes agentes são designados a sugerir

baseados nas preferências dos usuários, outros usuários e especialistas no assunto abor-

dado.

2.3.2.3 Sistemas Multiagentes para Reconhecimento de Padrões

O uso de agentes para realizar tarefas de reconhecimento de padrões vem crescendo cada

vez mais na literatura. Basicamente eles podem ser de dois tipos: agentes que realizam

a mesma tarefa e agentes que realizam tarefas diferentes. A seguir apresentam-se alguns

trabalhos que usam esses conceitos. Na primeira subseção a seguir mostram-se alguns

trabalhos que usam agentes para resolver tarefas diferentes, já na segunda subseção a

seguir mostram-se alguns trabalhos que usam agentes para resolver tarefas iguais.

Agentes Classiﬁcadores com Tarefas Diferentes

A partir do que já foi mostrado nesta dissertação, Sistemas compostos por Agentes

Classiﬁcadores que realizam tarefas diferentes são aqueles em que cada agente, ou con-

junto de agente, deve resolver apenas uma parte do problema a ser trabalhado e quando

cada agente, ou conjunto de agentes, fornece sua resposta para aquela parte do problema,

um combinador é responsável por concluir, de acordo com as informações fornecidas,

qual será a resposta mais adequada do sistema. Dentre os principais trabalhos que se-

guem essa abordagem, pode-se citar (Raje et al., 1998), (Heutte et al., 2004), (Heutte

et al., 2004), (Hull, 1994), (Schomaker et al., 1998), (Vuurpijl and Schomaker, 1998a),

(Morency et al., 2005), (Abreu et al., 2006a), (Abreu et al., 2006b).

Em (Raje et al., 1998), o principal foco da pesquisa é desenvolver um sistema baseado

em agentes capaz de prover serviço de informação personalizada para um usuário com o

mínimo de intervenção do mesmo. Eles utilizam uma biblioteca virtual onde é ﬁltrada

a informação e é feita a classiﬁcação de dois tipos: Ambientes de um único agente e

Ambientes Multiagentes.

Já em (Heutte et al., 2004) é feita uma análise dos sistemas que fazem a leitura au-

tomática de textos escritos à mão. O trabalho mostra como a capacidade do sistema de

leitura se adapta para o reconhecimento para cada escrita humana. Isso ocorre através da

exploração do contexto gráﬁco deﬁnido entre as invariantes do escritor. Esta adaptação é

garantida por ligações de interação ativada sobre todo o texto entre os procedimentos de

reconhecimento da palavra e da letra. Além disso, é utilizado uma arquitetura de multia-

gentes para suportar os princípios da implementação de adaptação.

2. Estado da Arte 21

A essência do projeto apresentado em (Schomaker et al., 1998) é que em muitos cam-

pos do reconhecimento de padrões, várias técnicas são avaliadas para classiﬁcar instâncias

de padrões. Cada aproximação é caracterizada pelas suas próprias virtudes e respostas. A

idéia de combinar a saída de muitos classiﬁcadores tem sido estudada por muitos anos na

expectativa de quando comparada ao melhor classiﬁcador, SMC, deve-se ter uma maior

capacidade de reconhecimento. A combinação de muitos classiﬁcadores é um exemplo

do mais geral e fundamental problema da integração de informação de muitas fontes.

Como escolher uma combinação de algoritmos é ainda um problema e esse é o tópico de

pesquisa desse projeto.

Em (Vuurpijl and Schomaker, 1998a) é descrito um novo framework que utiliza agen-

tes inteligentes para reconhecimento de padrões. Com ele é implementado um reconhece-

dor de dígito para validação de senha. A modularidade intrínseca do uso de agentes provê

uma resposta mais rápida, um desenvolvimento mais estratiﬁcado e um paralelismo para

o sistema proposto.

Já em (Morency et al., 2005) é apresentado um modelo de reconhecimento visual

que integra sugestões de um diálogo falado de um agente com a observação direta da

reação mais aparente do usuário. Isso é motivado pelo fato que as reações e os gestos

oferecem muitas chaves convencionais e são usadas essencialmente na interação entre

pessoas. Foi investigado como a informação contextual pode gerar uma reação de ações

durante interações com agentes.

Em (Abreu et al., 2006a) e em (Abreu et al., 2006b) é feito a implementação de um

sistema multiagente para classiﬁcação de padrões utilizando-se da plataforma multiagente

JADE, onde os agentes têm visões diferentes do padrão a ser classiﬁcado apesar de se

proporem a resolver a mesma tarefa. Além disso, dois tipos de métodos de classiﬁcação

são utilizados (redes neurais MLP e RBF).

Agentes Classiﬁcadores com Tarefas Iguais

Por outro lado, Sistemas compostos por Agentes Classiﬁcadores que realizam a mesma

tarefa são aqueles em que cada agente deve resolver o mesmo problema. Dentre os prin-

cipais trabalhos que seguem essa abordagem, pode-se citar (Al-Ani and Derich, 2002),

(Petrushin, 2000), (Julia et al., 1997), (Sidorova, 1999), (Abreu et al., 2005e), (Abreu

et al., 2004) e (Abreu, 2005).

Mas em (Al-Ani and Derich, 2002) é apresentada uma nova técnica de combinação

de classiﬁcadores baseada na teoria de Dempster-Shafer de evidência. Essa teoria é um

poderoso método para combinar medidas de evidência para diferentes classiﬁcadores.

Entretanto, cada um dos métodos avaliados que estima a evidência dos classiﬁcadores é

2. Estado da Arte 22

analisado. Estes possuem suas próprias limitações. Além disso, é proposta aqui uma nova

implementação no qual existe adaptação para os dados de treinamento.

Em (Petrushin, 2000) é feito uma descrição dos agentes para reconhecimento de emo-

ções em apresentações públicas e suas aplicações em problemas do mundo real. Os agen-

tes podem reconhecer cinco estados emocionais com a seguinte exatidão: Normal ou

Não-Emocional (55-75%), Felicidade (60-70%), Raiva (70-80%), Tristeza (75-85%) e

Medo (35-55%). A média total de exatidão é, em torno, de 70%. Os agentes podem ser

adaptados para um determinado ambiente dependendo dos parâmetros da apresentação e

do número de alvos de emoções. Para uma aplicação prática um agente tem sido criado

para ser hábil na análise da qualidade do sinal de fala e diferenciar entre dois estados de

emoção: Agitação (Raiva, Felicidade e Medo) e Calma(Estado Normal e Tristeza).

Em (Julia et al., 1997) é feita uma descrição de um protótipo para uma aplicação

que combina tecnologia de identiﬁcação de fala e uma arquitetura de agentes para pro-

ver monitoração de mensagens de voz incomuns de usuários. Nele, agentes distribuídos

processam o pedido, testando periodicamente o sistema de correio de voz do usuário para

identiﬁcar a composição das mensagens a partir de um conjunto de vozes selecionadas.

Quando a mensagem encontra a condição especiﬁcada pelo usuário, os agentes localizam

a posição do pedido e notiﬁcam o usuário que chegou uma mensagem importante.

E em (Sidorova, 1999) uma estratégia de reconhecimento de padrões baseada na in-

ferência de árvore gramatical e um método de aprendizado estatístico baseado na Árvore

de Decisão - Algoritmo C4.5 (Quinhan, 1993) para uma solução é apresentado. O agente

trabalha com linguagem Russa. A idéia principal do algoritmo é que o sinal da linguagem

é muito rica em detalhes e que essa riqueza reﬂete na riqueza estrutural da linguística.

Árvores são usadas para representar a organização estrutural. Primeiro o sistema aprende

um conjunto de árvores automáticas até a técnica de correção de erro baseada em infe-

rência gramatical. Então, um conjunto de distâncias de cada estrutura para cada árvore

automática é obtida. Finalmente, a árvore de decisão aprende pelo último conjunto de

distâncias usadas no algoritmo.

Já em (Abreu et al., 2005e) foi utilizada a mesma base de dados que em (Abreu et al.,

2005a), mas os experimentos foram diferentes. Nesse trabalho é apresentada uma análise

entre sistemas de classiﬁcação e métodos de negociação propostos no Sistema NeurAge.

Foram utilizados os métodos de negociação adaptados propostos em (Abreu et al., 2004) e

(Abreu, 2005) que são: Teoria dos Jogos, Leilão e Negociação Baseado na Sensibilidade

de agente. Dentre os métodos de combinação consagrados na literatura, foram utilizados a

Soma e o Voto. Por ﬁm, o trabalho mostra que o método baseado na sensibilidade possuiu

um melhor desempenho comparados com os demais.

Capítulo 3

O Sistema NeurAge e Suas

Características

Os sistemas com classiﬁcadores combinados possuem potenciais vantagens sobre os mé-

todos individuais mas, a implementação desses sistemas não é uma tarefa fácil e simples.

O principal problema é a determinação da estratégia de combinação. Normalmente, a

escolha do melhor método de combinação para um Sistema Multi-Classiﬁcador (SMC)

necessita de execuções exaustivas. Essa limitação acontece pelo fato de existir um pro-

cesso de tomada de decisão centralizado.

Os SMCs podem utilizar muitos classiﬁcadores em sua topologia, porém apenas o

método de combinação é responsável pela escolha da saída ﬁnal do sistema. Este fato ca-

racteriza um processo de tomada de decisão centralizado e mostra uma grande dependên-

cia entre a escolha de um método de combinação e o desempenho do sistema (Kuncheva,

2004). Com o intuito de transformar a tomada de decisão dos SMCs mais distribuída,

alguns métodos de baseados em seleção foram propostos (Giacinto and Roli, 1999) e

(Didaci and Giacinto, 2004). Estes métodos baseados em seleção são conhecidos como

DCSs (Dynamic Classiﬁer Selection) e eles escolhem o classiﬁcador que foi considerado

mais apto para a classiﬁcação do padrão de entrada. A escolha do classiﬁcador que rotula

o padrão é feita durante uma fase de operação. Esta escolha é normalmente baseada na

escolha do método vencedor.

Nestes métodos de seleção de um SMC acontece uma escolha direta, conhecida tam-

bém como one-step process ou processo de um passo. Neste processo, a escolha do

classiﬁcador é feita somente uma vez por padrão, onde o classiﬁcador considerado o mais

competente é escolhido. Podem acontecer situações onde todos os classiﬁcadores esco-

lhem respostas erradas, desta maneira produzindo uma resposta errada. O ideal é que um

conjunto de classiﬁcadores decida, de maneira interativa e incremental, qual dos classi-

3. O Sistema NeurAge e Suas Características 24

ﬁcadores é mais adequado para classiﬁcar aquele determinado padrão de entrada. Além

disso, os classiﬁcadores também devem poder mudar de opinião, baseados em critérios

ou informações sobre os padrões de entrada.

O Sistema NeurAge é um Sistema Multiagentes (SMA) que foi proposto como uma

possível solução para o problema de tomada de decisão centralizado dos SMCs. O funci-

onamento geral do NeurAge pode ser descrito da seguinte maneira: quando uma entrada

é mostrada para o sistema, todos os agentes neurais produzem suas próprias respostas.

Ao contrário dos SMCs centralizados ou paralelos, onde existe um método de combina-

ção que escolhe a saída do sistema, todos os agentes se comunicarão com os demais para

encontrar uma saída comum para o sistema. Dessa maneira, tem-se um caminho mais

ﬂexível e ainda distribuído para realizar a tomada de decisão.

A Seção 3.1 mostra como foi feita a ligação entre a topologia bem como o funciona-

mento dos SMCs e os SMAs e a migração. Na Seção 3.2 explica-se como foi modelado

um agente de classiﬁcação, ou seja, aquele que possui a capacidade de realizar reconhe-

cimento de padrão. E, por ﬁm, na Seção 3.3 faz-se uma introdução e uma explicação de

como funcionam alguns dos métodos de negociação mais utilizados na literatura e como

foram feitas as adaptações para que eles fossem utilizados no Sistema NeurAge.

3.1 Um Sistema Multiagente para Classiﬁcação

A Figura 3.1 ilustra um exemplo típico de um SMC paralelo, também conhecido como

Ensemble ou Comitês. Como já foi mencionado anteriormente, neste tipo de sistema os

classiﬁcadores analisam padrões de entrada mostrados a eles e enviam suas respostas para

um método combinador. Este combinador é, também, um classiﬁcador. Este combinador

decide qual a classe adequada para o padrão que foi apresentado ao sistema.

Como já mencionado anteriormente, a existência de um módulo de combinação nos

SMCs, que necessita de todas as saídas dos classiﬁcadores para obter a saída ﬁnal de

um sistema, pode torná-los sistemas depentes deste módulo. Além disso, se, por algum

motivo, o combinador parar de funcionar o sistema parará. Isso ocorre porque a tomada

de decisão é um processo centralizado. Neste contexto, iniciou-se o estudo de uma so-

lução viável com o objetivo de atenuar esse problema. A partir do modelo da Figura 3.1

começou-se a pensar como poderia ser resolvido esse problema de centralização. Pensou-

se, então, em criar estruturas que ﬁzessem a classiﬁcação de uma maneira diferente, no

qual os classiﬁcadores pudessem decidir, por si só, qual seria a saída do sistema.

A Figura 3.2 mostra o sistema proposto inicialmente em (Abreu et al., 2004). Na

sua estrutura observa-se um sistema no qual os todos os seus componentes podem se

3. O Sistema NeurAge e Suas Características 25

Figura 3.1: Modelo de um Sistema Multi-Classiﬁcador Paralelo Tradicional

comunicar. Todas as entidades seriam autônomas e uma entrada é mostrada para todas

essas entidades.

Figura 3.2: Eliminação do Módulo de Combinação do Sistema Multi-Classiﬁcador

3. O Sistema NeurAge e Suas Características 26

As entidades supracitadas, por conseguinte, produziriam suas respectivas saídas e,

diferentemente da Figura 3.1 no qual essas saídas eram enviadas para um módulo de

combinação, as entidades se comunicariam entrando em acordo em relação à resposta

para a entrada fornecida.

Percebeu-se que esse sistema proposto era bastante semelhante com um SMA. Porém,

nele os agentes deveriam executar tarefas de reconhecimento de padrões. Para atender a

essa nova funcionalidade foi proposta a idéia de modelar um agente de classiﬁcação que

era composto pelos módulos básicos de um agente inteligente e, além disso, possuiria

um módulo extra que executaria o reconhecimento de padrões. Essa nova entidade seria

conhecida como Agente Classiﬁcador.

3.2 Agente Classiﬁcador do Sistema NeurAge

A arquitetura de um Agente Classiﬁcador pode ser representada pela Figura 3.3 que é

composta pelos módulos citados a seguir.

• Controlador: Este módulo é responsável por receber as perguntas do usuário, assim

como, por deﬁnir a ordem de ativação de seus processos internos.

• Tomada de Decisão: Este módulo é responsável por raciocinar sobre seu conheci-

mento a ﬁm deﬁnir a melhor saída para um classiﬁcador.

• Negociação: Este módulo é responsável pela comunicação com outros agentes a

ﬁm de que um resultado comum seja obtido. Esta negociação é feita através de

protocolos de negociações. Durante o processo da negociação, pode-se sugerir que

um agente mude seu resultado. Entretanto, cada um deles possui a autonomia para

decidir se muda ou conﬁrma seu resultado atual.

• Classiﬁcador: Este módulo é responsável por executar o método de classiﬁcação do

agente. Este método de classiﬁcação produz uma saída para cada classe possível

do problema em questão, esta saída representa o grau de certeza que o agente tem

de que o padrão de entrada pertença àquela classe. A classe escolhida pelo agente

é aquela que possui o maior valor de saída do método de classiﬁcação, ou seja, o

maior grau de certeza. O fato do método de classiﬁcação produzir esses graus de

certezas possibilita o agente de analisar outras possibilidades de resposta durante a

negociação.

3. O Sistema NeurAge e Suas Características 27

Figura 3.3: Arquitetura Interna de Um Agente Classiﬁcador

3. O Sistema NeurAge e Suas Características 28

A idéia principal por trás do funcionamento do Agente Classiﬁcador mostrado na

Figura 3.3 é que uma vez que a pergunta do usuário é fornecida, o controlador passa a

informação ao módulo de tomada de decisão, que alcança o módulo classiﬁcador para

produzir sua saída. Então, o controlador pode decidir se deve se comunicar com outros

agentes, através do módulo de negociação, a ﬁm de alcançar um resultado comum ou não.

Durante o processo da negociação, pode ser necessária uma mudança de opinião so-

bre a saída atual ou que se execute novamente alguma outra ação (Abreu et al., 2004).

O processo de mudar um resultado é possível porque o módulo classiﬁcador fornecerá

sempre uma lista de classes possíveis baseado em alguns critérios da avaliação. Além

disso, um agente pode decidir executar a tomada de decisão mais uma vez, analisando

outros critérios ou características do padrão de teste. Uma vez que um resultado comum

é alcançado, fornece-se ao usuário.

3.3 Métodos de Negociação

A necessidade de que os agentes se comuniquem para que possam chegar a uma solução

comum é bastante evidente no Sistema NeurAge. Com isso, observou-se que o processo

de negociação é muito importante para o seu bom funcionamento (Abreu et al., 2005d).

Os protocolos de negociação usados nos SMAs não podem ser aplicados adequadamente

no Sistema NeurAge. Como exemplo, tem-se que durante a negociação em um sistema

baseado em Leilão, dois agentes (comprador e vendedor) tentam encontrar um valor co-

mum que seja bom para ambos (Tomohara, 2002). Por outro lado, dois agentes neurais

do NeurAge devem decidir a qual classe pertence um determinado padrão de entrada. No

NeurAge, ambos podem produzir diferentes classes para o mesmo padrão. A mudança do

valor da saída de um agente do NeurAge não beneﬁciará o outro agente como acontece

no sistema baseado no Leilão. Dessa maneira, um deles ou ambos terão que mudar seus

resultados e aceitar a saída do outro (Toda et al., 2001). Daí, a necessidade de adaptá-

los. Existem vários métodos de negociação na literatura, dentre eles foram utilizados os

citados a seguir.

• Método baseado na Teoria dos Jogos, (De Vos and Vermeir, 2001), (Mathieu et al.,

2006),

• Método baseado no Leilão, (Li et al., 2005b), (Ben-Ameur et al., 2002),

• Método baseado na Sensibilidade (Abreu, 2005), (Abreu et al., 2005d).

3. O Sistema NeurAge e Suas Características 29

Quando usam-se métodos de classiﬁcação, os valores de conﬁabilidade podem ser

associados com as amostras para mostrar a conﬁabilidade do método em questão na clas-

siﬁcação de um padrão de entrada para uma classe particular. Valores de conﬁabilidade

podem, também, ser associados a todas as outras classes e eles deﬁnem um certo grau de

pertinência de um exemplo e todas as classes. Estes valores de conﬁabilidade, também

conhecidos como grau de conﬁabilidade, são providos por todos os métodos de classiﬁ-

cação e podem ser considerados como uma das mais valiosas informações que podem ser

extraídas das saídas dos métodos de classiﬁcação (Zhou, 2002). No Sistema NeurAge,

uma vez que uma classe ganhadora é deﬁnida pelo classiﬁcador de um agente, sua con-

ﬁabilidade correspodente é considerada a conﬁabilidade do agente. Quando um agente

muda o seu resultado (classe), sua conﬁabilidade também muda.

É importante enfatizar que o uso da conﬁabilidade foi aplicado nos três métodos de

negociação. Entretanto, não é permitido que um agente possua conﬁabilidade negativa.

Neste caso, ou o agente muda a classe vencedora ou será descartado do processo de ne-

gociação, pois não existe sentido em manter um agente com conﬁabilidade negativa no

processo de negociação. Em todos os métodos que serão descritos a seguir, a decisão de

manter ou descartar um agente da negociação é baseado em regras internas e no domínio

da base de conhecimento de cada agente.

Outro detalhe importante é que nestes métodos de negociação o agente não pode optar

por não negociar, ou seja, sempre que houver discordância de opiniões, haverá negocia-

ção. A seguir serão explicados como funcionam os métodos de negociação abordados

neste trabalho e como são as adaptações feitas para a utilização do Sistema ClassAge.

3.3.1 Método de Negociação Baseado na Teoria dos Jogos

A Teoria dos Jogos vem sendo amplamente usada como uma ferramenta de cooperação

em Sistemas Multiagentes (SMA) (Osborne, 2003). Na Teoria dos Jogos, uma descrição

sistemática dos resultados pode ser feita através da utilização da estratégia dos jogos.

Uma estratégia de jogo é um jogo no qual um jogador, neste caso um agente, escolhe o

seu plano de ação apenas uma vez e ao mesmo tempo que o seu oponente. De maneira

a ajudar os jogadores a tomar suas decisões, uma matriz de payoff (matriz de retorno) é

usada. Nesta matriz, cada célula representa o valor de payoff que os jogadores terão no

caso dessas ações serem escolhidas. Um modelo da matriz de payoff é mostrado na Tabela

3.1, onde existem dois jogadores e cada um deles só possui duas ações.

Como pode ser visto na Tabela 3.1, os jogadores devem analisar cada uma das possi-

bilidades e escolher aquela onde ele mesmo possui a menor perda. Para o caso do jogador

3. O Sistema NeurAge e Suas Características 30

Jogador 1

Jogador 2

AçãoA/Jogador1; AçãoB/Jogador2 AçãoA/Jogador1; AçãoD/Jogador2

AçãoC/Jogador1; AçãoB/Jogador2 AçãoC/Jogador1; AçãoD/Jogador2

Tabela 3.1: Matriz de Payoff.

1, ele pode executar apenas as ações A e C, já o jogador 2, pode executar apenas as ações

B e D. A partir disso, eles negociam até chegar em comum.

Baseado no que foi introduzido anteriormente, a estratégia da teoria dos jogos foi

ajustada para que fosse possível ser utilizada no NeurAge. Como já mencionado, quando

um padrão de entrada é apresentado ao Sistema NeurAge, todos os agentes escolhem sua

classe de saída, que representa a classe ganhadora para aquele padrão, ou seja aquela

com o maior valor de conﬁabilidade. Além disso, é fornecido por cada agente a lista de

conﬁabilidades, ou seja, o grau de pertinência do padrão de entrada para cada classe. A

partir disso, todos os agentes do NeurAge possuem sempre duas ações possíveis, que são:

manter a classe vencedora ou mudar a classe vencedora para a classe vencedora do agente

oponente. A matriz de payoff para esta situação seria a mostrada na Tabela 3.2.

muda/Ag

; muda/Ag

nãoMuda/Ag

; muda/Ag

muda/Ag

; nãoMuda/Ag

nãoMuda/Ag

; nãoMuda/Ag

Tabela 3.2: Matriz de Payoff para o NeurAge.

Na Tabela 3.2 observa-se que existem quatro conﬁgurações possíveis que são: ambos

mudam de classe, ambos não mudam de classe ou um deles muda e o outro não muda.

No NeurAge, o agente escolhe o que for melhor para ele. É importante, ainda, deﬁnir a

medida de payoff que será utilizada na matriz. No caso usado no NeurAge, essas medidas

devem ser baseadas na conﬁabilidade da classe vencedora do agente e na conﬁabilidade

da classe correspondente a classe vencedora do agente oponente. As equações 3.1 e 3.2

mostram como seria o cálculo da matriz para as possibilidades do agente mudar ou não

mudar de classe respectivamente para o Ag

muda/Ag

confAg

[V encAg

] + confAg

[V encAg

]

(3.1)

naoMuda/Ag

= conf Ag

[V encAg

] − confAg

[V encAg

] (3.2)

onde confAg

[V encAg

] é a conﬁabilidade do agente i para a classe atualmente vence-

dora do agente i e confAg

[V encAg

] é a conﬁabilidade do agente i para a classe atu-

almente vencedora do agente j. Esses valores de payoff serão correspondentes as novas

3. O Sistema NeurAge e Suas Características 31

conﬁabilidades dos agentes. Por exemplo, se um agente muda de classe, a conﬁabilidade

da classe que era vencedora vai ser igual ao valor calculado na Fórmula 3.1. Já se ele

não muda de classe, a conﬁabilidade da classe que era vencedora vai ser igual ao valor

calculado na Fórmula 3.2. Com isso, tem-se que os valores de payoff para as duas ações

são, como mostrados anteriormente:

• A ação muda: o valor de payoff é a média da soma entre as conﬁabilidades dos

agentes;

• A ação não muda: o valor de payoff é a diferença entre as conﬁabilidades dos

agentes.

Essa negociação só acontece entre dois agentes de cada vez. Caso existam mais de

dois agentes na negociação, é feita uma ordenação pelo valor da conﬁabilidade da classe

vencedora de cada agente. A partir disso, é criada uma lista de ordenação que contém as

referências para os agentes. Sempre que um agente é excluído do processo de negociação,

o que está imediatamente após ele na lista de ordenação entra nesta negociação.

Quando um agente decide mudar de classe e o outro decide não mudar, aquele que

mudou é considerado o perdedor e é eliminado da negociação. Então um novo agente

entra no seu lugar. Quando os dois mudam ou não mudam, ambos continuam na negocia-

ção. A negociação termina quando não existe mais nenhum agente na lista de ordenação

para substituir aquele que é retirado da negociação. Um plano de ação que representa a

Teoria dos Jogos aplicado ao NeurAge é mostrado a seguir.

1. Apresente o padrão para cada um dos agentes e estes escolhem suas classes vence-

doras;

2. Se todos os agentes possuirem a mesma classe vencedora, vá para o Passo 9;

3. Ordene os agentes decrescentemente de acordo com suas conﬁabilidades e coloque-

os em uma lista de negociação;

4. Se ainda existir mais de dois agentes na lista de negociação, escolha os dois com as

maiores conﬁabilidades e com classes vencedoras diferentes para negociar. Senão

vá para o Passo 9;

5. Para cada um deles calcule os novos valores de payoff para os casos deles mudarem

e não mudarem de classe;

6. Escolha a ação onde acontece menor perda para cada um dos agentes;

3. O Sistema NeurAge e Suas Características 32

7. Se apenas um dos dois agentes escolheu mudar de classe, modiﬁca-se a sua conﬁa-

bilidade e ele está excluído da negociação. Vá para o Passo 3;

8. Se ambos escolheram não mudar ou mudar de classe, modiﬁcam-se as suas conﬁa-

bilidades e ambos continuam na negociação. Vá para o Passo 3;

9. Se ainda existir padrão, vá para o próximo padrão e para o Passo 1, senão vá para o

Passo 10;

10. Termina a negociação.

3.3.1.1 Exemplo do Método de Negociação Baseado na Teoria dos Jogos

Como exemplo para ilustrar a operação desse método, será analisada uma tarefa de reco-

nhecimento de padrões. Para tal serão consideradas de três classes (A, B e C) no qual cada

padrão contém cinco atributos (at1, at2, at3, at4 e at5). Supondo um sistema composto de

dois agentes (Ag1, Ag2). Após o processo de treinamento o seguinte padrão de teste (0,7;

0,4; 0,34; 0,9; 0,22) é apresentado aos agentes. O módulo de classiﬁcação de cada agente

produz suas respectivas saídas. A Tabela 3.3 mostra a saída de cada um dos agentes.

Agente 1 (Ag1) Agente 2 (Ag2)

Classe Conﬁabilidade Classe Conﬁabilidade

A 0,90 B 0,87

B 0,30 A 0,56

C 0,25 C 0,34

Tabela 3.3: Conﬁabilidades dos dois Agentes.

A Tabela 3.3 representa o Passo 3 do plano de ação mostrado anteriormente. Nesse

caso, a classe escolhida pelo Ag1 foi a A, por ter tido a maior conﬁabilidade, seguido pela

B e C. Já, a classe escolhida pelo Ag2 foi a B, seguida pela A e C. O Passo 4 do plano de

ação é satisfeito, pois existem dois agentes para negociar. Como já foi dito, uma matriz

de payoff é calculada para cada ação dos agentes, isto corresponde ao Passo 5 do plano de

ação. Logo, para o Ag1 e o Ag2 tem-se que, aplicando as Funções 3.1 e 3.2, os resultados

mostrados a seguir.

• muda/Ag1 =

0,90+0,30

= 0, 60, referente a Função 3.1;

• naoMuda/Ag1 = 0, 90 − 0, 30 = 0, 60, referente a Função 3.2;

• muda/Ag2 =

0,87+0,56

= 0, 715, referente a Função 3.1;

3. O Sistema NeurAge e Suas Características 33

• naoMuda/Ag2 = 0, 87 − 0, 56 = 0, 31, referente a Função 3.2.

Para esta situação a matriz de payoff seria como a mostrada na Tabela 3.4. Nela, pode-

se observar que para o agente 1 não existe diferença entre as ações mudar ou não, pois

em ambos os casos sua conﬁabilidade para a classe A teria uma diminuição de 0,30. Já

para o agente 2 é mais vantajoso escolher a ação muda de classe, pois a sua conﬁabilidade

para a classe B diminuiria 0,155 apenas, já se ele escolhesse a ação não muda a sua

conﬁabilidade diminuiria 0,56. Sendo assim, a célula escolhida da matriz de payoff é a

célula C

1,2

, ou seja, a célula correspondente a linha 1 e coluna 2 ou 1,2.

Agente 1

Agente 2

0,60; 0,715 0,60; 0,715

0,60; 0,31 0,60; 0,31

Tabela 3.4: Aplicação da Matriz de Payoff para o NeurAge.

Como já foi mencionado anteriormente, se apenas um dos dois agentes escolhe a ação

mudar, este agente está descartado da negociação. Seguindo o plano de ação mostrado

anteriormente, no Passo 6 tem-se que o agente 1 escolhe a ação não mudar e o agente 2

escolhe a ação mudar. Pelo Passo 7, o agente 2 está fora da negociação e volta-se para o

Passo 3. Fazendo uma nova ordenação das conﬁabilidades do agente 1, tem-se que a sua

classe vencedora continuaria sendo a classe A. Indo para o Passo 4 observa-se que não

existem mais agentes para negociar, sendo assim, vai-se para o Passo 10 que ﬁnaliza a

negociação para aquele padrão de entrada.

Na arquitetura interna dos agentes que usam este método de negociação, a base de

conhecimento compartilhada contém toda a informação sobre os valores de mudar ou

não mudar de todos os agentes que estão na negociação. Por outro lado, o domínio da

base de conhecimento privada possui informações sobre as conﬁabilidades dos agentes,

as novas conﬁabilidades e um limiar, que é individual para cada agente. Existindo este

limiar, um agente pode decidir mudar, por ele mesmo, uma classe vencedora. Como já

mencionado, estas decisões podem ser baseadas em regras internas e individuais de cada

agente, dependendo de experiências passadas.

3.3.2 Método de Negociação Baseado no Leilão

Leilão é outro protocolo de negociação que foi ajustado para ser usado no Sistema Neu-

rAge. O leilão é um método no qual uma série de regras devem ser seguidas. Isto pode

determinar recursos e valores para uma boa base em uma proposta inicial feita por um

dos seus participantes. Este método é bastante popular no ambiente da Internet (Farrugia,

3. O Sistema NeurAge e Suas Características 34

2002). O leilão pode ser visto como uma transação comercial onde existe um vendedor

e vários compradores. Um comprador é considerado vencedor de um leilão quando ele

consegue dar o melhor lance, ou seja, fazer a proposta mais vantajosa para o vendedor.

Uma seção de leilão pode durar uma considerável porção de tempo. Por exemplo, um

leilão de internet pode durar dias até que se deﬁna qual é o comprador vencedor, ou seja,

aquele com a melhor proposta.

Diferentemente do leilão original, neste método, todos os agentes são considerados

como de um tipo, ou seja ou todos vendedores ou todos compradores. Eles tentam alcan-

çar um acordo em relação a um padrão de entrada. Em analogia com o leilão original, esta

abordagem é similar a uma situação onde todos os compradores ou vendedores decidem

encontrar uma maneira no qual cada comprador tenha o melhor preço em relação ao início

da Seção do leilão.

Da mesma forma que mostrado no método anterior, este método também utiliza a

medida de conﬁabilidade como base do seu funcionamento. Mas, diferentemente do que

foi mostrado na Seção anterior, todos os agentes podem fazer parte da mesma iteração ao

mesmo tempo. Uma vez que uma iteração do leilão é iniciada, um custo para cada agente

é calculado. Este custo é baseado na soma das diferenças entre a conﬁabilidade da classe

vencedora e a conﬁabilidade correspondente à classe vencedora dos demais agentes. Esta

soma é dividida por uma constante que varia de acordo com o problema atacado.

Neste método, o agente com o maior custo é considerado o perdedor e a iteração

termina. As conﬁabilidades das classes vencedoras de todos os agentes são mudadas para

as diferenças entre a conﬁabilidade da classe vencedora atual e o seu custo. Quando

um agente perde duas vezes seguidas, ele é descartado da negociação. O agente que

permanecer até o ﬁnal é considerado o vencedor e a classe vencedora deste agente é vista

como a classe vencedora do sistema. A tabela de custos possui dois valores possíveis para

cada célula que podem ser vistos nas Fórmulas 3.3 e 3.4.

parcela = conf[V enc] − conf[V encOpo] (3.3)

custo =

parcela1 + parcela2 + ... + parcelaN

constante

(3.4)

Na Fórmula 3.3, o valorde conf[V enc] é o valor da conﬁabilidade da classe vencedora

do agente que está negociando, já conf[V encOpo] é o valor da conﬁabilidade do agente

que está negociando para a classe que o agente oponente acha que é a vencedora. Nesta

equação é calculada cada parcela que vai ser utilizada no cálculo do custo que é mostrado

na Fórmula 3.4. Nesta Fórmula a quantidade de parcelas vai ser igual a quantidade de

3. O Sistema NeurAge e Suas Características 35

agentes menos um, ou seja, o valor de N será a quantidade de agentes menos um. Um

plano de ação que representa o Leilão aplicado ao NeurAge é mostrado a seguir.

1. Apresente o padrão para cada um dos agentes e estes escolhem suas classes vence-

doras;

2. Se ainda existir mais de dois agentes continue, senão vá para o Passo 8;

3. Para cada um deles calcule os valores das parcelas correspondentes aos seus opo-

nentes, utilizando a Fórmula 3.3;

4. Calcule o valor do custo de cada agente, utilizando a Fórmula 3.4;

5. O agente que teve o maior custo é marcado;

6. Se este agente marcado já tinha sido marcado na iteração anterior, então ele está

fora da negociação.

7. Vá para o Passo 2;

8. Se ainda existir padrões, vá para o Passo 1, senão vá para o Passo 9;

9. Termina a negociação.

3.3.2.1 Exemplo do Método de Negociação Baseado no Leilão

Usando o mesmo exemplo da Seção 3.3.1, mostrado na Tabela 3.3, um terceiro agente

pode ser acrescentado no sistema. Baseado na Tabela 3.3 e tendo como conﬁabilidade

para o terceiro agente (C = 0,85; B = 0,4; A = 0,37). Esta etapa corresponde ao Passo 1

do plano de ação. Como ainda existem três agentes para negociar, o Passo 2 é satisfeito e

é executado o Passo 3 da maneira mostrada a seguir e aplicando sempre a Fórmula 3.3.

Parcelas para o Agente 1:

• Em relação ao agente 2, tem-se que parcel a

= 0, 90 − 0, 30 = 0, 60;

• Em relação ao agente 3, tem-se que parcel a

= 0, 90 − 0, 25 = 0, 65;

Parcelas para o Agente 2:

• Em relação ao agente 1, tem-se que parcel a

= 0, 87 − 0, 56 = 0, 31;

• Em relação ao agente 3, tem-se que parcel a

= 0, 87 − 0, 34 = 0, 53;

3. O Sistema NeurAge e Suas Características 36

Parcelas para o Agente 3:

• Em relação ao agente 1, tem-se que parcel a

= 0, 85 − 0, 37 = 0, 48;

• Em relação ao agente 2, tem-se que parcel a

= 0, 85 − 0, 40 = 0, 45;

A costanta serve para ponderar o valor do custo que cada agente vai possuir no mo-

mento de cada lance. Após o cálculo de cada parcela, é executado o Passo 4, com a

aplicação da Fórmula 3.4. Considerando que o valor da constante é de 10 (dez). O cál-

culo do custo para cada agente pode ser visto a seguir.

Custo pata o Agente 1:

custo

Ag1

par cela

+parcela

= 0, 125

Custo pata o Agente 2:

custo

Ag2

par cela

+parcela

= 0, 084

Custo pata o Agente 3:

custo

Ag3

par cela

+parcela

= 0, 093

Para resumir, a matriz completa com o cálculo dos custos e das parcelas de cada custo

é mostrada na Tabela 3.5.

- Ag1 Ag2 Ag3

Ag1 0,125 0,6 0,65

Ag2 0,31 0,084 0,53

Ag3 0,48 0,45 0,093

Tabela 3.5: Matriz de Custo do Leilão.

Como já foi explicado anteriormente, o valor do custo para o Ag1, por exemplo, foi

calculado pela soma das células C

(0,6) e C

(0,65) divido por 10 (constante) (

1,25

= 0,125). As células C

e C

são calculadas pela diferença entre a classe escolhida

pelo Ag1 e a classe escolhida correspondente aos demais agentes, como foi mostrado

anteriormente. Nesse exemplo, Ag1 é considerado como o perdedor para esta iteração,

pois o seu custo foi o maior. A partir do valor de custo que foi calculado, subtrai-se esse

valor a conﬁabilidade atual de cada agente para se obter as suas nova conﬁabilidades. As

3. O Sistema NeurAge e Suas Características 37

novas conﬁabilidades de cada agente serão Ag1 = 0,775; Ag2 = 0,786 e Ag3 = 0,757. A

partir deste ponto, considerando o Passo 6, como é apenas a primeira iteração, pelo plano

de ação a negociação continua.

A arquitetura interna dos agentes que utilizam o método de negociação é similar ao

anterior, onde a base de conhecimento compartilhada contém todas as informações sobre

os valores de custo de todos os agentes para a iteração atual e a anterior. Por outro lado,

o domínio da base de conhecimento privada possui informações sobre as conﬁabilidades

dos agentes, as novas conﬁabilidades e as classes vencedoras. Além disso, o agente pode,

mais uma vez, decidir sair do processo de negociação a qualquer momento baseado em

regras internas.

3.3.3 Método de Negociação Baseado na Sensibilidade

Este método de negociação foi proposto inicialmente em (Abreu et al., 2004). Ele é

uma aplicação baseada no método Teoria dos Jogos, mas utiliza mais informações que

a aplicação tradicional da Teoria dos Jogos que foi apresentada na Seção 3.3.1. Neste

método é introduzido o conceito de sensibilidade de um agente.

A sensibilidade de um agente é a capacidade deste sofrer alterações em sua classiﬁ-

cação diante de alterações nos atributos de entrada para este método. Se um agente tem

uma grande sensibilidade para um determinado atributo, signiﬁca que ele sofre grandes

variações de classiﬁcação a partir de pequenas variações nos atributos. Por outro lado, se

um agente tem uma pequena sensibilidade para um determinado atributo, signiﬁca que ele

sofre pequenas variações de classiﬁcação, mesmo que aconteçam grandes alterações nos

atributos de entrada. Esta sensibilidade é usada durante o processo de negociação entre

os agentes.

Este método é também composto por muitas iterações e o agente com a maior conﬁa-

bilidade na última iteração é escolhida para ser o mais adequado para classiﬁcar o padrão

de entrada em execução. Em cada iteração, existe um decremento na conﬁabilidade de

todos os agentes que é baseada na análise de sensibilidade. O principal detalhe desta

análise é investigar a sensibilidade de um método de classiﬁcação para um determinado

atributo e usar esta informação no processo de negociação. Além do uso da sensibilidade,

também são usadas informações como os atributos de entrada e a média dos atributos de

treinamento. Essas informações são usadas para deﬁnir a magnitude de decréscimo da

conﬁabilidade dos agentes durante a negociação.

Uma maneira possível de criar um plano de ação para este método é selecionar os

agentes, dois a dois, para calcular o risco de conﬂito em uma especíﬁca iteração. Normal-

mente, dois agentes são escolhidos para fazer parte da negociação. Sendo assim, o risco

3. O Sistema NeurAge e Suas Características 38

de conﬂito é calculado para ambos e, assim, um deles é escolhido para ceder. Quando

um agente é considerado como aquele que cede, ele não fará mais parte do processo de

negociação para esta iteração. Em outras palavras, um agente só pode ceder uma vez por

iteração. O plano de ação pode ser descrito como se segue.

1. Após a fase de treinamento do módulo de classiﬁcação do agente, calcula-se a aná-

lise de sensibilidade para todos os atributos de cada classe.

2. Calcula-se a média de treinamento para cada atributo de cada classe em relação

àquele método de classiﬁcação;

3. Para cada padrão de teste, faça:

(a) Calcule a diferença entre os atributos do padrão de entrada e a média de trei-

namento dos atributos para todas as classes;

(b) Ordene as diferenças entre os atributos em ordem descrescente, ou seja, do

menos similar para o mais similar;

(d) Após o processo de negociação, o agente do NeurAge com o maior grau de

conﬁabilidade é dito o mais adequado para classiﬁcar o padrão de teste e sua

saída é considerada a saída do sistema.

O processo de negociação, ou seja, o Passo (c) citado anteriormente, pode ser descrito

como a seguir.

1. Escolha o primeiro atributo da lista das diferenças que foi ordenada decrescente-

mente, ou seja, o atributo menos similar e faça:

(a) Escolha dois agentes para fazer parte da negociação;

(b) Calcule a possibilidade do risco de conﬂito de cada agente;

tégia de Zeuthen para uma negociação PCM (protocolo de concessão monotô-

nica) (Wooldridge, 2002). Esta escolha é baseada no risco do agente, onde o

agente a ceder deve ser aquele com o menor valor de risco;

(d) A concessão de um agente signiﬁca o decréscimo do grau da conﬁabilidade

deste agente para a classe escolhida. Este agente é considerado como um

agente que já cedeu para esta iteração;

3. O Sistema NeurAge e Suas Características 39

(e) Se todos os agente que escolheram classe vencedoras diferentes são conside-

rados como já cedidos, a iteração termina, então retira-se o atributo da lista de

diferenças e vai para o Passo 1. Caso contrário, vai para o Passo (a);

2. Este processo acontece até que o máximo número de iterações seja alcançado ou até

que só reste apenas um agente na negociação. É importante lembrar que em caso

de conﬁabilidades não negativas, o agente pode decidir mudar a classe vencedora

ou sair do processo de negociação.

Como já foi mencionado, um agente deve calcular a análise de sensibilidade para

todos os atributos de entrada. Esta análise pode ser feita excluindo e/ou variando o valor

do atributo de entrada e analisando a variação do desempenho do método de classiﬁcação.

Esta análise é feita para todos os atributos de todas as classes do problema de classiﬁcação.

A principal idéia por trás do processo mencionado anteriormente é que quanto maior

a distância entre o atributo de entrada e o atributo da média do treinamento, maior a pro-

babilidade que a análise da sensibilidade estar errada. Desta maneira, este fato é utilizado

para calcular o conﬂito do risco dos agentes e a concessão, ou seja o decréscimo do grau

de conﬁabilidade. O risco e a medida de concessão são mostrados nas Fórmulas 3.5 e 3.6.

risco

= conf

∗ (1 − D)

(3.5)

concessao

D ∗ S

R ∗ C

(3.6)

onde:

• conf

é a conﬁabilidade do agente i para sua classe vencedora;

• D é a diferença normalizada entre os atributos do padrão de teste atual e os padrões

da média de treinamento;

• S

é a sensibilidade do método de classiﬁcação para o atributo correspondente da

classe ganhadora;

• R é a posição do atributo na lista da diferença calculada entre o padrão de entrada

e o da média de treinamento;

• C é uma constante que deﬁne a intensidade da punição.

3. O Sistema NeurAge e Suas Características 40

O detalhe relacionado a medida de risco é que quanto maior a certeza sobre uma classe

vencedora, ou seja, a conf

, e quanto menor a sensibilidade para um determinado atributo,

ou seja, a S

, maior este risco é. Enquanto o agente com a menor valorde risco é escolhido,

o agente com maior valor de risco, provavelmente, não será escolhido. Além disso, a

inversão da diferença normalizada entre o valor do atributo do padrão de teste corrente e

o da média de treinamento é também levado em consideração. Se um agente não é muito

conﬁante sobre um padrão de teste, ou seja, ele possui um valor baixo de conﬁabilidade,

e este agente é sensível para o atributo atual, ou seja, possui um alto valor do S

, mas

o atributo em questão para o padrão de treinamento é distante da média de treinamento

para este atributo, ou seja, o valor de D próximo de um, este atributo do padrão de teste

será considerado como não muito conﬁável e todos os problemas com a conﬁabilidade e

sensibilidade deste agente são atenuado pela inversão da diferença normalizada.

Como já mencionado, um agente pode mudar a sua classe vencedora. Neste caso,

quando a conﬁabilidade de uma classe vencedora se torna menor que a conﬁabilidade de

alguma outra classe, o agente pode decidir, baseado em experiências passadas e em regras

internas, escolher uma classe com conﬁabilidade maior ou manter a classe vencedora.

Além disso, um agente pode decidir executar mais uma vez o processo de tomada de

decisão ou treinar novamente o seu método classiﬁcador. Isto é baseado na análise do

desempenho do agente, se ele teve um desempenho satisfatório ou não na realização da

tarefa de classiﬁcação.

O ﬁnal da execução do processo de negociação pode ser feito de duas maneiras. A

primeira é deﬁnir um número máximo de iterações, ou seja, independente de quantos

agentes ainda estejam no processo, quando o número de iterações é atingido a negociação

para. Já a segunda maneira é quando só existem agentes com conﬁabilidades de valor não

negativo. Quando o usuário não deﬁne um número de iterações, o número de atributos do

padrão de entrada é considerado. Além disso, existe sempre um ganhador na negociação.

O único problema que pode surgir na utilização deste método é que todos os agentes

podem alcançar conﬁabilidades negativas ao mesmo tempo. Neste caso, eles devem ser

discartados da negociação e a conﬁabilidade do sistema ser a da iteração anterior. Então,

o agente com a maior conﬁabilidade é deﬁnido como ganhador.

Na arquitetura interna dos agentes, todas as informações relacionadas com a análise

de sensibilidade, a conﬁabilidade e a média de treinamento de todos os agentes compõem

a base de conhecimento. Por outro lado, informações sobre métodos de negociações

anteriores, limiares, regras internas e tudo que é individual para cada agente compõem o

domínio da base de conhecimento.

3. O Sistema NeurAge e Suas Características 41

3.3.3.1 Exemplo do Método de Negociação Baseado na Sensibilidade

Como um exemplo para ilustrar a operação deste método de negociação, o mesmo exem-

plo usado na Seção 3.3.1 com o acréscimo do Ag3 que foi feito na Seção 3.3.2. A con-

ﬁabilidade dos dois primeiros agentes pode ser vista na Tabela 3.3 e a do terceiro agente

é dada por (C = 0,85; B = 0,4; A = 0,37). De acordo com o Passo 1 do plano de ação

deste método é necessário calcular a análise de sensibilidade e a média de treinamento

para todos os atributos de todas as classes. Estes valores podem ser vistos nas Tabelas 3.6

e 3.7.

- At1 At2 At3 At4 At5

Ag1 1.7% 0.9% 6.2% 5.3% 6.9%

Ag2 8.0% 3.4% 10.7% 4.6% 9.0%

Ag3 7.5% 6.4% 6.8% 3.9% 4.8%

Tabela 3.6: Análise de Sensibilidade dos Agentes.

- At1 At2 At3 At4 At5

A 0,40 0,50 0,25 0,84 0,73

B 0,20 0,70 0,35 0,88 0,61

C 0,10 0,47 0,46 0,91 0,75

Tabela 3.7: Média de Treinamento para Todos os Atributos.

Seguindo o plano de ação, executa-se o Passo (a), que é exatamente calcular a dife-

rença absoluta entre os atributos do padrão de entrada e os atributos calculados na média

do treinamento. Esses valores são normalizados e podem ser vistos na Tabela 3.8. De

acordo com o Passo (b) do plano de ação, essas diferenças devem ser ordenadas decres-

centemente, e elas podem ser vistas na Tabela 3.9.

- At1 At2 At3 At4 At5

A 0,30 0,10 0,09 0,06 0,51

B 0,50 0,30 0,01 0,02 0,39

C 0,60 0,07 0,12 0,01 0,53

Tabela 3.8: Distância absoluta entre os atributos do padrão de teste e da média de treina-

mento.

Na primeira iteração do processo de negociação, sinalizado no Passo (c) do plano de

ação, suponhe-se que os agentes Ag1 e Ag2 são escolhidos para fazer a negociação. A

classe ganhadora para o Ag1 é a classe A e o At5 é o atributo com menor similaridade

para esta classe. Além disso, a sensibilidade do Ag1 para o At5 é de 6.9% e a diferença

3. O Sistema NeurAge e Suas Características 42

A At5, At1, At2, At3, At4

B At1, At5, At2, At4, At3

C At1, At5, At3, At2, At4

Tabela 3.9: Ordem decrescente da distância entre os atributos.

para a média de treinamento é 0.51. Por outro lado, a classe ganhadora do Ag2 é B e o At1

é o atributo menos similar desta classe. A sensibilidade do Ag2 para o At1 é de 8.0% e a

sua diferença para a média de treinamento da a classe B é 0.5. Baseado nisto, a medida de

risco, dada pela Fórmula 3.5 é calculada para ambos os agentes, como mostrado a seguir.

Medida de Custo para o Agente 1:

risco

Ag1/ClasseA/At5

= 0.90 +

6.9∗(1−0.51)

= 0.90 +

3.381

= 0.90 + 0.2957 = 1.1957

Medida de Custo para o Agente 2:

risco

Ag2/ClasseB/At1

= 0.87 +

8.0∗(1−0.50)

= 0.87 +

4.0

= 0.87 + 0.25 = 1.12

Como pode ser visto no cálculo feito anteriormente, os valores dos riscos para os Ag1

e Ag2 são, respectivamente, 1.1957 e 1.12. Pelo Passo (c) da negociação, o agente com o

menor valor de risco deve ceder, neste caso é o Ag2, que cede e o seu valor de concessão

é dado pela Fórmula 3.6, é calculado usando a constante igual a vinte (20), como pode ser

visto a seguir.

concessao

Ag2

0.5∗8.0

1∗20

4.0

= 0.20

Mais uma vez, como pode ser visto no cálculo feito anteriormente, o valor da con-

cessão para o Ag2 é de 0.2, que é subtraído da conﬁabilidade do Ag2 sobre a classe B,

que agora possui o valor 0.67, pois 0.87 − 0.20 = 0.67. O agente Ag2 é considerado

como o agente que cedeu e não mais participará desta iteração da negociação. Como a

classe ganhadora do agente Ag1 é A e a classe ganhadora do Ag3 é C, eles farão parte

da negociação. A medida de risco do Ag1 é 1.1957 e a do Ag3, como o At1 com menor

similaridade, pode ser vista a seguir.

risco

Ag3/ClasseC/At1

= 0.85 +

7.5∗(1−0.60)

= 0.85 +

= 0.85 + 0.3333 = 1.1833

Mais uma vez, como pode ser visto no cálculo feito anteriormente, o risco para o Ag3

é de 1.1833, ou seja, agora o Ag3 é aquele que cede. Como só existem um agente que

não cedeu ainda, que é o Ag1, a primeira iteração é ﬁnalizada. Como todos os agentes

possuem conﬁabilidades positivas e o número total de atributos não foi alcançado, uma

segunda iteração deve começar.

Capítulo 4

Detalhamento da Investigação

Como foi mostrado no Capítulo 3, o trabalho original do Sistema NeurAge (Abreu et al.,

2004) apresentou uma nova aplicação para os Sistemas Multiagentes (SMA). No trabalho

original, os agentes são capazes de resolver problemas de reconhecimento de padrões.

Para que isto fosse possível, foram utilizadas algumas características dos Sistemas Multi-

Classiﬁcador (SMC). Porém, esse trabalho fez uma exploração superﬁcial dos diversos

parâmentros que poderiam ser analisados.

A partir disso, esta dissertação propõe extender a investigação iniciada no primeiro

trabalho. Ou seja, será feita uma expansão dos conceitos aplicados inicialmente no Sis-

tema NeurAge sendo chamado, agora, de Sistema ClassAge. Para isso, fez-se uma análise

sobre os parâmetros que poderiam ser mudados e, analogamente a isso, fez-se uma análise

comparativa de como esses sistemas se comportariam diante das variações propostas.

Na Seção 4.1 é feita uma explanação de como os primeiros experimentos, utilizando

os conceitos do NeurAge, foram planejados e executados, além de mostrar os seus re-

sultados. Na Seção 4.2 é feita uma explicação da metodologia que será utilizada neste

trabalho, bem como os parâmetros que serão explorados e seus possíveis valores.

4.1 Primeiros Resultados do Sistema NeurAge

O Sistema NeurAge foi proposto inicialmente em (Abreu et al., 2004) e (Abreu, 2005).

Nele foram feitos alguns experimentos para que fosse possível a validação do mesmo.

Nesse sistema inicial foram utilizadas algumas conﬁgurações padrões que podem ser vis-

tas a seguir.

• Agentes Neurais contendo a rede MLP (Multi-Layer Perceptron) (Xiang et al.,

2001).

4. Detalhamento da Investigação 44

• Sistema contendo quatro agentes.

• Os métodos de negociação:

– Baseado na Teoria dos Jogos (TeoJog).

– Baseado no Leilão (Lei).

– Baseado na Sensibilidade (Sensi).

• Três bases de dados:

– Proteínas (Tan et al., 2003).

– Caracteres Numéricos (Hull, 1994).

– Imagens (Blake and Merz, 1998).

• Dois métodos de Combinação:

– Voto.

– Soma.

Os resultados dos experimentos estão na Tabela 4.1. Observando as porcentagens de

acerto e os desvios padrões pode-se concluir que foram obtidos resultados satisfatórios.

Os trabalhos (Abreu et al., 2005c) e (Abreu et al., 2005b) também se basearam nesses ex-

perimentos para sua elaboração, assim como, os trabalhos (Abreu et al., 2005d) e (Abreu

and Canuto, 2004).

Base de Dados de Caracteres

- Soma Voto Sensi Lei TeoJog

Acerto 93,81% 91,61% 96,05% 95,17% 95,21%

Desvio Padrão 7,59 10,16 11,93 13,64 13,20

Base de Dados de Imagens

- Soma Voto Sensi Lei TeoJog

Acerto 89,25% 81,58% 93,33% 91,33% 93,33%

Desvio Padrão 2,56 3,03 2,64 2,61 2,64

Base de Dados de Proteínas

- Soma Voto Sensi Lei TeoJog

Acerto 83,00% 74,67% 94,00% 87,00% 94,00%

Desvio Padrão 4,83 5,33 2,72 3,33 3,88

Tabela 4.1: Resultados do Trabalho (Abreu, 2005).

O trabalho apresentado aqui extende a investigação iniciada em (Abreu et al., 2004),

explorando tantos os pontos que foram citados anteriormente no início da Seção, como

4. Detalhamento da Investigação 45

outros pontos relevantes para o reﬁnamento da análise do novo sistema. Como o trabalho

realizado, conseguiu-se alcançar um entendimento melhor dos potenciais e das limitações

deste sistema.

4.2 Metodologia do Trabalho

O Sistema ClassAge possui muitas possibilidades de parâmetros que podem ser explo-

rados. A partir das conﬁgurações que foram mostradas na Seção 4.1 pode-se pensar em

vários tipos de variações possíveis, mas as que serão utilizadas nessa proposta de trabalho

serão as seguintes:

• Quantidade de componentes do Sistema, ou seja, de classiﬁcadores ou agentes.

• Variações nos tipos dos componentes do Sistema, ou seja, sistemas homogêneos ou

heterogêneos.

• Tipos de Bases de Dados.

Antes de começar a descrever os pontos supracitados, é importante descrever alguns

procedimentos a serem analisados, que serão mostrados nas Subseções 4.2.1, 4.2.2 e 4.2.3.

Na Subseção 4.2.4 será mostrado e explicadocomo funcionam os outros tipo de classiﬁca-

dores que serão utilizados no trabalho. Na Subseção 4.2.5 serão citadas as bases de dados

escolhidas. Na Subseção 4.2.6 será explicado como funcionam os outros tipos de classi-

ﬁcadores que serão utilizados nesse trabalho. E, por ﬁm, na Seção 4.2.8 será explicado

como será administrada a questão do tamanho do sistema.

4.2.1 Validação Cruzada

Para a avaliação da robustez de um classiﬁcador, nesse caso um Agente Classiﬁcador,

pode-se utilizar uma metodologia que executa validação cruzada. O método de amostra-

gem 10-fold-cross-validation vem sendo uma boa escolha na avaliação da performance

de classiﬁcadores (Mitchell, 1997).

Esse método divide o conjunto de dados em k partes iguais onde cada treinamento é

feito utilizando k-1 partes e aquele fold que sobrou é usado para o teste. De preferência

esses folds devem possuir a mesma quantidade de padrões para cada classe. No caso desta

dissertação, usar-se o valor de k igual a dez (10), ou seja, a cada execução do treinamento

e teste, serão utilizados nove partes para treinamento e uma parte para teste.

4. Detalhamento da Investigação 46

4.2.2 Análise Estatística

Um estudo acerca dos métodos de análise estatística foi realizado abordando principal-

mente três métodos: o teste de McNemar (Mitchell, 1997), o teste para a diferença de

duas proporções (Mitchell, 1997) e o t-teste de variância combinada (Levine and Beren-

son, 2000). Neste estudo, o t-teste de variância combinada foi escolhido para ser utilizado

na análise estatística dos resultados obtidos pelos experimentos. Para todas as bases de

dados utilizadas nesta investigação, o t-teste foi aplicado usando o método de validação

cruzada com dez grupos, como foi citado na Seção 4.2.1, e grau de conﬁança de acerto de

95%, para deﬁnir se as diferenças obtidas são signiﬁcantemente importantes do ponto de

vista estatístico.

O t-teste é um método para comparar dois métodos de aprendizagem e é amplamente

utilizado com algoritmos de aprendizagem de máquina (Mitchell, 1997). Este método é

utilizado para comparar duas amostras (conjuntos de resultados), e, para melhor entendê-

lo, é necessário explicar alguns conceitos estatísticos em que o teste se baseia. Entre

eles, o teste utiliza o conceito de inferência estatística para obter estimativas sobre as

características de uma população (uma amostra) (Levine and Berenson, 2000).

Considerando uma amostra X com n valores selecionados de uma população de va-

lores, deﬁne-se a média aritmética da amostra, como mostrado na Fórmula 4.1.

X =



i=1

(4.1)

Desta forma,

X é uma estimativa da média aritmética populacional que normalmente

é desconhecida e denominada de µ

. Também deﬁne-se a variância da amostra como

mostrado na Fórmula 4.2.

n ∗



i=1

− (



i=1

)

n ∗ (n − 1)

(4.2)

Sendo assim, S

é uma estimativa da variância populacional σ

. Nesse contexto,

denomina-se de nível de signiﬁcância de erro da estimativa, ou α, a probabilidade de erro

que a estimativa amostral esteja incorreta. Por exemplo, α=5% ou 0,05 signiﬁca que,

se todas as amostras possíveis de um mesmo tamanho n fossem retiradas da população,

5% delas não iriam conter a verdadeira média aritmética da população no intervalo de

conﬁança de (1 − α). O nível de conﬁança de acerto da estimativa é, então, deﬁnido como

o complemento do nível de signiﬁcância de erro da estimativa, ou seja, (1 − α) (Levine

and Berenson, 2000).

4. Detalhamento da Investigação 47

Todos esses conceitos descritos anteriormente servem para inferir a média aritmética

populacional µ, a partir de uma determinada amostra de valores com certo intervalo de

conﬁança (1 − α). Com o objetivo de comparar duas amostras independentes, esses con-

ceitos básicos podem ser entendidos. Neste trabalho, todas as amostras possuem o mesmo

tamanho n. Desse modo, a Fórmula 4.3 pode ser utilizada para calcular a diferença de

seus intervalos de conﬁança.

−t

(1−α)/2,2n−1

≤

(

X − Y ) − (x − y)



−S

≤ t

(1−α)/2,2n−1

(4.3)

Ao se comparar os dois intervalos de conﬁança, caso o módulo da diferença entre

as duas amostras seja maior que t

(1−α)/2,2n−1

, conclui-se que eles são signiﬁcantemente

diferentes em nível de signiﬁcância, ou seja α escolhido. Todavia, caso o módulo da

diferença entre as duas amostras seja menor ou igual a t

(1−α)/2,2n−1

, não é possívelaﬁrmar

relação de equivalência das amostras, mas, apenas, que não há diferenças signiﬁcativas,

detectadas em nível de signiﬁcância, ou seja, α escolhido.

Esse teste que utiliza a distribuição t de Student, para comparar duas amostras in-

dependentes, é conhecido como teste t de variância combinada. Esse teste estatístico é

robusto, pois não é sensível a distanciamentos moderados do pressuposto da normalidade

das amostras (Levine and Berenson, 2000). Inicialmente, assume-se uma hipótese nula,

denominada de H

. Sempre que se determina a hipótese nula, deve-se especiﬁcar a hipó-

tese alternativa, oposta à nula, denominada de H

, que será verdadeira, caso H

seja falsa

(Levine and Berenson, 2000).

O valor p é o melhor modo de analisar os resultados de um teste de hipótese. Um

valor de p é o menor nível de signiﬁcância à qual H

é rejeitado quando um procedimento

de teste especíﬁco é aplicado em um determinado grupo de dados. A simples declaração

de que a hipótese H

está ou não na área de rejeição não informa o grau em que o valor

computado no teste estatístico está na área de rejeição ou de não-rejeição. Uma vez que o

valor p tenha sido calculado, pode-se tomar a decisão se as diferenças nos resultados dos

dois grupos de teste são signiﬁcantes ou não do ponto de vista estatístico. Neste caso, se o

valor de p for menor que 0,05, os resultados são ditos signiﬁcantemente diferentes. Caso

contrário, as diferenças não são estatisticamente signiﬁcantes.

4.2.3 Medidas de Diversidade

Os sistemas que combinam classiﬁcadores para um melhor desempenho na resolução de

problemas de reconhecimento de padrões vem ganhando crescente atenção na literatura.

4. Detalhamento da Investigação 48

As saídas dos classiﬁcadores são combinadas com a intenção de encontrar uma decisão

mais correta que as encontrada a partir de classiﬁcadores individuais. Estes classiﬁcadores

combinados são diferentes entre si, senão esta decisão não seria melhor que as decisões

dos classiﬁcadores individuais. Esta diferença entre eles, que é também conhecida como

diversidade, deve alcançar uma melhor ou pior decisão, sendo assim, conclui-se que tanto

existem boas diversidades, quanto más diversidades (Kuncheva and Whitaker, 2001).

Não existe uma escolha única de medida de diversidade ou dependência. Existem

diferentes medidas de avaliação da diversidade em diferentes campos de pesquisa (Kun-

cheva, 2004). Existem medidas que trabalham com paridade (pairwise), ou seja, dois a

dois, e medidas que não trabalham com paridade (no-pairwise), ou seja, a análise é feita

individualmente. As do primeiro grupo são calculadas para cada par de classiﬁcadores e

as do segundo grupo utilizam a idéia de entropia e correlação de saídas individuais ou são

baseadas na diﬁculdade de distribuição dos pontos dos dados trabalhados.

Dentre as medidas que utilizam paridade, pode-se citar quatro principais: o Q esta-

tístico, o coeﬁciente de correlação, a medida de desacordo e a medida do duplo-falso.

Já dentre as medidas que não utilizam paridade, pode-se citar seis principais: a medida

de entropia E, a medida de diﬁculdade θ, a variância de Kohavi-Wolpert, a medida de

acordo κ, a diversidade generalizada e a diversidade coincidente da falha (Kuncheva and

Whitaker, 2001).

Dentre as medidas citadas anteriormente, foram utilizadas neste trabalho duas medi-

das que utilizam paridade e uma que não utiliza paridade. Elas serão explicadas a seguir

nas Seções 4.2.3.1 e 4.2.3.2.

4.2.3.1 Medidas que utilizam paridade

Como já foi mencionado anteriormente, existem várias medidas de similaridade que tra-

balham com o conceito de paridade. Dentre as principais, foram escolhidas para serem

aplicadas neste trabalho o Q estatístico e a medida do duplo-falso.

O Q Estatístico: O Q estatístico de Yule (Kuncheva, 2004) para dois classiﬁcadores,

e D

é dados pela Fórmula 4.4.

i,j

− N

+ N

(4.4)

onde N

é o número de padrões onde ambos os classiﬁcadores erram; N

é o número

de padrões onde ambos os classiﬁcadores acertam; N

é o número de padrões onde o

4. Detalhamento da Investigação 49

primeiro classiﬁcador erra e o segunda acerta; N

é o número de padrões onde o primeiro

classiﬁcador acerta e o segunda erra;

Para classiﬁcadores estatísticamente independentes, espera-se que o valor de Q seja 0.

Caso contrário o valor de Q pode variar de -1 a 1. Essa variação se comporta da maneira

mostrada a seguir.

• Quando os classiﬁcadores tendem a acertar ou errar os mesmos padrões, eles ten-

dem a possuir valores de Q positivos.

• Quando os classiﬁcadores tendem a acertar ou errar padrões diferentes, eles tendem

a possuir valores de Q negativos.

Sendo assim, pode-se aﬁrmar que os classiﬁcadores são considerados mais diversos

quando possuem valores de Q negativos. Por outro lado, pode-se aﬁrmar que os classiﬁ-

cadores são menos diversos quando possuem valores de Q positivos.

A medida de duplo-falso (Giacinto and Roli, 2001): Essa medida utiliza a proporção

de casos que em que existem erros de classiﬁcação para ambos os classiﬁcadores a deﬁne

conjuntos. A Fórmula 4.5 mostra como isso é feito.

df =

+ N

(4.5)

É importante observar que isso é uma medida de não similaridade, ou seja, quanto

maior o valor df, menor a similaridade entre os classiﬁcadores e quanto menor esse valor,

maior é essa similaridade.

4.2.3.2 Medidas que não utilizam paridade

Como já foi mencionado anteriormente, existem várias medidas de similaridade que não

trabalham com o conceito de paridade. Dentre as principais, foi escolhida para ser apli-

cada neste trabalho a Medida de Entropia.

Medide de Entropia (Kuncheva, 2004): Essa é uma medida baseada na suposição

que a maior diversidade entre classiﬁcadores é mostrada a por

dos votos em y, onde L

é a quantidade de classiﬁcadores. Se todos eles são 0’s ou 1’s, não existe similaridade e

eles são diversos. Uma possível maneira de retratar isso é mostrada na Fórmula 4.6.

e =



m=1

L −

min{l (z

), L − l (Z

)} (4.6)

4. Detalhamento da Investigação 50

l (z

) é o número de classiﬁcadores que reconhecem corretamente z

. O e varia entre 0 e

1, onde 0 indica nenhuma diferença e 1 indica a mais alta diversidade possível.

4.2.4 Métodos de Classiﬁcação

A pesquisa inicial do NeurAge envolvia apenas agentes com módulo de reconhecimento

de padrões contendo Redes MLP (Abreu et al., 2004). De forma a englobar uma maior

quantidade de problemas foram sugeridos outros tipos de classiﬁcadores, não excluindo a

MLP, os quais são apresentados a seguir.

4.2.4.1 Redes Neurais

Neste trabalho foram utilizados três tipos de redes neurais: Redes do Tipo MLP (Multi-

Layer Perceptron) (Xiang et al., 2001), FuzzyMLP (Fuzzy Multi-Layer Perceptron) (Ca-

nuto, 2001) e RBF (Radial Basis Function) (Park et al., 2002). A seguir elas são descritas

suncintamente.

As Redes Neurais MLP são redes de múltiplas camadas onde cada camada tem uma

função especíﬁca. A camada de saída recebe os estímulos da camada intermediária e

constrói o padrão que será a resposta. As camadas intermediárias funcionam como ex-

tratoras de características, seus pesos são uma codiﬁcação de características apresentadas

nos padrões de entrada e permitem que a rede crie sua própria representação, mais rica e

complexa, do problema.

Durante o treinamento com o algoritmobackpropagation,a rede opera em uma sequên-

cia de dois passos. Primeiro, um padrão é apresentado à camada de entrada da rede. A

atividade resultante ﬂui através da rede, camada por camada, até que a resposta seja pro-

duzida pela camada de saída. No segundo passo, a saída obtida é comparada à saída

desejada para esse padrão particular. Se esta não estiver correta, o erro é calculado. O

erro é propagado a partir da camada de saída até a camada de entrada, e os pesos das

conexões das unidades das camadas internas vão sendo modiﬁcados conforme o erro é

retropropagado.

Existem várias extensões do algoritmo backpropagation, tais como RProp, Quick-

Prop, FuzzyMLP, dentre outras. A extensão FuzzyMLP (Fuzzy Multi-Layer Perceptron)

(Canuto, 2001) é uma implementação da teoria dos conjuntos fuzzy em uma rede neural

perceptron de múltiplas camadas. Ou seja, é o resultado da fuzziﬁcação direta no nível

de rede, no nível de aprendizado ou em ambos na rede MLP. Além disso, a saída dese-

jada é calculada de forma diferente que nas Redes MLP, no qual utilizam o método do

4. Detalhamento da Investigação 51

winner-takes-all. Sendo assim, os nodos correspondentes a saída desejada são modiﬁca-

dos durante a fase de treinamento dando origem a saída desejada fuzzy.

Uma rede neural RBF (Radial Basis Function) (Park et al., 2002), ou seja, com fun-

ção de ativação de base radial pode ser vista como uma rede feedforward de múltiplas

camadas, contendo três camadas com papéis completamente distintos. A camada de en-

trada é composta por unidades sensoriais que conectam a rede a seu ambiente. A segunda

camada (única camada intermediária) aplica uma transformação não-linear do espaço de

entrada para o espaço intemediário. As unidades intermediárias não-lineares têm ativação

local e suas respostas correspondem às ativações das funções de base radial.

4.2.4.2 Máquinas de Vetores Suporte

As SVM (Suport Vector Machines) (Meir, 2002), ou Máquinas de Vetores Suportes foram

primeiramente aplicadas em Classiﬁcação de Textos no ﬁnal dos anos 90. De acordo com

a teoria deste método, enquanto técnicas tradicionais para reconhecimento de padrões

são baseadas na minimização do risco empírico, ou seja, tenta-se otimizar o desempenho

sobre o conjunto de treinamento, as SVM minimizam o risco estrutural, ou seja, tenta-se

minimizar a probabilidade de classiﬁcar de forma errada padrões ainda não vistos por

uma distribuição de probabilidade dos dados ﬁxa e desconhecida.

De forma direta, este método é um novo princípio de indução que é equivalente a

minimizar um limite superior do erro de generalização, dependendo da teoria de con-

vergência uniforme de probabilidade. SVM divide o espaço de termos em hiperplanos ou

superfícies, separando as amostras de treinamento positivas das negativas. Algumas vezes

estas superfícies são referidas como superfícies de decisão. Então a superfície que provê

a maior separação (a maior margem possível entre as amostras positivas e negativas) é

selecionada.

4.2.4.3 K-Vizinhos Mais Próximos

O K-nn (K-nearest neighbors) (Jiangsheng, 2002) é um dos métodos de aprendizado mais

simples. Ele é um classiﬁcador onde o aprendizado é baseado em analogia. O conjunto

de treinamento é formado por vetores de n dimensões e cada elemento deste conjunto

representa um ponto no espaço n-dimensional. Ele funciona de maneira que é calculado

os k’s vizinhos mais próximos de um determinado conjunto de dados. Isso é feito usando

métricas especíﬁcas, como por exemplo a distância euclidiana.

Para determinar a classe de um elemento que não pertença ao conjunto de treina-

mento, o classiﬁcador procura k elementos do conjunto de treinamento que estejam mais

4. Detalhamento da Investigação 52

próximos deste elemento, ou seja, que tenha, a menor distância. Estes k elementos são

chamados de k-vizinhos mais próximos. Veriﬁca-se quais são as classes desses k vizinhos

e a classe mais freqüente será à atribuída ao padrão de entrada.

O K-nn é um classiﬁcador que possui apenas um parâmetro livre, no caso o número de

K-vizinhos. Este número é controlado pelo usuário com o objetivo de obter uma melhor

classiﬁcação. Este processo de classiﬁcação pode ser computacionalmente exaustivo se

considerado um conjunto com muitos dados. Para determinadas aplicações, no entanto, o

processo é bem aceitável.

4.2.4.4 Árvores de Decisão

Uma árvore de decisão (Decision Trees) (Quinhan, 1993) utiliza a estratégia de dividir

para conquistar. Nelas, um problema complexo é decomposto em sub-problemas mais

simples e recursivamente, a mesma estratégia é aplicada a cada sub-problema. A capaci-

dade de descriminação de uma árvore vem da divisão do espaço deﬁnido pelos atributos

em sub-espaços e cada sub-espaço é associado uma classe.

Este método consiste de uma hierarquia de nós internos e externos que são conectados

por ramos. O nó interno, também conhecido como nó decisório ou nó intermediário, é a

unidade de tomada de decisão que avalia através de teste lógico qual será o próximo nó

descendente ou ﬁlho. Em contraste, um nó externo, também conhecido como folha ou

nó terminal, está associado a um rótulo ou um valor. Em geral, o procedimento de uma

árvore de decisão é dado a seguir.

1. Apresenta-se um conjunto de dados ao nó inicial (ou nó raiz que também é um nó

interno) da árvore;

2. Dependendo do resultado do teste lógico usado pelo nó, a árvore ramiﬁca-se para

um dos nós ﬁlhos;

3. Este procedimento é repetido até que um nó terminal seja alcançado.

De forma resumida, em uma árvore de decisão, a classiﬁcação de um caso se inicia

pela raiz da árvore, e esta árvore é percorrida até que se chegue a uma folha. Em cada nó

de decisão será feito um teste que irá direcionar o padrão de teste para uma sub-árvore.

Este processo irá guiar-se para uma folha. A classe do padrão se presupõe que seja a

mesma que está armazenada nesta folha. O método utilizado neste trabalho foi o J4.8.

4. Detalhamento da Investigação 53

4.2.4.5 JRip

Muitas das técnicas utilizadas pelo aprendizado moderno vêm sendo adaptadas para o

aprendizado e árvores de decisão. A maioria das árvores de decisão utiliza uma estratégia

de sobrecarregar para simpliﬁcar para tratar dados com ruído. Nesta estratégia, uma hi-

pótese é inicialmente formada gerando uma árvore complexa que super-utiliza os dados,

e assim, simpliﬁca a árvores através de técnicas de poda.

Normalmente as técnicas de poda melhoram taxas de erros de dados não vistos quando

o conjunto de dados possui ruído. Uma grande variedade de métodos vem sendo proposto

para podar árvores e uma das técnicas mais efecientes é a poda reduzindo o erro (REP

- Reduced Erro Pruning) (Cohen, 1995). O REP pode facilmente adaptar sistemas de

regras de aprendizado. Existem algumas variações deste método e uma delas é o IREP -

Incremental Reduced Erro Pruning) (Cohen, 1995).

O (IREP - Incremental Reduced ErroPruning)integraﬁrmemente a poda pela redução

do erro com um algoritmo da regra de aprendizado que trabalha com a regra dividir para

conquistar. Este algoritmo possui um conjunto de regras e testa todas as regras, uma

por vez. Depois que uma regra é encontrada, todos os exemplos que são cobertos pela

regra são deletados. Este processo é repetido até que não exista exemplos corretamente

classiﬁcados, ou até que a regra encontrada pelo IREP possua um erro inaceitável.

A abordagem que repete o crescimento e a simpliﬁcação usada no IREP pode produzir

resultados diferentes da poda para redução de erro convencional. Um caminho para me-

lhorar a abordagem incremental do IREP é adiar o processo de produção de regras deste

método. Dessa maneira, esse método se aproxima ao máximo do método de poda pelo

erro. Esta otimização é conhecida como JRip (Optimized IREP - Incremental Reduced

Erro Pruning) (Cohen, 1995).

4.2.5 Bases de Dados

As bases de dados utilizadas nos primeiros experimentos feitos na utilização dos conceitos

do Sistema NeurAge foram citadas na Seção 4.1. São elas a base de Caracteres Numéricos,

Imagens e Proteínas. Cada uma delas possui suas características próprias, porém todas são

bases contendo um número suﬁciente de padrões para treinamento e um número reduzido

de atributos em relação a quantidade de seus padrões.

Neste trabalho foi pensado em usar outras bases de dados para uma nova avaliação dos

métodos propostos. Logo, serão utilizadas as bases de Splice, Breast Cancer e Wisconsin,

além da Imagem e Proteínas. As conﬁgurações básicas de cada base podem ser vistas

4. Detalhamento da Investigação 54

Base de Dados de Imagens

Qtd Padrões Qtd Atributos Qtd Classes

2100 18 7

Base de Dados de Proteínas

Qtd Padrões Qtd Atributos Qtd Classes

530 126 5

Base de Dados de Splice

Qtd Padrões Qtd Atributos Qtd Classes

2890 60 3

Base de Dados de Breast Cancer

Qtd Padrões Qtd Atributos Qtd Classes

620 9 2

Base de Dados de Wisconsin

Qtd Padrões Qtd Atributos Qtd Classes

510 30 2

Tabela 4.2: Características das Bases de Dados deste trabalho.

na Tabela 4.2. Cada uma dessas bases possui suas próprias características. Nas Seções a

seguir estão descritas mais detalhadamente cada uma das bases.

4.2.5.1 Base Breast Cancer

A Base Breast Cancer (Mangasarian and Wolberg, 1992), que aqui será sempre referen-

ciada como Base A, trata do câncer de mama e foi desenvolvida pela Universidade de

Winsconsin. As instâncias foram extraídas de imagens digitalizadas da massa do seio e

descrevem as características do núcleo celular presente na imagem.

Os nove atributos desta base são denominados Clump Thickness, Uniformity of Cell

Size, Uniformity of Cell Shape, Marginal Adhesion, Single Epithelial Cell Size, Bare Nu-

clei, Bland Chromatin, Normal Nucleoli e Mitoses. Esse atributos são nominais e re-

presentam os possíveis deoxinucleotídeos do DNA que são adenina, citosina, guanina e

timina. Neste caso esses valores foram transformados para valores numéricos.

A base possui duas classes no qual a primeira representa ter câncer e a segunda re-

presenta não ter câncer. Nesta base existem 682 instância, onde 620 são de treinamento

e teste e 62 são de validação. No conjunto de treinamento, 210 padrões são da classe do

tipo 1, que representa ter câncer, e 410 são da classe do tipo 2, que representa não ter

câncer. O conjunto de validação possui 21 padrões do tipo 1, que representa ter câncer, e

41 do tipo 2, que representa não ter câncer. É importante destacar que esta base de dados

4. Detalhamento da Investigação 55

é uma base desbalancedada.

4.2.5.2 Base de Imagem

A Base de Imagem (Blake and Merz, 1998), que aqui será referenciada como Base B,

foi criada pelo Vision Group da Universidade de Massachusetts. Nesta base, as instâncias

(cada instância é uma região de 3x3) foram aleatoriamente extraídas de uma base de dados

de 7 imagens segmentadas para criar uma classiﬁcação para cada pixel.

Esta base de dados possui dezenove atributos reais que foram extraídos das regiões das

imagens, mas só foram utilizados 18 atributos, pois um deles era um atributo contínuo.

No total, existem 7 diferentes classes de regiões, brickface, sky, foliage, cement, window,

path e grass. Na Tabela 4.3 pode ser observada representação numérica de cada uma das

classes.

Classe Representação

brickface 0.000000

sky 0.1667

foliage 0.3333

cement 0.5

window 0.6667

path 0.8333

grass 1.000000

Tabela 4.3: Representação Numérica da Base de Dados de Imagem.

Esta base contém 2310 instâncias, onde cada uma das sete classes possui 330 ins-

tâncias. Foram utilizadas 2100 instâncias para treinamento e teste, onde cada uma das

sete classes possui 300 representantes. Já para validação, foram utilizadas 210 instâncias,

onde cada uma das sete classes possui 30 representantes.

4.2.5.3 Base de Proteínas

A Base de Proteínas (Tan et al., 2003), que aqui será referenciada como Base C, é uma

classiﬁcação hierárquica, detalhada manualmente, derivada de estruturas conhecidas de

proteínas e organizada de acordo com seus relacionamentos evolucionários e estruturais.

Ela é dividida em quatro níveis hierárquicos: classe, dobra, superfamília e família.

Aqui neste trabalho é utilizada a parte dessa base que contém a classiﬁcação das clas-

ses de proteínas. As principais classes de proteínas são all-α, all-β, α + β,

e small.

4. Detalhamento da Investigação 56

Nesta base existem 125 seqüências que caracterizam as classes de proteínas. As propri-

edades de cada seqüência contém 21 características contínuas, a menos da última que

contém 20. A partir disso, conclui-se que esta base possui 126 atributos, pois são 125

seqüências e mais um atributo de rótulo. Estes atributos são nominais e representam os

possíveis deoxinucleotídeos do DNA que são adenina, citosina, guanina e timina. Neste

caso esses valores foram transformados para valores numéricos.

Classe Quantidade de Padrões

all-α 111

all-β 177

α + β 203

small 45

Tabela 4.4: Distribuição de padrões da Base de Dados de Proteínas.

Esta base possui 584 padrões distribuídos de acordo com a Tabela 4.4. Foram utili-

zados 531 padrões para treinamento e teste e 53 padrões para validação. No conjunto de

treinamento e validação existem, respectivamente, 101 e 10 padrões do tipo all-α, 159

e 18 padrões do tipo

, 186 e 17 padrões do tipo all-β, 42 e 4 padrões do tipo α + β

e 41 e 4 padrões do tipo small. É muito importante destacar que esta base de dados é

desbalanceada.

4.2.5.4 Base de Splice

A Base de Splice (Towell and Shavlik, 1992), que aqui será referenciada como Base D, é

de junções de splice de seqüências de DNA, com teoria imperfeita associada do domínio.

Junção de Splice são trechos na sequência de DNA que são removidos dele durante o

processo de criação de proteínas nos mais altos organismos. Assim como a base A, esta

base foi desenvolvida pela Universidade de Wisconsin.

Esta base possui 60 atributos que descrevem as sequências de DNA usadas no pro-

cesso de criação da proteína. Esses atributos, como na Base de Proteínas, são nominais e

representam os possíveis deoxinucleotídeos do DNA. Neste caso também, esses valores

foram transformados para valores numéricos.

As possíveis classes desta base são de três tipos que representam o tipo de junção de

seqüência de DNA. Podem ser intron, representada pela classe 2, exon, representada pela

classe 3 ou nenhuma das duas, representada pela classe 1. Ao total esta base de dados

possui 3179 instâncias. A distribuição para os arquivos de treinamento e validação são,

4. Detalhamento da Investigação 57

respectivamente, de 1500 e 150 para a classe 1, de 700 e 70 para classe 2 e de 690 e 69

para a classe 2.

4.2.5.5 Base de Wisconsin

A Base de Wisconsin (Street et al., 1995), que aqui será referenciada como Base E, foi

obtida de hospitais da Universidade de Wisconsin, esta base contém dados sobre câncer

de mama assim como na Base de Breast-Cancer. Suas instâncias estão separadas em duas

classes, benigno e maligno de acordo com o tipo do câncer. Esta base possui 30 atributos

que representam amostras de informação sobre câncer.

Ela possui 561 instâncias e a representação numérica para as classes é maligno 1 e

benigno 0. A distribuição delas para os arquivos de treinamento e validação são, respec-

tivamente, 330 e 33 para a classe 0 e 190 e 19 para a classe 1.

4.2.6 Métodos de Combinação

Como foi dito anteriormente, para analisar se as modiﬁcações propostas no Sistema Clas-

sAge possuem maior eﬁcácia que os correspondentes SMCs foram feitas comparações

do ClassAge com alguns métodos de combinação que também podem ser chamados de

métodos baseados em fusão.

Dentre os método de combinação, que visam aproveitar as várias vantagens que os

métodos individuais possuem (Mitchell, 1997), foram escolhidos alguns métodos para a

análise. Existem vários métodos baseados em fusão na literatura. Eles pertencem a esse

grupo pois, fazem a classiﬁcação através da fusão de várias informações. Vários grupos

podem ser citados, dentre os a seguir.

• Métodos de Combinação Linear: São os métodos mais simples de combinar mú-

tiplos classiﬁcadores, eles executam combinação linear das saídas dos classiﬁca-

dores. Os métodos deste tipo que foram utilizados neste trabalho são Soma (Sum)

(Kittler and Alkoot, 2003), Média (Average) (Kuncheva, 2002b) e Mediana (Me-

dian) (Kuncheva, 2002b).

• Métodos Não Lineares: São métodos que realizam combinação não linear das saí-

das dos classiﬁcadores. Em geral, são mais complexos que os métodos de com-

binação linear. Nesta classe de métodos, incluem-se combinadores baseados em

ordenação. Dentre eles o utilizado aqui é o Voto (Majority Vote) (Stefano et al.,

2002).

4. Detalhamento da Investigação 58

• Métodos baseados em Estatística: São métodos que utilizam probabilidade ou com-

binações estatísticas para combinar as saídas dos classiﬁcadores. O método deste

tipo que foi utilizado neste trabalho foi o Naive Bayes (Davis et al., 2004).

• Métodos baseados em Inteligência Computacional: Aqui os métodos fazem a com-

binação das saídas dos classiﬁcadores a partir de técnicas de inteligência computaci-

onal. Os utilizados neste trabalho são o FuzzyMLP (Fuzzy Multi-Layer Perceptron)

(Canuto, 2001) e o MLP (Multi-Layer Perceptron) (Xiang et al., 2001).

Como citado anteriormente, serão ultizados neste trabalho a Soma, a Média, a Me-

diana, o Voto, o Naive Bayes, o FuzzyMLP e o MLP. Como os dois últimos já foram

descritos na Seção 4.2.4.1, pois também são utilizados como classiﬁcadores em alguns

dos experimentos, não serão explicados novamente. A seguir serão descritos os demais

métodos que serão usados.

O Naive Bayes (Davis et al., 2004) implementa o classiﬁcador Bayes, no qual para

cada classe de decisão é calculada a probabilidade condicional de que essa classe de deci-

são é correta. Nesse método de classiﬁcação assume-se que os atributos dos exemplos são

independentes dada a classe. As probabilidades envolvidas são calculadas como freqüên-

cia obtida da tabela de decisão.

Um classiﬁcador Naive Bayes (Davis et al., 2004) é um classiﬁcador probabilístico

simples baseado na aplicação do teorema de Bayes com suposições de forte indepen-

dência. Dependendo da natureza precisa do modelo probabilístico, estes classiﬁcadores

podem ser treinados com bastante eﬁciência em um aprendizado supervisionado. Em al-

gumas aplicações práticas, o parâmentro estimação para os modelos do Naive Bayes uti-

liza o método da máxima probabilidade; em outras palavras, o classiﬁcador pode trabalhar

sem acreditar na probabilidade bayesiana ou utilizando qualquer método bayesiano. De

acordo com o modelo do naive e a sua aparente simpliﬁcação de suposições, este classiﬁ-

cador, muitas vezes, trabalha melhor com situações complexas do mundo real do que se é

esperado dele.

O método Soma, funciona de maneira que, quando apresentado um padrão de teste

para os classiﬁcadores, todas as saídas correspondentes de cada classiﬁcador são somadas

e a classe vencedora é aquela que possuir o maior valor absoluto. Já o Voto, funciona

de maneira que, quando apresentado um padrão de teste para os classiﬁcadores, cada um

deles vota na classe que ele achar que é a correta. A classe vencedora é aquela que possuir

o maior número de votos. O método Média calcula a média aritmética dos valores das

saídas dos classiﬁcadores, já a mediana calcula o valor mediano entre as saídas destes

classiﬁcadores.

4. Detalhamento da Investigação 59

4.2.7 Métodos Baseados em Seleção

Como já mencionado anteriormente, diferentemente dos combinadores baseados em fu-

são, nos métodos baseados em seleção, somente um classiﬁcador é necessário para clas-

siﬁcar um padrão de entrada. Para que isto ocorra, é importante deﬁnir um processo de

escolha do membro do sistema para tomar a decisão. O fato de apenas um classiﬁcador

ser escolhido para realizar a classiﬁcação faz com que estes métodos sejam denominados

de seleções. A escolha deste classiﬁcador que fará a rotulação do padrão de entrada acon-

tece durante a fase de operação ou teste. Esta escolha é, normalmente, baseada na certeza

da decisão atual. A preferência é dada para os classiﬁcadores que possuem maior certeza

dos seus resultados (Giacinto and Roli, 1999).

Existem vários métodos baseados em seleção na literatura. Alguns deles são conside-

rados híbridos, pois só efetuam a seleção se o classiﬁcador tiver uma certeza estatística

de que o seu resultado está correto. Dentre os métodos existentes foram escolhidos os

citados a seguir, onde os dois últimos são considerados híbridos.

• DCS-LA (Dynamic Classiﬁer Selection based on Local Accuracy) (Giacinto and

Roli, 1999).

• DCS-DT (Dynamic Classiﬁer Selection using Decision-Theoretic) (Kuncheva, 2002a).

• DCS-MCB (Dynamic Classiﬁer Selection based on Multiple Classiﬁer Behaviour)

(Giacinto and Roli, 2000).

A seguir, nas seções 4.2.7.1, 4.2.7.2 e 4.2.7.3, uma descrição de cada um desses mé-

todos é feita.

4.2.7.1 DCS-LA

O Classiﬁcador de Seleção Dinâmica baseado em exatidão local, também conhecida como

LCA (local class accuracy), utiliza análise de competência para o classiﬁcador que de-

nomina um padrão de entrada com um determinado rótulo ou classe. O principal passo

para calcular a exatidão local de uma classe (LCA) para um padrão de teste x pode ser

deﬁnido como:

1. Pega-se os rótulos fornecidos por todos os classiﬁcadores (D).

2. Para cada classiﬁcador (D

, i = 1, ..., L) encontre k pontos mais próximos de x para

cada D

que provê o mesmo rótulo.

4. Detalhamento da Investigação 60

3. Calcule a proporção de pontos no qual D

provê o rótulo correto e faça com que

essa proporção seja a exatidão do classiﬁcador (LCA).

4. Escolha o classiﬁcador com o maior LCA. Nesse caso podem acontecer três coisas:

(a) Se existe somente um vencedor, ele rotuta o padrão x.

(b) Se dois classiﬁcadores empatam, escolha o terceiro.

tre os rótulos empatados.

A seleção do classiﬁcador mais apropriado é feita durante a fase de teste e acontece

em caso de haver um desacordo entre os classiﬁcadores. Os métodos baseados em seleção

são muito sensíveis a variações no tipo dos membros do ensemble e na diversidade destes.

Isso signiﬁca que a escolha do tipo de classiﬁcador que vai fazer parte do sistema é muito

importante para o bom desempenho de um DCS.

4.2.7.2 DCS-MCB

Como dito anteriormente, o Classiﬁcador de Seleção Dinâmica baseado em classiﬁcador

de comportamento múltiplo é um método híbrido, pois este método pode optar utilizar

ou não o classiﬁcador selecionado, quando este não tiver certeza estatística que está cor-

reto. Este método possui duas principais diferenças entre o anterior. Primeiramente, k é

variável e, segundo, um classiﬁcador é selecionado se e somente se o maior LCA é sub-

tancialmente maior que os valores dos LCA’s dos demais classiﬁcadores. Por outro lado,

o padrão de teste é classiﬁcado através da aplicação da técnica do Voto. Os principais

Passos do DCS-MCB são descritos a seguir.

1. Para cada padrão de teste, selecione os k’s vizinhos mais próximos.

2. Selecione somente os vizinhos que possuem maior similaridade que um limiar que

é deﬁnido previamente.

3. Calcule a competência de cada classiﬁcador para os vizinhos selecionados.

4. Se o melhor classiﬁcador é substancialmente maior que os outros, selecione ele.

5. Caso contrário, utilize uma técnica de votação.

A principal diferença entre este método e o DCS-LA é o fato do DCS-MCB ser um

método híbrido, pois pode optar, quando não tiver uma certeza estatística, entre escolher

o classiﬁcador com o maior LCA ou executar uma técnica de Votação.

4. Detalhamento da Investigação 61

4.2.7.3 DCS-DT

Como dito anteriormente, o Classiﬁcador de Seleção Dinâmica é um método híbrido e

pode ser usado com modelos de decisão. Como o método mostrado anteriormente, se o

classiﬁcador que foi selecionado, ou seja, o que foi escolhido como sendo o mais com-

petente para rotular um padrão de entrada, não tiver uma forte certeza, neste caso uma

certeza estatística, o método pode escolher entre usar este classiﬁcador ou técnicas de

fusão. Os principais Passos para esse método são descritos a seguir.

1. Realiza o processo de treinamento de todos os classiﬁcadores;

2. Agrupa-se os padrões de treinamento em conjuntos, usando o procedimento de

agrupamento K-médias;

3. A exatidão da classiﬁcação de todos os classiﬁcadores é estimada;

4. O classiﬁcador com o maior LCA, ou seja, com a melhor classiﬁcação é deﬁnida

para cada conjunto;

5. Para cada padrão de teste, faça:

(a) A partir do padrão de entrada, encontra-se o conjunto com o centro mais pró-

ximo deste;

(b) Se o melhor classiﬁcador do conjunto mais próximo é signiﬁcantemente me-

lhor que os outros, ele rotula o padrão de entrada;

A principal diferença entre este método e o DCS-LA é, igualmente ao DCS-MCB,

o DCS-DT é um método híbrido. Isto possibilita que um teste estatístico seja feito para

deﬁnir se o melhor classiﬁcador, no caso o que possui o maior LCA, é signiﬁcantemente

diferente dos outros. Já a principal diferença entre o DCS-DT e o DCS-MCB é que o

primeiro utiliza, como segunda opção, uma técnica de votação, já o segundo utiliza uma

técnica de combinação baseada em fusão.

4.2.8 Topologias dos Sistemas

Dentre as alterações propostas neste trabalho está a variação na topologia dos sistemas.

Variar a topologia de um sistema signiﬁca mudar a quantidade de membros deste sistema,

ou mudar o tipo destes membros, ou, ainda, realizar as duas modiﬁcações anteriores ao

mesmo tempo. Os trabalhos encontrados na literatura apontam que quando analisam-se as

4. Detalhamento da Investigação 62

reações dos sistemas, a variação da diversidade destes só é relevante quando o tamanho do

sistema é igual ou inferior a dez (Abreu et al., 2006b). Por este motivo, foram escolhidos

os sistemas com: Três Componentes, Cinco Componentes, Sete Componentes e Nove

Componentes.

Como foi dito anteriormente, a variação da topologia pode signiﬁcar variação na quan-

tidade de componentes ou no tipo dos componentes. Neste trabalho, além da variação na

quantidade de componentes, serão feitas variações nos tipos dos componentes. Neste

caso, as variações serão com três, cinco e sete tipos de componentes. Por exemplo, no

caso de experimentos com três classiﬁcadores serão feitos experimentos com três classi-

ﬁcadores de tipos diferentes ou dois de tipos iguais possuindo conﬁgurações diferentes e

um diferente destes dois.

A partir do que foi visto, pode-se concluir que serão utilizados sistemas híbridos ou

heterogêneos e não híbridos ou homogêneos. No trabalho (Abreu et al., 2004) foram utili-

zados apenas sistemas não-híbridos. Um sistema Não Híbrido é aquele que possui apenas

classiﬁcadores do mesmo tipo, por exemplo, um sistema formado apenas por SVM’s ou

por K-nn’s. Ao contrário dos sistemas não híbridos, os sistemas híbridos são aqueles onde

existem pelo menos dois métodos de classiﬁcação diferentes. Por exemplo, um sistema

com quatro componentes formados por dois classiﬁcadores SVM’s e dois classiﬁcadores

de Árvore de Decisão.

Capítulo 5

Experimentos e Análises de Resultados

O Sistema NeurAge propôs, como mencionado anteriormente, uma nova forma de tra-

balhar com agentes para reconhecimento de padrões. Inicialmente foram feitos alguns

testes que comprovaram a sua eﬁciência. Porém, ainda é possível aprofundar a investiga-

ção desse sistema, pois muitos dos parâmetros dele ainda foram pouco explorados.

O trabalho proposto aqui é exatamente investigar mais aprofundadamente os conceitos

utilizados no NeurAge, porém com uma abordagem mais abrangente criando o ClassAge

(Classiﬁer Agents System), um Sistema Multiagentes Classiﬁcador.

Com o intuito de identiﬁcar mais facilmente as topologias das estruturas utilizadas

aqui foi adotada uma nomenclatura especial. Como já foi dito anteriormente, serão traba-

lhados dois tipos principais de estruturas: as não híbridas, com apenas um tipo de com-

ponente e as híbridas com tipos diferentes de componentes. Neste trabalho, os sistemas

com apenas um tipo de componente, ou seja, um sistema não híbrido, serão chamados

de NH, sistemas com três tipos de componentes serão chamados de H3, os sistemas com

cinco tipos de componentes serão chamados de H5 e, por ﬁm, os sistemas com sete tipos

de componentes serão chamados de H7.

Como existem muitas possibilidades para cada uma das estruturas citadas anterior-

mente, este trabalho apresenta a média de todas as possibilidades para as correspondentes

estruturas. Por exemplo, quando se trabalha com sistemas com três componentes e usa-se

H3, levando em consideração que estão sendo usados sete tipos de classiﬁcadores dife-

rentes, tem-se 35 possibilidades de combinação. Dessa maneira, sistemas com três tipos

de componentes (H3) representam a média das 35 possibilidades. Essa metodologia foi

adotada para todos os tamanhos de sistemas. Desta maneira ﬁca mais fácil fazer uma

melhor análise dos resultados.

Nas tabelas 5.2, 5.7, 5.12 e 5.17 são mostrados a média de acurácia e o desvio padrão

de todos os sistemas de classiﬁcação para 3, 5, 7 e 9 componentes, respectivamente, para

5. Experimentos e Análises de Resultados 64

todas as cinco bases de dados para sistemas baseados em fusão. Já nas tabelas 5.3, 5.8,

5.13 e 5.18 são mostrados a média de acurácia e o desvio padrão de todos os sistemas

de classiﬁcação para 3, 5, 7 e 9 componentes, respectivamente, para todas as cinco bases

de dados para sistemas baseados em seleção. E nas tabelas 5.4, 5.9, 5.14 e 5.19 são

mostrados a média de acurácia e o desvio padrão de todos os sistemas de classiﬁcação

para 3, 5, 7 e 9 componentes, respectivamente, para todas as cinco bases de dados os

métodos de negociação.

Como foi citado anteriormente, neste trabalho foram analisadas as diversidades dos

sistemas. Foram utilizadas três medidas de diversidade: o Q estatístico, o dupla-falsa e a

medida de entropia. Cada uma delas está representada nas Tabelas 5.6, 5.11, 5.16 e 5.21

como sendo, q, df, e, respectivamente. Essas diferenças foram calculadas em relação as

diferentes topologias dos sistemas, ou seja, entre os sistemas não híbridos e os híbridos.

Outra informação importante que será analisada é a quantidade de vezes que os mé-

todos híbridos baseados em seleção, ou seja, o DCS-DT e o DCS-MCB, escolhem não

usar a seleção. Esta informação está exposta nas Tabelas 5.3, 5.8, 5.13 e 5.18. No caso

do DCS-DT será analisada a porcentagem de vezes que este método utilizou um método

de fusão ao invés do melhor classiﬁcador. Já no caso do DCS-MCB, será analisada a

porcentagem de vezes que este método utilizou o método de votação.

A maioria ds métodos de negociação executa algumas iterações para que se chegue a

uma decisão em comum. No caso do método do Leilão, isso não acontece, mas na Teoria

dos Jogos e no método de senbibilidade, isto ocorre. Esses valores estão representados

nas Tabelas 5.4, 5.9, 5.14 e 5.19 como iteracaoSensibi e iteracaoTJ .

Mais uma informação importante que deve ser analisada é a diferença entre os melho-

res resultados e os piores resultados dentro das diferentes topologias dos sistemas. Por

exemplo, observam-se os resultados dos sistemas não híbridos e híbridos para sistemas

com nove componentes, se o menor desempenho foi o do sistema NH e o maior desem-

penho foi do sistema H5, então essa diferença vai ser entre os valores das conﬁabilidades

deste sistemas. Essas diferenças estão representados na coluna Dif. Essa medida mostra

como o resultado do sistema é afetado pela diversidade dos componentes.

E, por ﬁm, outra informação relevante é o valor do teste estatístico que é feito para

analisar se o melhor resultado é estatisticamente melhor que o pior resultado. Essa in-

formação está representada na coluna p. Como já foi dito anteriormente, foi utilizado

uma taxa de 5% de aceitação. Isto signiﬁca que quando o valor do p é menor que 0,05,

pode-se aﬁrmar que o sistema com conﬁabilidade melhor é estatisticamente melhor que o

de menor desempenho.

5. Experimentos e Análises de Resultados 65

5.1 Métodos Individuais

Antes de começar a análise do desempenho do Sistema ClassAge, é importante observar o

desempenho dos classiﬁcadores individuais. Foram feitas nove topologias, ou conﬁgura-

ções, diferentes de cada um dos métodos de classiﬁcação utilizados. Além disso, foi utili-

zado o método de amostragem 10 fold-cross-validation. Por motivode simplicidade, nesta

dissertação, será utilizada, como parâmetro de comparação, a média destes nove experi-

mentos. A Tabela 5.1 mostra este desempenho dos classiﬁcadores individuais utilizados

nos sistemas. Os valores dos parâmetros de todas as nove conﬁgurações dos classiﬁcado-

res foram escolhidas de acordo com as melhores porcentagens de corretos e os menores

desvios padrões. O valores presentes na Tabela 5.1 são a Media ± DesvioP adrao.

Classiﬁcadores Individuais

- Base A Base B Base C Base D Base E

K-nn 75, 24 ± 3, 26 77, 67 ± 2, 33 70, 83 ± 5, 29 76, 59 ± 2, 59 73, 69 ± 5, 99

SVM 81, 74 ± 4, 21 83, 84 ± 2, 11 75, 81 ± 4, 87 82, 66 ± 3, 84 78, 26 ± 5, 21

MLP 88, 21 ± 2, 71 90, 26 ± 2, 03 79, 51 ± 3, 26 89, 22 ± 3, 99 83, 64 ± 3, 66

FMLP 89, 22 ± 2, 94 91, 34 ± 2, 36 84, 37 ± 3, 12 90, 26 ± 2, 64 86, 81 ± 3, 22

RBF 86, 23 ± 2, 99 89, 63 ± 2, 91 82, 34 ± 3, 59 85, 29 ± 2, 66 83, 67 ± 4, 52

Árvore de Decisão 80, 21 ± 3, 71 84, 26 ± 3, 26 78, 84 ± 4, 26 82, 54 ± 3, 59 85, 84 ± 4, 91

JRip 82, 33 ± 3, 52 84, 91 ± 3, 89 75, 99 ± 4, 88 83, 97 ± 3, 67 86, 22 ± 4, 24

Tabela 5.1: Porcentagem dos Acertos e Desvio Padrão dos Métodos Individuais.

Como pode ser observados na Tabela 5.1 as médias de acertos para o classiﬁcador

FuzzyMLP sempre são maiores que os demais métodos. Isto pode ser explicado pelo fato

deste método utilizar conceitos fuzzy associados a redes neurais, pois desta maneira este

método tem uma melhor capacidade de captar o conhecimento intrínseco das aplicações

resultando, assim, em um melhor desempenho. Por outro lado, o classiﬁcador K-nn se

mantém com as menores médias de acertos. Isto pode ser explicado, ao contrário do

FuzzyMLP, pelo fato do K-nn ser o classiﬁcador mais simples utilizado. De maneira

geral os classiﬁcadores SVM, Árvore e JRip possuem desempenhos semelhantes.

Observando os desvios padrões, conclui-se que as Bases C e E possuem os maiores

desvios padrões, o que mostra que essas são as bases que sofrem maiores variações de

estabilidade por classiﬁcador. Isto pode ser explicado pelo fato destas bases serem, como

já foi mencionado, desbalanceadas.

5.2 Sistemas com Três Componentes

Os resultados dos experimentos utilizando sistemas com três componentes podem ser

observados nas Tabelas 5.2, 5.3 e 5.4. Nesse tamanho de sistema, para cada classiﬁcação,

existem duas diferentes estruturas:

5. Experimentos e Análises de Resultados 66

• Um tipo de componente, ou sistema não híbrido (NH)

• Três tipos de componentes, ou sistema híbrido (H3).

Para os sistemas não híbridos, foram possíveis construir sete variações, pois só exis-

tem sete tipos diferentes de classiﬁcadores. Para os experimentos dos sistemas híbridos,

que neste tamanho de sistemas é somente o H3, foram construídos onze variações. Como

já foi mencionado anteriormente, os valores apresentados nas tabelas citadas anterior-

mente são a média dos melhores desvios padrões de todas as possibilidades. Os valores

em negrito representam o melhor desempenho entre as duas variações do sistema, NH e

H3.

Neste tamanho de sistemas, os valores de Dif são sempre calculados entre os sistemas

NH e H3. E, por conseguinte, os valores dos testes estatísticos, neste caso os valores de

p, foram calculados para veriﬁcar se essas diferenças são estatisticamente signiﬁcantes ou

não.

Nestas tabelas, sete diferentes métodos de combinação foram analisados, que são:

Voto, Naive Bayes (NB), Soma, Média, Mediana, MLP, FuzzyMLP (FMLP); três diferen-

tes métodos de seleção foram analisados, que são: DCS-LA, DCS-DT, DCS-MCB; e três

diferetes métodos de negociação foram analisados, que são: Sensibilidade (Sensibi), Lei-

lão e Teoria dos Jogos (TJ). Para deﬁnir o conjunto de treinamento para os combinadores

treináveis, aproximadamente 10% das instâncias de cada base de dados foram separada

para criar um conjunto de validação.

5.2.1 Métodosde Combinação ouFusãopara Sistemascom Três Com-

ponentes

Nesta seção serão mostrados e analisados os resultados dos métodos de combinação para

sistemas com três componentes.

Como pode ser visto nas Tabelas 5.1 e 5.2, pode-se concluir que os sistemas baseados

em fusão com três componetes tiveram um melhor desempenho em relação aos métodos

individuais. Este comportamento já era esperado, pois, como já foi dito anteriormente, os

Ensembles conseguem captar o conhecimento mais facilmente porque gera sua resposta a

partir de um conjunto de classiﬁcadores.

Na Tabela 5.2 pode ser observado os resultados dos sete métodos baseados em fusão

que foram usados neste trabalho. De maneira geral, os melhores desempenhos acontecem

quando o sistema possui três componentes diferentes, ou seja, os melhores desempenhos

5. Experimentos e Análises de Resultados 67

Sistemas Com Três Componentes

BD Métodos Baseados em Fusão

Var Voto NB Soma Média Mediana MLP FMLP

NH 72,02±7,01 78,76±4,71 77,54±6,03 77,78±4,69 73,60±3,71 91,18±3,82 91,95±3,23

H3 75,58±2,87 78,58±2,34 78,21±2,22 78,67±3,31 76,94±4,24 92,37±2,17 94,75±2,16

Dif 3,56 0,18 0,67 0,89 3,34 1,19 2,80

p 0,00000214 0,366 0,145 0,0674 0,000000102 0,00416 3,20E-11

Var Voto NB Soma Média Mediana MLP FMLP

NH 80,97±6,06 85,56±6,58 82,51±5,55 83,96±6,40 81,57±6,62 95,25±2,97 95,95±2,40

H3 82,56±6,61 85,11±7,13 83,02±5,40 84,36±7,29 82,72±7,11 94,49±2,50 96,35±2,33

Dif 1,59 0,45 0,51 0,40 1,15 0,76 0,40

p 0,0736 0,143 0,00000565 0,176 0,215 0,00845 0,177

Var Voto NB Soma Média Mediana MLP FMLP

NH 69,21±11,0 73,07±9,56 70,71±10,2 72,31±10,3 70,05±11,5 84,33±7,31 89,69±6,14

H3 71,71±4,58 76,51±3,75 76,02±3,85 76,00±3,90 74,60±4,88 90,25±2,82 93,16±3,53

Dif 2,50 3,44 5,31 3,69 4,55 5,92 3,47

p 0,00000978 0,001 0,00000122 0,00065 0,0000531 8,94E-16 3,78E-09

Var Voto NB Soma Média Mediana MLP FMLP

NH 76,15±4,68 81,14±4,46 78,65±3,48 79,39±4,40 77,07±5,36 89,92±2,12 93,02±3,01

H3 78,30±4,61 82,93±3,93 80,67±3,83 81,85±3,92 79,59±4,75 92,73±2,77 95,34±2,28

Dif 2,15 1,79 2,02 2,46 2,52 2,81 2,32

p 0,0096 0,0182 0,00183 0,0449 0,0793 0,00015 0,00013

Var Voto NB Soma Média Mediana MLP FMLP

NH 73,62±6,39 78,95±4,86 76,03±4,47 77,72±5,02 75,20±6,35 89,10±2,48 91,09±2,95

H3 77,26±5,87 80,21±5,38 78,58±4,58 79,28±5,75 77,80±6,65 91,45±2,50 93,27±3,06

Dif 3,64 1,26 2,55 1,56 2,60 2,35 2,18

p 0,00000147 0,00061 0,0000123 0,0002 0,0000255 3,23E-11 2,71E-11

Tabela 5.2: Método baseado em Fusão para Sistemas com Três Componentes.

são alcançados nos sistemas híbridos. Apenas nas bases A e B com o método de combi-

nação Naive Bayes (NB) o melhor resultado acontece com sistemas NH e ainda na base B

isso acontece com o método MLP. Isto mostra que aumentando a diversidade do sistema,

consegue-se um melhor desempenho.

Ainda na Tabela 5.2, em relação aos métodos baseados em fusão, observa-se que para

todas as cinco bases de dados, de maneira geral, os melhores desempenhos foram alcança-

dos com o método FuzzyMLP (FMLP). Apenas para as bases A e B, o método com melhor

desempenho foi o MLP. Além disso, observa-se que os métodos MLP e FMLP possuem

resultados próximos e que eles se distanciam consideravemente dos demais métodos. Isto

pode ser explicado pelo fato destas redes neurais serem métodos mais complexos que os

demais, por isso, conseguem realizar a classiﬁcação com maior eﬁciência.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a diver-

sidade dos componentes inﬂuencia o resultado do sistema. Observa-se que, para as bases

A, B e E, o método Voto possui os maiores valores de Dif. Já para as bases C e D isto

acontece com o método MLP. Por outro lado, observando o método que possui os meno-

res valores de Dif, conclui-se que para as bases A, D e E, este método é o Naive Bayes

(NB). Já na base C, o método Voto é o que possui o menor valor de Dif, em contraste com

5. Experimentos e Análises de Resultados 68

as bases A, B e E no qual ele possui o maior. Na base B acontece um empate, os métodos

Média e FuzzyMLP (FMLP) possuem o menor valor de Dif. Isto mostra que, de forma

geral, os sistemas deste tipo mais afetados pelo uso de componentes diferentes são aque-

les que são combinados por métodos mais complexos. Por outro lado, de forma geral, os

sistemas menos afetados são aqueles que são combinados por métodos mais simples.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.2. Dentre os testes

feitos entre os métodos que tiveram os maiores Dif, a única base no qual essa diferença

não é estatística é a base B, pois obteve um valor de p de 0,0736 que é maior que o limite

de 0,05. Já entre os testes feitos entre os métodos que tiveram os menores Dif, conclui-se

que nas bases C, D e E essa diferença é estatisticamente comprovada, mas nas bases A e

B isto não acontece.

5.2.2 Métodos Baseados em Seleção para Sistemas com Três Compo-

nentes

Nesta seção serão mostrados e analisados os resultados dos métodos de seleção para sis-

temas com três componentes.

Da mesma forma que aconteceu com os métodos baseados em fusão, como pode ser

visto nas Tabelas 5.1 e 5.3, pode-se concluir que os sistemas baseados em seleção com

três componetes tiveram um melhor desempenho em relação aos métodos individuais.

Este comportamento também já era esperado, pois, como já foi dito anteriormente, os

Ensembles conseguem captar o conhecimento mais facilmente porque geram sua resposta

a partir de um conjunto de classiﬁcadores.

Na Tabela 5.3 podem ser observados os resultados dos três métodos baseados em se-

leção que foram usados neste trabalho. Nela, observa-se que, para todas as bases, os

melhores desempenhos acontecem quando o sistema possui três componentes diferentes,

ou seja, quando o sistema é híbrido. Este é um comportamento esperado, pois há uma

tendência a se ter uma maior diversidade em sistemas com diferentes tipos de classiﬁca-

dores.

De maneira geral, os melhores desempenhos são alcançados com o método DCS-

MCB. Porém, na base A isto acontece com o método DCS-DT. Dentre esses métodos de

seleção não é observada uma grande variação entre as porcentagens de corretude, porém,

em todas as bases o DCS-LA possui o menor desempenho dos três. Isto pode ser justi-

ﬁcado pelo fato dos DCS-DT e DCS-MCB serem métodos híbridos, ou seja, eles podem

realizar seleção ou fusão durante a sua classiﬁcação.

5. Experimentos e Análises de Resultados 69

Sistemas Com Três Componentes

BD Métodos Baseados em Seleção

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 90,80±3,30 90,79±3,28 18,94 92,41±2,77 12,99

H3 92,21±1,74 94,75±2,31 20,82 94,45±1,67 15,24

Dif 1,41 3,96 - 2,04 -

p 0,000122 6,96E-18 - 2,41E-09 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 93,07±2,95 94,80±3,04 22,13 95,60±2,04 16,81

H3 94,79±2,53 95,63±2,73 20,95 95,72±2,13 15,77

Dif 1,72 0,83 - 0,12 -

p 0,0000352 0,00231 - 0,215 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 81,04±6,64 86,01±6,91 22,99 88,39±6,26 17,25

H3 89,43±2,46 91,90±2,86 18,10 93,55±2,83 12,79

Dif 8,39 5,89 - 5,16 -

p 3,62E-15 1,46E-12 - 8,91E-11 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 90,35±2,77 91,69±2,51 24,34 93,88±2,80 17,27

H3 92,77±2,01 94,15±2,71 23,95 95,87±2,77 15,80

Dif 2,42 2,46 - 1,99 -

p 0,00000706 0,00507 - 0,0681 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 88,43±2,53 89,83±2,75 20,99 91,82±2,15 15,24

H3 90,82±2,12 92,29±2,97 20,91 94,28±2,18 13,97

Dif 2,39 2,46 - 2,46 -

p 1,12E-11 4,05E-14 - 1,34E-14 -

Tabela 5.3: Método baseado em Seleção para Sistemas com Três Componentes.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Os valores de Dif são os

maiores, para as bases A, D e E, quando o método DCS-DT é aplicado. Já as bases B

e C isto acontece quando o método DCS-LA é aplicado. Por outro lado, os valores de

Dif são os menores, para as bases B, C e D, quando o DCS-MCB é utilizado. Já para

as bases A e E isto ocorre com o método DCS-LA. Isto mostra que, de forma geral, os

sistemas deste tipo são mais afetados pelo uso de componentes diferentes são aqueles que

são combinados por métodos mais simples. Por outro lado, de forma geral, os sistemas

menos afetados são aqueles que são combinados por métodos mais complexos.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.3. Dentre os testes

feitos entre os métodos que tiveram os maiores Dif, pode-se concluir que todos são

estatisticamente comprováveis, pois não atingiram o limiar que é de 0.05. Já dentre os

testes feitos entre os métodos que tiveram os menores Dif , as únicas bases que não se

pode aﬁrmar nada são as B e D, pois possuem valores de p menores que o limiar.

Na maioria dos casos, o método DCS-MCB possui um desempenho melhor que o

método DCS-DT. Nas colunas 4 e 6 da Tabela 5.3 são apresentados as porcentagens de

5. Experimentos e Análises de Resultados 70

fusão para os métodos híbridos DCS-DT e DCS-MCB. Do ponto de vista do método

DCS-DT observa-se que, de forma geral, a porcentagem da utilização do método de fusão

vai diminuindo quando se faz a variação dos tipos de componentes. Apenas para a base de

dados A isto não acontece. Da mesma maneira, do ponto de vista do método DCS-MCB,

observa-se o mesmo comportamento, uma diminuição do uso do Voto na medida que se

faz a variação do tipo de combinador. Mais uma vez, para a base A isto não acontece.

Isto pode ser explicado pelo fato de quanto mais tipos diferentes de classiﬁcadores são

usados, maior a chance do classiﬁcador selecionado ser melhor, estatisticamente, que os

demais.

Em geral, os métodos de seleção possuem um melhor desempenho que os métodos de

fusão. Porém, na base A acontece um empate e na base B o melhor método de fusão é

melhor que o melhor método de seleção. Outro detalhe importante, que já foi dito, é que

os melhores métodos de seleção são os híbridos, ou seja, eles trabalham com seleção ou

com fusão. Isto pode ser explicado pelo fato métodos de seleção trabalharem com mais

informação que os métodos de fusão.

5.2.3 Métodos de Negociação para Sistemas com Três Componentes

Nesta seção serão mostrados e analisados os resultados dos métodos de negociação para

sistemas com três componentes.

Os resultados dos testes feitos com os métodos de negociação podem ser vistos na

Tabela 5.4. Diante disto, observa-seque, assim como nos Ensebles, para todas as bases, de

maneira geral, os melhores desempenhos acontecem quando o sistema possui três agentes

com classiﬁcadores diferentes, ou seja, quando utiliza sistema híbrido. Isso somente não

acontece no método Leilão da base D.

Além disso, para todas as bases de dados, os melhores desempenhos são alcançados

com o método baseado em Sensibilidade (Sensibi). Isto pode ser explicado pelo fato deste

método utilizar mais informações que os demais para executar a negociação. Nos métodos

baseados em negociação não é observada uma grande variação entre as porcentagens de

corretude, porém, em todas as bases o Leilão possui o menor desempenho dentre três.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a diver-

sidade dos componentes inﬂuencia o resultado do sistema. Dentre os métodos de negocia-

ção, observa-se, ainda, que, para as bases A, C, D e E, o método Sensibi possui os maiores

valores de Dif. Porém, para a base B isto acontece com o método Teoria dos Jogos (TJ).

Observando o fato contrário, ou seja, o método que possui os menores valores de Dif,

pode-se aﬁrmar que para as bases A e E isto ocorre com o método Teoria dos Jogos (TJ)

5. Experimentos e Análises de Resultados 71

e para as demais isto ocorre com o método Leilão. Isto mostra que, de forma geral, os

sistemas deste tipo são mais afetados pelo uso de componentes diferentes são aqueles que

são combinados por métodos mais complexos. Por outro lado, de forma geral, os sistemas

menos afetados são aqueles que são combinados por métodos mais simples.

Sistemas Com Três Componentes

BD Métodos de Negociação

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 88,78±2,77 91,41±2,38 10,28 90,96±2,45 9,25

H3 90,71±2,13 95,17±1,77 10,29 92,65±2,08 10,12

Dif 1,93 3,76 - 1,69 -

p 0,00000019 1,71E-25 - 0,000000818 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 91,70±3,15 95,78±2,14 11,38 93,38±3,12 10,52

H3 91,74±3,14 96,69±2,24 12,36 94,70±3,12 10,85

Dif 0,04 0,91 - 1,32 -

p 0,00056 0,0541 - 0,35 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 87,25±5,02 90,85±5,37 16,86 88,81±5,61 12,61

H3 89,82±3,36 94,49±3,40 14,47 92,03±3,76 11,61

Dif 2,57 3,64 - 3,22 -

p 6,15E-10 1,57E-13 - 2,13E-11 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 92,05±2,87 94,99±2,64 16,10 93,85±2,31 12,24

H3 91,76±3,75 96,41±3,00 13,58 94,80±3,18 11,78

Dif 0,29 1,42 - 0,95 -

p 0,0224 0,0657 - 0,285 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 89,59±3,03 92,48±1,93 15,38 91,25±2,14 11,36

H3 92,07±2,81 95,54±2,50 16,25 93,24±2,26 11,75

Dif 2,48 3,06 - 1,99 -

p 0,00395 6,79E-17 - 0,000000682 -

Tabela 5.4: Método de Negociação para Sistemas com Três Componentes.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.4. Dentre os testes

feitos entre os métodos que tiveram os maiores Dif, essa diferença é estatísticamente

comprovada apenas para as bases A, C e E. Para as bases B e D, o valor do p estatístico

é, respectivamente, 0,35 e 0,065, o que não é menor que 0,05 e prova que não se pode

aﬁrmar nado sobre esses dois métodos. Por outro lado, quando se observa os métodos

com os menores valores de Dif, é interessante observar que, apesar das diferenças serem

relativamente pequenas, todos os métodos podem-se dizer melhor estatisticamente que

suas variações.

Em relação ao número de iterações (rounds) do método Sensibi observa-se que, de

forma geral, a porcentagem das iterações da negociação para as bases A, B e E diminuem

com o a utilização de um sistema híbrido. Por outro lado, para as bases C e D isso

ocorre de forma contrária. Já analisando o método Teoria dos Jogos (TJ), observa-se um

comportamente semelhante, uma diminuição na percentagem das iterações da negociação

5. Experimentos e Análises de Resultados 72

para as bases C e D e um aumento para as bases A, B e E. Logo, conclui-se que de

forma geral, o número de rounds aumenta quando trabalha-se com estruturas híbridas.

Isto pode ser explicado pelo fato de que quando se trabalha com componentes diferentes

estes demoram mais a chegar a uma opinião comum.

5.2.4 Negociação versus Combinação para Sistemas com Três Com-

ponentes

Fazendo uma comparação entre os métodos de negociação e os de combinação, observa-

se que, para todas as bases de dados, o método de negociação baseado em Sensibilidade

(Sensibi) obteve o melhor desempenho. Para saber se um método é estatisticamente me-

lhor que o outro, realiza-se um teste de hipótese entre estes dois métodos. Os resultados

dos testes estatísticos entre o melhor método de negociação dos sistemas NH e H3 e os

melhores métodos baseados em fusão e seleção podem ser observados na Tabela 5.5.

Na Tabela 5.5, quando aparece ’Sim’ signiﬁca que o melhor método de negociação é

estatisticamente melhor que o melhor método do tipo que está sendo comparado e ’Não’

signiﬁca que não se pode aﬁrmar nada sobre os sistemas comparados. Para sistemas com

três componentes e considerando que existe apenas um tipo de sistema híbrido, foram

feitos vinte testes estatísticos. Como resultado, tem-se que em 8 das 20 comparações o

método de negociação é estatisticamente melhor. Isso signiica que em 40% das compara-

ções conseguiu-se uma superioridade estatística.

NH H3

Base Fusão Seleção Fusão Seleção

A Não - 0,12697517 Sim - 0,01154840 Sim - 0,01627784 Não - 0,21365802

B Não - 0,33515785 Não - 0,30154605 Não - 0,29236770 Não - 0,37034379

C Não - 0,11784616 Sim - 0,00691982 Não - 0,38612846 Não - 0,26218269

D Não - 0,00003050 Sim - 0,00834341 Sim - 0,00050816 Não - 0,46856358

E Sim - 0,00063044 Não - 0,02955606 Sim - 8,27E-14 Sim - 4,38E-10

Tabela 5.5: Valores de p para os testes estatísticos entre os melhores métodos de negocia-

ção e os de fusão e seleção para sistemas com Três Componentes.

Observando Tabela 5.5, conclui-se que, na base de dados A para sistemas NH, o me-

lhor método de negociação é estatisticamente melhor que o melhor método de seleção,

pois o valor do p ﬁcou abaixo do limiar que é 0.05, mas não se pode dizer nada em rela-

ção ao melhor método de negociação e o melhor de seleção. Já para sistemas H3 acontece

exatamente o contrário, ou seja, o método de negociação é melhor que o de fusão, mas

não se pode aﬁrmar nada em relação ou método de seleção.

Em relação a base B, não se pode aﬁrmar nada, pois os valores de p para os sistemas

NH e H3 são maiores que o limiar. De maneira contrária, na base de dados E, o método

5. Experimentos e Análises de Resultados 73

de negociação é melhor que todos os outros.

Na base C, observa-se que apenas quando o método de negociação é comparado com

o método de seleção para sistemas H3, pode-se dizer que a negociação é melhor. Por

outro lado, em relação a base D, apenas quando o método de negociação é comparado

com o de seleção para sistemas H3 é que não se pode aﬁrmar nada.

5.2.5 Diversidade para Sistemas com Três Componentes

Com o intuito de analisar o nível de diversidade dos sistemas, a Tabela 5.6 mostra os

valores das três diversidades que foram aplicadas a todas as estruturas dos sistemas com

três componentes. Essas medidas de diversidade foram discutidas no capítulo anterior.

Como já mencionado, o Q estatístico (q) e o dupla-falsa (df) são medidas que utilizam

paridade e a entropia (e) é uma medida que não utiliza paridade.

Na Tabela 5.6, pode-se observar que, quase sempre, variações nos tipos de compo-

nentes dos sistemas inﬂuenciam as diversidades. De acordo com o comportamento das

medidas de diversidade, observa-se que as medidas de q e e tendem a aumentar o seu

valor quando são calculadas para sistemas híbridos, neste caso o sistema H3. Por outro

lado, as medidas de df tendem a diminuir com o aumento da diversidade.

BD Medidas de Diversidade

Var q df e

NH 0,79 0,31 0,80

H3 0,84 0,28 0,82

Var q df e

NH 0,88 0,28 0,84

H3 0,86 0,27 0,83

Var q df e

NH 0,83 0,31 0,82

H3 0,82 0,29 0,88

Var q df e

NH 0,88 0,25 0,83

H3 0,88 0,22 0,85

Var q df e

NH 0,83 0,24 0,82

H3 0,87 0,25 0,85

Tabela 5.6: Medidas de Diversidade para Sistemas com Três Componentes.

De acordo com os resultados mostrados na Tabela 5.6, para as três medidas conclui-se

que sistemas híbridos são capazes de prover maiores níveis de diversidade que sistemas

não híbridos. Outra conclusão importante é que este fato também reﬂete na acurácia

dos sistemas, já que os melhores resultados para sistemas com três componentes foram

alcançados quando foram utilizados os sistemas H3.

5. Experimentos e Análises de Resultados 74

5.3 Sistemas com Cinco Componentes

Os resultados dos experimentos utilizando sistemas com cinco componentes podem ser

observados nas Tabelas 5.7, 5.8 e 5.9. Nesse tamanho de sistema, para cada classiﬁcação,

existem três diferentes estruturas:

• Um tipo de componente (NH)

• Três tipos de componentes (H3)

• Cinco tipos de componentes (H5).

Para os sistemas não híbridos, foram possíveis construir sete variações, pois só exis-

tem sete tipos diferentes de classiﬁcadores. Para os experimentos dos sistemas híbridos,

que neste tamanho de sistemas podem ser de dois tipos, H3 e H5, foram construídos dez

e quatro variações, respectivamente. Como já foi mencionado anteriormente, os valores

apresentados nas tabela citadas anteriormente são a média dos melhores desvios padrões

de todas as possibilidades. Os valores em negrito representam o melhor desempenho entre

as três variações do sistema, NH, H3 e H5.

Neste tamanho de sistemas, os valores de Dif são calculados os maiores e menores

valores dentre os três tipos de sistemas, NH, H3 e H5. E, por conseguinte, os valores

dos testes estatísticos, neste caso os valores de p, foram calculados para veriﬁcar se essas

diferenças são estatisticamente signiﬁcantes ou não.

Nestas tabelas, sete diferentes métodos de combinação foram analisados, que são:

Voto, Naive Bayes (NB), Soma, Média, Mediana, MLP, FuzzyMLP (FMLP); três diferen-

tes métodos de seleção foram analisados, que são: DCS-LA, DCS-DT, DCS-MCB; e três

diferetes métodos de negociação foram analisados, que são: Sensibilidade (Sensibi), Lei-

lão e Teoria dos Jogos (TJ). Para deﬁnir o conjunto de treinamento para os combinadores

treináveis, aproximadamente 10% das instâncias de cada base de dados foram separada

para criar um conjunto de validação.

5.3.1 Métodos de Combinação ou Fusão para Sistemas com Cinco

Componentes

Nesta seção serão mostrados e analisados os resultados dos métodos de combinação para

sistemas com cinco componentes.

5. Experimentos e Análises de Resultados 75

Na Tabela 5.7 pode ser observado os resultados dos sete métodos baseados em fusão

que foram usados neste trabalho. Como pode ser observado, de maneira geral, os melho-

res desempenhos acontecem quando o sistema possui cinco agentes com classiﬁcadores

diferentes. Apesar disso, cada base de dados apresentou um comportamente diferente

para esses métodos. Por exemplo, para a base A, apenas um dos métodos, (NB) apre-

sentou um melhor desempenho com o sistema H3. Já a base B, três dos classiﬁcadores

(Voto, NB e Média) apresentou um melhor desempenho com os sistemas NH. A base D,

apresentou dois classiﬁcadores (NB e Média) com melhor desempenho para H3. As bases

C e E apresentaram 100% de melhor desempenho para sistemas H5. Observa-se, ainda,

que para todas as cinco bases de dados os melhores desempenhos foram alcançados com

o método FuzzyMLP (FMLP). Mais uma vez, isto pode ser explicado pelo fato deste

método ser mais complexo que os demais, por isso, consegue obter melhores resultados.

Sistemas Com Cinco Componentes

BD Métodos Baseados em Fusão

Var Voto NB Soma Média Mediana MLP FMLP

NH 73,85±6,26 78,44±5,12 77,56±5,90 75,98±4,90 76,02±5,61 93,47±4,85 94,27±2,85

H3 80,75±6,11 81,58±4,66 81,12±3,78 81,63±3,88 80,72±5,45 94,42±2,41 96,43±2,01

H5 82,61±5,72 81,23±5,57 84,24±3,99 83,03±4,89 83,50±8,31 95,45±1,42 97,27±2,26

Dif 8,76 3,14 6,68 7,05 7,48 1,98 3,00

p 2,88E-11 0,0000275 2,43E-09 3,17E-11 7,40E-08 0,00678 5,03E-08

Var Voto NB Soma Média Mediana MLP FMLP

NH 85,26±3,48 89,74±4,68 86,24±4,09 88,15±4,86 85,73±5,30 95,49±3,00 96,86±2,08

H3 84,43±3,73 88,97±4,50 85,45±3,07 87,40±5,25 84,84±6,62 94,59±2,21 96,58±1,90

H5 85,00±2,65 89,35±4,61 87,86±2,05 88,01±6,58 85,82±6,57 95,83±1,64 96,92±1,92

Dif 0,83 0,77 2,41 0,75 0,98 1,24 0,34

p 0,0736 0,143 0,00000565 0,176 0,215 0,00085 0,177

Var Voto NB Soma Média Mediana MLP FMLP

NH 72,84±6,79 77,88±8,22 74,58±6,99 76,31±8,47 73,65±7,80 84,47±4,88 89,27±4,48

H3 75,95±4,18 79,39±3,97 78,47±4,02 78,93±5,06 77,34±5,47 89,19±2,56 93,61±3,90

H5 78,45±5,43 82,39±4,77 80,81±4,87 81,15±4,95 79,60±6,81 92,28±2,75 94,38±3,37

Dif 5,61 4,51 6,23 4,84 5,95 7,81 5,11

p 0,00000978 0,001 0,00000122 0,00065 0,0000531 8,94E-16 3,78E-09

Var Voto NB Soma Média Mediana MLP FMLP

NH 78,86±4,95 82,16±3,57 80,58±2,80 81,48±3,47 79,86±5,55 92,99±2,11 94,97±2,23

H3 79,56±4,62 83,42±4,02 81,49±3,40 82,57±4,49 80,62±5,71 93,45±2,35 95,33±2,19

H5 81,31±5,62 82,57±4,92 82,50±3,97 82,47±4,15 81,52±6,49 94,65±2,44 96,64±2,20

Dif 2,45 1,26 1,92 1,09 1,66 1,66 1,67

p 0,0096 0,0182 0,00183 0,0449 0,0793 0,00015 0,00013

Var Voto NB Soma Média Mediana MLP FMLP

NH 74,73±6,40 78,15±4,84 77,01±4,90 77,47±5,68 76,10±5,99 89,85±2,88 91,79±3,41

H3 77,19±4,90 80,75±4,73 77,74±5,11 79,54±5,45 77,06±6,14 90,96±2,57 93,20±3,39

H5 80,89±6,11 81,37±4,95 81,10±4,26 81,36±4,74 81,03±5,73 94,01±2,90 96,33±2,61

Dif 6,16 3,22 4,09 3,89 4,93 4,16 4,54

p 0,00000147 0,00061 0,0000123 0,0002 0,0000255 3,23E-11 2,71E-11

Tabela 5.7: Método baseado em Fusão para Sistemas com Cinco Componentes.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Em relação as maiores

diferenças, ou seja, os maiores valores de Dif, observa-se que, para as bases A, D e E, o

5. Experimentos e Análises de Resultados 76

método Voto possui os maiores valores de Dif. Na base B isto acontece com o método

Soma, e na base C com o método MLP. Observando o caso oposto, os menores valo-

res de Dif podem ser vistos, para as bases C e E no método Naive Bayes (NB). Para a

base A isto ocorre com a MLP, na base B com a FuzzyMLP (FMLP) e na base D com a

Média. Ao contrário do que aconteceu nos métodos de fusão com três componentes, de

forma geral, os sistemas de cinco componentes mais afetados pelo uso de componentes

diferentes são aqueles que são combinados por métodos mais simples. Por outro lado, de

forma geral, os sistemas menos afetados são aqueles que são combinados por métodos

mais complexos.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.7. Em todas essas

ocorrências é provado pelo teste de hipótese que os métodos são signiﬁcantemente me-

lhores que a sua variação, pois todos os valores de p para essas ocorrências são menores

que o limiar, que é de 0.05.

5.3.2 Métodos Baseados em Seleção para Sistemas com Cinco Com-

ponentes

Nesta seção serão mostrados e analisados os resultados dos métodos de seleção para sis-

temas com cinco componentes.

Na Tabela 5.8, pode-se observar o desempenho dos métodos baseados em seleção.

Assim como aconteceu com os métodos de fusão, em geral, os sistemas que apresentaram

melhor desempenho foram os H5. Apenas na base B é que um deles ﬁcou melhor para

os sistemas H3. Em geral, o método que apresenta o melhor desempenho é o DCS-MBC.

Apenas para a base B o DCS-DT apresenta um desempenho melhor. Outro detalhe desses

resultados é que as variações da porcentagem dos acertos entre os métodos DCS-LA,

DCS-DT e DCS-MCB são pequenas.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Diante da diferença entre

os resultados dos sistemas NH, H3 e H5, ou seja, os valores de Dif, observa-se que as

maiores diferenças ocorrem na utilização do método DCS-LA. Apenas na base E este fato

ocorre com o método DCS-DT. Por outro lado, todas as menores diferenças acontecem

quando o método DCS-MCB é aplicado. Da mesma forma que nos métodos de seleção

com três componentes, Isto mostra que, de forma geral, os sistemas mais afetados pelo

uso de componentes diferentes são aqueles que são combinados por métodos mais sim-

ples. Por outro lado, de forma geral, os sistemas menos afetados são aqueles que são

combinados por métodos mais complexos.

5. Experimentos e Análises de Resultados 77

Sistemas Com Cinco Componentes

BD Métodos Baseados em Seleção

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 91,2±3,58 91,83±2,99 19,98 94,13±3,34 13,81

H3 93,99±2,22 94,33±2,91 18,57 95,32±1,97 15,37

H5 95,53±3,02 95,47±2,05 19,44 96,37±2,29 17,37

Dif 4,33 3,64 - 2,24 -

p 1,64E-09 2,59E-10 - 0,00014 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 94,51±2,78 96,10±1,94 22,61 96,54±1,87 16,94

H3 95,51±2,30 97,06±2,27 22,50 96,67±2,12 15,26

H5 96,45±1,33 96,58±1,54 21,53 96,82±1,68 13,19

Dif 1,94 0,96 - 0,28 -

p 0,0000352 0,00231 - 0,215 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 80,41±7,05 85,33±5,68 22,61 87,94±5,91 17,62

H3 86,65±3,10 89,44±2,07 20,97 92,05±1,87 16,62

H5 90,80±2,32 92,88±2,77 21,70 94,89±2,60 14,87

Dif 10,39 7,55 - 6,95 -

p 3,62E-15 1,46E-12 - 8,91E-11 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 93,16±2,44 93,76±3,00 22,68 95,38±2,17 15,49

H3 94,38±1,98 94,93±3,03 23,25 95,57±2,05 15,38

H5 95,34±2,37 95,29±2,85 20,11 96,06±2,40 15,83

Dif 2,18 1,53 - 0,68 -

p 0,00000706 0,00507 - 0,0681 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 89,78±2,72 90,45±2,19 21,67 92,52±1,76 16,02

H3 90,74±2,79 93,02±2,51 21,79 95,17±2,48 16,06

H5 93,64±2,41 94,55±2,76 19,19 95,64±1,85 15,99

Dif 3,86 4,10 - 3,12 -

p 1,12E-11 4,05E-14 - 1,34E-14 -

Tabela 5.8: Método baseado em Seleção para Sistemas com Cinco Componentes.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.8. Sendo assim, todos

os métodos que tiveram os maiores valores de Dif são estatisticamente melhores que a

sua variação. Mas, de acordo com os métodos que apresentaram os menores valores de

Dif, pode-se dizer que para as bases A, C e E eles são estatisticamente melhores que suas

variações, mas para as base B e D não se pode aﬁrmar nada.

Na maioria dos casos mais uma vez, o método DCS-MCB possui um desempenho

melhor que o método DCS-DT. Ainda observando os métodos de seleção, agora somente

o método DCS-DT, conclui-se que para as bases A, B e C, as porcentagens do uso do

método de fusão diminui para sistemas H3 e aumenta para sistemas H5. Já no método

DCS-MCB para as bases B e C a porcentagem de execução do Voto diminui de acordo

com o acréscimo de novos classiﬁcadores. Por outro lado, para a base A acontece exata-

mente o oposto. Na base D acontece uma diminuição da porcentagem do uso do Voto nos

sistemas H3 seguido pelo aumente para sistemas H5. Já na base E acontece o processo

5. Experimentos e Análises de Resultados 78

oposto.

Para este tamanho de sistema, comparando-se os métodos de seleção e fusão, observa-

se que os de fusão apresentam um desempenho melhor que os de seleção. Como pode ser

visto nas Tabelas 5.7 e 5.8, nas bases de dados A, D e E o desempenho do melhor método

de fusão, que no caso foi sempre o FuzzyMLP, é melhor que o melhor método de seleção,

que no caso foi sempre o DCS-MCB. Porém, como nos sistemas com três componentes,

os métodos de seleção apresentam um melhor desempenho que os de fusão para as bases

B e C.

5.3.3 Métodos de Negociação para Sistemas com Cinco Componen-

tes

Nesta seção serão mostrados e analisados os resultados dos métodos de negociação para

sistemas com cinco componentes.

Os resultados dos testes feitos com os métodos de negociação podem ser vistos na

Tabela 5.9. Analisando esta tabela, pode-se aﬁrmar que, em geral assim como nos En-

sebles, eles apresentam melhor desempenho quando são utilizados sistemas H5. Porém,

para as bases D e E, o Leilão apresentou melhor desempenho com sistemas do tipo NH e

H3, respectivamente. E, na base B, a Teoria dos Jogos (TJ) apresenta um melhor desem-

penho com o sistema do tipo H3. O método que obteve o melhor desempenho para todas

as bases foi o métodos de negociação baseado em Sensibilidade (Sensibi). Além disso,

observa-se uma diferença considerável entre o desempenho deste método em relação aos

demais. Este é um comportamento esperado, já que este método utiliza mais informações

durante o processo de negociação.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a diver-

sidade dos componentesinﬂuencia o resultado do sistema. Avaliando, agora, as diferenças

entre os maiores e menores sistemas entre NH, H3 e H5, ou seja, os maiores e menores

valores de Dif, tem-se que as maiores diferenças nas bases A, B e D acontecem com o

método Leilão. Para as demais bases, isto acontece com o método baseado em Sensibi-

lidade (Sensibi). Por outro lado, ainda observando as diferenças, o método que possui as

menores diferenças, para as bases B e D é a Teoria dos Jogos (TJ), já para as bases C e

E, isto ocorre com o método Leilão. E, por ﬁm, a base A possui uma menor diferença

quando trabalha com o método Sensibilidade (Sensibi). Da mesma forma que em sistema

com três agentes, isto mostra que, de forma geral, os sistemas deste tipo são mais afetados

pelo uso de componentes diferentes são aqueles que são combinados por métodos mais

complexos. Por outro lado, de forma geral, os sistemas menos afetados são aqueles que

são combinados por métodos mais simples.

5. Experimentos e Análises de Resultados 79

Sistemas Com Cinco Componentes

BD Métodos de Negociação

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 87,64±2,43 94,68±2,99 12,74 90,85±2,95 10,18

H3 88,88±2,26 97,14±1,28 12,56 94,20±2,12 10,53

H5 92,30±2,23 98,07±1,82 13,21 95,66±2,04 10,60

Dif 5,02 3,39 - 4,81 -

p 2,54E-17 1,32E-09 - 2,09E-15 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 93,57±2,53 97,21±2,39 13,97 95,72±1,91 10,16

H3 93,13±2,63 97,90±2,03 13,14 96,09±2,10 10,43

H5 94,82±2,88 97,93±2,00 15,62 95,94±1,91 10,38

Dif 1,69 0,72 - 0,15 -

p 0,00056 0,0541 - 0,35 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 87,10±4,34 90,60±4,30 17,73 88,99±4,36 13,11

H3 89,40±2,84 94,93±2,78 17,09 93,91±3,42 11,66

H5 92,29±3,08 96,74±2,40 16,80 94,68±2,96 12,25

Dif 5,19 6,14 - 5,69 -

p 6,15E-10 1,57E-13 - 2,13E-11 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 92,27±3,34 97,41±2,10 14,67 95,22±2,15 12,59

H3 92,24±3,38 97,09±2,26 14,75 95,13±2,96 12,47

H5 90,83±3,99 97,71±2,01 14,01 95,44±2,63 11,52

Dif 1,44 0,62 - 0,31 -

p 0,0224 0,0657 - 0,285 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 90,23±3,29 93,14±2,36 15,32 91,98±2,89 10,63

H3 91,51±2,88 94,61±3,13 16,66 93,55±2,96 11,13

H5 90,51±2,94 97,32±1,73 13,77 94,78±2,51 10,65

Dif 1,28 4,18 - 2,80 -

p 0,00395 6,79E-17 - 0,000000682 -

Tabela 5.9: Método de Negociação para Sistemas com Cinco Componentes.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valorde p deste teste pode ser observado na Tabela 5.9. Com isto, conclui-se

que para os métodos que apresentaram os maiores valores de Dif, todos são estatistica-

mente que a sua variação. Já para aqueles que apresentaram os menores valores de Dif,

apenas nas bases B e D não se pode aﬁrmar nada.

Analisando o método Sensibi observa-se que, de forma geral, a porcentagem das itera-

ções da negociação sofrem picos. Por exemplo, para as bases A e B a média das iterações

sofrem uma pequena queda entre os sistemas NH e H3, mas sobe para sistemas H5. Já a

base a para as bases D e E aumentam com o a utilização do sistema híbrido H3 e diminui

com o uso do H5. E, por ﬁm, a base C que sofre diminuição quando aumenta a quanti-

dade de agentes diferentes. Agora, analisando o método Teoria dos Jogos (TJ), nas bases

B e E acontece um aumento da porcentadem de iterações para sistemas H3 e diminuição

para sistemas H5. Já a base C tem a reação contrária. A base A só sofre aumento com o

acréscimo de agentes diferentes e a base D sofre o efeito contrário. Logo, conclui-se que

5. Experimentos e Análises de Resultados 80

de forma geral, o número de rounds aumenta quando trabalha-se com estruturas híbridas.

Isto pode ser explicado pelo fato de que quando se trabalha com componentes diferentes

estes demoram mais a chegar a uma opinião comum.

5.3.4 Negociação versus Combinação para Sistemas com Cinco Com-

ponentes

Fazendo uma comparação entre os métodos de negociação e os de combinação, que em-

globam os métodos de seleção e fusão, observa-se que, para todas as bases de dados, mais

uma vez, o método de negociação baseado em Sensibilidade (Sensibi) obteve o melhor

desempenho. Para saber se um método é estatisticamente melhor que o outro, realiza-se

um teste de hipótese entre esse método e os demais. Os resultados dos testes estatísticos

entre o melhor método de negociação dos sistemas NH, H3 e H5 e os melhores métodos

baseados em fusão e seleção podem ser observados na Tabela 5.10.

Na Tabela 5.10, quando aparece ’Sim’ signiﬁca que o melhor método de negociação é

estatisticamente melhor que o melhor método do tipo que está sendo comparado e ’Não’

signiﬁca que não se pode aﬁrmar nada sobre os sistemas comparados. Para sistemas com

cinco componentes e considerando que existem dois tipos de sistemas híbridos, foram

feitos trinta testes estatísticos. Como resultado, tem-se que em 26 das 30 comparações o

método de negociação é estatisticamente melhor. Isso signiica que em 86,67% das com-

parações conseguiu-se uma superioridade estatística. Observa-se uma melhora quando

compara-se o desempenho dos sistemas com três componentes, onde somente 40% das

comparações foram estatisticamente melhores.

NH H3 H5

Base Fusão Seleção Fusão Seleção Fusão Seleção

A Não - 0,20378700 Não - 0,15274868 Sim - 0,00162633 Sim - 3,02E-13 Sim - 0,04425290 Sim - 0,00022066

B Não - 0,18325493 Sim - 0,03363419 Sim - 2,08E-06 Sim - 0,00309751 Sim - 0,01168165 Sim - 0,00442876

C Sim - 0,03798267 Sim - 0,00141797 Sim - 0,00307054 Sim - 1,27E-15 Sim - 0,00028575 Sim - 0,00072196

D Sim - 2,97E-10 Sim - 5,03E-08 Sim - 3,94E-08 Sim - 6,65E-07 Sim - 0,01284674 Sim - 0,00063113

E Sim - 0,00359252 Sim - 0,03886376 Sim - 0,00126007 Não - 0,07913151 Sim - 0,02465112 Sim - 0,00003479

Tabela 5.10: Teste de Hipótese entre os melhores métodos de seleção e fusão com o

melhor método de negociação para sistemas com Cinco Componentes.

Na primeira linha da Tabela 5.10, observa-se os testes entre o melhor método de ne-

gociação e os melhores método de fusão e seleção. Logo, conclui-se que para a base de

dados A, apenas quando os sistemas NH são utilizados é que não se pode aﬁrmar nada,

pois estes ultrapassaram o limiar, que é de 0.05. Na base de dados B, não se pode aﬁrmar

nada quando se compara o melhor método de fusão com o melhor método de negociaão,

nas demais comparações, a negociação é melhor estatisticamente. Nas bases C, D e E

5. Experimentos e Análises de Resultados 81

todos as comparações concluiram que o melhor método de negociação é melhor que os

melhores métodos de fusão e seleção.

5.3.5 Diversidade para Sistemas com Cinco Componentes

Com o intuito de analisar o nível de diversidade dos sistemas, a Tabela 5.11 mostra os

valores das três diversidades que foram aplicadas a todas as estruturas dos sistemas com

cinco componentes. Essas medidas de diversidade foram discutidas no capítulo anterior.

Como já mencionado, o Q estatístico (q) e o dupla-falsa (df) são medidas que utilizam

paridade e a entropia (e) é uma medida que não utiliza paridade.

Na Tabela 5.11, pode-se observar que, quase sempre, variações nos tipos de compo-

nentes dos sistemas inﬂuenciam as diversidades. De acordo com o comportamento das

medidas de diversidade, observa-se que as medidas de q e e tendem a aumentar o seu

valor quando são calculadas para sistemas híbridos, neste caso os sistemas H3 e H5. Por

outro lado, as medidas de df tendem a diminuir com o aumento da diversidade.

Neste tamanho de sistema, observa-se que, em geral, as diversidades para as bases D

e E tendem a manter uma estabilidade, mas nas bases A, B e C acontece exatamente o que

é esperado. Este comportamento apenas não é observado nas bases B e C.

BD Medidas de Diversidade

Var q df e

NH 0,80 0,29 0,82

H3 0,82 0,26 0,81

H5 0,86 0,25 0,83

Var q df e

NH 0,91 0,23 0,86

H3 0,92 0,23 0,87

H5 0,84 0,29 0,84

Var q df e

NH 0,83 0,29 0,84

H3 0,85 0,31 0,84

H5 0,88 0,23 0,87

Var q df e

NH 0,85 0,22 0,79

H3 0,87 0,34 0,79

H5 0,85 0,22 0,82

Var q df e

NH 0,87 0,24 0,84

H3 0,86 0,26 0,83

H5 0,85 0,24 0,83

Tabela 5.11: Medidas de Diversidade para Sistemas com Cinco Componentes.

De acordo com os resultados mostrados na Tabela 5.11 e mantendo o padrão do que

foi observado nos sistemas com três componentes, para as três medidas conclui-se que

5. Experimentos e Análises de Resultados 82

sistemas híbridos são capazes de prover maiores níveis de diversidade que sistemas não

híbridos. Outra conclusão importante é que este fato também reﬂete na acurácia dos

sistemas, já que os melhores resultados para sistemas com cinco componentes foram al-

cançados quando foram utilizados os sistemas H5.

5.4 Sistemas com Sete Componentes

Os resultados dos experimentos utilizando sistemas com sete componentes podem ser ob-

servados nas Tabelas 5.12, 5.13 e 5.14. Nesse tamanho de sistema, para cada classiﬁcação,

existem quatro diferentes estruturas:

• Um tipo de componente (NH)

• Três tipos de componentes (H3)

• Cinco tipos de componentes (H5)

• Sete tipos de componentes (H7).

Para os sistemas não híbridos, foram possíveis construir sete variações, pois só exis-

tem sete tipos diferentes de classiﬁcadores. Para os experimentos dos sistemas híbridos,

que neste tamanho de sistemas podem ser de três tipos, H3, H5 e H7, foram construídos

dez, quatro e uma variação, respectivamente. Como já foi mencionado anteriormente, os

valores apresentados nas tabela citadas anteriormente são a média dos melhores desvios

padrões de todas as possibilidades. Os valores em negrito representam o melhor desem-

penho entre as quatro variações do sistema, NH, H3, H5 e H7.

Neste tamanho de sistemas, os valores de Dif são calculados os maiores e menores

valores dentre os quatro tipos de sistemas, NH, H3, H5 e H7. E, por conseguinte, os

valores dos testes estatísticos, neste caso os valores de p, foram calculados para veriﬁcar

se essas diferenças são estatisticamente signiﬁcantes ou não.

Nestas tabelas, sete diferentes métodos de combinação foram analisados, que são:

Voto, Naive Bayes (NB), Soma, Média, Mediana, MLP, FuzzyMLP (FMLP); três diferen-

tes métodos de seleção foram analisados, que são: DCS-LA, DCS-DT, DCS-MCB; e três

diferetes métodos de negociação foram analisados, que são: Sensibilidade (Sensibi), Lei-

lão e Teoria dos Jogos (TJ). Para deﬁnir o conjunto de treinamento para os combinadores

treináveis, aproximadamente 10% das instâncias de cada base de dados foram separada

para criar um conjunto de validação.

5. Experimentos e Análises de Resultados 83

5.4.1 Métodosde Combinação ouFusãopara Sistemascom Sete Com-

ponentes

Nesta seção serão mostrados e analisados os resultados dos métodos de combinação para

sistemas com sete componentes.

Na Tabela 5.12 pode ser observado os resultados dos sete métodos baseados em fu-

são que foram usados neste trabalho. Analisando esta tabela, tem-se que, em geral, o

sistema que obteve as melhores porcentagens de acerto foi o com sete tipos de classiﬁca-

dores diferentes, ou seja, o sistemas híbrido H7. Isto é sensivelmente percebido quando

se observa as bases de dados C e D. Nelas os melhores desempenhos são 100% perten-

centes aos sistemas H7. Apesar de possuir apenas o método FuzzyMLP (FMLP) com

melhor desempenho para sistemas H5, a base B também tem uma grande concentração

de melhores resultados com os sistemas H7. Por outro lado, a base de dados A mostra

um desempenho particular. Nela, os métodos Voto, Soma e Mediana possuem um melhor

desempenho com sistemas H3. Ainda assim, os demais métodos possuem melhor desem-

penho com sistemas H7. Já a base de dados E apresenta uma melhor desempenho sempre

com sistemas H5.

Para esse tamanho de sistema, os métodos que apresentam os melhores desempenhos

para cada base de dados estão concentrados nas redes neurais. Para as bases A e B os

melhores desempenhos foram alcançados com os classiﬁcadores MLP e para as demais

bases, isto ocorreu com os classiﬁcadores FuzzyMLP (FMLP). E, mais uma vez, os mé-

todos neurais apresentam uma diferença de desempenho acentuada em relação aos de-

mais. E, mais uma vez, isto pode ser explicado pelo fato do MLP e do FuzzyMLP serem

métodos mais complexos que os demais, conseguindo assim realizar mais classiﬁcações

corretamente.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Em relação a diferença

de desempenho entre os sistemas híbridos e não híbridos, ou seja, os valores de Dif,

observa-se que os maiores valores de Dif ocorreram, em sua maioria, com o classiﬁca-

dor Naive Bayes (NB). Apenas a base de dados D apresenta essa maior diferença quando

é utilizado o classiﬁcador Voto. Em relação aos menores valores de Dif, observa-se que

eles ocorrem, para as bases de dados A e C, quando o classiﬁcador FuzzyMLP (FMLP)

é utilizado. Para a base B, isto ocorre para o método Voto, para a base D, para o método

MLP e para a base E, para o método Soma. Da mesma forma que nos sistemas com três e

cinco componentes, isto mostra que, de forma geral, os sistemas deste tipo são mais afe-

tados pelo uso de componentes diferentes são aqueles que são combinados por métodos

mais complexos. Por outro lado, de forma geral, os sistemas menos afetados são aqueles

que são combinados por métodos mais simples.

5. Experimentos e Análises de Resultados 84

Sistemas Com Sete Componentes

BD Métodos Baseados em Fusão

Var Voto NB Soma Média Mediana MLP FMLP

NH 75,32±5,87 81,21±6,12 79,23±5,56 80,11±7,03 78,25±7,95 91,68±3,61 93,96±2,88

H3 78,57±2,98 83,98±2,51 82,98±3,35 83,23±4,97 81,86±6,39 93,46±2,11 95,86±2,37

H5 84,31±3,26 88,78±3,67 87,20±3,51 87,08±6,42 85,36±6,64 95,48±2,61 96,71±2,12

H7 85,69±2,16 90,51±3,22 88,84±2,24 87,95±6,50 86,88±6,82 96,72±1,90 96,73±2,00

Dif 10,37 9,30 9,61 7,84 8,63 5,04 2,77

p 3,12E-28 1,61E-21 4,51E-27 1,15E-10 9,13E-11 3,32E-19 3,90E-10

Var Voto NB Soma Média Mediana MLP FMLP

NH 85,21±4,60 88,89±6,66 85,01±3,38 88,41±6,03 84,80±4,70 95,49±1,81 96,84±2,61

H3 82,86±4,63 87,90±3,87 85,36±3,42 86,91±5,21 84,13±5,48 95,43±2,58 96,44±2,51

H5 86,07±4,11 90,70±4,60 87,31±4,07 89,75±5,99 86,39±4,65 95,70±2,40 97,20±2,40

H7 85,69±2,16 90,51±3,22 88,84±2,24 87,95±6,50 86,88±6,82 96,72±1,90 96,73±2,00

Dif 3,21 2,80 3,83 2,84 2,75 1,29 0,76

p 0,00000315 0,0000147 1,08E-13 0,00061 0,00925 0,000597 0,0247

Var Voto NB Soma Média Mediana MLP FMLP

NH 74,80±3,93 81,50±2,64 75,92±3,65 79,94±4,08 75,06±6,22 89,76±2,84 91,71±2,92

H3 78,36±3,00 82,96±2,17 79,64±2,25 81,79±3,63 79,09±5,48 91,83±1,47 92,59±2,56

H5 82,54±4,84 86,92±6,40 85,45±5,34 86,49±6,53 83,76±7,49 93,03±2,39 94,60±2,34

H7 85,43±2,19 90,09±3,91 88,17±2,37 87,81±6,05 86,49±6,40 96,19±1,78 96,78±1,88

Dif 10,63 8,59 12,25 7,87 11,43 6,43 5,07

p 1,92E-42 1,21E-31 1,71E-50 6,81E-16 3,78E-20 1,28E-33 4,87E-24

Var Voto NB Soma Média Mediana MLP FMLP

NH 77,45±3,88 82,42±3,47 80,38±3,03 81,27±4,86 79,44±6,67 91,23±2,38 94,42±1,97

H3 79,45±4,57 83,60±3,93 82,06±4,01 82,26±5,03 80,15±5,94 93,00±3,59 95,34±2,35

H5 81,61±4,72 85,08±3,97 83,01±3,48 84,56±5,38 81,94±5,55 93,33±2,53 96,50±2,36

H7 82,56±4,87 88,80±3,57 85,90±5,04 86,46±6,12 84,71±6,86 96,20±1,78 96,38±1,88

Dif 5,11 6,38 5,52 5,19 5,27 4,97 2,08

p 9,95E-11 3,27E-20 5,02E-13 6,79E-08 0,00000462 1,72E-28 4,35E-08

Var Voto NB Soma Média Mediana MLP FMLP

NH 78,98±5,06 83,02±4,92 80,49±4,71 81,39±4,89 79,57±5,31 92,16±3,38 93,25±2,75

H3 80,13±5,07 84,37±4,80 82,49±4,56 83,27±4,91 81,50±5,52 92,28±3,23 94,31±2,64

H5 82,77±5,52 86,64±6,09 84,86±6,04 85,46±5,60 84,15±4,98 94,41±4,05 96,60±2,64

H7 84,65±3,27 88,71±4,37 87,77±3,47 87,00±6,56 85,56±6,81 96,27±1,97 96,73±1,96

Dif 5,67 5,69 7,28 5,61 5,99 4,11 3,48

p 4,47E-13 0,00061 2,02E-19 2,88E-08 2,15E-08 2,73E-15 7,32E-15

Tabela 5.12: Método baseado em Fusão para Sistemas com Sete Componentes.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.12. Diante disso,

pode-se aﬁrmar que todos os sistemas que possuiram os maiores valores de Dif são

estatisticamente melhores que suas variações. Por outro lado, conclui-se que, quando

analisando os menores valores de Dif, o único método que não se pode aﬁrmar nada é o

MLP da base D, os demais são estatisticamente melhores que suas variações.

5. Experimentos e Análises de Resultados 85

5.4.2 Métodos Baseados em Seleção para Sistemas com Sete Compo-

nentes

Nesta seção serão mostrados e analisados os resultados dos métodos de seleção para sis-

temas com sete componentes.

Na Tabela 5.13, pode-se observar o desempenho dos métodos baseados em seleção.

Nesta tabela, observa-se que, em geral, os sitemas que apresentam os melhores desempe-

nhos são os H7. Apenas para a base de dados D isto não ocorre com o método DCS-DT.

De acordo com os melhores desempenhos do sistema, observa-se que para as bases A e D

isto acontece com o método DCS-LA. Por outro lado, para as bases B, C e E isto ocorre

com o método DCS-MCB. Além disso, observa-se que as diferenças de desempenho entre

os métodos é relativamente pequena, ou seja, as desempenhos são bastante próximas.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Em relação a diferença de

desempenho entre os sistemas híbridos e não híbridos, ou seja, os valores de Dif, pode-se

concluir que, em geral, os maiores valores de Dif ocorrem quando o método DCS-LA é

utilizado. Apenas para a base de dados A, isto ocorre com o método DCS-DT. Já os me-

nores valores de Dif acontecem, para as bases A, C, D e E quando o método DCS-MCB

é utilizado. Apenas com a base B isto ocorre para o método DCS-DT. Mais uma vez, as-

sim como nos sistemas com três e cinco componentes, isto mostra que, de forma geral, os

sistemas deste tipo são mais afetados pelo uso de componentes diferentes são aqueles que

são combinados por métodos mais simples. Por outro lado, de forma geral, os sistemas

menos afetados são aqueles que são combinados por métodos mais complexos.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.13. Diante do exposto

e dos valores de p, pode-se concluir que todos os sistemas com os combinadores com

maiores e menores valores de Dif são estatisticamente melhores.

Na maioria dos casos mais uma vez, o método DCS-MCB possui um desempenho

melhor que o método DCS-DT. Avaliando, agora, o método DCS-DT, ainda na Tabela

5.13, observa-se que nas bases B, C, D e E a média de utilização do método de fusão di-

minui com o acréscimo de classiﬁcadores de tipos diferentes. Apenas a base A possui um

aumento progressivo nessa variação. Já para o método DCS-MCB, a média de utilização

do método Voto para resolver o sistema, para as bases A e B diminui com a utilização do

sistema H3, aumenta com a utilização do sistema H5 e volta a diminuir com a utilização

do sistema H7. A base C funciona de forma que essa média diminui quando aumenta a

quantidade de tipos dos classiﬁcadores e quando usa-se H7 ele diminui. Por outro lado,

a base D se comporta exatamente de forma contrária. E, por ﬁm, a base E apresenta

5. Experimentos e Análises de Resultados 86

Sistemas Com Sete Componentes

BD Métodos Baseados em Seleção

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 93,09±2,41 93,34±2,77 21,13 95,09±3,10 13,13

H3 96,23±1,69 95,81±1,49 21,91 95,52±1,81 13,49

H5 96,63±1,13 97,04±1,34 21,78 97,10±2,15 12,36

H7 96,89±1,20 96,86±1,35 22,42 97,38±1,78 12,28

Dif 3,80 3,70 - 2,29 -

p 5,79E-23 1,52E-18 - 0,000000173 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 95,95±2,17 96,40±2,38 20,19 96,54±1,80 16,47

H3 95,55±1,98 96,43±2,15 21,64 96,47±2,62 16,04

H5 96,18±1,83 97,39±1,87 19,96 97,73±1,87 15,09

H7 96,62±1,20 97,18±1,41 22,26 97,38±1,78 12,22

Dif 1,07 1,33 - 1,26 -

p 0,0000379 0,00354 - 0,000349 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 91,97±2,70 93,59±3,02 20,06 93,80±3,38 13,67

H3 92,83±2,31 95,15±2,67 20,82 95,87±2,28 13,95

H5 95,10±2,81 96,58±1,83 19,08 96,29±2,63 13,50

H7 96,30±1,55 96,93±1,46 22,56 96,99±1,70 13,59

Dif 4,33 3,34 - 3,19 -

p 1,51E-22 3,52E-14 - 4,08E-11 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 91,09±2,74 94,07±3,08 21,48 95,58±2,82 14,74

H3 92,89±2,68 95,38±3,15 19,82 95,96±2,61 12,96

H5 95,53±2,61 96,63±3,32 20,15 96,43±2,84 13,47

H7 96,46±1,16 96,77±1,62 22,17 96,67±1,96 13,02

Dif 5,37 2,70 - 1,09 -

p 2,87E-31 7,15E-10 - 0,00444 -

Var DCS-LA DCS-DT Uso Fusão DCS-MCB Uso Voto

NH 91,31±2,78 92,63±1,73 22,10 94,01±2,27 16,30

H3 92,00±2,73 93,22±1,98 22,77 95,10±2,18 16,26

H5 92,84±3,04 94,13±2,03 21,31 97,32±1,67 14,85

H7 96,37±1,49 96,59±1,99 21,49 96,73±1,97 12,73

Dif 5,06 3,96 - 3,31 -

p 4,52E-27 6,48E-25 - 7,74E-18 -

Tabela 5.13: Método baseado em Seleção para Sistemas com Sete Componentes.

uma diminuição dessa média na medida que a quantidade de tipos de classiﬁcadores é

aumentada.

Para este tamanho de sistema, comparando-se os métodos de seleção e fusão, observa-

se que os de seleção apresentam um desempenho melhor que os de fusão. Como pode ser

visto nas Tabelas 5.12 e 5.13, para todas as bases de dados o melhor método de fusão foi

sempre o FuzzyMLP. Já o melhor método de seleção, foi em geral, o método DCS-MCB,

mas, na base D isto ocorre com o método DCS-DT. Mas sempre os métodos FuzzyMLP

possuiram desempenho inferior que os DCS.

5. Experimentos e Análises de Resultados 87

5.4.3 Métodos de Negociação para Sistemas com Sete Componentes

Nesta seção serão mostrados e analisados os resultados dos métodos de negociação para

sistemas com sete componentes.

Analisando a Tabela 5.14 e observando os métodos de negociação, pode-se aﬁrmar

que, assim como nos Ensebles, em geral, eles apresentam melhor desempenho quando são

utilizados sistemas H7. Porém, para a base B os métodos Leilão e Sensibilidade (Sensibi)

apresentam melhor desempenho com sistemas do tipo H5. E, na base D, a Teoria dos

Jogos (TJ) e a Sensibilidade (Sensibi) apresentam um melhor desempenho com o sistema

do tipo H5 também. Observando o desempenho dos métodos de negociação, conclui-se

que o método baseado em Sensibilidade (Sensibi) apresenta, para todas as bases, o melhor

desempenho. Para as bases B e D, como foi mencionado anteriormente, apresentam esse

resultado para sistemas H5, mas as demais são para sistemas H7.

Como já foi explicado anteriormente, a medida Dif serve para mostrar como a di-

versidade dos componentes inﬂuencia o resultado do sistema. Em relação a diferença

de desempenho entre os sistemas híbridos e não híbridos, ou seja, os valores de Dif,

observa-se que as maiores diferenças ocorreram, para as bases A e D, com o método

Leilão. Para as bases B e C isto ocorre quando o método de Sensibilidade (Sensibi) é

aplicado. E, por ﬁm, para a base E isto ocorre para o método Teoria dos Jogos (TJ).

Observando os métodos que alcançaram os menores valores de Dif , conclui-se que para

as bases B, C e E isto ocorre quando o método Leilão é aplicado. Já nas bases A e D,

isto acontece para os métodos de Teoria dos Jogos (TJ). Mais uma vez, assim como nos

sistemas com três e cinco agents, isto mostra que, de forma geral, os sistemas deste tipo

são mais afetados pelo uso de componentes diferentes são aqueles que são combinados

por métodos mais complexos. Por outro lado, de forma geral, os sistemas menos afetados

são aqueles que são combinados por métodos mais simples.

Para veriﬁcar se essas diferenças são signiﬁcantemente estatísticas, foi feito um teste

estatístico e o valor de p deste teste pode ser observado na Tabela 5.14. Diante do exposto

e dos testes de hipótese, pode-se aﬁrmar que todos os sistemas que possuiram os maiores

valores de Dif são estatisticamente melhores que suas variações. Já em relação aos me-

nores valores de Dif, o único método que não se pode aﬁrmar que ele é estatisticamente

melhor que sua variação é o método Teoria dos Jogos (TJ) da base D.

Observando, na Tabela 5.14, o método Teoria dos Jogos (TJ) conclui-se que para as

bases A, C e D, a média da aplicação do método de fusão diminui com o aumento do tipo

dos agentes presentes no sistema. Já a base E apresenta uma diminuição para o sistema

H3, mas nos sistemas H5 e H7 ele sofre um aumento. E, por ﬁm, a base B sofre sempre

aumento desta média. Analisando, agora, o método baseado em Sensibilidade (Sensibi),

5. Experimentos e Análises de Resultados 88

Sistemas Com Sete Componentes

BD Métodos de Negociação

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 88,86±2,43 94,54±3,04 17,88 93,01±3,40 12,77

H3 92,25±2,34 96,38±2,04 16,72 95,24±2,08 12,60

H5 93,64±2,54 97,17±2,46 15,21 95,74±1,95 11,90

H7 95,36±3,59 98,36±2,48 15,26 96,59±2,94 11,26

Dif 6,50 3,82 - 3,58 -

p 6,38E-11 0,00015 - 0,00112 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 94,41±2,73 97,74±2,15 13,03 96,14±2,40 10,12

H3 94,80±2,21 97,97±2,65 14,17 96,28±2,49 10,35

H5 95,35±2,94 98,25±2,13 13,52 96,87±2,23 10,98

H7 94,46±2,01 96,19±2,19 16,37 97,56±1,88 10,99

Dif 0,94 2,06 - 1,42 -

p 0,0253 0,00275 - 0,0384 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 88,01±3,76 92,04±3,47 14,14 90,17±3,44 18,10

H3 89,78±2,52 92,95±2,16 14,61 90,88±2,23 17,47

H5 91,10±2,80 94,47±2,48 14,44 93,48±3,14 16,44

H7 93,55±2,65 96,81±3,61 17,98 95,88±2,81 10,84

Dif 5,54 6,77 - 5,71 -

p 0,0000117 0,0000607 - 0,00000165 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 94,13±3,14 97,09±2,67 15,34 95,89±2,25 11,22

H3 93,30±3,44 97,49±1,68 14,75 95,71±2,20 11,14

H5 94,54±3,71 98,12±1,59 15,46 96,07±2,18 11,06

H7 96,94±1,67 97,40±2,28 16,09 95,70±1,67 10,29

Dif 3,64 1,03 - 0,36 -

p 0,00066 0,0031 - 0,144 -

Var Leilao Sensibi iteracao Sensibi TJ iteracao TJ

NH 91,25±2,45 94,72±2,79 15,92 92,70±3,21 12,48

H3 91,56±3,28 95,27±2,77 15,72 93,16±3,25 10,79

H5 92,99±2,74 96,83±2,62 16,14 94,72±2,62 11,35

H7 93,84±3,25 97,84±2,64 16,23 96,59±2,51 13,54

Dif 2,59 3,12 - 3,89 -

p 0,0018 0,00066 - 0,00022 -

Tabela 5.14: Método de Negociação para Sistemas com Sete Componentes.

observa-se a média da utilização do método Voto para resolução do sistema diminui, mas

com o aumento da quantidade de tipos de agentes ele sofre um aumento também. Já

as bases B e C apresentam uma oscilação quando se modiﬁca a quantidade dos tipos,

primeiramente ele aumenta, depois diminui para aumentar novamente. Logo, conclui-

se que de forma geral, o número de rounds aumenta quando trabalha-se com estruturas

híbridas. Isto pode ser explicado pelo fato de que quando se trabalha com componentes

diferentes estes demoram mais a chegar a uma opinião comum.

5. Experimentos e Análises de Resultados 89

5.4.4 Negociação versus Combinação para Sistemas com Sete Com-

ponentes

Comparando-se, agora, os métodos de negociação e os de combinação, que emglobam os

métodos de seleção e fusão, observa-se que, para todas as bases de dados, mais uma vez, o

método de negociação baseado em Sensibilidade (Sensibi) obteve o melhor desempenho.

Para saber se um método é estatisticamente melhor que o outro, realiza-se um teste de

hipótese entre esse método e os demais. Os resultados dos testes estatísticos entre o

melhor método de negociação dos sistemas NH, H3, H5 e H7 e os melhores métodos

baseados em fusão e seleção podem ser observados na Tabela 5.15.

Na Tabela 5.15, quando aparece ’Sim’ signiﬁca que o melhor método de negociação é

estatisticamente melhor que o melhor método do tipo que está sendo comparado e ’Não’

signiﬁca que não se pode aﬁrmar nada sobre os sistemas comparados. Para sistemas com

sete componentes e considerando que existem três tipos de sistemas híbridos, foram fei-

tos quarenta testes estatísticos. Como resultado, tem-se que em 28 das 40 comparações o

método de negociação é estatisticamente melhor. Isso signiica que em 70% das compa-

rações conseguiu-se uma superioridade estatística. Observa-se uma ligeira queda quando

compara-se o desempenho dos sistemas com cinco componentes, onde 86,67% das com-

parações foram estatisticamente melhores, mas ainda é melhor que os sistemas com três

componentes, onde obteve-se apenas 40% de certeza de melhor desempenho estatístico.

NH H3

Base Fusão Seleção Fusão Seleção

A Não - 0,07383105 Não - 0,47505606 Sim - 0,04272615 Não - 0,35760382

B Sim - 0,04659815 Sim - 0,00008614 Sim - 0,00878909 Sim - 0,00378668

C Sim - 0,00335861 Sim - 0,00002751 Sim - 1,87E-13 Sim - 4,18E-08

D Sim - 7,52E-08 Sim - 0,00178451 Sim - 1,09E-11 Sim - 5,80E-11

E Sim - 0,00003751 Sim - 0,01942831 Sim - 0,00002458 Sim - 0,00626104

H5 H7

Base Fusão Seleção Fusão Seleção

A Sim - 0,00001909 Sim - 0,00087235 Não - 0,29011638 Não - 0,13053520

B Sim - 0,01696520 Sim - 0,00025943 Não - 0,35376177 Não - 0,31715769

C Sim - 6,64E-10 Sim - 0,00052588 Não - 0,07272109 Não - 0,15310682

D Sim - 1,66E-11 Sim - 1,30E-06 Não - 0,40893985 Não - 0,34466944

E Sim - 8,11E-06 Sim - 0,00010503 Sim - 0,00535126 Não - 0,06732302

Tabela 5.15: Teste de Hipótese entre os melhores métodos de seleção e fusão com o

melhor método de negociação para sistemas com Sete Componentes.

Analisando a primeira linha da Tabela 5.15, tem-se os valores de p para os teste com

a base de dados A. Para esta base, apenas quando compara-se o melhor método de ne-

gociação com os melhores de fusão e seleção dos sistemas H5 e a fusão dos sistemas

H3 pode-se dizer que o método de negociação é estatisticamente melhor. Nas bases de

dados B, C e D, apenas para as comparações feitas com sistemas H7 não se pode aﬁrmar

5. Experimentos e Análises de Resultados 90

nada, nos demais a negociação é melhor. E, por ﬁm, para a base de dados E apenas a

comparação do método de seleção com o de negociação é que não se pode aﬁrmar nada.

5.4.5 Diversidade para Sistemas com Sete Componentes

Com o intuito de analisar o nível de diversidade dos sistemas, a Tabela 5.16 mostra os

valores das três diversidades que foram aplicadas a todas as estruturas dos sistemas com

sete componentes. Essas medidas de diversidade foram discutidas no capítulo anterior.

Como já mencionado, o Q estatístico (q) e o dupla-falsa (df) são medidas que utilizam

paridade e a entropia (e) é uma medida que não utiliza paridade.

BD Medidas de Diversidade

Var q df e

NH 0,80 0,28 0,82

H3 0,83 0,24 0,85

H5 0,88 0,24 0,87

H7 0,91 0,20 0,92

Var q df e

NH 0,84 0,26 0,81

H3 0,83 0,25 0,79

H5 0,86 0,29 0,85

H7 0,83 0,28 0,84

Var q df e

NH 0,85 0,27 0,85

H3 0,84 0,28 0,82

H5 0,90 0,21 0,87

H7 0,88 0,19 0,90

Var q df e

NH 0,81 0,24 0,75

H3 0,83 0,24 0,78

H5 0,86 0,22 0,80

H7 0,79 0,28 0,81

Var q df e

NH 0,87 0,20 0,83

H3 0,84 0,25 0,84

H5 0,88 0,20 0,82

H7 0,83 0,19 0,79

Tabela 5.16: Medidas de Diversidade para Sistemas com Sete Componentes.

Na Tabela 5.16, pode-se observar que, quase sempre, variações nos tipos de compo-

nentes dos sistemas inﬂuenciam as diversidades. De acordo com o comportamento das

medidas de diversidade, observa-se que as medida baseadas em paridade tendem a au-

mentar o seu valor quando são calculadas para sistemas híbridos, neste caso os sistemas

H3, H5 e H7. Por outro lado, as medidas que não são baseadas em paridade tendem a

diminuir com o aumento da diversidade.

Neste tamanho de sistema, observa-se que, em geral, as diversidades tendem a manter

5. Experimentos e Análises de Resultados 91

uma estabilidade. Este comportamento é esperado quando aumenta-se a quantidade de

componentes dos sistemas.

De acordo com os resultados mostrados na Tabela 5.16 e mantendo o padrão do que

foi observado nos sistemas com três e cinco componentes, para as três medidas conclui-se

que sistemas híbridos são capazes de prover maiores níveis de diversidade que sistemas

não híbridos. Outra conclusão importante, que mais uma vez foi abservada, é que este

fato também reﬂete na acurácia dos sistemas, já que os melhores resultados para sistemas

com cinco componentes foram alcançados quando foram utilizados os sistemas H7.

5.5 Sistemas com Nove Componentes

Os resultados dos experimentos utilizando sistemas com nove componentes podem ser

observadosnas Tabelas 5.17, 5.18 e 5.19. Nesse tamanho de sistema, da mesma forma que

para os sistemas com sete componentes, para cada classiﬁcação, existem quatro diferentes

estruturas:

• Um tipo de componente (NH)

• Três tipos de componentes (H3)

• Cinco tipos de componentes (H5)

• Sete tipos de componentes (H7).

Para os sistemas não híbridos, foram possíveis construir sete variações, pois só exis-

tem sete tipos diferentes de classiﬁcadores. Para os experimentos dos sistemas híbridos,

que neste tamanho de sistemas podem ser de três tipos, H3, H5 e H7, foram construídos

dez, sete e sete variações, respectivamente. Como já foi mencionado anteriormente, os