( PDF ) Controle robusto de robôs móveis com rodas

Download PDF

ads:

Roberto Santos Inoue

Controle Robusto de Robˆos M´oveis com Rodas

Disserta¸c˜ao apresentada `a Escola de Engenharia de S˜ao Carlos

da Universidade de S˜ao Paulo, como parte dos requisitos para

obten¸c˜ao do t´ıtulo de Mestre em Engenharia El´etrica

Area de Concentra¸c˜ao: Sistemas Dinˆamicos

Orientador: Prof. Dr. Marco Henrique Terra

Co-orientador: Prof. Dr. Adriano A. G. Siqueira

S˜ao Carlos

2007

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

ads:

iii

Sum´ario

Resumo vii

Abstract ix

Publica¸c˜oes xi

Lista de Figuras xiii

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao ....................................... 1

1.2 Revis˜ao bibliogr´aﬁca.................................. 2

1.2.1 Robˆos m´oveiscomrodas ........................... 2

1.2.2 Controle H

∞

para robˆos ........................... 5

1.2.3 Localiza¸c˜ao usando vis˜ao computacional . ................. 6

1.3 Disposi¸c˜ao dos cap´ıtulos ............................... 8

2 Modelagem do RobˆoM´ovel 9

2.1 Modelo cinem´atico................................... 10

2.2 Controlador baseado na cinem´atica ......................... 11

2.3 Modelo dinˆamico.................................... 12

3 Controle H

∞

N˜ao Linear 13

3.1 Formula¸c˜aodoproblema ............................... 13

3.2 Controle H

∞

n˜ao linear via representa¸c˜aoquase-LPV ............... 16

3.2.1 Ganho L

para sistemas n˜aolinearesvariantesnotempo ......... 16

3.2.2 S´ıntese do controle H

∞

para sistemas LPV por realimenta¸c˜ao do estado . 17

3.2.3 Considera¸c˜oes computacionais . . . ..................... 18

3.3 Controle H

∞

n˜ao linear via Teoria dos Jogos (TJ) ................. 20

3.4 Controle H

∞

n˜ao linear baseado em modelo fuzzy

TakagiSugeno ..................................... 22

3.5 Controle H

∞

n˜aolinearbaseadoemredesneurais ................. 30

3.6 Solu¸c˜ao da equa¸c˜ao alg´ebricadeRiccati....................... 34

4 Implementa¸c˜ao 37

4.1 Robˆom´ovelcomrodas ................................ 37

4.2 Sistema de vis˜ao computacional . . . ........................ 38

4.2.1 TransformadadeHoughcircular....................... 39

4.3 AmbientedecontroledeRMR ............................ 41

4.4 Experimentos ..................................... 43

4.4.1 Controle H

∞

n˜ao linear via representa¸c˜aoquase-LPV........... 46

4.4.2 Controle H

∞

n˜ao linear via Teoria dos Jogos (TJ) . ............ 50

4.4.3 Controle H

∞

n˜aolinearbaseadoemmodelofuzzyTakagiSugeno .... 53

4.4.4 Controle H

∞

n˜ao linear baseado em modelo e em modelo fuzzy

TakagiSugeno ................................. 57

4.4.5 Controle H

∞

n˜aolinearbaseadoemredesneurais ............. 61

4.4.6 Controle H

∞

n˜aolinearbaseadoemmodeloeemredesneurais ..... 65

4.4.7 Controleproporcionalderivativoetorquecalculado(PD+TC) ...... 69

4.4.8 Estudo comparativo . . ............................ 72

5 Conclus˜ao 75

Referˆencias Bibliogr´aﬁcas 77

Dedicat´oria

Aos meus pais Francisco Hitoshi Inoue e Maria Selma dos Santos com amor e gratid˜ao.

Agradecimentos

A Deus, que me concedeu sa´ude f´ısica e mental para a realiza¸c˜ao deste trabalho.

Aos meus pais Francisco Hitoshi Inoue e Maria Selma dos Santos com amor, admira¸c˜ao e

gratid˜ao por sua compreens˜ao, carinho, presen¸ca e incans´avel apoio ao longo do per´ıodo deste

mestrado.

Aos meus tios Gilberto e Djalma que me ajudaram em minha permanˆencia em S˜ao Carlos.

Ao Prof Dr. Marco Henrique Terra pela conﬁan¸ca, orienta¸c˜ao, paciˆencia e pelo tempo

dedicado a este trabalho.

Ao Prof. Dr. Adriano Almeida Gon¸calves Siqueira pela aten¸c˜ao, apoio e contribui¸c˜oes na

realiza¸c˜ao deste trabalho.

Aos amigos da p´os-gradua¸c˜ao e do LASI: Aline, Amanda, Carolina, Cleber, Elmer, Gild-

son, Lais, Rafael, Raphael, Robson, Samuel, Saulo, Tatiana, Tatiane, Thiago, Wallisson, pela

amizade, paciˆencia, companheirismo e colabora¸c˜oes durante a realiza¸c˜ao das disciplinas e deste

trabalho.

Aos professores e funcion´ariosdoDepartamentodeEngenhariaEl´etrica da Escola de Enge-

nharia de S˜ao Carlos, pelas contribui¸c˜oes durante o mestrado.

Ao Conselho Nacional de Desenvolvimento Cient´ıﬁco e Tecnol´ogico (CNPq) pela concess˜ao

da bolsa de mestrado.

vii

Resumo

Nesta disserta¸c˜ao ´e apresentado um estudo comparativo entre seis controladores H

∞

n˜ao

lineares aplicados em um robˆom´ovel com rodas. Trˆes estrat´egias de controle s˜ao avaliadas.

Na primeira, o modelo do robˆo´e considerado completamente conhecido. Na segunda, o modelo

matem´atico ´e considerado desconhecido e ´e realizada uma estimativa baseada em m´etodos inteli-

gentes. E ﬁnalmente, na terceira estrat´egia, o modelo nominal ´e conhecido e t´ecnicas inteligentes

s˜ao usadas para estimar somente incertezas param´etricas do robˆo. As t´ecnicas inteligentes usadas

s˜ao baseadas em redes neurais e em l´ogica fuzzy. Esses controladores s˜ao resolvidos atrav´es de

Desigualdades Matriciais Lineares (DMLs) e equa¸c˜oes alg´ebricas de Riccati. Todos os resultados

obtidos s˜ao baseados em dados experimentais.

viii

Abstract

This dissertation is present a comparative study between six nonlinear H

∞

controllers applied

to a wheeled mobile robot. Three control strategies are adopted. In the ﬁrst, the model of the robot

is considered completely known. In the second, the mathematical model is considered unknown

and is accomplished an estimate based on intelligent methods. And ﬁnally, in the third strategy,

the nominal model is known and intelligent techniques are used only to estimate parametric

uncertainties of the robot. The intelligent techniques used are based in neural networks and in

fuzzy logic. These controllers are solved via Linear Matrix Inequalities (LMIs) and algebraic

Riccati equations. All results obtained are based in experimental data.

Publica¸c˜oes

1. Inoue, R. S., A. A. G. Siqueira e M. H. Terra (2007). Experimental results on the nonli-

near H

∞

control via Quasi-LPV representation and game theory for wheeled mobile robots.

IEEE Conference on Control Applications, Singapore.

2. Inoue, R. S., Tatiana de F. P. A. T. Pazelli, A. A. G. Siqueira e M. H. Terra (2007). Mixed

model based/fuzzy adaptive robust controller with H

∞

criterion applied to wheeled mobile.

3rd IFAC Symposium on System Structure and Control, Foz do Igua¸cu, Brazil.

3. Inoue, R. S., Tatiana de F. P. A. T. Pazelli, A. A. G. Siqueira e M. H. Terra (2007).

Controlador Robusto H

∞

Baseado em Redes Neurais Aplicado em Robˆos M´oveis com

Rodas. VIII Simp´osio Brasileiro de Automa¸c˜ao Inteligente, Florian´opolis, Brasil.

4. Pazelli, Tatiana de F. P. A. T., R. S. Inoue, A. A. G. Siqueira e M. H. Terra (2007).

Mixed Model Based/Fuzzy Adaptive Robust Controller with H

∞

Criterion Applied to

Free-Floating Space Manipulators. VIII Simp´osio Brasileiro de Automa¸c˜ao Inteligente,

Florian´opolis, Brasil.

xii

xiii

Lista de Figuras

FIGURA2.1 GeometriadoRMR. ............................ 9

FIGURA3.1 RedeNeural.................................. 32

FIGURA 4.1 Foto do robˆom´ovel.............................. 38

FIGURA 4.2 Conven¸c˜ao: (a) imagem cont´ınua,(b)imagemdigital........... 39

FIGURA 4.3 Transformada de Hough circular: (a) imagem, (b) matriz acumuladora. 39

FIGURA 4.4 Imagem da cˆamera visualizando o robˆo................... 41

FIGURA 4.5 Ambiente de controle de RMR na aba de Parˆametros........... 42

FIGURA 4.6 Ambiente de controle de RMR na aba de Gr´aﬁcoA............ 42

FIGURA 4.7 Ambiente de controle de RMR na aba de Gr´aﬁcoB............ 43

FIGURA 4.8 Dist´urbios de torque aplicados `asrodas. ................. 44

FIGURA 4.9 Sistema de controle de acompanhamento de trajet´oria para robˆos m´oveis. 45

FIGURA 4.10 Controladores baseados na dinˆamica.................... 45

FIGURA 4.11 Acompanhamento de trajet´oria de referˆencia usando o controlador quase-

LPV: sem dist´urbio (esquerda) e com dist´urbio(direita)............... 47

FIGURA 4.12 Erros de posi¸c˜ao usando o controlador quase-LPV: sem dist´urbio (es-

querda) e com dist´urbio(direita)............................ 47

FIGURA 4.13 Erro de dire¸c˜ao usando o controlador quase-LPV: sem dist´urbio (es-

querda) e com dist´urbio(direita)............................ 48

xiv

FIGURA 4.14 Derivada dos erros de posi¸c˜ao usando o controlador quase-LPV: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 48

FIGURA 4.15 Derivada do erro de dire¸c˜ao usando o controlador quase-LPV: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 48

FIGURA 4.16 Velocidade angular da roda direita usando o controlador quase-LPV:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 49

FIGURA 4.17 Velocidade angular da roda esquerda usando o controlador quase-LPV:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 49

FIGURA 4.18 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador quase-LPV: sem dist´urbio (esquerda) e com dist´urbio (direita). 49

FIGURA 4.19 Acompanhamento de trajet´oria de referˆencia usando o controlador TJ:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 50

FIGURA 4.20 Erros de posi¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda) e

com dist´urbio(direita). ................................ 50

FIGURA 4.21 Erro de dire¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda) e

com dist´urbio(direita). ................................ 51

FIGURA 4.22 Derivada dos erros de posi¸c˜ao usando o controlador TJ: sem dist´urbio

(esquerda) e com dist´urbio(direita). ......................... 51

FIGURA 4.23 Derivada do erro de dire¸c˜ao usando o controlador TJ: sem dist´urbio

(esquerda) e com dist´urbio(direita). ......................... 51

FIGURA 4.24 Velocidade angular da roda direita usando o controlador TJ: sem dist´urbio

(esquerda) e com dist´urbio(direita). ......................... 52

FIGURA 4.25 Velocidade angular da roda esquerda usando o controlador TJ: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 52

FIGURA 4.26 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio (direita). . . 52

FIGURA 4.27 Conjunto fuzzy A

(˜q) e conjunto fuzzy A

(

˜q)............... 53

FIGURA 4.28 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-

seado em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . 54

FIGURA 4.29 Erros de posi¸c˜ao usando o controlador baseado em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 54

FIGURA 4.30 Erro de dire¸c˜ao usando o controlador baseado em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 55

FIGURA 4.31 Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 55

FIGURA 4.32 Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 55

FIGURA 4.33 Velocidades angulares da roda direita usando o controlador baseado em

modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita). ...... 56

FIGURA 4.34 Velocidades angulares da roda esquerda usando o controlador baseado

em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . . 56

FIGURA 4.35 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio (esquerda) e

com dist´urbio(direita). ................................ 56

FIGURA 4.36 Conjunto fuzzy A

(˜q) e conjunto fuzzy A

(

˜q)............... 57

FIGURA 4.37 Acompanhamento de trajet´oria de referˆencia usando o controlador base-

ado em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio

(direita).......................................... 58

FIGURA 4.38 Erros de posi¸c˜ao usando o controlador baseado em modelo e em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 58

FIGURA 4.39 Erro de dire¸c˜ao usando o controlador baseado em modelo e em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 59

FIGURA 4.40 Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo

e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 59

FIGURA 4.41 Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo

e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 59

FIGURA 4.42 Velocidades angulares da roda direita usando o controlador baseado em

modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). 60

xvi

FIGURA 4.43 Velocidades angulares da roda esquerda usando o controlador baseado

em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio

(direita).......................................... 60

FIGURA 4.44 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador baseado em modelo e em modelo fuzzy T-S: sem dist´urbio

(esquerda) e com dist´urbio(direita). ......................... 60

FIGURA 4.45 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-

seado em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 62

FIGURA 4.46 Erros de posi¸c˜ao usando o controlador baseado em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 62

FIGURA 4.47 Erro de dire¸c˜ao usando o controlador baseado em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 62

FIGURA 4.48 Derivada dos erros de posi¸c˜ao usando o controlador baseado em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 63

FIGURA 4.49 Derivada do erro de dire¸c˜ao usando o controlador baseado em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 63

FIGURA 4.50 Velocidades angulares da roda direita usando o controlador baseado em

redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita).......... 63

FIGURA 4.51 Velocidades angulares da roda esquerda usando o controlador baseado

em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)........ 64

FIGURA 4.52 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador baseado em redes neurais: sem dist´urbio (esquerda) e com

dist´urbio(direita). ................................... 64

FIGURA 4.53 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-

seado em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio

(direita).......................................... 66

FIGURA 4.54 Erros de posi¸c˜ao usando o controlador baseado em modelo e em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 66

FIGURA 4.55 Erro de dire¸c˜ao usando o controlador baseado em modelo e em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 66

xvii

FIGURA 4.56 Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo

e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)....... 67

FIGURA 4.57 Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo

e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)....... 67

FIGURA 4.58 Velocidades angulares da roda direita usando o controlador baseado em

modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). . 67

FIGURA 4.59 Velocidades angulares da roda esquerda usando o controlador baseado

em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). 68

FIGURA 4.60 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador baseado em modelo e em redes neurais: sem dist´urbio (es-

querda) e com dist´urbio(direita)............................ 68

FIGURA 4.61 Acompanhamento de trajet´oria de referˆencia usando o controlador PD

+ TC: sem dist´urbio (esquerda) e com dist´urbio(direita). ............. 69

FIGURA4.62Errosdeposi¸c˜ao usando o controlador PD + TC: sem dist´urbio (es-

querda) e com dist´urbio(direita)............................ 69

FIGURA 4.63 Erro de dire¸c˜ao usando o controlador PD + TC: sem dist´urbio (es-

querda) e com dist´urbio(direita)............................ 70

FIGURA 4.64 Derivada dos erros de posi¸c˜ao usando o controlador PD + TC: sem

dist´urbio (esquerda) e com dist´urbio(direita)..................... 70

FIGURA 4.65 Derivada do erro de dire¸c˜ao usando o controlador PD: sem dist´urbio

(esquerda) e com dist´urbio(direita). ......................... 70

FIGURA 4.66 Velocidades angulares da roda direita usando o controlador PD + TC:

sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 71

FIGURA 4.67 Velocidades angulares da roda esquerda usando o controlador PD +

TC: sem dist´urbio (esquerda) e com dist´urbio(direita). .............. 71

FIGURA 4.68 Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente,

usando o controlador PD +TC: sem dist´urbio (esquerda) e com dist´urbio (direita). 71

xviii

Cap´ıtulo 1

Introdu¸c˜ao

1.1 Motiva¸c˜ao

Considerando que robˆos m´oveis com rodas (RMRs) podem estar sujeitos a perturba¸c˜oes ex-

ternas, como desn´ıveis da superf´ıcie por onde o robˆo circula, escorregamento das rodas, colis˜ao

com obst´aculos ou com outros robˆos e incertezas param´etricas, o controle utilizado deve ser ro-

busto o suﬁciente para a realiza¸c˜ao de uma tarefa pr´e-estabelecida. Optou-se neste trabalho pela

utiliza¸c˜ao de estrat´egias de controle baseadas em modelos dinˆamicos. Ser´a usada uma repre-

senta¸c˜ao do robˆoemespa¸co de estado linear a parˆametros variantes (LPV). Essa representa¸c˜ao

tem se mostrado bastante apropriada em aplica¸c˜oes voltadas `a rob´otica pois preserva a natureza

dinˆamicadosistema. Paraaatenua¸c˜ao dos dist´urbios externos e incertezas param´etricas, o

crit´erio H

∞

tem sido usado para outros tipos de robˆos e ser´a aplicado em RMRs neste trabalho.

Em adi¸c˜ao a este car´ater robusto do crit´erio de controle adotado, este trabalho utiliza m´etodos

baseados em inteligˆencia artiﬁcial, baseados em redes neurais e em l´ogica fuzzy, para comple-

mentar o modelo matem´atico do robˆom´ovel. Estimam as incertezas n˜ao modeladas pelo modelo

nominal. Esta combina¸c˜ao ´e feita com a garantia de estabilidade do sistema de controle robusto

resultante.

1.2 Revis˜ao bibliogr´aﬁca

1.2.1 Robˆos m´oveis com rodas

Controladores para RMRs tˆem sido alvo de pesquisas em rob´otica a partir dos anos 80. A

express˜ao Robˆos M´oveis com Rodas ser´a utilizada para diferenciar a categoria de robˆos consi-

derada neste trabalho de outros tipos de robˆos (m´oveis, aqu´aticos, a´ereos, etc) e em boa parte

do texto ser´a utilizado apenas o termo Robˆos M´oveis.

Em Campion et al. (1996), os autores deﬁniram dois tipos de rodas para RMRs: rodas

convencionais, cuja velocidade no ponto de contato da roda com o solo ´e zero e s˜ao divididas em

rodas ﬁxas, centradas orient´aveis e centradas n˜ao orient´aveis (conhecidas tamb´em por castor);

e rodas suecas nas quais somente a componente da velocidade ao longo do movimento no ponto

decontatodarodacomosolo´e admitida ser nula.

Os RMRs mais comuns estudados na literatura s˜ao: uniciclo (Aicardi et al., 1995; Morin e

Samson, 2000; Lee et al., 2001) (este nome ´e devido a equa¸c˜ao cinem´atica do robˆo ser equivalente

ao de uma roda que n˜ao gira em falso e nem desliza no sentido do eixo), carro convencional

(Almeida et al., 1997), carro convencional com trailers (Vendittelli e Oriolo, 2000; Samson,

1995; Jiang e Nijmeijer, 1999) e uniciclo com trailers (M’Closkey e Murray, 1997).

O robˆom´ovel utilizado neste trabalho ´e um uniciclo com duas rodas convencionais ﬁxas

atuadas independentemente e uma roda convencional tipo castor. Considera-se tamb´em que o

centro de massa (P

)´e diferente do ponto no centro do eixo das rodas atuadas (P

Modelos matem´aticas para RMRs tˆem sido formulados para cada tipo de robˆo. Modelos

cinem´aticos para cinco tipos de robˆos s˜ao apresentados em Campion et al. (1996). Em Coelho

(2001), o autor apresenta uma modelagem completa (cinem´atica e dinˆamica) para um robˆo

uniciclo, considerando trˆes casos: no primeiro P

= P

, no segundo P

= P

e no terceiro

= P

, incluindo em todos eles as for¸cas de restri¸c˜oes.

Robˆos M´oveis com Rodas constituem uma classe de sistemas mecˆanicos caracterizados por

restri¸c˜oes n˜ao holonˆomicas. Para entender o que s˜ao restri¸c˜oes n˜ao holonˆomicas, considere que

o sistema mecˆanico pode ser descrito por um vetor de coordenadas generalizadas de dimens˜ao n

q =[q

... q

]

e a velocidade generalizada em um ponto gen´erico de uma trajet´oria suave q(t)´e o vetor tangente

˙q =[˙q

˙q

... ˙q

]

Um sistema mecˆanico pode estar sujeito a um conjunto de restri¸c˜oes cinem´aticas, envolvendo

as coordenadas generalizadas e suas derivadas, ou seja, k restri¸c˜oes de primeira ordem

(q, ˙q)=0,

sendo i = {1, 2, ..., k}. Na maioria dos casos as restri¸c˜oes s˜ao lineares nas velocidades e podem

ser denotadas por

A(q)˙q =0.

Se as restri¸c˜oes cinem´aticas podem ser integradas, isto ´e, se existem k fun¸c˜oes h

tais que

(q(t))

∂h

(q(t))

∂q

˙q =0,i= {1, 2, ..., k},

ent˜ao, as restri¸c˜oes cinem´aticas s˜ao de fato restri¸c˜oes geom´etricas. Portanto um conjunto de

restri¸c˜oes cinem´aticas ´e chamado holonˆomico se ´e integr´avel e em caso contr´ario, ´e chamado de

n˜ao holonˆomico.

Usando

Algebra de Lie, Coelho e Nunes (2003) mostraram como pode-se determinar quantas

restri¸c˜oes cinem´aticas n˜ao holonˆomicas est˜ao presentes em um sistema de restri¸c˜oes. Uma li-

mita¸c˜ao na estabilidade de um ponto de equil´ıbrio de um sistema com restri¸c˜oes n˜ao holonˆomicas

´e que a estabilidade de Lyapunov n˜ao pode ser alcan¸cada por uma lei de realimenta¸c˜ao invariante

no tempo e suave (Bloch e McClamroch, 1989; Oriolo et al., 2002). Este resultado ´ebaseado

nos resultados apresentados em Brockett (1983).

Estudos de controlabilidade e estabilizabilidade para sistemas n˜ao holonˆomicos podem ser

encontrados em Bloch e McClamroch (1990), onde se utiliza como exemplo o movimento de uma

faca, e em Oriolo et al. (2002), que avalia um robˆodotipouniciclo.

Na literatura s˜ao apresentados trˆes tipos b´asicos de objetivos a serem alcan¸cados por um

RMR: estabiliza¸c˜ao de postura (posi¸c˜ao e dire¸c˜ao do robˆo), alcan¸car uma postura de referˆencia

iniciando em uma dada postura; acompanhamento de trajet´oria,orobˆo deve seguir uma tra-

jet´oria de referˆencia em fun¸c˜ao do tempo; seguindo um caminho,orobˆo deve seguir uma tra-

jet´oria de referˆencia em fun¸c˜ao de parˆamentros independentes do tempo, podendo ser geom´etrico

(Coelho e Nunes, 2003) ou em fun¸c˜ao do trajeto e das velocidades ao longo do caminho (Sarkar

et al., 1994). Neste trabalho, o controle ser´a realizado para acompanhamento de trajet´oria de

referˆencia, sendo a trajet´oria de referˆencia o objetivo a ser alcan¸cado pelo ponto P

do robˆo,

diferentemente da trajet´oria desejada, que se refere `as velocidades desejadas para as rodas do

robˆo tais que o robˆo alcance a referˆencia, conforme apresentado no Cap´ıtulo 2.2.

Na literatura foram encontradas in´umeras publica¸c˜oes de trabalhos relacionados a controle

de RMRs e alguns est˜ao resumidos a seguir.

Oriolo et al. (2002) apresentaram um m´etodo uniﬁcado para resolver os problemas de acom-

panhamento de trajet´oria e estabiliza¸c˜ao de postura, que utiliza o modelo cinem´atico de um

uniciclo e a lineariza¸c˜ao por realimenta¸c˜ao dinˆamica. O m´etodo consiste em encontrar um com-

pensador dinˆamico dependente da dire¸c˜ao do robˆoedasvari´aveis de controle geradas por um

controlador proporcional derivativo (PD).

Sarkar et al. (1994) propuseram um m´etodo de controle por realimenta¸c˜ao de sa´ıda que

alcan¸ca estabilidade assint´otica usando o modelo cinem´atico e dinˆamico. A escolha das sa´ıdas

est´a ligada diretamente ao objetivo de controle. Para o acompanhamento de trajet´oria, o vetor

de sa´ıda consiste de parte das coordenadas generalizadas em fun¸c˜ao do tempo, e para seguir um

caminho, o vetor de sa´ıda consiste em um caminho geom´etrico, por exemplo uma reta ou uma

circunferˆencia.

Coelho e Nunes (2003) mostraram o uso da ´algebra de Lie para sistemas de controle n˜ao

lineares com restri¸c˜oes n˜ao holonˆomicas. O controle de um RMR ´e realizado por realimenta¸c˜ao de

sa´ıda, sendo as sa´ıdas o erro de posi¸c˜ao do robˆo com rela¸c˜ao a uma circunferˆencia e a velocidade

linear do robˆo para o problema de seguir um caminho.

Fukao et al. (2000) apresentaram um m´etodo para projetar um controlador adaptativo para

omodelodinˆamico de um robˆom´ovel com restri¸c˜oes n˜ao holonˆomicas com parˆametros des-

conhecidos, utilizando Backstepping adaptativo. A metodologia de projeto recursiva chamada

Backstepping, (Krstic et al., 1995), ´e uma constru¸c˜ao sistem´

atica de ambas as leis de controle

de realimenta¸c˜ao e fun¸c˜ao de Lyapunov associada. Propriedades fortes de acompanhamento e

estabilidade local ou global s˜ao constru´ıdas dentro de sistemas n˜ao lineares em um n´umero de

passos que nunca ´e maior do que a ordem do sistema.

Do et al. (2004) apresentaram um controle adaptativo global variante no tempo que resolve

simultaneamente ambas estabiliza¸c˜ao de postura e acompanhamento de trajet´oria para robˆos

m´oveis com parˆametros da dinˆamica e cinem´atica desconhecidos. A s´ıntese de controle ´ebaseada

em t´ecnicas de Backstepping em´etodo direto de Lyapunov.

Ji et al. (2003) desenvolveram um sistema de controle adaptativo tolerante a falha. O robˆo

´emodeladocomoumsistemacont´ınuo com um controlador supervisor. Um ajuste em um

controle hier´arquico ´e desenvolvido para o controlador supervisor que determina uma estrat´egia

de controle adequada para eliminar a falha.

Atrav´es de uma fun¸c˜ao de Lyapunov, Kanayama et al. (1990) propuseram um controle de

acompanhamento de trajet´oria est´avel, que envolve o erro de postura (erro de dire¸c˜ao e posi¸c˜ao

com rela¸c˜ao ao sistema de coordenadas local do robˆo) e a trajet´oria de referˆencia, e gera velo-

cidades desejadas para o robˆom´ovel seguir a trajet´oria de referˆencia, ou seja, zerar o erro de

postura.

1.2.2 Controle H

∞

para robˆos

Trˆes importantes estrat´egias sobre controle de sistemas rob´oticos tˆem sido tratadas na lite-

ratura: na primeira, o modelo de um sistema rob´otico ´e considerado completamente conhecido

e utiliz´avel para o controlador (Lewis et al., 1993); na segunda, os parˆametros do modelo s˜ao

desconhecidos e eles s˜ao estimados baseados na propriedade rob´otica de parametriza¸c˜ao linear,

resultados cl´assicos sobre controle adaptativo podem ser vistos em Craig (1985) e Lewis et al.

(1993); e na terceira, o modelo ´e desconhecido e uma abordagem inteligente (baseada em redes

neurais ou l´ogica fuzzy) ´e usada para estimar o modelo (veja, por exemplo, Chang (2000) e

Chang (2005)). Se, em adi¸c˜ao `a incertezas param´etricas, dist´urbios externos est˜ao presentes, a

diﬁculdade para controlar um sistema rob´otico sob estas circunstˆancias aumentam. Uma abor-

dagem interessante para resolver este problema de controle ´e baseado no crit´erio H

∞

n˜ao linear,

que visa atenuar os efeitos de todos dist´urbios no desempenho do sistema.

Controladores H

∞

baseados nas estrat´egias descristas acima s˜ao propostos em Chen et al.

(1994); Wu (1995); Wu et al. (1996); Chen et al. (1997); Chang e Chen (1997); Huang e Jadbabaie

(1998); Chang (2000); Siqueira e Terra (2004); Chang (2005), para robˆos manipuladores. Em

Chen et al. (1994), uma solu¸c˜ao expl´ıcita para o problema de controle H

∞

n˜ao linear, onde

o modelo do manipulador ´e considerado completamente conhecido, ´e desenvolvida baseada na

Teoria dos Jogos (TJ) (em Postlethwaite e Bartoszewicz (1998) uma metodologia similar ´eusada

para controlar um manipulador real). Controladores H

∞

n˜ao lineares para sistemas LPVs, que

tˆem sido aplicados em robˆos manipuladores (veja por exemplo Siqueira e Terra (2004)), podem

ser vistos em Wu (1995); Wu et al. (1996); Huang e Jadbabaie (1998).

Um algoritmo de controle adaptativo H

∞

n˜ao linear ´e proposto em Chen et al. (1997), onde

um projeto de controle robusto de acompanhamento de trajet´oria considera que os parˆametros

desconhecidos podem ser aprendidos por uma lei cl´assica de adapta¸c˜ao atualiz´avel. Controles

adaptativos H

∞

n˜ao lineares baseados em t´ecnicas inteligentes podem ser vistos em Chang e

Chen (1997), Chang (2000) e Chang (2005). Redes neurais e l´ogica fuzzy s˜ao empregadas para

estimar todo o modelo dinˆamico do robˆo. Uma abordagem interessante desenvolvida em Ge et al.

(1998) usa um controlador adaptativo baseado no modelo nominal e em redes neurais, sendo que

as redes neurais s˜ao usadas somente para estimar as incertezas param´etricas do sistema rob´otico.

Vale destacar que este controlador n˜ao utiliza um crit´erio de desempenho robusto, semelhante

ao crit´erio H

∞

por exemplo.

Poucos trabalhos tˆem sido apresentados com t´ecnicas de controle H

∞

direcionados a RMRs.

Hwang et al. (2004) propuseram uma combina¸c˜ao de um controlador baseado na cinem´atica e um

controlador H

∞

robusto baseado na dinˆamica para acompanhamento de trajet´oria. A solu¸c˜ao

proposta em Hwang et al. (2004) resulta em matrizes constantes do controlador, n˜ao leva em

considera¸c˜ao a natureza variante dos parˆametros do robˆo. J´a em dos Reis (2005), equa¸c˜oes

dinˆamicas de um RMR s˜ao descritas na forma quase-LPV. Um controlador baseado no modelo

cinem´atico, proposto em Kanayama et al. (1990), ´e utilizado para gerar as velocidades desejadas

para as rodas e controladores robustos baseados no modelo dinˆamico s˜ao projetados levando em

considera¸c˜ao as varia¸c˜oes param´etricas do robˆo.

Neste trabalho, que complementa os resultados obtidos em dos Reis (2005); Ge et al. (1998);

Chang (2005), ´e feito um estudo comparativo, utilizando resultados experimentais de um RMR,

entre dois controladores H

∞

apresentados em dos Reis (2005), quatro controladores robustos

baseados em t´ecnicas inteligentes e um controlador Proporcional Derivativo mais torque calcu-

lado. Os controladores robustos baseados em t´ecnicas inteligentes, utilizam redes neurais e o

modelo fuzzy Takagi Sugeno (T-S) (Takagi e Sugeno, 1985) para estimar todo o modelo nominal

do RMR ou para aprender apenas as incertezas do modelo nominal.

1.2.3 Localiza¸c˜ao usando vis˜ao computacional

A determina¸c˜ao da postura de RMRs ´euma´area de pesquisa de destaque para a imple-

menta¸c˜ao dos controladores, pois uma boa precis˜ao da posi¸c˜ao e dire¸c˜ao ´e de fundamental

importˆancia para o funcionamento do sistema.

Os sensores mais utilizados s˜ao os encoders (por exemplo Oriolo et al. (2002); Sarkar et al.

(1994)), sonares (Bozma e Kuc, 1994) ou a uni˜ao destes dois (Corradini et al., 2003). A utiliza¸c˜ao

de cˆameras est´a sendo largamente pesquisada, sendo que elas podem ser embarcadas (Lee et al.,

2004), como em vis˜ao omnidirecional que produzem imagens de 360

do ambiente (Yagi et al.,

1994), ou externas como em Gupta et al. (2005); Liu et al. (2004), na qual a cˆamera ﬁca em

cima de um campo de atua¸c˜ao (vis˜ao global).

Posi¸c˜oes em imagens 2D podem ser obtidas com extra¸c˜ao de caracter´ısticas como pontos,

linhas, ´areas ou formas geom´etricas. Um procedimento para detec¸c˜ao aproximada de c´ırculos e

arcos em imagens monocrom´atica (escala em n´ıveis de cinza) foi mostrado em Kimme e Sklansky

(1975), fazendo primeiro uma extra¸c˜ao de bordas e depois aplicando a Transformada de Hough

com matrizes tridimensionais de acumuladores. Ho e Chen (1995) utilizaram simetria geom´etrica

para encontrar c´ırculos/elipses em imagens ap´os aplicar um processo de extra¸c˜ao de bordas. Um

m´etodo para detec¸c˜ao de caracter´ısticas geom´etricas (linhas, c´ırculos e elipses) foi proposto por

McLaughlin e Alder (1998) e comparado com a transformada de Hough.

Para um RMR seguir um caminho desenhado na superf´ıcie, Bianchi et al. (2001) utilizaram

uma cˆamera de v´ıdeo colorida sobre a ´area de movimenta¸c˜ao do robˆo(vis˜ao global). A iden-

tiﬁca¸c˜ao da posi¸c˜ao, dire¸c˜ao e caminho a seguir s˜ao encontrados particionando a imagem em

regi˜oes de cores de pixels usando a t´ecnica de imposi¸c˜oes de limiares.

Luca et al. (2002) utilizaram a informa¸c˜ao visual de uma cˆamera no teto para identiﬁcar a

posturadeumRMR.Emcimadorobˆo foi criada uma superf´ıcie de cor preta com trˆes LEDs

localizados nos v´ertices de um triˆangulo is´osceles. O m´etodo consiste primeiro em tornar bin´aria

a imagem monocrom´atica capturada, depois aplica-se um operador dilata¸c˜ao (Sonka et al.,

1998) e extra¸c˜ao das regi˜oes de luminosidades dos LEDs e por ´ultimo as posi¸c˜oes dos v´ertices do

triˆangulo s˜ao encontradas por um algoritmo baseado na rela¸c˜ao das distˆ

ancias entre as posi¸c˜oes

candidatas a v´ertices. Portanto, a posi¸c˜ao ser´aumdosv´ertices e a dire¸c˜ao dada por rela¸c˜oes

trigonom´etricas.

Este trabalho utiliza para a localiza¸c˜ao de um RMR real o m´etodo da Transformada de

Hough Circular (THC), mostrado em Sonka et al. (1998). O m´etodo ´e baseado na determina¸c˜ao

de centros de c´ırculos de imagens monocrom´aticas obtidas da parte superior do RMR. A deter-

mina¸c˜ao da postura est´a apresentada no Cap´ıtulo 4.2.

1.3 Disposi¸c˜ao dos cap´ıtulos

No Cap´ıtulo 2 ´e descrita a modelagem completa, cinem´atica e dinˆamica, do robˆom´ovel, o

controle cinem´atico proposto por Kanayama et al. (1990) para obter as velocidades angulares

desejadas, dadas a postura atual e a trajet´oria de referˆencia.

No Cap´ıtulo 3 ´e abordado o projeto de dois controladores robustos baseados no modelo

dinˆamico usando t´ecnicas de controle H

∞

para RMRs e quatro controladores robustos usando

t´ecnicas de controle H

∞

, redes neurais e modelo fuzzy T-S.

No Cap´ıtulo 4 s˜ao mostrados o RMR, o sistema de vis˜ao computacional, o ambiente de

controle de RMR e os resultados experimentais do controle do RMR.

No Cap´ıtulo 5 s˜ao apresentadas as conclus˜oes.

Cap´ıtulo 2

Modelagem do RobˆoM´ovel

Neste cap´ıtulo, a cinem´aticaeomodelodinˆamicodeumRMRs˜ao apresentados. A geometria

do robˆo´e mostrada na Fig. 2.1, sendo (X,Y ) o sistema de coordenadas inercial; (X

) o sistema

Figura 2.1: Geometria do RMR.

de coordenadas local; a o comprimento do robˆo; d adistˆancia entre P

e P

; b adistˆancia entre

uma roda atuada e o eixo de simetria do robˆo; r o raio das rodas atuadas; α oˆangulo (dire¸c˜ao do

robˆo) entre o eixo X e o eixo de simetria do robˆo no sentido anti-hor´ario; θ

e θ

os deslocamentos

angulares das rodas direita e esquerda, respectivamente.

Amodelagemdorobˆo apresentada a seguir est´a baseada em Coelho (2001) e dos Reis (2005).

2.1 Modelo cinem´atico

O RMR mostrado na Fig. 2.1 apresenta trˆes restri¸c˜oes cinem´aticas (Coelho e Nunes, 2003).

Assume-se que o robˆon˜ao pode deslizar, ou seja, movimentar-se na dire¸c˜ao do eixo das rodas

atuadas. A velocidade de P

deve estar na dire¸c˜ao do eixo de simetria (eixo X

), assim, a

primeira restri¸c˜ao com respeito a P

´e dada por

˙y

cos α − ˙x

sen α − d ˙α =0,

sendo (x

) as coordenadas do centro de massa P

no sistema de coordenadas inercial, e α o

ˆangulo entre o eixo de simetria do robˆo e o eixo X. As outras duas restri¸c˜oes est˜ao relacionadas

com a rota¸c˜ao das rodas, ou seja, as rodas atuadas n˜ao podem girar em falso,

˙x

cos α +˙y

sen α + b ˙α − r

=0,

˙x

cos α +˙y

sen α − b ˙α − r

=0.

Deﬁnindo q =[q

], q

=[x

α]

e q

=[θ

]

,ent˜ao as trˆes restri¸c˜oes podem ser

escritas na forma

A(q)˙q =

⎡

⎢

⎣

−sen α cos α −d 00

−cos α −sen α −br0

−cos α −sen α b 0 r

⎤

⎥

⎦

˙q =0.

A matriz A(q) tem posto completo e pode ser expressa como [A

(q)

(3×3)

2(3×2)

], tal que

(q)´en˜ao singular e S(q)=[−A

−1

(q)A

(2×2)

]

cujas colunas s˜aooespa¸co nulo de A(q),

ou seja, A(q)S(q)=0. Ent˜ao encontra-se

S(q)=

⎡

⎢

⎣

c(b cos α−d sen α) c(b cos α+d sen α)

c(b sen α+d cos α) c(b sen α−d cos α)

c −c

⎤

⎥

⎦

sendo c = r/(2b). A equa¸c˜ao cinem´atica ´e dada por

˙q(t)=S(q)˙q

(t) (2.1)

˙x

= c(b cos α − d sen α)

+ c(b cos α + d sen α)

, (2.2)

˙y

= c(b sen α + d cos α)

+ c(b sen α −d cos α)

, (2.3)

˙α = c(

−

). (2.4)

2.2 Controlador baseado na cinem´atica

Nesta se¸c˜ao, ´e apresentado o controlador baseado na cinem´aticapropostoporKanayama

et al. (1990), que gera as velocidades desejadas para o problema de acompanhamento de tra-

jet´oria de referˆencia de RMRs. Considere o erro q

=[x

]

, entre a postura de referˆencia

=[x

,α

]

,eaposturarealdoRMRP

=[x

,α]

, dada por

= cosα(x

− x

)+senα(y

− y

= −senα(x

− x

)+cosα(y

− y

= α

− α,

(2.5)

sendo [x

]

= q

a trajet´oria de referˆencia escolhida e α

= tan

−1

(˙y

/ ˙x

). As velocidades

desejadas linear (v

) e angular (w

) de um RMR s˜ao dadas por

= v

cos α

+ k

= w

+ v

+ k

sen α

(2.6)

sendo k

constantes,



(˙x

)

+(˙y

)

e w

=˙α

. (2.7)

No Cap´ıtulo 3, os controladores baseados no modelo dinˆamico do robˆos˜ao resolvidos consi-

derando as velocidades angulares desejadas das rodas, ˙q

.Ent˜ao, ´e necess´ario deﬁnir a rela¸c˜ao

de velocidades que segue

˙q

⎡

⎣

⎤

⎦

⎡

⎣

1/r b/r

1/r −b/r

⎤

⎦

⎡

⎣

⎤

⎦

, (2.8)

sendo

as velocidades angulares desejadas das rodas direita e esquerda, respectivamente.

2.3 Modelo dinˆamico

As equa¸c˜oes dinˆamicas de RMRs usando a teoria de Lagrange ´e descrita por Coelho e Nunes

(2003) como

M(q)¨q + C(q, ˙q)˙q = Eτ − A

(q)λ, (2.9)

sendo λ =[λ

]

o vetor de restri¸c˜oes de for¸ca; E =[0

(2×3)

(2×2)

]

a matriz da entrada;

τ =[τ

]

o vetor de entrada (torque nas rodas);

C(q, ˙q)=

⎡

⎢

⎣

00md ˙α cos α 00

00md ˙α sen α 00

00000

⎤

⎥

⎦

a matriz de for¸cas de Coriolis e centr´ıpeta; e

M(q)=

⎡

⎢

⎣

m 0 md sen α 00

0 m −md cos α 00

md sen α −md cos α I 00

00 0I

00 00I

⎤

⎥

⎦

amatrizdein´ercia. Os parˆametros m e I s˜ao dados por

m = m

+2m

e I = I

+2m

+ b

)+2I

+ m

sendo m

a massa de cada roda atuada mais o rotor do motor; m

a massa da plataforma do

robˆo; I

o momento de in´ercia da plataforma do robˆoemrela¸c˜ao ao eixo vertical em P

; I

momento de in´ercia de cada roda com o rotor em rela¸c˜ao ao eixo da roda e I

o momento de

in´ercia em rela¸c˜ao ao eixo deﬁnido no plano da roda (perpendicular ao eixo da roda).

Cap´ıtulo 3

Controle H

∞

N˜ao Linear

Uma vez encontradas as velocidades desejadas do robˆo(v

e ω

) utilizando o controlador

cinem´atico e posteriormente as velocidades angulares desejadas das rodas (

), torna-se

poss´ıvel aplicar t´ecnicas de controle H

∞

ao modelo dinˆamico para obter os torques a serem

aplicados `as rodas para o acompanhamento da trajet´oria de referˆencia. Neste cap´ıtulo, ser˜ao

apresentados os dois controladores H

∞

n˜ao lineares mostrados em dos Reis (2005). Dois contro-

ladores robustos baseados em redes neurais e em modelo fuzzy Takagi Sugeno (T-S) que estimam

todo o modelo nominal do RMR. E duas abordagens utilizando t´ecnicas de controle baseadas

em modelo nominal do RMR e em inteligˆenica artiﬁcial. Neste caso, redes neurais e l´ogica fuzzy

s˜ao utilizadas para estimar somente as incertezas do modelo nominal.

3.1 Formula¸c˜ao do problema

Omodelodinˆamico mostrado na Se¸c˜ao 2.3 ´e descrito em espa¸co de estado na forma quase

linear a parˆametros variantes (quase-LPV), ou seja, os parˆametros das matrizes do sistema

dependem dos estados. Diferenciando (2.1) com respeito ao tempo, tem-se

¨q =

S(q)˙q

+ S(q)¨q

. (3.1)

Substituindo (3.1) e (2.1) na equa¸c˜ao (2.9) e multiplicando por S

`a esquerda, obt´em-se

¨q

+ C

(˙q

)˙q

= S

Eτ = τ. (3.2)

Incertezas param´etricas s˜ao introduzidas em (3.2) dividindo as matrizes de parˆametros M

e C

(˙q

) em uma parte nominal e uma parte perturbada

= M

+ΔM

(˙q

)=C

(˙q

)+ΔC

(˙q

)

sendo M

uma matriz sim´etrica constante, n˜ao singular, dada por S(q)

M(q)S(q)eC

(˙q)=

(˙α)=C

(˙q

)=S(q)

C(q, ˙q)S(q)+S(q)

M(q)

S(q). Note que nesta passagem desaparece a

matriz de restri¸c˜ao que estava presente no termo A

λ da equa¸c˜ao dinˆamica, pois S

=0(A

est´anoespa¸co nulo de S). Acrescentando um dist´urbio de torque w =[w

]

e substituindo

(2.4) na equa¸c˜ao (3.2) segue que

¨q

= A(˙q

)˙q

+ Bτ + Bw, (3.3)

sendo A(˙q

)=−M

−1

(˙q

)eB = M

−1

. Somando e subtraindo ¨q

e A(˙q

)˙q

em (3.3), (sendo

que ‘d’ sobrescrito signiﬁca valor desejado) e deﬁnindo o estado como

x =

⎡

⎣

q

⎤

⎦

⎡

⎢

⎣

−

− θ

⎤

⎥

⎦

a representa¸c˜ao quase-LPV, em espa¸co de estado, para o controle de acompanhamento de tra-

jet´oria do RMR ´e dada por

x =

⎡

⎣

A(˙q

I 0

⎤

⎦

x +

⎡

⎣

⎤

⎦

u +

⎡

⎣

⎤

⎦

w (3.4)

sendo

u = −¨q

+ A(˙q

)˙q

+ Bτ,

τ = B

−1

(¨q

− A(˙q

)˙q

+ u). (3.5)

Considere agora a seguinte transforma¸c˜ao de estado

x =

⎡

⎣

0 I

⎤

⎦

⎡

⎣

q

⎤

⎦

, (3.6)

sendo T

, T

∈

2×2

matrizes constantes a serem determinadas. Assume-se que a matriz T

´e diagonal, de maneira a facilitar escolhe-se T

= t

I. Aplicando a transforma¸c˜ao de estado

(3.6) em (3.4), obt´em-se

x = T

−1

⎡

⎣

A(˙q

I 0

⎤

⎦

−1

x + T

−1

⎡

⎣

⎤

⎦

u + T

−1

⎡

⎣

⎤

⎦

= T

−1

⎡

⎣

A(˙q

−1

−T

−1

⎤

⎦

x

+ T

−1

⎡

⎣

−1

A(˙q

− T

−1

⎤

⎦

x + T

−1

⎡

⎣

⎤

⎦

u + T

−1

⎡

⎣

⎤

⎦

= T

−1

⎡

⎣

A(˙q

−1

−T

−1

⎤

⎦

x + T

−1

⎡

⎣

˜q

− A(˙q

˜q

− T

¨q

+ T

A(˙q

)˙q

+ T

Bτ

⎤

⎦

+ T

−1

⎡

⎣

−1

⎤

⎦

= T

−1

⎡

⎣

A(˙q

−1

−T

−1

⎤

⎦

x

+ T

−1

⎡

⎣

−1

⎤

⎦

[−M

(¨q

− T

−1

˜q

) − C

(˙q

)(˜q

− T

−1

˜q

)+τ)]

+ T

−1

⎡

⎣

−1

⎤

⎦

Deﬁnindo

(˙q

)=T

−1

⎡

⎣

−M

−1

(˙q

−1

−T

−1

⎤

⎦

, (3.7)

= T

−1

⎡

⎣

−1

⎤

⎦

, (3.8)

d = M

−1

(w − ΔF

)), (3.9)



˙q

)

(˙q

)

(¨q

)



, (3.10)

)=M

(¨q

− T

−1

˜q

)+C

(˙q

)( ˙q

− T

−1

˜q

) e (3.11)

ΔF

)=ΔM

(¨q

− T

−1

˜q

)+ΔC

(˙q

)( ˙q

− T

−1

˜q

). (3.12)

obt´em-se

˜x = A

(˙q

)˜x + B

(−F

)+τ)+B

d. (3.13)

3.2 Controle H

∞

n˜ao linear via representa¸c˜ao quase-LPV

Com a equa¸c˜ao em espa¸co de estado formulada na representa¸c˜ao quase-LPV (o parˆametro

ρ em fun¸c˜ao do estado, ou seja, ρ = ρ(x) resultante do modelo dinˆamico (2.9)), o controle

∞

para sistemas LPV pode ser aplicado a RMRs, gerando um controlador n˜ao linear baseado

na dinˆamica. A lei de controle n˜ao linear apresentada a seguir ´e baseada em Desigualdades

Matriciais Lineares (DMLs). Trata-se de uma lei de controle por realimenta¸c˜ao de estado u =

F (ρ)x que estabiliza o sistema em malha fechada garantindo que um ganho L

entre o dist´urbio

easa´ıda seja limitado por um n´ıvel de atenua¸c˜ao γ>0.

3.2.1 Ganho L

para sistemas n˜ao lineares variantes no tempo

Considere um sistema n˜ao linear variante no tempo com entrada de dist´urbio aﬁm w ∈

sa´ıda controlada z ∈

˙x = f(x, t)+g(x, t)w,

z = h(x, t)+k(x, t)w,

(3.14)

sendo f(0,t)=0eh(0,t) = 0 para todo t ∈ [0,T], e x ∈

o estado. Assume-se que f(x, t),

g(x, t), h(x, t)ek(x, t)s˜ao fun¸c˜oes continuamente diferenci´aveis em rela¸c˜ao a x econt´ınuas em

t. O sistema (3.14) possui ganho L

≤ γ no intervalo [0,T]se



z(t)

dt ≤ γ



w(t)

dt, (3.15)

para todo T ≥ 0 e todo w ∈L

(0,T) com o sistema iniciando em x(0) = 0. Para sistemas

lineares invariantes no tempo, a condi¸c˜ao de ganho L

≤ γ corresponde `a condi¸c˜ao da norma

∞

da fun¸c˜ao de transferˆencia entre a entrada de dist´urbio e a sa´ıda controlada ser limitada

por γ,ouseja,T

(s)

∞

≤ γ.

3.2.2 S´ıntese do controle H

∞

para sistemas LPV por realimenta¸c˜ao do estado

O problema consiste no controle por realimenta¸c˜ao de estado dependente de parˆametro para

estabilizar o sistema em malha fechada e fazer a norma L

menor que um n´ıvel de desempenho

especiﬁcado γ. Considere o problema de s´ıntese do controle por realimenta¸c˜ao do estado

˙x = A(ρ(t))x + B

(ρ(t))w + B

(ρ(t))u

= C

(ρ(t))x

= C

(ρ(t))x + u

(3.16)

sendo x ∈

o estado, u ∈

a entrada de controle, w ∈

odist´urbio de entrada, z

∈

as sa´ıdas, A(·), B

(·), B

(·), C

(·)eC

(·) matrizes cont´ınuas de dimens˜oes apropriadas

e ρ(t) ∈ F

deﬁnido por



ρ∈C

(

, 

):ρ(t)∈P, ˙ρ

≤ν

,i=1,...,m



sendo P ⊂

um conjunto compacto e ν =[ν

···ν

]

com ν

≥ 0.

Deﬁni¸c˜ao 3.2.1 (Wu, 1995) O problema de realimenta¸c˜ao de estado dependente de parˆametro,

para o sistema LPV (3.16), ´e resolvido se existir uma fun¸c˜ao Z ∈ C

(

n×n

) eumaF ∈

(

×

, 

×n

) tais que para todo ρ(t) ∈ P e ˙ρ

≤ν

, i =1, 2, ..., s, Z(ρ) > 0 e

⎡

⎣

(ρ, ˙ρ)Z(ρ)+Z(ρ)A

(ρ, ˙ρ)+



i=1



∂Z

∂ρ



+ C

(ρ, ˙ρ)C(ρ, ˙ρ) Z(ρ)B

(ρ)

(ρ)Z(ρ) −γ

⎤

⎦

< 0, (3.17)

sendo A

(ρ, ˙ρ):=A(ρ)+B

(ρ)F (ρ, ˙ρ),C(ρ, ˙ρ):=C

(ρ)+D

F (ρ, ˙ρ) e D

=[0I]

Se o problema de realimenta¸c˜ao de estado dependente de parˆametro (3.17) tem solu¸c˜ao,

ent˜ao a lei de controle u = F (ρ(t))x estabilizar´a exponencialmente o sistema em malha fechada

e garantir´aqueanormaL

induzida seja menor que γ. O seguinte teorema fornece uma condi¸c˜ao

de existˆencia para o controlador de realimenta¸c˜ao de estado expresso em DMLs para o sistema

LPV em malha aberta (3.16).

Teorema 3.2.1 (Wu, 1995) Dado um conjunto compacto P ∈

,umn´ıvel de desempenho

γ>0 e o sistema (3.16), o problema de realimenta¸c˜ao de estado tem solu¸c˜ao se e somente se

existir uma fun¸c˜ao X ∈ C

(

n×n

) tal que para todo ρ ∈ P , X(ρ) > 0 e

⎡

⎢

⎣

E(ρ) X(ρ)C

(ρ) B

(ρ)

(ρ)X(ρ) −I 0

(ρ)0−γ

⎤

⎥

⎦

< 0, (3.18)

sendo

E(ρ)=−



i=1



∂X

∂ρ





A(ρ)X(ρ)+X(ρ)



A(ρ)

− B

(ρ)B

(ρ)



A(ρ)=A(ρ) − B

(ρ)C

(ρ).

Este teorema fornece um ganho F (ρ) de realimenta¸c˜ao de estado tal que

u = −(B

(ρ)

−1

(ρ)+C

(ρ))x, (3.19)

garante que o sistema em malha tenha ganho L

≤ γ para toda varia¸c˜ao param´etrica ρ(t) ∈ F

O resultado acima ´e uma generaliza¸c˜ao natural da teoria de controle H

∞

para sistemas linea-

res. Uma fun¸c˜ao de Lyapunov dependente de parˆametros na forma V (x, t)=x

(t)X

−1

(ρ(t))x(t)

´e assumida. Como resultado, deve-se resolver as DMLs param´etricas (3.18) que ´e um problema

de otimiza¸c˜ao convexo com dimens˜ao inﬁnita.

3.2.3 Considera¸c˜oes computacionais

Um esquema computacional pr´atico (Wu, 1995; Wu et al., 1996; Huang e Jadbabaie, 1998;

Siqueira e Terra, 2004) pode ser utilizado para resolver as desigualdades matriciais lineares

presentes na an´alise e s´ıntese dos problemas LPV. Por simplicidade, considere o problema de en-

contrar X(ρ(t)) na Equa¸c˜ao (3.18). Primeiro, escolha um conjunto de fun¸c˜oes C

, {f

(ρ(t))}

i=1

como base para X(ρ), ou seja,

X(ρ(t)) =



i=1

(ρ(t))X

, (3.20)

sendo X

∈ S

n×n

a matriz coeﬁciente para f

(ρ(t)). Se X(ρ(t)) em (3.18) ´e substitu´ıda por (3.20),

o problema de realimenta¸c˜ao do estado transforma-se no seguinte problema de otimiza¸c˜ao

min

}

i=1

sujeito a

⎡

⎢

⎣

∗

(ρ)



j=1

(ρ)X

(ρ) B

(ρ)



j=1

(ρ)X

−I 0

(ρ)0−γ

⎤

⎥

⎦

< 0,



j=1

(ρ)X

> 0, (3.21)

sendo

∗

(ρ)=−



i=1

⎛

⎝



j=1

∂f

∂ρ

⎞

⎠



j=1

(ρ)(



A(ρ)X

+ X



A(ρ)

) − B

(ρ)B

(ρ).

Note que (3.21) s˜ao DMLs em termos das vari´aveis matriciais {X

}

i=1

que devem ser satis-

feitas para todo parˆametro ρ(t)emP . Para resolver este problema de otimiza¸c˜ao de dimens˜ao

inﬁnita, divide-se o conjunto de parˆametros P em N pontos {ρ

}

k=1

em cada dimens˜ao. Ent˜ao

calcula-se as DMLs acima para estes pontos. Desde que (3.18) consiste em 2

v´ınculos, um

total de (2

+1)N

desigualdades matriciais aﬁns em termos das M vari´aveis matriciais {X

}

devem ser resolvidas. E



±(·) indica que toda combina¸c˜ao +(·)e−(·) deve ser satisfeita.

Uma aproxima¸c˜ao da densidade de pontos particionados, N, que garante uma solu¸c˜ao global

das DMLs ´e dada em Wu (1995); Wu et al. (1996).

Este esquema computacional possui algumas limita¸c˜oes. O n´umero de parˆametros conside-

rados e o n´umero de divis˜oes N devem ser escolhidos tais que a solu¸c˜ao seja alcan¸cada em um

n´umero de itera¸c˜oes realiz´aveis. Outro problema ´e a falta de justiﬁcativa te´orica na escolha das

fun¸c˜oes base para X(ρ). Geralmente, escolhem-se fun¸c˜oes similares `as encontradas nas matrizes

de estado A(ρ(t)) (Apkarian e Adams, 1998).

3.3 Controle H

∞

n˜ao linear via Teoria dos Jogos (TJ)

Nesta se¸c˜ao, o controle H

∞

n˜ao linear proposto em Chen et al. (1994) ´e aplicado aos RMRs

onde se leva em considera¸c˜ao a equa¸c˜ao em espa¸co de estado da dinˆamica do erro de ordem

reduzida (3.4). O termo de incertezas ΔF

), associado a um dist´urbio no torque w,forma

odist´urbio combinado d deﬁnido em (3.13). Escolhendo a entrada de controle como sendo

u = T

(−F

)+τ), o torque aplicado pode ser calculado como

τ = F

)+T

−1

u. (3.22)

Considerando a dinˆamica do erro de acompanhamento, (3.13), o crit´erio de desempenho que

inclue um n´ıvel de atenua¸c˜ao de dist´urbio desejado γ ´e deﬁnido como

min

u(·)∈L

max

0=d(·)∈L



∞



x

(t)Qx(t)+

(t)Ru(t)





∞



(t)d(t)



≤ γ

, (3.23)

sendo Q e R matrizes de pondera¸c˜ao sim´etricas deﬁnidas positivas e x(0) = 0 . Este crit´erio de

desempenho ´e semelhante ao apresentado em (3.15), sendo que neste caso matrizes de pondera¸c˜ao

s˜ao acrescentadas no estado e na entrada de controle.

Asolu¸c˜ao do problema de controle H

∞

(3.23) relacionado `a equa¸c˜ao de estado (3.4), pode

ser explicitamente encontrada pela teoria dos jogos diferenciais (Basar e Bernhard, 1990; Basar

e Olsder, 1982) e uma escolha apropriada da fun¸c˜ao de Lyapunov V (x, t) (Chen et al., 1994).

A metodologia apresentada por Chen et al. (1994) para resolver este problema ´e resumida a

seguir. O crit´erio de desempenho (3.23) pode ser modiﬁcado para formar o seguinte problema

minimax

min

u(·)∈L

max

0=d(·)∈L



∞



x

(t)Qx(t)+

(t)Ru(t) −

(t)d(t)



dt ≤ 0,

com x(0) = 0. Deﬁnindo a fun¸c˜ao custo

J(x(t),u,d,t)=



∞

L(x(s),u(s),d(s))ds,

sendo L(x, u, d) o Lagrangiano dado por

L(x, u, d)=

x

(t)Qx(t)+

(t)Ru(t) −

(t)d(t).

Deﬁnindo-se a fun¸c˜ao de Lyapunov

V (x(t),t)=min

u(·)

max

d(·)

J(x(t),u,d,t),

o crit´erio de desempenho (3.23) ﬁca

V (x(0), 0) = min

u(·)

max

d(·)

J(x(0),u,d,0) ≤ 0,

com x(0) = 0. De acordo com a teoria dos jogos diferenciais, a solu¸c˜ao deste problema minimax

´e encontrada se existir uma fun¸c˜ao de Lyapunov continuamente diferenci´avel V (x, t) que satisfaz

a seguinte equa¸c˜ao minimax de Bellman-Isaacs

−

∂V (x, t)

∂t

=min

u(·)

max

d(·)



L(x, u, d)+



∂V (x, t)

∂x



x



com condi¸c˜ao terminal V (x(∞), ∞) = 0. Escolhendo a fun¸c˜ao de Lyapunov da forma

V (x, t)=

x

P (x, t)x, (3.24)

sendo P uma matriz sim´etrica deﬁnida positiva para todo t, a equa¸c˜ao de Bellman-Isaacs fornece

a seguinte equa¸c˜ao de Riccati

P + PA

+ A

P − PB



−1

−



P + Q =0.

O controle ´otimo correspondente e o pior caso de dist´urbio s˜ao dados, respectivamente, por

∗

= −R

−1

P x

∗

P x.

Com uma escolha apropriada da matriz P e sendo a matriz (C

(˙q

) −

)anti-sim´etrica

(Chen et al., 1994), a equa¸c˜ao de Riccati pode ser simpliﬁcada para uma equa¸c˜ao matricial

alg´ebrica. De acordo com Chen et al. (1994); Johansson (1990) uma escolha apropriada para P

´e feita em fun¸c˜ao de M

, T

e uma matriz K sim´etrica deﬁnida positiva a ser determinada, ou

seja,

P = T

⎡

⎣

0 K

⎤

⎦

. (3.25)

A equa¸c˜ao alg´ebrica simpliﬁcada ´e dada por

⎡

⎣

0 K

K 0

⎤

⎦

− T

[I 0]



−1

−



[I 0]T

+ Q =0. (3.26)

O controle ´otimo e o pior dist´urbio podem ser reescritos, respectivamente como

∗

= −R

−1

[I 0]T

x (3.27)

∗

[I 0]T

x.

A condi¸c˜ao terminal ´e satisfeita para esta escolha de P , (Chen et al., 1994).

3.4 Controle H

∞

n˜ao linear baseado em modelo fuzzy

Takagi Sugeno

Nesta se¸c˜ao, duas abordagens de controle robusto baseadas em l´ogica fuzzy ser˜ao aplicadas

em RMRs, seguindo as linhas desenvolvidas em Ge et al. (1998); Chang (2000, 2005) . Duas

hip´oteses ser˜ao consideradas: na primeira, os termos das equa¸c˜oes (3.11) e (3.12) F

ΔF

)s˜ao considerados desconhecidos e na segunda F

)´e considerado conhecido e apenas

as incertezas ΔF

)s˜ao consideradas desconhecidas.

Para o primeiro caso, onde os termos F

)eΔF

)domodelodoRMRs˜ao considerados

desconhecidos, um modelo fuzzy T-S

F (x

, Θ), formado por um conjunto de modelos fuzzy, ´e

proposto para estimar ambos os termos.

Em geral, um sistema fuzzy consiste de quatro partes: um fuzziﬁcador, uma base de regras,

um procedimento de inferˆencia e um defuzziﬁcador. O fuzziﬁcador ´eummapeamentodouniverso

de discurso de entrada U ⊂ R

dos conjuntos fuzzy deﬁnidos em U. Dois fatores determinam a

interface de fuzziﬁca¸c˜ao: (i) o n´umero de conjuntos fuzzy deﬁnidos no universo de discurso de

entrada e (ii) as fun¸c˜oes de pertinˆencia relacionadas com esses conjuntos.

A base de regras ´e formada por um conjunto de proposi¸c˜oes lingu´ısticas do tipo

SE premissas s˜ao satisfeitas,

ENT

AO conseq¨uˆencias s˜ao inferidas.

Om´etodo de T-S ´e caracterizado por uma base de regras que utiliza conseq¨uentes funcionais ao

inv´es de conseq¨uentes fuzzy, na forma

SE u

´e A

e u

´e A

e ...e u

´e A

ENT

AO y

= p

+ p

+ ...+ p

SE u

´e A

e u

´e A

e ...e u

´e A

ENT

AO y

= p

+ p

+ ...+ p

sendo A

, j =1,...,r e i =1,...,k,vari´aveis lingu´ısticas referentes aos conjuntos fuzzy

deﬁnidos sobre os espa¸cos de entrada U

, U

, ..., U

; u

, u

, ..., u

valores das vari´aveis de

entrada e k on´umero de regras fuzzy.

O procedimento de inferˆencia ´eal´ogica da tomada de decis˜ao que aplica as regras fuzzy para

determinar a sa´ıda correspondente `as entradas fuzziﬁcadas. A sa´ıda inferida pelo sistema fuzzy

atr´av´es do m´etodo de T-S ´e crisp (portanto n˜ao necessita de um defuzziﬁcador), deﬁnida pela

m´edia ponderada das sa´ıdas y

de cada subsistema linear

y =



i=1



i=1

= ψθ, (3.28)

sendo

ψ =[β

,...,β

,...,u



i=1

θ =[p

,...,p

]

os parˆametros os quais deﬁnem as fun¸c˜oes de conseq¨uˆencias y

= f(˜x) para cada regra e μ

´e o grau de liberdade da i-´esima regra, deﬁnido como o m´ınimo entre os graus de pertinˆencia

associados `as entradas nos conjuntos fuzzy ativados pela i-´esima regra:

:= A

) ∧ A

) ∧ ...∧ A

). (3.29)

O modelo fuzzy T-S,

F (x

, Θ), proposto para estimar F

)eΔF

), ´e deﬁnido como

segue

F (x

, Θ) = Y (˜x, A(˜x), Θ) = [y

,...,y

]

⎡

⎢

⎣

,θ

)

,θ

)

⎤

⎥

⎦

⎡

⎢

⎣

⎤

⎥

⎦

⎡

⎢

⎣

0 ... 0

0 ψ

00... ψ

⎤

⎥

⎦

⎡

⎢

⎣

⎤

⎥

⎦

=Ψ(x

)(˜x, A(˜x))Θ, (3.30)

sendo Y o conjunto de sistemas fuzzy, ˜x s˜ao as entradas fuzzy, A(˜x):=[A

(˜q) A

(

˜q)] representa

os conjuntos fuzzy deﬁnidos para as entradas de fuzziﬁca¸c˜ao e n on´umero de atuadores rob´oticos,

que para o caso do RMR s˜ao dois (atuadores da roda direita e esquerda).

Considere uma regi˜ao de restri¸c˜ao Ω

de parˆametros Θ. Para garantir que o parˆametro

estimado

Θ(t) para todo t esteja dentro da regi˜ao de restri¸c˜ao, um algoritmo de proje¸c˜ao pode

ser usado. Considere Ω

= {Θ:Θ

Θ ≤ N } eΩ

=Θ:{Θ

Θ ≤ N +Δ} para algum N>0e

Δ > 0. De acordo com Chang (2000), deﬁne-se

Proj[Φ] =

⎧

⎪

⎨

⎪

⎩

Φ, se Θ

Θ ≤ N ou

(Θ

Θ >NeΘ

Φ ≤ 0)

Φ−

(Θ

Θ−N)Θ

δΘ

Θ, caso contr´ario

(3.31)

para alguma fun¸c˜ao suave Φ(x

). Assume-se que exista um valor Θ



∈ Ω

tal que

F (x

, Θ



)pode

aproximar F (x

)omaispr´oximo poss´ıvel. Ummododealcan¸car o desempenho H

∞

, quando

a rede neural ´eusada,´e considerar o erro de aproxima¸c˜ao, ΔF (x

F (x

, Θ



) − F (x

), como

dist´urbio. Essa abordagem foi usada em Chang e Chen (1997), onde o termo dinˆamico do robˆo

F (x

)´e aproximado por uma rede neural.

Em virtude do erro de aproxima¸c˜ao incluir os efeitos de incertezas dinˆamicas, a integra¸c˜ao

do termo quadr´atico na prova da estabilidade para a garantia do crit´erio H

∞

se torna mais com-

plexa. Em Chang (2000) a solu¸c˜ao desse problema tem sido obtida com a utiliza¸c˜ao da t´ecnica

de controle por estrutura vari´avel (CEV), cujos detalhes podem ser vistos nessa referˆencia.

A utiliza¸c˜ao do CEV requer que o erro de aproxima¸c˜ao deva ser limitado por uma fun¸c˜ao

dependente do estado, isto ´e, exite uma fun¸c˜ao k(x

) > 0 tal que |(ΔF (x

))

|≤k(x

), para todo

1 ≤ i ≤ n.

Levando em conta o erro de aproxima¸c˜ao m´ınimo ΔF (x

), a equa¸c˜ao dinˆamica do erro com

respeito a ˜x pode ser obtida como

˜x = A

(˙q

)˜x + B

(−Ψ(x

)Θ

∗

+ΔF (x

)+τ)+B

d, (3.32)

com d = M

−1

w.Opr´oximo teorema apresenta uma s´ıntese de um controlador adaptativo

∞

baseado em modelo fuzzy T-S, considerando a estimativa completa do modelo do RMR. A

provadoteoremaabaixo´e similar ao apresentado em Chang (2000).

Teorema 3.4.1 Considere o sistema rob´otico descrito em (2.9) com d ∈L

[0, ∞). Dado um

n´ıvel de atenua¸c˜ao γ>0 e uma matriz de pondera¸c˜ao Q = Q

> 0, se existirem uma matriz

sim´etrica deﬁnida positiva K = K

> 0 e uma matriz T

satisfazendo a equa¸c˜ao alg´ebrica de

Riccati

⎡

⎣

0 K

K 0

⎤

⎦

− T

[I 0]



−1

−



[I 0]T

+ Q = 0 (3.33)

sendo R a matriz de ganho tal que R<γ

I,ent˜ao a lei de controle adaptativo H

∞

baseado em

modelo fuzzy T-S ´e dada por

τ =Ψ(x

)Θ + T

−1

u + u

(3.34)

com

Θ=Proj[−H

−1

Ψ(x

)

[I 0]T

˜x], (3.35)

u = −R

−1

[I 0]T

˜x, (3.36)

= −k(x

)sgn(T

[I 0]T

˜x), (3.37)

sendo H o ganho adaptativo e sgn(T

[I 0]T

˜x)

=[sgn((T

[I 0]T

˜x)

) ...sgn((T

[I 0]T

˜x)

)]

Esta lei de controle garante que todas as vari´aveis do sistema em malha fechada (2.9, 3.34-3.37)

s˜ao limitadas e que a seguinte desigualdade ´e satisfeita





˜x

Q˜x + u



dt ≤ ˜x

(0)P

˜x(0) +

(0)H

Θ(0) + γ



d)dt.

Prova 1 Considere a seguinte equa¸c˜ao de Lyapunov

V (˜x,

Θ,t)=

˜x

P ˜x +

Θ (3.38)

Tomando a derivada de V em rela¸c˜ao ao tempo, obt´em-se

V (˜x,

Θ,t)=

˜x

P ˜x +

˜x

P ˜x +

˜x

˜x +

Θ+

Θ. (3.39)

Substituindo (3.32) em (3.39), tem-se

V (˜x,

Θ,t)=

˜x

P ˜x +

˜x

(˙q

)+[B

(−Ψ(x

)Θ

∗

+ΔF (x

)+τ)+B

P ˜x (3.40)

˜x

P [A

(˙q

)˜x + B

(−Ψ(x

)Θ

∗

+ΔF (x

)+τ)+B

d]+

Θ.

Usando o controlador (3.34) e deﬁnindo

=Θ− Θ

∗

, a derivada de

V torna-se

V (˜x,

Θ,t)=

˜x

(

P + A

(˙q

)P + PA

(˙q

))˜x +˜x

(u + d)

+˜x

+ΔF (x

)) + ˜x

Ψ(x

)

Θ+

Θ. (3.41)

Considerando N =(C

(˙q

) −

) anti-sim´etrica para todo t,amatrizP deﬁnida como em

(3.25) e manipulando o termo A

(˙q

)P + PA

(˙q

) de (3.41), obt´em-se

(˙q

)P + PA

(˙q

)=T

⎡

⎣

0 K

⎤

⎦

−1

⎡

⎣

−M

−1

(˙q

−1

−T

−1

⎤

⎦

+ T

⎡

⎣

−M

−1

(˙q

) T

−1

0 −T

−1

⎤

⎦

−T

⎡

⎣

0 K

⎤

⎦

= T

⎡

⎣

−C

(˙q

−1

−KT

−1

⎤

⎦

+ T

⎡

⎣

−C

(˙q

) KT

−1

0 −KT

−1

⎤

⎦

= T

⎡

⎣

−2C

(˙q

) KT

−1

−2KT

−1

⎤

⎦

= T

⎡

⎣

0 KT

−1

−2KT

−1

⎤

⎦

+ T

⎡

⎣

−2C

(˙q

⎤

⎦

⎡

⎣

0 K

K 0

⎤

⎦

+ T

⎡

⎣

−

⎤

⎦

+ T

⎡

⎣

−2N 0

⎤

⎦

. (3.42)

Manipulando o termo PB

, tem-se

= T

⎡

⎣

0 K

⎤

⎦

−1

⎡

⎣

−1

⎤

⎦

= T

[I 0]

. (3.43)

Substituindo (3.42) e (3.43) em (3.41),

V torna-se

V =

˜x

⎧

⎨

⎩

⎡

⎣

⎤

⎦

⎡

⎣

0 K

K 0

⎤

⎦

+ T

⎡

⎣

−

⎤

⎦

+ T

⎡

⎣

−2N 0

⎤

⎦

⎫

⎬

⎭

˜x

+˜x

[I 0]

(u + d)+˜x

[I 0]

+ΔF (x

))

+˜x

[I 0]

Ψ(x

)

Θ+

Θ. (3.44)

ComoamatrizN ´e anti-sim´etrica, o termo quadr´atico que inclui a matriz N ´e zero, desse

modo (3.44) torna-se

V (˜x,

Θ,t)=

˜x

⎡

⎣

0 K

K 0

⎤

⎦

˜x +˜x

[I 0]

(u + d)+˜x

[I 0]

+ΔF (x

))

+˜x

[I 0]

Ψ(x

)

Θ+

Θ. (3.45)

Avaliando o termo ˜x

[I 0]

+ΔF (x

)) e a lei de controle (3.37), observa-se que

˜x

[I 0]

= −˜x

[I 0]

k(x

)sgn(T

[I 0]T

˜x)

= −



(˜x

[I 0]

)

+ ...+(˜x

[I 0]

)



k(x

)sgn

⎡

⎢

⎣

(˜x

[I 0]

)

(˜x

[I 0]

)

⎤

⎥

⎦

= −k(x

)[(˜x

[I 0]

)

sgn((˜x

[I 0]

)

)+...

+(˜x

[I 0]

)

sgn((˜x

[I 0]

)

)]

= −k(x

)



|(˜x

[I 0]

)

| + ...+ |(˜x

[I 0]

)



= −k(x

)



p=1

|(˜x

[I 0]

)

|, (3.46)

e que

˜x

[I 0]

ΔF (x



(˜x

[I 0]

)

...(˜x

[I 0]

))



⎡

⎢

⎣

(ΔF (x

))

(ΔF (x

))

⎤

⎥

⎦

=(˜x

[I 0]

)

(ΔF (x

))

+ ...+(˜x

[I 0]

)

(ΔF (x

))

≤|(˜x

[I 0]

)

(ΔF (x

))

+ ...+(˜x

[I 0]

)

(ΔF (x

))

≤|(˜x

[I 0]

)

(ΔF (x

))

| + ...+ |(˜x

[I 0]

)

(ΔF (x

))

= |(˜x

[I 0]

)

||(ΔF (x

))

| + ...+ |(˜x

[I 0]

)

||(ΔF (x

))



p=1

|(ΔF (x

))

||(˜x

[I 0]

)

| (3.47)

Levando-se em considera¸c˜ao (3.46) e (3.47), obt´em-se a seguinte desigualdade

˜xT

[I 0]

+ΔF (x

)) (3.48)

≤−k(x

)



i=1

|(˜x

[I 0]

)

| +



i=1

|(ΔF (x

))

||(˜x

[I 0]

)

= −k(x

)|(˜x

[I 0]

)

| + |(ΔF (x

))

||(˜x

[I 0]

)

| + ...+

− k(x

)|(˜x

[I 0]

)

| + |(ΔF (x

))

||(˜x

[I 0]

)

=[|(ΔF (x

))

|−k(x

)] |(˜x

[I 0]

)

| + ...

+[|(ΔF (x

))

|−k(x

)] |(˜x

[I 0]

)

| (3.49)

Levando em considera¸c˜ao a suposi¸c˜ao de CEV, |(ΔF (x

))

|≤k(x

) para todo 1 ≤ p ≤ n,

ent˜ao pode se garantir que

˜xT

[I 0]

+ΔF (x

))

≤−k(x

)



p=1

|(˜x

[I 0]

)

| +



p=1

|(ΔF (x

))

||(˜x

[I 0]

)

|≤0.

(3.50)

Substituindo (3.33) e (3.50) em (3.45), obt´em-se

V (˜x,

Θ,t)=−

˜x

Q˜x −

Ru −

˜x

[I 0]

[I 0]T

˜x +˜x[I 0]

+˜x

[I 0]

Ψ(x

)

Θ+

Θ. (3.51)

Somando e subtraindo

d em 3.51 e sabendo que

−



[I 0]T

˜x −γd





[I 0]T

˜x −γd



= −

˜x

[I 0]

[I 0]T

˜x

+˜xT

[I 0]

d −

d, (3.52)

t´em-se

V (˜x,

Θ,t) ≤−



[I 0]T

˜x −γd





[I 0]T

˜x −γd



(3.53)

−

˜x

Q˜x −

Ru +

d +˜x

[I 0]

Ψ(x

)

Θ+

Θ.

Desde que

Θ=

Θ e usando o algoritmo de proje¸c˜ao

V (˜x,

Θ,t) ≤−

˜x

Q˜x −

Ru +

d. (3.54)

Integrando a inequa¸c˜ao acima de t =0para t = T , resulta

V (˜x(T ),

Θ(T ),T) − V (˜x(0),

Θ(0), 0)

≤−



(˜x

Q˜x)dt −



Ru)dt +



d)dt. (3.55)

Desde que V (

x(T ),

Θ(T ),T) ≥ 0, a inequa¸c˜ao acima resulta





˜x

Q˜x + u



dt ≤ ˜x

(0)P

˜x(0) +

(0)H

Θ(0) + γ



d)dt. (3.56)

Al´em disso, desde que d ∈L

[0, ∞), ou seja, existe uma constante ﬁnita M

> 0 tal que



d)dt ≤ M

, a inequa¸c˜ao (3.55) tamb´em implica que

V (˜x(T ),

Θ(T ),T) ≤ V (˜x(0),

Θ(0), 0) +

< ∞. (3.57)

Isto implica que todos os estados e sinais do sistema de malha fechada s˜ao limitados.



Se considerarmos agora a hip´otese de que se conhece o modelo nominal do RMR e apenas

as incertezas do robˆo ser˜ao estimadas pelo modelo fuzzy T-S, a equa¸c˜ao dinˆamica do erro passa

a ser escrita da seguinte forma

˜x = A

(˙q

)˜x + B

(−F

) − Ψ(x

)Θ

∗

+ΔF (x

)+τ)+B

d, (3.58)

com d = M

(q)T

−1

(q)w. A lei de controle adaptativo H

∞

baseadonomodelomatem´atico

do sistema nominal do RMR e no modelo fuzzy T-S ´e semelhante ao controlador apresentado

no Teorema 3.4.1 sendo que apenas o torque do controlador ´e reescrito da seguinte forma

τ = F

)+Ψ(x

)Θ + T

−1

u + u

. (3.59)

Perceba que o modelo fuzzy T-S apenas complementa o modelo nominal F

3.5 Controle H

∞

n˜ao linear baseado em redes neurais

Nesta se¸c˜ao, as duas abordagens de controle robusto utilizadas na se¸c˜ao anterior baseadas

em l´ogica fuzzy ser˜ao agora aplicadas em RMRs com base em redes neurais, seguindo as linhas

desenvolvidas em Ge et al. (1998); Chang (2000, 2005). Ambas as hip´oteses ser˜ao adotadas

novamente: primeiro consideram-se os termos das equa¸c˜oes (3.11) e (3.12) F

)eΔF

)

desconhecidos e em seguida F

)´e considerado conhecido e apenas as incertezas ΔF

)s˜ao

consideradas desconhecidas.

Para o primeiro problema, onde os termos F

)eΔF

)domodelodoRMRs˜ao consi-

derados desconhecidos, uma rede neural

F (x

, Θ), formada por um conjunto de redes neurais, ´e

proposta para estimar ambos os termos.

Deﬁnem-se n redes neurais ξ

, k =1, ··· ,n, compostas de neurˆonios n˜ao lineares em todas

as camadas escondidas e neurˆonios lineares nas camadas de entrada e sa´ıda, com parˆametros

ajust´aveis Θ

na camada de sa´ıda (Chang, 2000; Chang e Chen, 1997), Fig. 3.1. As sa´ıdas das

redes neurais s˜ao da forma



i=1

⎛

⎝



j=1

+ m

⎞

⎠

(3.60)

com

⎡

⎢

⎣





j=1

+ b







j=1

+ b



⎤

⎥

⎦

, Θ

⎡

⎢

⎣

⎤

⎥

⎦

sendo p

on´umero de neurˆonios da camada escondida. Os pesos w

eobiasb

para 1 ≤ i ≤ p

1 ≤ j ≤ 5n e1≤ k ≤ n s˜ao assumidos constantes e especiﬁcados pelo projetista e H(.)´e

escolhida como sendo uma fun¸c˜ao tangente hiperb´olica

H(z)=

− e

−z

+ e

−z

Desse modo, a rede neural completa pode ser denotada por

F (x

, Θ) =

⎡

⎢

⎣

, Θ

)

, Θ

)

⎤

⎥

⎦

⎡

⎢

⎣

⎤

⎥

⎦

⎡

⎢

⎣

0 ... 0

0 ξ

00... ξ

⎤

⎥

⎦

⎡

⎢

⎣

⎤

⎥

⎦

=ΞΘ. (3.61)

Considere o algoritmo de proje¸c˜ao (3.31) e assuma que exista um valor de parˆametro Θ



∈ Ω

tal que

F (x

, Θ



)podeaproximarF (x

)omaispr´oximo poss´ıvel. Seja ΔF (x

F (x

, Θ



) −

F (x

), sem perda de generalidade assuma que exista uma fun¸c˜ao k(x

) > 0 tal que |(ΔF (x

))

|≤

k(x

), para todo 1 ≤ p ≤ n.

Comessassuposi¸c˜oes, o problema de controle H

∞

n˜ao linear baseado em redes neurais para

sistemas rob´oticos pode ser formulado como segue: dado um n´ıvel de atenua¸c˜ao γ, encontre um

Figura 3.1: Rede Neural.

controlador adaptativo baseado em redes neurais com realimenta¸c˜ao de estado

τ =ΞΘ+T

−1

u + u

(3.62)

com

Θ=Proj[−Z

−1

[I 0]T

˜x] (3.63)

u = −R

−1

[I 0]T

˜x (3.64)

= −k(x

)sgn(T

[I 0]T

˜x) (3.65)

tal que o seguinte ´ındice de desempenho seja satisfeito





˜x

Q˜x + u



dt ≤ ˜x

(0)P ˜x(0) +

(0)Z

Θ(0) + γ



d)dt, (3.66)

sendo Q = Q

> 0,R = R

> 0,P = P

> 0eZ = Z

> 0, matrizes de pondera¸c˜ao.

Θ=Θ− Θ

∗

denota o erro de estimativa dos parˆametros neurais. O termo u

em (3.62) ´e

o controle CEV, usado para eliminar o efeito do erro de aproxima¸c˜ao. Veja que em (3.62) o

termo ΞΘ ´e respons´avel pela estimativa de F

)eΔF

). De maneira similar `as solu¸c˜oes da

matriz P apresentadas nos controladores robustos fuzzy descritos na se¸c˜ao anterior, a solu¸c˜ao

deste controlador ´e dada pela seguinte equa¸c˜ao de Riccati

P + PA

+ A

P + PB



−1

−



P + Q = 0 (3.67)

que por sua vez pode ser simpliﬁcada para uma equa¸c˜ao alg´ebrica

⎡

⎣

0 K

K 0

⎤

⎦

− T

[I 0]



−1

−



[I 0]T

+ Q = 0 (3.68)

sendo P redeﬁnida como

P = T

⎡

⎣

0 K

⎤

⎦

Considerando o controlador H

∞

n˜ao linear baseado no modelo matem´atico do robˆo, que

representa F

), e em redes neurais, para estimar o termo ΔF

), vale a seguinte formula¸c˜ao:

dado um n´ıvel de atenua¸c˜ao γ, encontre um controlador adaptativo baseado em modelo e em

redes neurais com realimenta¸c˜ao de estado

τ = F

) + ΞΘ + T

−1

u + u

(3.69)

com

Θ=Proj[−Z

−1

[I 0]T

˜x] (3.70)

u = −R

−1

[I 0]T

˜x (3.71)

= −k(x

)sgn(T

[I 0]T

˜x) (3.72)

tal que o seguinte ´ındice de desempenho seja satisfeito





˜x

Q˜x + u



dt ≤ ˜x

(0)P ˜x(0) +

(0)Z

Θ(0) + γ



d)dt, (3.73)

para matrizes de pondera¸c˜ao Q = Q

> 0,R= R

> 0,P = P

> 0, Z = Z

> 0e

Θ=Θ−Θ

∗

denota o erro de estimativa dos parˆametros neurais. O termo u

em (3.69) ´e o controle por

estrutura vari´avel, usado para eliminar o efeito do erro de aproxima¸c˜ao. Veja em (3.69), que o

termo ΞΘ para essa nova vers˜ao do controlador estima toda incerteza n˜ao modelada por F

De maneira similar aos controladores deﬁnidos anteriormente, P ´e uma matriz sim´etrica

deﬁnida positiva cuja solu¸c˜ao ´e dada pela seguinte equa¸c˜ao de Riccati

P + PA

+ A

P + PB



−1

−



P + Q =0. (3.74)

com as simpliﬁca¸c˜oes alg´ebricas equivalentes

⎡

⎣

0 K

K 0

⎤

⎦

− T

[I 0]



−1

−



[I 0]T

+ Q =0. (3.75)

sendo P redeﬁnida como

P = T

⎡

⎣

0 K

⎤

⎦

3.6 Solu¸c˜ao da equa¸c˜ao alg´ebrica de Riccati

A equa¸c˜ao alg´ebrica de Riccati (3.26) pode ser resolvida com

⎡

⎣

0 I

⎤

⎦

K =



− Q



−



+ Q



sendo a matriz R

o resultado da fatoriza¸c˜ao de Cholesky



−1

−



−1

a matriz sim´etrica deﬁnida positiva Q ´e fatorada como

Q =

⎡

⎣

⎤

⎦

e (3.26) fornece quatro equa¸c˜oes distintas

− T



−1

−



=0, (3.76)

K + Q

− T



−1

−



=0, (3.77)

K + Q

− T



−1

−



=0, (3.78)

− T



−1

−



=0. (3.79)

Cap´ıtulo 4

Implementa¸c˜ao

4.1 Robˆom´ovel com rodas

O RMR mostrado na Fig. 4.1 foi desenvolvido pelo Laborat´orio de Sistemas Inteligentes

(LASI) da Universidade de S˜aoPauloemS˜ao Carlos. Este RMR consiste de uma base de

sustenta¸c˜ao, dois motores DC com torque 0.29 N.m acoplados a rodas de borracha, seis pilhas

recarreg´aveis que totalizam 7, 2V e uma placa controladora.

A placa controladora consiste de um microcontrolador, um m´odulo RF (R´adio Frequˆencia)

eumm´odulo de acionamento dos motores.

O microcontrolador escolhido foi o MSP430F169 da Texas que possui as seguintes carac-

ter´ısticas: baix´ıssimo consumo de energia (330 μA no modo Active a 1 MHz e 2,2V; 1,1 μA

no modo Standby; 0,2 μA no modo Oﬀ de reten¸c˜ao da RAM); alimenta¸c˜ao entre 1,8 V a 3,6

V; CPU de 8 MHz com arquitetura RISC de 16 bits; 2048 B de RAM e 60 kB de mem´oria

de programa tipo ﬂash, que pode ser usada para armazenar dados permanentes; 8 canais de

conversor AD de 12 bits; conversor DA de 12 bits; 2 timers de 16 bits com gerador de PWM;

48 terminais (pinos) de entrada/sa´ıda (I/O); 2 interfaces de comunica¸c˜ao serial USART (SPI ou

I2C); DMA; encapsulamento QFP com 64 terminais (pinos). A programa¸c˜ao do MSP430169 ´e

feitanopr´oprio circuito da placa controladora do robˆo diretamente de um computador, atrav´es

de uma interface padr˜ao JTAG.

Om´odulo de RF utiliza transceiver DR3000-1 da marca RF Monolithics (RFM). Foi desen-

volvido tamb´em uma placa de interface da serial do computador com o transceiver DR3000-1,

desse modo possibilitando a comunica¸c˜ao via r´adio do computador com o RMR.

Figura 4.1: Foto do robˆom´ovel.

Om´odulo de acionamento dos motores, consiste de um circuito integrado L293D, tamb´em da

Texas que controla dois motores nos dois sentidos. O L293D trata-se de um circuito integrado

contendo 4 meias ponte H, ou seja, 2 pontes H completas (2 canais). Possui capacidade m´axima

de corrente de sa´ıda de 600 mA por canal e opera cargas com tens˜ao entre 4,5 V e 36 V.

Os parˆametros nominais do RMR da Fig. 4.1 s˜ao a =0.17(m), b =0.065(m), d =

0.01(m), r =0.028(m), m

=0.075(kg), m

=0.597(kg) e momentos de inercias I

0.0022938(kg.m

), I

=0.000375(kg.m

) e I

=3.6788 × 10

−7

(kg.m

4.2 Sistema de vis˜ao computacional

A localiza¸c˜ao do robˆo´e feita encontrando a posi¸c˜ao de centros de c´ırculos em etiquetas

ﬁxadas sobre o robˆo em imagens bi-dimensionais monocrom´aticas, como mostrado em dos Reis

(2005), que ser˜ao adquiridas atrav´es de um sistema de vis˜ao computacional que consiste de uma

camera COHU H10x8M-II com resolu¸c˜ao de 320 x 240 pixels e uma placa de aquisi¸c˜ao PXC200F

com taxa de processamento de 30 quadros/seg. Para o m´etodo de detec¸c˜ao de c´ırculos da Se¸c˜ao

4.2.1, deﬁne-se a conven¸c˜ao utilizada para processamento de imagens, como mostrado na Fig. 4.2,

sendo L on´umero de linhas e C on´umero de colunas da imagem digital, f(i, j) a intensidade

do n´ıvel de cinza da imagem na coordenada (i, j)comf(i, j) ∈{0, 1, 2, 3, 4, ..., 254, 255}, sendo

o valor 0 representando a cor preta e 255 a branca.

Figura 4.2: Conven¸c˜ao: (a) imagem cont´ınua, (b) imagem digital.

4.2.1 Transformada de Hough circular

Esta se¸c˜ao mostra um m´etodo para encontrar o centro de circunferˆencias de raio ﬁxo, R.

Para isto utiliza-se uma m´ascara que tamb´em ´e uma circunferˆencia de raio R, cuja fun¸c˜ao ´e

atualizar os valores de uma matriz de dimens˜ao (L +2R) × (C +2R) deﬁnida como matriz

acumuladora.

Om´etodo Transformada de Hough Circular, mostrado em Sonka et al. (1998), consiste em

posicionar o centro da m´ascara nos pixels da circunferˆencia da imagem e os valores dos pixels

nas posi¸c˜oes correspondentes `a circunferˆencia da m´ascara na matriz acumuladora (inicialmente

zerada) s˜ao incrementadas de uma unidade. A Fig. 4.3b ilustra bem o m´etodo,

Figura 4.3: Transformada de Hough circular: (a) imagem, (b) matriz acumuladora.

sendo as circunferˆencias de linhas cont´ınuas a contribui¸c˜ao da m´ascara, os losangos em

negrito os pixels da circunferˆencia da imagem considerada e o c´ırculo em negrito a regi˜ao de

maior contribui¸c˜ao.

Ap´os percorrer toda a imagem a matriz acumuladora estar´a totalmente atualizada, e, por-

tanto, a posi¸c˜ao do pixel de maior valor, denotada por f

max

(i, j), ser´a considerada o centro da

circunferˆencia na matriz acumuladora e conseq¨uentemente o centro da circunferˆencia na imagem

ser´a dado por

i = i − R

j = j − R.

O algoritmo 4.1 mostra como encontrar a postura de um robˆo usando a THC.

Algoritmo 4.1 Seq¨uˆencia de passos para encontrar centros de circunferˆencias em imagem

usando a THC e determinar a postura de um RMR

1 - Coloque sobre o robˆotrˆes etiquetas de circunferˆencias de raio R (cor branca, por exemplo,

para um campo de atua¸c˜ao de cor escura), tais que a m´edia das duas posi¸c˜oes dos

centros das duas circunferˆencias, localizadas no fundo do robˆo, seja o ponto P

e a outra

circunferˆencia localizada no eixo de simetria, na frente do robˆo, bem afastada das outras

duas;

2 - Calibre o sistema capturando uma imagem e veriﬁcando o menor valor dos pixels per-

tencentes `as circunferˆencias;

3 - A cada quadro de imagem capturada, veriﬁcar quais os pixels s˜ao supostamente per-

tencentes `as circunferˆencias (Valor do n´ıvel de cinza maior ou igual ao menor valor

encontrado na calibra¸c˜ao) e atualizar a matriz acumuladora, conforme apresentada an-

teriormente;

4 - Encontre a posi¸c˜ao na matriz acumuladora de maior valor de n´ıvel de cinza f

max

(i, j).

E, portanto, a posi¸c˜ao da primeira circunferˆencia na imagem ser´a(

)=(i −R, j −R);

5 - Zerar uma regi˜ao na matriz acumuladora nas proximidades de (i − R, j − R);

6 - Encontre a posi¸c˜ao na matriz acumuladora de maior valor de n´ıvel de cinza f

max

(i, j).

E, portanto, a posi¸c˜ao da segunda circunferˆencia na imagem ser´a(

)=(i −R, j −R);

7 - Zerar uma regi˜ao na matriz acumuladora nas proximidades de (i − R, j − R);

8 - Encontre a posi¸c˜ao na matriz acumuladora de maior valor de n´ıvel de cinza f

max

(i, j).

E, portanto, a posi¸c˜ao da terceira circunferˆencia na imagem ser´a(

)=(i −R, j −R);

9-Aposi¸c˜ao do robˆo, (x

)=(

), ser´aam´edia entre as posi¸c˜oes dos dois centros

das circunferˆencias mais pr´oximas;

10- A dire¸c˜ao do robˆo ser´a dada pela inclina¸c˜ao da reta que passa por (

)eaposi¸c˜ao

do centro da circunferˆencia mais distante.

4.3 Ambiente de controle de RMR

A interface entre as t´ecnicas de controle desenvolvidas no Capitulo 3 e o robˆom´ovel com

rodas ´e feita atrav´es do ambiente de controle de RMR (ACRMR), que foi desenvolvido em C++.

O ACRMR funciona da seguinte maneira: a aquisi¸c˜ao da imagem atrav´es da cˆamera e localiza¸c˜ao

do robˆo utilizando THC ´e feita em paralelo ao controle do RMR, que gera os torques que s˜ao

transmitidos pela porta serial do computador para a placa de interface do computador com o

r´adio. O sistema de controle de acompanhamento de trajet´oria para RMR pode ser melhor

entendido na Se¸c˜ao 4.4.

O ACRMR possibilita que o usu´ario visualize a imagem da cˆamera em uma janela a parte

Fig. 4.3. Escolha qual controlador deseja utilizar atrav´es da caixa de sele¸c˜ao do controlador.

H´a a possibilidade de alterar os parˆametros nominais do RMR e os ganhos dos controladores na

aba Parˆametros Fig. 4.5. Visualize os gr´aﬁcos referentes ao experimento nas abas Gr´aﬁcos A

Fig. 4.6 e Gr´aﬁcos B Fig. 4.7. A visualiza¸c˜ao dos dados de postura do RMR pode ser obtida na

tela principal. O controle manual do robˆopodeserfeitoviatecladoe,atrav´es do menu arquivo,

´eposs´ıvel conﬁgurar a porta serial do microcomputador e exportar os dados dos experimentos

para arquivos que podem ser lidos pelo Matlab.

Figura 4.4: Imagem da cˆamera visualizando o robˆo.

Figura 4.5: Ambiente de controle de RMR na aba de Parˆametros.

Figura 4.6: Ambiente de controle de RMR na aba de Gr´aﬁco A.

Figura 4.7: Ambiente de controle de RMR na aba de Gr´aﬁco B.

4.4 Experimentos

Os resultados experimentais foram obtidos usando o RMR descrito na Se¸c˜ao 4.1, o sistema

de vis˜ao da Se¸c˜ao 4.2 e o ACRMR da Se¸c˜ao 4.3. A taxa de amostragem foi ajustada para 33 ms,

aqual´e utilizada para aquisi¸c˜ao de imagem do sistema de vis˜ao computacional. Os comandos

de controle s˜ao gerados pelo ACRMR instalado em um computador com processador Pentium

4 de 3.2 GHz e 2GB de mem´oria RAM e s˜ao enviados para o RMR atrav´es de um m´odulo de

r´adio frequˆencia com taxa de transmiss˜ao de 38400 bps.

A trajet´oria de referˆencia ´e deﬁnida por x

=0.0339t e y

=0.1132sen(0.3t), com a condi¸c˜ao

inicial (x

,α

)=(0, 0, 0). Para o controlador baseado na cinem´atica, os ganhos foram

selecionados como k

=0.75, k

= 200 e k

=25.5. Para permitir uma an´alise de robustez dos

controladores, dist´urbios externos (Fig.4.8) foram introduzidos nos torques das rodas da forma

=0.05e

−(t−6)

sen(1.3πt)ew

= −0.15e

−(t−6)

sen(1.3πt).

0 5 10 15 20

−0.15

−0.1

−0.05

0.05

0.1

0.15

Tempo (s)

Distúrbios (N.m)

Figura 4.8: Dist´urbios de torque aplicados `as rodas.

AFig.4.9mostraodiagramadeblocoscompletodaestrat´egia de controle do robˆom´ovel. E a

Fig. 4.10 mostra os controladores baseados na dinˆamica. A Fig. 4.10 (a) mostra os controladores

baseados somente no modelo do RMR, a Fig. 4.10 (b) o controlador robusto baseado em modelo

fuzzy T-S, a Fig. 4.10 (c) o controlador robusto baseado em modelo e em modelo fuzzy T-S,

a Fig. 4.10 (d) o controlador robusto baseado em redes neurais e a Fig. 4.10 (e) o controlador

robusto baseado em modelo e em redes neurais. O controlador Proporcional Derivativo em

conjunto com Torque Calculado (PD + TC) ser´a apresentado na Se¸c˜ao 4.4.7.

Figura 4.9: Sistema de controle de acompanhamento de trajet´oria para robˆos m´oveis.

Figura 4.10: Controladores baseados na dinˆamica

4.4.1 Controle H

∞

n˜ao linear via representa¸c˜ao quase-LPV

AmatrizdosistemaA(˙q

)est´a em fun¸c˜ao apenas das velocidades das rodas ˙q

. Portanto,

no projeto do controlador quase-LPV pode-se considerar como fun¸c˜ao dos erros de velocidades

q

. Assim o parˆametro ρ ´e deﬁnido como ρ(x)=

q

. O conjunto P ´e dado por

−π ≤



≤ π(rad/s)e − π ≤



≤ π(rad/s),

sendo ν =[



max



max

]=[2.5π 2.5π](rad/s

), e P dividido em N = 3 para cada parˆametro



. As fun¸c˜oes base, que s˜ao dependentes dos parˆametros, s˜ao selecionadas da seguinte forma

=10+cos



+sin



+cos



+sin



=cos



+sin



= −sin



+cos



Essas fun¸c˜oes foram selecionadas de maneira a acentuar a inﬂuˆencia da varia¸c˜ao do erro

de velocidade das rodas no c´alculo dos ganhos dos torques. A desigualdade (3.18) ´e resolvida

usando o software MATLAB



[Gahinet et al. (1995)], sendo que em (3.16)

x = x, A(ρ(t)) =

⎡

⎣

q

I 0

⎤

⎦

⎡

⎣

2×2

⎤

⎦

⎡

⎣

⎤

⎦

= I

4×4

e C

=0.

As matrizes X

s˜ao encontradas para o melhor n´ıvel de atenua¸c˜ao γ = 1655 (testes realizados

com as perturba¸c˜oes e incertezas param´etricas) e s˜ao dadas por

=10

−2

⎡

⎢

⎣

1.213 0.132 −1.837 −0.109

0.132 1.213 −0.109 −1.837

−1.837 −0.109 3.040 0.096

−0.109 −1.837 0.096 3.040

⎤

⎥

⎦

=10

−2

⎡

⎢

⎣

−1.214 −0.132 1.841 0.109

−0.132 −1.214 0.109 1.841

1.841 0.109 −3.044 −0.097

0.109 1.841 −0.097 −3.044

⎤

⎥

⎦

=10

−2

⎡

⎢

⎣

1.195 0.127 −1.781 −0.099

0.127 1.195 −0.099 −1.781

−1.781 −0.099 2.978 0.090

−0.099 −1.781 0.090 2.978

⎤

⎥

⎦

Os resultados s˜ao mostrados nas Figs. 4.11 a 4.18.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.11: Acompanhamento de trajet´oria de referˆencia usando o controlador quase-LPV: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.12: Erros de posi¸c˜ao usando o controlador quase-LPV: sem dist´urbio (esquerda) e com

dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.13: Erro de dire¸c˜ao usando o controlador quase-LPV: sem dist´urbio (esquerda) e com

dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.14: Derivada dos erros de posi¸c˜ao usando o controlador quase-LPV: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.15: Derivada do erro de dire¸c˜ao usando o controlador quase-LPV: sem dist´urbio (es-

querda) e com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.16: Velocidade angular da roda direita usando o controlador quase-LPV: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.17: Velocidade angular da roda esquerda usando o controlador quase-LPV: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.18: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador quase-LPV: sem dist´urbio (esquerda) e com dist´urbio (direita).

4.4.2 Controle H

∞

n˜ao linear via Teoria dos Jogos (TJ)

O controlador baseado na TJ ´e caracterizado por um n´ıvel de atenua¸c˜ao γ =66.632. As

matrizes de podera¸c˜ao selecionadas s˜ao Q

= I

(2×2)

, Q

=0.5 × I

(2×2)

, Q

=0eR =10.8 ×

(2×2)

. Os resultados s˜ao mostrados nas Figs. 4.19 e 4.26.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.19: Acompanhamento de trajet´oria de referˆencia usando o controlador TJ: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.20: Erros de posi¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio

(direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.21: Erro de dire¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio

(direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.22: Derivada dos erros de posi¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda)

e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.23: Derivada do erro de dire¸c˜ao usando o controlador TJ: sem dist´urbio (esquerda) e

com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.24: Velocidade angular da roda direita usando o controlador TJ: sem dist´urbio (es-

querda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.25: Velocidade angular da roda esquerda usando o controlador TJ: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.26: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador TJ: sem dist´urbio (esquerda) e com dist´urbio (direita).

4.4.3 Controle H

∞

n˜ao linear baseado em modelo fuzzy Takagi Sugeno

Um conjunto de sistemas fuzzy ´e deﬁnido

Y (˜x, A(˜x), Θ) :=

⎡

⎣

([˜q(1)

˜q(1)],A(˜x), Θ

)

([˜q(2)

˜q(2)],A(˜x), Θ

)

⎤

⎦

sendo y

(.)ey

(.) a estimativa da dinˆamica das rodas direira e esquerda, respectivamente.

Os conjuntos fuzzy A(˜x)s˜ao deﬁnidos para o universo de discurso de erro de deslocamento,

=˜q ∈ U

, e para o universo de discurso de erro de velocidade, u

˜q ∈ U

, na Fig. 4.27.

−3 −2 −1 0 1 2 3

0.2

0.4

0.6

0.8

1.2

Erro de Deslocamento (rad) e Erro de Velocidade (rad/s)

A1 e A2 (Negativo)

A1 e A2 (Zero)

A1 e A2 (Positivo)

Figura 4.27: Conjunto fuzzy A

(˜q) e conjunto fuzzy A

(

˜q)

A base de regra fuzzy ´e dada por

: SE (u

´e A

(Negativo)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Negativo)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Negativo)) e (u

´e A

(Positivo)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Positivo)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Positivo)) ENT

AO y

O controlador H

∞

´e caracterizado por um n´ıvel de atenua¸c˜ao γ =66.632 e k(x

100

√

˜x

˜x.

As matrizes de pondera¸c˜ao selecionadas s˜ao Q

= I

(2×2)

, Q

=0.5 × I

(2×2)

, Q

=0eR =

10.8 ×I

(2×2)

e H = 2000 ×I

(54×54)

. A lei de controle adaptativa para ajustar y

´e implementada

baseada em (3.35).

Os resultados s˜ao mostrados nas Figs. 4.28 a 4.35.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.28: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em

modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.29: Erros de posi¸c˜ao usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.30: Erro de dire¸c˜ao usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.31: Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.32: Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.33: Velocidades angulares da roda direita usando o controlador baseado em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.34: Velocidades angulares da roda esquerda usando o controlador baseado em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.35: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador baseado em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

4.4.4 Controle H

∞

n˜ao linear baseado em modelo e em modelo fuzzy

Takagi Sugeno

Um conjunto de sistemas fuzzy ´e deﬁnido como

Y (˜x, A(˜x), Θ) :=

⎡

⎣

([˜q(1)

˜q(1)],A(˜x), Θ

)

([˜q(2)

˜q(2)],A(˜x), Θ

)

⎤

⎦

sendo y

(.)ey

(.) a estimativa da dinˆamica da roda direira e esquerda, respectivamente. Os

conjuntos fuzzy A(˜x)s˜ao deﬁnidos para o universo de discurso de erro de deslocamento, u

˜q ∈ U

, e para o universo de discurso de erro de velocidades, u

˜q ∈ U

, na Fig. 4.36.

−3 −2 −1 0 1 2 3

0.2

0.4

0.6

0.8

1.2

Erro de Deslocamento (rad) e Erro de Velocidade (rad/s)

A1 e A2 (Negativo)

A1 e A2 (Zero)

A1 e A2 (Positivo)

Figura 4.36: Conjunto fuzzy A

(˜q) e conjunto fuzzy A

(

˜q)

A base de regra fuzzy ´e dada por

: SE (u

´e A

(Negativo)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Negativo)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Negativo)) e (u

´e A

(Positivo)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Zero)) e (u

´e A

(Positivo)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Negativo)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Zero)) ENT

AO y

: SE (u

´e A

(Positivo)) e (u

´e A

(Positivo)) ENT

AO y

O controlador H

∞

´e caracterizado por um n´ıvel de atenua¸c˜ao γ =66.632 e k(x

100

√

˜x

˜x.

As matrizes de pondera¸c˜ao selecionadas s˜ao Q

= I

(2×2)

, Q

=0.5 × I

(2×2)

, Q

=0eR =

10.8 ×I

(2×2)

e H = 2000 ×I

(54×54)

. A lei de controle adaptativa para ajustar y

´e implementada

baseada em (3.35). Os resultados s˜ao mostrados nas ﬁgs. 4.37 a 4.44.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.37: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em

modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.38: Erros de posi¸c˜ao usando o controlador baseado em modelo e em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.39: Erro de dire¸c˜ao usando o controlador baseado em modelo e em modelo fuzzy T-S:

sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.40: Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo e em

modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.41: Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo e em modelo

fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.42: Velocidades angulares da roda direita usando o controlador baseado em modelo e

em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.43: Velocidades angulares da roda esquerda usando o controlador baseado em modelo

e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.44: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador baseado em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio

(direita).

4.4.5 Controle H

∞

n˜ao linear baseado em redes neurais

O controlador H

∞

´e caracterizado por um n´ıvel de atenua¸c˜ao γ =66.632 e k(x

200

√

˜x

˜x.

As matrizes de pondera¸c˜ao selecionadas foram Q

= I

(2×2)

, Q

=0.5 × I

(2×2)

, Q

=0,

R =10.8 × I

(2×2)

e Z = 3000 × I

(14×14)

. A lei de controle adaptativa para ajustar y

´eim-

plementada baseada na Equa¸c˜ao (3.63). Deﬁnem-se

F (x

, Θ) =



, Θ

)

, Θ

)



com p

= 7 neurˆonios na camada escondida, o vetor de bias b

=[ −3 − 2 − 10123]e

a matriz de pesos para a primeira camada Ω

=[ω

]=[ −1 − 1 − 1 − 1111111].

Os parˆametros Θ s˜ao deﬁnidos como

Θ=

⎡

⎣

⎤

⎦

com

=[θ

]

=[θ

]

e a matriz Ξ pode ser calculada como

Ξ=

⎡

⎣

0 ξ

⎤

⎦

com ξ

=[ξ

, ··· ,ξ

]eξ

=[ξ

, ··· ,ξ

Os resultados s˜ao mostrados nas Figs. 4.45 a 4.52.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.45: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em

redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.46: Erros de posi¸c˜ao usando o controlador baseado em redes neurais: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.47: Erro de dire¸c˜ao usando o controlador baseado em redes neurais: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.48: Derivada dos erros de posi¸c˜ao usando o controlador baseado em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.49: Derivada do erro de dire¸c˜ao usando o controlador baseado em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.50: Velocidades angulares da roda direita usando o controlador baseado em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.51: Velocidades angulares da roda esquerda usando o controlador baseado em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.52: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador baseado em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

4.4.6 Controle H

∞

n˜ao linear baseado em modelo e em redes neurais

O controlador H

∞

´e caracterizado por um n´ıvel de atenua¸c˜ao γ =66.632 e k(x

200

√

˜x

˜x.

As matrizes de pondera¸c˜ao selecionadas foram Q

= I

(2×2)

, Q

=0.5 × I

(2×2)

, Q

=0,R =

10.8 × I

(2×2)

e Z = 3000 × I

(14×14)

A lei de controle adaptativa para ajustar y

´e implementada baseada na Equa¸c˜ao (3.70).

Deﬁnem-se Δ

F (x

, Θ) =



, Θ

)Δ

, Θ

)



com p

= 7 neurˆonios na camada

escondida, o vetor de bias b

=[ −3 − 2 − 1 0 1 2 3 ] e a matriz de pesos para a primeira

camada Ω

=[ω

]=[−1 − 1 − 1 − 1111111]. Osparˆametros Θ s˜ao deﬁnidos

como

Θ=

⎡

⎣

⎤

⎦

com

=[θ

]

=[θ

]

e a matriz Ξ pode ser calculada como

Ξ=

⎡

⎣

0 ξ

⎤

⎦

com ξ

=[ξ

, ··· ,ξ

]eξ

=[ξ

, ··· ,ξ

Os resultados s˜ao mostrados nas Figs. 4.53 a 4.60.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.2

0.09

0.11

Ampliação

Figura 4.53: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em

modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.54: Erros de posi¸c˜ao usando o controlador baseado em modelo e em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.55: Erro de dire¸c˜ao usando o controlador baseado em modelo e em redes neurais: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.56: Derivada dos erros de posi¸c˜ao usando o controlador baseado em modelo e em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.57: Derivada do erro de dire¸c˜ao usando o controlador baseado em modelo e em redes

neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.58: Velocidades angulares da roda direita usando o controlador baseado em modelo e

em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.59: Velocidades angulares da roda esquerda usando o controlador baseado em modelo

e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.60: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador baseado em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio

(direita).

4.4.7 Controle proporcional derivativo e torque calculado (PD+TC)

O controle PD consiste de um controle independente para cada roda, dado por

= −[θ

− θ

− [

−

= −[θ

− θ

− [

−

(4.1)

sendo os ganhos proporcionais e derivativos ajustados em K

= K

=50eK

= K

= 100,

tais que os erros de postura sem dist´urbios e incertezas ﬁquem pr´oximos aos dos erros dos

controladores via controle H

∞

. Os torques aplicados ao robˆom´ovel s˜ao obtidos considerando

(3.5), que de fato ´e a equa¸c˜ao conhecida do torque calculado. Os resultados s˜ao mostrados nas

ﬁgs. 4.61 a 4.68.

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

0.05 0.1

0.05

0.1

Ampliação

0 0.1 0.2 0.3 0.4 0.5 0.6

−0.1

−0.05

0.05

0.1

0.15

x(t) (m)

y(t) (m)

Referência

Robô Móvel

Figura 4.61: Acompanhamento de trajet´oria de referˆencia usando o controlador PD + TC: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

0 5 10 15 20

−0.08

−0.06

−0.04

−0.02

0.02

0.04

Tempo (s)

Erro de posição (m)

Figura 4.62: Erros de posi¸c˜ao usando o controlador PD + TC: sem dist´urbio (esquerda) e com

dist´urbio (direita).

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

0 5 10 15 20

−0.8

−0.6

−0.4

−0.2

0.2

0.4

0.6

0.8

Tempo (s)

Erro de direção (rad)

Figura 4.63: Erro de dire¸c˜ao usando o controlador PD + TC: sem dist´urbio (esquerda) e com

dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

0.05

Tempo (s)

Derivadas dos erros de posição (m/s)

˙x

˙y

Figura 4.64: Derivada dos erros de posi¸c˜ao usando o controlador PD + TC: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

0 5 10 15 20

−0.04

−0.03

−0.02

−0.01

0.01

0.02

0.03

0.04

Tempo (s)

Derivada do erro de direção (rad/s)

˙α

Figura 4.65: Derivada do erro de dire¸c˜ao usando o controlador PD: sem dist´urbio (esquerda) e

com dist´urbio (direita).

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

0 5 10 15 20

−3

−2

−1

Tempo (s)

Velocidades angulares da roda direita (rad/s)

Figura 4.66: Velocidades angulares da roda direita usando o controlador PD + TC: sem dist´urbio

(esquerda) e com dist´urbio (direita).

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

0 5 10 15 20

−1

−0.5

0.5

1.5

2.5

Tempo (s)

Velociades angulares da roda direita (rad/s)

Figura 4.67: Velocidades angulares da roda esquerda usando o controlador PD + TC: sem

dist´urbio (esquerda) e com dist´urbio (direita).

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

0 5 10 15 20

0.05

0.1

0.15

0.2

0.25

Tempo (s)

Torques (N.m)

Figura 4.68: Torques τ

e τ

aplicados `as rodas direita e esquerda, respectivamente, usando o

controlador PD +TC: sem dist´urbio (esquerda) e com dist´urbio (direita).

4.4.8 Estudo comparativo

Os controladores foram comparados baseados nos seguintes ´ındices de desempenho

• Norma L

dos erros de posi¸c˜ao e velocidade

[e]=



− t

)



e



sendo e =



˙q



• Energia total

E[τ]=



i=1





τ

dt



sendo t

= 0 at´e t

= 20(s) o tempo de experimento e τ

(t) o torque da roda i (direita ou

esquerda).

Os resultados est˜ao apresentados na Tabela 4.1.

Tabela 4.1:

Indices de desempenho.

Controlador Sem dist´urbios Com dist´urbios

[e] E[τ] L

[e] E[τ ]

∞

N˜ao linear via quase-LPV 0.1585 2.5443 0.1695 2.6500

∞

N˜ao linear via TJ 0.1522 2.5695 0.1607 2.6619

Adap. H

∞

N˜ao linear T-S 0.1523 2.6067 0.1642 2.6797

Adap. H

∞

N˜ao linear modelo + T-S 0.1543 2.6019 0.1588 2.6168

Adap. H

∞

N˜ao linear RN 0.1519 2.6818 0.1649 2.6903

Adap. H

∞

N˜ao linear modelo + RN 0.1524 2.5795 0.1596 2.6215

PD+TC 0.1559 2.5173 0.2833 3.2083

Observa-se na Tabela 4.1 que sem a presen¸ca de dist´urbios, os controladores robustos e o

controlador PD + TC apresentaram resultados equivalentes do ponto de vista do erro acompa-

nhamento de trajet´oria. Vale ressaltar que o controlador PD + TC apresentou melhor economia

de energia. Com a presen¸ca de dist´urbios veriﬁca-se que os controladores robustos apresen-

taram melhores resultados, em ambos os ´ındices utilizados, que o controlador PD + TC. Os

controladores robustos baseados em modelo e em t´ecnicas inteligentes apresentaram melhores

resultados tanto com rela¸c˜ao ao erro de acompanhamento de trajet´oria como na economia de

energia em rela¸c˜ao aos demais controladores robustos. A abordagem utilizando modelo fuzzy

Takagi Sugeno se destacou com rela¸c˜ao a abordagem com redes neurais, nesses experimentos. Os

n´umeros obtidos na Tabela 4.1 est˜ao baseados na m´edia de cinco experimentos realizados com

o RMR. Para generalizar uma poss´ıvel superioridade dos modelos fuzzy com rela¸c˜ao `as redes

neurais para este tipo de problema, h´a certamente a necessidade de mais estudos. Esse ´eum

dos aspectos a serem explorados em trabalhos futuros.

Cap´ıtulo 5

Conclus˜ao

Seis controladores robustos baseados no modelo dinˆamicodeumRMReemt´ecnicas inteli-

gentes, utilizando t´ecnicas de controle H

∞

foram propostos para o problema de acompanhamento

de trajet´oria. Um ambiente de controle de RMRs (ACRMR) foi desenvolvido para realiza¸c˜ao

de experimentos e estudos com RMRs. Um estudo comparativo entre os controladores conside-

rando dist´urbios externos foi realizado. Resultados experimentais tˆem mostrado que ´e bastante

eﬁciente utilizar t´ecnicas inteligentes para estimar apenas a parte incerta do modelo nominal em

sistemas de controle robustos. Principalmente se considerarmos que nas estrat´egias adotadas

para esses controladores h´a garantia de estabilidade do sistema e o crit´erio H

∞

´e satisfeito.

Referˆencias Bibliogr´aﬁcas

Aicardi, M., G. Casalino, A. Bicchi, e A. Balestrino (1995). Closed loop steering of unicycle like

vehicles via lyapunov techniques. IEEE Robotics & Automation Magazine 2 (1), 27–35.

Almeida, J., F. L. Pereira, e J. B. Sousa (1997). A hybrid feedback control system for a

nonholonomic car-like vehicle. In IEEE International Conference on Robotics and Automation,

Volume 3, pp. 2614 – 2619.

Apkarian, P. e R. J. Adams (1998). Advanced gain-scheduling techniques for uncertain systems.

IEEE Transactions on Control Systems Technology 6 (1), 21–32.

Basar, T. e P. Bernhard (1990). H

∞

-Optimal Control and Related Minimax Problems. Berlin:

Birkhauser.

Basar, T. e J. Olsder (1982). Dynamic Noncooperative Game Theory. New York: Academic

Press.

Bianchi,R.A.C.,A.S.Sim˜oes, e A. H. R. Costa (2001). Comportamentos reativos para seguir

pistas em um robˆom´ovel guiado por vis˜ao. Simp´osio Brasileiro de Automa¸c˜ao Inteligente (5,

Canela).

Bloch, A. M. e N. H. McClamroch (1989). Control of mechanical systems with classical nonho-

lonomic constraints. In IEEE Conference on Decision and Control, Volume 1, pp. 201–205.

Bloch, A. M. e N. H. McClamroch (1990). Controllability and stabilizability properties of a

nonholonomic control system. In IEEE Conference on Decision and Control, Volume 3, pp.

1312 – 1314.

Bozma, O. e R. Kuc (1994). A physical model-based analysis of heterogeneous environments

using sonar-endura method. IEEE Transactions on Pattern Analysis and Machine Intelli-

gence 16 (5), 497 – 506.

Brockett, R. W. (1983). Asymptotic stability and feedback stabilization. In Diﬀerential Geo-

metric Control Theory, R. W. Brockett, R. S. Millman and H. J. Sussmann, Boston, MA:

Birkh¨auser, pp. 181–191.

Campion, G., G. Bastin, e B. D’Andr´ea-Novel (1996). Strutural properties and classiﬁcation of

kinematic and dynamic model of wheeled mobile robots. IEEE Transactions on Robotics and

Automation 12 (1), 47–62.

Chang, Y. C. (2000). Neural network-based H

∞

tracking control for robotic systems. IEE

Proceedings of Control Theory Applications 147 (3), 303–311.

Chang, Y. C. (2005). Intelligent robust control for uncertain nonlinear time-varying systems

and its application to robotic systems. IEEE Transactions on Systems, Man and Cybernetics

- Part B: Cybernetics 35 (6), 1108–1119.

Chang, Y. C. e B. S. Chen (1997). A nonlinear adaptive H

∞

tracking control design in robotic

systems via neural networks. IEEE Transactions on Control Systems Technology 5 (1), 13–29.

Chen, B. S., Y. C. Chang, e T. C. Lee (1997). Adaptive control in robotic systems with H

∞

tracking performance. Automatica 33 (2), 227–234.

Chen, B. S., T. S. Lee, e J. H. Feng (1994). A nonlinear H

∞

control design in robotic systems un-

der parameter perturbation and external disturbance. International Journal of Control 59 (2),

439–461.

Coelho, P. (2001). Aplica¸c˜ao de lagrangianos na dinˆamica de robˆos m´oveis com rodas. Technical

Report, No. ISR-LCIR-2001/01 (Instituto de sistemas e rob´otica), Universidade de Coimbra,

Portugal.

Coelho, P. e U. Nunes (2003). Lie algebra application to mobile robot control: A tutorial.

Robotica 21, 483 – 493.

Corradini, M. L., G. Ippoliti, e S. Longhi (2003). Neural networks based conrol of mobile robots:

Development and experimental validation. journal of Robotic Systems 20 (10), 587–600.

Craig, J. (1985). Adaptive Control of Mechanical Manipulators. Addison-Wesley.

Do, K. D., Z. P. Jiang, e J. Pan (2004). Simultaneous tracking and stabilization of mobile robots:

an adaptive approach. IEEE Transactions on Automatic Control 49 (7), 1147 – 1151.

dos Reis, G. A. (2005). Controle H

∞

n˜ao linear de robˆos m´oveis com rodas. Disserta¸c˜ao de

Mestrado, Escola de Engenharia de S˜ao Carlos, Universidade de S˜ao Paulo, S˜ao Carlos. 2005.

Fukao, T., H. Nakagawa, e N. Adachi (2000). Adaptive tracking control of a nonholonomic

mobile robot. IEEE Transactions on Robotics and Automation 16 (5), 609 – 615.

Gahinet, P., A. Nemiroviski, A. J. Laub, e M. Chilali (1995). LMI Control Toolbox. The

MathWorks Inc.

Ge, S. S., T. H. Lee, e C. J. Harris (1998). Adaptive Neural Network Control of Robotic Mani-

pulators. Singapore: World Scientiﬁc.

Gupta, G. S., C. H. Messom, e S. Demidenko (2005). Real-time identiﬁcation and predictive con-

trol of fast mobile robots using global vision sensing. IEEE Transactions on Instrumentation

and Measurement 54 (1), 200 – 214.

Ho, C. T. e L. H. Chen (1995). A fast ellipse/circle detector using geometric symmetry. Pattern

Recognition 28 (1), 117–124.

Huang, Y. e A. Jadbabaie (1998). Nonlinear H

∞

control: An enhanced quasi-lpv approach. In

IEEE International Conference on Decision and Control, 37, Tampa, Florida, USA. Workshop

in H

∞

nonlinear control by J. C. Doyle, Caltech.

Hwang, C. K., B. S. Chen, e Y. T. Chang (2004). Combination of kinematical and robust dyna-

mical controllers for mobile robotics tracking control: (i) optimal H

∞

control. In Proceedings

IEEE International Conference on Control Applications, pp. 1205–1210.

Ji, M., Z. Zhang, G. Biswas, e N. Sarkar (2003). Hybrid fault adaptive control of a wheeled

mobile robot. IEEE/ASME Transactions on Mechatronics 8 (2), 226 – 233.

Jiang, Z.-P. e H. Nijmeijer (1999). A recursive technique for tracking control of nonholonomic

systems in chained form. IEEE Transactions on Automatic Control 44 (2), 265 – 279.

Johansson, R. (1990). Quadratic optimization of motion coordination and control. IEEE Tran-

sactions on Automatic Control 35 (11), 1197–1208.

Kanayama, Y., Y. Kimura, F. Miyazaki, e T. Noguchi (1990). A stable tracking control method

for an autonomous mobile robot. In Proceedings IEEE International Conference on Robotics

and Automation, pp. 384 – 389.

Kimme, C. e J. Sklansky (1975). Finding circles by an array of accumulators. Communication

of the ACM 18(2), 120–122.

Krstic, M., I. Kanellakopoulos, e P. Kokotovic (1995). Nonlinear and Adaptive Control Design.

John Wiley and Sons, Inc., 605 Third Aveneu, New York, NY.

Lee, P., T. Dean, A. Yap, D. Walter, L. Kitchen, e N. Barnes (2004). On-board vision using

visual-servoing for robocup f-180 league mobile robots. ROBOCUP 2003: ROBOT SOCCER

WORLD CUP VII LECTURE NOTES IN COMPUTER SCIENCE 3020 , 422–433.

Lee, T.-C., K.-T. Song, C.-H. Lee, e C.-C. Teng (2001). Tracking control of unicycle-modeled

mobile robots using a saturation feedback controller. IEEE Transactions on Control Systems

Technology 9 (2), 305 – 318.

Lewis, F. L., C. T. Abdallah, e D. M. Dawson (1993). Control of robot manipulators. New York:

Macmillan.

Liu, H., H. Zha, e F. Lin (2004). Competition analysis system for soccer robots based on

global vision and trajectory restrictions. IEEE International Conference on Systems, Man

and Cybernetics 6, 5296 – 5300.

Luca, A. D., G. Oriolo, L. Paone, e P. R. Giordano (2002). Experiments in visual feedback

control of a wheeled mobile robot. In IEEE Conference on Robotics and Automation, pp.

2073–2078.

McLaughlin, R. A. e M. D. Alder (1998). The hough transform versus the upwrite. IEEE

Transactions on Pattern Analysis and Machine Intelligence 20 (4), 396–400.

M’Closkey, R. T. e R. M. Murray (1997). Exponential stabilization of driftless nonlinear control

systems using homogeneous feedback. Automatic Control, IEEE Transactions on 42 (5), 614

– 628.

Morin, P. e C. Samson (2000). Practical stabilization of a class of nonlinear systems. application

to chain systems and mobile robots. In IEEE Conference on Decision and Control, Volume 3,

pp. 2989 – 2994.

Oriolo, G., A. D. Luca, e M. Vendittelli (2002). Wmr control via dynamic feedback linearization:

Design, implementation, and experimental validation. IEEE Transactions Control Systems

Technology 10 (6), 835–852.

Postlethwaite, I. e A. Bartoszewicz (1998). Application of non-linear H

∞

control to the tetrabot

robot manipulator. Proceedings of the Institution of Mechanical Engineers - Part I - Journal

of Systems and Control Engineering 212 (16), 459–465.

Samson, C. (1995). Control of chained systems application to path following and time-varying

point-stabilization of mobile robots. IEEE Transactions on Automatic Control 40 (1), 64–77.

Sarkar, N., X. Yun, e V. Kumar (1994). Control of mechanical systems with rolling constraints:

Application to dynamic control of mobile robots. Int. J. Rob. Res. 13 (1), 55–69.

Siqueira, A. A. G. e M. H. Terra (2004). Nonlinear and markovian H

∞

controls of underactuated

manipulators. IEEE Transaction on Control Systems Technology 12 (6), 811–826.

Sonka, M., V. Hlavac, e R. Boyle (1998). Image Processing, Analysis, and Machine Vision.

Wiley Inter Science.

Takagi, T. e M. Sugeno (1985). Fuzzy identiﬁcation of systems and its applications to modeling

and control. IEEE Transactions on Systems, Man and Cybernetics 15, 116–132.

Vendittelli, M. e G. Oriolo (2000). Stabilization of the general two-trailer system. In IEEE

International Conference on Robotics and Automation, Volume 2, pp. 1817 – 1823.

Wu, F. (1995). Control of linear parameter-varying systems. 150p. PhD Thesis - Department

of Mechanical Engineering, University of California, Berkeley. 1995.

Wu, F., X. H. Yang, A. Packard, e G. Becker (1996). Induced L

-norm control for lpv sys-

tems with bounded parameter variation rates. International Journal of Robust and Nonlinear

Control 6 (9-10), 983–998.

Yagi, Y., S. Kawato, e S. Tsuji (1994). Real-time omnidirectional image sensor (copis) for

vision-guided navigation. IEEE Transactions on Robotics and Automation 10 (1), 11–22.

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo