Download PDF
ads:
Roberto Santos Inoue
Controle Robusto de Robˆos oveis com Rodas
Disserta¸ao apresentada `a Escola de Engenharia de ao Carlos
da Universidade de ao Paulo, como parte dos requisitos para
obten¸ao do t´ıtulo de Mestre em Engenharia El´etrica
´
Area de Concentra¸ao: Sistemas Dinˆamicos
Orientador: Prof. Dr. Marco Henrique Terra
Co-orientador: Prof. Dr. Adriano A. G. Siqueira
ao Carlos
2007
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ii
ads:
iii
Sum´ario
Resumo vii
Abstract ix
Publica¸oes xi
Lista de Figuras xiii
1 Introdu¸ao 1
1.1 Motivao ....................................... 1
1.2 Revis˜ao bibliogr´aca.................................. 2
1.2.1 Robˆos m´oveiscomrodas ........................... 2
1.2.2 Controle H
para robˆos ........................... 5
1.2.3 Localiza¸ao usando vis˜ao computacional . ................. 6
1.3 Disposi¸ao dos cap´ıtulos ............................... 8
2 Modelagem do RobˆoM´ovel 9
2.1 Modelo cinem´atico................................... 10
2.2 Controlador baseado na cinem´atica ......................... 11
2.3 Modelo dinˆamico.................................... 12
3 Controle H
ao Linear 13
3.1 Formula¸aodoproblema ............................... 13
3.2 Controle H
ao linear via representa¸aoquase-LPV ............... 16
3.2.1 Ganho L
2
para sistemas n˜aolinearesvariantesnotempo ......... 16
3.2.2 S´ıntese do controle H
para sistemas LPV por realimenta¸ao do estado . 17
3.2.3 Considera¸oes computacionais . . . ..................... 18
3.3 Controle H
ao linear via Teoria dos Jogos (TJ) ................. 20
3.4 Controle H
ao linear baseado em modelo fuzzy
TakagiSugeno ..................................... 22
iv
3.5 Controle H
aolinearbaseadoemredesneurais ................. 30
3.6 Solu¸ao da equa¸ao alg´ebricadeRiccati....................... 34
4 Implementa¸ao 37
4.1 Robˆom´ovelcomrodas ................................ 37
4.2 Sistema de vis˜ao computacional . . . ........................ 38
4.2.1 TransformadadeHoughcircular....................... 39
4.3 AmbientedecontroledeRMR ............................ 41
4.4 Experimentos ..................................... 43
4.4.1 Controle H
ao linear via representa¸aoquase-LPV........... 46
4.4.2 Controle H
ao linear via Teoria dos Jogos (TJ) . ............ 50
4.4.3 Controle H
aolinearbaseadoemmodelofuzzyTakagiSugeno .... 53
4.4.4 Controle H
ao linear baseado em modelo e em modelo fuzzy
TakagiSugeno ................................. 57
4.4.5 Controle H
aolinearbaseadoemredesneurais ............. 61
4.4.6 Controle H
aolinearbaseadoemmodeloeemredesneurais ..... 65
4.4.7 Controleproporcionalderivativoetorquecalculado(PD+TC) ...... 69
4.4.8 Estudo comparativo . . ............................ 72
5 Conclus˜ao 75
Referˆencias Bibliogr´aficas 77
Dedicat´oria
Aos meus pais Francisco Hitoshi Inoue e Maria Selma dos Santos com amor e gratid˜ao.
Agradecimentos
A Deus, que me concedeu sa´ude f´ısica e mental para a realiza¸ao deste trabalho.
Aos meus pais Francisco Hitoshi Inoue e Maria Selma dos Santos com amor, admira¸ao e
gratid˜ao por sua compreens˜ao, carinho, presen¸ca e incans´avel apoio ao longo do per´ıodo deste
mestrado.
Aos meus tios Gilberto e Djalma que me ajudaram em minha permanˆencia em S˜ao Carlos.
Ao Prof Dr. Marco Henrique Terra pela confian¸ca, orienta¸ao, paciˆencia e pelo tempo
dedicado a este trabalho.
Ao Prof. Dr. Adriano Almeida Gon¸calves Siqueira pela aten¸ao, apoio e contribui¸oes na
realiza¸ao deste trabalho.
Aos amigos da os-gradua¸ao e do LASI: Aline, Amanda, Carolina, Cleber, Elmer, Gild-
son, Lais, Rafael, Raphael, Robson, Samuel, Saulo, Tatiana, Tatiane, Thiago, Wallisson, pela
amizade, paciˆencia, companheirismo e colabora¸oes durante a realiza¸ao das disciplinas e deste
trabalho.
Aos professores e funcion´ariosdoDepartamentodeEngenhariaEl´etrica da Escola de Enge-
nharia de S˜ao Carlos, pelas contribui¸oes durante o mestrado.
Ao Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnol´ogico (CNPq) pela concess˜ao
da bolsa de mestrado.
vii
Resumo
Nesta disserta¸ao ´e apresentado um estudo comparativo entre seis controladores H
ao
lineares aplicados em um robˆom´ovel com rodas. Trˆes estrat´egias de controle ao avaliadas.
Na primeira, o modelo do robˆe considerado completamente conhecido. Na segunda, o modelo
matem´atico ´e considerado desconhecido e ´e realizada uma estimativa baseada em etodos inteli-
gentes. E finalmente, na terceira estrat´egia, o modelo nominal ´e conhecido e t´ecnicas inteligentes
ao usadas para estimar somente incertezas param´etricas do robˆo. As ecnicas inteligentes usadas
ao baseadas em redes neurais e em ogica fuzzy. Esses controladores ao resolvidos atrav´es de
Desigualdades Matriciais Lineares (DMLs) e equa¸oes alg´ebricas de Riccati. Todos os resultados
obtidos s˜ao baseados em dados experimentais.
viii
ix
Abstract
This dissertation is present a comparative study between six nonlinear H
controllers applied
to a wheeled mobile robot. Three control strategies are adopted. In the first, the model of the robot
is considered completely known. In the second, the mathematical model is considered unknown
and is accomplished an estimate based on intelligent methods. And finally, in the third strategy,
the nominal model is known and intelligent techniques are used only to estimate parametric
uncertainties of the robot. The intelligent techniques used are based in neural networks and in
fuzzy logic. These controllers are solved via Linear Matrix Inequalities (LMIs) and algebraic
Riccati equations. All results obtained are based in experimental data.
x
xi
Publica¸oes
1. Inoue, R. S., A. A. G. Siqueira e M. H. Terra (2007). Experimental results on the nonli-
near H
control via Quasi-LPV representation and game theory for wheeled mobile robots.
IEEE Conference on Control Applications, Singapore.
2. Inoue, R. S., Tatiana de F. P. A. T. Pazelli, A. A. G. Siqueira e M. H. Terra (2007). Mixed
model based/fuzzy adaptive robust controller with H
criterion applied to wheeled mobile.
3rd IFAC Symposium on System Structure and Control, Foz do Igua¸cu, Brazil.
3. Inoue, R. S., Tatiana de F. P. A. T. Pazelli, A. A. G. Siqueira e M. H. Terra (2007).
Controlador Robusto H
Baseado em Redes Neurais Aplicado em Robˆos oveis com
Rodas. VIII Simp´osio Brasileiro de Automa¸ao Inteligente, Florian´opolis, Brasil.
4. Pazelli, Tatiana de F. P. A. T., R. S. Inoue, A. A. G. Siqueira e M. H. Terra (2007).
Mixed Model Based/Fuzzy Adaptive Robust Controller with H
Criterion Applied to
Free-Floating Space Manipulators. VIII Simp´osio Brasileiro de Automa¸ao Inteligente,
Florian´opolis, Brasil.
xii
xiii
Lista de Figuras
FIGURA2.1 GeometriadoRMR. ............................ 9
FIGURA3.1 RedeNeural.................................. 32
FIGURA 4.1 Foto do robˆom´ovel.............................. 38
FIGURA 4.2 Conven¸ao: (a) imagem cont´ınua,(b)imagemdigital........... 39
FIGURA 4.3 Transformada de Hough circular: (a) imagem, (b) matriz acumuladora. 39
FIGURA 4.4 Imagem da cˆamera visualizando o robˆo................... 41
FIGURA 4.5 Ambiente de controle de RMR na aba de Parˆametros........... 42
FIGURA 4.6 Ambiente de controle de RMR na aba de Gr´acoA............ 42
FIGURA 4.7 Ambiente de controle de RMR na aba de Gr´acoB............ 43
FIGURA 4.8 Dist´urbios de torque aplicados `asrodas. ................. 44
FIGURA 4.9 Sistema de controle de acompanhamento de trajet´oria para robˆos m´oveis. 45
FIGURA 4.10 Controladores baseados na dinˆamica.................... 45
FIGURA 4.11 Acompanhamento de trajet´oria de referˆencia usando o controlador quase-
LPV: sem dist´urbio (esquerda) e com dist´urbio(direita)............... 47
FIGURA 4.12 Erros de posi¸ao usando o controlador quase-LPV: sem dist´urbio (es-
querda) e com dist´urbio(direita)............................ 47
FIGURA 4.13 Erro de dire¸ao usando o controlador quase-LPV: sem dist´urbio (es-
querda) e com dist´urbio(direita)............................ 48
xiv
FIGURA 4.14 Derivada dos erros de posi¸ao usando o controlador quase-LPV: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 48
FIGURA 4.15 Derivada do erro de dire¸ao usando o controlador quase-LPV: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 48
FIGURA 4.16 Velocidade angular da roda direita usando o controlador quase-LPV:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 49
FIGURA 4.17 Velocidade angular da roda esquerda usando o controlador quase-LPV:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 49
FIGURA 4.18 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador quase-LPV: sem dist´urbio (esquerda) e com dist´urbio (direita). 49
FIGURA 4.19 Acompanhamento de trajet´oria de referˆencia usando o controlador TJ:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 50
FIGURA 4.20 Erros de posi¸ao usando o controlador TJ: sem dist´urbio (esquerda) e
com dist´urbio(direita). ................................ 50
FIGURA 4.21 Erro de dire¸ao usando o controlador TJ: sem dist´urbio (esquerda) e
com dist´urbio(direita). ................................ 51
FIGURA 4.22 Derivada dos erros de posi¸ao usando o controlador TJ: sem dist´urbio
(esquerda) e com dist´urbio(direita). ......................... 51
FIGURA 4.23 Derivada do erro de dire¸ao usando o controlador TJ: sem dist´urbio
(esquerda) e com dist´urbio(direita). ......................... 51
FIGURA 4.24 Velocidade angular da roda direita usando o controlador TJ: sem dist´urbio
(esquerda) e com dist´urbio(direita). ......................... 52
FIGURA 4.25 Velocidade angular da roda esquerda usando o controlador TJ: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 52
FIGURA 4.26 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio (direita). . . 52
FIGURA 4.27 Conjunto fuzzy A
1
q) e conjunto fuzzy A
2
(
˙
˜q)............... 53
FIGURA 4.28 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-
seado em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . 54
xv
FIGURA 4.29 Erros de posi¸ao usando o controlador baseado em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 54
FIGURA 4.30 Erro de dire¸ao usando o controlador baseado em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 55
FIGURA 4.31 Derivada dos erros de posi¸ao usando o controlador baseado em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 55
FIGURA 4.32 Derivada do erro de dire¸ao usando o controlador baseado em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 55
FIGURA 4.33 Velocidades angulares da roda direita usando o controlador baseado em
modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita). ...... 56
FIGURA 4.34 Velocidades angulares da roda esquerda usando o controlador baseado
em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . . 56
FIGURA 4.35 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio (esquerda) e
com dist´urbio(direita). ................................ 56
FIGURA 4.36 Conjunto fuzzy A
1
q) e conjunto fuzzy A
2
(
˙
˜q)............... 57
FIGURA 4.37 Acompanhamento de trajet´oria de referˆencia usando o controlador base-
ado em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio
(direita).......................................... 58
FIGURA 4.38 Erros de posi¸ao usando o controlador baseado em modelo e em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 58
FIGURA 4.39 Erro de dire¸ao usando o controlador baseado em modelo e em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio(direita)............ 59
FIGURA 4.40 Derivada dos erros de posi¸ao usando o controlador baseado em modelo
e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 59
FIGURA 4.41 Derivada do erro de dire¸ao usando o controlador baseado em modelo
e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 59
FIGURA 4.42 Velocidades angulares da roda direita usando o controlador baseado em
modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita). 60
xvi
FIGURA 4.43 Velocidades angulares da roda esquerda usando o controlador baseado
em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio
(direita).......................................... 60
FIGURA 4.44 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador baseado em modelo e em modelo fuzzy T-S: sem dist´urbio
(esquerda) e com dist´urbio(direita). ......................... 60
FIGURA 4.45 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-
seado em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). . . . 62
FIGURA 4.46 Erros de posi¸ao usando o controlador baseado em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 62
FIGURA 4.47 Erro de dire¸ao usando o controlador baseado em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 62
FIGURA 4.48 Derivada dos erros de posi¸ao usando o controlador baseado em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 63
FIGURA 4.49 Derivada do erro de dire¸ao usando o controlador baseado em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 63
FIGURA 4.50 Velocidades angulares da roda direita usando o controlador baseado em
redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita).......... 63
FIGURA 4.51 Velocidades angulares da roda esquerda usando o controlador baseado
em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)........ 64
FIGURA 4.52 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador baseado em redes neurais: sem dist´urbio (esquerda) e com
dist´urbio(direita). ................................... 64
FIGURA 4.53 Acompanhamento de trajet´oria de referˆencia usando o controlador ba-
seado em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio
(direita).......................................... 66
FIGURA 4.54 Erros de posi¸ao usando o controlador baseado em modelo e em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 66
FIGURA 4.55 Erro de dire¸ao usando o controlador baseado em modelo e em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio(direita). ............ 66
xvii
FIGURA 4.56 Derivada dos erros de posi¸ao usando o controlador baseado em modelo
e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)....... 67
FIGURA 4.57 Derivada do erro de dire¸ao usando o controlador baseado em modelo
e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio(direita)....... 67
FIGURA 4.58 Velocidades angulares da roda direita usando o controlador baseado em
modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). . 67
FIGURA 4.59 Velocidades angulares da roda esquerda usando o controlador baseado
em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita). 68
FIGURA 4.60 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador baseado em modelo e em redes neurais: sem dist´urbio (es-
querda) e com dist´urbio(direita)............................ 68
FIGURA 4.61 Acompanhamento de trajet´oria de referˆencia usando o controlador PD
+ TC: sem dist´urbio (esquerda) e com dist´urbio(direita). ............. 69
FIGURA4.62Errosdeposi¸ao usando o controlador PD + TC: sem dist´urbio (es-
querda) e com dist´urbio(direita)............................ 69
FIGURA 4.63 Erro de dire¸ao usando o controlador PD + TC: sem dist´urbio (es-
querda) e com dist´urbio(direita)............................ 70
FIGURA 4.64 Derivada dos erros de posi¸ao usando o controlador PD + TC: sem
dist´urbio (esquerda) e com dist´urbio(direita)..................... 70
FIGURA 4.65 Derivada do erro de dire¸ao usando o controlador PD: sem dist´urbio
(esquerda) e com dist´urbio(direita). ......................... 70
FIGURA 4.66 Velocidades angulares da roda direita usando o controlador PD + TC:
sem dist´urbio (esquerda) e com dist´urbio(direita). ................. 71
FIGURA 4.67 Velocidades angulares da roda esquerda usando o controlador PD +
TC: sem dist´urbio (esquerda) e com dist´urbio(direita). .............. 71
FIGURA 4.68 Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente,
usando o controlador PD +TC: sem dist´urbio (esquerda) e com dist´urbio (direita). 71
xviii
1
Cap´ıtulo 1
Introdu¸ao
1.1 Motivao
Considerando que robˆos m´oveis com rodas (RMRs) podem estar sujeitos a perturba¸oes ex-
ternas, como desn´ıveis da superf´ıcie por onde o robˆo circula, escorregamento das rodas, colis˜ao
com obst´aculos ou com outros robˆos e incertezas param´etricas, o controle utilizado deve ser ro-
busto o suficiente para a realiza¸ao de uma tarefa pr´e-estabelecida. Optou-se neste trabalho pela
utiliza¸ao de estrat´egias de controle baseadas em modelos dinˆamicos. Ser´a usada uma repre-
senta¸ao do robˆoemespa¸co de estado linear a parˆametros variantes (LPV). Essa representa¸ao
tem se mostrado bastante apropriada em aplica¸oes voltadas `a rob´otica pois preserva a natureza
dinˆamicadosistema. Paraaatenua¸ao dos dist´urbios externos e incertezas param´etricas, o
crit´erio H
tem sido usado para outros tipos de robˆos e ser´a aplicado em RMRs neste trabalho.
Em adi¸ao a este car´ater robusto do crit´erio de controle adotado, este trabalho utiliza m´etodos
baseados em inteligˆencia artificial, baseados em redes neurais e em ogica fuzzy, para comple-
mentar o modelo matem´atico do robˆom´ovel. Estimam as incertezas ao modeladas pelo modelo
nominal. Esta combina¸ao ´e feita com a garantia de estabilidade do sistema de controle robusto
resultante.
2
1.2 Revis˜ao bibliogr´afica
1.2.1 Robˆos oveis com rodas
Controladores para RMRs tˆem sido alvo de pesquisas em rob´otica a partir dos anos 80. A
express˜ao Robˆos oveis com Rodas ser´a utilizada para diferenciar a categoria de robˆos consi-
derada neste trabalho de outros tipos de robˆos (m´oveis, aqu´aticos, ereos, etc) e em boa parte
do texto ser´a utilizado apenas o termo Robˆos M´oveis.
Em Campion et al. (1996), os autores definiram dois tipos de rodas para RMRs: rodas
convencionais, cuja velocidade no ponto de contato da roda com o solo ´e zero e ao divididas em
rodas fixas, centradas orienaveis e centradas ao orient´aveis (conhecidas tamb´em por castor);
e rodas suecas nas quais somente a componente da velocidade ao longo do movimento no ponto
decontatodarodacomosolo´e admitida ser nula.
Os RMRs mais comuns estudados na literatura ao: uniciclo (Aicardi et al., 1995; Morin e
Samson, 2000; Lee et al., 2001) (este nome ´e devido a equa¸ao cinem´atica do robˆo ser equivalente
ao de uma roda que ao gira em falso e nem desliza no sentido do eixo), carro convencional
(Almeida et al., 1997), carro convencional com trailers (Vendittelli e Oriolo, 2000; Samson,
1995; Jiang e Nijmeijer, 1999) e uniciclo com trailers (M’Closkey e Murray, 1997).
O robˆom´ovel utilizado neste trabalho ´e um uniciclo com duas rodas convencionais fixas
atuadas independentemente e uma roda convencional tipo castor. Considera-se tamb´em que o
centro de massa (P
c
e diferente do ponto no centro do eixo das rodas atuadas (P
o
).
Modelos matem´aticas para RMRs tˆem sido formulados para cada tipo de robˆo. Modelos
cinem´aticos para cinco tipos de robˆos ao apresentados em Campion et al. (1996). Em Coelho
(2001), o autor apresenta uma modelagem completa (cinem´atica e dinˆamica) para um robˆo
uniciclo, considerando trˆes casos: no primeiro P
c
= P
o
, no segundo P
c
= P
o
e no terceiro
P
c
= P
o
, incluindo em todos eles as for¸cas de restri¸oes.
Robˆos oveis com Rodas constituem uma classe de sistemas mecˆanicos caracterizados por
restri¸oes n˜ao holonˆomicas. Para entender o que ao restri¸oes ao holonˆomicas, considere que
o sistema mecˆanico pode ser descrito por um vetor de coordenadas generalizadas de dimens˜ao n
q =[q
1
q
2
... q
n
]
T
,
3
e a velocidade generalizada em um ponto gen´erico de uma trajet´oria suave q(te o vetor tangente
˙q =[˙q
1
˙q
2
... ˙q
n
]
T
.
Um sistema mecˆanico pode estar sujeito a um conjunto de restri¸oes cinem´aticas, envolvendo
as coordenadas generalizadas e suas derivadas, ou seja, k restri¸oes de primeira ordem
φ
T
i
(q, ˙q)=0,
sendo i = {1, 2, ..., k}. Na maioria dos casos as restri¸oes ao lineares nas velocidades e podem
ser denotadas por
A(qq =0.
Se as restri¸oes cinem´aticas podem ser integradas, isto ´e, se existem k fun¸oes h
i
tais que
dh
i
(q(t))
dt
=
∂h
i
(q(t))
∂q
˙q =0,i= {1, 2, ..., k},
enao, as restri¸oes cinem´aticas ao de fato restri¸oes geom´etricas. Portanto um conjunto de
restri¸oes cinem´aticas ´e chamado holonˆomico se ´e integr´avel e em caso contr´ario, ´e chamado de
ao holonˆomico.
Usando
´
Algebra de Lie, Coelho e Nunes (2003) mostraram como pode-se determinar quantas
restri¸oes cinem´aticas ao holonˆomicas est˜ao presentes em um sistema de restri¸oes. Uma li-
mita¸ao na estabilidade de um ponto de equil´ıbrio de um sistema com restri¸oes ao holonˆomicas
´e que a estabilidade de Lyapunov ao pode ser alcan¸cada por uma lei de realimenta¸ao invariante
no tempo e suave (Bloch e McClamroch, 1989; Oriolo et al., 2002). Este resultado ´ebaseado
nos resultados apresentados em Brockett (1983).
Estudos de controlabilidade e estabilizabilidade para sistemas ao holonˆomicos podem ser
encontrados em Bloch e McClamroch (1990), onde se utiliza como exemplo o movimento de uma
faca, e em Oriolo et al. (2002), que avalia um robˆodotipouniciclo.
Na literatura ao apresentados trˆes tipos asicos de objetivos a serem alcan¸cados por um
RMR: estabiliza¸ao de postura (posi¸ao e dire¸ao do robˆo), alcan¸car uma postura de referˆencia
iniciando em uma dada postura; acompanhamento de trajet´oria,orobˆo deve seguir uma tra-
jet´oria de referˆencia em fun¸ao do tempo; seguindo um caminho,orobˆo deve seguir uma tra-
4
jet´oria de referˆencia em fun¸ao de parˆamentros independentes do tempo, podendo ser geom´etrico
(Coelho e Nunes, 2003) ou em fun¸ao do trajeto e das velocidades ao longo do caminho (Sarkar
et al., 1994). Neste trabalho, o controle ser´a realizado para acompanhamento de trajet´oria de
referˆencia, sendo a trajet´oria de referˆencia o objetivo a ser alcan¸cado pelo ponto P
c
do robˆo,
diferentemente da trajet´oria desejada, que se refere `as velocidades desejadas para as rodas do
robˆo tais que o robˆo alcance a referˆencia, conforme apresentado no Cap´ıtulo 2.2.
Na literatura foram encontradas in´umeras publica¸oes de trabalhos relacionados a controle
de RMRs e alguns est˜ao resumidos a seguir.
Oriolo et al. (2002) apresentaram um m´etodo unificado para resolver os problemas de acom-
panhamento de trajet´oria e estabiliza¸ao de postura, que utiliza o modelo cinem´atico de um
uniciclo e a lineariza¸ao por realimenta¸ao dinˆamica. O m´etodo consiste em encontrar um com-
pensador dinˆamico dependente da dire¸ao do robˆoedasvari´aveis de controle geradas por um
controlador proporcional derivativo (PD).
Sarkar et al. (1994) propuseram um etodo de controle por realimenta¸ao de sa´ıda que
alcan¸ca estabilidade assinotica usando o modelo cinem´atico e dinˆamico. A escolha das sa´ıdas
est´a ligada diretamente ao objetivo de controle. Para o acompanhamento de trajet´oria, o vetor
de sa´ıda consiste de parte das coordenadas generalizadas em fun¸ao do tempo, e para seguir um
caminho, o vetor de sa´ıda consiste em um caminho geom´etrico, por exemplo uma reta ou uma
circunferˆencia.
Coelho e Nunes (2003) mostraram o uso da ´algebra de Lie para sistemas de controle ao
lineares com restri¸oes ao holonˆomicas. O controle de um RMR ´e realizado por realimenta¸ao de
sa´ıda, sendo as sa´ıdas o erro de posi¸ao do robˆo com rela¸ao a uma circunferˆencia e a velocidade
linear do robˆo para o problema de seguir um caminho.
Fukao et al. (2000) apresentaram um m´etodo para projetar um controlador adaptativo para
omodelodinˆamico de um robˆom´ovel com restri¸oes ao holonˆomicas com parˆametros des-
conhecidos, utilizando Backstepping adaptativo. A metodologia de projeto recursiva chamada
Backstepping, (Krstic et al., 1995), ´e uma constru¸ao sistem´
atica de ambas as leis de controle
de realimenta¸ao e fun¸ao de Lyapunov associada. Propriedades fortes de acompanhamento e
estabilidade local ou global ao constru´ıdas dentro de sistemas ao lineares em um n´umero de
passos que nunca ´e maior do que a ordem do sistema.
Do et al. (2004) apresentaram um controle adaptativo global variante no tempo que resolve
simultaneamente ambas estabiliza¸ao de postura e acompanhamento de trajet´oria para robˆos
5
oveis com parˆametros da dinˆamica e cinem´atica desconhecidos. A s´ıntese de controle ´ebaseada
em t´ecnicas de Backstepping em´etodo direto de Lyapunov.
Ji et al. (2003) desenvolveram um sistema de controle adaptativo tolerante a falha. O robˆo
´emodeladocomoumsistemacont´ınuo com um controlador supervisor. Um ajuste em um
controle hier´arquico ´e desenvolvido para o controlador supervisor que determina uma estrat´egia
de controle adequada para eliminar a falha.
Atrav´es de uma fun¸ao de Lyapunov, Kanayama et al. (1990) propuseram um controle de
acompanhamento de trajet´oria est´avel, que envolve o erro de postura (erro de dire¸ao e posi¸ao
com rela¸ao ao sistema de coordenadas local do robˆo) e a trajet´oria de referˆencia, e gera velo-
cidades desejadas para o robˆom´ovel seguir a trajet´oria de referˆencia, ou seja, zerar o erro de
postura.
1.2.2 Controle H
para robˆos
Trˆes importantes estrat´egias sobre controle de sistemas rob´oticos tˆem sido tratadas na lite-
ratura: na primeira, o modelo de um sistema rob´otico ´e considerado completamente conhecido
e utiliz´avel para o controlador (Lewis et al., 1993); na segunda, os parˆametros do modelo ao
desconhecidos e eles s˜ao estimados baseados na propriedade rob´otica de parametriza¸ao linear,
resultados cl´assicos sobre controle adaptativo podem ser vistos em Craig (1985) e Lewis et al.
(1993); e na terceira, o modelo ´e desconhecido e uma abordagem inteligente (baseada em redes
neurais ou ogica fuzzy) ´e usada para estimar o modelo (veja, por exemplo, Chang (2000) e
Chang (2005)). Se, em adi¸ao `a incertezas param´etricas, dist´urbios externos est˜ao presentes, a
dificuldade para controlar um sistema rob´otico sob estas circunstˆancias aumentam. Uma abor-
dagem interessante para resolver este problema de controle ´e baseado no crit´erio H
ao linear,
que visa atenuar os efeitos de todos dist´urbios no desempenho do sistema.
Controladores H
baseados nas estrat´egias descristas acima ao propostos em Chen et al.
(1994); Wu (1995); Wu et al. (1996); Chen et al. (1997); Chang e Chen (1997); Huang e Jadbabaie
(1998); Chang (2000); Siqueira e Terra (2004); Chang (2005), para robˆos manipuladores. Em
Chen et al. (1994), uma solu¸ao expl´ıcita para o problema de controle H
ao linear, onde
o modelo do manipulador ´e considerado completamente conhecido, ´e desenvolvida baseada na
Teoria dos Jogos (TJ) (em Postlethwaite e Bartoszewicz (1998) uma metodologia similar ´eusada
para controlar um manipulador real). Controladores H
ao lineares para sistemas LPVs, que
em sido aplicados em robˆos manipuladores (veja por exemplo Siqueira e Terra (2004)), podem
6
ser vistos em Wu (1995); Wu et al. (1996); Huang e Jadbabaie (1998).
Um algoritmo de controle adaptativo H
ao linear ´e proposto em Chen et al. (1997), onde
um projeto de controle robusto de acompanhamento de trajet´oria considera que os parˆametros
desconhecidos podem ser aprendidos por uma lei cl´assica de adapta¸ao atualiz´avel. Controles
adaptativos H
ao lineares baseados em t´ecnicas inteligentes podem ser vistos em Chang e
Chen (1997), Chang (2000) e Chang (2005). Redes neurais e l´ogica fuzzy s˜ao empregadas para
estimar todo o modelo dinˆamico do robˆo. Uma abordagem interessante desenvolvida em Ge et al.
(1998) usa um controlador adaptativo baseado no modelo nominal e em redes neurais, sendo que
as redes neurais ao usadas somente para estimar as incertezas param´etricas do sistema rob´otico.
Vale destacar que este controlador ao utiliza um crit´erio de desempenho robusto, semelhante
ao crit´erio H
por exemplo.
Poucos trabalhos tˆem sido apresentados com t´ecnicas de controle H
direcionados a RMRs.
Hwang et al. (2004) propuseram uma combina¸ao de um controlador baseado na cinem´atica e um
controlador H
robusto baseado na dinˆamica para acompanhamento de trajet´oria. A solu¸ao
proposta em Hwang et al. (2004) resulta em matrizes constantes do controlador, ao leva em
considera¸ao a natureza variante dos parˆametros do robˆo. a em dos Reis (2005), equa¸oes
dinˆamicas de um RMR ao descritas na forma quase-LPV. Um controlador baseado no modelo
cinem´atico, proposto em Kanayama et al. (1990), ´e utilizado para gerar as velocidades desejadas
para as rodas e controladores robustos baseados no modelo dinˆamico ao projetados levando em
considera¸ao as varia¸oes param´etricas do robˆo.
Neste trabalho, que complementa os resultados obtidos em dos Reis (2005); Ge et al. (1998);
Chang (2005), ´e feito um estudo comparativo, utilizando resultados experimentais de um RMR,
entre dois controladores H
apresentados em dos Reis (2005), quatro controladores robustos
baseados em t´ecnicas inteligentes e um controlador Proporcional Derivativo mais torque calcu-
lado. Os controladores robustos baseados em t´ecnicas inteligentes, utilizam redes neurais e o
modelo fuzzy Takagi Sugeno (T-S) (Takagi e Sugeno, 1985) para estimar todo o modelo nominal
do RMR ou para aprender apenas as incertezas do modelo nominal.
1.2.3 Localiza¸ao usando vis˜ao computacional
A determina¸ao da postura de RMRs ´eumarea de pesquisa de destaque para a imple-
menta¸ao dos controladores, pois uma boa precis˜ao da posi¸ao e dire¸ao ´e de fundamental
importˆancia para o funcionamento do sistema.
7
Os sensores mais utilizados ao os encoders (por exemplo Oriolo et al. (2002); Sarkar et al.
(1994)), sonares (Bozma e Kuc, 1994) ou a uni˜ao destes dois (Corradini et al., 2003). A utiliza¸ao
de ameras est´a sendo largamente pesquisada, sendo que elas podem ser embarcadas (Lee et al.,
2004), como em vis˜ao omnidirecional que produzem imagens de 360
o
do ambiente (Yagi et al.,
1994), ou externas como em Gupta et al. (2005); Liu et al. (2004), na qual a amera fica em
cima de um campo de atua¸ao (vis˜ao global).
Posi¸oes em imagens 2D podem ser obtidas com extra¸ao de caracter´ısticas como pontos,
linhas, ´areas ou formas geom´etricas. Um procedimento para detec¸ao aproximada de c´ırculos e
arcos em imagens monocrom´atica (escala em n´ıveis de cinza) foi mostrado em Kimme e Sklansky
(1975), fazendo primeiro uma extra¸ao de bordas e depois aplicando a Transformada de Hough
com matrizes tridimensionais de acumuladores. Ho e Chen (1995) utilizaram simetria geom´etrica
para encontrar c´ırculos/elipses em imagens ap´os aplicar um processo de extra¸ao de bordas. Um
etodo para detec¸ao de caracter´ısticas geom´etricas (linhas, c´ırculos e elipses) foi proposto por
McLaughlin e Alder (1998) e comparado com a transformada de Hough.
Para um RMR seguir um caminho desenhado na superf´ıcie, Bianchi et al. (2001) utilizaram
uma amera de ıdeo colorida sobre a ´area de movimenta¸ao do robˆo(vis˜ao global). A iden-
tifica¸ao da posi¸ao, dire¸ao e caminho a seguir ao encontrados particionando a imagem em
regi˜oes de cores de pixels usando a t´ecnica de imposi¸oes de limiares.
Luca et al. (2002) utilizaram a informa¸ao visual de uma amera no teto para identificar a
posturadeumRMR.Emcimadorobˆo foi criada uma superf´ıcie de cor preta com trˆes LEDs
localizados nos ertices de um triˆangulo is´osceles. O etodo consiste primeiro em tornar bin´aria
a imagem monocrom´atica capturada, depois aplica-se um operador dilata¸ao (Sonka et al.,
1998) e extra¸ao das regi˜oes de luminosidades dos LEDs e por ´ultimo as posi¸oes dos ertices do
triˆangulo s˜ao encontradas por um algoritmo baseado na rela¸ao das distˆ
ancias entre as posi¸oes
candidatas a ertices. Portanto, a posi¸ao ser´aumdosv´ertices e a dire¸ao dada por rela¸oes
trigonom´etricas.
Este trabalho utiliza para a localiza¸ao de um RMR real o etodo da Transformada de
Hough Circular (THC), mostrado em Sonka et al. (1998). O m´etodo ´e baseado na determina¸ao
de centros de c´ırculos de imagens monocrom´aticas obtidas da parte superior do RMR. A deter-
mina¸ao da postura est´a apresentada no Cap´ıtulo 4.2.
8
1.3 Disposi¸ao dos cap´ıtulos
No Cap´ıtulo 2 ´e descrita a modelagem completa, cinem´atica e dinˆamica, do robˆom´ovel, o
controle cinem´atico proposto por Kanayama et al. (1990) para obter as velocidades angulares
desejadas, dadas a postura atual e a trajet´oria de referˆencia.
No Cap´ıtulo 3 ´e abordado o projeto de dois controladores robustos baseados no modelo
dinˆamico usando ecnicas de controle H
para RMRs e quatro controladores robustos usando
ecnicas de controle H
, redes neurais e modelo fuzzy T-S.
No Cap´ıtulo 4 ao mostrados o RMR, o sistema de vis˜ao computacional, o ambiente de
controle de RMR e os resultados experimentais do controle do RMR.
No Cap´ıtulo 5 ao apresentadas as conclus˜oes.
9
Cap´ıtulo 2
Modelagem do RobˆoM´ovel
Neste cap´ıtulo, a cinem´aticaeomodelodinˆamicodeumRMRs˜ao apresentados. A geometria
do robˆe mostrada na Fig. 2.1, sendo (X,Y ) o sistema de coordenadas inercial; (X
o
,Y
o
) o sistema
Figura 2.1: Geometria do RMR.
de coordenadas local; a o comprimento do robˆo; d adistˆancia entre P
o
e P
c
; b adistˆancia entre
uma roda atuada e o eixo de simetria do robˆo; r o raio das rodas atuadas; α angulo (dire¸ao do
robˆo) entre o eixo X e o eixo de simetria do robˆo no sentido anti-hor´ario; θ
d
e θ
e
os deslocamentos
10
angulares das rodas direita e esquerda, respectivamente.
Amodelagemdorobˆo apresentada a seguir est´a baseada em Coelho (2001) e dos Reis (2005).
2.1 Modelo cinem´atico
O RMR mostrado na Fig. 2.1 apresenta trˆes restri¸oes cinem´aticas (Coelho e Nunes, 2003).
Assume-se que o robˆon˜ao pode deslizar, ou seja, movimentar-se na dire¸ao do eixo das rodas
atuadas. A velocidade de P
o
deve estar na dire¸ao do eixo de simetria (eixo X
o
), assim, a
primeira restri¸ao com respeito a P
c
´e dada por
˙y
c
cos α ˙x
c
sen α d ˙α =0,
sendo (x
c
,y
c
) as coordenadas do centro de massa P
c
no sistema de coordenadas inercial, e α o
ˆangulo entre o eixo de simetria do robˆo e o eixo X. As outras duas restri¸oes est˜ao relacionadas
com a rota¸ao das rodas, ou seja, as rodas atuadas n˜ao podem girar em falso,
˙x
c
cos α y
c
sen α + b ˙α r
˙
θ
d
=0,
˙x
c
cos α y
c
sen α b ˙α r
˙
θ
e
=0.
Definindo q =[q
1
q
2
], q
1
=[x
c
y
c
α]
T
e q
2
=[θ
d
θ
e
]
T
,ent˜ao as trˆes restri¸oes podem ser
escritas na forma
A(qq =
sen α cos α d 00
cos α sen α br0
cos α sen α b 0 r
˙q =0.
A matriz A(q) tem posto completo e pode ser expressa como [A
1
(q)
(3×3)
A
2(3×2)
], tal que
A
1
(qen˜ao singular e S(q)=[A
1
1
(q)A
2
I
(2×2)
]
T
cujas colunas aooespa¸co nulo de A(q),
ou seja, A(q)S(q)=0. Ent˜ao encontra-se
S(q)=
c(b cos αd sen α) c(b cos α+d sen α)
c(b sen α+d cos α) c(b sen αd cos α)
c c
10
01
,
11
sendo c = r/(2b). A equa¸ao cinem´atica ´e dada por
˙q(t)=S(qq
2
(t) (2.1)
ou
˙x
c
= c(b cos α d sen α)
˙
θ
d
+ c(b cos α + d sen α)
˙
θ
e
, (2.2)
˙y
c
= c(b sen α + d cos α)
˙
θ
d
+ c(b sen α d cos α)
˙
θ
e
, (2.3)
˙α = c(
˙
θ
d
˙
θ
e
). (2.4)
2.2 Controlador baseado na cinem´atica
Nesta se¸ao, ´e apresentado o controlador baseado na cinem´aticapropostoporKanayama
et al. (1990), que gera as velocidades desejadas para o problema de acompanhamento de tra-
jet´oria de referˆencia de RMRs. Considere o erro q
e
=[x
e
y
e
α
e
]
T
, entre a postura de referˆencia
P
r
=[x
r
,y
r
r
]
T
,eaposturarealdoRMRP
c
=[x
c
,y
c
]
T
, dada por
x
e
= cosα(x
r
x
c
)+senα(y
r
y
c
),
y
e
= senα(x
r
x
c
)+cosα(y
r
y
c
),
α
e
= α
r
α,
(2.5)
sendo [x
r
,y
r
]
T
= q
r
a trajet´oria de referˆencia escolhida e α
r
= tan
1
y
r
/ ˙x
r
). As velocidades
desejadas linear (v
d
) e angular (w
d
) de um RMR s˜ao dadas por
v
d
= v
r
cos α
e
+ k
x
x
e
,
w
d
= w
r
+ v
r
(k
y
y
e
+ k
α
sen α
e
),
(2.6)
sendo k
x
,k
y
,k
α
constantes,
v
r
=
x
r
)
2
+(˙y
r
)
2
e w
r
α
r
. (2.7)
No Cap´ıtulo 3, os controladores baseados no modelo dinˆamico do robˆos˜ao resolvidos consi-
derando as velocidades angulares desejadas das rodas, ˙q
d
2
.Ent˜ao, ´e necess´ario definir a rela¸ao
de velocidades que segue
12
˙q
d
2
=
˙
θ
d
d
˙
θ
d
e
=
1/r b/r
1/r b/r
v
d
w
d
, (2.8)
sendo
˙
θ
d
d
e
˙
θ
d
e
as velocidades angulares desejadas das rodas direita e esquerda, respectivamente.
2.3 Modelo dinˆamico
As equa¸oes dinˆamicas de RMRs usando a teoria de Lagrange ´e descrita por Coelho e Nunes
(2003) como
M(qq + C(q, ˙qq = A
T
(q)λ, (2.9)
sendo λ =[λ
1
λ
2
λ
3
]
T
o vetor de restri¸oes de for¸ca; E =[0
(2×3)
I
(2×2)
]
T
a matriz da entrada;
τ =[τ
d
τ
e
]
T
o vetor de entrada (torque nas rodas);
C(q, ˙q)=
00md ˙α cos α 00
00md ˙α sen α 00
00000
00000
00000
a matriz de for¸cas de Coriolis e centr´ıpeta; e
M(q)=
m 0 md sen α 00
0 m md cos α 00
md sen α md cos α I 00
00 0I
r
0
00 00I
r
amatrizdein´ercia. Os parˆametros m e I ao dados por
m = m
p
+2m
r
e I = I
c
+2m
r
(d
2
+ b
2
)+2I
m
+ m
p
d
2
,
sendo m
r
a massa de cada roda atuada mais o rotor do motor; m
p
a massa da plataforma do
robˆo; I
c
o momento de in´ercia da plataforma do robˆoemrela¸ao ao eixo vertical em P
c
; I
r
o
momento de in´ercia de cada roda com o rotor em rela¸ao ao eixo da roda e I
m
o momento de
in´ercia em rela¸ao ao eixo definido no plano da roda (perpendicular ao eixo da roda).
13
Cap´ıtulo 3
Controle H
ao Linear
Uma vez encontradas as velocidades desejadas do robˆo(v
d
e ω
d
) utilizando o controlador
cinem´atico e posteriormente as velocidades angulares desejadas das rodas (
˙
θ
d
d
e
˙
θ
d
e
), torna-se
poss´ıvel aplicar t´ecnicas de controle H
ao modelo dinˆamico para obter os torques a serem
aplicados `as rodas para o acompanhamento da trajet´oria de referˆencia. Neste cap´ıtulo, ser˜ao
apresentados os dois controladores H
ao lineares mostrados em dos Reis (2005). Dois contro-
ladores robustos baseados em redes neurais e em modelo fuzzy Takagi Sugeno (T-S) que estimam
todo o modelo nominal do RMR. E duas abordagens utilizando ecnicas de controle baseadas
em modelo nominal do RMR e em inteligˆenica artificial. Neste caso, redes neurais e ogica fuzzy
ao utilizadas para estimar somente as incertezas do modelo nominal.
3.1 Formula¸ao do problema
Omodelodinˆamico mostrado na Se¸ao 2.3 ´e descrito em espa¸co de estado na forma quase
linear a parˆametros variantes (quase-LPV), ou seja, os parˆametros das matrizes do sistema
dependem dos estados. Diferenciando (2.1) com respeito ao tempo, tem-se
¨q =
˙
S(qq
2
+ S(qq
2
. (3.1)
Substituindo (3.1) e (2.1) na equa¸ao (2.9) e multiplicando por S
T
`a esquerda, obt´em-se
M
2
¨q
2
+ C
2
q
2
q
2
= S
T
= τ. (3.2)
14
Incertezas param´etricas ao introduzidas em (3.2) dividindo as matrizes de parˆametros M
2
e C
2
q
2
) em uma parte nominal e uma parte perturbada
M
2
= M
0
M
0
C
2
q
2
)=C
0
q
2
)+ΔC
0
q
2
)
sendo M
0
uma matriz sim´etrica constante, ao singular, dada por S(q)
T
M(q)S(q)eC
0
q)=
C
0
α)=C
0
q
2
)=S(q)
T
C(q, ˙q)S(q)+S(q)
T
M(q)
˙
S(q). Note que nesta passagem desaparece a
matriz de restri¸ao que estava presente no termo A
T
λ da equa¸ao dinˆamica, pois S
T
A
T
=0(A
est´anoespa¸co nulo de S). Acrescentando um dist´urbio de torque w =[w
d
w
e
]
T
e substituindo
(2.4) na equa¸ao (3.2) segue que
¨q
2
= Aq
2
q
2
+ + Bw, (3.3)
sendo Aq
2
)=M
1
2
C
2
q
2
)eB = M
1
2
. Somando e subtraindo ¨q
d
2
e Aq
2
q
d
2
em (3.3), (sendo
que ‘d’ sobrescrito significa valor desejado) e definindo o estado como
x =
˙
q
2
q
2
=
˙
θ
d
˙
θ
d
d
˙
θ
e
˙
θ
d
e
θ
d
θ
d
d
θ
e
θ
d
e
a representa¸ao quase-LPV, em espa¸co de estado, para o controle de acompanhamento de tra-
jet´oria do RMR ´e dada por
˙
x =
Aq
2
)0
I 0
x +
I
0
u +
B
0
w (3.4)
sendo
u = ¨q
d
2
+ Aq
2
q
d
2
+ Bτ,
ou
τ = B
1
q
d
2
Aq
2
q
d
2
+ u). (3.5)
15
Considere agora a seguinte transforma¸ao de estado
T
0
x =
T
11
T
12
0 I
˙
q
2
q
2
, (3.6)
sendo T
11
, T
12
∈
2×2
matrizes constantes a serem determinadas. Assume-se que a matriz T
11
´e diagonal, de maneira a facilitar escolhe-se T
11
= t
11
I. Aplicando a transforma¸ao de estado
(3.6) em (3.4), obt´em-se
˙
x = T
1
0
T
0
Aq
2
)0
I 0
T
1
0
T
0
x + T
1
0
T
0
I
0
u + T
1
0
T
0
B
0
w
= T
1
0
Aq
2
)0
T
1
11
T
1
11
T
12
T
0
x
+ T
1
0
T
12
T
1
11
Aq
2
)T
12
T
2
12
T
1
11
00
T
0
x + T
1
0
T
0
I
0
u + T
1
0
T
0
B
0
w
= T
1
0
Aq
2
)0
T
1
11
T
1
11
T
12
T
0
x + T
1
0
T
12
˙
˜q
2
Aq
2
)T
12
˜q
2
T
11
¨q
d
2
+ T
11
Aq
2
q
d
+ T
11
0
+ T
1
0
M
1
2
0
T
11
w
= T
1
0
Aq
2
)0
T
1
11
T
1
11
T
12
T
0
x
+ T
1
0
M
1
2
0
T
11
[M
2
q
d
2
T
1
11
T
12
˙
˜q
2
) C
2
q
2
)(˜q
d
2
T
1
11
T
12
˜q
2
)+τ)]
+ T
1
0
M
1
2
0
T
11
w
Definindo
16
A
T
q
2
)=T
1
0
M
1
0
C
0
q
2
)0
T
1
11
T
1
11
T
12
T
0
, (3.7)
B
T
= T
1
0
M
1
0
0
, (3.8)
d = M
0
T
11
M
1
0
(w ΔF
0
(x
e
)), (3.9)
x
e
=
q
T
2
˙q
T
2
(q
d
2
)
T
q
d
2
)
T
q
d
2
)
T
, (3.10)
F
0
(x
e
)=M
0
q
d
2
T
1
11
T
12
˙
˜q
2
)+C
0
q
2
)( ˙q
d
2
T
1
11
T
12
˜q
2
) e (3.11)
ΔF
0
(x
e
)=ΔM
0
q
d
2
T
1
11
T
12
˙
˜q
2
)+ΔC
0
q
2
)( ˙q
d
2
T
1
11
T
12
˜q
2
). (3.12)
obt´em-se
˙
˜x = A
T
q
2
x + B
T
T
11
(F
0
(x
e
)+τ)+B
T
d. (3.13)
3.2 Controle H
ao linear via representa¸ao quase-LPV
Com a equa¸ao em espa¸co de estado formulada na representa¸ao quase-LPV (o parˆametro
ρ em fun¸ao do estado, ou seja, ρ = ρ(x) resultante do modelo dinˆamico (2.9)), o controle
H
para sistemas LPV pode ser aplicado a RMRs, gerando um controlador n˜ao linear baseado
na dinˆamica. A lei de controle ao linear apresentada a seguir ´e baseada em Desigualdades
Matriciais Lineares (DMLs). Trata-se de uma lei de controle por realimenta¸ao de estado u =
F (ρ)x que estabiliza o sistema em malha fechada garantindo que um ganho L
2
entre o dist´urbio
easa´ıda seja limitado por um n´ıvel de atenua¸ao γ>0.
3.2.1 Ganho L
2
para sistemas ao lineares variantes no tempo
Considere um sistema n˜ao linear variante no tempo com entrada de dist´urbio afim w ∈
p
e
sa´ıda controlada z ∈
q
˙x = f(x, t)+g(x, t)w,
z = h(x, t)+k(x, t)w,
(3.14)
17
sendo f(0,t)=0eh(0,t) = 0 para todo t [0,T], e x ∈
n
o estado. Assume-se que f(x, t),
g(x, t), h(x, t)ek(x, t)s˜ao fun¸oes continuamente diferenci´aveis em rela¸ao a x econt´ınuas em
t. O sistema (3.14) possui ganho L
2
γ no intervalo [0,T]se
T
0
z(t)
2
dt γ
2
T
0
w(t)
2
dt, (3.15)
para todo T 0 e todo w ∈L
2
(0,T) com o sistema iniciando em x(0) = 0. Para sistemas
lineares invariantes no tempo, a condi¸ao de ganho L
2
γ corresponde `a condi¸ao da norma
H
da fun¸ao de transferˆencia entre a entrada de dist´urbio e a sa´ıda controlada ser limitada
por γ,ouseja,T
zw
(s)
γ.
3.2.2 S´ıntese do controle H
para sistemas LPV por realimenta¸ao do estado
O problema consiste no controle por realimenta¸ao de estado dependente de parˆametro para
estabilizar o sistema em malha fechada e fazer a norma L
2
menor que um n´ıvel de desempenho
especificado γ. Considere o problema de s´ıntese do controle por realimenta¸ao do estado
˙x = A(ρ(t))x + B
1
(ρ(t))w + B
2
(ρ(t))u
z
1
= C
1
(ρ(t))x
z
2
= C
2
(ρ(t))x + u
(3.16)
sendo x ∈
n
o estado, u ∈
q
4
a entrada de controle, w ∈
p
odist´urbio de entrada, z
1
∈
q
3
e
z
2
∈
q
4
as sa´ıdas, A(·), B
1
(·), B
2
(·), C
1
(·)eC
2
(·) matrizes cont´ınuas de dimens˜oes apropriadas
e ρ(t) F
ν
P
definido por
F
ν
P
=
ρ∈C
1
(
+
,
m
):ρ(t)P, ˙ρ
i
≤ν
i
,i=1,...,m
,
sendo P ⊂
m
um conjunto compacto e ν =[ν
1
···ν
m
]
T
com ν
i
0.
Defini¸ao 3.2.1 (Wu, 1995) O problema de realimenta¸ao de estado dependente de parˆametro,
para o sistema LPV (3.16), ´e resolvido se existir uma fun¸ao Z C
1
(
s
,S
n×n
) eumaF
C
0
(
s
×
s
,
n
u
×n
) tais que para todo ρ(t) P e ˙ρ
i
≤ν
i
, i =1, 2, ..., s, Z(ρ) > 0 e
A
T
F
(ρ, ˙ρ)Z(ρ)+Z(ρ)A
F
(ρ, ˙ρ)+
s
i=1
ν
i
∂Z
∂ρ
i
+ C
T
(ρ, ˙ρ)C(ρ, ˙ρ) Z(ρ)B
1
(ρ)
B
T
1
(ρ)Z(ρ) γ
2
I
< 0, (3.17)
18
sendo A
F
(ρ, ˙ρ):=A(ρ)+B
2
(ρ)F (ρ, ˙ρ),C(ρ, ˙ρ):=C
1
(ρ)+D
12
F (ρ, ˙ρ) e D
12
=[0I]
T
.
Se o problema de realimenta¸ao de estado dependente de parˆametro (3.17) tem solu¸ao,
enao a lei de controle u = F (ρ(t))x estabilizar´a exponencialmente o sistema em malha fechada
e garantir´aqueanormaL
2
induzida seja menor que γ. O seguinte teorema fornece uma condi¸ao
de existˆencia para o controlador de realimenta¸ao de estado expresso em DMLs para o sistema
LPV em malha aberta (3.16).
Teorema 3.2.1 (Wu, 1995) Dado um conjunto compacto P ∈
s
,umn´ıvel de desempenho
γ>0 e o sistema (3.16), o problema de realimenta¸ao de estado tem solu¸ao se e somente se
existir uma fun¸ao X C
1
(
s
,S
n×n
) tal que para todo ρ P , X(ρ) > 0 e
E(ρ) X(ρ)C
T
1
(ρ) B
1
(ρ)
C
1
(ρ)X(ρ) I 0
B
T
1
(ρ)0γ
2
I
< 0, (3.18)
sendo
E(ρ)=
m
i=1
±
ν
i
∂X
∂ρ
i
+
A(ρ)X(ρ)+X(ρ)
A(ρ)
T
B
2
(ρ)B
T
2
(ρ)
e
A(ρ)=A(ρ) B
2
(ρ)C
2
(ρ).
Este teorema fornece um ganho F (ρ) de realimenta¸ao de estado tal que
u = (B
2
(ρ)
T
X
1
(ρ)+C
2
(ρ))x, (3.19)
garante que o sistema em malha tenha ganho L
2
γ para toda varia¸ao param´etrica ρ(t) F
ν
P
.
O resultado acima ´e uma generaliza¸ao natural da teoria de controle H
para sistemas linea-
res. Uma fun¸ao de Lyapunov dependente de parˆametros na forma V (x, t)=x
T
(t)X
1
(ρ(t))x(t)
´e assumida. Como resultado, deve-se resolver as DMLs param´etricas (3.18) que ´e um problema
de otimiza¸ao convexo com dimens˜ao infinita.
3.2.3 Considera¸oes computacionais
Um esquema computacional pr´atico (Wu, 1995; Wu et al., 1996; Huang e Jadbabaie, 1998;
Siqueira e Terra, 2004) pode ser utilizado para resolver as desigualdades matriciais lineares
presentes na an´alise e s´ıntese dos problemas LPV. Por simplicidade, considere o problema de en-
19
contrar X(ρ(t)) na Equa¸ao (3.18). Primeiro, escolha um conjunto de fun¸oes C
1
, {f
i
(ρ(t))}
M
i=1
,
como base para X(ρ), ou seja,
X(ρ(t)) =
M
i=1
f
i
(ρ(t))X
i
, (3.20)
sendo X
i
S
n×n
a matriz coeficiente para f
i
(ρ(t)). Se X(ρ(t)) em (3.18) ´e substitu´ıda por (3.20),
o problema de realimenta¸ao do estado transforma-se no seguinte problema de otimiza¸ao
min
{X
i
}
M
i=1
γ
2
,
sujeito a
E
(ρ)
M
j=1
f
j
(ρ)X
j
C
T
1
(ρ) B
1
(ρ)
C
1
(ρ)
M
j=1
f
j
(ρ)X
j
I 0
B
T
1
(ρ)0γ
2
I
< 0,
M
j=1
f
j
(ρ)X
j
> 0, (3.21)
sendo
E
(ρ)=
m
i=1
±
ν
i
M
j=1
∂f
j
∂ρ
i
X
j
+
M
j=1
f
j
(ρ)(
A(ρ)X
j
+ X
j
A(ρ)
T
) B
2
(ρ)B
T
2
(ρ).
Note que (3.21) ao DMLs em termos das vari´aveis matriciais {X
i
}
M
i=1
que devem ser satis-
feitas para todo parˆametro ρ(t)emP . Para resolver este problema de otimiza¸ao de dimens˜ao
infinita, divide-se o conjunto de parˆametros P em N pontos {ρ
k
}
N
k=1
em cada dimens˜ao. Enao
calcula-se as DMLs acima para estes pontos. Desde que (3.18) consiste em 2
m
ınculos, um
total de (2
m
+1)N
m
desigualdades matriciais afins em termos das M vari´aveis matriciais {X
i
}
devem ser resolvidas. E
±(·) indica que toda combina¸ao +(·)e(·) deve ser satisfeita.
Uma aproxima¸ao da densidade de pontos particionados, N, que garante uma solu¸ao global
das DMLs ´e dada em Wu (1995); Wu et al. (1996).
Este esquema computacional possui algumas limita¸oes. O n´umero de parˆametros conside-
rados e o n´umero de divis˜oes N devem ser escolhidos tais que a solu¸ao seja alcan¸cada em um
umero de itera¸oes realiz´aveis. Outro problema ´e a falta de justificativa te´orica na escolha das
fun¸oes base para X(ρ). Geralmente, escolhem-se fun¸oes similares `as encontradas nas matrizes
de estado A(ρ(t)) (Apkarian e Adams, 1998).
20
3.3 Controle H
ao linear via Teoria dos Jogos (TJ)
Nesta se¸ao, o controle H
ao linear proposto em Chen et al. (1994) ´e aplicado aos RMRs
onde se leva em considera¸ao a equa¸ao em espa¸co de estado da dinˆamica do erro de ordem
reduzida (3.4). O termo de incertezas ΔF
0
(x
e
), associado a um dist´urbio no torque w,forma
odist´urbio combinado d definido em (3.13). Escolhendo a entrada de controle como sendo
u = T
11
(F
0
(x
e
)+τ), o torque aplicado pode ser calculado como
τ = F
0
(x
e
)+T
1
11
u. (3.22)
Considerando a dinˆamica do erro de acompanhamento, (3.13), o crit´erio de desempenho que
inclue um n´ıvel de atenua¸ao de dist´urbio desejado γ ´e definido como
min
u(·)∈L
2
max
0=d(·)∈L
2
0
1
2
x
T
(t)Qx(t)+
1
2
u
T
(t)Ru(t)
dt
0
1
2
d
T
(t)d(t)
dt
γ
2
, (3.23)
sendo Q e R matrizes de pondera¸ao sim´etricas definidas positivas e x(0) = 0 . Este crit´erio de
desempenho ´e semelhante ao apresentado em (3.15), sendo que neste caso matrizes de pondera¸ao
ao acrescentadas no estado e na entrada de controle.
Asolu¸ao do problema de controle H
(3.23) relacionado `a equa¸ao de estado (3.4), pode
ser explicitamente encontrada pela teoria dos jogos diferenciais (Basar e Bernhard, 1990; Basar
e Olsder, 1982) e uma escolha apropriada da fun¸ao de Lyapunov V (x, t) (Chen et al., 1994).
A metodologia apresentada por Chen et al. (1994) para resolver este problema ´e resumida a
seguir. O crit´erio de desempenho (3.23) pode ser modificado para formar o seguinte problema
minimax
min
u(·)∈L
2
max
0=d(·)∈L
2
0
1
2
x
T
(t)Qx(t)+
1
2
u
T
(t)Ru(t)
1
2
γ
2
d
T
(t)d(t)
dt 0,
com x(0) = 0. Definindo a fun¸ao custo
J(x(t),u,d,t)=
t
L(x(s),u(s),d(s))ds,
sendo L(x, u, d) o Lagrangiano dado por
L(x, u, d)=
1
2
x
T
(t)Qx(t)+
1
2
u
T
(t)Ru(t)
1
2
γ
2
d
T
(t)d(t).
21
Definindo-se a fun¸ao de Lyapunov
V (x(t),t)=min
u(·)
max
d(·)
J(x(t),u,d,t),
o crit´erio de desempenho (3.23) fica
V (x(0), 0) = min
u(·)
max
d(·)
J(x(0),u,d,0) 0,
com x(0) = 0. De acordo com a teoria dos jogos diferenciais, a solu¸ao deste problema minimax
´e encontrada se existir uma fun¸ao de Lyapunov continuamente diferenci´avel V (x, t) que satisfaz
a seguinte equa¸ao minimax de Bellman-Isaacs
∂V (x, t)
∂t
=min
u(·)
max
d(·)
L(x, u, d)+
∂V (x, t)
x
T
˙
x
,
com condi¸ao terminal V (x(), ) = 0. Escolhendo a fun¸ao de Lyapunov da forma
V (x, t)=
1
2
x
T
P (x, t)x, (3.24)
sendo P uma matriz sim´etrica definida positiva para todo t, a equa¸ao de Bellman-Isaacs fornece
a seguinte equa¸ao de Riccati
˙
P + PA
T
+ A
T
T
P PB
T
R
1
1
γ
2
T
2
11
B
T
T
P + Q =0.
O controle ´otimo correspondente e o pior caso de dist´urbio s˜ao dados, respectivamente, por
u
= R
1
B
T
T
P x
e
d
=
1
γ
2
B
T
T
P x.
Com uma escolha apropriada da matriz P e sendo a matriz (C
0
q
2
)
1
2
˙
M
0
)anti-sim´etrica
(Chen et al., 1994), a equa¸ao de Riccati pode ser simplificada para uma equa¸ao matricial
alg´ebrica. De acordo com Chen et al. (1994); Johansson (1990) uma escolha apropriada para P
´e feita em fun¸ao de M
0
, T
0
e uma matriz K sim´etrica definida positiva a ser determinada, ou
22
seja,
P = T
T
0
M
0
0
0 K
T
0
. (3.25)
A equa¸ao alg´ebrica simplificada ´e dada por
0 K
K 0
T
T
0
[I 0]
T
R
1
1
γ
2
T
2
11
[I 0]T
0
+ Q =0. (3.26)
O controle ´otimo e o pior dist´urbio podem ser reescritos, respectivamente como
u
= R
1
[I 0]T
0
x (3.27)
e
d
=
T
11
γ
2
[I 0]T
0
x.
A condi¸ao terminal ´e satisfeita para esta escolha de P , (Chen et al., 1994).
3.4 Controle H
ao linear baseado em modelo fuzzy
Takagi Sugeno
Nesta se¸ao, duas abordagens de controle robusto baseadas em ogica fuzzy ser˜ao aplicadas
em RMRs, seguindo as linhas desenvolvidas em Ge et al. (1998); Chang (2000, 2005) . Duas
hip´oteses ser˜ao consideradas: na primeira, os termos das equa¸oes (3.11) e (3.12) F
0
(x
e
)e
ΔF
0
(x
e
)s˜ao considerados desconhecidos e na segunda F
0
(x
e
e considerado conhecido e apenas
as incertezas ΔF
0
(x
e
)s˜ao consideradas desconhecidas.
Para o primeiro caso, onde os termos F
0
(x
e
)eΔF
0
(x
e
)domodelodoRMRs˜ao considerados
desconhecidos, um modelo fuzzy T-S
ˆ
F (x
e
, Θ), formado por um conjunto de modelos fuzzy, ´e
proposto para estimar ambos os termos.
Em geral, um sistema fuzzy consiste de quatro partes: um fuzzificador, uma base de regras,
um procedimento de inferˆencia e um defuzzificador. O fuzzificador ´eummapeamentodouniverso
de discurso de entrada U R
r
dos conjuntos fuzzy definidos em U. Dois fatores determinam a
interface de fuzzifica¸ao: (i) o n´umero de conjuntos fuzzy definidos no universo de discurso de
entrada e (ii) as fun¸oes de pertinˆencia relacionadas com esses conjuntos.
23
A base de regras ´e formada por um conjunto de proposi¸oes lingu´ısticas do tipo
SE premissas s˜ao satisfeitas,
ENT
˜
AO conseq¨encias s˜ao inferidas.
Om´etodo de T-S ´e caracterizado por uma base de regras que utiliza conseq¨uentes funcionais ao
inv´es de conseq¨uentes fuzzy, na forma
SE u
1
´e A
11
e u
2
´e A
12
e ...e u
r
´e A
1r
,
ENT
˜
AO y
1
= p
10
+ p
11
u
1
+ p
12
u
2
+ ...+ p
1r
u
r
.
.
.
.
SE u
1
´e A
k1
e u
2
´e A
k2
e ...e u
r
´e A
kr
,
ENT
˜
AO y
k
= p
k0
+ p
k1
u
1
+ p
k2
u
2
+ ...+ p
kr
u
r
.
sendo A
ij
, j =1,...,r e i =1,...,k,vari´aveis lingu´ısticas referentes aos conjuntos fuzzy
definidos sobre os espa¸cos de entrada U
1
, U
2
, ..., U
r
; u
1
, u
2
, ..., u
r
valores das vari´aveis de
entrada e k on´umero de regras fuzzy.
O procedimento de inferˆencia ´eal´ogica da tomada de decis˜ao que aplica as regras fuzzy para
determinar a sa´ıda correspondente `as entradas fuzzificadas. A sa´ıda inferida pelo sistema fuzzy
atr´av´es do etodo de T-S ´e crisp (portanto n˜ao necessita de um defuzzificador), definida pela
edia ponderada das sa´ıdas y
i
de cada subsistema linear
y =
k
i=1
μ
i
y
i
k
i=1
μ
i
= ψθ, (3.28)
sendo
ψ =[β
1
,...,β
k
,u
1
β
1
,...,u
1
β
k
,...,u
r
β
k
],
β
i
=
μ
i
k
i=1
μ
i
,
θ =[p
10
,...,p
k0
,p
11
,...,p
k1
,...,p
kr
]
os parˆametros os quais definem as fun¸oes de conseq¨encias y
i
= fx) para cada regra e μ
i
´e o grau de liberdade da iesima regra, definido como o m´ınimo entre os graus de pertinˆencia
associados `as entradas nos conjuntos fuzzy ativados pela iesima regra:
μ
i
:= A
i1
(u
1
) A
i2
(u
2
) ... A
ir
(u
r
). (3.29)
O modelo fuzzy T-S,
ˆ
F (x
e
, Θ), proposto para estimar F
0
(x
e
)eΔF
0
(x
e
), ´e definido como
24
segue
ˆ
F (x
e
, Θ) = Y x, Ax), Θ) = [y
1
,...,y
n
]
T
=
ˆ
F
1
(x
e
1
)
.
.
.
ˆ
F
n
(x
e
n
)
=
ψ
1
θ
1
.
.
.
ψ
n
θ
n
=
ψ
1
0 ... 0
0 ψ
2
.
.
.0
.
.
.
.
.
.
.
.
.
.
.
.
00... ψ
n
θ
1
θ
2
.
.
.
θ
n
(x
e
)(˜x, Ax))Θ, (3.30)
sendo Y o conjunto de sistemas fuzzy, ˜x ao as entradas fuzzy, Ax):=[A
1
q) A
2
(
˙
˜q)] representa
os conjuntos fuzzy definidos para as entradas de fuzzifica¸ao e n on´umero de atuadores rob´oticos,
que para o caso do RMR s˜ao dois (atuadores da roda direita e esquerda).
Considere uma regi˜ao de restri¸ao Ω
Θ
de parˆametros Θ. Para garantir que o parˆametro
estimado
ˆ
Θ(t) para todo t esteja dentro da regi˜ao de restri¸ao, um algoritmo de proje¸ao pode
ser usado. Considere Ω
0
= {Θ:Θ
T
Θ N }
Θ
=Θ:{Θ
T
Θ N } para algum N>0e
Δ > 0. De acordo com Chang (2000), define-se
Proj[Φ] =
Φ, se Θ
T
Θ N ou
T
Θ >N
T
Φ 0)
Φ
T
ΘN
T
Φ
δΘ
T
Θ
Θ, caso contr´ario
(3.31)
para alguma fun¸ao suave Φ(x
e
). Assume-se que exista um valor Θ
Ω
0
tal que
ˆ
F (x
e
, Θ
)pode
aproximar F (x
e
)omaispr´oximo poss´ıvel. Ummododealcan¸car o desempenho H
, quando
a rede neural ´eusadae considerar o erro de aproxima¸ao, ΔF (x
e
)=
ˆ
F (x
e
, Θ
) F (x
e
), como
dist´urbio. Essa abordagem foi usada em Chang e Chen (1997), onde o termo dinˆamico do robˆo
F (x
e
e aproximado por uma rede neural.
Em virtude do erro de aproxima¸ao incluir os efeitos de incertezas dinˆamicas, a integra¸ao
do termo quadr´atico na prova da estabilidade para a garantia do crit´erio H
se torna mais com-
plexa. Em Chang (2000) a solu¸ao desse problema tem sido obtida com a utiliza¸ao da t´ecnica
25
de controle por estrutura vari´avel (CEV), cujos detalhes podem ser vistos nessa referˆencia.
A utiliza¸ao do CEV requer que o erro de aproxima¸ao deva ser limitado por uma fun¸ao
dependente do estado, isto ´e, exite uma fun¸ao k(x
e
) > 0 tal que |F (x
e
))
i
|≤k(x
e
), para todo
1 i n.
Levando em conta o erro de aproxima¸ao m´ınimo ΔF (x
e
), a equa¸ao dinˆamica do erro com
respeito a ˜x pode ser obtida como
˙
˜x = A
T
q
2
x + B
T
T
11
(Ψ(x
e
F (x
e
)+τ)+B
T
d, (3.32)
com d = M
0
T
11
M
1
0
w.Opr´oximo teorema apresenta uma s´ıntese de um controlador adaptativo
H
baseado em modelo fuzzy T-S, considerando a estimativa completa do modelo do RMR. A
provadoteoremaabaixo´e similar ao apresentado em Chang (2000).
Teorema 3.4.1 Considere o sistema rob´otico descrito em (2.9) com d ∈L
2
[0, ). Dado um
ıvel de atenua¸ao γ>0 e uma matriz de ponderao Q = Q
T
> 0, se existirem uma matriz
sim´etrica definida positiva K = K
T
> 0 e uma matriz T
0
satisfazendo a equa¸ao alg´ebrica de
Riccati
0 K
K 0
T
T
0
[I 0]
T
R
1
1
γ
2
I
[I 0]T
0
+ Q = 0 (3.33)
sendo R a matriz de ganho tal que R<γ
2
I,ent˜ao a lei de controle adaptativo H
baseado em
modelo fuzzy T-S ´e dada por
τ (x
e
+ T
1
11
u + u
s
(3.34)
com
˙
Θ=Proj[H
1
Ψ(x
e
)
T
T
11
[I 0]T
0
˜x], (3.35)
u = R
1
[I 0]T
0
˜x, (3.36)
u
s
= k(x
e
)sgn(T
11
[I 0]T
0
˜x), (3.37)
sendo H o ganho adaptativo e sgn(T
11
[I 0]T
0
˜x)
Δ
=[sgn((T
11
[I 0]T
0
˜x)
1
) ...sgn((T
11
[I 0]T
0
˜x)
n
)]
T
.
Esta lei de controle garante que todas as vari´aveis do sistema em malha fechada (2.9, 3.34-3.37)
ao limitadas e que a seguinte desigualdade ´e satisfeita
T
0
˜x
T
Q˜x + u
T
Ru
dt ˜x
T
(0)P
0
˜x(0) +
˜
Θ
T
(0)H
˜
Θ(0) + γ
2
T
0
(d
T
d)dt.
26
Prova 1 Considere a seguinte equa¸ao de Lyapunov
V x,
˜
Θ,t)=
1
2
˜x
T
P ˜x +
1
2
˜
Θ
T
H
˜
Θ (3.38)
Tomando a derivada de V em rela¸ao ao tempo, obt´em-se
˙
V x,
˜
Θ,t)=
1
2
˜x
T
˙
P ˜x +
1
2
˙
˜x
T
P ˜x +
1
2
˜x
T
P
˙
˜x +
1
2
˙
˜
Θ
T
S
˜
Θ+
1
2
˜
Θ
T
S
˙
˜
Θ. (3.39)
Substituindo (3.32) em (3.39), tem-se
˙
V x,
˜
Θ,t)=
1
2
˜x
T
˙
P ˜x +
1
2
˜x
T
A
T
T
q
2
)+[B
T
T
11
(Ψ(x
e
F (x
e
)+τ)+B
T
d]
T
P ˜x (3.40)
+
1
2
˜x
T
P [A
T
q
2
x + B
T
T
11
(Ψ(x
e
F (x
e
)+τ)+B
T
d]+
˙
˜
Θ
T
S
˜
Θ.
Usando o controlador (3.34) e definindo
˜
Θ
Δ
Θ
, a derivada de
˙
V torna-se
˙
V x,
˜
Θ,t)=
1
2
˜x
T
(
˙
P + A
T
T
q
2
)P + PA
T
q
2
))˜x x
T
PB
T
(u + d)
x
T
PB
T
T
11
(u
s
F (x
e
)) + ˜x
T
PB
T
T
11
Ψ(x
e
)
˜
Θ+
˙
˜
Θ
T
H
˜
Θ. (3.41)
Considerando N =(C
0
q
2
)
1
2
˙
M
0
) anti-sim´etrica para todo t,amatrizP definida como em
(3.25) e manipulando o termo A
T
T
q
2
)P + PA
T
q
2
) de (3.41), obt´em-se
A
T
T
q
2
)P + PA
T
q
2
)=T
T
0
M
0
0
0 K
T
0
T
1
0
M
1
0
C
0
q
2
)0
T
1
11
T
1
11
T
12
T
0
+ T
T
0
M
1
0
C
0
q
2
) T
1
11
0 T
1
11
T
12
T
T
0
T
T
0
M
0
0
0 K
T
0
= T
T
0
C
0
q
2
)0
KT
1
11
KT
1
11
T
12
T
0
+ T
T
0
C
0
q
2
) KT
1
11
0 KT
1
11
T
12
T
0
= T
T
0
2C
0
q
2
) KT
1
11
KT
1
11
2KT
1
11
T
12
T
0
= T
T
0
0 KT
1
11
KT
1
11
2KT
1
11
T
12
T
0
+ T
T
0
2C
0
q
2
)0
00
T
0
=
0 K
K 0
+ T
T
0
˙
M
0
0
00
T
0
+ T
T
0
2N 0
00
T
0
. (3.42)
27
Manipulando o termo PB
T
, tem-se
PB
T
= T
T
0
M
0
0
0 K
T
0
T
1
0
M
1
0
0
= T
T
0
[I 0]
T
. (3.43)
Substituindo (3.42) e (3.43) em (3.41),
˙
V torna-se
˙
V =
1
2
˜x
T
T
T
0
˙
M
0
0
00
T
0
+
0 K
K 0
+ T
T
0
˙
M
0
0
00
T
0
+ T
T
0
2N 0
00
T
0
˜x
x
T
T
T
0
[I 0]
T
(u + d)+˜x
T
T
T
0
[I 0]
T
T
11
(u
s
F (x
e
))
x
T
T
T
0
[I 0]
T
T
11
Ψ(x
e
)
˜
Θ+
˙
˜
Θ
T
H
˜
Θ. (3.44)
ComoamatrizN ´e anti-sim´etrica, o termo quadr´atico que inclui a matriz N ´e zero, desse
modo (3.44) torna-se
˙
V x,
˜
Θ,t)=
1
2
˜x
T
0 K
K 0
˜x x
T
T
T
0
[I 0]
T
(u + d)+˜x
T
T
T
0
[I 0]
T
T
11
(u
s
F (x
e
))
x
T
T
T
0
[I 0]
T
T
11
Ψ(x
e
)
˜
Θ+
˙
˜
Θ
T
H
˜
Θ. (3.45)
Avaliando o termo ˜x
T
T
T
0
[I 0]
T
T
11
(u
s
F (x
e
)) e a lei de controle (3.37), observa-se que
˜x
T
T
T
0
[I 0]
T
T
11
u
s
= ˜x
T
T
T
0
[I 0]
T
T
11
k(x
e
)sgn(T
11
[I 0]T
0
˜x)
=
x
T
T
T
0
[I 0]
T
T
11
)
1
+ ...+(˜x
T
T
T
0
[I 0]
T
T
11
)
n
k(x
e
)sgn
x
T
T
T
0
[I 0]
T
T
11
)
1
.
.
.
x
T
T
T
0
[I 0]
T
T
11
)
n
= k(x
e
)[(˜x
T
T
T
0
[I 0]
T
T
11
)
1
sgn((˜x
T
T
T
0
[I 0]
T
T
11
)
1
)+...
+(˜x
T
T
T
0
[I 0]
T
T
11
)
n
sgn((˜x
T
T
T
0
[I 0]
T
T
11
)
n
)]
= k(x
e
)
|x
T
T
T
0
[I 0]
T
T
11
)
1
| + ...+ |x
T
T
T
0
[I 0]
T
T
11
)
n
|
= k(x
e
)
n
p=1
|x
T
T
T
0
[I 0]
T
T
11
)
p
|, (3.46)
28
e que
˜x
T
T
T
0
[I 0]
T
T
11
ΔF (x
e
)=
x
T
T
T
0
[I 0]
T
T
11
)
1
...x
T
T
T
0
[I 0]
T
T
11
))
n
F (x
e
))
1
.
.
.
F (x
e
))
n
=(˜x
T
T
T
0
[I 0]
T
T
11
)
1
F (x
e
))
1
+ ...+(˜x
T
T
T
0
[I 0]
T
T
11
)
n
F (x
e
))
n
≤|x
T
T
T
0
[I 0]
T
T
11
)
1
F (x
e
))
1
+ ...+(˜x
T
T
T
0
[I 0]
T
T
11
)
n
F (x
e
))
n
|
≤|x
T
T
T
0
[I 0]
T
T
11
)
1
F (x
e
))
1
| + ...+ |x
T
T
T
0
[I 0]
T
T
11
)
n
F (x
e
))
n
|
= |x
T
T
T
0
[I 0]
T
T
11
)
1
||F (x
e
))
1
| + ...+ |x
T
T
T
0
[I 0]
T
T
11
)
n
||F (x
e
))
n
|
=
n
p=1
|F (x
e
))
p
||x
T
T
T
0
[I 0]
T
T
11
)
p
| (3.47)
Levando-se em considerao (3.46) e (3.47), obt´em-se a seguinte desigualdade
˜xT
T
0
[I 0]
T
T
11
(u
s
F (x
e
)) (3.48)
≤−k(x
e
)
n
i=1
|x
T
T
T
0
[I 0]
T
T
11
)
i
| +
n
i=1
|F (x
e
))
i
||x
T
T
T
0
[I 0]
T
T
11
)
i
|
= k(x
e
)|x
T
T
T
0
[I 0]
T
T
11
)
1
| + |F (x
e
))
1
||x
T
T
T
0
[I 0]
T
T
11
)
1
| + ...+
k(x
e
)|x
T
T
T
0
[I 0]
T
T
11
)
n
| + |F (x
e
))
1
||x
T
T
T
0
[I 0]
T
T
11
)
n
|
=[|F (x
e
))
1
|−k(x
e
)] |x
T
T
T
0
[I 0]
T
T
11
)
1
| + ...
+[|F (x
e
))
n
|−k(x
e
)] |x
T
T
T
0
[I 0]
T
T
11
)
n
| (3.49)
Levando em considerao a suposi¸ao de CEV, |F (x
e
))
p
|≤k(x
e
) para todo 1 p n,
ent˜ao pode se garantir que
˜xT
T
0
[I 0]
T
T
11
(u
s
F (x
e
))
≤−k(x
e
)
n
p=1
|x
T
T
T
0
[I 0]
T
T
11
)
p
| +
n
p=1
|F (x
e
))
p
||x
T
T
T
0
[I 0]
T
T
11
)
p
|≤0.
(3.50)
Substituindo (3.33) e (3.50) em (3.45), obt´em-se
29
˙
V x,
˜
Θ,t)=
1
2
˜x
T
Q˜x
1
2
u
T
Ru
1
2
˜x
T
T
T
0
[I 0]
T
1
γ
2
[I 0]T
0
˜x x[I 0]
T
d
x
T
T
T
0
[I 0]
T
Ψ(x
e
)
˜
Θ+
˙
˜
Θ
T
H
˜
Θ. (3.51)
Somando e subtraindo
1
2
γ
2
d
T
d em 3.51 e sabendo que
1
2
1
γ
[I 0]T
0
˜x γd
T
1
γ
[I 0]T
0
˜x γd
=
1
2
˜x
T
T
T
0
[I 0]
T
1
γ
2
[I 0]T
0
˜x
xT
T
0
[I 0]
T
d
1
2
γ
2
d
T
d, (3.52)
em-se
˙
V x,
˜
Θ,t) ≤−
1
2
1
γ
[I 0]T
0
˜x γd
T
1
γ
[I 0]T
0
˜x γd
(3.53)
1
2
˜x
T
Q˜x
1
2
u
T
Ru +
1
2
γ
2
d
T
d x
T
T
T
0
[I 0]
T
T
11
Ψ(x
e
)
˜
Θ+
˙
˜
Θ
T
H
˜
Θ.
Desde que
˙
˜
Θ=
˙
Θ e usando o algoritmo de proje¸ao
˙
V x,
˜
Θ,t) ≤−
1
2
˜x
T
Q˜x
1
2
u
T
Ru +
1
2
γ
2
d
T
d. (3.54)
Integrando a inequa¸ao acima de t =0para t = T , resulta
V x(T ),
˜
Θ(T ),T) V x(0),
˜
Θ(0), 0)
≤−
1
2
T
0
x
T
Q˜x)dt
1
2
T
0
(u
T
Ru)dt +
γ
2
2
T
0
(d
T
d)dt. (3.55)
Desde que V (
˜
x(T ),
˜
Θ(T ),T) 0, a inequa¸ao acima resulta
T
0
˜x
T
Q˜x + u
T
Ru
dt ˜x
T
(0)P
0
˜x(0) +
˜
Θ
T
(0)H
˜
Θ(0) + γ
2
T
0
(d
T
d)dt. (3.56)
Al´em disso, desde que d ∈L
2
[0, ), ou seja, existe uma constante finita M
d
> 0 tal que
30
T
0
(d
T
d)dt M
d
, a inequa¸ao (3.55) tamb´em implica que
V x(T ),
˜
Θ(T ),T) V x(0),
˜
Θ(0), 0) +
1
2
γ
2
M
d
< . (3.57)
Isto implica que todos os estados e sinais do sistema de malha fechada s˜ao limitados.
Se considerarmos agora a hip´otese de que se conhece o modelo nominal do RMR e apenas
as incertezas do robˆo ser˜ao estimadas pelo modelo fuzzy T-S, a equa¸ao dinˆamica do erro passa
a ser escrita da seguinte forma
˙
˜x = A
T
q
2
x + B
T
T
11
(F
0
(x
e
) Ψ(x
e
F (x
e
)+τ)+B
T
d, (3.58)
com d = M
0
(q)T
11
M
1
0
(q)w. A lei de controle adaptativo H
baseadonomodelomatem´atico
do sistema nominal do RMR e no modelo fuzzy T-S ´e semelhante ao controlador apresentado
no Teorema 3.4.1 sendo que apenas o torque do controlador ´e reescrito da seguinte forma
τ = F
0
(x
e
)+Ψ(x
e
+ T
1
11
u + u
s
. (3.59)
Perceba que o modelo fuzzy T-S apenas complementa o modelo nominal F
0
(x
e
).
3.5 Controle H
ao linear baseado em redes neurais
Nesta se¸ao, as duas abordagens de controle robusto utilizadas na se¸ao anterior baseadas
em l´ogica fuzzy ser˜ao agora aplicadas em RMRs com base em redes neurais, seguindo as linhas
desenvolvidas em Ge et al. (1998); Chang (2000, 2005). Ambas as hip´oteses ser˜ao adotadas
novamente: primeiro consideram-se os termos das equa¸oes (3.11) e (3.12) F
0
(x
e
)eΔF
0
(x
e
)
desconhecidos e em seguida F
0
(x
e
e considerado conhecido e apenas as incertezas ΔF
0
(x
e
)s˜ao
consideradas desconhecidas.
Para o primeiro problema, onde os termos F
0
(x
e
)eΔF
0
(x
e
)domodelodoRMRs˜ao consi-
derados desconhecidos, uma rede neural
ˆ
F (x
e
, Θ), formada por um conjunto de redes neurais, ´e
proposta para estimar ambos os termos.
Definem-se n redes neurais ξ
T
k
Θ
k
, k =1, ··· ,n, compostas de neurˆonios ao lineares em todas
as camadas escondidas e neurˆonios lineares nas camadas de entrada e sa´ıda, com parˆametros
31
ajust´aveis Θ
k
na camada de sa´ıda (Chang, 2000; Chang e Chen, 1997), Fig. 3.1. As sa´ıdas das
redes neurais s˜ao da forma
ξ
T
k
Θ
k
=
p
k
i=1
H
5n
j=1
w
k
ij
x
e
j
+ m
k
i
Θ
ki
(3.60)
com
ξ
k
=
H
5n
j=1
w
k
1j
x
e
j
+ b
k
1
.
.
.
H
5n
j=1
w
k
p
k
j
x
e
j
+ b
k
p
k
, Θ
k
=
Θ
k1
.
.
.
Θ
kp
k
sendo p
k
on´umero de neurˆonios da camada escondida. Os pesos w
k
ij
eobiasb
k
i
para 1 i p
k
,
1 j 5n e1 k n ao assumidos constantes e especificados pelo projetista e H(.e
escolhida como sendo uma fun¸ao tangente hiperb´olica
H(z)=
e
z
e
z
e
z
+ e
z
.
Desse modo, a rede neural completa pode ser denotada por
ˆ
F (x
e
, Θ) =
ˆ
F
1
(x
e
, Θ
1
)
.
.
.
ˆ
F
n
(x
e
, Θ
n
)
=
ξ
1
Θ
1
.
.
.
ξ
n
Θ
n
=
ξ
1
0 ... 0
0 ξ
2
.
.
.0
.
.
.
.
.
.
.
.
.
.
.
.
00... ξ
n
Θ
1
Θ
2
.
.
.
Θ
n
Θ. (3.61)
Considere o algoritmo de proje¸ao (3.31) e assuma que exista um valor de parˆametro Θ
Ω
Θ
tal que
ˆ
F (x
e
, Θ
)podeaproximarF (x
e
)omaispr´oximo poss´ıvel. Seja ΔF (x
e
)=
ˆ
F (x
e
, Θ
)
F (x
e
), sem perda de generalidade assuma que exista uma fun¸ao k(x
e
) > 0 tal que |F (x
e
))
p
|≤
k(x
e
), para todo 1 p n.
Comessassuposi¸oes, o problema de controle H
ao linear baseado em redes neurais para
sistemas rob´oticos pode ser formulado como segue: dado um n´ıvel de atenua¸ao γ, encontre um
32
Figura 3.1: Rede Neural.
controlador adaptativo baseado em redes neurais com realimenta¸ao de estado
τ Θ+T
1
11
u + u
s
(3.62)
com
˙
Θ=Proj[Z
1
Ξ
T
T
11
[I 0]T
0
˜x] (3.63)
u = R
1
[I 0]T
0
˜x (3.64)
u
s
= k(x
e
)sgn(T
11
[I 0]T
0
˜x) (3.65)
tal que o seguinte ´ındice de desempenho seja satisfeito
T
0
˜x
T
Q˜x + u
T
Ru
dt ˜x
T
(0)P ˜x(0) +
˜
Θ
T
(0)Z
˜
Θ(0) + γ
2
T
0
(d
T
d)dt, (3.66)
sendo Q = Q
T
> 0,R = R
T
> 0,P = P
T
> 0eZ = Z
T
> 0, matrizes de pondera¸ao.
˜
Θ=Θ Θ
denota o erro de estimativa dos parˆametros neurais. O termo u
s
em (3.62) ´e
o controle CEV, usado para eliminar o efeito do erro de aproxima¸ao. Veja que em (3.62) o
33
termo ΞΘ ´e respons´avel pela estimativa de F
0
(x
e
)eΔF
0
(x
e
). De maneira similar `as solu¸oes da
matriz P apresentadas nos controladores robustos fuzzy descritos na se¸ao anterior, a solu¸ao
deste controlador ´e dada pela seguinte equa¸ao de Riccati
˙
P + PA
T
+ A
T
T
P + PB
T
R
1
1
γ
2
I
B
T
P + Q = 0 (3.67)
que por sua vez pode ser simplificada para uma equa¸ao alg´ebrica
0 K
K 0
T
T
0
[I 0]
T
R
1
1
γ
2
I
[I 0]T
0
+ Q = 0 (3.68)
sendo P redefinida como
P = T
T
0
M
0
0
0 K
T
0
.
Considerando o controlador H
ao linear baseado no modelo matem´atico do robˆo, que
representa F
0
(x
e
), e em redes neurais, para estimar o termo ΔF
0
(x
e
), vale a seguinte formula¸ao:
dado um n´ıvel de atenua¸ao γ, encontre um controlador adaptativo baseado em modelo e em
redes neurais com realimenta¸ao de estado
τ = F
0
(x
e
) + ΞΘ + T
1
11
u + u
s
(3.69)
com
˙
Θ=Proj[Z
1
Ξ
T
T
11
[I 0]T
0
˜x] (3.70)
u = R
1
[I 0]T
0
˜x (3.71)
u
s
= k(x
e
)sgn(T
11
[I 0]T
0
˜x) (3.72)
tal que o seguinte ´ındice de desempenho seja satisfeito
T
0
˜x
T
Q˜x + u
T
Ru
dt ˜x
T
(0)P ˜x(0) +
˜
Θ
T
(0)Z
˜
Θ(0) + γ
2
T
0
(d
T
d)dt, (3.73)
para matrizes de pondera¸ao Q = Q
T
> 0,R= R
T
> 0,P = P
T
> 0, Z = Z
T
> 0e
˜
Θ=ΘΘ
denota o erro de estimativa dos parˆametros neurais. O termo u
s
em (3.69) ´e o controle por
estrutura vari´avel, usado para eliminar o efeito do erro de aproxima¸ao. Veja em (3.69), que o
termo ΞΘ para essa nova vers˜ao do controlador estima toda incerteza ao modelada por F
0
(x
e
).
34
De maneira similar aos controladores definidos anteriormente, P ´e uma matriz sim´etrica
definida positiva cuja solu¸ao ´e dada pela seguinte equa¸ao de Riccati
˙
P + PA
T
+ A
T
T
P + PB
T
R
1
1
γ
2
I
B
T
P + Q =0. (3.74)
com as simplifica¸oes alg´ebricas equivalentes
0 K
K 0
T
T
0
[I 0]
T
R
1
1
γ
2
I
[I 0]T
0
+ Q =0. (3.75)
sendo P redefinida como
P = T
T
0
M
0
0
0 K
T
0
.
3.6 Solu¸ao da equa¸ao alg´ebrica de Riccati
A equa¸ao alg´ebrica de Riccati (3.26) pode ser resolvida com
T
0
=
R
T
1
Q
1
R
T
1
Q
2
0 I
,
K =
1
2
Q
T
1
Q
2
Q
T
2
Q
1
1
2
Q
T
21
+ Q
12
,
sendo a matriz R
1
o resultado da fatoriza¸ao de Cholesky
R
T
1
R
1
=
R
1
1
γ
2
I
1
,
a matriz sim´etrica definida positiva Q ´e fatorada como
Q =
Q
T
1
Q
1
Q
12
Q
T
12
Q
T
2
Q
2
,
35
e (3.26) fornece quatro equa¸oes distintas
Q
T
1
Q
1
T
T
11
R
1
1
γ
2
I
T
11
=0, (3.76)
K + Q
T
12
T
T
12
R
1
1
γ
2
I
T
11
=0, (3.77)
K + Q
12
T
T
11
R
1
1
γ
2
I
T
12
=0, (3.78)
Q
T
2
Q
2
T
T
12
R
1
1
γ
2
I
T
12
=0. (3.79)
36
37
Cap´ıtulo 4
Implementa¸ao
4.1 Robˆom´ovel com rodas
O RMR mostrado na Fig. 4.1 foi desenvolvido pelo Laborat´orio de Sistemas Inteligentes
(LASI) da Universidade de aoPauloemS˜ao Carlos. Este RMR consiste de uma base de
sustenta¸ao, dois motores DC com torque 0.29 N.m acoplados a rodas de borracha, seis pilhas
recarreg´aveis que totalizam 7, 2V e uma placa controladora.
A placa controladora consiste de um microcontrolador, um odulo RF (R´adio Frequˆencia)
eumm´odulo de acionamento dos motores.
O microcontrolador escolhido foi o MSP430F169 da Texas que possui as seguintes carac-
ter´ısticas: baix´ıssimo consumo de energia (330 μA no modo Active a 1 MHz e 2,2V; 1,1 μA
no modo Standby; 0,2 μA no modo Off de reten¸ao da RAM); alimenta¸ao entre 1,8 V a 3,6
V; CPU de 8 MHz com arquitetura RISC de 16 bits; 2048 B de RAM e 60 kB de mem´oria
de programa tipo flash, que pode ser usada para armazenar dados permanentes; 8 canais de
conversor AD de 12 bits; conversor DA de 12 bits; 2 timers de 16 bits com gerador de PWM;
48 terminais (pinos) de entrada/sa´ıda (I/O); 2 interfaces de comunica¸ao serial USART (SPI ou
I2C); DMA; encapsulamento QFP com 64 terminais (pinos). A programa¸ao do MSP430169 ´e
feitanopr´oprio circuito da placa controladora do robˆo diretamente de um computador, atraes
de uma interface padr˜ao JTAG.
Om´odulo de RF utiliza transceiver DR3000-1 da marca RF Monolithics (RFM). Foi desen-
volvido tamb´em uma placa de interface da serial do computador com o transceiver DR3000-1,
desse modo possibilitando a comunica¸ao via r´adio do computador com o RMR.
38
Figura 4.1: Foto do robˆom´ovel.
Om´odulo de acionamento dos motores, consiste de um circuito integrado L293D, tamb´em da
Texas que controla dois motores nos dois sentidos. O L293D trata-se de um circuito integrado
contendo 4 meias ponte H, ou seja, 2 pontes H completas (2 canais). Possui capacidade axima
de corrente de sa´ıda de 600 mA por canal e opera cargas com tens˜ao entre 4,5 V e 36 V.
Os parˆametros nominais do RMR da Fig. 4.1 ao a =0.17(m), b =0.065(m), d =
0.01(m), r =0.028(m), m
r
=0.075(kg), m
p
=0.597(kg) e momentos de inercias I
c
=
0.0022938(kg.m
2
), I
r
=0.000375(kg.m
2
) e I
m
=3.6788 × 10
7
(kg.m
2
).
4.2 Sistema de vis˜ao computacional
A localiza¸ao do robˆe feita encontrando a posi¸ao de centros de c´ırculos em etiquetas
fixadas sobre o robˆo em imagens bi-dimensionais monocrom´aticas, como mostrado em dos Reis
(2005), que ser˜ao adquiridas atrav´es de um sistema de vis˜ao computacional que consiste de uma
camera COHU H10x8M-II com resolu¸ao de 320 x 240 pixels e uma placa de aquisi¸ao PXC200F
com taxa de processamento de 30 quadros/seg. Para o m´etodo de detec¸ao de c´ırculos da Se¸ao
4.2.1, define-se a conven¸ao utilizada para processamento de imagens, como mostrado na Fig. 4.2,
sendo L on´umero de linhas e C on´umero de colunas da imagem digital, f(i, j) a intensidade
do n´ıvel de cinza da imagem na coordenada (i, j)comf(i, j) ∈{0, 1, 2, 3, 4, ..., 254, 255}, sendo
o valor 0 representando a cor preta e 255 a branca.
39
Figura 4.2: Conven¸ao: (a) imagem cont´ınua, (b) imagem digital.
4.2.1 Transformada de Hough circular
Esta se¸ao mostra um m´etodo para encontrar o centro de circunferˆencias de raio fixo, R.
Para isto utiliza-se uma ascara que tamem ´e uma circunferˆencia de raio R, cuja fun¸ao ´e
atualizar os valores de uma matriz de dimens˜ao (L +2R) × (C +2R) definida como matriz
acumuladora.
Om´etodo Transformada de Hough Circular, mostrado em Sonka et al. (1998), consiste em
posicionar o centro da ascara nos pixels da circunferˆencia da imagem e os valores dos pixels
nas posi¸oes correspondentes `a circunferˆencia da m´ascara na matriz acumuladora (inicialmente
zerada) s˜ao incrementadas de uma unidade. A Fig. 4.3b ilustra bem o m´etodo,
Figura 4.3: Transformada de Hough circular: (a) imagem, (b) matriz acumuladora.
40
sendo as circunferˆencias de linhas cont´ınuas a contribui¸ao da ascara, os losangos em
negrito os pixels da circunferˆencia da imagem considerada e o c´ırculo em negrito a regi˜ao de
maior contribui¸ao.
Ap´os percorrer toda a imagem a matriz acumuladora estar´a totalmente atualizada, e, por-
tanto, a posi¸ao do pixel de maior valor, denotada por f
max
(i, j), ser´a considerada o centro da
circunferˆencia na matriz acumuladora e conseq¨uentemente o centro da circunferˆencia na imagem
ser´a dado por
¯
i = i R
e
¯
j = j R.
O algoritmo 4.1 mostra como encontrar a postura de um robˆo usando a THC.
Algoritmo 4.1 Seq¨encia de passos para encontrar centros de circunferˆencias em imagem
usando a THC e determinar a postura de um RMR
1 - Coloque sobre o robˆotrˆes etiquetas de circunferˆencias de raio R (cor branca, por exemplo,
para um campo de atua¸ao de cor escura), tais que a edia das duas posi¸oes dos
centros das duas circunferˆencias, localizadas no fundo do robˆo, seja o ponto P
o
e a outra
circunferˆencia localizada no eixo de simetria, na frente do robˆo, bem afastada das outras
duas;
2 - Calibre o sistema capturando uma imagem e verificando o menor valor dos pixels per-
tencentes `as circunferˆencias;
3 - A cada quadro de imagem capturada, verificar quais os pixels ao supostamente per-
tencentes `as circunferˆencias (Valor do n´ıvel de cinza maior ou igual ao menor valor
encontrado na calibra¸ao) e atualizar a matriz acumuladora, conforme apresentada an-
teriormente;
4 - Encontre a posi¸ao na matriz acumuladora de maior valor de n´ıvel de cinza f
max
(i, j).
E, portanto, a posao da primeira circunferˆencia na imagem ser´a(
¯
i
1
,
¯
j
1
)=(i R, j R);
5 - Zerar uma regi˜ao na matriz acumuladora nas proximidades de (i R, j R);
6 - Encontre a posi¸ao na matriz acumuladora de maior valor de n´ıvel de cinza f
max
(i, j).
E, portanto, a posao da segunda circunferˆencia na imagem ser´a(
¯
i
2
,
¯
j
2
)=(i R, j R);
7 - Zerar uma regi˜ao na matriz acumuladora nas proximidades de (i R, j R);
8 - Encontre a posi¸ao na matriz acumuladora de maior valor de n´ıvel de cinza f
max
(i, j).
E, portanto, a posi¸ao da terceira circunferˆencia na imagem ser´a(
¯
i
3
,
¯
j
3
)=(i R, j R);
9-Aposi¸ao do robˆo, (x
o
,y
o
)=(
¯
i
o
,
¯
j
o
), ser´aam´edia entre as posi¸oes dos dois centros
das circunferˆencias mais pr´oximas;
10- A dire¸ao do robˆo ser´a dada pela inclina¸ao da reta que passa por (
¯
i
o
,
¯
j
o
)eaposi¸ao
do centro da circunferˆencia mais distante.
41
4.3 Ambiente de controle de RMR
A interface entre as ecnicas de controle desenvolvidas no Capitulo 3 e o robˆom´ovel com
rodas ´e feita atrav´es do ambiente de controle de RMR (ACRMR), que foi desenvolvido em C++.
O ACRMR funciona da seguinte maneira: a aquisi¸ao da imagem atraes da amera e localiza¸ao
do robˆo utilizando THC ´e feita em paralelo ao controle do RMR, que gera os torques que ao
transmitidos pela porta serial do computador para a placa de interface do computador com o
adio. O sistema de controle de acompanhamento de trajet´oria para RMR pode ser melhor
entendido na Se¸ao 4.4.
O ACRMR possibilita que o usu´ario visualize a imagem da amera em uma janela a parte
Fig. 4.3. Escolha qual controlador deseja utilizar atrav´es da caixa de sele¸ao do controlador.
a a possibilidade de alterar os parˆametros nominais do RMR e os ganhos dos controladores na
aba Parˆametros Fig. 4.5. Visualize os gr´aficos referentes ao experimento nas abas Gr´aficos A
Fig. 4.6 e Gr´aficos B Fig. 4.7. A visualiza¸ao dos dados de postura do RMR pode ser obtida na
tela principal. O controle manual do robˆopodeserfeitoviatecladoe,atrav´es do menu arquivo,
´eposs´ıvel configurar a porta serial do microcomputador e exportar os dados dos experimentos
para arquivos que podem ser lidos pelo Matlab.
Figura 4.4: Imagem da cˆamera visualizando o robˆo.
42
Figura 4.5: Ambiente de controle de RMR na aba de Parˆametros.
Figura 4.6: Ambiente de controle de RMR na aba de Gr´afico A.
43
Figura 4.7: Ambiente de controle de RMR na aba de Gr´afico B.
4.4 Experimentos
Os resultados experimentais foram obtidos usando o RMR descrito na Se¸ao 4.1, o sistema
de vis˜ao da Se¸ao 4.2 e o ACRMR da Se¸ao 4.3. A taxa de amostragem foi ajustada para 33 ms,
aquae utilizada para aquisi¸ao de imagem do sistema de vis˜ao computacional. Os comandos
de controle s˜ao gerados pelo ACRMR instalado em um computador com processador Pentium
4 de 3.2 GHz e 2GB de mem´oria RAM e ao enviados para o RMR atrav´es de um odulo de
adio frequˆencia com taxa de transmiss˜ao de 38400 bps.
A trajet´oria de referˆencia ´e definida por x
r
=0.0339t e y
r
=0.1132sen(0.3t), com a condi¸ao
inicial (x
o
o
,y
o
o
o
)=(0, 0, 0). Para o controlador baseado na cinem´atica, os ganhos foram
selecionados como k
x
=0.75, k
y
= 200 e k
α
=25.5. Para permitir uma an´alise de robustez dos
controladores, dist´urbios externos (Fig.4.8) foram introduzidos nos torques das rodas da forma
w
d
=0.05e
(t6)
4
sen(1.3πt)ew
e
= 0.15e
(t6)
4
sen(1.3πt).
44
0 5 10 15 20
0.15
0.1
0.05
0
0.05
0.1
0.15
Tempo (s)
Distúrbios (N.m)
W
d
W
e
Figura 4.8: Dist´urbios de torque aplicados `as rodas.
AFig.4.9mostraodiagramadeblocoscompletodaestrat´egia de controle do robˆom´ovel. E a
Fig. 4.10 mostra os controladores baseados na dinˆamica. A Fig. 4.10 (a) mostra os controladores
baseados somente no modelo do RMR, a Fig. 4.10 (b) o controlador robusto baseado em modelo
fuzzy T-S, a Fig. 4.10 (c) o controlador robusto baseado em modelo e em modelo fuzzy T-S,
a Fig. 4.10 (d) o controlador robusto baseado em redes neurais e a Fig. 4.10 (e) o controlador
robusto baseado em modelo e em redes neurais. O controlador Proporcional Derivativo em
conjunto com Torque Calculado (PD + TC) ser´a apresentado na Se¸ao 4.4.7.
45
Figura 4.9: Sistema de controle de acompanhamento de trajet´oria para robˆos m´oveis.
Figura 4.10: Controladores baseados na dinˆamica
46
4.4.1 Controle H
ao linear via representa¸ao quase-LPV
AmatrizdosistemaAq
2
)est´a em fun¸ao apenas das velocidades das rodas ˙q
2
. Portanto,
no projeto do controlador quase-LPV pode-se considerar como fun¸ao dos erros de velocidades
˙
q
2
. Assim o parˆametro ρ ´e definido como ρ(x)=
˙
q
2
. O conjunto P ´e dado por
π
˙
θ
d
π(rad/s)e π
˙
θ
e
π(rad/s),
sendo ν =[
¨
θ
d
max
¨
θ
e
max
]=[2.5π 2.5π](rad/s
2
), e P dividido em N = 3 para cada parˆametro
˙
θ
d
e
˙
θ
e
. As fun¸oes base, que s˜ao dependentes dos parˆametros, s˜ao selecionadas da seguinte forma
f
1
=10+cos
˙
θ
d
+sin
˙
θ
d
+cos
˙
θ
e
+sin
˙
θ
e
,
f
2
=cos
˙
θ
d
+sin
˙
θ
e
e
f
3
= sin
˙
θ
d
+cos
˙
θ
e
.
Essas fun¸oes foram selecionadas de maneira a acentuar a influˆencia da varia¸ao do erro
de velocidade das rodas no alculo dos ganhos dos torques. A desigualdade (3.18) ´e resolvida
usando o software MATLAB
[Gahinet et al. (1995)], sendo que em (3.16)
x = x, A(ρ(t)) =
A(
˙
q
2
)0
I 0
,B
2
=
I
2×2
0
,B
1
=
B
0
,
C
1
= I
4×4
e C
2
=0.
As matrizes X
i
ao encontradas para o melhor n´ıvel de atenua¸ao γ = 1655 (testes realizados
com as perturba¸oes e incertezas param´etricas) e s˜ao dadas por
X
1
=10
2
×
1.213 0.132 1.837 0.109
0.132 1.213 0.109 1.837
1.837 0.109 3.040 0.096
0.109 1.837 0.096 3.040
,
47
X
2
=10
2
×
1.214 0.132 1.841 0.109
0.132 1.214 0.109 1.841
1.841 0.109 3.044 0.097
0.109 1.841 0.097 3.044
,
X
3
=10
2
×
1.195 0.127 1.781 0.099
0.127 1.195 0.099 1.781
1.781 0.099 2.978 0.090
0.099 1.781 0.090 2.978
.
Os resultados s˜ao mostrados nas Figs. 4.11 a 4.18.
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.11: Acompanhamento de trajet´oria de referˆencia usando o controlador quase-LPV: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.12: Erros de posi¸ao usando o controlador quase-LPV: sem dist´urbio (esquerda) e com
dist´urbio (direita).
48
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.13: Erro de dire¸ao usando o controlador quase-LPV: sem dist´urbio (esquerda) e com
dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.14: Derivada dos erros de posi¸ao usando o controlador quase-LPV: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.15: Derivada do erro de dire¸ao usando o controlador quase-LPV: sem dist´urbio (es-
querda) e com dist´urbio (direita).
49
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.16: Velocidade angular da roda direita usando o controlador quase-LPV: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.17: Velocidade angular da roda esquerda usando o controlador quase-LPV: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.18: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador quase-LPV: sem dist´urbio (esquerda) e com dist´urbio (direita).
50
4.4.2 Controle H
ao linear via Teoria dos Jogos (TJ)
O controlador baseado na TJ ´e caracterizado por um n´ıvel de atenua¸ao γ =66.632. As
matrizes de podera¸ao selecionadas ao Q
1
= I
(2×2)
, Q
2
=0.5 × I
(2×2)
, Q
12
=0eR =10.8 ×
I
(2×2)
. Os resultados s˜ao mostrados nas Figs. 4.19 e 4.26.
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.19: Acompanhamento de trajet´oria de referˆencia usando o controlador TJ: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.20: Erros de posi¸ao usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio
(direita).
51
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.21: Erro de dire¸ao usando o controlador TJ: sem dist´urbio (esquerda) e com dist´urbio
(direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.22: Derivada dos erros de posi¸ao usando o controlador TJ: sem dist´urbio (esquerda)
e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.23: Derivada do erro de dire¸ao usando o controlador TJ: sem dist´urbio (esquerda) e
com dist´urbio (direita).
52
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.24: Velocidade angular da roda direita usando o controlador TJ: sem dist´urbio (es-
querda) e com dist´urbio (direita).
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.25: Velocidade angular da roda esquerda usando o controlador TJ: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.26: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador TJ: sem dist´urbio (esquerda) e com dist´urbio (direita).
53
4.4.3 Controle H
ao linear baseado em modelo fuzzy Takagi Sugeno
Um conjunto de sistemas fuzzy ´e definido
Y x, Ax), Θ) :=
y
1
([˜q(1)
˙
˜q(1)],Ax), Θ
1
)
y
2
([˜q(2)
˙
˜q(2)],Ax), Θ
2
)
sendo y
1
(.)ey
2
(.) a estimativa da dinˆamica das rodas direira e esquerda, respectivamente.
Os conjuntos fuzzy Ax)s˜ao definidos para o universo de discurso de erro de deslocamento,
u
1
q U
1
, e para o universo de discurso de erro de velocidade, u
2
=
˙
˜q U
2
, na Fig. 4.27.
3 2 1 0 1 2 3
0
0.2
0.4
0.6
0.8
1
1.2
μ
Erro de Deslocamento (rad) e Erro de Velocidade (rad/s)
A1 e A2 (Negativo)
A1 e A2 (Zero)
A1 e A2 (Positivo)
Figura 4.27: Conjunto fuzzy A
1
q) e conjunto fuzzy A
2
(
˙
˜q)
A base de regra fuzzy ´e dada por
R
1
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
1
R
2
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
2
R
3
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
3
R
4
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
4
R
5
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
5
R
6
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
6
R
7
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
7
R
8
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
8
R
9
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
9
O controlador H
´e caracterizado por um n´ıvel de atenua¸ao γ =66.632 e k(x
e
)=
1
100
˜x
T
˜x.
54
As matrizes de pondera¸ao selecionadas ao Q
1
= I
(2×2)
, Q
2
=0.5 × I
(2×2)
, Q
12
=0eR =
10.8 ×I
(2×2)
e H = 2000 ×I
(54×54)
. A lei de controle adaptativa para ajustar y
i
´e implementada
baseada em (3.35).
Os resultados s˜ao mostrados nas Figs. 4.28 a 4.35.
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.28: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em
modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.29: Erros de posi¸ao usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio
(esquerda) e com dist´urbio (direita).
55
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.30: Erro de dire¸ao usando o controlador baseado em modelo fuzzy T-S: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.31: Derivada dos erros de posi¸ao usando o controlador baseado em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.32: Derivada do erro de dire¸ao usando o controlador baseado em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio (direita).
56
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.33: Velocidades angulares da roda direita usando o controlador baseado em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.34: Velocidades angulares da roda esquerda usando o controlador baseado em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.35: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador baseado em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
57
4.4.4 Controle H
ao linear baseado em modelo e em modelo fuzzy
Takagi Sugeno
Um conjunto de sistemas fuzzy ´e definido como
Y x, Ax), Θ) :=
y
1
([˜q(1)
˙
˜q(1)],Ax), Θ
1
)
y
2
([˜q(2)
˙
˜q(2)],Ax), Θ
2
)
sendo y
1
(.)ey
2
(.) a estimativa da dinˆamica da roda direira e esquerda, respectivamente. Os
conjuntos fuzzy Ax)s˜ao definidos para o universo de discurso de erro de deslocamento, u
1
=
˜q U
1
, e para o universo de discurso de erro de velocidades, u
2
=
˙
˜q U
2
, na Fig. 4.36.
3 2 1 0 1 2 3
0
0.2
0.4
0.6
0.8
1
1.2
μ
Erro de Deslocamento (rad) e Erro de Velocidade (rad/s)
A1 e A2 (Negativo)
A1 e A2 (Zero)
A1 e A2 (Positivo)
Figura 4.36: Conjunto fuzzy A
1
q) e conjunto fuzzy A
2
(
˙
˜q)
A base de regra fuzzy ´e dada por
R
1
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
1
R
2
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
2
R
3
: SE (u
1
´e A
1
(Negativo)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
3
R
4
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
4
R
5
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
5
R
6
: SE (u
1
´e A
1
(Zero)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
6
R
7
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Negativo)) ENT
˜
AO y
7
R
8
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Zero)) ENT
˜
AO y
8
R
9
: SE (u
1
´e A
1
(Positivo)) e (u
2
´e A
2
(Positivo)) ENT
˜
AO y
9
58
O controlador H
´e caracterizado por um n´ıvel de atenua¸ao γ =66.632 e k(x
e
)=
1
100
˜x
T
˜x.
As matrizes de pondera¸ao selecionadas ao Q
1
= I
(2×2)
, Q
2
=0.5 × I
(2×2)
, Q
12
=0eR =
10.8 ×I
(2×2)
e H = 2000 ×I
(54×54)
. A lei de controle adaptativa para ajustar y
i
´e implementada
baseada em (3.35). Os resultados s˜ao mostrados nas figs. 4.37 a 4.44.
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.37: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em
modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.38: Erros de posi¸ao usando o controlador baseado em modelo e em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio (direita).
59
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.39: Erro de dire¸ao usando o controlador baseado em modelo e em modelo fuzzy T-S:
sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.40: Derivada dos erros de posi¸ao usando o controlador baseado em modelo e em
modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.41: Derivada do erro de dire¸ao usando o controlador baseado em modelo e em modelo
fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
60
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.42: Velocidades angulares da roda direita usando o controlador baseado em modelo e
em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.43: Velocidades angulares da roda esquerda usando o controlador baseado em modelo
e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.44: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador baseado em modelo e em modelo fuzzy T-S: sem dist´urbio (esquerda) e com dist´urbio
(direita).
61
4.4.5 Controle H
ao linear baseado em redes neurais
O controlador H
´e caracterizado por um n´ıvel de atenua¸ao γ =66.632 e k(x
e
)=
1
200
˜x
T
˜x.
As matrizes de pondera¸ao selecionadas foram Q
1
= I
(2×2)
, Q
2
=0.5 × I
(2×2)
, Q
12
=0,
R =10.8 × I
(2×2)
e Z = 3000 × I
(14×14)
. A lei de controle adaptativa para ajustar y
i
´eim-
plementada baseada na Equa¸ao (3.63). Definem-se
ˆ
F (x
e
, Θ) =
ˆ
F
1
(x
e
, Θ
1
)
ˆ
F
2
(x
e
, Θ
2
)
T
com p
k
= 7 neurˆonios na camada escondida, o vetor de bias b
k
=[ 3 2 10123]e
a matriz de pesos para a primeira camada Ω
k
i
=[ω
k
ij
]=[ 1 1 1 1111111].
Os parˆametros Θ s˜ao definidos como
Θ=
Θ
1
Θ
2
com
Θ
1
=[θ
11
θ
12
θ
13
θ
14
θ
15
θ
16
θ
17
]
T
,
Θ
2
=[θ
21
θ
22
θ
23
θ
24
θ
25
θ
26
θ
27
]
T
e a matriz Ξ pode ser calculada como
Ξ=
ξ
T
1
0
0 ξ
T
2
,
com ξ
T
1
=[ξ
11
, ···
17
]eξ
T
2
=[ξ
21
, ···
27
].
Os resultados s˜ao mostrados nas Figs. 4.45 a 4.52.
62
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.45: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em
redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.46: Erros de posi¸ao usando o controlador baseado em redes neurais: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.47: Erro de dire¸ao usando o controlador baseado em redes neurais: sem dist´urbio
(esquerda) e com dist´urbio (direita).
63
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.48: Derivada dos erros de posi¸ao usando o controlador baseado em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.49: Derivada do erro de dire¸ao usando o controlador baseado em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.50: Velocidades angulares da roda direita usando o controlador baseado em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
64
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.51: Velocidades angulares da roda esquerda usando o controlador baseado em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.52: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador baseado em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
65
4.4.6 Controle H
ao linear baseado em modelo e em redes neurais
O controlador H
´e caracterizado por um n´ıvel de atenua¸ao γ =66.632 e k(x
e
)=
1
200
˜x
T
˜x.
As matrizes de pondera¸ao selecionadas foram Q
1
= I
(2×2)
, Q
2
=0.5 × I
(2×2)
, Q
12
=0,R =
10.8 × I
(2×2)
e Z = 3000 × I
(14×14)
.
A lei de controle adaptativa para ajustar y
i
´e implementada baseada na Equa¸ao (3.70).
Definem-se Δ
ˆ
F (x
e
, Θ) =
Δ
ˆ
F
1
(x
e
, Θ
1
ˆ
F
2
(x
e
, Θ
2
)
T
com p
k
= 7 neurˆonios na camada
escondida, o vetor de bias b
k
=[ 3 2 1 0 1 2 3 ] e a matriz de pesos para a primeira
camada Ω
k
i
=[ω
k
ij
]=[1 1 1 1111111]. Osparˆametros Θ ao definidos
como
Θ=
Θ
1
Θ
2
com
Θ
1
=[θ
11
θ
12
θ
13
θ
14
θ
15
θ
16
θ
17
]
T
,
Θ
2
=[θ
21
θ
22
θ
23
θ
24
θ
25
θ
26
θ
27
]
T
e a matriz Ξ pode ser calculada como
Ξ=
ξ
T
1
0
0 ξ
T
2
,
com ξ
T
1
=[ξ
11
, ···
17
]eξ
T
2
=[ξ
21
, ···
27
].
Os resultados s˜ao mostrados nas Figs. 4.53 a 4.60.
66
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.2
0.09
0.11
Ampliação
Figura 4.53: Acompanhamento de trajet´oria de referˆencia usando o controlador baseado em
modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.54: Erros de posi¸ao usando o controlador baseado em modelo e em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.55: Erro de dire¸ao usando o controlador baseado em modelo e em redes neurais: sem
dist´urbio (esquerda) e com dist´urbio (direita).
67
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.56: Derivada dos erros de posi¸ao usando o controlador baseado em modelo e em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.57: Derivada do erro de dire¸ao usando o controlador baseado em modelo e em redes
neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.58: Velocidades angulares da roda direita usando o controlador baseado em modelo e
em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
68
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.59: Velocidades angulares da roda esquerda usando o controlador baseado em modelo
e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.60: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador baseado em modelo e em redes neurais: sem dist´urbio (esquerda) e com dist´urbio
(direita).
69
4.4.7 Controle proporcional derivativo e torque calculado (PD+TC)
O controle PD consiste de um controle independente para cada roda, dado por
u
d
= [θ
d
θ
d
d
]k
p1
[
˙
θ
d
˙
θ
d
d
]k
d1
,
u
e
= [θ
e
θ
d
e
]k
p2
[
˙
θ
e
˙
θ
d
e
]k
d2
,
(4.1)
sendo os ganhos proporcionais e derivativos ajustados em K
p1
= K
p2
=50eK
d1
= K
d2
= 100,
tais que os erros de postura sem dist´urbios e incertezas fiquem pr´oximos aos dos erros dos
controladores via controle H
. Os torques aplicados ao robˆom´ovel ao obtidos considerando
(3.5), que de fato ´e a equa¸ao conhecida do torque calculado. Os resultados s˜ao mostrados nas
figs. 4.61 a 4.68.
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
0.05 0.1
0.05
0.1
Ampliação
0 0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.05
0
0.05
0.1
0.15
x(t) (m)
y(t) (m)
Referência
Robô Móvel
Figura 4.61: Acompanhamento de trajet´oria de referˆencia usando o controlador PD + TC: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
0 5 10 15 20
0.08
0.06
0.04
0.02
0
0.02
0.04
Tempo (s)
Erro de posição (m)
x
e
y
e
Figura 4.62: Erros de posi¸ao usando o controlador PD + TC: sem dist´urbio (esquerda) e com
dist´urbio (direita).
70
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
0 5 10 15 20
0.8
0.6
0.4
0.2
0
0.2
0.4
0.6
0.8
Tempo (s)
Erro de direção (rad)
α
e
Figura 4.63: Erro de dire¸ao usando o controlador PD + TC: sem dist´urbio (esquerda) e com
dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
0.05
Tempo (s)
Derivadas dos erros de posição (m/s)
˙x
e
˙y
e
Figura 4.64: Derivada dos erros de posi¸ao usando o controlador PD + TC: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
0 5 10 15 20
0.04
0.03
0.02
0.01
0
0.01
0.02
0.03
0.04
Tempo (s)
Derivada do erro de direção (rad/s)
˙α
e
Figura 4.65: Derivada do erro de dire¸ao usando o controlador PD: sem dist´urbio (esquerda) e
com dist´urbio (direita).
71
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
0 5 10 15 20
3
2
1
0
1
2
3
4
Tempo (s)
Velocidades angulares da roda direita (rad/s)
˙
θ
d
d
˙
θ
d
Figura 4.66: Velocidades angulares da roda direita usando o controlador PD + TC: sem dist´urbio
(esquerda) e com dist´urbio (direita).
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
0 5 10 15 20
1
0.5
0
0.5
1
1.5
2
2.5
Tempo (s)
Velociades angulares da roda direita (rad/s)
˙
θ
d
e
˙
θ
e
Figura 4.67: Velocidades angulares da roda esquerda usando o controlador PD + TC: sem
dist´urbio (esquerda) e com dist´urbio (direita).
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
0 5 10 15 20
0
0.05
0.1
0.15
0.2
0.25
Tempo (s)
Torques (N.m)
τ
d
τ
e
Figura 4.68: Torques τ
d
e τ
e
aplicados `as rodas direita e esquerda, respectivamente, usando o
controlador PD +TC: sem dist´urbio (esquerda) e com dist´urbio (direita).
72
4.4.8 Estudo comparativo
Os controladores foram comparados baseados nos seguintes ´ındices de desempenho
Norma L
2
dos erros de posi¸ao e velocidade
L
2
[e]=
1
(t
r
t
0
)
t
r
t
0
e
2
2
dt
1
2
,
sendo e =
q
e
˙q
e
T
,
Energia total
E[τ]=
2
i=1
t
r
t
0
τ
i
dt
sendo t
o
= 0 at´e t
r
= 20(s) o tempo de experimento e τ
i
(t) o torque da roda i (direita ou
esquerda).
Os resultados est˜ao apresentados na Tabela 4.1.
Tabela 4.1:
´
Indices de desempenho.
Controlador Sem dist´urbios Com dist´urbios
L
2
[e] E[τ] L
2
[e] E[τ ]
H
ao linear via quase-LPV 0.1585 2.5443 0.1695 2.6500
H
ao linear via TJ 0.1522 2.5695 0.1607 2.6619
Adap. H
ao linear T-S 0.1523 2.6067 0.1642 2.6797
Adap. H
ao linear modelo + T-S 0.1543 2.6019 0.1588 2.6168
Adap. H
ao linear RN 0.1519 2.6818 0.1649 2.6903
Adap. H
ao linear modelo + RN 0.1524 2.5795 0.1596 2.6215
PD+TC 0.1559 2.5173 0.2833 3.2083
Observa-se na Tabela 4.1 que sem a presen¸ca de dist´urbios, os controladores robustos e o
controlador PD + TC apresentaram resultados equivalentes do ponto de vista do erro acompa-
nhamento de trajet´oria. Vale ressaltar que o controlador PD + TC apresentou melhor economia
de energia. Com a presen¸ca de dist´urbios verifica-se que os controladores robustos apresen-
taram melhores resultados, em ambos os ´ındices utilizados, que o controlador PD + TC. Os
controladores robustos baseados em modelo e em t´ecnicas inteligentes apresentaram melhores
resultados tanto com rela¸ao ao erro de acompanhamento de trajet´oria como na economia de
energia em rela¸ao aos demais controladores robustos. A abordagem utilizando modelo fuzzy
73
Takagi Sugeno se destacou com rela¸ao a abordagem com redes neurais, nesses experimentos. Os
umeros obtidos na Tabela 4.1 est˜ao baseados na m´edia de cinco experimentos realizados com
o RMR. Para generalizar uma poss´ıvel superioridade dos modelos fuzzy com rela¸ao `as redes
neurais para este tipo de problema, a certamente a necessidade de mais estudos. Esse ´eum
dos aspectos a serem explorados em trabalhos futuros.
74
75
Cap´ıtulo 5
Conclus˜ao
Seis controladores robustos baseados no modelo dinˆamicodeumRMReemt´ecnicas inteli-
gentes, utilizando ecnicas de controle H
foram propostos para o problema de acompanhamento
de trajet´oria. Um ambiente de controle de RMRs (ACRMR) foi desenvolvido para realiza¸ao
de experimentos e estudos com RMRs. Um estudo comparativo entre os controladores conside-
rando dist´urbios externos foi realizado. Resultados experimentais em mostrado que ´e bastante
eficiente utilizar ecnicas inteligentes para estimar apenas a parte incerta do modelo nominal em
sistemas de controle robustos. Principalmente se considerarmos que nas estrat´egias adotadas
para esses controladores h´a garantia de estabilidade do sistema e o crit´erio H
´e satisfeito.
76
77
Referˆencias Bibliogr´aficas
Aicardi, M., G. Casalino, A. Bicchi, e A. Balestrino (1995). Closed loop steering of unicycle like
vehicles via lyapunov techniques. IEEE Robotics & Automation Magazine 2 (1), 27–35.
Almeida, J., F. L. Pereira, e J. B. Sousa (1997). A hybrid feedback control system for a
nonholonomic car-like vehicle. In IEEE International Conference on Robotics and Automation,
Volume 3, pp. 2614 – 2619.
Apkarian, P. e R. J. Adams (1998). Advanced gain-scheduling techniques for uncertain systems.
IEEE Transactions on Control Systems Technology 6 (1), 21–32.
Basar, T. e P. Bernhard (1990). H
-Optimal Control and Related Minimax Problems. Berlin:
Birkhauser.
Basar, T. e J. Olsder (1982). Dynamic Noncooperative Game Theory. New York: Academic
Press.
Bianchi,R.A.C.,A.S.Sim˜oes, e A. H. R. Costa (2001). Comportamentos reativos para seguir
pistas em um robˆom´ovel guiado por vis˜ao. Simp´osio Brasileiro de Automa¸ao Inteligente (5,
Canela).
Bloch, A. M. e N. H. McClamroch (1989). Control of mechanical systems with classical nonho-
lonomic constraints. In IEEE Conference on Decision and Control, Volume 1, pp. 201–205.
Bloch, A. M. e N. H. McClamroch (1990). Controllability and stabilizability properties of a
nonholonomic control system. In IEEE Conference on Decision and Control, Volume 3, pp.
1312 – 1314.
Bozma, O. e R. Kuc (1994). A physical model-based analysis of heterogeneous environments
using sonar-endura method. IEEE Transactions on Pattern Analysis and Machine Intelli-
gence 16 (5), 497 – 506.
78
Brockett, R. W. (1983). Asymptotic stability and feedback stabilization. In Differential Geo-
metric Control Theory, R. W. Brockett, R. S. Millman and H. J. Sussmann, Boston, MA:
Birkh¨auser, pp. 181–191.
Campion, G., G. Bastin, e B. D’Andr´ea-Novel (1996). Strutural properties and classification of
kinematic and dynamic model of wheeled mobile robots. IEEE Transactions on Robotics and
Automation 12 (1), 47–62.
Chang, Y. C. (2000). Neural network-based H
tracking control for robotic systems. IEE
Proceedings of Control Theory Applications 147 (3), 303–311.
Chang, Y. C. (2005). Intelligent robust control for uncertain nonlinear time-varying systems
and its application to robotic systems. IEEE Transactions on Systems, Man and Cybernetics
- Part B: Cybernetics 35 (6), 1108–1119.
Chang, Y. C. e B. S. Chen (1997). A nonlinear adaptive H
tracking control design in robotic
systems via neural networks. IEEE Transactions on Control Systems Technology 5 (1), 13–29.
Chen, B. S., Y. C. Chang, e T. C. Lee (1997). Adaptive control in robotic systems with H
tracking performance. Automatica 33 (2), 227–234.
Chen, B. S., T. S. Lee, e J. H. Feng (1994). A nonlinear H
control design in robotic systems un-
der parameter perturbation and external disturbance. International Journal of Control 59 (2),
439–461.
Coelho, P. (2001). Aplica¸ao de lagrangianos na dinˆamica de robˆos oveis com rodas. Technical
Report, No. ISR-LCIR-2001/01 (Instituto de sistemas e rob´otica), Universidade de Coimbra,
Portugal.
Coelho, P. e U. Nunes (2003). Lie algebra application to mobile robot control: A tutorial.
Robotica 21, 483 – 493.
Corradini, M. L., G. Ippoliti, e S. Longhi (2003). Neural networks based conrol of mobile robots:
Development and experimental validation. journal of Robotic Systems 20 (10), 587–600.
Craig, J. (1985). Adaptive Control of Mechanical Manipulators. Addison-Wesley.
Do, K. D., Z. P. Jiang, e J. Pan (2004). Simultaneous tracking and stabilization of mobile robots:
an adaptive approach. IEEE Transactions on Automatic Control 49 (7), 1147 – 1151.
79
dos Reis, G. A. (2005). Controle H
ao linear de robˆos oveis com rodas. Disserta¸ao de
Mestrado, Escola de Engenharia de ao Carlos, Universidade de S˜ao Paulo, ao Carlos. 2005.
Fukao, T., H. Nakagawa, e N. Adachi (2000). Adaptive tracking control of a nonholonomic
mobile robot. IEEE Transactions on Robotics and Automation 16 (5), 609 – 615.
Gahinet, P., A. Nemiroviski, A. J. Laub, e M. Chilali (1995). LMI Control Toolbox. The
MathWorks Inc.
Ge, S. S., T. H. Lee, e C. J. Harris (1998). Adaptive Neural Network Control of Robotic Mani-
pulators. Singapore: World Scientific.
Gupta, G. S., C. H. Messom, e S. Demidenko (2005). Real-time identification and predictive con-
trol of fast mobile robots using global vision sensing. IEEE Transactions on Instrumentation
and Measurement 54 (1), 200 – 214.
Ho, C. T. e L. H. Chen (1995). A fast ellipse/circle detector using geometric symmetry. Pattern
Recognition 28 (1), 117–124.
Huang, Y. e A. Jadbabaie (1998). Nonlinear H
control: An enhanced quasi-lpv approach. In
IEEE International Conference on Decision and Control, 37, Tampa, Florida, USA. Workshop
in H
nonlinear control by J. C. Doyle, Caltech.
Hwang, C. K., B. S. Chen, e Y. T. Chang (2004). Combination of kinematical and robust dyna-
mical controllers for mobile robotics tracking control: (i) optimal H
control. In Proceedings
IEEE International Conference on Control Applications, pp. 1205–1210.
Ji, M., Z. Zhang, G. Biswas, e N. Sarkar (2003). Hybrid fault adaptive control of a wheeled
mobile robot. IEEE/ASME Transactions on Mechatronics 8 (2), 226 – 233.
Jiang, Z.-P. e H. Nijmeijer (1999). A recursive technique for tracking control of nonholonomic
systems in chained form. IEEE Transactions on Automatic Control 44 (2), 265 – 279.
Johansson, R. (1990). Quadratic optimization of motion coordination and control. IEEE Tran-
sactions on Automatic Control 35 (11), 1197–1208.
Kanayama, Y., Y. Kimura, F. Miyazaki, e T. Noguchi (1990). A stable tracking control method
for an autonomous mobile robot. In Proceedings IEEE International Conference on Robotics
and Automation, pp. 384 – 389.
80
Kimme, C. e J. Sklansky (1975). Finding circles by an array of accumulators. Communication
of the ACM 18(2), 120–122.
Krstic, M., I. Kanellakopoulos, e P. Kokotovic (1995). Nonlinear and Adaptive Control Design.
John Wiley and Sons, Inc., 605 Third Aveneu, New York, NY.
Lee, P., T. Dean, A. Yap, D. Walter, L. Kitchen, e N. Barnes (2004). On-board vision using
visual-servoing for robocup f-180 league mobile robots. ROBOCUP 2003: ROBOT SOCCER
WORLD CUP VII LECTURE NOTES IN COMPUTER SCIENCE 3020 , 422–433.
Lee, T.-C., K.-T. Song, C.-H. Lee, e C.-C. Teng (2001). Tracking control of unicycle-modeled
mobile robots using a saturation feedback controller. IEEE Transactions on Control Systems
Technology 9 (2), 305 – 318.
Lewis, F. L., C. T. Abdallah, e D. M. Dawson (1993). Control of robot manipulators. New York:
Macmillan.
Liu, H., H. Zha, e F. Lin (2004). Competition analysis system for soccer robots based on
global vision and trajectory restrictions. IEEE International Conference on Systems, Man
and Cybernetics 6, 5296 – 5300.
Luca, A. D., G. Oriolo, L. Paone, e P. R. Giordano (2002). Experiments in visual feedback
control of a wheeled mobile robot. In IEEE Conference on Robotics and Automation, pp.
2073–2078.
McLaughlin, R. A. e M. D. Alder (1998). The hough transform versus the upwrite. IEEE
Transactions on Pattern Analysis and Machine Intelligence 20 (4), 396–400.
M’Closkey, R. T. e R. M. Murray (1997). Exponential stabilization of driftless nonlinear control
systems using homogeneous feedback. Automatic Control, IEEE Transactions on 42 (5), 614
– 628.
Morin, P. e C. Samson (2000). Practical stabilization of a class of nonlinear systems. application
to chain systems and mobile robots. In IEEE Conference on Decision and Control, Volume 3,
pp. 2989 – 2994.
Oriolo, G., A. D. Luca, e M. Vendittelli (2002). Wmr control via dynamic feedback linearization:
Design, implementation, and experimental validation. IEEE Transactions Control Systems
Technology 10 (6), 835–852.
81
Postlethwaite, I. e A. Bartoszewicz (1998). Application of non-linear H
control to the tetrabot
robot manipulator. Proceedings of the Institution of Mechanical Engineers - Part I - Journal
of Systems and Control Engineering 212 (16), 459–465.
Samson, C. (1995). Control of chained systems application to path following and time-varying
point-stabilization of mobile robots. IEEE Transactions on Automatic Control 40 (1), 64–77.
Sarkar, N., X. Yun, e V. Kumar (1994). Control of mechanical systems with rolling constraints:
Application to dynamic control of mobile robots. Int. J. Rob. Res. 13 (1), 55–69.
Siqueira, A. A. G. e M. H. Terra (2004). Nonlinear and markovian H
controls of underactuated
manipulators. IEEE Transaction on Control Systems Technology 12 (6), 811–826.
Sonka, M., V. Hlavac, e R. Boyle (1998). Image Processing, Analysis, and Machine Vision.
Wiley Inter Science.
Takagi, T. e M. Sugeno (1985). Fuzzy identification of systems and its applications to modeling
and control. IEEE Transactions on Systems, Man and Cybernetics 15, 116–132.
Vendittelli, M. e G. Oriolo (2000). Stabilization of the general two-trailer system. In IEEE
International Conference on Robotics and Automation, Volume 2, pp. 1817 – 1823.
Wu, F. (1995). Control of linear parameter-varying systems. 150p. PhD Thesis - Department
of Mechanical Engineering, University of California, Berkeley. 1995.
Wu, F., X. H. Yang, A. Packard, e G. Becker (1996). Induced L
2
-norm control for lpv sys-
tems with bounded parameter variation rates. International Journal of Robust and Nonlinear
Control 6 (9-10), 983–998.
Yagi, Y., S. Kawato, e S. Tsuji (1994). Real-time omnidirectional image sensor (copis) for
vision-guided navigation. IEEE Transactions on Robotics and Automation 10 (1), 11–22.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo