Download PDF
ads:
ALEX DA SILVA TEMOTEO
AN
´
ALISE CONJUNTA DE FATORES:
DISTRIBUIC¸
˜
AO AMOSTRAL DA IMPORT
ˆ
ANCIA
RELATIVA POR SIMULAC¸
˜
AO DE DADOS
Disserta¸ao apresentada `a Universidade Fe-
deral de Vi¸cosa, como parte das exigˆencias do
Programa de os-gradua¸ao em Estat´ıstica
Aplicada e Biometria, para obten¸ao do
t´ıtulo de Magister Scientiae”.
VIC¸ OSA
MINAS GERAIS - BRASIL
2008
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ALEX DA SILVA TEMOTEO
AN
´
ALISE CONJUNTA DE FATORES:
DISTRIBUIC¸
˜
AO AMOSTRAL DA IMPORT
ˆ
ANCIA
RELATIVA POR SIMULAC¸
˜
AO DE DADOS
Disserta¸ao apresentada `a Universidade Fe-
deral de Vi¸cosa, como parte das exigˆencias do
Programa de os-gradua¸ao em Estat´ıstica
Aplicada e Biometria, para obten¸ao do
t´ıtulo de Magister Scientiae”.
APROVADA: 17 de novembro de 2008
Luiz Alexandre Peternelli Jos´e Ivo Ribeiro J´unior
Co-Orientador
Sebasti˜ao Martins Filho Val´eria Paula Rodrigues Minim
Carlos Henrique Os´orio Silva
Orientador
ads:
`
A minha ae Inez, `a minha esposa assia e
minha filha Isabelly.
ii
Agradecimentos
Agrade¸co primeiramente `a Deus, porque a f´e nos d´a for¸ca na hora que mais precisamos.
Agrade¸co tamem `as pessoas que direta ou indiretamente, participaram dessa con-
quista: minha esposa C´assia, pelo apoio, paciˆencia e credibilidade em mim depositada;
minha filha Isabelly, que ´e a raz˜ao de todas as minhas conquistas; minha ae Inez,
que com tanta dificuldade me apoiou e acreditou em mim em todos os momentos;
ao Professor Carlos Henrique, que al´em de meu orientador, me trata como um ver-
dadeiro amigo, e quero que saiba que a rec´ıproca tamb´em ´e verdadeira;
agradecimento especial `a Consuelo Arellano (North Carolina State University) pela
grande colabora¸ao e dicas de programa¸ao para simula¸ao dos dados no SAS;
`a Cleuza Salom´e, incentivadora e uma das respons´aveis por minha vinda para Vi¸cosa;
aos professores do departamento, que sempre se mostraram dispostos a ajudar;
aos membros da banca, pelo voto de confian¸ca;
ao Fernando Bastos pela for¸ca com o Tex;
Thiago, que sempre dava um jeito de dar uma navegada na internet (at´e que comprou
seu notebook); Danilo, meu companheiro de arroz com pequi e Maria Nilsa com a
fam´ılia, que veio para Vi¸cosa e ganhou um estimadorzinho.
`
As diretoras Rita Queiroz e Maria Am´elia da Escola Estadual Dr Mariano da Rocha,
pelo incentivo e disposi¸ao na elabora¸ao de documentos e esfor¸cos necess´arios para se
fazer o pedido de licen¸ca.
`a todos da UNIPAC, pela confian¸ca em mim depositada. Aos meus afilhados do sexto
per´ıodo da matem´atica 2008, turma que tive o prazer de, al´em de amigo, ser professor,
coordenador e paraninfo.
iii
Sum´ario
Lista de Figuras vi
Lista de Tabelas viii
Resumo x
Abstract xii
1 Introdu¸ao 1
1.1 Objetivos da Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Revis˜ao de Literatura 3
2.1 An´alise conjunta de fatores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Intervalos de confian¸ca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3 Material e M´etodos 12
3.1 An´alise conjunta de fatores, um estudo por simula¸ao de dados . . . . . . . . 12
3.1.1 Fatores e n´ıveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.2 Modelo utilizado na an´alise . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.3 Importˆancias Relativas (IR%) dos fatores . . . . . . . . . . . . . . . . 14
3.1.4 Simula¸ao de distribui¸oes alternativas para o erro aleat´orio do modelo
da ANCF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.5 Re-escalonamento das vari´aveis resposta Y obtidas na simula¸ao . . . 18
3.2 Apresenta¸ao dos resultados da simula¸ao . . . . . . . . . . . . . . . . . . . 19
3.2.1 Normalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2 Intervalos de confian¸ca . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.3 Erro M´edio Relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
iv
v
4 Resultados e Discuss˜ao 21
4.1 Valores simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1.1 Erros Aleat´orios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1.2 Vari´avel resposta Y . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1.3 Notas de aceita¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Distribui¸oes amostrais das importˆancias relativas geradas por simula¸ao . . 23
4.2.1 Intervalos de Confian¸ca . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.2.2 Erro M´edio Relativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5 Conclus˜oes 49
Referˆencias Bibliogr´aficas 51
Apˆendices 53
Apˆendice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Apˆendice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Apˆendice 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Lista de Figuras
2.1 Distribui¸oes dos erros aleat´orios com σ = 2, 8 para os tratamentos 1 e 36.
Modelos normal (N), em forma de U (FU), assim´etrico `a esquerda (AE) e `a
direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Distribui¸oes dos erros aleat´orios com σ = 0, 5 para os tratamentos 1 e 36.
Modelos normal (N), em forma de U (FU), assim´etrico `a esquerda (AE) e `a
direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Formas das distribui¸oes das vari´aveis resposta Y para os 10800 valores gera-
dos para o tratamento 1 e 36 com σ = 2, 8 . . . . . . . . . . . . . . . . . . . 29
2.4 Formas das distribui¸oes das vari´aveis resposta Y para os 10800 valores gera-
dos para o tratamento 1 e 36 com σ = 0, 5 . . . . . . . . . . . . . . . . . . . 30
2.5 Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) na forma
decimal para os 10800 valores gerados para o tratamento 1 e 36 com σ = 2, 8 31
2.6 Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) na forma
decimal para os 10800 valores gerados para o tratamento 1 e 36 com σ = 0, 5 32
2.7 Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) para os 10800
valores gerados para o tratamento 1 e 36 com σ = 2, 8 . . . . . . . . . . . . 33
2.8 Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) para os 10800
valores gerados para o tratamento 1 e 36 com σ = 0, 5 . . . . . . . . . . . . 34
2.9 Importˆancia relativa do fator A com a presen¸ca de erros na forma da dis-
tribui¸ao normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e
assim´etrica `a direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.10 Importˆancia relativa do fator B com a presen¸ca de erros na forma da dis-
tribui¸ao normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e
assim´etrica `a direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
vi
vii
2.11 Importˆancia relativa do fator C com a presen¸ca de erros na forma da dis-
tribui¸ao normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e
assim´etrica `a direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.12 Importˆancia relativa do fator D com a presen¸ca de erros na forma da dis-
tribui¸ao normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e
assim´etrica `a direita (AD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Lista de Tabelas
3.1 Fatores e respectivos n´ıveis considerados no estudo por simula¸ao de dados
para a an´alise conjunta de fatores . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Valores de referˆencia dos coeficientes de preferˆencia (β
si
) dos n´ıveis e das res-
pectivas importˆancias relativas (IR%) dos fatores utilizados no estudo por
simula¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 Tratamentos resultantes da combina¸ao no esquema fatorial completo, dos
n´ıveis dos fatores considerados no estudo por simula¸ao de dados, com os
respectivos valores dos efeitos fixos τ
j
/1
. . . . . . . . . . . . . . . . . . . . 15
4.1 Informa¸oes sobre os erros aleat´orios gerados para cada tipo de distribui¸ao
para os tratamentos 1 e 36 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Informa¸oes sobre as vari´aveis resposta y geradas para cada tipo de dis-
tribui¸ao para os tratamentos 1 e 36 . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Teste de normalidade(Kolmogorov-Smirnov), estat´ıstica do teste e p-valor
para as IR’s de cada fator para cada forma de distribui¸ao dos erros com
σ = 2, 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Teste de normalidade(Kolmogorov-Smirnov), estat´ıstica do teste e p-valor
para as IR’s de cada fator para cada forma de distribui¸ao dos erros com
σ = 0, 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.5 Limites inferior e superior dos intervalos de confian¸ca percentis a 95% para as
Importˆancias Relativas, com os respectivos valores de referˆencia (%), para os
fatores A, B, C e D em cada distribui¸ao alternativa para o erro com σ = 2, 8 43
4.6 Limites inferior e superior dos intervalos de confian¸ca percentis a 95% para as
Importˆancias Relativas, com os respectivos valores de referˆencia (%), para os
fatores A, B, C e D em cada distribui¸ao alternativa para o erro com σ = 0, 5 44
viii
ix
4.7 Limites inferior e superior dos intervalos de confian¸ca pela aproxima¸ao nor-
mal com 95% de confian¸ca (z = 1, 96) para as Importˆancias Relativas, com os
respectivos valores de referˆencia (IR%), para os fatores A, B, C e D em cada
distribui¸ao alternativa para o erro com σ = 2, 8 . . . . . . . . . . . . . . . . 45
4.8 Limites inferior e superior dos intervalos de confian¸ca pela aproxima¸ao nor-
mal com 95% de confian¸ca (z = 1, 96) para as Importˆancias Relativas, com os
respectivos valores de referˆencia (IR%), para os fatores A, B, C e D em cada
distribui¸ao alternativa para o erro com σ = 0, 5 . . . . . . . . . . . . . . . . 46
4.9 Valores m´edios das IR estimadas (
IR%), valores de referˆencia (IR%) e Erro
M´edio Relativo (EMR), para cada fator com a respectiva distribui¸ao do erro
aleat´orio, para σ = 2, 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.10 Valores m´edios das IR estimadas (
IR%), valores de referˆencia (IR%) e Erro
M´edio Relativo (EMR), para cada fator com a respectiva distribui¸ao do erro
aleat´orio, para σ = 0, 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Resumo
TEMOTEO, Alex da Silva M.Sc., Universidade Federal de Vi¸cosa, novembro de 2008.
An´alise conjunta de fatores: distribui¸ao amostral da Importˆancia Relativa por
simula¸ao de dados. Orientador: Carlos Henrique Os´orio Silva. Coorientadores: Luiz
Alexandre Peternelli, Fabyano Fonseca e Silva, Adair Jos´e Regazzi.
Conjoint analysis ou an´alise conjunta de fatores (ANCF) ´e uma an´alise de regress˜ao
que utiliza um modelo com vari´aveis explicativas indicadoras ou dummy, para se estudar
a preferˆencia de consumidores por tratamentos que podem ser servi¸cos ou produtos, e que
ao definidos pela combina¸ao de n´ıveis de diversos atributos ou fatores. Com esta t´ecnica
estima-se a Importˆancia Relativa (IR) de cada fator que comp˜oe os tratamentos avaliados.
Tais estudos ao importantes por permitir decidir, com base nas estimativas das IR de
cada fator, quais devem ser observados com maior aten¸ao na defini¸ao do tratamento.
No presente trabalho foi realizado um estudo por simula¸ao para se investigar a robustez
da distribui¸ao amostral do estimador da IR de um fator, `a varia¸oes na distribui¸ao do
erro aleat´orio do modelo de regress˜ao empregado na ANCF. Foram gerados erros aleat´orios
com a distribui¸ao normal e tamem trˆes outras distribui¸oes alternativas obtidas por uma
transforma¸ao de loca¸ao e escala da beta: uma distribui¸ao assim´etrica `a direita, outra
assim´etrica `a esquerda e uma com forma de U. Para cada distribui¸ao, utilizou-se desvio-
padr˜ao σ = 2, 8 e σ = 0, 5, portanto para oito condi¸oes foram simulados 100 conjuntos de
dados referentes a avalia¸oes (notas de aceita¸ao) de 108 consumidores para cada um dos 36
tratamentos formados pela combina¸ao de 4 fatores (A, B, C e D) num esquema fatorial
x
completo 3
2
× 2
2
. Definiu-se com base em um modelo de regress˜ao para ANCF, valores
de referˆencia para as IR’s iguais a 44,25%, 25,66%, 26,55% e 3,54%, respctivamente para
os fatores A, B, C e D. Na avalia¸ao dos resultados com base em intervalos de confian¸ca
percentil e pela aproxima¸ao normal, ambos a 95%, verificou-se intervalos mais estreitos
pela aproxima¸ao normal. Conforme esperado, verificou-se intervalos de confian¸ca para as
IR’s mais amplos quando σ = 2, 8.
Observou-se que todos os intervalos de confian¸ca inclu´ıram os valores das IR’s tomados
como referˆencia, exceto para os seguintes casos: (i) intervalo de confian¸ca pela aproxima¸ao
normal para a simula¸ao de erros com distribui¸ao normal e σ = 2, 8, para os fatores A
e B; (ii) com intervalo pela aproxima¸ao normal e σ = 0, 5, (iia) para os fatores A e C
com distribui¸ao normal, em forma de U e assim´etrica `a esquerda; (iib) para o fator B com
distribui¸ao em forma de U; e (iic) para o fator D com distribui¸ao normal e em forma de U .
Entretanto, neste casos de n˜ao inclus˜ao do valor IR de referˆencia nos intervalos, observou-se
que o valor estava pr´oximo ao limite do IC, tanto `a esquerda quanto `a direita. As estimativas
de IR obtidas no estudo por simula¸ao tamb´em foram avaliadas pelo Erro M´edio Relativo
(EMR) com rela¸ao aos respectivos valores de referˆencia. Exceto para o fator D na simula¸ao
com erros normais e σ = 2, 8, na qual se obteve EMR = 7, 91%, em todas as demais situa¸oes
simuladas obteve-se EMR < 5%. Adicionalmente, o teste de Kolmogorov-Smirnov indicou
normalidade (p > 0, 05) das distribui¸oes amostrais em todos os casos.
Concluiu-se que o estimador da IR pode ser considerado como robusto `a ao nor-
malidade da distribui¸ao do erro aleat´orio do modelo de regress˜ao utilizado na ANCF. Adi-
cionalmente, pode-se considerar que a distribui¸ao amostral da IR seja normal e que portanto
m´etodos inferenciais que requerem normalidade podem ser aplicados `as estimativas de IR’s
obtidas na ANCF.
xi
Abstract
TEMOTEO, Alex da Silva M.Sc., Universidade Federal de Vi¸cosa, november of 2008. Con-
joint analysis: sampling distribution of the Relative Importance by data simu-
lation Adviser: Carlos Henrique Os´orio Silva. Co-advisors: Luiz Alexandre Peternelli,
Fabyano Fonseca e Silva and Adair Jos´e Regazzi.
Conjoint analysis is a regression analysis that uses a model with dummy or indicator
explanatory variables to study consumer preference for treatments that can be products
or services, and are defined by combining levels of each attribute or factor. It allows the
estimation of the Relative Importance (RI) of each factor that makes up the treatments.
Such studies are important to help decide, based on RI estimates obtained from the CA, to
which factors should be given more attention when developing the products and/or services.
In this research work we conducted a simulation study in order to investigate the robustness
of the RI sampling distribution to departures from normality for the distribution of the
random error term ( ) of the CA model. We simulated four alternative distributions for
and generated data (acceptance notes) that allowed estimation of RI for hypothetical
factors A, B, C and D considered in our study. In addition to the normal distribution, we
used a location and scale transformation of the beta density to generate three alternative
distributions: right skewed, left skewed, and also an U-shape distribution. Each one of these
four distributions was tested with two standard error values (σ = 2.8 and 0.5) which resulted
in eight alternative scenarios. Our simulation study considered factors A and B with 3 levels
and factors C and D with two levels, hence 36 treatments in a full factorial design. We set
xii
reference RI values of 44.25%, 25.66%, 26.55% and 3.54%, respectively for factors A, B, C
and D, and simulated data such that each treatment was evaluated by 108 consumers. This
data set with 3888 observations was simulated 100 times for each scenario and analyzed by
CA which resulted in 100 RI estimates for each factor at every scenario.
Results were investigated by 95% confidence intervals (CI) using the usual normal
approximation and also percentile intervals, histograms of RI values sampling distribution
to check normality, and also we calculated relative mean errors of estimation (RME) with
respect to the reference RI values. It was observed that the confidence intervals included the
values of RI’s taken as reference in all scenarios, with the exception of: (i) factors A and B,
with the normal CI using normal distribuition and σ = 2.8; (ii) with normal CI and σ = 0.5,
(iia) for factors A and C with normal distribution, U shaped and left skewed; (iib) for factor
B with U shaped model and (iic) for factor D with normal distribution and U shaped. In all
these cases were the CI missed the RI reference value, we observed close miss left and miss
right results. We observed RME < 5% in all scenarios except for normal distribution and
factor D only, for which RME = 7.91%.
We concluded that the sampling distribution of the estimator of the RI of a factor is
relatively robust to departures from the normal distribution. In fact, results showed that
its sampling distribution must be close to the normal, regardless of the distribution of the
random error term of the CA model.
xiii
Cap´ıtulo 1
Introdu¸ao
Conjoint Analysis ou An´alise Conjunta de Fatores (ANCF) ´e uma an´alise de regress˜ao
que tem sido utilizada em estudos da preferˆencia do consumidor, tanto para avaliar produtos
quanto para avaliar servi¸cos (tratamentos).
Os tratamentos estudados ao formados pela combina¸ao de diversos n´ıveis de fatores
ou atributos. Por exemplo, a aceita¸ao e escolha de embalagens de ´oleo de soja, pode ser
entre embalagem PET ou Lata, pelas informa¸oes do r´otulo como marca (conhecida ou n˜ao),
presen¸ca ou ausˆencia de informa¸ao nutricional, informa¸ao sobre soja transgˆencia ou ao e
pre¸co alto ou baixo. Outro exemplo ´e a embalagem de couve minimamente processada, que
pode ser escolhida pela cor (verde ou amarelo), informa¸ao (com ou sem informa¸ao), tipo
de produ¸ao (orgˆanico, sem produtos qu´ımicos ou sem informa¸ao), visibilidade do produto
(pouca ou muita visibilidade) e pre¸co (baixo ou alto). Ainda nas ciˆencias agr´arias podemos
considerar a preferˆencia por frutos de ma¸a, que pode ser investigada quanto aos fatores cor
(vermelho ou verde), brix (baixo ou alto), tamanho do fruto (pequeno, m´edio ou grande) e
acidez (baixo ou alto).
Os trˆes exemplos citados foram propositalmente escolhidos da ´area de tecnologia de
alimentos, a qual foi respons´avel pela motivao do opico da presente disserta¸ao.
Outras ´areas do conhecimento tais como em ciˆencias humanas, ind´ustria hoteleira e de
presta¸ao de servi¸cos (bancos, lojas e seguradoras), ind´ustria automobil´ıstica, ind´ustria de
cal¸cados, etc. tamb´em empregam a ANCF em estudos que visam definir perfis de produtos
e servi¸cos.
1
1.1 Objetivos da Pesquisa
A importˆancia relativa (IR%) de um fator ou atributo ´e uma das principais informa¸oes
resultantes da aplica¸ao da ANCF. Por exemplo, se quatro fatores ao investigados tem-
se
4
i=1
IR
i
= 100% e ainda que IR
i
representa o impacto que o i-´esimo fator causa na
aceita¸ao do consumidor pelo tratamento. Portanto, se um fator possui IR = 80% ele ´e
mais importante do que um fator com IR = 10%. Mais importante no sentido de que deve
ser dado mais aten¸ao a ele na elabora¸ao do tratamento (defini¸ao do produto e/ou servi¸co).
Entretando, se a ANCF estima IR’s iguais a 20% e 22% para dois fatores, o que pode ser
conclu´ıdo quanto `a significˆancia estat´ıstica da diferen¸ca observada? Existem pesquisadores
que analisam os resultados aplicando-se testes de edia como Tukey e Duncan, onde uma
das pressuposi¸oes ´e a normalidade dos dados. Adicionalmente, como a vari´avel resposta ´e
uma nota de aceita¸ao, pode-se questionar a validade de se empregar um modelo de regress˜ao
que requer normalidade dos erros aleat´orios para validar testes de significˆancia. Portanto,
outra quest˜ao de interesse ´e a robustez da distribui¸ao amostral do estimador da IR de um
atributo `a varia¸oes na distribui¸ao do erro aleat´orio do modelo de regress˜ao empregado na
ANCF.
O entendimento destas quest˜oes permitir´a, em trabalhos futuros, que se construa testes
ou intervalos de confian¸ca para se inferir com base nas estimativas de IR obtidas na ANCF, e,
consequentemente uma melhor compreens˜ao dos resultados obtidos em estudos da aceita¸ao
que utlizam a ANCF.
No presente trabalho apresentaremos um estudo realizado com dados obtidos por si-
mula¸ao, visando-se investigar a robustez da distribui¸ao amostral do estimador da IR. O
objetivo geral deste trabalho ´e estudar o efeito da n˜ao normalidade da distribui¸ao dos erros
aleat´orios do modelo de regress˜ao empregado na ANCF. Como objetivos espec´ıficos temos:
comparar a amplitude e tamb´em a inclus˜ao dos valores das IR de referˆencia nos inter-
valos de confian¸ca percentis e tamem nos intevalos obtidos pela aproxima¸ao normal.
verificar se a distribui¸ao amostral do estimador da IR, pode ser considerada como
normal, mesmo com a ao normalidade da distribui¸ao dos erros aleat´orios.
verificar a acur´acia preditiva do estimador da IR, por interm´edio das estimativas dos
erros relativos edios.
2
Cap´ıtulo 2
Revis˜ao de Literatura
2.1 An´alise conjunta de fatores
O termo conjoint analysis ´e da l´ıngua inglesa e em portuguˆes a tradu¸ao como an´alise
conjunta de fatores (ANCF) foi proposta por CARNEIRO, SILVA E MINIM (2006). Outros
termos propostos ao an´alise de preferˆencia e an´alise combinada de fatores. ANCF ´e uma
t´ecnica que pode ser aplicada em qualquer ´area de tomada de decis˜oes.
Em Ciˆencias Agr´arias ou afins tais como na Ciˆencia e Tecnologia de Alimentos, a
ANCF ´e uma alternativa que vˆem sendo utilizada em estudos da inten¸ao de compra dos
consumidores por otulos e embalagens de alimentos.
´
E uma an´alise de regress˜ao utilizada para decompor a preferˆencia de indiv´ıduos por
tratamentos a ele apresentado em partes devidas a cada um dos fatores (ou atributos) que o
comp˜oem. Os denominados tratamentos podem ser objetos, servi¸cos, produtos, etc, mas estes
devem ser formados pela combina¸ao dos mesmos fatores, por´em em diferentes vers˜oes ou
n´ıveis.
´
E tamb´em uma metodologia fundamentada numa an´alise de decomposi¸ao, na qual os
entrevistados (ou consumidores) reagem a um produto informando sua aceita¸ao global sobre
3
ele e, `a partir desta, calcula-se o valor das contribui¸oes que cada n´ıvel de cada fator tem sobre
ela, decompondo-a (Green e Srinivasan, 1987). Desta forma, em vez do consumidor avaliar
cada fator (ou cada n´ıvel) separadamente, ele avalia conjuntamente os fatores, por meio
de combina¸oes dos seus n´ıveis, as quais formam os produtos em avalia¸ao (MOSKOWITZ
et al, 2004). Assim, assume-se que o tratamento avaliado pode ser decomposto em seus
componentes, podendo ser estimada a importˆancia que cada um deles tem sobre a decis˜ao
do consumidor (DELLA LUCIA, 2008).
Como uma regra geral, (SIQUEIRA, 2000) aconselha-se que nenhum dos fatores possua
n´umero de n´ıveis muito maior do que dos outros, pois isso faria com que esse fator chamasse
mais a aten¸ao em rela¸ao aos outros, o que implicaria em uma maior importˆancia relativa
para esse fator.
Se a vari´avel resposta for m´etrica ou ordinal, o etodo de estima¸ao geral-
mente utilizado ´e o M´etodo dos M´ınimos Quadrados (MMQ). Quando a vari´avel dependente
´e bin´aria, deve-se fazer uso do M´etodo da axima Verossimilhan¸ca (MMV) (SIQUEIRA,
2000). Os resultados da ANCF ao avaliados quanto `a contribui¸ao de cada n´ıvel de cada
fator e quanto `as importˆancias relativas dos fatores (SAS, 1993), conforme explicaremos re-
sumidamente a seguir, adaptado de CARNEIRO, SILVA E MINIM (2006). Considere um
experimento com n fatores cada um com m
i
n´ıveis, sendo estes fatores vari´aveis qualita-
tivas ou quantitativas. Cada tratamento ´e obtido pela combina¸ao dos n´ıveis dos fatores,
portanto, os tratamentos constituem um fatorial. Todos os tratamentos (fatorial completo)
ou uma parte cientificamente estabelecida (fatorial fracionado) ao submetidos `a avalia¸ao
pelos consumidores, em geral quanto `a aceita¸ao ou inten¸ao de compra. Os tratamentos
4
ao apresentados aos consumidores e estes podem, por exemplo, atribuir notas, em uma
escala previamente estabelecida. Neste caso as notas ao as vari´aveis respostas ou os dados
submetidos `a an´alise. Um modelo estat´ıstico comumente utilizado em ANCF ´e,
Y
jk
= τ
j
+
jk
,
com
τ
j
= β
0
+
m
1
i=1
β
1i
X
j
1i
+ ···+
m
n
i=1
β
ni
X
j
ni
onde Y
jk
´e a vari´avel resposta, (nota de aceita¸ao ou inten¸ao de compra) dada ao
j-´esimo tratamento pelo k-´esimo consumidor, para j=1, 2, ..., N tratamentos avaliados por
cada um dos k consumidores participantes da pesquisa. Para s= 1, 2, ..., n fatores cada
um com m
i
n´ıveis, tem-se X
j
si
= 1 quando o i-´esimo n´ıvel do s-´esimo fator est´a presente
no j-´esimo tratamento e X
j
si
= 0 caso contr´ario. β
si
´e o coeficiente de preferˆencia (CP)
associado ao i-´esimo n´ıvel do s-´esimo fator (denominados part-worths em conjoint analysis).
O termo
jk
´e o erro aleat´orio ao observ´avel associado `a observao Y
jk
. O erro aleat´orio
pode ser definido como a diferen¸ca entre a nota dada pelo consumidor k e a nota m´edia
de todos os consumidores para um mesmo tratamento, para um umero muito grande de
consumidores que tende ao infinito. O modelo acima pode ser apresentado compactamente
na nota¸ao matricial como: Y = Xβ + , em que Y ´e o vetor de observoes correspondente
aos tratamentos avaliados, X ´e a matriz de vari´aveis indicadoras da presen¸ca ou ausˆencia dos
n´ıveis dos fatores e β ´e o vetor de parˆametros a serem estimados (part-worths ou CP´s). O
modelo acima ´e denominado de efeitos principais, pois ao inclui intera¸oes entre os fatores.
5
Adicionalmente, podem ser inclu´ıdas intera¸oes entre dois ou mais fatores, entretanto, a
inclus˜ao de intera¸oes implica na necessidade de estima¸ao de novos parˆametros β
si
e con-
seq¨uentemente na necessidade de um maior n´umero de observoes, isto ´e, na avalia¸ao de
um maior n´umero de tratamentos pelos consumidores, o que em termos pr´aticos pode invi-
abilizar o estudo. Portanto, a ANCF ´e uma t´ecnica que requer um cuidadoso planejamento
experimental.
O vetor β pode ser estimado pelo etodo dos m´ınimos quadrados ordin´arios o que
requer a solu¸ao do sistema de equa¸oes normais X
X
β = X
Y.
Em ANCF, assim como em muitas aplica¸oes em estat´ıstica experimental, a matriz X
ao ´e de posto coluna completo, e portanto, artif´ıcios se fazem necess´arios se for desejado
uma solu¸ao ´unica
β para o vetor β. Para facilitar a interpreta¸ao das estimativas
β
si
imp˜oe-
se as restri¸oes
m
i
i=1
β
si
=0 , para todo fator s. Estas restri¸oes completam o posto da matriz
X , de modo que o sistema de equa¸oes normais passa a ter solu¸ao ´unica
β = (X
X)
1
X
Y
.
As restri¸oes tamem permitem interpreta¸oes importantes para as estimativas dos
β
si
.
Pode-se concluir que
β
si
< 0 significam efeito desfavor´avel, ou seja, que diminuem a nota
de preferˆencia pelo produto, enquanto
β
si
> 0 significam efeito favor´avel na preferˆencia do
consumidor. Com os valores
β
si
, podemos estimar a Importˆancia de um fator s, que ´e dado
pelo aximo valor de
β
si
subtranindo do m´ınimo valor de
β
si
, ou seja, I
s
=max(
β
s
)min(
β
s
).
Estima-se a Importˆancia Relativa (IR) de cada fator, pela importˆancia dele dividido pela
soma das importˆancias de todos os fatores,
6
IR
s
% =
I
s
n
s=1
I
s
× 100% (2.1)
A importˆancia relativa pode ser interpretada como o ”impacto”, ou o efeito que o fator
tem sobre a aceita¸ao do produto pelo consumidor. A soma de todas as IR’s resulta em
100%.
DELLA LUCIA (2008) aplicou a ANCF na avalia¸ao da inten¸ao de compra e da
escolha do iogurte light sabor morango. Ela estimou a IR de trˆes fatores, todos com dois
n´ıveis cada um e obteve os seguintes resultados: (i) Informa¸ao sobre o conte´udo de c´ucar,
IR = 60,2%, (ii) Informa¸ao sobre o conte´udo de gordura,
IR = 10,6% e (iii) Informa¸ao
sobre o conte´udo de prote´ına,
IR = 29,2%
CARNEIRO (2007) aplicou ANCF para avaliar os fatores da embalagem e do otulo
de cacha¸ca na aceita¸ao dos consumidores. Foram avaliados cinco fatores, todos eles com
dois n´ıveis cada um: (i) Marca, (ii) Ilustra¸ao do otulo, (iii) Tempo de envelhecimento, (iv)
Tipo de madeira e (v) Tipo de embalagem. As estimativas das IR’s foram apresentadas para
diversos grupos.
CASTRO (2006) aplicou a ANCF na Ind´ustria Hoteleira para avaliar os pacotes de
servi¸cos preferidos pelos clientes de um hotel na cidade de ao Paulo. Foram avaliados
cinco fatores: (i) Equipamentos (com trˆes n´ıveis) que resultou em uma
IR = 27,60%, (ii)
Apartamentos (com trˆes n´ıveis) com
IR = 32,39%, (iii) Servi¸cos de quarto (com trˆes n´ıveis)
e
IR = 17,15%, (iv) Caf´e da Manh˜a (dois n´ıveis) e
IR = 12,77% e (v) Conforto do Banheiro
(dois n´ıveis) com
IR = 10,19%.
ABADIO (2003) utilizou a ecnica para avaliar o efeito de diferentes fatores de in-
7
forma¸ao da embalagem de suco de abacaxi na inten¸ao de compra do consumidor. Foram
avaliados cinco n´ıveis: (i) Marca (trˆes n´ıveis) que apresentou
IR = 24%, (ii) Defini¸ao do
Produto (dois n´ıveis) com
IR = 1,4%, (iii) Informa¸ao sobre tecnologia (trˆes n´ıveis) com
IR = 10,6%, (iv) Tipo de produ¸ao (dois n´ıveis) com
IR = 9,5% e (v) Pre¸co (dois n´ıveis)
com
IR = 25,9%. Neste estudo tamb´em foi aplicado o teste t para inferir quanto `a diferen¸ca
significativa entre os coeficientes de preferˆencia.
CARNEIRO (2002) aplicou ANCF para avaliar os fatores que causam impacto na
embalagem de ´oleo de soja na inten¸ao de compra dos consumidores. Os resultados foram
apresentados para quatro grupos distintos obtidos por an´alise de agrupamento dos consu-
midores com base nos CP’s. Apresentaremos para ilustar os resultados do grupo 1. Foram
avaliados quatro fatores, todos com dois n´ıveis cada um: (i) Marca que resultou na
IR
= 1,9%, (ii) Pre¸co com
IR = 6.5%, (iii) Informa¸ao nutricional, com
IR = 2,6%e (iv)
Informa¸ao sobre o tipo de soja com
IR = 89%. Neste estudo, foi aplicado o Teste t para
verificar diferen¸ca significativa entre os coeficientes de preferˆencia.
KOHLI (1988) propˆos dois testes de significˆancia para os fatores avaliados na ANCF.
Um pode ser aplicado quando as preferˆencias dos consumidores pelos fatores podem ser
ordenados a priori e o outro pode ser usado quando esta ordena¸ao ao ´e permitida.
2.2 Intervalos de confian¸ca
ao encontramos relatos na literatura `a respeito da constru¸ao de intervalos de confian¸ca
para a IR de um fator. Acreditamos que inferir `a respeito das IR’s dos fatores investigados
numa ANCF possa ser realizado com base em intervalos de confian¸ca (IC). Entretanto,
a constru¸ao de IC para a IR requer que se conhe¸ca a sua distribui¸ao amostral ou pelo
8
menos que se possa estimar o seu desvio-padr˜ao de modo que se possa construir um IC pela
aproxima¸ao normal, e neste caso, a validade do intervalo precisa ser investigada. O m´etodo
delta (CASELLA e BERGER, 2002) pode ser uma alternativa para se obter uma estimativa
do desvio-padr˜ao de
IR. Um intervalo de confian¸ca ´e uma afirma¸ao probabil´ıstica,
P [LI µ LS] = 1 α,
sendo 1 α o n´ıvel de confian¸ca do intervalo. Portanto, IC e testes de hip´otese ao pro-
cedimentos equivalentes, pois se o valor do parˆametro sob H
0
, pertencer ao intervalo rec´em
construido, H
0
ao deve ser rejeitada, caso contr´ario, rejeita-se a hip´otese nula.
´
E conve-
niente salientar que, se a hip´otese nula ´e do tipo H
0
: µ = µ
0
, o intervalo deve ser do tipo
[LI; LS]; se H
0
: µ µ
0
, ent˜ao, o intervalo ´e [LI; ) ; e se H
0
: µ µ
0
o intervalo ´e
(−∞; LS].
Segundo FERREIRA (2005), a estima¸ao pontual ao fornece id´eia de margem de erro
que ´e cometida ao se estimar um determinado parˆametro. A estima¸ao por intervalo procura
corrigir essa lacuna a partir da cria¸ao de um intervalo associado a uma probabilidade de se
conter o verdadeiro valor do parˆametro. Essa probabilidade ´e dada por 1 α de modo que
α se refere `a probabilidade de o real valor do parˆametro ao pertencer ao intervalo gerado.
Por outro ponto de vista, o coeficiente de confian¸ca pode ser interpretado como a propor¸ao
m´edia de intervalos de confian¸ca, gerados `a partir de um grande n´umero de amostras, que
incluir´a o parˆametro, ou seja, que conter´a o valor real do parˆametro entre seus limites. O
intervalo de confian¸ca pela aproxima¸ao da distribui¸ao normal ´e motivado pelo Teorema
Central do Limite (ver por exemplo MAGALH
˜
AES(2006)), o qual garante que para grandes
amostras (n ) tem-se X N
µ,
σ
2
n
e portanto pode-se definir α tal que:
9
P
Z
α/2
X µ
σ
n
Z
α/2
1 α
o que nos fornece
P
X Z
α/2
σ
n
µ X + Z
α/2
σ
n
1 α
onde os limites inferiores e superiores do IC ao dados por:
LI = X Z
α/2
σ
n
e
LS = X + Z
α/2
σ
n
,
onde µ e σ ao a edia e o desvio padr˜ao da popula¸ao, respectivamente.
TRINDADE e ROTONDARO (2004) aplicaram a ANCF e propuseram a modifica¸ao
da escala por postos fornecida pelo entrevistado em uma nova escala, ainda discreta, que
mantenha a posi¸ao relativa entre os produtos originalmente ordenados. O objetivo desta
mudan¸ca ´e estimar um modelo em que a reconstru¸ao da ordem original seja mais eficiente.
Utilizaram intervalos de confian¸ca a 95% para a m´edia ou propor¸ao para verificar a validade
das respostas. Foram gerados 1000 ordenamentos aleat´orios alidos dos produtos em cada
cen´ario. No cen´ario com quatro fatores e trˆes n´ıveis, apenas 25,4% das respostas foram
consideradas alidas. No cen´ario com 6 fatores e 2 n´ıveis, por sua vez, a propor¸ao de
respostas alidas foi de 89,2%.
FONSECA e SALAY (2005) utilizaram intervalos de confian¸ca a 95% para analisar
os riscos alimentares de acordo com a localiza¸ao demografica e socioeconˆomica de 158
10
consumidores da regi˜ao de campinas.
SPERS, SAES e SOUZA (2004) aplicaram a ANCF para caracterizar o consumidor de
caf´e, tentando identificar os principais fatores que levam ao consumo desse produto. Foram
entrevistados consumidores de ao Paulo e Belo Horizonte, que degustaram trˆes tipos de
caf´e. Os fatores mais importantes para a amostra estudada foram: (i) pre¸co com
IR = 30%,
(ii) tipo de caf´e com
IR = 20%, (iii) marca, tamb´em com
IR = 20%, (iv) tipo de preparo
com
IR = 15% e (v) embalagem com
IR = 10%. Nesse estudo, cosntruiram-se intervalos de
confian¸ca a 95% para analisar a m´edia entre as notas dos caf´es analisados.
11
Cap´ıtulo 3
Material e M´etodos
Este estudo foi desenvolvido utilizando-se os recursos e instala¸oes do Departamento de
Inform´atica, Setor de Estat´ıstica, da Universidade Federal de Vi¸cosa (UFV). Foi utilizado
principalmente o software SAS, licenciado para a UFV.
3.1 An´alise conjunta de fatores, um estudo por simu-
la¸ao de dados
3.1.1 Fatores e n´ıveis
Neste estudo por simula¸ao de dados, considerou-se um produto hipot´etico formado pela
combina¸ao num esquema fatorial completo, dos n´ıveis de quatro fatores conforme apresen-
tado na Tabela 3.1.
3.1.2 Modelo utilizado na an´alise
Optamos por ao considerar a intera¸ao entre os fatores, a que al´em de ao acrescen-
tar informa¸oes adicionais ao estudo, implicaria na necessidade de estima¸ao de um maior
n´umero de parˆametros e portanto na simula¸ao de mais dados. Portanto, considerou-se o
12
Tabela 3.1: Fatores e respectivos n´ıveis considerados no estudo por simula¸ao de dados para
a an´alise conjunta de fatores
Fatores N´ıveis
A pouco, m´edio e muito
B fraco, edio e forte
C sim e ao
D baixo e alto
seguinte modelo no estudo por simula¸ao de dados,
Y
jk
= τ
j
+
jk
= β
0
+
3
i=1
β
1i
X
j
1i
+
3
i=1
β
2i
X
j
2i
+
2
i=1
β
3i
X
j
3i
+
2
i=1
β
4i
X
j
4i
+
jk
(3.1)
onde, Y
jk
´e a nota atribu´ıda pelo kesimo consumidor ao jesimo tratamento, cujo efeito
´e τ
j
, para k = 1, 2, 3, . . . , 108 e j = 1, 2, 3, . . . , 36; β
si
´e a part-worth ou o coeficiente de
preferˆencia associado ao i-´esimo n´ıvel do s-´esimo fator, X
j
si
= 0 ou 1, ´e a vari´avel indicadora
da presen¸ca do i-´esimo n´ıvel do s-´esimo fator no j-´esimo tratamento (referimos o leitor `a
Se¸ao 2.1).
O termo
jk
mereceu especial aten¸ao em nosso estudo.
jk
´e o erro aleat´orio do
modelo, que no presente estudo foi gerado considerando-se quatro modelos de distribui¸ao
de probabilidades alternativos: distribui¸ao normal, distribui¸ao assim´etrica `a direita (AD),
distribui¸ao assim´etrica `a esquerda (AE), e, distribui¸ao em forma de U (FU). Os modelos
AD, AE e FU utilizados para gerarem valores aleat´orios
jk
foram obtidos por meio de uma
transforma¸ao de loca¸ao e escala da distribui¸ao beta, conforme explicaremos adiante no
texto em 3.1.4. O objetivo principal deste estudo era investigar a robustez da distribui¸ao
13
amostral do estimador da Importˆancia Relativa de um fator frente `a distribui¸oes alternativas
para o erro aleat´orio,
3.1.3 Importˆancias Relativas (IR%) dos fatores
Com base no modelo 3.1 define-se a Importˆancia (I
s
) do s-´esimo fator como,
I
s
= max(β
si
) min(β
si
) s = 1, 2, 3, 4
e consequentemente a Importˆancia Relativa (IR
s
%) do s-´esimo fator como,
IR
s
% =
I
s
4
s=1
I
s
× 100% (3.2)
Com base em pesquisas bibliogr´aficas, tomou-se β
0
= 4 e tamem os valores β
si
apresentados
na Tabela 3.2. Estes valores IR% ser˜ao denominados valores de referˆencia ou param´etricos
do estudo por simula¸ao.
Tabela 3.2: Valores de referˆencia dos coeficientes de preferˆencia (β
si
) dos n´ıveis e das res-
pectivas importˆancias relativas (IR%) dos fatores utilizados no estudo por simula¸ao
Fator A Fator B Fator C Fator D
β
11
β
12
β
13
β
21
β
22
β
23
β
31
β
32
β
41
β
42
-1,20 -0,10 1,30 -0,50 -0,45 0,95 -0,75 0,75 -0,10 0,10
IR= 44, 25% IR= 25, 66% IR= 26, 55% IR= 3, 54%
Portanto, o fatorial completo, 3
2
x 2
2
, com os fatores apresentados na Tabela 3.1 resulta
em 36 tratamentos conforme especificados na Tabela 3.3, juntamente com a contribui¸ao da
parte determin´ıstica do modelo 3.1, para o valor da nota Y
jk
.
14
Tabela 3.3: Tratamentos resultantes da combina¸ao no esquema fatorial completo, dos n´ıveis
dos fatores considerados no estudo por simula¸ao de dados, com os respectivos valores dos
efeitos fixos τ
j
/1
Fatores e n´ıveis
Tratamentos A B C D τ
j
1 pouca fraco sim baixo 1,45
2 pouca fraco sim alto 1,65
3 pouca fraco ao baixo 2,95
4 pouca fraco ao alto 3,15
5 pouca edio sim baixo 1,50
6 pouca edio sim alto 1,70
7 pouca edio ao baixo 3,00
8 pouca edio ao alto 3,20
9 pouca forte sim baixo 2,90
10 pouca forte sim alto 3,10
11 pouca forte ao baixo 4,40
12 pouca forte ao alto 4,60
13 medio fraco sim baixo 2,55
14 medio fraco sim alto 2,75
15 medio fraco ao baixo 4,05
16 medio fraco ao alto 4,25
17 medio edio sim baixo 2,60
18 medio edio sim alto 2,80
19 medio edio ao baixo 4,10
20 medio edio ao alto 4,30
21 medio forte sim baixo 4,00
22 medio forte sim alto 4,20
23 medio forte ao baixo 5,50
24 medio forte ao alto 5,70
25 muito fraco sim baixo 3,95
26 muito fraco sim alto 4,15
27 muito fraco ao baixo 5,45
28 muito fraco ao alto 5,65
29 muito m´edio sim baixo 4,00
30 muito m´edio sim alto 4,20
31 muito m´edio ao baixo 5,50
32 muito m´edio ao alto 5,70
33 muito forte sim baixo 5,40
34 muito forte sim alto 5,60
35 muito forte ao baixo 6,90
36 muito forte ao alto 7,10
/1
Efeitos τ
j
conforme o modelo (3.1)
15
3.1.4 Simula¸ao de distribui¸oes alternativas para o erro aleat´orio
do modelo da ANCF
O problema inicial foi gerar valores de notas Y
jk
atribu´ıdas pelos consumidores para a
ANCF conforme 3.1 para os tratamentos definidos conforme Tabelas 3.1 e 3.3. Para tanto,
inicialmente gerou-se valores aleat´orios
jk
da distribui¸ao cont´ınua g
(ε) obtida por meio de
uma transforma¸ao de loca¸ao e escala da distribui¸ao beta.
No estudo por simula¸ao, foram consideradas trˆes formas alternativas para a dis-
tribui¸ao g
(ε), al´em da distribui¸ao normal como uma quarta alternativa. Detalhes da
metodologia ao apresentados `a seguir.
Transforma¸ao de loca¸ao e escala da distribui¸ao beta
Seja X uma vari´avel aleat´oria tal que X beta(α
1
, α
2
), com parˆametros α
1
, α
2
> 0. A
fun¸ao densidade de probabilidade (fdp) de X ´e dada por:
f
X
(x) =
Γ(α
1
+ α
2
)
Γ(α
1
)Γ(α
2
)
x
α
1
1
(1 x)
α
2
1
, 0 x 1,
com m´edia e variˆancia dados por,
E(X) =
α
1
α
1
+ α
2
e V (X) =
α
1
α
2
(α
1
+ α
2
)
2
(α
1
+ α
2
+ 1)
.
Conforme Casella & Berger (1990), citado por SILVA(2000), para θ > 0,
T (X) = = 2θ(X 0, 5), define uma transforma¸ao de loca¸ao e escala da distribui¸ao beta,
com θ θ tal que o Jacobiano da transforma¸ao ´e:
16
J =
T
1
()
=
2θ
+ 0, 5
=
1
T (X)
X
=
1
2θ
Portanto, como g
(ε) = g
X
(T
1
(ε)) |J|, resulta em:
g
(ε) =
1
2θ
f
X
ε + θ
2θ
=
1
2θ
Γ(α
1
+ α
2
)
Γ(α
1
)Γ(α
2
)
ε + θ
2θ
α
1
1
θ ε
2θ
α
2
1
A m´edia e a variˆancia de ao dadas por:
E() =
θ(α
1
α
2
)
α
1
+ α
2
e σ
2
= V () = 4θ
2
V (X) =
4θ
2
α
1
α
2
(α
1
+ α
2
)
2
(α
1
+ α
2
+ 1)
Formas das distribui¸oes utilizadas no estudo
A forma da distribui¸ao g
(ε) que se deseja gerar ´e determinada pelos valores dos
parˆametros α
1
e α
2
. Optou-se por simular 3 formas alternativas, conforme abaixo:
α
1
< 1 e α
2
< 1 forma de U - FU
1 < α
2
< α
1
assim´etrica `a esquerda - AE, e
1 < α
1
< α
2
assim´etrica `a direita - AD
Entretanto, para que os resultados pudessem ser adequadamente comparados em ter-
mos das distribui¸oes amostrais das IR´s dos fatores, os valores θ e σ
2
= V () foram escolhi-
dos de modo que houvesse homocedasticidade entre as distribui¸oes FU, AE e AD utilizadas
no estudo.
Para que isso ocorresse, utilizou-se σ = 2, 8 para o caso da normal; θ = 4, α
1
= 0, 5 e
17
α
2
= 0, 5 para o caso da forma de U; θ = 7, α
1
= 2 e α
2
= 3 para o caso da forma assim´etrica
`a direita e θ = 7, α
1
= 3 e α
2
= 2 para o caso da forma assim´etrica `a esquerda.
Posteriormente, afim de diminuir a varia¸ao nas notas y encontradas, utilizou-se tamb´em
σ = 0, 5 para o caso normal; θ = 0, 7; α
1
= 0, 5 e α
2
= 0, 5 para o caso da forma de U,
θ = 1, 25; α
1
= 2 e α
2
= 3 para o caso da forma assim´etrica `a direita e θ = 1, 25; α
1
= 3 e
α
2
= 2 para o caso da forma assim´etrica `a esquerda.
Verificou-se a distribui¸ao da importˆancia relativa de cada fator para cada uma das
diferentes distribui¸oes de erros e com cada um dos valores de desvio-padr˜ao. Para essa
verifica¸ao, foram feitas 100 simula¸oes, considerando 108 consumidores para cada uma das
distribui¸oes simuladas. Portanto, para cada distribui¸ao e valor σ temos um conjunto com
36 tratamentos x 108 consumidores x 100 simula¸oes = 388800 dados.
3.1.5 Re-escalonamento das vari´aveis resposta Y obtidas na simu-
la¸ao
Optou-se por simular valores Y
jk
iguais a 1, 2, 3, . . . , 9, conforme em muitos estudos na ´area
de Tecnologia de Alimentos, nos quais estes ao os valores de notas de aceita¸ao fornecidas
pelos consumidores participantes de um estudo. Entretanto, a simula¸ao de dados proposta
em 3.1.4, com base na transforma¸ao de loca¸ao e escala da distribui¸ao beta, ir´a gerar
valores aleat´orios Y
jk
= τ
j
+
jk
.
Portanto, os valores Y
jk
iguais a 1, 2, 3, . . . , 9 foram obtidos mediante uma corre¸ao de
escala conforme LAW e KELTON (2000) citado por PETERNELLI e MELLO (2007),
Y
jk
= INT

Y
Y
(1)
Y
(n)
Y
(1)
× d + 1
d = Y
jk
(n) Y
jk
(1) = 9 1 = 8 (3.3)
onde Y
jk
´e a nota gerada por simula¸ao ap´os a corre¸ao, um n´umero inteiro {1, 2, 3, . . . , 9},
18
INT ( ) ´e a fun¸ao que retorna a parte inteira, Y
´e a nota gerada na simula¸ao antes da
corrre¸ao, Y
(1)
´e o menor valor e Y
(n)
´e o maior valor das notas geradas pela simula¸ao antes
da corrre¸ao.
3.2 Apresenta¸ao dos resultados da simula¸ao
3.2.1 Normalidade
Para averiguar a normalidade da distribui¸ao amostral do estimador da IR, optou-se
por apresentar apenas o teste de Kolmogorov-Smirnov juntamente com a sobreposi¸ao da
curva normal nos histogramas das IR’s para cada fator.
3.2.2 Intervalos de confian¸ca
Intervalos de confian¸ca foram utilizados para verificar se a distribui¸ao amostral da
IR ´e robusta em rela¸ao `a distribui¸ao dos erros. Verificou-se a sobreposi¸ao dos intervalos
para os fatores B e C cujos valores de IR de referˆencia foram pr´oximos. Verificou-se tamb´em
se os intervalos de confian¸ca continham os valores de referˆencia das IR’s.
Intervalo de confian¸ca percentil
Apresentaremos intevalos de confian¸ca percentis com α = 5%, os quais ao indicados
por [LI, LS] = [
IR
2,5%
;
IR
97,5%
], onde LI e LS ao obtidos, colocando-se os dados em ordem
crescente, e exclu´ındo-se da amostra os 2, 5% menores e os 2, 5% maiores valores
IR
i
, i=1,
2, 3, ···, 100, assim, apresentamos os quantis 2, 5% e 97, 5% como limites do intervalo.
19
Intervalo de confian¸ca pela aproxima¸ao da distribui¸ao normal
Tamb´em apresentaremos intervalos de confian¸ca pela aproxima¸ao da normal, com os valores
de σ
2
substitu´ıdos por s
2
, que ´e a variˆancia resultante dos 100 valores estimados para IR
i
;
assim, tem-se que: s
2
=
100
i=1
IR
i
IR
99
onde:
IR
i
´e o i-´esimo valor estimado para IR
i
dos fatores A, B, C e D,
IR =
100
i=1
IR
i
100
´e a m´edia amostral.
3.2.3 Erro edio Relativo
Definiu-se o Erro M´edio Relativo (EMR), como
EMR =
IR IR
IR
100%
onde
IR ´e o valor m´edio das 100 IR’s geradas para os fatores A, B C e D em cada distribui¸ao
alternativa para o erro aleat´orio, e IR ´e o valor de referˆencia utilizado na simula¸ao dos dados.
20
Cap´ıtulo 4
Resultados e Discuss˜ao
`
A seguir ao apresentados os intervalos de confian¸ca, histogramas da distribui¸ao
amostral das Importˆancias Relativas dos fatores, bem como tamb´em s˜ao apresentadas figuras
para ilustrar as formas das distribui¸oes dos erros aleat´orios e das respectivas vari´aveis
resposta Y e notas de aceita¸ao. Na apresenta¸ao dos resultados utilizamos os s´ımbolos e
σ; e tamb´em os termos vari´avel resposta Y e notas de aceita¸ao, para designar o seguinte:
(i) ao os erros aleat´orios do modelo da ANCF, simulados por quatro modelos de dis-
tribui¸ao, a normal (N) e outros trˆes com uma transforma¸ao de loca¸ao e escala da
distribui¸ao beta: em forma de U (FU), assim´etrica `a esquerda (AE) e assim´etrica `a
direita (AD).
(ii) σ ´e o desvio-padr˜ao da distribui¸ao utilizada para simular valores .
(iii) vari´avel resposta Y ao os valores gerados pelo modelo da ANCF. ao os valores
das CP’s (Tabela 3.2) somados aos valores .
(iv) notas de aceita¸ao (Y) na forma decimal, ao os valores da vari´avel resposta
Y re-escalonadas para o intervalo 1 a 9, conforme ormula 3.3, sem a aplica¸ao do
21
comando INT. Ou seja, valores com casas decimais.
(v) notas de aceita¸ao ao as vari´aveis resposta Y re-escalonadas conforme ormula 3.3
de modo que sejam valores inteiros de 1 a 9.
ao apresentados os resultados tanto dos valores quanto para as notas de aceita¸ao (Y)
para os tratamentos 1 e 36.
4.1 Valores simulados
4.1.1 Erros Aleat´orios
As figuras 2.1 e 2.2 apresentam os 10800 valores gerados por simula¸ao para cada
uma das quatro formas alternativas de distribui¸oes dos erros aleat´orios, com respectivos
valores σ, somente para os tratamentos 1 e 36. Na tabela 4.1 s˜ao apresentados os respectivos
valores da edia, desvio padr˜ao, m´ınimos e aximos para cada gr´afico. Verificou-se que
com σ = 2, 8 obteve-se erros em um intervalo muito amplo, o que motivou a utiliza¸ao do
σ = 0, 5, para diminuir tal amplitude. Observou-se que os erros foram gerados com as formas
desejadas para todos os tratamentos (resultados ao apresentados).
4.1.2 Vari´avel resposta Y
Ap´os adicionar os erros ao modelo estat´ıstico 3.1 e com valores betas da tabela 3.2,
obtemos vari´aveis resposta Y, cujas distribui¸oes ao apresentadas nas figuras 2.3 e 2.4 para
σ = 2, 8 e σ = 0, 5 respectivamente.
Observou-se que os valores Y possuiam a mesma forma de distribui¸ao dos erros para
todos os tratamentos. Aprsentamos na tabela 4.2 um resumo descritivo, para todas as dis-
22
tribui¸oes simuladas e valores σ, sobre a vari´avel resposta Y gerados para os tratamentos 1
e 36.
4.1.3 Notas de aceita¸ao
Nas figuras 2.5 e 2.6 apresentamos para os tratamentos 1 e 36 respectivamente, os va-
lores da vari´avel resposta Y re-escalonados para o intervalo 1 a 9 conforme f´ormula proposta
por LAW e KELTON (2000), citado por PETERNELLI e MELLO (2007) sem o comando
INT, ou seja, notas com casas decimais.
As notas de aceita¸ao apresentadas nas Figuras 2.7 e 2.8, respectivamente para σ = 2, 8
e σ = 0, 5, ao valores inteiros de 1 a 9, utilizadas na ANCF.
4.2 Distribui¸oes amostrais das importˆancias relativas
geradas por simula¸ao
`
A seguir s˜ao apresentados os intervalos de confian¸ca, histogramas e resultados do teste
de normalidade (Kolmogorov Smirnov), da distribui¸ao amostral das Importˆancias Relativas
dos fatores A, B, C e D.
As importˆancias relativas para os fatores A, B, C e D obtidas na simula¸ao, possuem
distribui¸ao amostral conforme figuras 2.9, 2.10, 2.11 e 2.12 respectivamente. Podemos ob-
servar uma boa sobreposi¸ao da curva normal sobre os histogramas das distribui¸ao das IR’s
para todos os fatores, o que nos a evidˆencias de normalidade. Adicionalmente, as tabelas
4.3 e 4.4 apresentam o teste de normalidade de Kolmogorov-Smirnov para as distribui¸oes
23
amostrais das IR’s geradas por simula¸ao. Adotando-se α = 5% conclui-se que em todos os
casos ao se rejeita a hip´otese H
0
de que as IR’s sigam a distribui¸ao normal.
4.2.1 Intervalos de Confian¸ca
Com a finalidade de verificar a robustez das IR’s perante a ao-normalidade dos erros
aleat´orios, construiu-se intervalos de confian¸ca percentis. Esses intervalos foram obtidos
tomando-se o intervalo de [5%; 95%] dos quantis dos dados em ordem crescente. As tabelas
4.5 e 4.6 nos mostram esses intervalos de confian¸ca para cada fator, e todas as formas de
distribui¸oes alternativas para os erros com σ = 2, 8 e σ = 0, 5 respectivamente.
Observou-se que em todos os casos, o IC incluiu os valores de referˆencia das IR’s.
Observou-se tamb´em que, no caso de σ = 2, 8, como a amplitude dos intervalos de confian¸ca
para as IR’s foi grande, existe sobreposi¸ao de intervalos para as IR´s dos fatores B e C,
cujos valores de referˆencia foram 26, 55% e 25, 66%. Ou seja, inferˆencia com base nestes IC´s
concluiria erroneamente que B e C possuem IR´s estatisticamente iguais.
Considerando-se que houve ind´ıcios de normalidade pelas tabelas 4.3 e 4.4, construiu-se
tamem intervalos de confian¸ca pela distribui¸ao normal, apresentado nas tabelas 4.7 e 4.8.
Vale ressaltar que o desvio-padr˜ao utilizado na constru¸ao dos intervalos pela aproxima¸ao
normal foi o obtido com base nos valores IR obtidos nas simula¸oes. Este ´e um problema
para a constru¸ao do IC normal na pr´atica, como obter um valor para o desvio-padr˜ao? Uma
solu¸ao seria obter uma aproxima¸ao pelo m´etodo delta (Casella e Berger, 2002).
Observou-se que todos os intervalos de confian¸ca inclu´ıram os valores das IR’s tomados
como referˆencia, exceto para os seguintes casos: (i) intervalo de confian¸ca pela aproxima¸ao
normal para a simula¸ao de erros com distribui¸ao normal e σ = 2, 8, para os fatores A
24
e B; (ii) com intervalo pela aproxima¸ao normal e σ = 0, 5, (iia) para os fatores A e C
com distribui¸ao normal, em forma de U e assim´etrica `a esquerda; (iib) para o fator B com
distribui¸ao em forma de U; e (iic) para o fator D com distribui¸ao normal e em forma de U .
Entretanto, neste casos de ao inclus˜ao do valor IR de referˆencia nos intervalos, observou-se
que o valor estava pr´oximo ao limite do IC, tanto `a esquerda quanto `a direita. Novamente
existe sobreposi¸ao de intervalos entre os fatores B e C quando σ = 2, 8, que possuem IR’s
pr´oximas. Portanto, assim como no IC percentil, novamente n˜ao podemos concluir que a IR
de 25, 66% ´e estatisticamente diferente da IR de 26, 55% quando σ = 2, 8.
25
4.2.2 Erro edio Relativo
Para avaliar a acur´acia do estimador da IR, definiu-se o Erro M´edio Relativo (EMR)
dado por
EMR =
IR IR
IR
100%.
As tabelas 4.9 e 4.10 apresentam os EMR, respectivamente para σ = 2, 8 e σ = 0, 5, de todos
os fatores para todas as distribui¸oes alternativas para o erro aleat´orio.
Um resumo dos resultados ´e apresentado nas tabelas 4.9 e 4.10. Para σ = 2, 8, com
excess˜ao dos EMR do fator D para as formas alternativas dos erros aleat´orios normal e em
forma de U, iguais a 7, 65% e 4, 95%, respectivamente, todos os demais valores foram inferi-
ores a 2%. a para σ = 0, 5, Com excess˜ao dos EMR do fator D para as formas alternativas
dos erros aleat´orios normal e em forma de U, iguais a 4, 62% e 2, 14%, respectivamente, todos
os demais valores foram inferiores a 1, 5%. Estes resultados refor¸cam as evidˆencias de que os
estimadores da IR ao robustos `a ao-normalidade dos erros. Existem evidˆencias ainda de
que quanto menor a IR, mais sujeito `a variabilidade ela est´a, pois qualquer altera¸ao pode
representar uma varia¸ao muito grande em porcentagem (como no caso do fator D para as
formas alternativas dos erros aleat´orios normal e em forma de U).
Uma quest˜ao pr´atica de interesse na ANCF seria estabelecer qual o menor valor de IR
estimado para se considerar o fator como relevante, ou seja, para ele ao ser descartado de
futuros estudos.
26
Figura 2.1: Distribui¸oes dos erros aleat´orios com σ = 2, 8 para os tratamentos 1 e 36.
Modelos normal (N), em forma de U (FU), assim´etrico `a esquerda (AE) e `a direita (AD)
27
Figura 2.2: Distribui¸oes dos erros aleat´orios com σ = 0, 5 para os tratamentos 1 e 36.
Modelos normal (N), em forma de U (FU), assim´etrico `a esquerda (AE) e `a direita (AD)
28
Figura 2.3: Formas das distribui¸oes das vari´aveis resposta Y para os 10800 valores gerados
para o tratamento 1 e 36 com σ = 2, 8
29
Figura 2.4: Formas das distribui¸oes das vari´aveis resposta Y para os 10800 valores gerados
para o tratamento 1 e 36 com σ = 0, 5
30
Figura 2.5: Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) na forma decimal
para os 10800 valores gerados para o tratamento 1 e 36 com σ = 2, 8
31
Figura 2.6: Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) na forma decimal
para os 10800 valores gerados para o tratamento 1 e 36 com σ = 0, 5
32
Figura 2.7: Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) para os 10800
valores gerados para o tratamento 1 e 36 com σ = 2, 8
33
Figura 2.8: Formas das distribui¸oes dos valores das notas de aceita¸ao (Y) para os 10800
valores gerados para o tratamento 1 e 36 com σ = 0, 5
34
Figura 2.9: Importˆancia relativa do fator A com a presen¸ca de erros na forma da distribui¸ao
normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e assim´etrica `a direita (AD)
35
Figura 2.10: Importˆancia relativa do fator B com a presen¸ca de erros na forma da distribui¸ao
normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e assim´etrica `a direita (AD)
36
Figura 2.11: Importˆancia relativa do fator C com a presen¸ca de erros na forma da distribui¸ao
normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e assim´etrica `a direita (AD)
37
Figura 2.12: Importˆancia relativa do fator D com a presen¸ca de erros na forma da distribui¸ao
normal (N), em forma de U (FU), assim´etrica `a esquerda (AE) e assim´etrica `a direita (AD)
38
Tabela 4.1: Informa¸oes sobre os erros aleat´orios gerados para cada tipo de distribui¸ao para
os tratamentos 1 e 36
Distribui¸ao Trat σ edia Desvio Padr˜ao M´ınimo aximo
1 2,8 -0,03 2,80 -11,76 11,15
N 0,5 -0,01 0,50 -2,10 1,99
36 2,8 0,01 2,77 -11,03 10,38
0,5 0,00 0,49 -1,97 1,85
1 2,8 0,00 2,84 -4,00 4,00
FU 0,5 0,00 0,50 -0,70 0,70
36 2,8 -0,02 2,85 -4,00 4,00
0,5 -0,01 0,50 -0,70 0,70
1 2,8 1,40 2,81 -6,63 6,95
AE 0,5 0,25 0,50 -1,18 1,24
36 2,8 1,37 2,82 -6,61 6,94
0,5 0,24 0,50 -1,18 1,24
1 2,8 -1,40 2,81 -6,95 6,61
AD 0,5 -0,25 0,50 -1,24 1,18
36 2,8 -1,42 2,82 -6,95 6,58
0,5 -0,25 0,50 -1,24 1,17
39
Tabela 4.2: Informa¸oes sobre as vari´aveis resposta y geradas para cada tipo de distribui¸ao
para os tratamentos 1 e 36
Distribui¸ao Trat σ edia Desvio Padr˜ao M´ınimo aximo
1 2,8 1,42 2,80 -10,31 12,60
N 0,5 1,44 0,50 -0,65 3,44
36 2,8 7,11 2,77 -3,93 17,48
0,5 7,10 0,49 5,13 8,95
1 2,8 1,45 2,84 -2,55 5,45
FU 0,5 1,45 0,50 0,75 2,15
36 2,8 7,07 2,85 3,10 11,10
0,5 7,10 0,50 6,40 7,80
1 2,8 2,85 2,81 -5,18 8,40
AE 0,5 1,70 0,50 0,27 2,69
36 2,8 8,47 2,83 0,49 14,04
0,5 7,34 0,50 5,92 8,34
1 2,8 0,05 2,81 -5,50 8,06
AD 0,5 1,20 0,50 0,21 2,63
36 2,8 5,68 2,82 0,15 13,68
0,5 6,84 0,50 5,86 8,27
40
Tabela 4.3: Teste de normalidade(Kolmogorov-Smirnov), estat´ıstica do teste e p-valor para
as IR’s de cada fator para cada forma de distribui¸ao dos erros com σ = 2, 8
Fator Formas Estat´ıstica p-valor (Pr > D)
A N D = 0,05584820 > 0, 150
FU D = 0,05644860 > 0, 150
AE D = 0,05340434 > 0, 150
AD D = 0,08393014 0, 083
B N D = 0,05540334 > 0, 150
FU D = 0,06573097 > 0, 250
AE D = 0,04158116 > 0, 150
AD D = 0,04583226 > 0, 150
C N D = 0,04945570 > 0, 150
FU D = 0,06287521 > 0, 150
AE D = 0,04840710 > 0, 150
AD D = 0,08106178 0, 103
D N D = 0,06403950 > 0, 150
FU D = 0,07339083 > 0, 250
AE D = 0,08608175 0, 068
AD D = 0,05916682 > 0, 150
41
Tabela 4.4: Teste de normalidade(Kolmogorov-Smirnov), estat´ıstica do teste e p-valor para
as IR’s de cada fator para cada forma de distribui¸ao dos erros com σ = 0, 5
Fator Formas Estat´ıstica p-valor (Pr > D )
A N D = 0,05227260 > 0, 150
FU D = 0,05607470 > 0, 150
AE D = 0,05799330 > 0, 150
AD D = 0,0597502 > 0, 150
B N D = 0,07182885 > 0, 150
FU D = 0,08838745 0, 053
AE D = 0,08181350 0, 097
AD D = 0,0604332 > 0, 150
C N D = 0,06797566 > 0, 150
FU D = 0,05673800 > 0, 150
AE D = 0,0632306 > 0, 150
AD D = 0,0494557 > 0, 150
D N D = 0,07083845 > 0, 150
FU D = 0,0603286 > 0, 150
AE D = 0,0616599 > 0, 150
AD D = 0,0818474 0, 096
42
Tabela 4.5: Limites inferior e superior dos intervalos de confian¸ca percentis a 95% para as
Importˆancias Relativas, com os respectivos valores de referˆencia (%), para os fatores A, B,
C e D em cada distribui¸ao alternativa para o erro com σ = 2, 8
Fator Distribui¸ao Referˆencia(%) Limite Inferior Limite Superior
A N 44,25 42,63 45,01
FU 42,67 45,05
AE 43,07 45,28
AD 43,03 45,19
B N 25,66 24,88 27,15
FU 24,80 26,69
AE 24,94 26,94
AD 25,02 26,78
C N 26,55 25,42 27,31
FU 25,55 27,81
AE 25,50 27,47
AD 25,45 27,62
D N 3,54 2,72 4,60
FU 2,65 4,75
AE 2,32 4,73
AD 2,44 4,60
43
Tabela 4.6: Limites inferior e superior dos intervalos de confian¸ca percentis a 95% para as
Importˆancias Relativas, com os respectivos valores de referˆencia (%), para os fatores A, B,
C e D em cada distribui¸ao alternativa para o erro com σ = 0, 5
Fator Distribui¸ao Referˆencia(%) Limite Inferior Limite Superior
A N 44,25 43,77 44,25
FU 43,31 44,69
AE 44,07 44,53
AD 44,09 44,49
B N 25,66 25,45 25,95
FU 25,20 25,52
AE 25,40 25,87
AD 25,39 25,80
C N 26,55 26,42 26,78
FU 26,43 26,88
AE 26,30 26,69
AD 26,38 26,83
D N 3,54 3,52 3,89
FU 3,27 3,66
AE 3,31 3,80
AD 3,34 3,78
44
Tabela 4.7: Limites inferior e superior dos intervalos de confian¸ca pela aproxima¸ao normal
com 95% de confian¸ca (z = 1, 96) para as Importˆancias Relativas, com os respectivos valores
de referˆencia (IR%), para os fatores A, B, C e D em cada distribui¸ao alternativa para o erro
com σ = 2, 8
Fator Distribui¸ao IR% M´edia Desvio Padr˜ao Limite Inferior Limite Superior
A N 44,25 43,77 1,61 43,45 44,08
/D
FU 43,95 1,68 43,62 44,28
AE 44,15 1,63 43,83 44,47
AD 44,11 1,64 43,78 44,43
B N 25,66 26,03 1,67 25,70
/E
26,35
FU 25,74 1,62 25,43 26,06
AE 25,86 1,59 25,55 26,18
AD 25,89 1,54 25,59 26,20
C N 26,55 26,40 1,42 26,12 26,68
FU 26,59 1,55 26,29 26,90
AE 26,44 1,52 26,14 26,74
AD 26,45 1,61 26,14 26,77
D N 3,54 3,81 1,50 3,52 4,11
FU 3,72 1,71 3,38 4,05
AE 3,55 1,69 3,21 3,88
AD 3,55 1,64 3,23 3,87
/D
e
/E
- valor de referˆencia `a direita e `a esquerda do IC respectivamete
45
Tabela 4.8: Limites inferior e superior dos intervalos de confian¸ca pela aproxima¸ao normal
com 95% de confian¸ca (z = 1, 96) para as Importˆancias Relativas, com os respectivos valores
de referˆencia (IR%), para os fatores A, B, C e D em cada distribui¸ao alternativa para o erro
com σ = 0, 5
Fator Distribui¸ao IR% M´edia Desvio Padr˜ao Limite Inferior Limite Superior
A N 44,25 44,00 0,38 43,93 44,07
/D
FU 44,49 0,35 44,42
/E
44,55
AE 44,32 0,34 44,26
/E
44,39
AD 44,29 0,34 44,23 44,36
B N 25,66 25,67 0,34 25,61 25,74
FU 25,38 0,30 25,32
/E
25,44
AE 25,65 0,34 25,58 25,71
AD 25,60 0,31 25,54 25,66
C N 26,55 26,62 0,32 26,56
/E
26,69
FU 26,67 0,30 26,61
/E
26,73
AE 26,48 0,30 26,42 26,54
/D
AD 26,59 0,34 26,53 26,66
D N 3,54 3,70 0,32 3,64
/E
3,77
FU 3,46 0,34 3,40 3,53
/D
AE 3,55 0,35 3,48 3,61
AD 3,51 0,35 3,44 3,58
/D
e
/E
- valor de referˆencia `a direita e `a esquerda do IC respectivamete
46
Tabela 4.9: Valores m´edios das IR estimadas (
IR%), valores de referˆencia (IR%) e Erro
M´edio Relativo (EMR), para cada fator com a respectiva distribui¸ao do erro aleat´orio, para
σ = 2, 8
Fator Distribui¸ao
IR% IR% EMR%
A N 43,77 44,25 1,09
FU 43,95 0,68
AE 44,15 0,23
AD 44,11 0,32
B N 26,03 25,66 1,43
FU 25,74 0,32
AE 25,86 0,80
AD 25,89 0,92
C N 26,40 26,55 0,58
FU 26,59 0,17
AE 26,44 0,42
AD 26,45 0,37
D N 3,81 3,54 7,65
FU 3,72 4,95
AE 3,55 0,17
AD 3,55 0,17
47
Tabela 4.10: Valores edios das IR estimadas (
IR%), valores de referˆencia (IR%) e Erro
M´edio Relativo (EMR), para cada fator com a respectiva distribui¸ao do erro aleat´orio, para
σ = 0, 5
Fator Distribui¸ao
IR% IR% EMR%
A N 44,00 44,25 0,56
FU 44,49 0,53
AE 44,32 0,17
AD 44,29 0,10
B N 25,67 25,66 0,05
FU 25,38 1,08
AE 25,65 0,05
AD 25,60 0,22
C N 26,62 26,55 0,28
FU 26,67 0,44
AE 26,48 0,25
AD 26,59 0,17
D N 3,70 3,54 4,62
FU 3,46 2,14
AE 3,55 0,15
AD 3,51 0,93
48
Cap´ıtulo 5
Conclus˜oes
Os intervalos de confian¸ca pela aproxima¸ao normal foram mais estreitos do que os per-
centis e os resultados no geral foram satisfat´orios com a inclus˜ao dos valores IR de referˆencia
na maioria dos IC ou com a proximidade nos casos da ao inclus˜ao. Assim, conclu´ımos
enao que existe evidˆencias de que o estimador da IR ´e robusto `a varia¸oes na forma da dis-
tribui¸ao do erro aleat´orio, visto que em todos os casos de distribui¸ao dos erros aleat´orios
gerados pela simula¸ao, a impotˆancia relativa teve distribui¸ao que pode ser considerada
normal pelos testes de Kolmogov-Smirnov, independente do tipo de distribui¸ao e do valor
do desvio-pardr˜ao do erro que foi utilizado na simula¸ao.
Somente alguns IC normais ao inclu´ıram o valor param´etrico ou de referˆencia, e
mesmo assim estes estavam na adjacˆencia do intervalo. Portanto, esta parece ser uma boa
alternativa pr´atica em estudos com a ANCF. Sugerimos ent˜ao investigar se o etodo delta
pode ser utilizado para se aproximar o desvio-padr˜ao da IR visando-se a constru¸ao de IC
normais para se comparar os valores de IR’s.
Verificou-se que para os fatores B e C, houve sobreposi¸ao dos intervalos de confian¸ca
tanto para o IC percentil quanto para o IC pela aproxima¸ao da normal nos casos onde o
49
desvio-padr˜ao utilizado foi σ = 2, 8. Isso foi devido `a grande amplitude dos erros somados
aos valores ‘tau’ fixados na simula¸ao, que gerou valores de y tamb´em com amplitude grande
e consequentemente geraram IR’s tamb´em com grande amplitude. Assim, acabou ocorrendo
a sobreposi¸ao dos intervalos de confian¸ca para os fatores B e C que foram propositalmente
escolhidos pr´oximos. Portanto, nesse contexto, ao se pode concluir que na simula¸ao apre-
sentada, os fatores B e C podem ser considerados com importˆancias relativas distintas, ou se
um fator ´e mais importante do que o outro, ou ainda se um fator causa maior impacto do que
o outro na avalia¸ao do produto (ou servi¸co) pelo consumidor. Tal fato ao ocorreu quando
diminu´ımos o desvio-padr˜ao para σ = 0, 5. Nesse caso, como a amplitude dos erros eram
pequenas, esses dados geraram valores de y com amplitude pequena e consquentemente IR’s
com amplitude tamb´em pequenas. Assim, ao ocorreu sobreposi¸ao de intervalos. Nesse
caso espec´ıfico, podemos considerar sim que as IR’s dos fatores B e C ao estat´ısticamente
distintas. Nesse contexto, nos aproximamos mais da realidade, j´a que as notas ao se alteram
tanto dentro de um mesmo tratamento.
Sugerimos tamb´em que se tente obter a fdp da IR pelo etodo do jacobiano da trans-
forma¸ao visando-se a constru¸ao de intervalos de confian¸ca exatos, ou ainda via inferˆencia
Bayesiana, assim, seria poss´ıvel obter intervalos de credibilidade.
50
Referˆencias Bibliogr´aficas
[1] ABADIO, F. D. B. Efeito de diferentes fatores de informa¸ao da embalagem de suco
de abacaxi (ananas comosus l. merr) no comportamento do consumidor 2003. 59 p.
Tese (Mestrado em Ciˆencia e Tecnologia de Alimentos) - Universidade Federal Rural do Rio
de Janeiro, Serop´edica - RJ.
[2] ANDRADE, D. F.; OGLIARI, P. J. Estat´ıstica para as ciˆencias agr´arias e biol´ogicas:
com no¸oes de experimenta¸ao Florian´opolis: Editora da UFSC, 2007. 432 p.
[3] ARTES, R. An´alise de preferˆencia ”conjoint analysis”. 1991. 189 p. Tese (Mestrado em
Estat´ıstica Instituto de Matem´atica e Estat´ıstica, Universidade de S˜ao Paulo, S˜ao Paulo - SP.
[4] CARNEIRO, J. D. S. Estudo dos fatores da embalagem e do otulo de cacha¸ca no
comportamento dos consumidores. 2007. 109 p. Tese (Doutorado em Ciˆencia e Tecnologia
de Alimentos) - Universidade Federal de Vi¸cosa - Vi¸cosa - MG.
[5] CARNEIRO, J. D. S. Impacto da embalagem de ´oleo de soja na inten¸ao de compra
do consumidor, via conjoint analysis. 2002. 80 p. Tese (Mestrado em Ciˆencia e Tecnologia
de Alimentos) - Universidade Federal de Vi¸cosa, Vi¸cosa - MG.
[6] CASELLA, G.; BERGER, R. L. Statistical inference. California: Editora Duxbury. 2ed,
2002.660 p.
[7] CASTRO, L. R. K. Valor percebido como ferramenta para tomada de decis˜ao: uma
aplica¸ao na ind´ustria hoteleira utilizando a an´alise conjunta. 2006. 187 p. Tese
(Mestrado em Engenharia de Produ¸ao) - Escola de Engenharia de ao Carlos, Universidade
de ao Paulo, ao Paulo - SP.
[8] DANTAS, M. I. S. Impacto da embalagem de couve (Brassica oleraceal cv. acephala)
minimamente processada na inten¸ao de compra do consumidor. 2001. 77p. Tese
(Mestrado em Ciˆencia e Tecnologia de Alimentos) - Universidade Federal de Vi¸cosa, Vi¸cosa -
MG.
51
[9] DELLA LUCIA, S. M. etodos estat´ısticos para a avalia¸ao da influˆencia de ca-
racter´ısticas ao sensoriais no comportamento do consumidor. 2008. 135 p. Tese
(Doutorado em Ciˆencia e Tecnologia de Alimentos) - Universidade Federal de Vi¸cosa, Vi¸cosa
- MG.
[10] FERREIRA, D. F. Estat´ıstica asica Lavras: Editora UFLA, 2005. 664 p.
[11] FONSECA, M. C. P.; SALAY, E. Opini˜ao de consumidores dos munic´ıpio de Campinas
(SP) sobre riscos `a sa´ude provenientes de alimentos. Dispon´ıvel em www.unicamp.br\
nepa\arquivo san\Opinio de Consumidores e riscos alimentares.pdf, acesso em 15 ago. 2008.
[12] KOHLI, R. Assessing Attribute Significance in Conjoint Analysis: Nonparametric Tests and
Empirical Validation Journal of Marketing Research, v. 25, no. 2 p. 123-133, 1988.
[13] MAGALH
˜
AES, M. N. Probabilidade e vari´aveis aleat´orias ao Paulo: Editora da Uni-
versidade de ao Paulo, 2ed, 2006. 428 p.
[14] MINIM, V. P. R. An´alise sensorial: estudos com consumidores. Vi¸cosa: Editora UFV,
2006. 225p.
[15] SAS Institute Inc., SAS Technical Report R-109, Conjoint Analysis Examples, Cary, NC:
SAS Institute Inc., 1993. 85 p.
[16] SILVA, C. H. O. A proposed framework for establishing optimal genetic designs for
estimating narrow-sense heritability. 2000. 198 p. Dissertation (Doctor of Philosophy in
Statistics) North Carolina State University - North Carolina.
[17] SIQUEIRA, J. O. Mensura¸ao da estrutura de preferˆencia do consumidor: uma
aplica¸ao da conjoint analysis em marketing. 2000. 250 p. Disserta¸ao (Mestrado em
Administra¸ao) - Universidade de ao Paulo, ao Paulo - SP.
[18] SPERS, E. E.; SAES, M. S. M.; SOUZA, M. C. M. An´alise das preferˆencias do consumi-
dor brasileiro de caf´e: um estudo explorat´orio dos mercados de ao Paulo e Belo
Horizonte. Dispon´ıvel em www.rausp.usp.br\download.asp?file=V390153.pdf, acesso em 15
ago. 2008.
[19] TRINDADE, A. L. G; ROTONDARO, R. G. Modifica¸ao da escala de classifica¸ao
por postos utilizada em An´alise Conjunta para aprimorar o modelo obtido por
regress˜ao com vari´aveis dummy. Revista Produ¸ao Online, v. 4, p. 2678-2685, 2004.
52
Apˆendice 1
Comandos do SAS (vers˜ao 9.1) utilizados para gerar as IR’s de referˆencia, sem a pre-
sen¸ca de erros aleat´orios.
options nodate pageno=1;
proc format; *to define factor levels; value Af 1 = ’pouca’ 2 =
’medio’ 3 = ’muito’; value Bf 1 = ’fraco’ 2 = ’medio’ 3 = ’forte’;
value Cf 1 = ’sim’ 2 = ’nao’; value Df 1 = ’baixo’ 2 = ’alto’;
run;
data a; *codede factor levels; format A Af. B Bf. C Cf. D Df. ;
* do cons=1 to 144; retain trt 0;
do A = 1 to 3; do B = 1 to 3; do C = 1 to 2; do D = 1 to 2;
trt=trt+1;
output; end; end; end; end;* end; run; proc print data = a; run;
data a3; set a;
IA1 = (A=1);
IA2 = (A=2);
IA3 = (A=3);
53
IB1 = (B=1);
IB2 = (B=2);
IB3 = (B=3);
IC1 = (C=1);
IC2 = (C=2);
ID1 = (D=1);
ID2 = (D=2);
b0=4; b11=-1.2; b12=-0.1; b13=1.3; b21=-0.5; b22=-0.45; b23=0.95;
b31=-0.75; b32=0.75; b41=-0.1; b42=0.1; run; proc print data=a3;
run;
data rates; set a3; y = b0 + IA1*b11 + IA2*b12 + IA3*b13 +
IB1*b21 + IB2*b22 + IB3*b23 +
IC1*b31 + IC2*b32 +
ID1*b41 + ID2*b42 ;
run;
proc print data = rates;
run;
/* com isso, os valores de y abaixo foram simulados.
Para facilitar, apenas copiei e colei os valores
desses y para rodar o proc transreg, e verificar
os valores das ir’s que estamos usando como par^ametros.*/
54
proc transreg ;
data teste;
input A B C D y;
datalines;
1 1 1 1 1.45
1 1 1 2 1.65
1 1 2 1 2.95
1 1 2 2 3.15
1 2 1 1 1.5
1 2 1 2 1.7
1 2 2 1 3
1 2 2 2 3.2
1 3 1 1 2.9
1 3 1 2 3.1
1 3 2 1 4.4
1 3 2 2 4.6
2 1 1 1 2.55
2 1 1 2 2.75
2 1 2 1 4.05
2 1 2 2 4.25
2 2 1 1 2.6
55
2 2 1 2 2.8
2 2 2 1 4.1
2 2 2 2 4.3
2 3 1 1 4
2 3 1 2 4.2
2 3 2 1 5.5
2 3 2 2 5.7
3 1 1 1 3.95
3 1 1 2 4.15
3 1 2 1 5.45
3 1 2 2 5.65
3 2 1 1 4
3 2 1 2 4.2
3 2 2 1 5.5
3 2 2 2 5.7
3 3 1 1 5.4
3 3 1 2 5.6
3 3 2 1 6.9
3 3 2 2 7.1 ;
run;
proc print; run; proc gchart data = teste;
vbar y / TYPE=FREQ//
56
midpoints=(0 to 9 by 1.5);
run;
proc capability data=teste; var y;
histogram y / normal(color=yellow w=3)
midpoints= 0 to 9 by 1.5
vscale = count;
run;
proc transreg data=teste utilities outtest=res.Utils short
dependent=yhat separators=’ ’; ods select FitStatistics Utilities;
title ’IR´s da Conjoint Analysis’;
title2 ’do estudo por simulacao’;
model identity(y) = class(A B C D / zero=sum);
output out=saida;
run;
proc print data=res.utils;
run;
proc print data=saida;
run;
57
proc corr data=saida; var y Ty; run;
proc transreg data=teste utilities short;
*ods select FitStatistics Utilities;
title ’IR´s da Conjoint Analysis’;
title2 ’do estudo por simulacao’;
model identity(y) = class(A B C D / zero=sum);
* output out=saida;
run;
58
Apˆendice 2
Comandos do SAS (vers˜ao 9.1) utilizados para simular os erros em forma de U com
σ = 0, 5 e gerar suas respectivas IR’s.
options nodate pageno=1;
libname IR2 ’C:\Documents and Settings\OK\Desktop\ULTIMA TESE\nova
tentativa nova\3coorientadores\arquivos sas’; /* Generate basic data
structure starts here*/
proc format; *to define factor levels; value Af 1 = ’pouca’ 2 =
’medio’ 3 = ’muito’; value Bf 1 = ’fraco’ 2 = ’medio’ 3 = ’forte’;
value Cf 1 = ’sim’ 2 = ’nao’; value Df 1 = ’baixo’ 2 = ’alto’;
run;
data a; *codede factor levels; format A Af. B Bf. C Cf. D Df. ;
* do cons=1 to 144; retain trt 0;
do A = 1 to 3; do B = 1 to 3; do C = 1 to 2; do D = 1 to 2;
trt=trt+1;
output; end; end; end; end;* end; run;
59
proc print data=a; run;
data a2(drop=cons);
set a;
t = 0.7 ; alf = 0.5 ; bet = 0.5 ; drop t alf bet ;
do simul=1 to 100;
do cons = 1 to 108;
u = uniform(3895) ;
r = betainv(u,alf,bet) ;
e = 2*t*(r-.5);
id_cons= compress(simul||A||B||C||D||Cons);
output;
end;
end; run;
proc sort data=a2; by simul trt id_cons; run; proc print data =
a2(obs=11664); var simul trt id_cons e; run;
proc means data = a2;by trt; var e; output; run;
goptions htitle=6 ftext=swissb ; proc gchart data =
a2(where=(trt=1)); title ; title2 height=4 ’FU’;
60
vbar e / TYPE=FREQ
midpoints=(-1 to 1 by .2);
run;
proc gchart data = a2(where=(trt=36)); title ; title2 height=4 ’FU’;
vbar e / TYPE=FREQ
midpoints=(-1 to 1 by .2);
run;
proc capability data = a2; var e; title ’FU’; histogram e
/normal(color=yellow w=3)
midpoints= -4 to 4 by .2
vscale = count;
run;
data a3;
set a2;
IA1 = (A=1);
IA2 = (A=2);
IA3 = (A=3);
IB1 = (B=1);
IB2 = (B=2);
IB3 = (B=3);
IC1 = (C=1);
IC2 = (C=2);
61
ID1 = (D=1);
ID2 = (D=2);
b0=4; b11=-1.2; b12=-0.1; b13=1.3; b21=-0.5; b22=-0.45; b23=0.95;
b31=-0.75; b32=0.75; b41=-0.1; b42=0.1; run;
proc print data=a3; run;
data rates; set a3; y = b0 + IA1*b11 + IA2*b12 + IA3*b13 +
IB1*b21 + IB2*b22 + IB3*b23 +
IC1*b31 + IC2*b32 +
ID1*b41 + ID2*b42 + e;
output;
run;
*======================================================;
proc means data = rates;*by trt; var y; output; run;
proc gchart data = rates(where=(trt=1));
vbar y / TYPE=FREQ
midpoints=(0.6 to 2.2 by 0.1);
title ;
title2 height=4 ’FU’;
run;
62
proc gchart data = rates(where=(trt=36));
vbar y / TYPE=FREQ
midpoints=(6.3 to 7.9 by 0.1);
title ;
title2 height=4 ’FU’;
run;
*======================================================;
* corrigir para 1 a 9;
data corrigir;set rates;
nota = (((y-0.7500000) / ( 7.8000000-0.7500000)) * 8) +1; nota2 =
int((((y-0.7500000) / ( 7.8000000-0.7500000)) * 8) +1);
if nota2<1 then nota2=1; if nota2>9 then nota2=9; run;
proc print data=corrigir (where=(trt=1)); var nota2; run;
proc means data = corrigir; var nota2; by trt; run;
proc gchart data = corrigir (where=(trt=1));
vbar nota / TYPE=FREQ
63
midpoints=(0 to 10 by .2);
title ;
title2 height=4 ’FU’;
run;
proc gchart data = corrigir (where=(trt=36));
vbar nota / TYPE=FREQ
midpoints=(0 to 10 by .2);
title ;
title2 height=4 ’FU’;
run;
proc gchart data = corrigir (where=(trt=1));
vbar nota2 / TYPE=FREQ
midpoints=(0 to 10 by 1);
title ;
title2 height=4 ’FU’;
run;
proc gchart data = corrigir (where=(trt=36));
vbar nota2 / TYPE=FREQ
midpoints=(0 to 10 by 1);
title ;
64
title2 height=4 ’FU’;
run;
proc print data = corrigir; run;
proc sort data=corrigir;
by simul A B C D;
run;
data tr;
set corrigir(keep = simul A B C D id_cons nota2 trt);
by simul A B C D;
run;
proc print data = tr; title ’basic data structure’; run;
proc transreg data=tr utilities short outtest=Utils separators=’ ’;
by simul;
ods select FitStatistics Utilities;
title ’Conjoint Analysis’;
model linear(nota2) =
class(A B C D / zero=sum);
run;
65
proc print data=Utils; run;
*---Gather the Importance Values---;
data Importance;
set Utils(keep= simul _depvar_ Importance Label);
by simul;
if n(Importance);
label = substr(label, 1, index(label, ’ ’));
run;
proc print data=Importance; title ’ ’; run;
proc transpose out=Importance2(drop=_:);
by simul _depvar_;
id Label;
run;
data IR2.importance2; set importance2; run;
proc print data=IR2.Importance2;
title2 ’Importance Values’;
run;
66
proc sort data = IR2.importance2;
by A;
run; proc print; run;
proc sort data = IR2.importance2;
by B ;
run; proc print; run;
proc sort data = IR2.importance2;
by C ;
run; proc print; run;
proc sort data = IR2.importance2;
by D ;
run; proc print; run;
proc means data=Importance2;
var A B C D;
title2 ’Average Importance’;
run;
goptions htitle=6 ftext=swissb ; axis1 value=(height=1.5); axis2
label=(’Freq’);
proc capability data=Importance2;
67
var A ;
title ;
title2 height=4 ’FU’;
histogram A /nolegend haxis = axis1 vaxis = axis2
normal(color=yellow w=3)
midpoints= 43.5 to 45.5 by 0.1
vscale = count;
run;
proc capability data=Importance2;
var B;
title ;
title2 height=4 ’FU’;
histogram B / nolegend haxis = axis1 vaxis = axis2
normal(color=yellow w=3)
midpoints= 24.6 to 26 by 0.1
vscale = count;
run;
proc capability data=Importance2;
var C;
title ;
title2 height=4 ’FU’;
68
histogram C /nolegend haxis = axis1 vaxis = axis2
normal(color=yellow w=3)
midpoints= 25.7 to 27.3 by 0.1
vscale = count;
run;
proc capability data=Importance2;
var D;
title ;
title2 height=4 ’FU’;
histogram D / nolegend haxis = axis1 vaxis = axis2
normal(color=yellow w=3)
midpoints= 2.5 to 4.3 by 0.1
vscale = count;
run;
69
Apˆendice 3
Comandos do SAS (vers˜ao 9.1) utilizados para simular os erros normais com σ = 0, 5
e gerar suas respectivas IR’s.
options nodate pageno=1;
libname IR1 ’C:\Documents and Settings\OK\Desktop\ULTIMA TESE\ nova
tentativa nova\3coorientadores\arquivos sas’; /* Generate basic data
structure starts here*/
proc format; *to define factor levels; value Af 1 = ’pouca’ 2 =
’medio’ 3 = ’muito’; value Bf 1 = ’fraco’ 2 = ’medio’ 3 = ’forte’;
value Cf 1 = ’sim’ 2 = ’nao’; value Df 1 = ’baixo’ 2 = ’alto’;
run;
data a; *codede factor levels; format A Af. B Bf. C Cf. D Df. ;
retain trt 0;
do A = 1 to 3; do B = 1 to 3; do C = 1 to 2; do D = 1 to 2;
trt=trt+1;
output; end; end; end; end; run;
70
proc print data=a; run;
data a2(drop=cons);
set a;
do simul=1 to 100;
do cons = 1 to 108;
id_cons= compress(simul||A||B||C||D||Cons);
output;
end;
end;
run;
proc print data=a2; run;
data a3;
set a2;
IA1 = (A=1);
IA2 = (A=2);
IA3 = (A=3);
IB1 = (B=1);
IB2 = (B=2);
IB3 = (B=3);
IC1 = (C=1);
71
IC2 = (C=2);
ID1 = (D=1);
ID2 = (D=2);
b0=4; b11=-1.2; b12=-0.1; b13=1.3; b21=-0.5; b22=-0.45; b23=0.95;
b31=-0.75; b32=0.75; b41=-0.1; b42=0.1; run;
proc print data=a3; run;
data rates; set a3; e = .5 * rannor(3895); tau= b0 + IA1*b11 +
IA2*b12 + IA3*b13 +
IB1*b21 + IB2*b22 + IB3*b23 +
IC1*b31 + IC2*b32 +
ID1*b41 + ID2*b42;
y = tau + e; output; run;
*==================================================;
proc means data = rates; by trt; var tau e; output; run;
goptions htitle=6 ftext=swissb ; proc gchart data =
rates(where=(trt=1));
vbar e / TYPE=FREQ
midpoints=(-2.2 to 2 by .2);
title ’Tratamento 1’;
title2 height=4 ’N’;
72
run;
proc gchart data = rates(where=(trt=36));
vbar e / TYPE=FREQ
midpoints =(-2 to 2 by .2);
title ’Tratamento 36’;
title2 height=4 ’N’;
run;
*===================================================;
*======================================================;
proc means data = rates;*by trt; var y; output; run;
proc gchart data = rates(where=(trt=1));
vbar y / TYPE=FREQ
midpoints=(-1 to 4 by .2);
title ’Tratamento 1’;
title2 height=4 ’N’;
run;
proc gchart data = rates(where=(trt=36));
vbar y / TYPE=FREQ
midpoints=(5 to 9 by .2);
title ’Tratamento 36’;
73
title2 height=4 ’N’;
run;
*=========================================================;
* corrigir para 1 a 9;
data corrigir;set rates; nota = (((y-(-0.6502759)) /
(8.9532705-(-0.6502759))) * 8) +1; nota2 = int((((y-(-0.6502759)) /
(8.9532705-(-0.6502759))) * 8) +1);
if nota2<1 then nota2=1; if nota2>9 then nota2=9; run; proc print
data=corrigir (where=(trt=1)); var nota2; run;
proc means data = corrigir; var nota2; by trt; run;
proc gchart data=corrigir(where=(trt=1));
vbar nota / TYPE=FREQ
midpoints=(0 to 10 by .2);
title ’Tratamento 1’;
title2 height=4 ’N’;
run;
proc gchart data=corrigir(where=(trt=36));
74
vbar nota / TYPE=FREQ
midpoints=(0 to 10 by .2);
title ’Tratamento 36’;
title2 height=4 ’N’;
run;
proc gchart data=corrigir(where=(trt=1));
vbar nota2 / TYPE=FREQ
midpoints=(0 to 10 by 1);
title ’Tratamento 1’;
title2 height=4 ’N’;
run;
proc gchart data=corrigir(where=(trt=36));
vbar nota2 / TYPE=FREQ
midpoints=(0 to 10 by 1);
title ’Tratamento 36’;
title2 height=4 ’N’;
run;
proc print data=corrigir; run;
proc capability data=corrigir;
75
var nota2;
histogram nota2 /normal(color=yellow w=3)
midpoints= 0 to 10 by 1
vscale = count;
run;
proc means data = corrigir;
var nota2;
output;
run;
proc sort data=corrigir;
by simul A B C D;
run;
data tr;
set corrigir(keep = simul A B C D id_cons nota2 trt);
by simul A B C D;
run;
proc print data = tr; title ’basic data structure’; run;
proc transreg data=tr utilities short outtest=Utils separators=’ ’;
76
by simul;
ods select FitStatistics Utilities;
title ’Conjoint Analysis’;
model linear(nota2) =
class(A B C D / zero=sum);
run;
proc print data=Utils; run;
*---Gather the Importance Values---;
data Importance;
set Utils(keep=simul _depvar_ Importance Label);
by simul;
if n(Importance);
label = substr(label, 1, index(label, ’ ’));
run;
proc print data=Importance; title ’ ’; run;
proc transpose out=Importance2(drop=_:);
by simul _depvar_;
id Label;
run;
77
data IR1.importance2; set importance2; run;
proc print data=IR1.Importance2;
title2 ’Importance Values’;
run;
proc sort data = IR1.importance2;
by A ;
run; proc print; run;
proc sort data = IR1.importance2;
by B ;
run; proc print; run;
proc sort data = IR1.importance2;
by C ;
run; proc print; run;
proc sort data = IR1.importance2;
by D ;
run; proc print; run;
proc means data=IR1.Importance2;
var A B C D;
78
title2 ’Average Importance’;
run;
goptions htitle=6 ftext=swissb ; axis1 value=(height=1.5); axis2
label=(’Freq’);
proc capability data=IR1.Importance2;
var A;
title ’Sigma = 0,5’;
title2 height=4 ’N’;
histogram A /
nolegend haxis = axis1 vaxis = axis2 normal(color=yellow w=3)
midpoints= 43 to 45 by 0.1
vscale = count;
run;
proc capability data=IR1.Importance2;
var B;
title ’Sigma = 0,5’;
title2 height=4 ’N’;
histogram B /
nolegend haxis = axis1 vaxis = axis2 normal(color=yellow w=3)
midpoints= 24.6 to 26.3 by 0.1
vscale = count;
79
run;
proc capability data=IR1.Importance2;
var C;
title ’Sigma = 0,5’;
title2 height=4 ’N’;
histogram C /
nolegend haxis = axis1 vaxis = axis2 normal(color=yellow w=3)
midpoints= 25.8 to 27.2 by 0.1
vscale = count;
run;
proc capability data=IR1.Importance2;
var D;
title ’Sigma = 0,5’;
title2 height=4 ’N’;
histogram D /
nolegend haxis = axis1 vaxis = axis2 normal(color=yellow w=3)
midpoints= 2.7 to 4.3 by 0.1
vscale = count;
run;
80
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo