CBCA
CBCA
CBCA
A análise de declarações, inicialmente menos sistemática do que o procedimento SVA atual, tem
sido aplicada por especialistas alemães em casos judiciais criminais desde a década de 1950 (Steller &
Boychuk, 1992), mas a pesquisa sobre a precisão da análise de declarações originou-se muito mais tarde.
Ressalta-se que foi após mais de 30 anos de prática forense nos tribunais alemães que foi publicado o
primeiro estudo alemão para validar a análise de declarações (Steller, 1989). Obviamente, mais pesquisas
empíricas sobre a validade do procedimento são necessárias (Doris, 1994). Artigos de pesquisa testando a
precisão da análise de enunciados apareceram em inglês pela primeira vez no final da década de 1980 e,
até onde sei, 37 estudos foram publicados e/ou apresentados (em inglês) em conferências até o momento.
Os achados desses estudos são discutidos neste artigo. No núcleo do SVA está a Análise de Conteúdo
Baseada em Critérios (CBCA; Berliner & Conte, 1993) e, portanto, talvez sem surpresa, a maioria desses 37
estudos tem se concentrado na precisão das análises do CBCA. Revisões anteriores da literatura do CBCA
foram publicadas (Horowitz, 1991; Cordeiro, Sternberg, Esplin, Hershkowitz, & Orbach, 1997; Pezdek e
Taylor, 2000; Rubi e Brigham, 1997; Tully, 1999; Vrij, 2000). No entanto, a presente revisão é a mais
abrangente, pois inclui mais estudos do que revisões anteriores e aborda um maior número de questões,
1
tais como taxas de concordância entre avaliadores; a frequência de ocorrência dos critérios individuais do
CBCA nas afirmativas; o efeito da idade, habilidade verbal, habilidade social e estilo de entrevista nos
escores do CBCA; e vários aspectos relacionados ao Checklist de Validade (outra parte do SVA).
A análise dos depoimentos teve origem na Alemanha e na Suécia. Talvez não seja surpreendente
que uma técnica tenha sido desenvolvida para verificar se uma criança foi ou não abusada sexualmente.
Muitas vezes é difícil determinar os fatos de um caso de abuso sexual porque muitas vezes não há
evidências médicas ou físicas. Muitas vezes, a suposta vítima e o réu prestam depoimentos contraditórios e,
muitas vezes, não há testemunhas independentes para dar uma versão objetiva dos fatos. Assim, a
credibilidade percebida do réu e da suposta vítima é importante. A suposta vítima está em uma posição
desvantajosa se for criança, pois os adultos tendem a desconfiar das declarações feitas por crianças (Ceci e
Bruck, 1995).
Os psicólogos alemães Arntzen (1982) e Undeutsch (1982) e o psicólogo sueco Trankell (1972)
sugeriram que vários critérios poderiam ser usados para avaliar a veracidade das afirmações. O primeiro a
descrever tal lista de critérios foi Undeutsch (1967). A hipótese subjacente a esses critérios é que "relatos
verdadeiros e baseados na realidade diferem significativa e visivelmente de histórias infundadas, falsificadas
ou distorcidas" (Undeutsch, 1982, p. 44). Undeutsch enfatizou que, além de examinar esses critérios, outros
aspectos também precisam ser levados em consideração para formar uma opinião final sobre a veracidade
de uma afirmação, como o grau em que a afirmação é consistente com informações de outras fontes
(Gumpert e Lindblad, 1999). Com a ajuda de outros, Gunter, Ko ̈hnkenand, Max, Steller levaram as análises
de declarações um passo adiante, refinando os critérios de Undeutsch e integrando-os em um procedimento
formal de avaliação que eles chamaram de SVA (Ko ̈hnken e Steller, 1988; Raskin e Esplin, 1991b; Raskin e
Steller, 1989; Raskin e Yuille, 1989; Steller, 1989; Steller e Boychuk, 1992; Steller e Ko ̈hnken,1989; Yuille,
1988b). A SVA é composta por três elementos: entrevista semiestruturada, CBCA e avaliação dos
resultados do CBCA.
A primeira etapa do SVA é uma entrevista semiestruturada na qual a criança fornece seu próprio
relato da alegação. Um elemento-chave é que a criança conte sua própria história sem qualquer influência
do entrevistador. Vários pesquisadores desenvolveram técnicas especiais de entrevista baseadas em
princípios psicológicos para obter o máximo de informações possível das crianças, num estilo narrativo livre,
sem estímulos ou sugestões inadequadas. Solicitações apropriadas (como “O que aconteceu a seguir?”) ou
perguntas (por exemplo, “Você acabou de mencionar um homem. Como ele era?”) fazem parte de tais
técnicas.
Características Gerais
1. Estrutura lógica
3. Quantidade de detalhes
Conteúdos Específicos
4. Incorporação contextual
6. Reprodução da conversa
8. Detalhes inusitados
9. Detalhes supérfluos
17. Autodepreciação
Com relação aos fatores cognitivos, supõe-se que a presença de vários critérios (Critérios 1–13; ver
Figura 1) provavelmente indicam experiências genuínas, pois são tipicamente muito difíceis de fabricar.
Portanto, afirmações que são coerentes e consistentes (estrutura lógica), em que a informação não é
fornecida em uma sequência temporal cronológica (produção não estruturada), e que contêm uma
quantidade significativa de detalhes (quantidade de detalhes) são mais prováveis de serem verdadeiras. Em
relação aos detalhes, é mais provável que os relatos sejam verdadeiros se incluírem incorporações
3
contextuais (referências ao tempo e ao espaço: "Ele se aproximou de mim pela primeira vez no jardim
durante as férias de verão"), descrições de interações ("No momento em que minha mãe entrou na sala, ele
parou de sorrir"), reprodução da fala (fala em sua forma original: "E então ele perguntou: 'É o seu
casaco?'"), complicações inesperadas (elementos incorporados no depoimento que são um tanto
inexplicáveis, por exemplo, a criança menciona que o agressor teve dificuldade em ligar o motor de seu
carro), detalhes incomuns (detalhes incomuns, mas significativos, por exemplo, uma testemunha que
descreve que o homem que conheceu tinha gagueira) e detalhes supérfluos (descrições que não são
essenciais para a alegação, por exemplo, uma testemunha que descreve que o agressor era alérgico a
gatos). Outro critério que pode indicar veracidade é quando uma testemunha fala de detalhes que estão
além do horizonte de sua compreensão, por exemplo, quando descreve o comportamento sexual do adulto,
mas o atribui a um espirro ou à dor (detalhes relatados com precisão incompreendidos). Finalmente,
possíveis indicadores de veracidade são se a criança relata detalhes que não fazem parte da alegação, mas
estão relacionados a ela (associações externas relacionadas, por exemplo, uma testemunha que descreve
que o agressor falou sobre as mulheres com quem havia dormido e as diferenças entre elas), descreve seus
sentimentos ou pensamentos experimentados no momento do incidente (relatos de estado mental
subjetivo), ou descreve os sentimentos, pensamentos ou motivos do perpetrador durante o incidente
(atribuição do estado mental do perpetrador: "Ele estava nervoso, suas mãos tremiam").
Outros critérios (Critérios 14–18; ver Figura 1) são mais prováveis de ocorrer em declarações
verdadeiras por razões motivacionais. Pessoas verdadeiras não estão tão preocupadas com a gestão de
impressões quanto os enganadores. Em comparação com os contadores da verdade, os enganadores estão
mais interessados em tentar construir um relatório que eles acreditam que causará uma impressão crível
nos outros, e por isso deixam de fora informações que, em sua opinião, prejudicarão sua imagem de pessoa
sincera (Ko ̈ hnken, 1999). Como resultado, é mais provável que uma declaração verdadeira contenha
informações inconsistentes com os estereótipos de veracidade. A lista do CBCA inclui cinco desses
chamados critérios de estereótipo contrário à veracidade (Ruby & Brigham, 1998): correções espontâneas
(correções feitas sem aviso do entrevistador ("Ele usava calças pretas, não, desculpe, eram verdes"),
admitindo falta de memória (expressando preocupação de que algumas partes da afirmação pudessem
estar incorretas: "penso", "talvez", "não tenho certeza" etc.), levantando dúvidas sobre o próprio testemunho
(objeções antecipadas contra a veracidade do próprio testemunho: "Eu sei que tudo isso soa muito
estranho"), autodepreciação (mencionando detalhes pessoalmente desfavoráveis, autoincriminadores:
"Obviamente, foi estúpido da minha parte deixar minha porta escancarada porque minha carteira estava
claramente visível em minha mesa") e perdoar o agressor (dando desculpas para o agressor ou deixando
de culpá-lo, como uma garota que diz que agora sente simpatia pelo réu que possivelmente enfrenta
prisão).
O último critério diz respeito a detalhes característicos da infração. Esse critério está presente se a
descrição dos eventos for típica do tipo de crime investigado (por exemplo, uma testemunha descreve
sentimentos que os profissionais sabem que são típicos de vítimas de, digamos, relações incestuosas).
Os escores do CBCA podem ser afetados por outros fatores que não a veracidade da afirmação.
Tome-se, por exemplo, a idade do entrevistado. As habilidades cognitivas e o domínio da linguagem
desenvolvem-se ao longo da infância, tornando gradualmente mais fácil dar relatos detalhados do que foi
4
testemunhado (Davies, 1991, 1994a; Fivush, Haden, & Adam, 1995). Portanto, todos os tipos de detalhes
são menos prováveis de ocorrer nos depoimentos de crianças pequenas. Além disso, crianças menores de
8 anos podem ter dificuldade em ver o mundo da perspectiva de outra pessoa (Flavell, Botkin, Fry, Wright, &
Jarvis, 1968); assim, é improvável que o critério 13 (relatos do estado mental do agressor) ocorra nos
depoimentos de crianças pequenas. Finalmente, as crianças mais novas têm capacidades metacognitivas e
metamemoriais menos desenvolvidas (isto é, saber se sabem ou não uma resposta; Walker & Warren,
1995), portanto, eles são menos propensos a estar cientes de lacunas em suas memórias (Critério 15).
Uma Lista de Verificação de Validade foi desenvolvida consistindo em questões que são
consideradas relevantes e que valem a pena examinar, pois podem afetar os escores do CBCA. Descrições
detalhadas das questões mencionadas na Lista de Verificação de Validade foram fornecidas por Raskin e
Esplin (1991b), Steller (1989), Steller e Boychuk (1992) e Yuille (1988b). Existem versões ligeiramente
diferentes da Lista de Verificação de Validade (autores diferentes usaram versões um pouco diferentes). A
Lista de Verificação de Validade apresentada a seguir é a publicada por Steller e colaboradores (Steller,
1989, Tabela II, usada aqui com a gentil permissão da Springer Science and Business Media; ver também
Steller & Boychuk, 1992). Os avaliadores do SVA consideram as seguintes questões:
(f) motivos para denunciar, por exemplo, se a relação do depoente com o acusado ou com outras
pessoas envolvidas sugere possíveis motivos para uma falsa alegação;
(g) Contexto da divulgação ou relatório original, por exemplo, se existem elementos questionáveis
no contexto da divulgação original;
(h) pressões para relatar falsamente, como indícios de que outros sugeriram, orientaram,
pressionaram ou coagiram o entrevistado a fazer uma denúncia falsa;
(i) coerência com a lei da natureza, ou seja, se os eventos descritos são irreais;
(j) coerência com outras afirmações, ou seja, se há elementos importantes da afirmação que sejam
inconsistentes ou contraditados por outra afirmação feita por esse entrevistado; e
(k) consistência com outras evidências, por exemplo, se há elementos importantes na declaração
que são contraditos por evidências físicas confiáveis ou outras evidências concretas.
A partir de agora, refiro-me a tais questões como fatores externos. Na terceira etapa do
procedimento de SVA, avaliação do resultado do CBCA, o avaliador aborda sistematicamente cada um dos
fatores externos mencionados na lista de verificação e explora e considera interpretações alternativas dos
resultados do CBCA.
5
(a) idade do entrevistado,
Estes são discutidos nesta revisão. Um quarto fator externo, as habilidades verbais do entrevistado,
foi examinado na pesquisa do CBCA, mas não está incluído na lista de verificação de validade. Esse fator
também é discutido.
A REVISÃO DA LITERATURA
Todos os artigos publicados e capítulos de livros que apareceram em uma busca na literatura
(PsycLIT, usando os termos de busca Análise de Conteúdo Baseada em Critérios, Validade de Enunciados
Avaliação e Análise da Validade do Enunciado) foram incluídos nesta revisão. Além disso, incluí todos os
artigos conhecidos da conferência CBCA/SVA, incluindo aqueles que foram relatados anteriormente na
literatura de SVA. Finalmente, incluiu-se o estudo de campo inédito de Boychuk (1991). Este estudo
recebeu ampla cobertura na literatura de SVA). Os estudos incluídos na revisão são indicados com um
asterisco na lista de referência.
TIPO DE ESTUDOS:
Na tentativa de validar os pressupostos do CBCA, dois tipos de estudos têm sido realizados. Em
estudos de campo, declarações feitas por pessoas em casos reais de suposto abuso sexual foram
examinadas, enquanto em estudos experimentais de laboratório, declarações de participantes que mentiram
ou disseram a verdade para o bem do experimento foram avaliadas. Cada paradigma tem suas vantagens,
e a força de um é a fraqueza do outro. Os depoimentos avaliados em estudos de campo têm clara
relevância forense, pois são depoimentos derivados de casos reais. No entanto, muitas vezes é difícil
estabelecer a verdade ou falsidade dessas afirmações sem dúvida.
Normalmente, critérios como confissão, resultados do polígrafo e condenação têm sido usados para
estabelecer se uma afirmação é realmente verdadeira ou falsa. O problema é que esses critérios, muitas
vezes, não são independentes da qualidade da declaração e, portanto, dos escores do CBCA. Por exemplo,
as declarações foram classificadas como duvidosas se o juiz rejeitasse as acusações em estudos
conduzidos por Esplin, Boychuk, e Raskin (1988) e Boychuk (1991). Contudo, um despedimento pode ser
simplesmente o resultado de a criança ser incapaz de expressar de forma convincente ao juiz ou ao júri o
que ela viveu; isso não implica necessariamente que a criança esteja mentindo.
Outro critério frequentemente usado para estabelecer se uma afirmação é realmente verdadeira ou
falsa é uma confissão (Craig, Scheibe, Raskin, Kircher, & Dodd, 1999). No entanto, se a única prova contra
o réu culpado é a declaração incriminadora da criança, o que é frequentemente o caso em casos de abuso
sexual, é improvável que o autor confesse o crime se a declaração incriminadora for de má qualidade,
porque a principal motivação do autor para confessar um crime é a percepção de que as provas contra ele
ou ela são fortes (Moston, Stephenson, Williamson, 1992). Por outro lado, se uma declaração incriminadora
falsa for persuasiva e julgada verdadeira por um perito do CBCA, as chances de o réu inocente obter uma
absolvição diminuem drasticamente, e se não houver chance de evitar um veredicto de culpado, pode ser
6
benéfico se declarar culpado para obter uma pena reduzida (Steller & Ko ̈ hnken, 1989). Em resumo,
declarações de baixa qualidade (por exemplo, não convincentes) diminuem a probabilidade de obter uma
confissão, e declarações de alta qualidade (por exemplo, convincentes) aumentam a probabilidade de obter
uma confissão, independentemente de uma declaração ser verdadeira ou fabricada.
Bons estudos de campo estabelecem se a declaração é realmente verdadeira ou falsa com base em
critérios que são independentes do depoimento da testemunha, como provas de DNA e evidências médicas.
No entanto, esse tipo de evidência muitas vezes não está disponível em casos reais em que avaliações do
CBCA são conduzidas (Steller & Ko ̈hnken,1989). Para uma discussão sobre as dificuldades em estabelecer
se uma afirmação é verdadeira ou falsa em estudos sobre abuso sexual, ver Horowitz e colaboradores
(1996).
Steller (1989) argumentou que as experiências de abuso sexual são caracterizadas por três
elementos importantes:
O primeiro elemento poderia ser facilmente introduzido em um estudo experimental; os dois últimos
elementos são mais difíceis devido a restrições éticas. Um paradigma popular na pesquisa experimental do
CBCA, portanto, é convidar os participantes a dar um relato de um evento negativo que eles
experimentaram, como dar uma amostra de sangue, ser mordido por um cachorro e assim por diante, ou
dar um relato fictício de tal evento que eles realmente não experimentaram. Obviamente, o experimentador
precisa estabelecer se a história é realmente verdadeira ou fictícia, por exemplo, verificando com os pais
dos participantes, embora isso nem sempre aconteça na pesquisa experiencial (ver, por exemplo, Ruby &
Brigham, 1998).
Diferentes estudos utilizaram diferentes paradigmas. É feita uma distinção entre estudos de campo
e estudos de laboratório. Nos estudos de laboratório, é feita uma distinção adicional entre estudos em que
os entrevistados realmente participaram de um evento e foram solicitados a dizer a verdade ou mentir sobre
aquele evento depois (ativos), estudos em que lhes foi mostrado um vídeo e, em seguida, solicitado a dizer
a verdade ou mentir sobre aquele vídeo (vídeo), estudos em que assistiram a um evento encenado e, em
seguida, foram solicitados a dizer a verdade ou mentir sobre aquele evento ( encenados) e estudos nos
7
quais lhes foi pedido que contassem uma história verdadeira ou fictícia sobre uma experiência negativa
anterior em sua vida (memória).
Como mencionado anteriormente, o CBCA foi desenvolvido para avaliar depoimentos de crianças
que são testemunhas ou supostas vítimas em casos de abuso sexual. Muitos autores ainda descrevem o
CBCA como uma técnica desenvolvida apenas para avaliar declarações feitas por crianças em julgamentos
de crimes sexuais (ver, por exemplo, Honts, 1994; Horowitz et al., 1997). Outros, no entanto, têm defendido
o uso adicional da técnica para avaliar os depoimentos de adultos que falam sobre outras questões além do
abuso sexual (Ko ̈hnken et al., 1995; Porter & Yuille, 1996; Rubi e Brigham, 1997; Steller & Ko ̈hnken, 1989).
Esses autores apontaram que a hipótese subjacente de Undeutsch não se restringe nem a crianças,
testemunhas e vítimas, nem a abuso sexual.
Vários pesquisadores realizaram estudos de campo sem examinar as diferenças nos escores do
CBCA entre relatos verdadeiros e falsos (Anson, Golding, & Gully, 1993; Buck, Warren, Betman, e Brigham,
2002; Davies et al., 2000; Hershkowitz, Cordeiro, Sternberg, & Esplin, 1997; Lamers-Winkelman & Buffing,
1996). Esses pesquisadores examinaram o impacto de fatores como idade ou estilo de entrevista nos
escores do CBCA, e seus achados são discutidos na seção, Lista De Verificação De Validade. Outros
examinaram o impacto da veracidade nos escores do CBCA.
O primeiro estudo de campo do CBCA já apresentado foi o de Esplin et al., em 1988. Um avaliador
treinado do CBCA avaliou as afirmações. Caso um critério não estivesse presente na afirmativa, este
recebia nota 0; se estivesse presente, recebia nota 1; e se estivesse fortemente presente, recebia nota 2.
Assim, os escores totais do CBCA poderiam variar entre 0 e 38. Os resultados foram impressionantes. Os
casos confirmados receberam escore médio do CBCA de 24,8 e as declarações duvidosas receberam
escore médio de 3,6. Além disso, as distribuições dos escores dos grupos confirmado e duvidoso não
apresentaram uma única sobreposição. O maior escore no grupo duvidoso foi 10 (uma criança recebeu
esse escore e três crianças obtiveram um escore 0), enquanto o menor escore no grupo confirmado foi 16
(uma criança obteve esse escore e o maior escore foi 34). Quando as diferenças entre os dois grupos em
cada critério foram avaliadas, as diferenças entre os grupos duvidoso e confirmado emergiram para 16 dos
19 critérios, todos na direção esperada. Ou seja, os critérios estiveram mais presentes nos casos
confirmados do que nos casos duvidosos, o que corrobora fortemente a hipótese Undeutsch. No entanto, o
estudo de Esplin foi fortemente criticado.
Os problemas com o estudo de Esplin et al., (1988), incluem o fato de que apenas um avaliador
pontuou as transcrições, que o efeito poderia ter sido simplesmente um efeito de idade e que a decisão
sobre o que realmente havia acontecido não foi baseada em fatos de caso independentes. Wells e Loftus
(1991) apontaram que as diferenças entre os dois grupos podem ter sido causadas por diferenças de idade
entre esses grupos. De fato, as crianças do grupo confirmado eram mais velhas (9,1 anos) do que as
crianças do grupo duvidoso (6,9 anos). Além disso, o grupo duvidoso continha oito afirmações de crianças
menores de 5 anos, enquanto o grupo confirmado continha apenas uma afirmação de criança menor de 5
anos. Em segundo lugar, os critérios independentes utilizados para os casos duvidosos no estudo foram a
destituição judicial, a ausência de acusação, a ausência de confissões feitas pelo réu e a negação
8
persistente do acusado. Como identificado anteriormente, nenhum desses critérios são fatos de caso
independentes.
Em seu estudo posterior, Boychuk (1991) abordou algumas dessas críticas. Os depoimentos de 75
crianças com idades entre 4 e 16 anos foram analisados por três avaliadores mascarados quanto à
disposição do caso. Ela também incluiu em sua amostra, além dos grupos confirmados e duvidosos, um
terceiro grupo: provavelmente abusados. Os prováveis abusados foram aqueles sem provas médicas, mas
com confissões dos acusados ou sanções criminais de um tribunal superior. Não por acaso, em todas as
suas análises, ela combinou o grupo confirmado e o grupo provável abusado. Ao avaliar as diferenças entre
os dois grupos restantes em cada critério, Boychuk encontrou menos diferenças significativas do que Esplin
e colaboradores (1988), mas todas as 13 diferenças encontradas foram na direção esperada. Ou seja, os
critérios estiveram mais presentes nos casos confirmados do que nos casos duvidosos, o que novamente
corrobora a hipótese Undeutsch.
Avaliações do CBCA foram realizadas para avaliar a veracidade de alegações de estupro de adultos
em um estudo de campo publicado por Parker e Brown (2000). Foram encontradas diferenças em vários
critérios, e todas as diferenças foram na direção esperada. No entanto, este estudo também apresentou
sérios problemas metodológicos. Por exemplo, os critérios para estabelecer a veracidade real das
declarações, a evidência convincente de estupro (quando não foi dada nenhuma informação sobre o que se
queria dizer com isso) e a corroboração no sentido jurídico e com um suspeito sendo identificado ou
acusado, são fatos muito vagos ou não independentes. Além disso, apenas um avaliador examinou a
maioria dos casos, e não está claro se essa pessoa estava mascarada em relação aos fatos do caso ou se
tinha alguma informação de fundo sobre os casos que ela ou ele foi solicitado a avaliar.
Em um estudo de campo mais bem controlado, Lamb, Sternberg, Esplin, Hershkowitz, Orbach, e
Hovav (1997) selecionaram e analisaram os depoimentos de 98 supostas vítimas de abuso sexual infantil
(com idades entre 4 e 12 anos) e incluíram apenas casos em que havia:
O uso desses critérios de seleção significou que muitos outros casos precisaram ser
desconsiderados, já que a amostra inicial consistiu de 1.187 entrevistas. Eles encontraram menos
diferenças significativas do que Boychuk (1991) e Esplin (1988), em parte porque nem todos os 19 critérios
foram incluídos na avaliação. No entanto, novamente, todas as diferenças foram na direção esperada, ou
seja, os critérios estiveram mais presentes no grupo plausível do que no grupo implausível. Assim como
Esplin e colaboradores, Lamb, também calcularam os escores médios do CBCA de seus dois grupos. Caso
um critério não estivesse presente na afirmativa, este recebia nota 0; se estivesse presente, recebia nota 1.
Apenas 14 critérios foram utilizados neste estudo, o que fez com que o escore total do CBCA pudesse variar
de 0 a 14. Significativamente mais critérios estiveram presentes nos casos confirmados (6,74) do que nos
casos duvidosos (4,85). Essa diferença, no entanto, é bem menor do que a encontrada por Esplin e colegas.
Craig e colaboradores (1999) examinaram 48 depoimentos de crianças entre 3 e 16 anos que foram
supostas vítimas de abuso sexual. Uma declaração foi classificada como confirmada se o acusado fez uma
confissão e/ou foi reprovado em um teste de polígrafo. Uma declaração foi classificada como altamente
9
duvidosa se a criança forneceu uma retratação detalhada e credível e/ou se o acusado passou por um teste
de polígrafo, ou seja, quando o teste do polígrafo sugeriu que o acusado era inocente. Em outras palavras,
este estudo também não estabeleceu fatos de caso independentes. A pontuação média do CBCA dos casos
confirmados (7,2) foi ligeiramente superior à pontuação média dos casos duvidosos (5,7). Foram utilizados
apenas 14 critérios, podendo os escores variar de 0 a 14. Apenas os escores totais do CBCA foram
examinados.
Em comparação com a maioria dos estudos de campo, os estudos laboratoriais revelaram menos
diferenças entre mentirosos e contadores da verdade por estudo. Quase todas as diferenças, no entanto,
foram na direção esperada, com os critérios ocorrendo com mais frequência em relatórios verdadeiros do
que em relatórios enganosos, apoiando a hipótese Undeutsch. Esse apoio consistente aos critérios do
CBCA é impressionante quando comparado com pesquisas sobre indicadores não verbais de engano, nas
quais os achados são muito mais erráticos (ver Vrij, 2000, para uma revisão de tais pesquisas). Quase
todos os achados que se desviaram do padrão geral foram obtidos nos estudos de Landry e Brigham (1992)
e Ruby e Brigham (1998). Várias explicações para isso podem ser possíveis. Eles utilizaram avaliadores
que foram treinados por apenas 45 min na pontuação do CBCA, e é duvidoso que as pessoas pudessem
ser consideradas treinadas pelo CBCA após um período de treinamento tão curto. Além disso, os
avaliadores foram expostos a enunciados muito curtos, em média 255 palavras, enquanto o método CBCA
foi desenvolvido para uso em enunciados mais longos (Raskin & Esplin, 1991b). Finalmente, no estudo de
Landry e Brigham, alguns avaliadores não leram as transcrições dos depoimentos (procedimento comum do
CBCA), mas assistiram a depoimentos gravados em vídeo. Os especialistas do CBCA normalmente não são
favoráveis à avaliação de declarações gravadas em vídeo, pois assistir a um vídeo pode distrair o avaliador
do CBCA de sua tarefa de avaliação (Ko ̈hnken, 1999). As pessoas também percebem a frequência de
ocorrência de critérios verbais de forma diferente em diferentes modos de apresentação: elas tipicamente
acreditam que tais critérios estão mais presentes ao assistir a um vídeo do que ao ler um texto (Stro ̈mwall &
Granhag, 2003). Além disso, pesquisas demonstraram que as pessoas são melhores em detectar verdades
e mentiras quando leem uma transcrição do que quando assistem a um vídeo (ver DePaulo, Stone, &
Lassiter, 1985, para uma revisão). Em outras palavras, esses estudos se desviaram consideravelmente do
procedimento normal do CBCA em certos pontos que podem ter afetado os julgamentos do CBCA.
Além disso, tanto nas narrativas de crianças quanto de adultos, os critérios emergiram com maior
frequência nos relatos verdadeiros. As diferenças de idade foram testadas diretamente pela inclusão de
declarações de adultos e crianças em experimentos de Akehurst, Ko ̈hnken e Ho ̈fer (2001) e Vrij, Akehurst,
Soukara, e Bull (2002). Ambos encontraram escores totais mais altos no CBCA para contadores da verdade
do que para mentirosos em ambas as faixas etárias (crianças versus adultos); no entanto, eles não
examinaram diferenças de idade nos critérios separados, e os resultados apresentados são os escores
combinados para adultos e crianças.
10
uma pontuação total mais alta para contadores da verdade do que para mentirosos em suspeitos e
testemunhas, mas não examinaram diferenças em cada critério.
Finalmente, as diferenças esperadas foram encontradas nas pontuações do CBCA entre mentirosos
e contadores da verdade em todos os paradigmas de pesquisa experimental – envolvimento real, assistir a
um vídeo, declarações derivadas da memória e assim por diante – o que é mais uma indicação de que as
diferenças nos escores do CBCA são bastante robustas.
Um olhar sobre o suporte empírico para cada um dos 19 critérios mostra que o critério 3 (quantidade
de detalhes) recebeu mais apoio. A quantidade de detalhes foi calculada em 20 estudos e, em 16 desses
estudos (80%), os contadores da verdade incluíram significativamente mais detalhes em seus relatos do
que os mentirosos. A produção não estruturada (Critério 2), as incorporações contextuais (Critério 4) e a
reprodução da conversação (Critério 6) também receberam forte apoio. Os chamados critérios
motivacionais, Critérios 14 a 18, receberam menos apoio do que a maioria dos critérios cognitivos (1–13).
Na verdade, o critério 17, a autodepreciação, não recebeu nenhum apoio até o momento. Esse critério foi
examinado em seis estudos. Em dois estudos, uma diferença significativa entre mentirosos e contadores da
verdade apareceu e, em ambas as vezes, o critério apareceu com menos frequência nas declarações
verdadeiras. Berliner e Conte (1993) apontaram que os critérios 14 a 16 exigem que a testemunha
demonstre falta de confiança no relato como prova de veracidade. Isso, eles observaram, sugere por
implicação que a confiança diminui a probabilidade de veracidade, o que é uma implicação que eles
consideram discutível. Como pode ser visto, vários pesquisadores não examinaram os Critérios 15 a 19 por
questões de confiabilidade entre avaliadores (Lamb, Sternberg, Esplin, Hershkowitz, Orbach, & Hovav,
1997) ou porque acreditavam que esses critérios não estão teoricamente relacionados ao conceito básico
de memória incorporado na hipótese Undeutsch (Raskin & Esplin, 1991b). Detalhes relatados com precisão,
mal compreendidos (Critério 10) e que suscitam dúvidas sobre o próprio depoimento (Critério 16) também
receberam pouco apoio, talvez, como será mostrado a seguir, pois esses critérios não estão frequentemente
presentes nos depoimentos.
A hipótese de que os contadores da verdade obteriam uma pontuação total mais alta do CBCA do
que os mentirosos foi examinada em 12 estudos. Em 11 desses 12 estudos (92%), a hipótese foi apoiada.
11
(c) kappas de Cohen
A concordância percentual pode ser inflada pelo acaso (Maxwell, 1977), por isso é preferível usar
estatísticas corrigidas pelo acaso. O kappa de Cohen é uma estatística. No entanto, sabe-se que o kappa é
impreciso quando as taxas básicas divergem significativamente de .50 (Spitznagel & Helzer, 1985), ou seja,
quando um critério dificilmente está presente em qualquer um dos enunciados ou quando um critério está
presente em quase todos os enunciados. Argumenta-se que a ER de Maxwell é a melhor estatística a ser
utilizada nessas circunstâncias (Maxwell, 1977). Vários pesquisadores pontuaram a presença ou ausência
de critérios em escalas do tipo Likert e, nesses casos, o cálculo das taxas de concordância é inadequado.
Nesses casos, foram utilizadas correlações.
Vários pesquisadores examinaram a frequência com que os critérios estavam presentes nos
enunciados. Embora os escores de frequência de ocorrência tenham sido calculados tanto em estudos de
campo quanto em estudos de laboratório, os achados de estudos de campo são provavelmente mais
relevantes, pois a ocorrência depende de um evento que alguém tenha testemunhado. Por exemplo, se os
participantes de um estudo de laboratório testemunharam um vídeo em que nenhum detalhe incomum
ocorreu, a frequência de ocorrência de detalhes incomuns nos depoimentos dessas testemunhas
provavelmente será muito baixa. Portanto, discuto aqui apenas os estudos de campo.
Como pode ser observado, a frequência de ocorrência dos critérios difere amplamente para cada
critério. Em particular, o Critério 1 (estrutura lógica), o Critério 3 (quantidade de detalhes), o Critério 4
(incorporações contextuais) e o Critério 19 (detalhes característicos da ofensa) estão frequentemente
presentes, enquanto o Critério 10 (detalhes relatados com precisão mal compreendidos), o Critério 16
(levantar dúvidas sobre a memória) e o Critério 17 (autodepreciação) raramente ocorrem em declarações
(tipicamente em menos de 10% das afirmações). Os três últimos critérios são também os que têm menos
apoio para a hipótese Undeutsch. Vários pesquisadores examinaram diferenças de idade na frequência de
ocorrência dos critérios do CBCA. Esses resultados serão discutidos posteriormente.
12
Os avaliadores treinados são melhores do que os leigos? A primeira questão a ser discutida é se há
alguma evidência de que as classificações de contadores da verdade e mentirosos com base nos escores
do CBCA são melhores do que as classificações feitas por leigos. Vários estudos nos quais especialistas ou
leigos do CBCA julgaram declarações de crianças são discutidos em Vrij (2002a), culminando na tentativa
de conclusão de que os especialistas do CBCA foram melhores do que os leigos. No entanto, os estudos
incluídos nessa revisão utilizaram especialistas do CBCA ou leigos como avaliadores, de modo que uma
comparação direta não pôde ser feita. Além disso, provavelmente houve uma confusão nesses estudos.
Nos estudos do CBCA, os especialistas fizeram seus julgamentos com base nas transcrições escritas,
enquanto nos estudos com leigos, os julgamentos foram tipicamente feitos com base na visualização de
fitas de vídeo com os entrevistados. Como mencionado anteriormente, as pessoas são melhores em
detectar verdades e mentiras quando leem uma transcrição do que quando assistem a um vídeo (DePaulo
et al., 1985).
Todos os estudos que examinaram o impacto do treinamento CBCA nos escores de precisão
claramente estão aquém desse requisito de 2 ou 3 dias de workshop. A sessão de treinamento mais curta
(45 min) foi dada por Landry e Brigham (1992) e Ruby e Brigham (1998), embora aos 90 min, a sessão de
treinamento de Steller et al. A sessão de Akehurst et al., (1998), teve duração de 2h, enquanto Ko ̈hnken
(1987) e Santtila et al (2000) não forneceram informações sobre a duração de suas sessões de treinamento.
No entanto, suas sessões podem ter sido de duração semelhante, pois o conteúdo das sessões de
treinamento utilizadas nesses dois estudos se assemelhava fortemente às sessões de treinamento
utilizadas nos outros estudos mencionados até o momento. Em um estudo típico, os estagiários recebem
uma apostila com informações sobre os critérios do CBCA. Em seguida, um treinador explica os critérios
com mais profundidade e fornece alguns exemplos. Os formandos são então solicitados a avaliar uma ou
algumas declarações de exercício, e as suas classificações são discutidas. A sessão de treinamento foi
ligeiramente diferente no estudo de Tye (1999), pois, em vez de treinar avaliadores especificamente para
seu experimento, eles usaram um painel de pessoas previamente treinadas no CBCA (nenhuma informação
foi dada sobre o treinamento que esses avaliadores previamente treinados receberam).
Os resultados desses estudos de treinamento são mistos. Vários pesquisadores descobriram que
avaliadores treinados eram melhores em distinguir entre verdades e mentiras do que avaliadores leigos
(Landry & Brigham, 1992; Steller et al., 1988; Tye et al., 1999). Alguns não encontraram efeito de
treinamento (Ruby & Brigham, 1998; Santtila et al., 2000), e outros constataram que o treinamento piorava
13
os avaliadores na distinção entre verdades e mentiras (Akehurst et al., 1998; Ko ̈ hnken, 1987).
Provavelmente não é justo desacreditar o treinamento do CBCA com base nesses achados, dada a falta de
profundidade dessas sessões de treinamento. Tudo o que se pode concluir é que fornecer aos avaliadores
programas de treinamento tão curtos tem um efeito imprevisível sobre a capacidade de detectar verdades e
mentiras.
Um segundo método é pedir aos especialistas do CBCA que façam classificações de verdade e
mentira. Este método é mais realista, pois é o que acontece na vida real. No entanto, também é altamente
subjetivo, porque uma classificação depende da própria interpretação de um enunciado por um avaliador. O
problema óbvio da subjetividade é a generalização. Não há garantia de que dois especialistas diferentes do
CBCA que julgam as mesmas declarações tomarão as mesmas decisões. Em outras palavras, a taxa de
precisão obtida por um especialista em um estudo CBCA não prediz a taxa de precisão obtida por um
segundo especialista no mesmo estudo.
O único estudo de campo em que foram relatadas taxas de precisão e uma taxa de precisão global
muito alta de 90% foi encontrada foi conduzido por Parker e Brown (2000). Não foi encontrada uma única
sobreposição entre os escores CBCA de casos confirmados e não confirmados por Esplin (1988). Todos os
escores para os casos não confirmados foram menores do que qualquer um dos escores para os casos
confirmados, o que implica que Esplin, encontraram uma taxa de precisão ainda maior (100%). Embora
ambos os estudos tenham mostrado um enorme apoio para a precisão das avaliações do CBCA, como
discutido anteriormente, ambos os estudos também apresentaram falhas metodológicas. Prefiro, portanto,
ignorar esses resultados.
Em relação aos demais estudos em que foram relatadas taxas de acurácia (todos os laboratoriais),
as taxas gerais de precisão nesses estudos variaram de 65% a 90%, com exceção de Landry e Brigham
(1992), que obtiveram menor índice de precisão. Já dei várias razões para explicar suas descobertas
excepcionais – treinamento curto, declarações curtas, assistir a fitas de vídeo. Além disso, os avaliadores
foram aconselhados a usar uma regra de decisão em que mais de cinco critérios presentes equivalem a um
14
bom indicativo de alta credibilidade, o que não é o que os especialistas do CBCA costumam fazer. Se
desconsiderarmos seus achados, as taxas de acerto para verdades variaram entre 53% e 89% e as taxas
de precisão para mentiras entre 60% e 100%. A taxa média de acerto das verdades nesses estudos é de
73%, semelhante às taxas de acerto das mentiras, que é de 72%. As taxas de precisão para crianças não
parecem diferir das taxas de precisão para adultos, reforçando ainda mais que as avaliações do CBCA não
se restringem às afirmações das crianças.
Que eu saiba, Ruby e Brigham (1998) são os únicos pesquisadores que examinaram o impacto da
etnia na qualidade das declarações (ver também Vrij & Winkel, 1991, 1994, para diferenças étnicas no estilo
de fala). Essa questão merece atenção em estudos futuros, dadas as possíveis diferenças nas técnicas
narrativas entre diferentes culturas (Davies, 1994b; Phillips, 1993).
IDADE DO ENTREVISTADO:
Pesquisas demonstraram de forma convincente que, como previsto, os escores do CBCA estão
positivamente correlacionados com a idade.
Utilizando depoimentos de crianças em casos de abuso sexual (com idade variando entre 4 e 12
anos), Anson e colaboradores (1993) encontraram que a idade estava significativamente correlacionada
com a estrutura lógica, incorporação contextual, descrição das interações, reprodução da conversa, perdão
ao perpetrador e detalhes característicos do delito. Entrevistas de supostas vítimas de abuso sexual
também foram analisadas por Boychuk (1991), que comparou os escores do CBCA de depoimentos de
crianças de diferentes faixas etárias (idade variando de 4 a 16 anos) e constatou que descrições de
interações, relatos do estado mental do agressor, admissão de falta de memória e autodepreciação estavam
mais presentes nos depoimentos de crianças mais velhas (entre 8 e 16 anos) do que nos depoimentos de
crianças mais novas (entre 4 e 7 anos). Os depoimentos de supostas vítimas de abuso sexual (de 2 a 11
anos) foram analisados por Lamers-Winkelman e Buffing (1996), e seis critérios foram positivamente
correlacionados com a idade: incorporações contextuais, descrições de interações, reprodução de
conversas, detalhes supérfluos, admissão de falta de memória e detalhes característicos do delito.
Entrevistas de abuso sexual infantil de crianças de 2 a 14 anos foram examinadas por Buck e
colaboradores (2002), que encontraram que o escore total do CBCA e 13 dos 19 critérios estavam
correlacionados com a idade. Todos os 6 critérios que não foram correlacionados (detalhes incomuns,
detalhes relatados com precisão incompreendidos, atribuição do estado mental do perpetrador, levantar
dúvidas sobre a própria memória, autodepreciação e perdão ao perpetrador) estavam presentes em menos
de 10% das entrevistas.
No único estudo de laboratório até o momento que examinou diferenças de idade nos critérios
individuais do CBCA, Santtila e colaboradores (2000) descobriram que a faixa etária mais jovem (7 a 8
15
anos) obteve pontuação significativamente menor em estrutura lógica, quantidade de detalhes, estado
mental do perpetrador e correções espontâneas em comparação com a faixa etária mais velha (13-14
anos).
ESTILO DO ENTREVISTADOR:
TREINAMENTO DO ENTREVISTADO:
Dado que alguns fatores externos influenciam os escores do CBCA, os especialistas em SVA levam
esses fatores em consideração ao fazer seus julgamentos finais? Pesquisas sobre como a Lista de
Verificação de Validade é usada na vida diária são raras (mas ver Gumpert & Lindblad, 1999; Lamers-
Winkelman, 1999; e Parker & Brown, 2000, para exceções). No entanto, várias questões podem ser
levantadas com base nos princípios psicológicos e nas pesquisas disponíveis.
Alguns fatores da verificação de validade da lista podem ser difíceis de identificar. Os especialistas
da SVA procuram evidências de que um adulto pode ter treinado a criança para aumentar a credibilidade
percebida das declarações. Por exemplo, em um acordo de divórcio amargo, um dos pais pode usar a tática
duvidosa de expor falsamente seu ex-cônjuge como um abusador de crianças para aumentar as chances de
ganhar a guarda dos filhos. Em seus experimentos, Joffe e Yuille (1992) e Vrij, Kneller, e Mann (2000)
treinaram alguns participantes e pediram a um especialista treinado da CBCA que examinasse as
declarações de todos os participantes (contadores da verdade, mentirosos treinados e mentirosos não
treinados). Os especialistas do CBCA não perceberam que alguns participantes foram treinados e não
discriminaram com sucesso entre contadores da verdade e mentirosos treinados. Talvez causando ainda
mais preocupação, no estudo de Vrij, Kneller e Mann, os especialistas do CBCA ainda não conseguiram
indicar quais declarações pertenciam aos mentirosos treinados, mesmo depois de terem sido informados de
que alguns dos participantes haviam sido treinados.
16
Pelo menos um fator externo, suscetibilidade à sugestão (Critério 3; Steller, 1989), é difícil de
mensurar. Algumas testemunhas são mais propensas a sugestões feitas pelos entrevistadores do que
outras, e uma criança sugestionável pode estar mais inclinada a fornecer informações que confirmem as
expectativas do entrevistador, mas que, na verdade, são imprecisas. Yuille (1988b), portanto, recomendou
que se fizesse à testemunha ao final da entrevista algumas perguntas norteadoras para avaliar a
suscetibilidade à sugestão. Ele recomendou fazer algumas perguntas sobre informações periféricas e não
centrais, pois fazer perguntas importantes poderia distorcer a memória do entrevistado e, portanto,
prejudicar o caso (Loftus & Palmer, 1974). O fato de que perguntas podem ser feitas apenas sobre
informações periféricas é problemático, pois pode dizer pouco sobre a sugestionabilidade da testemunha
em relação a questões centrais de seu depoimento. As crianças mostram mais resistência à
sugestionabilidade das partes centrais do que das partes periféricas de um evento (Goodman, Rudy,
Bottoms, & Aman, 1990). Eles também são mais resistentes à sugestionabilidade para eventos
estressantes, provavelmente os eventos centrais, do que para eventos menos estressantes, com maior
probabilidade de serem eventos periféricos (Davies, 1991). Assim, se um entrevistado cede a uma pergunta
norteadora sobre uma parte periférica do evento, isso não implica que ele não seja resistente à sugestão
quando incidentes mais importantes são discutidos. Esse critério também parece assumir que a sugestão é
mais o resultado de diferenças individuais do que de circunstâncias. Esta pode não ser uma suposição
válida (Milne & Bull, 1999).
Alguns fatores que influenciam os escores do CBCA não estão presentes no Checklist de Validade.
Pesquisas têm mostrado que os escores do CBCA estão relacionados às habilidades verbais e sociais
(Santtila et al., 2000; Vrij, Edward, Boi, 2001b; Vrij et al., 2002). Por exemplo, Santtila e colaboradores
encontraram correlação positiva entre os escores do CBCA e habilidade verbal, e Vrij e colaboradores
verificaram que os escores do CBCA foram, em algumas faixas etárias, positivamente correlacionados com
habilidade social e automonitoramento e negativamente com ansiedade social. No entanto, isso não é
levado em conta pelos especialistas em SVA quando se baseiam no Checklist de Validade. Embora o
Checklist de Validade possa parecer uma lista completa de fatores externos, na verdade, não é.
Obviamente, outros fatores externos, atualmente desconhecidos, também podem ter impacto nos escores
do CBCA. Por exemplo, crianças obrigadas a dar declarações podem ter distúrbios psicológicos, como
depressão ou problemas de atenção, e não está claro o impacto que isso pode ter em seus escores no
CBCA.
Obviamente, a questão da dificuldade em medir fatores externos discutida acima também se aplica
a esses conceitos. Por exemplo, como questões como agilidade social e automonitoramento devem ser
avaliadas no caso individual?
Há pelo menos três tipos de alegações falsas que são muito difíceis de detectar. Primeiro, a
situação em que alguém foi abusado sexualmente, mas identifica erroneamente o agressor e, em vez disso,
acusa um suspeito inocente de ser o culpado. Tal afirmação pode ser rica em detalhes e pode obter uma
17
pontuação alta no CBCA, já que a maioria do relato é verdadeira. A acusação, no entanto, é falsa. Em geral,
uma suposição do CBCA é que uma declaração é totalmente verdadeira ou totalmente fabricada, e não há
nenhum procedimento para distinguir entre partes experientes e não experientes dentro da mesma conta.
Em segundo lugar, às vezes as pessoas, tanto adultos quanto crianças, ficam confusas sobre o que
realmente viveram e o que apenas imaginaram. Pesquisas têm demonstrado que narrativas imaginadas
podem ser internamente coerentes e detalhadas. Portanto, é provável que obtenham altas pontuações no
CBCA e sejam julgados como verdadeiros. Em terceiro lugar, os estudos de treinamento descritos acima
revelaram que mentiras bem preparadas que incluem muitos critérios CBCA são difíceis de detectar.
O critério 10 trata de inconsistências entre diferentes depoimentos de uma mesma testemunha. Isso
sugere que uma afirmação pode, de fato, ser fabricada quando os entrevistados se contradizem em dois
depoimentos diferentes. Essa crença pode estar incorreta. Em sua pesquisa com participantes adultos,
Granhag e Stro ̈mwall (1999, 2002) demonstraram que a inconsistência entre diferentes afirmações não é
um indicador válido de engano. Fivush, Peterson, e Schwarzmueller (2002), em sua revisão de pesquisas
infantis, também concluíram que a inconsistência, por si só, não é um indício de imprecisão. Também não é
verdade, como apontaram esses autores, que consistência significa necessariamente precisão. Além disso,
a própria pesquisa de Fivush, demonstrou que as narrativas das crianças mudam naturalmente ao longo
das ocasiões de recordação, o que se deve em grande parte às diferenças nos entrevistadores entre as
entrevistas e ao tipo de perguntas feitas. Finalmente, julgar se uma afirmação é consistente ou não pode ser
mais difícil do que parece inicialmente. Os avaliadores muitas vezes não concordam entre si se uma
afirmação é consistente com uma afirmação anterior ou não, de acordo com a pesquisa de Granhag e Stro
̈mwall (2001a,2001b).
18
Os critérios 9 e 11 tratam do realismo do enunciado. Dalenberg, Hyland, e Cuevas (2002) relataram
que, para um pequeno grupo de crianças que fizeram alegações iniciais de abuso e para as quais havia um
padrão-ouro de prova de que o abuso havia ocorrido (as alegações foram apoiadas por confissões, e as
lesões foram julgadas clinicamente consistentes com as alegações), material bizarro e improvável foi
incluído em suas declarações (referência a figuras fantasiosas, características impossíveis ou
extremamente implausíveis da história, e descrições de atos abusivos extremos que deveriam ter sido (mas
não foram) apoiados por evidências externas se tivessem realmente ocorrido). Como os especialistas da
SVA lidariam com tais alegações? Tais declarações contêm claramente elementos irrealistas, pelo que
existe o risco de tais alegações serem consideradas inverídicas com base na avaliação do Checklist de
Validade.
Mesmo quando um especialista em SVA sabe que um fator externo que aparece no Checklist
Validade está presente, ainda assim é difícil determinar o impacto exato desse fator nos escores do CBCA.
Em um estudo de campo, os avaliadores foram instruídos a levar em conta a idade da criança (Lamers-
Winkelman & Buffing, 1996). No entanto, seis critérios correlacionaram-se positivamente com a idade.
Alternativamente, os avaliadores do CBCA podem classificar todas as afirmações da mesma maneira,
independentemente da idade do entrevistado, mas podem aplicar regras de decisão diferentes depois para
diferentes faixas etárias: Por exemplo, em crianças mais novas, é provável que uma declaração seja
verdadeira se cinco critérios estiverem presentes; em crianças maiores, pelo menos oito critérios devem
estar presentes; e assim por diante. No entanto, a aplicação das regras de decisão é impossível porque não
se sabe quais as notas de corte relacionadas com a idade que devem ser utilizadas. Dadas essas
dificuldades em identificar os fatores externos relevantes e em examinar o impacto exato desses fatores nos
escores do CBCA, fica claro que o procedimento do Checklist de Validade é mais subjetivo e menos
formalizado do que o procedimento do CBCA (Steller, 1989; Steller & Ko ̈hnken, 1989). Portanto, não é
surpreendente que, se dois especialistas discordam sobre a veracidade de uma declaração em casos
criminais alemães, eles frequentemente discordam sobre o provável impacto de alguns fatores externos
sobre essa declaração.
Em seu estudo de campo sobre o uso do Checklist de Validade na Suécia, Gumpert e Lindblad
(1999) mostraram que diferentes especialistas às vezes tiraram conclusões diferentes sobre o impacto de
fatores externos no estado de saúde das crianças. Por conseguinte, é aconselhável que, nos contextos
aplicados, não um, mas pelo menos dois avaliadores avaliem um caso de forma independente um do outro.
Atualmente, essa não é uma prática comum.
Steller e Ko ̈hnken (1989) observaram que alguns critérios podem ser mais valiosos para avaliar a
veracidade do que outros. Por exemplo, a presença de detalhes relatados com precisão, mas
incompreendidos, em uma afirmação (Critério 10), como uma criança que descreve o comportamento
sexual do adulto, mas o atribui a um espirro ou à dor, é aparentemente mais significativa do que o fato de a
criança descrever onde o suposto encontro sexual ocorreu (Critério 4). No entanto, não é dada qualquer
orientação no procedimento SVA sobre a forma como um sistema de ponderação diferente deve ser
aplicado, deixando isso para a interpretação do perito individual.
19
O CHECKLIST DE VALIDAÇÃO PODE SER USADO INCORRETAMENTE:
O estudo de campo de Gumpert e Lindblad (1999) sobre o uso do Checklist de Validade por
especialistas em SVA na Suécia revelou que esses especialistas podem ter usado essa lista
incorretamente. Em primeiro lugar, embora os especialistas em SVA às vezes destacassem a influência de
fatores externos nas declarações das crianças em geral, nem sempre discutiram como esse fator pode ter
influenciado a declaração da criança em particular que foram solicitadas a avaliar. Em segundo lugar,
embora os especialistas às vezes indicassem possível influência externa nas declarações, eles tendiam a
confiar no resultado do CBCA e tendiam a julgar declarações de alta qualidade como verdadeiras e
declarações de baixa qualidade como fabricadas. Embora Gumpert e Lindblad tenham examinado apenas
um número limitado de casos e, portanto, tirar conclusões convincentes talvez fosse prematuro, suas
descobertas causam preocupação. Eles implicaram que as decisões de SVA provavelmente não serão mais
precisas do que as avaliações do CBCA, pois a decisão final baseada nos resultados do CBCA, juntamente
com o processo do Checklist de Validade, muitas vezes é a mesma que a decisão baseada apenas nos
resultados do CBCA. Eles também implicaram que os entrevistados que naturalmente produzem
declarações de baixa qualidade e, portanto, são propensos a obter baixos escores no CBCA (ou seja,
crianças pequenas, entrevistados com habilidades verbais pobres, etc.) podem estar em uma posição
desvantajosa.
IMPLICAÇÕES LEGAIS
Quais são as implicações desses achados para o uso das avaliações CBCA/SVA como evidência
científica nos sistemas jurídicos? Uma maneira possível de responder a essa pergunta é examinando em
que medida as avaliações do CBCA/SVA atendem aos critérios exigidos para a admissão de provas
científicas periciais nos tribunais criminais. Em Daubert v. Merrell Dow Pharmaceuticals, Inc., 1993, a
Suprema Corte dos Estados Unidos promulgou um conjunto de diretrizes para admitir evidências científicas
especializadas nos tribunais federais (americanos). As seguintes diretrizes foram fornecidas pela Suprema
Corte e relatadas e discutidas por Honts (1994):
(d) a hipótese e/ou técnica foi submetida à revisão por pares e publicação, e
(e) a teoria na qual a hipótese e/ou técnica se baseia é geralmente aceita na comunidade científica
apropriada?
20
A resposta à segunda pergunta – A proposição foi testada? – Também é sugerida como afirmativa;
no entanto, a maioria dos estudos que indicam isso foram estudos experimentais de laboratório e, na
maioria dos estudos, adultos e não crianças participaram. Há muito poucos estudos de campo devidamente
conduzidos testando a hipótese Undeutsch. Em geral, os estudos disponíveis fornecem suporte empírico
para a hipótese Undeutsch. Em 11 dos 12 estudos em que um escore total do CBCA foi calculado, o escore
do CBCA foi significativamente maior para contadores da verdade do que para mentirosos, o que apoia a
hipótese Undeutsch. Quando os critérios individuais são levados em conta, os critérios com maior apoio
(Critérios 2, 3, 4 e 6) fazem parte do componente cognitivo da hipótese Undeutsch (Critérios 1–13). O apoio
ao componente motivacional da hipótese (Critérios 14–18) é geralmente fraco.
A resposta para a terceira pergunta — Existe uma taxa de erro conhecida? — É não. Claramente,
há uma taxa de erro conhecida de julgamentos de CBCA feitos em pesquisas laboratoriais experimentais,
que é de aproximadamente 30% tanto para detectar verdades quanto para detectar mentiras. No entanto,
de particular interesse aqui é a taxa de erro dos julgamentos de SVA em estudos de campo. Um estudo
devidamente conduzido examinando essa questão não foi publicado até o momento. Enquanto a taxa de
erro em estudos de campo for desconhecida, não há melhor alternativa do que usar a taxa de erro
conhecida em estudos laboratoriais CBCA. Essa taxa de erro, em torno de 30%, provavelmente não é uma
estimativa desarrazoada para a precisão dos julgamentos do SVA. Há razões para acreditar que as
avaliações de verdade-mentira em situações da vida real são tão ou até mais difíceis do que as avaliações
de verdade-mentira em estudos experimentais de laboratório. Pesquisas, revisadas na seção Lista de
Verificação de Validade desta revisão, demonstraram que os escores do CBCA são afetados não apenas
pela veracidade da afirmação, mas também por outros fatores, como idade, habilidade verbal e habilidades
sociais do entrevistado e o estilo de entrevista do entrevistador. Na seção do Checklistde Validade, também
foi argumentado que é difícil, em situações da vida real, indicar quais fatores externos podem ter
influenciado a qualidade da afirmação. Alguns fatores externos (como o treinamento do entrevistado) são
difíceis de detectar, e os entrevistados que conhecem o método podem, portanto, enganar os avaliadores.
Outros fatores (como habilidades sociais do entrevistado) não são incluídos no Checklist de Validade e,
portanto, provavelmente serão ignorados pelos avaliadores. Outros fatores (por exemplo, se o entrevistado
foi sugestionável durante a entrevista) são difíceis de mensurar. Finalmente, levantei algumas preocupações
sobre a adequação de alguns fatores (como a busca de consistência entre as afirmações).
Além disso, é difícil determinar o impacto exato desses fatores externos em uma determinada
declaração. Por exemplo, mesmo em estudos nos quais os avaliadores foram instruídos a levar em conta a
idade da criança (Lamers-Winkelman & Buffing, 1996), os escores do CBCA ainda se correlacionaram com
a idade. Em um dos poucos estudos sobre o Checklist de Validade, Gumpert e Lindblad (1999) descobriram
que os especialistas em SVA tinham a tendência de confiar fortemente nos resultados do CBCA e que uma
declaração de alta qualidade era frequentemente considerada verdadeira e uma declaração de baixa
qualidade era frequentemente considerada falsa. Os achados combinados de Lamers-Winkelman e Buffing
(1996) e Gumpert e Lindblad (1999) sugerem que os jovens entrevistados, que naturalmente produzem
baixos escores no CBCA, estão em uma posição desvantajosa. Outros entrevistados que naturalmente
produzem declarações de baixa qualidade (como entrevistados com habilidades verbais pobres,
entrevistados socialmente ineptos, etc.) podem estar em uma posição igualmente desvantajosa. Finalmente,
uma complicação adicional em fazer avaliações de SVA é que algumas alegações falsas (ou seja, narrativas
21
falsas que contêm muitos elementos verdadeiros, falsas memórias, mentiras bem preparadas) são difíceis
de detectar.
Em resumo, embora as taxas de erro para avaliações de AVS em casos da vida real sejam
desconhecidas, é provável que ocorram decisões incorretas, dadas as inúmeras dificuldades associadas à
realização de avaliações de AVS. Se tomarmos como diretriz a conhecida taxa de erro de 30%, fica claro
que os avaliadores do SVA não são capazes de apresentar a precisão de suas avaliações do SVA como
estando além da dúvida razoável, que é o padrão de prova frequentemente estabelecido nos tribunais
criminais. Em outras palavras, as avaliações do SVA não são precisas o suficiente para serem
apresentadas como evidência científica nos tribunais criminais.
A resposta para a quarta pergunta – A hipótese e/ou técnica foi submetida à revisão por pares e
publicação? – É novamente sim. Um número crescente de estudos do CBCA já foi publicado em revistas
revisadas por pares, embora, novamente, a maioria dos estudos tenha sido baseada em laboratório, na qual
os participantes geralmente eram adultos e não crianças.
A resposta para a quinta e última pergunta – A teoria na qual a hipótese e/ou técnica se baseia é
geralmente aceita na comunidade científica apropriada? – É provavelmente não. Como já mencionado na
seção introdutória, vários autores expressaram sérias dúvidas sobre o método (Brigham, 1999; Davies,
2001; Cordeiro, Sternberg, Esplin, Hershkowitz, Orbach, & Hovav, 1997; Rassin, 1999; Rubi e Brigham,
1997; Wells & Loftus, 1991).
No entanto, não foi publicado até o momento um levantamento adequado, semelhante àquele em
que foi examinada a opinião científica sobre o polígrafo (Iacono & Lykken, 1997).
CONCLUSÃO
As avaliações de SVA não atendem às diretrizes de Daubert (1993) para admissão de provas
científicas periciais em tribunais criminais. As duas principais razões são que a taxa de erro é demasiado
elevada e que o método não é indiscutível na comunidade científica relevante. Em relação à alta taxa de
erro, os avaliadores do SVA podem contestar a alegação de que a taxa de erro é de cerca de 30%, pois
esta é a taxa de erro conhecida para avaliações de CBCA feitas em estudos laboratoriais e não a taxa de
erro para avaliações de SVA feitas em situações da vida real. No entanto, esses avaliadores de SVA devem
perceber que, caso as taxas de erro do CBCA devam ser negadas, tudo o que poderia ser concluído é que
a taxa de erro é desconhecida, um resultado que também não atende à diretriz de Daubert.
Atualmente, as avaliações de SVA são aceitas como prova em tribunais criminais de vários países.
Nesses países, pelo menos, os especialistas em SVA devem apresentar os problemas e limitações das
avaliações de SVA nos tribunais para que juízes, jurados, promotores e solicitadores possam tomar uma
decisão informada sobre a validade das decisões de SVA. Além disso, embora as taxas de concordância
interavaliadores entre os juízes do CBCA sejam geralmente adequadas, elas não são perfeitas e
provavelmente serão maiores do que as taxas de concordância interavaliadores em relação ao Checklist de
Validade. Isso tudo claramente torna a realização de julgamentos de SVA um exercício subjetivo e, portanto,
mais de um especialista deve julgar cada afirmação para estabelecer a confiabilidade entre os avaliadores.
No entanto, histórias verdadeiras e fabricadas podem ser detectadas acima do nível do acaso com
avaliações CBCA/SVA em crianças e adultos e em contextos diferentes de incidentes de abuso sexual, o
22
que torna tais avaliações uma ferramenta valiosa para investigações policiais. Eles podem ser úteis, por
exemplo, na fase inicial da investigação para formar indícios aproximados da veracidade de várias
declarações em casos em que os detetives da polícia têm opiniões diferentes sobre a veracidade de uma
declaração. Treinamento exaustivo em como conduzir avaliações CBCA/SVA é provavelmente desejável,
dados os efeitos erráticos obtidos em estudos anteriores nos quais os estagiários foram expostos a
programas de treinamento menos abrangentes.
23