Ensaios Clínicos em Medicamentos
INVESTIGAÇÃO EM CIRURGIA
Ensaios Clínicos em Medicamentos
Margarida Borges
Unidade de Farmacologia Clínica, Centro Hospitalar de Lisboa Central E.P.E.
Centro de Estudos de Medicina Baseada na Evidência da Faculdade de Medicina da
Universidade de Lisboa
Correspondência
ABSTRACT
Randomized controlled trial, despite some disadvantages, is usually considered
the gold standard for determining the efficacy of an intervention (drugs,
clinical devices, surgery, etc.). In this article, we discuss some aspects of
the trial design needed for its critical appraisal of quality.
INTRODUÇÃO
Designa-se por ensaio clínico um estudo que tem por objetivo avaliar a eficácia
e segurança de uma determinada intervenção terapêutica, seja ela medicamentosa
ou não farmacológica. Diz-se que é controlado e aleatorizado (ECA) quando a
eficácia de dois tratamentos (medicamentos, dispositivos ou técnicas) é
comparada pela aplicação de um ou de outro, ou então comparada com o placebo,
ou ainda no caso da cirurgia, com uma operação simulada (1).
A aleatorização é uma metodologia de investigação na qual os indivíduos
selecionados de uma população em estudo são distribuídos à sorte por dois ou
mais grupos: experimental (exposto à intervenção em estudo) e controlo
(submetidos à terapêutica convencional ou a placebo)(2). Esta metodologia
permite uma distribuição equitativa de fatores que podem influenciar o
prognóstico, equilíbrio que é considerado essencial na apreciação de uma
relação de causalidade entre a intervenção e o efeito observado. Os resultados
deste tipo de estudos são avaliados comparando os grupos em termos de taxas de
eventos: doença, recuperação, mortalidade, etc. (2, 3)
Os resultados dos ECA assumem um papel crucial na geração da melhor informação
científica sobre a eficácia e segurança de intervenções terapêuticas sendo hoje
em dia classificados, em termos de níveis de evidência, como o grau mais
elevado pelo que são considerados o gold standardpara a avaliação da eficácia
das várias alternativas terapêuticas.
Esta afirmação assume particular relevância na avaliação de medicamentos, onde
o papel dos ECA está hoje perfeitamente estabelecido e os resultados produzidos
na base da ponderação regulamentar do benefício e do risco de um futuro
medicamento, e consequente da obtenção da sua autorização de introdução no
mercado (AIM). O contraponto aos ECA são os estudos observacionais, não
experimentais em que uma coorte de indivíduos sujeita a uma intervenção é
seguida durante um determinado período de tempo (4). Os estudos observacionais
têm geralmente dois objetivos principais: descrever a incidência de resultados
ou analisar as associações entre resultados e fatores preditores.
Contrariamente ao passado, comparações recentes entre ECA e estudos
observacionais de boa qualidade efetuados em populações semelhantes não parecem
indicar uma sobrestimava sistemática dos efeitos terapêuticos dos estudos
observacionais mostrando inclusive, nalguns casos, resultados semelhantes (1,
4). Na verdade existem situações onde os estudos aleatorizados não devem ser
postos em prática, como por exemplo quando existe uma barreira ética ou quando
outros estudos não aleatorizado já demonstraram benefícios ou prejuízos francos
em relação à intervenção em estudo (5). Apesar disso não é previsível que
venham substituam os ECA em termos de qualidade da evidência.
ENSAIOS CLÍNICOS EM CIRURGIA
Os ECA representam menos de 8% dos estudos clínicos publicados em revistas
cirúrgicas (B) e a maioria dos ECA em Cirurgia estudam fármacos utilizados em
anestesia ou a terapêutica farmacológica pré ou pós operatória.
Não foram necessários ECA para demostrar que a apendicectomia, a cirurgia do
megacólon toxico ou a utilização de antibióticos no tratamento de infeções
cirúrgicas melhoram a sobrevivência dos doentes (6). Já quando o benefício do
tratamento não era tão óbvio como no caso da vagotomia seletiva
comparativamente com a vagotomia troncular e piloroplastia, do shunt espleno-
renal comparativamente com o shunt porto-cava ou da lumpectomia
comparativamente com a mastectomia radical modificada, era difícil com base em
estudos observacionais, demostrar que o efeito terapêutico se devia à
intervenção e não a diferenças nas características dos doentes tratados, aos
cuidados pós operatórios ou mesmo à experiência dos cirurgiões (6).
Nestas circunstâncias, como no caso dos medicamentos, os ECA são a metodologia
de eleição para a avaliação da efectividade de novas intervenções cirurgicas.
Existem na literatura múltiplos casos em que os resultados de ECA
cuidadosamente planeados e conduzidos adequadamente tiveram um grande impacto
na prática clínica como no caso da comparação da lumpectomia com a mastectomia,
dos ensaios da endarterectomia carotídea ou do estudo CASS (Coronary Artery
Surgery Study) (6, 7).
Infelizmente o inverso também é verdadeiro e há múltiplos exemplos de estudos
de fraca qualidade metodológica em que a validade dos resultados é, no mínimo,
questionável. Normalmente esses estudos são de pequenas dimensões e decorreram
numa única instituição. Trata-se de ECA, muitas vezes desenhados para comparar
terapêuticas equivalentes ou com pequenas diferenças que tendem a não ter
potência estatística para detetar essas diferenças. Para além deste problema,
os ensaios de intervenções cirúrgicas têm problemas relacionados com a
dificuldade de estandardização dos procedimentos, ocultação (é impossível fazer
com que um cirurgião não saiba a técnica que está a utilizar numa intervenção)
e alguma relutância dos cirurgiões (6).
Os ECA são mais adequados para estudar modalidades terapêuticas bem
padronizadas e de ação uniforme como fármacos, dispositivos médicos ou
intervenções cirúrgicas padronizadas. Contrariamente a estas, as técnicas
cirúrgicas em fase inicial não são, normalmente, suficientemente uniformes para
poderem ser avaliadas em ECA de boa qualidade. Nesta medida, a tentativa de
estender os ECA à avaliação de novas técnicas cirúrgicas em fase precoce de
forma semelhante à avaliação de medicamentos deve ter em conta as diferenças
fundamentais entre agentes estáveis e intervenções complexas em constante
mutação [7, 8].
Estas dificuldades práticas não devem afastar os Cirurgiões dos ECA pelo que
tem sido feito um esforço para encontrar metodologias que permitam ultrapassar
esses constrangimentos (7) e utilizar este poderoso instrumento na validação
das novas terapêuticas cirúrgicas após o seu desenvolvimento inicial.
ENSAIOS CLÍNICOS FARMACOLÓGICOS
Os ensaios clínicos farmacológicos costumam classificar-se de acordo com o
ciclo de desenvolvimento de um fármaco em quatro fases. Apresentam-se as
definições da Plataforma Nacional de Ensaios Clínicos:
Ensaio Clínico de Fase I: Os primeiros estudos farmacológicos em seres humanos,
sem objetivos terapêuticos, normalmente efetuados num número reduzido de
voluntários saudáveis podem ser conduzidos em doentes com patologias graves
tais como doença oncológica ou infeção por HIV/SIDA. São sempre efetuados num
pequeno número de doentes (20-80) e têm por objetivo proceder a uma avaliação
inicial da segurança e tolerabilidade do novo fármaco, bem como determinação do
seu perfil farmacocinético e farmacodinâmico.
Ensaio Clínico de Fase II: Ensaios clínicos que têm por objetivo avaliar a
eficácia terapêutica de um novo medicamento em doentes com a patologia ou
condição em estudo, avaliando simultaneamente a sua segurança. São de um modo
geral realizados num número limitado de doentes (25-100), selecionados através
de critérios rigorosos, conduzindo a uma população relativamente homogénea
sujeita a uma monitorização cuidada. Através destes ensaios confirma-se se o
medicamento tem um efeito terapêutico e avalia-se a toxidade permitindo
selecionar o regime terapêutico para os ensaios de Fase III.
Ensaio Clínico de Fase III: Estudos comparativos, geralmente multicêntricos,
necessários para demonstrar a segurança, eficácia e benefício terapêutico de um
novo medicamento por comparação com um medicamento padrão e/ou placebo. Estes
estudos são necessários para a submissão às autoridades regulamentares do
pedido de comercialização de um novo medicamento ou da sua utilização numa nova
indicação terapêutica. Nestes ensaios são envolvidos entre centenas a milhares
de doentes, dependendo o tamanho da amostra de vários fatores entre os quais a
magnitude da diferença esperada entre tratamentos, o número de eventos previsto
e o desenho do estudo. Por vezes, os ensaios de Fase III são divididos em Fase
IIIa e Fase IIIb.
Ensaios Clínicos de Fase IIIb: Estudos de Fase III conduzidos antes da
comercialização do medicamento em estudo e após finalização dos ensaios
clínicos que levaram à submissão do pedido de AIM. Estes ensaios decorrem
enquanto a submissão regulamentar para introdução no mercado está em preparação
ou em avaliação na agência regulamentar. As razões subjacentes à condução
destes ensaios clínicos relacionam-se com: extensão da indicação, demonstrando
que o medicamento é seguro e eficaz em populações e doenças diferentes das
indicadas na aprovação inicial, obter dados adicionais de segurança, permitir
que os doentes continuem a beneficiar do medicamento até à sua introdução no
mercado.
Ensaio Clínico de Fase IV: Estudos realizados após a obtenção da AIM e
relacionados com a indicação aprovada. São importantes para a otimização do uso
do medicamento. Incluem a avaliação de interações medicamentosas adicionais,
avaliação de dose-resposta, deteção de reações adversas previamente
desconhecidas ou inadequadamente quantificadas, entre outros fatores.
Os ECA quando corretamente desenhados e conduzidos constituem o gold standard
para a avaliação de intervenções em saúde. Contudo falhas metodológicas estão
associadas a vieses, especialmente o aumento do efeito de uma intervenção, que
podem facilmente comprometer a validade dos resultados (9). Para diminuir o
impacto deste problema foi criado em 1996, e posteriormente atualizado em 2001,
2010 e 2011 o CONSORT (consolidated standards of reporting trials) um
instrumento contendo as orientação para a avaliação dos ensaios clínicos
publicados (10).
Discutimos de seguida alguns aspetos deste documento, essenciais à avaliação
crítica de um ECA.
SELEÇÃO DE DOENTES
A importância da determinação das características dos doentes de um ECA
constitui um passo absolutamente crucial para análise da respetiva validade.
Isto é especialmente verdade no que diz respeito ao risco de base (i.e.
gravidade da doença) (2). Esta análise permite avaliar até que ponto os doentes
estudados num ECA representam a população geral com essa doença.
A seleção de um subgrupo de doentes mais homogéneo permite estudar a eficácia
do fármaco nesse subgrupo específico mas, obviamente, impedirá a generalização
dos resultados ao universo de doentes com a doença.
A definição da população em que a intervenção é estudada consegue-se através da
definição de critérios de inclusão e exclusão. Os critérios de inclusão incluem
tipicamente o grupo etário dos doentes, o seu sexo, o diagnóstico clínico e a
presença de comorbilidades. Os critérios de exclusão definem características
dos doentes que precludem, por questões de segurança, a sua inclusão no estudo
(por exemplo existência de insuficiência renal, idade superior a 75 anos,
alergias conhecidas, etc.) (2, 11).
DIAGNÓSTICO
A definição precisa do diagnóstico é de central importância num ensaio clínico.
Com efeito, para podermos generalizar para a prática clínica corrente os
resultados de um ECA (validade externa), é absolutamente necessário que o
diagnóstico definido no estudo seja claro e não ambíguo (3). Nalgumas
situações, os critérios de inclusão e exclusão quase definem o diagnóstico,
especialmente se forem muito específicos, mas seja como for, se existir alguma
a incerteza sobre o diagnóstico, esta deverá sempre ser claramente indicada.
ALEATORIZAÇÃO
Num ensaio clínico válido, os doentes devem ser distribuídos à sorte pelos
grupos de análise (experimental e controlo) através de um processo
imprevisível. Por outras palavras, na distribuição aleatória cada participante
tem, à partida, uma probabilidade conhecida de receber um dos tratamentos em
estudo mas o tratamento que vai receber é determinado pelo acaso não podendo
ser antecipadamente previsível (5).
A principal vantagem da aleatorização é a distribuição uniforme pelos grupos de
análise dos fatores de enviesamento desconhecidos. Por exemplo sabe-se que a
genética desempenha um papel importante na doença inflamatória do intestino.
Assim, na avaliação de uma nova terapêutica para a colite ulcerosa ou doença de
Crohn, é fundamental que o risco genético de base seja o mesmo entre os grupos
em estudo. Uma vez que aquele é desconhecido, só a aleatorização pode garantir
(mesmo que não em 100% dos casos) que determinada característica está
igualmente representada nos diversos grupos de estudo (2).
O método de aleatorização clássico elege o doente como unidade e procura
distribuí-lo pelos grupos com uma probabilidade determinada. Cada novo doente
recrutado tem exatamente as mesmas hipóteses de ser incluído num dos grupos em
estudo. Existem vários métodos de aleatorização que permitem a obtenção de uma
sequência de distribuição ao acaso dos participantes nos grupos de estudo por
exemplo a geração de números ao acaso num computador ou numa tabela de números
(5).
A aleatorização pode ser simples (baseada numa sequência de números em dois
grupos de ensaio com objetivo de obtenção de grupos comparáveis em termos de
variáveis de prognóstico conhecidas e desconhecidas) ou restrita (cujo objetivo
é o balanço entre grupos quer no seu tamanho quer nas suas características). A
aleatorização restrita inclui técnicas de bloqueio, estratificação e
minimização (2, 5).
OCULTAÇÃO
Consiste no manter oculta qual a distribuição dos tratamentos (ativo e
controlo) aos próprios doentes, investigadores e outros participantes no
estudo. A ocultação tem por objetivo evitar que o conhecimento da distribuição
das intervenções terapêuticas em estudo possa influenciar a resposta dos
doentes e a perceção de benefício ou atitudes dos prestadores de cuidados e dos
avaliadores dos resultados.
Um estudo designa-se por "com ocultação simples" quando apenas os
doentes não sabem a medicação que estão a efetuar (11). Este efeito é tanto
mais importante quanto o resultado do tratamento possa ser influenciado pelo
comportamento do próprio doente.
Designa-se por "com dupla ocultação" o estudo em que nem os doentes
nem os investigadores sabem a medicação que estes últimos estão a tomar.
Os investigadores devem ser ocultados aos tratamentos que administram para
evitar o viés de performance. Isto é fundamental, porque muitas vezes o
conhecimento prévio do tratamento que o doente irá receber altera o
comportamento do investigador responsável por implementar o estudo (11). Por
ex. se aquele souber que o doente irá receber um placebo, poderá ter a tentação
de aumentar a terapêutica concomitante que o doente está a fazer, deste modo
alterando os resultados do ensaio (11).
Se houver algum grau de subjetividade na avaliação dos resultados de uma
intervenção a análise dos estudos deve ser efetuada sem que se saiba o
tratamento atribuído a cada grupo de tratamento (placebo ou a substância
ativa). É sabido que os avaliadores tendem a classificar melhor o resultado do
tratamento com substância ativa e que quando ocultados para essa informação, a
sua classificação altera-se substancialmente em relação à primeira avaliação.
OCULTAÇÃO DA DISTRIBUIÇÃO
Consiste no procedimento usado para evitar a possibilidade de se prever
antecipadamente o grupo de tratamento a que um determinado participante no
estudo irá ser alocado antes que se processe a aleatorização. O processo de
alocação deve ser completamente independente de qualquer influência por parte
dos investigadores responsáveis pela inclusão do doente no estudo e pelo
processo de randomização. A sequência de integração do doente no estudo deve
ser preferencialmente obtida através da colaboração de um contacto externo
(como uma farmácia, telefone externo ou sistemas de designação automática) ou,
caso esta não seja exequível, através do uso de envelopes idênticos, selados e
opacos, numerados sequencialmente, com a designação das intervenções segundo
uma distribuição aleatória. Neste método, o processo de abertura dos envelopes
deve ocorrer de forma sequencial segundo a ordem estabelecida no contentor e
apenas após a inscrição do nome do participante e outros detalhes no envelope.
Tais requisitos podem, numa primeira análise, transmitir um aparente excesso de
zelo, contudo, temos de ter em atenção que este e outros métodos de
aleatorização podem ser corrompidos, em particular se não se verificarem certas
precauções. Um exemplo conhecido da perversão do processo de aleatorização é
dado através de um estudo conduzido por um grupo de investigadores australianos
que pretendiam comparar, utilizando um ECA, a eficácia da apendicectomia
laparoscópica comparativamente com a apendicectomia convencional (2, 12). Este
ensaio decorreu sem alterações durante o dia, contudo durante a noite houve
graves atropelos ao protocolo que se prenderam com questões relacionadas com o
funcionamento hospitalar: as apendicectomias por via endoscópica tinham que ser
efetuadas na presença de um cirurgião enquanto que nas efetuadas por via
convencional essa presença era dispensada. Assim, quando durante a noite, um
interno de cirurgia recebia um doente com indicação para apendicectomia, com
medo de chamar o cirurgião, colocava os envelopes translúcidos contra a luz
para decifrar qual a intervenção atribuída ao doente. Caso se tratasse de
apendicectomia convencional, incluía o doente no estudo e abria o envelope. Se,
por outro lado, se tratasse de cirurgia laparoscópica, repetiria o processo
sequencialmente até encontrar um envelope com a indicação de cirurgia
convencional, sendo que, na manhã seguinte, o primeiro doente com critérios de
inclusão para o estudo, seria submetido a apendicectomia laparoscópica de
acordo com o envelope ultrapassado. Se porventura os doentes admitidos durante
a noite tivessem um quadro cínico mais grave do que os doentes admitidos de
dia, os resultados obtidos apresentaria um viés que favoreceria a
apendicectomia laparoscópica.
ANÁLISE DOS RESULTADOS EM "INTENÇÃO DE TRATAR"
A abordagem intuitiva em relação aos doentes que, por qualquer razão, não foram
tratados de acordo com o protocolo, é de os retirar da análise final. Parecendo
certa, esta decisão é fundamentalmente errada, já que subverte a vantagem da
aleatorização, impede uma visão mais realista do impacto do novo fármaco e
permite a introdução de viéses no estudo. Assim, independentemente da
intervenção que o doente efetivamente recebeu, para a análise final ele deverá
ser incluído no grupo para o qual foi inicialmente aleatorizado (2, 5, 10).
DIMENSÃO DA AMOSTRA
Os resultados de um estudo são válidos se os respetivos resultados representam
uma estimativa não enviesada do resultado verdadeiro. A validade interna, a que
se refere à amostra, é determinada pelo rigor do desenho do estudo, da recolha
de dados e das respetivas análises, podendo se posta em causa por vieses ou
pelo acaso. De entre as características fundamentais de uma amostra encontra-se
a sua correta dimensão (13).
A dimensão da amostra de um ensaio clínico não pode ser definida na base das
convicções dos investigadores. Por razões clínicas e estatísticas, o efetivo
deve ser calculado com rigor, para que o estudo tenha potência para responder à
pergunta em estudo. Sé assim se pode dizer que um resultado negativo não foi
devido à pequena dimensão da amostra. Para o cálculo desta deve ter-se em conta
a percentagem esperada de eventos em cada grupo, o erro tipo I (nível α); 3) o
erro tipo II (nível b) (13).
Nas publicações científicas é frequente encontrarem-se estudos com amostra
inadequada e com baixo poder estatístico, que podem não ser apenas justificados
por deficiências metodológicas mas, eventualmente, por limitações relacionadas
com situações em que o número de participantes disponíveis é inferior ao
indicado por cálculos matemáticos (2). Uma amostra insuficiente pode
comprometer as conclusões a retirar, chegando alguns autores a advogar que tais
estudos devem ser abandonados. Contudo, outros defendem que ensaios com baixo
poder estatístico podem ser aceitáveis, uma vez que podem ser combinados
posteriormente numa meta-análise (desde que se cumpram requisitos como a
redução de vieses e boa publicação com intervalos de confiança adequados). Esta
posição baseia-se na necessidade de responder a muitas questões que por razões
económicas ou de ordem técnica (por ex. pequeno número de doentes) não serão
respondidas em ECA. grandes ensaios multicêntricos.
CARACTERÍSTICAS DA POPULAÇÃO
Nos ECA as características basais dos doentes (demográficas, clínicas,
laboratoriais, etc.) dos doentes dos vários grupos de tratamento devem ser
semelhantes. Sé assim se podem atribuir eventuais diferenças nos benefícios e
riscos do tratamento unicamente à intervenção (e não a um prognóstico de base
diverso) (2). É claro que, mesmo com uma aleatorização competentemente
desenhada e implementada, pode acontecer que - por pura má sorte - os grupos
não estejam equilibrados. Neste caso, dever-se-á analisar se as diferenças são
suficientemente importantes para anular os resultados ou se, pelo contrário,
não influenciam a alocação de causalidade dos resultados.
TERAPÊUTICA CONCOMITANTE
Um dos aspetos essenciais na análise da eficácia de uma intervenção é que ela
possa ser inequivocamente responsabilizada pelas alterações medidas. Se por
acaso a terapêutica concomitante administrada aos doentes diferir entre os
grupos, então torna-se muito difícil identificar a causa do benefício
demonstrado: intervenção em estudo ou alterações instituídas na terapêutica de
base.
O SEGUIMENTO (FOLLOW-UP) FINAL FOI SUPERIOR A 80%?
É inevitável que alguns doentes não terminem o estudo, especialmente se a sua
duração for longa. Contudo se o número abandonos for muito elevado, não se sabe
se esses doentes têm um prognóstico diferente dos que permanecem no estudo. Se
as razões para o abandono não se relacionarem com o prognóstico, por exemplo
mudança de residência, poderão não influenciar os resultados. O mesmo não se
verifica se forem devidas a falta de eficácia do medicamento, a um perfil de
efeitos secundários muito desfavorável ou uma adesão particularmente deficiente
ao esquema de tratamento.
Embora não esteja claramente definido a dimensão da taxa de abandonos que
compromete os resultados de um estudo, aceita-se que um valor superior a 20% é
gerador de viéses e indica problemas importantes do estudo (2).