CoPEP

Ensaios Clínicos em Medicamentos INVESTIGAÇÃO EM CIRURGIA Ensaios Clínicos em Medicamentos Margarida Borges Unidade de Farmacologia Clínica, Centro Hospitalar de Lisboa Central E.P.E.

Centro de Estudos de Medicina Baseada na Evidência da Faculdade de Medicina da Universidade de Lisboa Correspondência

ABSTRACT Randomized controlled trial, despite some disadvantages, is usually considered the gold standard for determining the efficacy of an intervention (drugs, clinical devices, surgery, etc.). In this article, we discuss some aspects of the trial design needed for its critical appraisal of quality.

INTRODUÇÃO Designa-se por ensaio clínico um estudo que tem por objetivo avaliar a eficácia e segurança de uma determinada intervenção terapêutica, seja ela medicamentosa ou não farmacológica. Diz-se que é controlado e aleatorizado (ECA) quando a eficácia de dois tratamentos (medicamentos, dispositivos ou técnicas) é comparada pela aplicação de um ou de outro, ou então comparada com o placebo, ou ainda no caso da cirurgia, com uma operação simulada (1).

A aleatorização é uma metodologia de investigação na qual os indivíduos selecionados de uma população em estudo são distribuídos à sorte por dois ou mais grupos: experimental (exposto à intervenção em estudo) e controlo (submetidos à terapêutica convencional ou a placebo)(2). Esta metodologia permite uma distribuição equitativa de fatores que podem influenciar o prognóstico, equilíbrio que é considerado essencial na apreciação de uma relação de causalidade entre a intervenção e o efeito observado. Os resultados deste tipo de estudos são avaliados comparando os grupos em termos de taxas de eventos: doença, recuperação, mortalidade, etc. (2, 3) Os resultados dos ECA assumem um papel crucial na geração da melhor informação científica sobre a eficácia e segurança de intervenções terapêuticas sendo hoje em dia classificados, em termos de níveis de evidência, como o grau mais elevado pelo que são considerados o gold standardpara a avaliação da eficácia das várias alternativas terapêuticas.

Esta afirmação assume particular relevância na avaliação de medicamentos, onde o papel dos ECA está hoje perfeitamente estabelecido e os resultados produzidos na base da ponderação regulamentar do benefício e do risco de um futuro medicamento, e consequente da obtenção da sua autorização de introdução no mercado (AIM). O contraponto aos ECA são os estudos observacionais, não experimentais em que uma coorte de indivíduos sujeita a uma intervenção é seguida durante um determinado período de tempo (4). Os estudos observacionais têm geralmente dois objetivos principais: descrever a incidência de resultados ou analisar as associações entre resultados e fatores preditores.

Contrariamente ao passado, comparações recentes entre ECA e estudos observacionais de boa qualidade efetuados em populações semelhantes não parecem indicar uma sobrestimava sistemática dos efeitos terapêuticos dos estudos observacionais mostrando inclusive, nalguns casos, resultados semelhantes (1, 4). Na verdade existem situações onde os estudos aleatorizados não devem ser postos em prática, como por exemplo quando existe uma barreira ética ou quando outros estudos não aleatorizado já demonstraram benefícios ou prejuízos francos em relação à intervenção em estudo (5). Apesar disso não é previsível que venham substituam os ECA em termos de qualidade da evidência.

ENSAIOS CLÍNICOS EM CIRURGIA Os ECA representam menos de 8% dos estudos clínicos publicados em revistas cirúrgicas (B) e a maioria dos ECA em Cirurgia estudam fármacos utilizados em anestesia ou a terapêutica farmacológica pré ou pós operatória.

Não foram necessários ECA para demostrar que a apendicectomia, a cirurgia do megacólon toxico ou a utilização de antibióticos no tratamento de infeções cirúrgicas melhoram a sobrevivência dos doentes (6). Já quando o benefício do tratamento não era tão óbvio como no caso da vagotomia seletiva comparativamente com a vagotomia troncular e piloroplastia, do shunt espleno- renal comparativamente com o shunt porto-cava ou da lumpectomia comparativamente com a mastectomia radical modificada, era difícil com base em estudos observacionais, demostrar que o efeito terapêutico se devia à intervenção e não a diferenças nas características dos doentes tratados, aos cuidados pós operatórios ou mesmo à experiência dos cirurgiões (6).

Nestas circunstâncias, como no caso dos medicamentos, os ECA são a metodologia de eleição para a avaliação da efectividade de novas intervenções cirurgicas.

Existem na literatura múltiplos casos em que os resultados de ECA cuidadosamente planeados e conduzidos adequadamente tiveram um grande impacto na prática clínica como no caso da comparação da lumpectomia com a mastectomia, dos ensaios da endarterectomia carotídea ou do estudo CASS (Coronary Artery Surgery Study) (6, 7).

Infelizmente o inverso também é verdadeiro e há múltiplos exemplos de estudos de fraca qualidade metodológica em que a validade dos resultados é, no mínimo, questionável. Normalmente esses estudos são de pequenas dimensões e decorreram numa única instituição. Trata-se de ECA, muitas vezes desenhados para comparar terapêuticas equivalentes ou com pequenas diferenças que tendem a não ter potência estatística para detetar essas diferenças. Para além deste problema, os ensaios de intervenções cirúrgicas têm problemas relacionados com a dificuldade de estandardização dos procedimentos, ocultação (é impossível fazer com que um cirurgião não saiba a técnica que está a utilizar numa intervenção) e alguma relutância dos cirurgiões (6).

Os ECA são mais adequados para estudar modalidades terapêuticas bem padronizadas e de ação uniforme como fármacos, dispositivos médicos ou intervenções cirúrgicas padronizadas. Contrariamente a estas, as técnicas cirúrgicas em fase inicial não são, normalmente, suficientemente uniformes para poderem ser avaliadas em ECA de boa qualidade. Nesta medida, a tentativa de estender os ECA à avaliação de novas técnicas cirúrgicas em fase precoce de forma semelhante à avaliação de medicamentos deve ter em conta as diferenças fundamentais entre agentes estáveis e intervenções complexas em constante mutação [7, 8].

Estas dificuldades práticas não devem afastar os Cirurgiões dos ECA pelo que tem sido feito um esforço para encontrar metodologias que permitam ultrapassar esses constrangimentos (7) e utilizar este poderoso instrumento na validação das novas terapêuticas cirúrgicas após o seu desenvolvimento inicial.

ENSAIOS CLÍNICOS FARMACOLÓGICOS Os ensaios clínicos farmacológicos costumam classificar-se de acordo com o ciclo de desenvolvimento de um fármaco em quatro fases. Apresentam-se as definições da Plataforma Nacional de Ensaios Clínicos: Ensaio Clínico de Fase I: Os primeiros estudos farmacológicos em seres humanos, sem objetivos terapêuticos, normalmente efetuados num número reduzido de voluntários saudáveis podem ser conduzidos em doentes com patologias graves tais como doença oncológica ou infeção por HIV/SIDA. São sempre efetuados num pequeno número de doentes (20-80) e têm por objetivo proceder a uma avaliação inicial da segurança e tolerabilidade do novo fármaco, bem como determinação do seu perfil farmacocinético e farmacodinâmico.

Ensaio Clínico de Fase II: Ensaios clínicos que têm por objetivo avaliar a eficácia terapêutica de um novo medicamento em doentes com a patologia ou condição em estudo, avaliando simultaneamente a sua segurança. São de um modo geral realizados num número limitado de doentes (25-100), selecionados através de critérios rigorosos, conduzindo a uma população relativamente homogénea sujeita a uma monitorização cuidada. Através destes ensaios confirma-se se o medicamento tem um efeito terapêutico e avalia-se a toxidade permitindo selecionar o regime terapêutico para os ensaios de Fase III.

Ensaio Clínico de Fase III: Estudos comparativos, geralmente multicêntricos, necessários para demonstrar a segurança, eficácia e benefício terapêutico de um novo medicamento por comparação com um medicamento padrão e/ou placebo. Estes estudos são necessários para a submissão às autoridades regulamentares do pedido de comercialização de um novo medicamento ou da sua utilização numa nova indicação terapêutica. Nestes ensaios são envolvidos entre centenas a milhares de doentes, dependendo o tamanho da amostra de vários fatores entre os quais a magnitude da diferença esperada entre tratamentos, o número de eventos previsto e o desenho do estudo. Por vezes, os ensaios de Fase III são divididos em Fase IIIa e Fase IIIb.

Ensaios Clínicos de Fase IIIb: Estudos de Fase III conduzidos antes da comercialização do medicamento em estudo e após finalização dos ensaios clínicos que levaram à submissão do pedido de AIM. Estes ensaios decorrem enquanto a submissão regulamentar para introdução no mercado está em preparação ou em avaliação na agência regulamentar. As razões subjacentes à condução destes ensaios clínicos relacionam-se com: extensão da indicação, demonstrando que o medicamento é seguro e eficaz em populações e doenças diferentes das indicadas na aprovação inicial, obter dados adicionais de segurança, permitir que os doentes continuem a beneficiar do medicamento até à sua introdução no mercado.

Ensaio Clínico de Fase IV: Estudos realizados após a obtenção da AIM e relacionados com a indicação aprovada. São importantes para a otimização do uso do medicamento. Incluem a avaliação de interações medicamentosas adicionais, avaliação de dose-resposta, deteção de reações adversas previamente desconhecidas ou inadequadamente quantificadas, entre outros fatores.

Os ECA quando corretamente desenhados e conduzidos constituem o gold standard para a avaliação de intervenções em saúde. Contudo falhas metodológicas estão associadas a vieses, especialmente o aumento do efeito de uma intervenção, que podem facilmente comprometer a validade dos resultados (9). Para diminuir o impacto deste problema foi criado em 1996, e posteriormente atualizado em 2001, 2010 e 2011 o CONSORT (consolidated standards of reporting trials) um instrumento contendo as orientação para a avaliação dos ensaios clínicos publicados (10).

Discutimos de seguida alguns aspetos deste documento, essenciais à avaliação crítica de um ECA.

SELEÇÃO DE DOENTES A importância da determinação das características dos doentes de um ECA constitui um passo absolutamente crucial para análise da respetiva validade.

Isto é especialmente verdade no que diz respeito ao risco de base (i.e.

gravidade da doença) (2). Esta análise permite avaliar até que ponto os doentes estudados num ECA representam a população geral com essa doença.

A seleção de um subgrupo de doentes mais homogéneo permite estudar a eficácia do fármaco nesse subgrupo específico mas, obviamente, impedirá a generalização dos resultados ao universo de doentes com a doença.

A definição da população em que a intervenção é estudada consegue-se através da definição de critérios de inclusão e exclusão. Os critérios de inclusão incluem tipicamente o grupo etário dos doentes, o seu sexo, o diagnóstico clínico e a presença de comorbilidades. Os critérios de exclusão definem características dos doentes que precludem, por questões de segurança, a sua inclusão no estudo (por exemplo existência de insuficiência renal, idade superior a 75 anos, alergias conhecidas, etc.) (2, 11).

DIAGNÓSTICO A definição precisa do diagnóstico é de central importância num ensaio clínico.

Com efeito, para podermos generalizar para a prática clínica corrente os resultados de um ECA (validade externa), é absolutamente necessário que o diagnóstico definido no estudo seja claro e não ambíguo (3). Nalgumas situações, os critérios de inclusão e exclusão quase definem o diagnóstico, especialmente se forem muito específicos, mas seja como for, se existir alguma a incerteza sobre o diagnóstico, esta deverá sempre ser claramente indicada.

ALEATORIZAÇÃO Num ensaio clínico válido, os doentes devem ser distribuídos à sorte pelos grupos de análise (experimental e controlo) através de um processo imprevisível. Por outras palavras, na distribuição aleatória cada participante tem, à partida, uma probabilidade conhecida de receber um dos tratamentos em estudo mas o tratamento que vai receber é determinado pelo acaso não podendo ser antecipadamente previsível (5).

A principal vantagem da aleatorização é a distribuição uniforme pelos grupos de análise dos fatores de enviesamento desconhecidos. Por exemplo sabe-se que a genética desempenha um papel importante na doença inflamatória do intestino.

Assim, na avaliação de uma nova terapêutica para a colite ulcerosa ou doença de Crohn, é fundamental que o risco genético de base seja o mesmo entre os grupos em estudo. Uma vez que aquele é desconhecido, só a aleatorização pode garantir (mesmo que não em 100% dos casos) que determinada característica está igualmente representada nos diversos grupos de estudo (2).

O método de aleatorização clássico elege o doente como unidade e procura distribuí-lo pelos grupos com uma probabilidade determinada. Cada novo doente recrutado tem exatamente as mesmas hipóteses de ser incluído num dos grupos em estudo. Existem vários métodos de aleatorização que permitem a obtenção de uma sequência de distribuição ao acaso dos participantes nos grupos de estudo por exemplo a geração de números ao acaso num computador ou numa tabela de números (5).

A aleatorização pode ser simples (baseada numa sequência de números em dois grupos de ensaio com objetivo de obtenção de grupos comparáveis em termos de variáveis de prognóstico conhecidas e desconhecidas) ou restrita (cujo objetivo é o balanço entre grupos quer no seu tamanho quer nas suas características). A aleatorização restrita inclui técnicas de bloqueio, estratificação e minimização (2, 5).

OCULTAÇÃO Consiste no manter oculta qual a distribuição dos tratamentos (ativo e controlo) aos próprios doentes, investigadores e outros participantes no estudo. A ocultação tem por objetivo evitar que o conhecimento da distribuição das intervenções terapêuticas em estudo possa influenciar a resposta dos doentes e a perceção de benefício ou atitudes dos prestadores de cuidados e dos avaliadores dos resultados.

Um estudo designa-se por "com ocultação simples" quando apenas os doentes não sabem a medicação que estão a efetuar (11). Este efeito é tanto mais importante quanto o resultado do tratamento possa ser influenciado pelo comportamento do próprio doente.

Designa-se por "com dupla ocultação" o estudo em que nem os doentes nem os investigadores sabem a medicação que estes últimos estão a tomar.

Os investigadores devem ser ocultados aos tratamentos que administram para evitar o viés de performance. Isto é fundamental, porque muitas vezes o conhecimento prévio do tratamento que o doente irá receber altera o comportamento do investigador responsável por implementar o estudo (11). Por ex. se aquele souber que o doente irá receber um placebo, poderá ter a tentação de aumentar a terapêutica concomitante que o doente está a fazer, deste modo alterando os resultados do ensaio (11).

Se houver algum grau de subjetividade na avaliação dos resultados de uma intervenção a análise dos estudos deve ser efetuada sem que se saiba o tratamento atribuído a cada grupo de tratamento (placebo ou a substância ativa). É sabido que os avaliadores tendem a classificar melhor o resultado do tratamento com substância ativa e que quando ocultados para essa informação, a sua classificação altera-se substancialmente em relação à primeira avaliação.

OCULTAÇÃO DA DISTRIBUIÇÃO Consiste no procedimento usado para evitar a possibilidade de se prever antecipadamente o grupo de tratamento a que um determinado participante no estudo irá ser alocado antes que se processe a aleatorização. O processo de alocação deve ser completamente independente de qualquer influência por parte dos investigadores responsáveis pela inclusão do doente no estudo e pelo processo de randomização. A sequência de integração do doente no estudo deve ser preferencialmente obtida através da colaboração de um contacto externo (como uma farmácia, telefone externo ou sistemas de designação automática) ou, caso esta não seja exequível, através do uso de envelopes idênticos, selados e opacos, numerados sequencialmente, com a designação das intervenções segundo uma distribuição aleatória. Neste método, o processo de abertura dos envelopes deve ocorrer de forma sequencial segundo a ordem estabelecida no contentor e apenas após a inscrição do nome do participante e outros detalhes no envelope.

Tais requisitos podem, numa primeira análise, transmitir um aparente excesso de zelo, contudo, temos de ter em atenção que este e outros métodos de aleatorização podem ser corrompidos, em particular se não se verificarem certas precauções. Um exemplo conhecido da perversão do processo de aleatorização é dado através de um estudo conduzido por um grupo de investigadores australianos que pretendiam comparar, utilizando um ECA, a eficácia da apendicectomia laparoscópica comparativamente com a apendicectomia convencional (2, 12). Este ensaio decorreu sem alterações durante o dia, contudo durante a noite houve graves atropelos ao protocolo que se prenderam com questões relacionadas com o funcionamento hospitalar: as apendicectomias por via endoscópica tinham que ser efetuadas na presença de um cirurgião enquanto que nas efetuadas por via convencional essa presença era dispensada. Assim, quando durante a noite, um interno de cirurgia recebia um doente com indicação para apendicectomia, com medo de chamar o cirurgião, colocava os envelopes translúcidos contra a luz para decifrar qual a intervenção atribuída ao doente. Caso se tratasse de apendicectomia convencional, incluía o doente no estudo e abria o envelope. Se, por outro lado, se tratasse de cirurgia laparoscópica, repetiria o processo sequencialmente até encontrar um envelope com a indicação de cirurgia convencional, sendo que, na manhã seguinte, o primeiro doente com critérios de inclusão para o estudo, seria submetido a apendicectomia laparoscópica de acordo com o envelope ultrapassado. Se porventura os doentes admitidos durante a noite tivessem um quadro cínico mais grave do que os doentes admitidos de dia, os resultados obtidos apresentaria um viés que favoreceria a apendicectomia laparoscópica.

ANÁLISE DOS RESULTADOS EM "INTENÇÃO DE TRATAR" A abordagem intuitiva em relação aos doentes que, por qualquer razão, não foram tratados de acordo com o protocolo, é de os retirar da análise final. Parecendo certa, esta decisão é fundamentalmente errada, já que subverte a vantagem da aleatorização, impede uma visão mais realista do impacto do novo fármaco e permite a introdução de viéses no estudo. Assim, independentemente da intervenção que o doente efetivamente recebeu, para a análise final ele deverá ser incluído no grupo para o qual foi inicialmente aleatorizado (2, 5, 10).

DIMENSÃO DA AMOSTRA Os resultados de um estudo são válidos se os respetivos resultados representam uma estimativa não enviesada do resultado verdadeiro. A validade interna, a que se refere à amostra, é determinada pelo rigor do desenho do estudo, da recolha de dados e das respetivas análises, podendo se posta em causa por vieses ou pelo acaso. De entre as características fundamentais de uma amostra encontra-se a sua correta dimensão (13).

A dimensão da amostra de um ensaio clínico não pode ser definida na base das convicções dos investigadores. Por razões clínicas e estatísticas, o efetivo deve ser calculado com rigor, para que o estudo tenha potência para responder à pergunta em estudo. Sé assim se pode dizer que um resultado negativo não foi devido à pequena dimensão da amostra. Para o cálculo desta deve ter-se em conta a percentagem esperada de eventos em cada grupo, o erro tipo I (nível Î±); 3) o erro tipo II (nível b) (13).

Nas publicações científicas é frequente encontrarem-se estudos com amostra inadequada e com baixo poder estatístico, que podem não ser apenas justificados por deficiências metodológicas mas, eventualmente, por limitações relacionadas com situações em que o número de participantes disponíveis é inferior ao indicado por cálculos matemáticos (2). Uma amostra insuficiente pode comprometer as conclusões a retirar, chegando alguns autores a advogar que tais estudos devem ser abandonados. Contudo, outros defendem que ensaios com baixo poder estatístico podem ser aceitáveis, uma vez que podem ser combinados posteriormente numa meta-análise (desde que se cumpram requisitos como a redução de vieses e boa publicação com intervalos de confiança adequados). Esta posição baseia-se na necessidade de responder a muitas questões que por razões económicas ou de ordem técnica (por ex. pequeno número de doentes) não serão respondidas em ECA. grandes ensaios multicêntricos.

CARACTERÍSTICAS DA POPULAÇÃO Nos ECA as características basais dos doentes (demográficas, clínicas, laboratoriais, etc.) dos doentes dos vários grupos de tratamento devem ser semelhantes. Sé assim se podem atribuir eventuais diferenças nos benefícios e riscos do tratamento unicamente à intervenção (e não a um prognóstico de base diverso) (2). É claro que, mesmo com uma aleatorização competentemente desenhada e implementada, pode acontecer que - por pura má sorte - os grupos não estejam equilibrados. Neste caso, dever-se-á analisar se as diferenças são suficientemente importantes para anular os resultados ou se, pelo contrário, não influenciam a alocação de causalidade dos resultados.

TERAPÊUTICA CONCOMITANTE Um dos aspetos essenciais na análise da eficácia de uma intervenção é que ela possa ser inequivocamente responsabilizada pelas alterações medidas. Se por acaso a terapêutica concomitante administrada aos doentes diferir entre os grupos, então torna-se muito difícil identificar a causa do benefício demonstrado: intervenção em estudo ou alterações instituídas na terapêutica de base.

O SEGUIMENTO (FOLLOW-UP) FINAL FOI SUPERIOR A 80%? É inevitável que alguns doentes não terminem o estudo, especialmente se a sua duração for longa. Contudo se o número abandonos for muito elevado, não se sabe se esses doentes têm um prognóstico diferente dos que permanecem no estudo. Se as razões para o abandono não se relacionarem com o prognóstico, por exemplo mudança de residência, poderão não influenciar os resultados. O mesmo não se verifica se forem devidas a falta de eficácia do medicamento, a um perfil de efeitos secundários muito desfavorável ou uma adesão particularmente deficiente ao esquema de tratamento.

Embora não esteja claramente definido a dimensão da taxa de abandonos que compromete os resultados de um estudo, aceita-se que um valor superior a 20% é gerador de viéses e indica problemas importantes do estudo (2).

EuPTCVHe1646-69182013000100010

EuPTCVHe1646-69182013000100010

Opções de representação