Um modelo de minimização de custos em diagnósticos com um caso de aplicação em
um banco de sangue
1. Introdução
A motivação inicial para a análise do problema central aqui tratado surgiu da
constatação de que a literatura tradicional em Controle de Qualidade, que
indica o "brainstorming" e o diagrama "espinha-de-peixe"
como ferramentas para auxiliar no levantamento e enumeração do conjunto de
causas possíveis para um problema observado, não indica nenhum procedimento
para a identificação da causa responsável dentro deste conjunto (ver por
exemplo Banks, 1989, e Montgomery, 1997). Evidentemente, os procedimentos
específicos para identificação da(s) causa(s) em uma palavra, para o
diagnóstico dependem da natureza e características particulares de cada
processo ou equipamento, e ainda do ambiente em que ele se insere, o que
explica facilmente a omissão.
Há, contudo, um problema ligado ao diagnóstico, que independe do contexto
particular do processo ou equipamento em questão, e que pode surgir em muitas
situações: dado um conjunto de testes possíveis para determinação da causa,
cada um com um custo associado, em que ordem executar os testes de maneira a
minimizar o custo total esperado do diagnóstico? Este é o problema que aqui
será abordado.
Este problema não se restringe ao contexto de diagnóstico de falhas em
equipamentos, ou de causas de problemas em processos. Por exemplo, o modelo e
método de solução desenvolvidos foram aplicados a um problema concreto de
diagnóstico em um banco de sangue, resultando em economia substancial.
Há trabalhos relacionados. Sem pretendermos ser exaustivos, no Brasil podem-se
citar Goulart et al. (1994) e Pereira (1994). Os primeiros, porém, não
consideram o fator custo que, no contexto industrial, bem como no contexto do
caso analisado, do banco de sangue, é de importância fundamental. (No contexto
de seu trabalho de que são possíveis exemplos de aplicação: questionários,
onde se quer minimizar o número de perguntas, e sistemas especialistas, onde se
quer minimizar o tempo de processamento o critério relevante é a minimização
do número de testes o que, em termos de modelo matemático, equivale a não
considerar os custos dos testes, ou a considerar implicitamente que todos os
testes possuem custo igual). Pereira (1994) considera o custo explicitamente,
mas trata o problema no contexto bem mais específico de uma classe de problemas
de diagnóstico de falhas de equipamento, e no nível de modelagem das relações
particulares de causa e efeito para o diagnóstico do tipo de equipamento em
questão. Neste nível mais específico, desenvolve um modelo baseado em
heurísticas para solução por sistemas a base de conhecimentos. No contexto do
presente trabalho, o interesse é por um modelo genérico e que considere os
custos dos testes; nisto ele se distingue dos trabalhos citados.
As próximas seções apresentam: inicialmente (Seção 2.1) a formulação matemática
para o problema, incluindo algumas hipóteses simplificadoras; estas, embora
demasiado restritivas em relação à maioria das situações reais típicas,
permitem uma solução elegante para o modelo (Seção 2.2), que serve de base para
a análise de situações mais complexas (uma dessas situações é mencionada
brevemente na Seção 2.3). O modelo básico é então estendido (3.1), para o caso
em que uma das hipóteses simplificadoras é violada, sendo desenvolvido um
algoritmo para solução (3.2). É descrito, em seguida, o problema concreto do
banco de sangue (4.1), e discutidos os resultados de sua solução pelo
algoritmo: economia proporcionada, questões de implementação da solução na
prática, e análise de sensibilidade (seções 4.2 a 4.4). Nas conclusões e
comentários finais (Seção 5) discutem-se o ganho proporcionado pelo algoritmo
em termos de redução do espaço de busca, o leque de aplicações potenciais do
modelo, e direções para pesquisa futura.
2. Modelo para o Caso de Diagnósticos Mutuamente Exclusivos
2.1 Formulação do problema
Dado o conjunto D = {d1, d2, ... dn} das n causas possíveis de uma falha ou
problema ou, mais genericamente, um conjunto de diagnósticos possíveis
deseja-se determinar a causa responsável ou o diagnóstico correto. (Daqui por
diante, referir-se-á sempre a "diagnósticos"). São feitas as
seguintes hipóteses simplificadoras: (a) os diagnósticos em D são mutuamente
exclusivos e exaustivos: um e somente um é o correto; (b) para cada diagnóstico
di Î D, existe um e apenas um teste ti que permite determiná-lo; (c) o
resultado do teste indica com 100% de certeza um dos dois eventos seguintes: o
diagnóstico correto é di; ou o diagnóstico correto não é di.
Cada diagnóstico di possui uma probabilidade a priori pi de ser o correto
(estimada a partir de estatísticas passadas, ou de conhecimento do processo, ou
ainda subjetivamente). Na execução de cada teste ti incorre-se em um custo ci
(este custo engloba tanto os custos diretos de execução do teste, como
quaisquer custos indiretos em que a execução do teste implique, tais como
custos de interrupção da produção ou de demora na correção do problema). Assim,
há um conjunto de n testes, T, um conjunto de n probabilidades, P, e um
conjunto de n custos, C, de tal forma que há uma associação entre os elementos
de mesmo índice nos conjuntos D, T, P e C. Além disso, S pi = 1.
O procedimento de investigação da causa responsável (determinação do
diagnóstico) começa pela escolha de um primeiro teste ti1 a ser executado. Se o
resultado for positivo, a causa foi identificada (o diagnóstico determinado) e
o processo termina; se negativo, um segundo teste ti2 deve ser escolhido e
realizado, e assim por diante. (O duplo índice é usado para distinguir entre os
índices de posição dos testes na seqüência de execução e os seus "índices-
nome" dentro do conjunto T; desta forma ij representa o índice-nome do
teste que ocupa a j-ésima posição na seqüência de execução. Por exemplo, na
seqüência (t3,t5,t1,t2, t4), tem-se i1=3, i2=5, i3=1,i4=2 e i5=4).
Como a seqüência é interrompida assim que a causa for identificada (assim que
se chegar a um diagnóstico) não se sabendo a priori quando isto ocorrerá o
custo da seqüência de testes efetivamente realizados é uma variável aleatória.
A função-objetivo a minimizar é o valor esperado deste custo. Este valor
esperado é função, obviamente, dos valores das probabilidades em P e dos custos
em C (que constituem os dados do problema), bem como da ordem de execução dos
testes. A decisão é em relação à ordem de execução dos testes: a variável de
decisão é o vetor, ou seqüência, de índices (i1, i2, ... , in), que indica esta
ordem de execução. Daqui em diante, utilizar-se-á o termo "seqüência"
para designar o conjunto dos testes executados segundo uma certa ordem.
É fácil verificar que, para uma dada ordem de execução dos testes, o valor
esperado do custo total CT é dado pela seguinte expressão:
ou pela expressão equivalente
A fórmula (1) pode ser facilmente entendida reconhecendo que o comprimento da
seqüência ou o número k de testes realizados é um evento aleatório, cuja
probabilidade é a probabilidade do ik-ésimo teste ter resultado positivo; o
custo correspondente a este comprimento é dado pela soma do custos dos k testes
realizados. A fórmula (2) calcula o custo em etapas: a cada etapa (final de um
teste), dois eventos são possíveis: interrupção do processo, ou realização do
próximo teste (e correspondente incremento no custo total).
Estas expressões fornecem o custo esperado antes de iniciar os testes. Ao longo
do tempo, o valor esperado do custo se altera cada vez que um teste é
realizado, mas é fácil mostrar que, se o teste tem resultado negativo, a ordem
de execução dos testes restantes que minimiza o custo total permanece
invariável. Assim, embora o ponto de interrupção da seqüência permaneça
aleatório, a seqüência ótima pode ser completamente determinada a priori.
2.2 Solução
Demonstra-se que a seqüência de execução dos testes que minimiza o custo
esperado E(CT) é aquela em que os testes estão ordenados por ordem crescente
das razões entre seus custos e as probabilidades de terem resultado positivo;
em outras palavras, é a seqüência (ti1, ti2, ... tin) tal que, para todo k Î
{1, 2, ..., n-1}:
Para não sobrecarregar a exposição, a demonstração encontra-se no Apêndice.
Dada a extrema simplicidade desta solução, os autores pesquisaram a literatura,
em busca de referência prévia ao problema e à própria solução; não se pretende
afirmar que esta não exista, mas nada se conseguiu localizar.
O Quadro_1 sintetiza a definição formal do problema e a solução.
É interessante observar que, se os custos dos testes forem iguais, esta solução
se reduz a uma das "heurísticas" (entre aspas, pois no caso, não é
uma heurística, mas sim a definição da solução ótima) adotadas por Goulart et
al.(1994).
2.3 Extensão para um problema com testes em diversos níveis
O modelo e solução acima podem facilmente ser estendidos ao caso em que as
causas ou sintomas se agrupam por grandes categorias, por estágio do processo,
ou segundo algum outro critério, levando a uma classificação hierárquica em
dois ou mais níveis. (Para exemplos de problemas deste tipo, ver Banks (1989),
seção 14.5). Suponha então que, além dos testes que determinam diagnósticos
individuais, há testes que reduzem os diagnósticos a um subconjunto (ou
identificam um grupo de causas que contém a causa responsável pela falha ou
problema). Suponha ainda que os subconjuntos, ou grupos, são mutuamente
exclusivos (disjuntos). No caso de dois níveis, a diagnose ocorre em duas
etapas: primeiro, realizam-se os testes do nível mais alto, para identificar o
grupo de diagnósticos que contém o diagnóstico verdadeiro; em seguida,
realizam-se os testes que irão determinar o diagnóstico final dentro do grupo
identificado. A seqüência ótima dos testes em cada etapa pode ser determinada
pelo procedimento acima proposto. Analogamente, se a hierarquia de causas
(diagnósticos) tiver mais de dois níveis, o problema pode ser decomposto e
solucionado na forma proposta, para um nível de cada vez, indo do mais alto
para o mais baixo. Pode-se demonstrar formalmente que este método leva à
solução de custo mínimo para o problema global; por considerarmos este
resultado intuitivo, sua demonstração é aqui omitida, mas ela pode ser
encontrada em Pires (1995).
3. Caso em que os Diagnósticos Não São Mutuamente Exclusivos
Foi visto que uma das hipóteses básicas do modelo desenvolvido é que os
diagnósticos sejam mutuamente exclusivos. Será apresentada agora uma extensão
do modelo para o caso em que essa condição não se verifica. As demais
hipóteses, porém, continuam sendo mantidas. Especificamente, continua-se
exigindo que: a união dos diagnósticos corresponda ao espaço amostral; os
testes não possuam probabilidade de erro; o resultado positivo de qualquer
teste, isoladamente, seja suficiente para identificar um diagnóstico; e a
seqüência de testes seja interrompida ao primeiro resultado positivo.
Um exemplo de problema real apresentando essas condições será descrito mais
adiante, na Seção 4. Foi precisamente tal problema a motivação para o
desenvolvimento dessa extensão.
3.1 Extensão do modelo matemático
O fato de os diagnósticos não serem mutuamente exclusivos pode ser representado
por uma mudança na definição de pj na fórmula do custo esperado. A nova
definição passa a ser:
pj: probabilidade do teste tj ser positivo condicionada a os testes
anteriores terem sido negativos, multiplicada pela probabilidade de
os testes anteriores serem negativos. Em outras palavras, pjé a
probabilidade da diferença de eventos A-B, onde A=dj e B = união dos
diagnósticos associados aos testes que precedem tj na seqüência
(i.e., união de todos os di tais que ti precede tj).
Note que esta é a definição genérica para pj, que, no caso particular em que os
diagnósticos são mutuamente exclusivos, se reduz à probabilidade absoluta do
diagnóstico (definição anterior para pj).
O impacto desta nova definição de pj no método de solução é que as
probabilidades {pik} nas fórmulas (1) e (2) não correspondem mais apenas a
permutações de um conjunto fixo de valores {pj}, mas os próprios valores dos
elementos deste conjunto {pj} variam agora de seqüência para seqüência.
Isto dificulta a determinação da seqüência ótima, pois as razões cj/pj passam
também a não mais possuir um valor constante para cada teste tj, mas a depender
da seqüência.
Contudo, para qualquer teste tj é verdade que, em qualquer seqüência,
onde
pjmin é a probabilidade de tj ter resultado positivo isoladamente (i.e.,
probabilidade de o diagnóstico ser dj e apenas dj);
pjmax é a probabilidade total de tj ter resultado positivo (independentemente
do resultado dos demais testes; i.e., probabilidade total do diagnóstico dj).
Então, por exemplo, em uma seqüência em que tj seja o último teste (in = j), pj
= pjmin ; e numa seqüência em que tj seja o primeiro teste (i1 = j), pj =
pjmax.
Estas condições são suficientes, mas não necessárias. I.e.,
Em outras situações (ik=j, 1<k<n), vale a condição em (4).
De (4), tira-se que, em qualquer seqüência, para cada cik/pik , ik Î {1, 2,
..., n}:
Se a ordenação dos cik/pik pelo critério cik/pik < ci(k+1)/pi(k+1) para todo ik
for insensível à variação de cada cj/pj entre os seus limites (i.e., se houver
uma única seqüência em que cik/pikmin < ci(k+1)/pi(k+1)max para todo k), então
esta é a seqüência ótima.
Se um subconjunto S1 de testes tiver todos cj/pjmin inferiores a todos cj/pjmax
dos testes de um outro subconjunto S2, então sabe-se que todos os testes de S1
precedem todos os testes de S2; e assim tem-se a priori uma ordem parcial dos
testes na seqüência ótima.
Desta forma, o exame dos limitantes superior e inferior para as razões cj/pj
(iguais, respectivamente, a cj/pjmin e cj/pjmax) pode vir a reduzir o espaço de
busca da seqüência ótima, determinando grupos de testes que precedem outros
grupos.
Uma vez assim definida uma ordem parcial dos testes, para determinar a
seqüência ótima resta apenas determinar a ordem ótima dos testes internos a
cada grupo. Para isso, em princípio, o único procedimento geral é calcular e
comparar os custos esperados das seqüências produzidas por todas as permutações
possíveis destes testes. De qualquer forma, a subdivisão prévia do conjunto
{tj} em grupos já proporciona uma redução evidente do número de seqüências
alternativas em relação ao conjunto formado por todas as permutações de todos
os testes do conjunto. Há, porém, um recurso adicional que pode reduzir ainda
mais o número de alternativas a considerar dentro de um grupo de testes: os
limitantes superior e inferior para as razões cj/pj correspondentes aos testes
do grupo podem ser recalculados, pois já se sabe que, qualquer que seja a
seqüência, o conjunto dos testes que precederão cada teste do grupo será
formado por: no mínimo (caso o teste seja o primeiro do grupo), todos os testes
dos demais grupos precedentes; no máximo (caso o teste seja o último do grupo),
todos estes, e mais todos os demais testes do próprio grupo. Assim, o exame
destes novos valores para os limitantes das razões cj/pj dentro do grupo pode
definir uma ordem parcial dentro do grupo, particionando-o por sua vez em
subgrupos, ou mesmo, por vezes, pode definir uma ordem total, determinando
completamente a seqüência ótima dentro do grupo.
3.2 Algoritmo
Estas observações já são suficientes para definir um algoritmo geral para
solução do problema. Este é apresentado no Quadro_2, abaixo.
4. Uma Aplicação a um Caso Real
4.1 Descrição do caso
Passemos agora a uma breve descrição do caso que motivou extensão do método.
Tratou-se da determinação da seqüência ótima de testes sorológicos no banco de
sangue (BS) de um hospital universitário. (Para uma descrição mais detalhada,
ver Santos Jr., 1997).
O sangue de cada doador só pode ser utilizado após passar pela triagem
sorológica, composta de 8 diferentes testes laboratoriais para identificar a
presença de doenças infecto-contagiosas. Os resultados destes testes são
considerados 100% confiáveis. Os custos com estes testes representam 71,22% dos
custos incorridos pelo BS.
Ao terem os autores contato com o BS, o procedimento adotado era realizar todos
os 8 testes, em paralelo. Contudo, lembrando que basta que um dos exames tenha
resultado positivo para rejeitar o sangue do doador, surgiu a idéia, para
tentar reduzir os custos, de aplicar os testes em seqüência, interrompendo-os
após o primeiro diagnóstico positivo.
O problema do BS, portanto, parecia ser bem descrito pelo modelo matemático da
Seção 2.1, representado no Quadro_1; a proposta de solução, então, foi
determinar a seqüência de custo esperado mínimo, e passar a realizar os testes
nessa seqüência.
Apenas, note-se que, no caso do BS, a união dos 8 diagnósticos não exaure o
espaço amostral: há o evento "apto" (sangue em condições de ser
utilizado), que constitui o complemento desta união. Como para os aptos são
feitos todos os testes (não se pode utilizar sangue que não tenha
"passado" em todos os testes), o seqüenciamento só terá efeito de
reduzir os custos dos exames dos candidatos não aptos; para os aptos, o custo é
fixo e máximo. (Para os aptos, a fórmula (1) não vale, e a fórmula (2) vale,
com pi = 0 para todo i, o que reduz (2) trivialmente a E(CT)=S ci). Trabalhou-
se, assim, com as probabilidades de ocorrência das doenças consideradas
condicionadas à presença de pelo menos uma das delas.
Como as despesas com o pessoal do laboratório são fixas, independentemente do
seu grau de utilização ou tempo ocioso, para efeitos da determinação da
seqüência de custo esperado mínimo, considerou-se como custo de cada exame
apenas o custo do material ("kit" para o teste). Para estimar as
probabilidades pj, levantaram-se e (a partir dos dados históricos disponíveis)
as freqüências absolutas de ocorrência dos diversos diagnósticos. Estes custos
e freqüências absolutas constam, respectivamente, das Tabelas_1 e2.
Observando a Tabela_2, nota-se que uma das hipóteses básicas do modelo não se
verifica: os diagnósticos, no caso, não são mutuamente exclusivos. A Figura_1
apresenta um diagrama de Venn dos resultados positivos para os testes. O fundo
da figura corresponde ao evento "apto".
Dada a violação desta hipótese básica, para poder solucionar o problema, foi
necessária a extensão do modelo e do método de solução descrita na Seção 3.
4.2 Solução
O algoritmo no Quadro_2 foi aplicado ao caso do BS, determinando a seguinte
seqüência ótima de realização dos testes laboratoriais:
A aplicação detalhada, passo a passo, do algoritmo, pode ser encontrada em
Epprecht et al. (1999).
O custo esperado desta seqüência (que é o custo esperado ótimo) é igual a
4,1645 (R$), o que representa apenas 13,47% do custo do conjunto completo de
testes (que é de R$30,92). Assim, a utilização dos testes em seqüência,
aguardando o resultado de um teste antes de decidir realizar o seguinte,
proporciona uma economia esperada de 86,53% no custo dos exames dos candidatos
sem condições de doar.
Como a proporção de candidatos sem condições de doar é de 17,53%, e lembrando
que 71,22% dos custos incorridos pelo BS são com os exames, esta economia
corresponde a 0,8653 x 0,1753 x 71,22 % = 10,8 % de todos os custos do BS.
4.3 Questões de ordem prática para implementação dos resultados
O seqüenciamento dos testes tem um impacto sobre os procedimentos, inclusive
provocando um aumento da duração da triagem sorológica (o tempo total dos
testes, que, com os testes em paralelo, é inferior a 4 horas, aumentará, com os
testes em seqüência, para cerca de 13 horas). Isto não necessariamente levará a
atrasos significativos na produção, pois o processo de coleta e exames só é
realizado uma vez por dia, mas pode impactar nos turnos de trabalho; implicar,
por exemplo, em que os testes sejam iniciados por uma equipe e terminados por
outra. Estas questões devem ser analisadas pelo BS, em termos de custo e
benefício. Mas algumas alternativas, que podem representar um bom compromisso
entre o ganho teórico e a viabilidade prática, são fornecidas com a análise de
sensibilidade a seguir.
4.4 Análise de sensibilidade
Devido aos possíveis problemas de implementação da solução ótima, é
interessante realizar uma análise de sensibilidade dos resultados, para
calcular a redução de custos que se obteria com um procedimento alternativo,
sub-ótimo em termos de custo esperado, mas que requereria um tempo total para a
execução dos testes bem inferior a 13 horas; a saber: realizar os primeiros
testes da seqüência ótima efetivamente em seqüência, e em seguida realizar os
demais (que raramente terão resultado positivo) em paralelo.
Para esta análise basta calcular o custo esperado das "seqüências"
assim determinadas, de maneira análoga ao que foi feito para a seqüência ótima.
Os resultados são:
Testes 1, 4 e 3 nesta ordem, seguidos dos demais em paralelo:
E(CT) = R$ 4,985
(20% mais cara que a seqüência ótima; 84% de economia em relação ao
procedimento vigente de efetuar todos os testes em paralelo)
Teste 1, depois teste 3, seguidos dos demais em paralelo:
E(CT) = R$ 5,229
(25% mais cara que a seqüência ótima; 83% de economia em relação ao
procedimento vigente de efetuar todos os testes em paralelo)
Portanto, um procedimento sub-ótimo destes pode levar a economias bem próximas
à proporcionada pela seqüência ótima, com um aumento bem menor da duração da
triagem sorológica; e isto pode fazer a diferença entre uma solução ótima mas
inviável e uma solução quase ótima viável.
Sobre a precisão das estimativas das probabilidades envolvidas, Epprecht et al.
(1999) apresentam uma discussão (aqui omitida por razões de espaço), concluindo
que os resultados são bastante robustos.
5. Conclusões e Comentários Finais
5.1 Resultados da aplicação ao problema real
A aplicação do método ao problema do banco de sangue mostrou a possibilidade de
uma economia de cerca de 86%; i.e., a utilização da seqüência ótima obtida para
os testes constitui um procedimento 7 vezes mais barato que o procedimento
vigente. Considerando possíveis dificuldades de ordem prática para
implementação da solução, foram sugeridas duas alternativas (mais viáveis) que
levam a economias menores, mas ainda substanciais: da ordem de 83 ou 84% (i.e.,
procedimento cerca de 6 vezes mais barato que o vigente).
5.2 Eficiência do algoritmo
A aplicação do algoritmo proporcionou uma enorme redução do número de
alternativas a considerar: no lugar das 40320 seqüências possíveis de 8 testes,
foi necessário calcular o custo esperado de apenas 2 subseqüências de 3 testes
(para detalhes, ver Epprecht et al., 1999). Embora este caso exemplifique o
ganho proporcionado pelo uso do algoritmo (em relação à busca exaustiva no
espaço de soluções), não se pretende generalizar este resultado: o grau de
redução do número de seqüências alternativas a considerar dependerá, para cada
problema específico, das probabilidades dos diagnósticos e de suas interseções.
O caso analisado foi extremamente favorável ao desempenho do algoritmo, já que
apenas um teste (t3) possuía interseções com vários outros. De qualquer forma,
é razoável esperar reduções substanciais do número de alternativas cada vez que
se subdividir o conjunto {tj} em subconjuntos, ordenados uns em relação aos
outros.
5.3 Aplicabilidade do modelo e algoritmo
Como foi dito, o modelo não se restringe a diagnósticos médicos, mas é
genérico. Sempre que o problema puder ser descrito pelas condições no Quadro_1,
a solução indicada no mesmo Quadro_1 se aplica. Sempre que a única violação
daquelas condições for a não exclusividade dos diagnósticos, mas o procedimento
seja interromper a seqüência ao obter um diagnóstico, pode-se aplicar o
algoritmo no Quadro_2.
Outra situação, ligeiramente mais complexa, que pode ser tratada pelo modelo no
Quadro_1, é a de testes organizados em níveis hierárquicos: neste caso, o
procedimento de solução deve ser aplicado separadamente para cada nível de
testes. Este caso é mencionado em Epprecht & Pires (1995); uma discussão
mais detalhada, com um argumento que mostra que o problema é perfeitamente
decomponível em um problema independente para cada nível, pode ser encontrada
em Pires (1995).
É importante insistir neste ponto: o modelo assume que os testes são
interrompidos sempre que se chegar a um (primeiro) diagnóstico, inclusive no
caso em que os diagnósticos não são mutuamente exclusivos. Como se vê, este é
exatamente o caso do problema do banco de sangue aqui analisado. Para problemas
em que este procedimento não seja obedecido, o modelo não se aplica.
No caso de diagnósticos de falhas de equipamentos (ou diagnósticos de problemas
em processos, no contexto de controle de qualidade) em que a estratégia seja
interromper os testes e reiniciar a operação do equipamento (ou processo) assim
que uma (primeira) causa for identificada e eliminada, há uma nuance: o modelo
se aplica apenas à minimização do custo esperado de identificar esta causa
única ou primeira. Caso o problema persista, ou se evidencie a presença de
outro problema, e seja necessário prosseguir com os testes, a simples retomada
da seqüência calculada pelo modelo a partir do ponto em que foi interrompida
pode não mais representar a solução ótima, pois a probabilidade de resultado
positivo para cada teste considerada nas fórmulas de E(CT) é condicionada a
todos os testes anteriores terem tido resultado negativo. Mesmo assim, se as
probabilidades de interseções de diagnósticos forem muito pequenas em relação
às probabilidades absolutas dos diagnósticos, os resultados não deverão ser
muito sensíveis a esta inadequação do modelo, e pode-se esperar que a solução
(seqüência) indicada pelo modelo, se não for a solução ótima, seja uma boa
solução. Outra maneira de enxergar esta questão é que, se as probabilidades de
interseções de diagnósticos forem muito pequenas em relação às probabilidades
absolutas dos diagnósticos, então a probabilidade de ser necessário retomar a
seqüência de testes após o primeiro diagnóstico positivo também será muito
pequena. Assim, com grande probabilidade, as condições de aplicação do modelo
são respeitadas e a solução é ótima; nas raras ocasiões em que isto não
ocorrer, o modelo fornece uma solução ótima para a identificação da primeira
causa, e uma boa solução para o prosseguimento da seqüência de testes.
Caso não se disponha de dados históricos que permitam estimar com razoável
precisão as probabilidades de cada diagnóstico (e interseções de diagnósticos),
podem-se utilizar estimativas subjetivas. Caso não se sinta confiança
suficiente nestas estimativas para aplicação do algoritmo, e por isso, ou por
quaisquer outras razões operacionais não representadas no modelo, a decisão
sobre a seqüência de testes deva ser subjetiva, ainda assim o exame das razões
cj/pj (ou de estimativas subjetivas, ou de faixas de valores para elas)
constitui um critério para auxílio à decisão, distinguindo pelo menos aqueles
testes em que os valores destas razões sejam muito diferentes, e aprimorando
assim o sentimento do decisor quanto à sensibilidade do custo total esperado à
ordem dos testes.
Finalmente, ao usar como critério o valor esperado do custo, implicitamente o
modelo não se destina a situações em que se incorrerá nos custos uma única vez
ou raramente, tais como decisões individuais quanto a exames às próprias custas
de um paciente, ou problemas raros de um equipamento. Para tais situações, pode
ser indicado considerar, além do custo esperado, ou mesmo em vez dele, a
dispersão da distribuição de probabilidades do custo total, a probabilidade de
ocorrer um custo total excessivamente alto, ou o uso de funções de preferência
ou utilidade do cliente. Contudo, para problemas de diagnóstico que se repitam
com freqüência, como no caso aqui descrito do banco de sangue ou no caso de
processos monitorados permanentemente, o custo esperado é o critério mais
adequado, e suficiente para a decisão. Esta questão é bem conhecida, mas pode-
se citar Gorentsin et al. (1992): "The use of the mean costs as the
decision criterion in stochastic problems is adequate for high frequency'
phenomena, in which a representative sample of all values is expected to occur
(...)". Nestes casos, além de o critério ser adequado, é usualmente
possível obter dados históricos suficientes para fornecer boas estimativas das
probabilidades dos diagnósticos, para entrada no modelo.
5.4 Direções de prosseguimento
Dentre as extensões possíveis para o modelo, as mais naturais e relevantes vão
na direção do relaxamento das hipóteses assumidas, de modo a admitir a
possibilidade de diferentes causas (ou doenças) produzirem sintomas comuns, de
modo que um teste não é suficiente para determinar um diagnóstico, mas um
subconjunto de diagnósticos; ou ainda a admitir testes cujos resultados possuem
uma margem (probabilidade) de erro; para citar apenas os aspectos mais
evidentes.
É possível que algumas destas situações não admitam um algoritmo exato de
solução, e requeiram (como nos trabalhos de Goulart et al., 1994, e Pereira,
1994) o uso de heurísticas ou outras técnicas (por exemplo técnicas de
inteligência artificial), para estes casos, espera-se que o presente modelo
possa ajudar a prover "insight" sobre a questão.