Estudo de métodos de aumento de resolução de espectros de FTIR para análise de
estruturas secundárias de proteínas
ii. O aumento de resolução não introduz qualquer fenômeno físico novo.
iii. Os estreitamentos das bandas são obtidos com distorções das bandas
originais e também levam à degradação da razão sinal/ruído.
iv. A quantificação baseada em aumento de resolução é dependente da relação das
áreas e/ou intensidades relativas, e não dos valores absolutos.
Derivação do Sinal
A derivação dos sinais de FTIR vêm sendo usada desde 1983 em estudos de ESP3.
Dong et al8,16,17,, fizeram uma descrição detalhada do uso da segunda derivada
como método quantitativo na determinação das ESP, e tem sido criticado por
alguns autores4,7. Somente as derivadas pares (principalmente a segunda) tem
sido usadas em estudos de ESP4.
Como o sinal de FTIR é digital, com resolução finita e bem mais complexo, a sua
derivada é calculada numericamente e o algoritmo mais usado é o de Savitzky-
Golay11,15,18.
Na figura_1, tem-se um sinal simulado, onde a aplicação tanto da segunda como
da quarta derivadas reduzem a largura do sinal. O inconveniente deste
processamento é a presença de lobos laterais que distorcem a base do sinal.
Como o uso de quarta derivada, que causa maior redução na largura de linha, é
muito restrito por necessitar de razão sinal/ruído muito alta15,24, a segunda
derivada será analisada com mais detalhes.
A meia largura da segunda derivada, g'', está relacionada à meia largura do
sinal original por15:
(2)
Para um sinal composto de dois picos de mesma intensidade e 10 cm-1 de meia
largura na meia altura, a distinção entre os dois picos pelas derivadas só
começa a ser observada a partir de 8 cm-1 e 6 cm-1 de separação, para a segunda
e quarta derivadas respectivamente. Para sinais com diferenças de intensidade
como o da figura_2, a distinção pela segunda e quarta derivadas só começa em 10
e 8 cm-1 respectivamente. Ou seja, a segunda derivada só distingue sinais com
separação igual ou superior à sua meia largura na meia altura. Nesta figura
pode-se notar a grande distorção do sinal de baixa intensidade. Além disso não
há como definir com precisão uma linha de base tanto para o cálculo das
intensidades e áreas. Esse problema não tem sido levado em consideração nos
trabalhos publicados por Dong et al8,16,17.
Um problema adicional é encontrado com o uso de derivadas quando as larguras de
linhas dos sinais não são iguais. A intensidade da segunda derivada de um sinal
lorentziano15 é dada por:
<formula/> (3)
onde a intensidade da derivada do sinal é inversamente proporcional ao quadrado
da meia largura original. Um exemplo desse efeito pode ser visto na figura_3,
onde foram simulados espectros com mesma intensidade e largura de linha 11 e 10
cm-1. A separação foi de 40 cm-1 para melhor visualização do problema. Pode-se
notar que tanto a intensidade como a área do sinal mais largo, sofreram uma
redução de 80% se comparado ao sinal mais estreito. A redução da relação da
área será tanto maior quanto maior for a diferença de largura de linha entre os
sinais.
Com isso fica evidente que as derivadas só podem ser usadas em análises
quantitativas quando as larguras de linha forem iguais e quando os sinais
estiverem separados em números de onda maiores que suas meias larguras à meia
altura e com pequenas diferenças de intensidade. Como em espectros reais de
proteínas isso não é garantido, as derivadas só devem ser usadas em análises
qualitativas ou semiquantitativas7.
Deconvolução de Fourier
A deconvolução de Fourier é outra técnica usada para reduzir a largura das
bandas dos espectros. Esse procedimento é muito usado em espectroscopia de RMN
tanto para aumento de resolução ou para melhoria da razão sinal/ruído3-5,9,19.
A redução da largura do sinal é obtida com a convolução do espectro com uma
função filtro do tipo passa alta19. Por facilitar o processamento, essa
convolução é realizada no domínio de Fourier, onde é apenas uma multiplicação.
Para isso obtém-se o interferograma a partir do espectro da proteína, com a
transformada inversa de Fourier. Após a multiplicação do interferograma com a
função filtro faz-se novamente a transformada de Fourier para obter o espectro
com as linhas mais estreitas19.
As funções filtro do tipo passa alta são exponenciais crescentes do tipo exp
(xg), onde x é o retardamento em cm e g a meia largura a meia altura em cm-1. A
sua utilização reduz o decaimento do interferograma reduzindo a largura de
linha do espectro. Ao aumentar a resolução há um conseqüente aumento de ruído,
pois no final do interferograma há uma grande redução da razão sinal/ruído.
Essa função também aumenta o problema de truncagem causando o aparecimento de
batimentos laterais no espectro. Ambos os problemas podem ser amenizados com a
utilização de funções de apodização do sinal. Uma função (ff) que contempla as
duas soluções (4) foi proposta por Kauppinen e colaboradores19:
<formula/> (4)
onde x é o retardamento em cm; L é o ponto limite da função filtro em cm; g é a
largura de linha na meia altura em cm-1.
Esta função representada na figura_4 é largamente usada em estudos de proteínas
por FTIR3-7 e apresenta o crescimento exponencial necessário para o aumento de
resolução bem como a apodização (1-x/L), fazendo com que o sinal retorne a
zero, no ponto onde L=X. Multiplica-se também o interferograma por uma função
boxcar, que tem valor 1 de zero a L e zero de L a X, ou seja, é a substituição
dos valores dos pontos de L a x por zero19.
Diferentemente das derivadas, o sinal decorrente da deconvolução de Fourier
(figura_5) não é muito distorcido e a redução da largura de linha pela
deconvolução de Fourier é determinada pela escolha dos valores de g e/ou L.
Isso pode ser um problema pois pode levar à sobredeconvolução do sinal (figura
6), onde aparecem os lobos laterais19, isto devido a utilização de um valor de
g grande comparado à largura de linha do sinal (g=10).
Ao deconvoluir um espectro composto de sinais de mesma largura de linha, as
intensidades e áreas relativas são mantidas (igual às derivadas). No entanto,
quando as larguras de linha são diferentes, cada sinal tem sua intensidade
reduzida por um fator inversamente proporcional à sua largura de linha, ou
seja, os sinais mais largos ficam menos intensos, como nas derivadas10. O fator
de redução depende dos valores de L e g usados. Por isso o uso das intensidades
tem sido pouco aplicado na análise das ESP4.
Na figura_7, pode-se observar o efeito da deconvolução de dois sinais de mesma
intensidade e largura de linha 11 e 10 cm-1, separados por 60 cm-1 (para
facilitar a visualização).
As linhas mais estreitas sofrem maior deconvolução (ficam proporcionalmente
mais estreitas) que as linhas mais largas, porém a razão entre as áreas é
mantida, diferentemente das derivadas.
Assim, é possível usar as áreas dos sinais deconvoluídos para as análises das
ESP. Para a obtenção das áreas individuais em sinais altamente complexos como o
de proteínas é necessário fazer o ajuste do sinal, para se obter as áreas dos
sinais individuais.
Ajuste do Sinal ("fitting")
O ajuste é um processo de decomposição de um sinal complexo em seus componentes
individuais, através da otimização pelo critério de mínimos quadrados, tendo
como parâmetros de entrada o número e posição dos picos, forma e largura do
sinal e uma linha de base11. O ajuste normalmente só produz resultados precisos
quando a separação entre as bandas é maior que suas meias larguras22, o que não
ocorre nos espectros de proteínas.
Como o método de deconvolução de Fourier reduz a largura de linha, sem
distorcer as áreas relativas, o ajuste do sinal deconvoluído começou a ser
largamente usado na quantificação das ESP de proteínas a partir do trabalho
pioneiro de Susi & Byler11.
O ajuste do sinal deconvoluído tem causado muita polêmica, com autores
considerando-o como a melhor solução7,21,24 e outros defendendo o uso do ajuste
do sinal original9,25.
Para os estudos de ajuste dos sinais originais e deconvoluídos, usaram-se dois
tipos de sinais simulados, de uma banda de amida I composta por combinações das
várias absorções de uma proteína rica em a-hélice (figura_8) e outra rica em
folhas b (figura_9).
Na figura_8 o espectro foi simulado com sinais de mesma largura de linha e
intensidade. A exceção é o sinal em 1656 cm-1, que tem área dez vezes maior do
que os outros picos e representa 60% da área total do sinal. Observa-se nessa
figura que a segunda derivada só identificou 5 sinais, cujas posições foram
usadas como parâmetros de entrada para o ajuste. Esse indicou que o sinal em
1656 cm-1 corresponde à 52% da área total e que as áreas dos outros sinais
variaram em até 6 vezes entre si.
Esse tipo de resultado indica a dificuldade de usar o ajuste de espectros
sobrepostos como o da banda de amida I de proteínas. No caso do sinal simulado
para uma estrutura rica em folhas b (figura_9) foram visualizados apenas sete
sinais dos onze simulados. As áreas ou intensidades originais com intensidades
iguais foram distorcidas em até 50%.
O mesmo tipo de problema foi encontrado ao realizarem-se os ajustes dos mesmos
sinais deconvoluídos com a função de Kauppinen e colaboradores. Para isso os
espectros simulados foram processados pelo programa de deconvolução de Fourier.
Na figura_10 tem-se o ajuste do sinal simulado (igual ao da figura_8) e
deconvoluído, onde a derivada identifica somente 6 dos 8 picos existentes. Essa
melhor resolução reflete o efeito da deconvolução de Fourier.
Na figura_11 tem-se o ajuste do sinal simulado (igual ao da figura_9) e
deconvoluído. Neste caso também foi possível identificar com a segunda derivada
um número maior de componentes (igual ao da figura_8) do que no ajuste do sinal
original. Isso porém não foi suficiente para se obter a proporcionalidade entre
as áreas dos picos.
Uma opção para melhorar o ajuste do sinal seria a utilização da quarta derivada
ou aumentar o fator de aumento de resolução da deconvolução, para identificar o
número e a posição dos picos. No entanto essa alternativa não tem muita
aplicação em espectros reais uma vez que necessita de uma razão sinal/ruído da
ordem de 10000/124 e/ou pode levar à sobredeconvolução do sinal (figura_5).
4. CONCLUSÕES
A partir desses resultados pode-se concluir que não há confiabilidade no uso
dos métodos de aumento de resolução na quantificação das ESP, uma vez que os
sinais reais de proteínas são bem mais complexos do que os sinais simulados,
devido às diferentes larguras de linha, não linearidade dos sinais, ruído e
interferência do meio como sinais de solventes e vapor de água etc.
Esses métodos também estão sujeitos a interferências externas, uma vez que
parâmetros como número e posição dos picos, fator de aumento de resolução,
entre outros, podem ser escolhidos de modo a que conduzam a um resultado
direcionado, ou seja, os métodos de aumento de resolução abordados não são
confiáveis e só devem ser usados para fins de análises qualitativas ou semi
quantitativas.