Uma abordagem usando redes neurais artificiais para resolução de problemas de
otimização restrita
1. Introdução
Problemas de otimização não-linear restrita referem-se, geralmente, ao problema
de minimizar ou maximizar uma função objetivo não-linear sujeita a um conjunto
de restrições (lineares e/ou não-lineares) de igualdade e/ou desigualdade
(Bazaraa & Shetty, 1979).
Embora existam na literatura diversos métodos de programação matemática que
possam ser aplicados na resolução de problemas de otimização não-linear
restrita, há a necessidade crescente de investigar métodos alternativos que
exploram arquiteturas de processamento inerentemente paralelas e adaptativas.
Assim sendo, as redes neurais artificiais torna-se uma abordagem promissora que
pode ser aplicada eficientemente nestes tipos de problemas. Entre as principais
vantagens em se utilizar a abordagem de redes neurais artificiais em otimização
não-linear restrita destacam-se as seguintes: i) a capacidade intrínseca de
operação em paralelo; ii) a simplicidade de implementação em hardware; e iii) o
alcance de altas taxas de computação por intermédio de elementos simples de
processamento.
Basicamente, as redes neurais utilizadas para resolver problemas de otimização
não-linear restrita são desenvolvidas utilizando parâmetros de penalidade
(Kennedy & Chua, 1988; Vazquez et al., 1990; Zhang et al., 1992). Os pontos
de equilíbrio destas redes, correspondentes às soluções do problema, são
obtidos através de uma escolha adequada dos parâmetros de penalidade que devem
ser suficientemente grandes para garantir a convergência da rede (Kennedy &
Chua, 1988). Entretanto, a escolha destes parâmetros é uma tarefa árdua, sendo
normalmente realizada através de técnicas de tentativas e erros, as quais podem
demandar um esforço computacional bastante excessivo. Além disso, a qualidade
da solução final também depende do ajuste destes parâmetros. Algumas outras
dificuldades relacionadas ao processo de convergência para os pontos de
equilíbrio da rede, que representam as soluções do problema de otimização, são
também evidenciadas. Uma análise minuciosa dos resultados apresentados nestes
artigos demonstra que muitas vezes resultados infactíveis são apontados como
soluções do problema.
Com a finalidade de contornar estes problemas de convergência, de aperfeiçoar a
eficiência de simulações por computador, e de fornecer uma nova metodologia
para mapeamento de problemas de otimização não-linear restrita, uma rede de
Hopfield modificada foi desenvolvida. A referida rede foi implementada com o
propósito de que seus pontos de equilíbrio correspondam à solução do problema
de otimização não-linear restrita. As principais características desta rede
são: i) inexistência de constantes de ponderação; ii) todas as restrições
estruturais envolvidas ao problema de otimização não-linear restrita são
agrupadas em um único termo de restrição; iii) não há interferência entre termo
de otimização e termo de restrição; e iv) nenhum parâmetro de iniciação é
requerido para a execução da simulação. Uma análise do comportamento dinâmico
da rede será também realizada para ilustrar o processo de convergência da rede
em direção às soluções ótimas (pontos de equilíbrio).
Portanto, o problema a ser estudado neste artigo consiste de aplicar uma rede
de Hopfield modificada a fim de minimizar uma função de energia Eot, a qual
representa a função objetivo do problema, estando sujeita a diversas restrições
de igualdade e desigualdade. Essas restrições são todas agrupadas em um único
termo de energia denominado Econf, o qual possui o objetivo de confinar todas
as restrições envolvidas com o problema de otimização.
Para este propósito a organização deste artigo está como segue. Na Seção 2, a
rede de Hopfield modificada é apresentada, e a técnica do subespaço-válido de
soluções utilizada para projetar os parâmetros internos da rede é descrita. A
Seção 3 contém uma análise do comportamento dinâmico da rede no contexto do
subespaço-válido. Na Seção 4, o mapeamento de problemas de otimização não-
linear restrita é formulado utilizando a rede de Hopfield modificada.
Resultados de simulação são apresentados na Seção 5 para validar a abordagem
proposta. Na Seção 6, as conclusões e os pontos chave deste artigo são
apresentados.
2. A Rede de Hopfield Modificada
Além de fornecer um novo método para resolver problemas de otimização não-
linear restrita, redes neurais artificiais oferecem um método que explora
arquiteturas de processamento intrinsecamente paralelas e adaptativas. Neste
artigo, uma rede de Hopfield modificada, cujos pontos de equilíbrio representam
uma solução do problema de otimização não-linear restrita, é desenvolvida.
A rede de Hopfield é provavelmente o melhor exemplo conhecido de uma rede
recorrente. Como definida em Hopfield (1984), esta rede apresenta geralmente
uma única camada com conexões realimentadas entre os nós. Na maioria dos casos,
os nós (neurônios) são completamente interconectados, ou seja, todos os
neurônios da rede estão conectados aos outros e a si próprio. A equação nodal
para a rede de Hopfield contínua no tempo é dada por:
onde:
ui(t) é o estado corrente do i-ésimo neurônio.
vi(t) é a saída do i-ésimo neurônio.
Tij é o peso conectando o i-ésimo neurônio ao j-ésimo neurônio.
é a entrada do i-ésimo neurônio (input
bias).
h.ui(t) é um termo de decaimento passivo.
Na equação (2), g(ui(t)) é uma função de ativação, monótona crescente, que
limita a saída de cada neurônio para um intervalo pré-definido. Em Hopfield
(1984) mostra-se que os pontos de equilíbrio da rede correspondem aos valores
de v(t) que minimizam a função de energia da rede. A função de energia
associada à rede de Hopfield é definida por:
De fato, a função de energia dada em (3) é uma função de Lyapunov (Vidyasagar,
1992) e, neste caso, a estabilidade assintótica da rede pode ser demonstrada
utilizando o segundo método de Lyapunov, isto é, mostrando que o sistema
dissipa energia com o passar do tempo. Para tanto, basta mostrarmos que as
derivadas parciais de (3) são não crescentes. Esta condição é alcançada quando
a matriz T é simétrica. Uma demonstração envolvendo o processo de convergência
da rede de Hopfield é apresentada no Apêndice.
Assim, o mapeamento de problemas de otimização utilizando uma rede de Hopfield
consiste em determinar, em cada tipo de problema, a matriz de pesos T e o vetor
de entradas ib associados à função de energia da rede (3).
A dificuldade em mapear problemas de otimização distintos através de uma rede
de Hopfield convencional está em satisfazer as várias restrições que são
impostas por cada tipo de problema. Uma técnica simples de mapeamento codifica
as restrições como termos na função de energia que são minimizados quando as
restrições são satisfeitas, ou seja:
onde ci são constantes positivas que ponderam cada uma das restrições. Assim, a
rede atua com o propósito de minimizar simultaneamente uma função de energia
(Eot) correspondente à função objetivo associada ao problema, e as funções ([/
img/revistas/pope/v24n2/21396s2.gif]) que representam as k-ésimas restrições
envolvidas no problema. Portanto, se qualquer uma destas restrições for
violada, a solução é considerada 'inválida' (Silva, 1997).
No processo de otimização com uma rede de Hopfield convencional, a
multiplicidade de termos de restrições em (4) pode cancelar uma ou várias
restrições simultaneamente. Como resultado, as soluções obtidas no final do
processo de otimização podem ser infactíveis; e o desempenho da rede é sensível
aos valores dos parâmetros ci , que são geralmente especificados através de
procedimentos não formais (Silva et al., 1997).
Para contornar estes problemas, realizou-se em Aiyer et al. (1990) uma análise
da convergência da rede que permite verificar como Eot e os termos de
restrições <formula/> em (4) podem ser separados
dentro de subespaços diferentes para evitar a infactibilidade do problema. Este
subespaço que agrupa todas as restrições impostas pelo problema é denominado
subespaço-válido de soluções, com equação definida por:
onde Tconf é uma matriz projeção (Tconf.Tconf = Tconf) que projeta o vetor v
para o subespaço-válido, e Tconf.iconf = 0 (iconf é um vetor ortogonal ao
subespaço-válido). Um estudo detalhado dos aspectos teóricos relacionados ao
subespaço-válido é apresentado em Silva et al. (1997).
Assim, utilizando o subespaço-válido com o objetivo de agrupar todas as
restrições envolvidas a um determinado problema, a função de energia dada em
(4) passa a ser definida por:
onde Econf confina todas as restrições <formula/>,
pertencentes a equação (4), para o subespaço-válido. A função de energia Eot e
Econf dadas na equação (6) são definidas por:
A necessidade de assegurar que Eot seja otimizado quando todas as restrições
contidas em Econf estejam são satisfeitas, implica em atribuir um valor elevado
para a constante c0 em (6). Esta condição torna a simulação da rede
ineficiente, desde que a maioria do esforço computacional é para forçar o
confinamento das restrições.
Portanto, com o objetivo de evitar esses problemas de convergência, uma rede de
Hopfield modificada que utiliza a técnica de subespaço-válido de soluções é
então proposta. A arquitetura desenvolvida (Figura_1) diretamente garante a
validade das restrições agrupadas por Econf, dispensando assim a utilização da
constante de ponderação c0. Assim, a principal contribuição da arquitetura
proposta, em constaste com a maioria das abordagens neurais propostas na
literatura, está na inexistência de parâmetros de ponderação e/ou penalidade,
implicando então na não necessidade de especificação dos mesmos. Uma análise da
convergência da rede de Hopfield modificada proposta neste trabalho é realizada
da Seção 3.
A dinâmica da rede de Hopfield modificada, ilustrada na Figura_1, é explicitada
através de três passos principais:
(I) Minimização de Econf: corresponde à projeção de v sobre o subespaço-válido
que confina todas as restrições impostas pelo problema:
Esta operação realiza uma minimização indireta de Econf.
(II) Aplicação de uma função de ativação do tipo 'rampa simétrica',
restringindo v dentro de um hipercubo pré-definido:
onde <formula/>. Esta função de ativação é similar
àquela utilizada em (1).
(III) Minimização de Eot: alteração de v em direção a uma solução de custo
ótimo (definida por Tot e iot), correspondente aos pontos de equilíbrio da
rede, que são as soluções para o problema de otimização considerado. Utilizando
a função de ativação 'rampa-simétrica' e dado que h =0, pois as alterações nos
neurônios são realizadas de forma síncrona, ou seja, todos os neurônios serão
alterados simultaneamente, então a equação (1) torna-se:
Assim, a minimização de Eot consiste na alteração de v na direção oposta ao
gradiente da função Eot em relação a v. Estes resultados são também válidos
quando uma função de ativação do tipo tangente hiperbólica é utilizada.
Deve-se ressaltar que a aplicação dos passos (I) a (III) são realizados de
forma discreta. Neste caso, após as considerações realizadas no passo (III), a
resolução da equação diferencial representada em (10) será similar ao método de
Euler.
3. Análise da Dinâmica da Rede
Nesta seção, realiza-se uma análise linearizada da convergência da rede de
Hopfield modificada cuja dinâmica de operação é implementada através dos passos
(I)-(III) apresentados anteriormente. Em particular, considera-se que a região
de operação na qual o vetor v está contido é limitada pelo hipercubo definido
pela função de ativação 'rampa-simétrica' (9). A equação nodal descrevendo o
comportamento dinâmico desta rede é obtida a partir de (1) para h = 0 e v(t) =
u(t), ou seja:
A análise dinâmica da rede é portanto inicializada com a obtenção de uma
equação para <formula/>, componente de
que pertence ao subespaço-válido.
Como na rede de Hopfield modificada a saída v é constantemente confinada ao
subespaço-válido pela aplicação do passo (I) descrito na Seção 2, isto é
{v ¬ Tconf.v + iconf}, então a aplicação deste processo iterativo implica
que qualquer componente de <formula/> ortogonal a
<formula/> é continuamente suprimida. Logo, a
componente <formula/> (não [/img/revistas/pope/
v24n2/21396s4.gif] ) caracteriza melhor a dinâmica global da rede. Assim, tem-
se:
A partir da equação (11), verifica-se que a componente [/img/revistas/pope/
v24n2/21396s3.gif] é constituída de duas partes, um termo constante {Tconf
(Tot.iconf + iot)}; e um termo dependente de v, {TconfTotTconf.v}. Estas
expressões podem ser simplificadas por:
Substituindo (12) e (13) em (11), obtém-se:
Com v confinado ao subespaço-válido (isto é: v = Tconf.v + iconf e Tconf.iconf
= 0), Eot pode ser expressado como:
Na equação (15) observa-se que a dinâmica de [/img/revistas/pope/v24n2/
21396s4.gif] = <formula/> = A.v + b simplesmente
resulta num processo de otimização de Eot em relação ao subespaço-válido. Logo,
o objetivo consiste em obter uma solução válida que minimiza Eot.
Corolário: A solução geral de um sistema linear invariante no tempo (autônomo)
do tipo descrito por <formula/> é dada por:
onde <formula/> é um vetor de elementos aleatórios
correspondendo ao valor de <formula/> no instante
de tempo t = 0. Deve-se observar que quando estamos começando a execução da
rede, o Passo (I) é realizado em primeira instância seguido do passo (II).
Neste caso, deve-se atribuir valores aleatórios para o vetor v, representado
aqui inicialmente por <formula/>, a fim de iniciar
o processo de confinamento do mesmo para o subespaço-válido. Somente após a
convergência ao subespaço-válido é que o passo (III) será aplicado pela
primeira vez. Assim, daqui por diante, o valor atribuído [/img/revistas/pope/
v24n2/21396s6.gif] será igual ao valor de v obtido no passo (III).
Definição: A exponencial de uma matriz quadrada A é definida pela série de
potências dada por:
Então, rescrevendo a equação (16) como séries de potências, tem-se:
Para analisar o comportamento de <formula/> durante
o processo de convergência da rede, considera-se os vetores [/img/revistas/
pope/v24n2/21396s6.gif], <formula/> e b escritos em
termos de suas componentes que serão expressas no espaço coordenado gerado a
partir dos autovetores normalizados de A. Assim, considera-se que A tem
autovalores l 1, l 2, ...,l n, cujos autovetores normalizados são
u1, u2,..., un. Para distinguir os autovalores nulos e não-nulos de A, define-
se o conjunto Z tal quel i = 0 para i Î Z e l i ¹ 0 para i Ï Z. Decompondo-
se <formula/>, [/img/revistas/pope/v24n2/
21396s5.gif] e b ao longo dos autovetores de A, tem-se:
onde vi, oi e bi referem-se respectivamente aos valores da i-ésima componente
de <formula/>, [/img/revistas/pope/v24n2/
21396s5.gif] e b, representado no espaço coordenado gerado a partir dos
autovetores de A. Portanto, a partir de (18), obtém-se:
Substituindo a equação (19) em (17) resulta-se em:
A equação (20) é completamente geral para quaisquer valores arbitrários de A, b
e <formula/>. Entretanto, esta equação pode ser
simplificada se A e b forem definidas como nas equações (12) e (13). Neste
caso, os autovetores de A com autovalores zero serão confinados ao transpor o
subespaço ortogonal ao subespaço-válido, enquanto b sempre permanece no
subespaço-válido {bi = 0 para i Î Z}. Assim, a equação (20) torna-se:
Agora torna-se também importante examinar a equação (21) para valores pequeno e
grande de t. Para t suficientemente pequeno, tem-se a seguinte aproximação:
Substituindo esta aproximação em (21), tem-se:
Observa-se que para um <formula/> aleatoriamente
pequeno, os termos oi são freqüentemente pequenos em comparação com os bi .
Logo, a equação (23) transforma-se em:
Analisando a equação (24), nota-se que vconf inicialmente parte na direção do
vetor b. No limite, quando t é muito grande, a equação (21) indica que vconf
tenderá em direção aos autovetores de A correspondente ao maior autovalor
positivo. Neste caso, a partir dos resultados advindos de Aiyer et al. (1990) e
Vidyasagar (1992), os pontos de equilíbrio da rede podem ser iterativamente
computados visto que o estado da rede partindo de uma posição inicial
arbitrária sempre convergirá para um ponto de equilíbrio estável. Este ponto de
equilíbrio é sempre limitado pela função de ativação 'rampa-simétrica' definida
em (9).
Embora o processo de convergência em direção aos pontos de equilíbrio seja
assegurado, deve-se observar que isto não implica na obtenção de um ponto de
mínimo global em relação à função de energia Em(t) associada à rede de Hopfield
modificada.
4. Formulação do Problema de Otimização Não-Linear Restrita
Considera-se o seguinte problema de otimização não-linear restrita contendo p-
restrições de desigualdade, com variáveis limitadas, ou seja:
onde v, zmin, zmax Î Â N; f(v) e hi(v) são funções contínuas e diferenciáveis.
As condições (26) e (27) definem um conjunto fechado em ÂN no qual o vetor v
deve permanecer para representar uma solução válida para o problema de
otimização (25). Uma solução para o problema pode ser obtida por uma rede de
Hopfield modificada cujo subespaço-válido garante a satisfação das condições
definidas em (26). Além disso, o hipercubo inicial representado pelas
restrições de desigualdade (variáveis canalizadas) em (27) é definido pela
função de ativação 'rampa-simétrica'.
Os parâmetros Tconf e iconf, pertencentes ao subespaço-válido, são calculados
transformando-se as restrições de desigualdade em (26) num conjunto de
restrições de igualdade através da utilização de uma variável auxiliar para
cada restrição de desigualdade:
onde wj > 0 são as variáveis auxiliares que podem ser tratadas como variáveis
vi , e dij é definida pela função impulso de Kronecker dada por:
Após esta transformação, o problema definido pelas equações (25), (26) e (27)
podem ser rescritas como:
onde <formula/> é um vetor de variáveis
estendidas. Deve-se notar que Eot não dependerá das variáveis auxiliares w.
A matriz projeção Tconf da equação do subespaço-válido é obtida através da
projeção de v+, obtido a partir da minimização de Eot(v+) = f(v+), para o
subespaço tangente à superfície delimitada pelas restrições dadas por (31).
Assim, uma equação para Tconf pode ser definida por (Luenberger, 1984):
onde:
Substituindo-se a matriz Tconf dada por (34) na equação do subespaço-válido
(5), obtém-se:
Por fim, resultados da teoria de estabilidade de Lyapunov (Vidyasagar, 1992)
devem ser introduzidas na equação (36) para garantir a estabilidade do sistema
não-linear, e conseqüentemente, forçar a convergência da rede para os pontos de
equilíbrio que representam uma solução para o sistema. Pela definição de
Jacobiano, quando v tende ao ponto de equilíbrio implica que ve = 0. Neste
caso, o valor de iconf deve ser também nulo, pois caso contrário a igualdade
não é satisfeita para a condição de equilíbrio, ou seja, ve = v(t) = v(t + Dt)
= 0. Assim, a equação (31) pode ser aproximada por:
Na vizinhança do ponto de equilíbrio ve = 0, obtém-se a seguinte equação:
Introduzindo-se os resultados das equações (37) e (38) na equação (36), obtém-
se:
Portanto, a equação (39) sintetiza a equação do subespaço-válido para sistemas
de equações não-lineares. Neste caso, a equação original do subespaço-válido em
(5), o qual está representado pelo passo (I) na Figura_1, deve ser substituída
pela equação (39). A aplicação sucessiva do passo (I) seguido do passo (II),
ilustrado na Figura_1, faz com que v seja uma solução que satisfaça todas as
restrições impostas pelo problema de otimização não-linear.
Os parâmetros Tot e iot do termo de energia Eot, dado por (7) e representado em
(30), são definidos com o objetivo de que a solução ótima corresponda à
minimização de Eot. Este procedimento pode ser feito alterando-se o vetor v+ na
direção oposta ao gradiente da função de energia Eot. Assim, os pontos de
equilíbrio da rede podem ser calculados assumindo-se os seguintes valores para
Tot e iot:
Vale aqui ressaltar que a obtenção das expressões de Tconf e iconf, as quais
caracterizam o subespaço válido de soluções, é realizada a partir do
conhecimento a priori sobre o inter-relacionamento envolvendo as variáveis do
problema. O processo envolvido com a especificação de Tconf e iconf deve levar
em consideração as propriedades do subespaço válido, ou seja, Tconf.Tconf =
Tconf e Tconf.iconf = 0.
Conforme mencionado anteriormente, visto que v+T = [vT wT] então o vetor iot
dado em (40) seria representado por:
Como o processo de otimização de Eot não depende dos valores das variáveis
auxiliares w, então a equação dada em (42) pode ser substituída pela seguinte
expressão:
A fim de sintetizar todos os passos envolvidos com o mapeamento de problemas de
otimização restrita através da rede de Hopfield modificada, ilustra-se na
Figura_2 os passos algorítmicos básicos envolvidos com a abordagem proposta.
Para ilustrar o desempenho da rede neural proposta, alguns resultados de
simulação são apresentados na próxima seção.
5. Resultados de Simulação
A rede de Hopfield proposta nas seções anteriores foi utilizada para resolver
três problemas de otimização não-linear restrita propostos na literatura.
O primeiro problema, conforme proposto em Bazaraa & Shetty (1979), a função
objetivo está sujeita somente às restrições de desigualdade, ou seja:
Para este problema, com três restrições de desigualdade e com variáveis
limitadas, o vetor solução (ponto de equilíbrio) obtido após a convergência da
rede de Hopfield modificada é dado por v = [0,00001 1,50002 0,00000]T, com
função objetivo f(v) = 3,49999. Estes resultados são bem próximos ao valor da
solução ótima fornecida por v* = [0.00000 1,50000 0.00000]T e f(v*) =
3,50000.
A Figura_3 ilustra a evolução dos valores de v1 , v2 e v3 obtidos pela rede de
Hopfield modificada em relação ao número de iterações. O esboço do
comportamento da função objetivo do problema é apresentado na Figura_4. As
restrições dadas em (C4), (C5) e (C6) são diretamente tratadas pela função de
ativação da rede que é definida em (9).
O segundo problema tratado pela rede de Hopfield modificada é constituído por
restrições de igualdade e desigualdade, sendo o mesmo definido pelas seguintes
expressões:
Em relação a este problema, a Figura_5 mostra a evolução dos valores de v1 ,
v2 e v3 em função do número de iterações. O vetor solução obtido, após a
convergência da rede, é dado por v = [0,00000 4,00000 0,00001]T, sendo o
valor da função objetivo f(v) = Eot(v) = 0.00034. A solução ótima para o
problema é fornecida por v* = [0,00000 4.00000 0.00000]T, com Eot(v*) =
0,00000.
A Figura_6 ilustra o comportamento da função objetivo do problema em função do
número de iterações. Os valores iniciais atribuídos ao vetor v foram gerados
aleatoriamente entre zero e um.
O terceiro problema, conforme proposto em Kennedy & Chua (1988), visa
confirmar a aplicabilidade da rede proposta quando todas as restrições
associadas ao mesmo são do tipo linear, ou seja:
A Figura_7 apresenta a evolução dos valores dos elementos do vetor de saída da
rede em relação ao número de iterações. Após a convergência da rede, o vetor
solução obtido é dado por v = [0,3398 0,3301]T, com Eot(v) = 0,2456. Estes
resultados são bem próximos aos valores da solução exata fornecida por v* =
[0,3395 0,3302]T, com função objetivo Eot(v*) = 0,2455.
A Figura_8 apresenta o comportamento da função objetivo do problema em função
do número de iterações. Neste caso, a rede foi iniciada com valores aleatórios,
uniformemente distribuídos, entre zero e um.
Estes resultados mostram a aplicação efetiva da rede de Hopfield modificada
para resolver problemas de otimização não-linear. A rede foi também simulada
considerando diversos valores iniciais atribuídos ao vetor de saída v. Para
todas as simulações, a rede sempre convergiu para as mesmas soluções.
Embora o número de iterações seja elevado o tempo gasto para a obtenção das
soluções tem sido bastante curto. Em relação a este aspecto vale ressaltar que
embora tenhamos utilizado computadores seqüenciais em nossas simulações, o
desempenho da rede alcançará eficiência máxima quando a mesma for executada em
computadores com processadores operando em paralelo, pois neste caso cada
unidade de processamento corresponderia a uma unidade neural.
Outro aspecto relevante diz respeito à qualidade das soluções obtidas pela
rede. Embora os valores das soluções apresentem alguns desvios em relação aos
valores ótimos, observa-se que os mesmos são menores quando comparados com
outras abordagens neurais utilizadas nesses tipos de problemas.
É também motivo de registro que alguns testes realizados com problemas de
dimensões maiores, tendo cerca de 800 restrições de desigualdade, mostraram que
a rede pode tornar-se lenta em sua procura pelos pontos de equilíbrio que
representam a solução do sistema. Este comportamento deve-se ao fato de
estarmos realizando toda a simulação em computadores seqüenciais. A utilização
de máquinas com processadores em paralelo, conforme mencionado anteriormente,
pode contornar esta situação.
Finalmente, o mapeamento de problemas de otimização não-linear restrita através
da rede de Hopfield modificada apresenta algumas particularidades em relação
aos métodos primais (Bazaraa & Shetty, 1979) que são também utilizados na
solução destes problemas, podendo se destacar as seguintes: i) a não
necessidade do cálculo do conjunto ativo de restrições em cada iteração; ii) o
vetor de inicialização da rede (solução inicial) não precisa pertencer ao
conjunto factível definido pelas restrições; iii) não necessidade de obtenção,
em cada iteração, de uma direção admissível de busca; e iv) mecanismo de busca
independe da utilização de multiplicadores de Lagrange.
6. Conclusões
Neste artigo, uma rede de Hopfield modificada foi desenvolvida para resolver
problemas de otimização não-linear restrita. Os resultados de simulação
mostraram que a rede proposta fornece resultados expressivos, tornando assim um
método alternativo para resolver estes problemas eficientemente. Os parâmetros
internos da rede foram obtidos utilizando conceitos relativos às teorias de
otimização não-linear e de estabilidade de Lyapunov. Todas as restrições
associadas ao problema são mapeadas através do subespaço-válido de soluções.
O mapeamento de problemas de otimização não-linear restrita através da rede de
Hopfield modificada além de fornecer um novo método para resolver estes
problemas, não requer a definição (ajuste) de nenhum parâmetro de penalidade ou
ponderação.