Otimização/Método de gradientes conjugados

Predefinição:Wikipedia

Algumas considerações históricas

Este método foi originalmente proposto por Hestenes e Stiefel, em 1952.
Seu objetivo inicial foi a resolução de problemas quadráticos sem restrições, mas logo o mesmo foi estendido para casos mais gerais.

O método

Este método pode ser considerado sob dois pontos de vista:

Como um método de descida, com busca linear exata;
Como um método de resolução de sistema linear, baseado em um processo de ortogonalização.

Predefinição:Definição

Exemplos de conjuntos convexos e côncavos

Este é um conjunto convexo, pois todo segmento com extremidades no conjunto está totalmente contido no conjunto.
Este é um conjunto côncavo, pois existe um segmento com extremidades no conjunto que não está totalmente contido no conjunto.

Predefinição:Definição

Predefinição:Exercício Predefinição:Resolução

Nota: Uma matriz é definida positiva se, e somente se, todos os seus autovalores são positivos.

Tem-se:

\nabla f : ℝ^{n} \mapsto ℝ

\nabla^{2} f : ℝ^{n} \mapsto (ℝ^{n})^{2}

Sendo $f (x) = \frac{1}{2} x^{⊤} A x + a^{⊤} x + α$ , segue em particular que $\nabla f = A x + a$ e $\nabla^{2} f = A = P^{⊤} Λ P$ , onde $Λ$ é uma matriz diagonal cujos elementos da diagonal são os autovalores de $A$ e $P$ é uma matriz onde as colunas são os autovetores correspondentes aos autovalores.

Note que $A$ é uma matriz simétrica, pois é a matriz Hessiana de uma função com segundas derivadas parciais contínuas, e consequentemente vale $\frac{\partial^{2} f}{\partial x \partial y} = \frac{\partial^{2} f}{\partial y \partial x}$ .

Para introduzir o método de direções conjugadas, serão consideradas somente funções quadráticas.

Uma condição necessária de primeira ordem para que $x$ seja um ponto de mínimo para a função $f$ é que $\nabla f (x) = 0$ . Para o presente caso, a função $f$ é convexa, então, a condição necessária $\nabla f (x) = 0$ também é suficiente.

Predefinição:Exercício Predefinição:Resolução

No caso de uma função quadrática, tem-se $\nabla f (x) = 0 \Leftrightarrow A x + a = 0$ , ou seja, $x$ é solução do sistema linear $A x = - a$ .

A resolução de um sistema linear nem sempre pode ser feita numericamente de forma eficiente. Por exemplo, se a matriz do sistema é:

A = [\begin{matrix} 1 0^{- 20} & 1 \\ 1 & 1 0^{20} + 1 \end{matrix}]

A solução do sistema linear corresponde à interseção entre duas retas quase paralelas, e os erros de truncamento podem causar imprecisão na solução obtida computacionalmente.

Analiticamente, o sistema $A x = - a$ tem $x = - A^{- 1} a$ como solução. Então alguém poderia se perguntar: qual o problema em resolver esse sistema linear, se basta calcular a inversa da matriz $A$ e multiplicar pelo vetor $- a$ ? A resposta é que o calculo da inversa de uma matriz em geral é impraticável computacionalmente, por ter custo muito alto. Por isso, nas situações práticas, onde as matrizes tem ordem bem maior do que 2 (digamos 1000), o cálculo de matrizes inversas não é uma opção.

Assim, com o intuito de desenvolver um método computacional para o cálculo de minimizadores, é preciso utilizar outras técnicas. Considere o seguinte:

Em um método de descida tem-se sempre uma sequencia ${x_{k}, t_{k}, d_{k}} \in ℕ$ , com $x_{k + 1} = x_{k} + t_{k} d_{k}$ e $t_{k}$ é um minimizador de $f (x_{k} + t d_{k}) : t \in ℝ$

\nabla f (x) = A x + a

e

0 = \nabla f (x_{k + 1}) = A x_{k + 1} + a = A (x_{k} + t_{k} d_{k}) + a = A x_{k} + t_{k} A d_{k} + a

Logo, $t_{k} A d_{k} = - (A x_{k} + a)$ e multiplicando por $d_{k}^{⊤}$ obtem-se $t_{k} d_{k}^{⊤} A d_{k} = - (d_{k}^{⊤} A x_{k} + d_{k}^{⊤} a)$ . Consequentemente, o valor de $t_{k}$ é dado por

t_{k} = \frac{- (d_{k}^{⊤} A x_{k} + a^{⊤} d_{k})}{d_{k}^{⊤} A d_{k}}

Deste modo, o método consistirá de escolher em cada etapa $k$ uma direção $d_{k}$ , e calcular o coeficiente $t_{k}$ pela fórmula anterior, para gerar o próximo ponto $x_{k + 1}$ . Mas como escolher a direção $d_{k}$ ?

Dado $x_{k}$ e escolhido $d_{k}$ , defina $θ : R \mapsto ℝ$ como $θ (t) = f (x_{k} + t d_{k})$ , ou seja, $θ$ é a restrição da função $f$ à reta que passa pelo ponto $x_{k}$ e que tem direção $d_{k}$ . Logo, derivando a expressão de $θ$ em relação a $t$ , obtem-se

θ^{'} (t) = \nabla f (x_{k} + t d_{k})^{⊤} d_{k}

Então, no ponto de mínimo, $x_{k + 1}$ , tem-se

0 = \nabla f (x_{k + 1})^{⊤} d_{k}

Ou seja, a direção $d_{k}$ a ser seguida a partir do ponto $x_{k}$ é ortogonal ao gradiente da função $f$ , no ponto $x_{k + 1}$ .

Esquema do método de descida

x_{k + 1} = x_{k} + t_{k} d_{k} = (x_{k - 1} + t_{k - 1} d_{k - 1}) + t_{k} d_{k} = \dots = x_{1} + t_{1} d_{1} + \dots + t_{k} d_{k} = x_{1} + \sum_{i = 1}^{k} t_{i} d_{i}

Seja $\bar{x}$ o minimizador da função $f$ . Tem-se

x_{k + 1} - \bar{x} = x_{1} - \bar{x} + \sum_{i = 1}^{k} t_{i} d_{i}

Mas $0 = \nabla f (\bar{x}) = A \bar{x} + a$ implica que $a = - A \bar{x}$ , logo

\nabla f (x) = A x + a = A x - A \bar{x} = A (x - \bar{x})

e consequentemente

A (x_{k + 1} - \bar{x}) = A (x_{1} - \bar{x}) + \sum_{i = 1}^{k} t_{i} A d_{i}

Donde $\nabla f (x_{k + 1}) = \nabla f (x_{1}) + \sum_{i = 1}^{k} t_{i} A d_{i}$ . Portanto $0 = \nabla f (x_{k + 1})^{⊤} d_{k} = \nabla f (x_{1})^{⊤} d_{k} + \sum_{i = 1}^{k} t_{i} d_{i}^{⊤} A d_{k}$ .

Predefinição:Exercício Predefinição:Resolução

Usando o resultado desse exercício, tem-se ainda que $0 = \nabla f (x_{k + 1})^{⊤} d_{k} = \nabla f (x_{1})^{⊤} d_{k} + \sum_{i = 1}^{k} t_{i} (B d_{i})^{⊤} (B d_{k})$

Fazendo $δ = B d$ , o método do gradiente conjugado escolhe as direções de descida tais que $δ_{i}^{⊤} d_{j} = 0, \forall i = j$ . Mas quando $i = j$ , tem-se na expressão apresentada anteriormente apenas $0 = \nabla f (x_{1})^{⊤} d_{k} + t_{k} (B d_{k})^{⊤} (B d_{k}) = \nabla f (x_{1})^{⊤} d_{k} + t_{k} d_{k} A d_{k}$

Finalmente, tem-se o algoritmo para este método.

Algoritmo de Hestenes-Stiefel

Primeiro passo: Escolha  $x_{0} \in ℝ^{n}$ 
  Se  $\nabla f (x_{0}) = 0$ , então pare:  $\bar{x} = x_{0}$ 
  Senão:  $d_{0} = - \nabla f (x_{0}) = - A x_{0} - a$ 
  Calcular  $t_{0} = \frac{‖ \nabla f (x_{0}) ‖^{2}}{d_{0}^{⊤} A d_{0}}$ 
   $x_{1} = x_{0} + t_{0} d_{0}$ 


Passo iterativo  $k$ : Dado  $x_{k} \in ℝ^{n}$ 
  Se  $\nabla f (x_{k}) = 0$ , então pare:  $\bar{x} = x_{k}$ 
  Senão:  $d_{k} = - \nabla f (x_{k}) + \frac{\nabla f (x_{k})^{⊤} A d_{k}}{d_{k}^{⊤} A d_{k}} d_{k}$ 
   $t_{k} = \frac{‖ \nabla^{2} f (x_{k}) ‖^{2}}{d_{k}^{⊤} A d_{k}}$ 
   $x_{k + 1} = x_{k} + t_{k} d_{k}$

Pode-se verificar facilmente que $d_{k + 1} ⊥ d_{k}$ . De fato, como $d_{k + 1} = - \nabla f (x_{k + 1}) + \frac{\nabla f (x_{k + 1})^{⊤} A d_{k}}{d_{k}^{⊤} A d_{k}} d_{k}$ , tem-se $A d_{k + 1} = - A \nabla f (x_{k + 1}) + \frac{\nabla f (x_{k + 1})^{⊤} A d_{k}}{d_{k}^{⊤} A d_{k}} A d_{k}$ . Logo, $d_{k}^{⊤} A d_{k + 1} = - \nabla f (x_{k + 1})^{⊤} A d_{k} + \frac{\nabla f (x_{k + 1})^{⊤} A d_{k}}{d_{k}^{⊤} A d_{k}} d_{k}^{⊤} A d_{k} = - \nabla f (x_{k + 1})^{⊤} A d_{k} + \nabla f (x_{k + 1})^{⊤} A d_{k} = 0$ .

Predefinição:Exercício Predefinição:Resolução

Exemplos

Considere $f : ℝ^{2} \mapsto ℝ$ definida por $f (x, y) = \frac{1}{2} (x^{2} + y^{2}) = \frac{1}{2} [\begin{matrix} x & y \end{matrix}] [\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}] [\begin{matrix} x \\ y \end{matrix}]$ . Em outros termos, tomando $u = [\begin{matrix} x \\ y \end{matrix}]$ , tem-se $f (u) = \frac{1}{2} u^{⊤} A u$ , onde $A = [\begin{matrix} 1 & 0 \\ 0 & 1 \end{matrix}] = I_{2 \times 2}$ .

Pode-se aplicar o método de direções conjugadas ao seguinte problema

(P) {\begin{matrix} m i n f (u) \\ u \in ℝ^{2} \end{matrix}

Note, desde já, que o conjunto solução é $S = {[\begin{matrix} 0 \\ 0 \end{matrix}]}$ .

Inicio

Toma-se $x_{0}$ arbitrário, por exemplo, $x_{0} = [\begin{matrix} 2 \\ 1 \end{matrix}]$ .
Avalia-se o gradiente da função $f$ neste ponto inicial: $\nabla f (x_{0}) = A x_{0} = I_{2 \times 2} x_{0} = x_{0}$

Iteração 1

$d_{0} = - \nabla f (x_{0}) = [\begin{matrix} - 2 \\ - 1 \end{matrix}]$
$t_{0} = \frac{‖ \nabla f (x_{0}) ‖^{2}}{d_{0}^{⊤} A d_{0}} = \frac{5}{5} = 1$
$x_{1} = x_{0} + t_{0} d_{0} = [\begin{matrix} 2 \\ 1 \end{matrix}] + 1 [\begin{matrix} - 2 \\ - 1 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]$

A seguir, verifica-se se o gradiente se anula no novo ponto $x_{1}$ :

$\nabla f (x_{1}) = A [\begin{matrix} 0 \\ 0 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]$

Como o gradiente já é nulo, não é preciso fazer a segunda iteração, e o ponto $x_{1}$ é o (único) minimizador global de $f$ .

Em um caso mais geral, considerando $f : ℝ^{2} \mapsto ℝ$ definida por $f (x, y) = \frac{λ}{2} (x^{2} + y^{2}) = \frac{1}{2} [\begin{matrix} x & y \end{matrix}] [\begin{matrix} λ & 0 \\ 0 & λ \end{matrix}] [\begin{matrix} x \\ y \end{matrix}]$ , tem-se cálculos muito parecidos em cada passo.

O conjunto solução continua sendo $S = {[\begin{matrix} 0 \\ 0 \end{matrix}]}$ .

Inicio

Considere $x_{0}$ como no primeiro exemplo, ou seja, $x_{0} = [\begin{matrix} 2 \\ 1 \end{matrix}]$ .
Avalia-se o gradiente da função $f$ neste ponto inicial: $\nabla f (x_{0}) = A x_{0} = λ x_{0}$

Iteração 1

$d_{0} = - \nabla f (x_{0}) = λ [\begin{matrix} - 2 \\ - 1 \end{matrix}]$
$t_{0} = \frac{‖ \nabla f (x_{0}) ‖^{2}}{d_{0}^{⊤} A d_{0}} = \frac{5 λ^{2}}{5 λ^{3}} = \frac{1}{λ}$
$x_{1} = x_{0} + \frac{1}{λ} λ d_{0} = [\begin{matrix} 2 λ \\ λ \end{matrix}] + 1 [\begin{matrix} - 2 λ \\ - λ \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]$

A seguir, verifica-se se o gradiente se anula no novo ponto $x_{1}$ :

$\nabla f (x_{1}) = A [\begin{matrix} 0 \\ 0 \end{matrix}] = λ [\begin{matrix} 0 \\ 0 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]$

Novamente, o gradiente se anula já na primeira iteração, de modo que $x_{1}$ é o minimizador global de $f$ .

Predefinição:Exercício

Um terceiro exemplo pode ser dado tomando $A = [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}]$ e $f : ℝ^{2} \mapsto ℝ$ definida por $f (u) = \frac{1}{2} u^{⊤} A u$ . Observe que tal matriz é simétrica e definida positiva:

\det (A - λ I) = (2 - λ) (3 - λ) - 1 = λ^{2} - 4 λ - 3 = (λ - 3) (λ - 1)

Logo, os autovalores de $A$ são $λ = 1$ e $λ = 3$ . Isso também implica que a função é fortemente convexa.

Aplicando o método:

Início

Toma-se um ponto arbitrário no plano, por exemplo $x_{0} = [\begin{matrix} 10 \\ 20 \end{matrix}]$ ;
Verifica-se se tal ponto é o minimizador global, avaliando nele o gradiente da função:

\nabla f (x_{0}) = [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 10 \\ 20 \end{matrix}] = [\begin{matrix} 0 \\ 30 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]

.

Já que o gradiente não se anulou no chute inicial, é preciso escolher uma direção e um comprimento de passo para determinar a próxima aproximação:

Iteração 1: $d_{0} = - \nabla f (x_{0}) = [\begin{matrix} 0 \\ - 30 \end{matrix}]$; $t_{0} = \frac{‖ [\begin{matrix} 0 & 30 \end{matrix}] ‖^{2}}{[\begin{matrix} 0 & - 30 \end{matrix}] [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 0 \\ - 30 \end{matrix}]} = \frac{900}{[\begin{matrix} 0 & - 30 \end{matrix}] [\begin{matrix} - 30 \\ - 60 \end{matrix}]} = \frac{900}{1800} = \frac{1}{2}$

Feitos esses cálculos, o próximo ponto é dado por

x_{1} = x_{0} + t_{0} d_{0} = [\begin{matrix} 10 \\ 20 \end{matrix}] + \frac{1}{2} [\begin{matrix} 0 \\ - 30 \end{matrix}] = [\begin{matrix} 10 \\ 20 \end{matrix}] + [\begin{matrix} 0 \\ - 15 \end{matrix}] = [\begin{matrix} 10 \\ 5 \end{matrix}]

Para saber se será necessária uma nova iteração, ou se o minimizador foi encontrado, calcula-se o gradiente da função no ponto:

\nabla f (x_{1}) = [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 10 \\ 5 \end{matrix}] = [\begin{matrix} 15 \\ 0 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]

.

Novamente, será preciso calcular uma nova direção e um novo comprimento de passo:

Iteração 2: $d_{0} = [\begin{matrix} - 15 \\ 0 \end{matrix}] + β [\begin{matrix} 0 \\ - 30 \end{matrix}] = [\begin{matrix} - 15 \\ - 30 β \end{matrix}]$

onde $β$ , no algoritmo de Hestenes é dado por:

β = \frac{[\begin{matrix} 15 & 0 \end{matrix}] [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 0 \\ - 30 \end{matrix}]}{[\begin{matrix} 0 & - 30 \end{matrix}] [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 0 \\ - 30 \end{matrix}]} = \frac{[\begin{matrix} 15 & 0 \end{matrix}] [\begin{matrix} 30 \\ - 60 \end{matrix}]}{[\begin{matrix} 0 & - 30 \end{matrix}] [\begin{matrix} 30 \\ - 60 \end{matrix}]} = \frac{15 \times 30}{(- 30) \times (- 60)} = \frac{1}{4}

Portanto

d_{0} = - 15 [\begin{matrix} 1 \\ 1 / 2 \end{matrix}]

Além disso, o tamanho do passo é dado por

t_{1} = \frac{‖ \nabla f (x_{1}) ‖^{2}}{d_{0}^{⊤} A d_{0}} = \frac{1 5^{2}}{1 5^{2} [\begin{matrix} 1 & 1 / 2 \end{matrix}] [\begin{matrix} 2 & - 1 \\ - 1 & 2 \end{matrix}] [\begin{matrix} 1 \\ 1 / 2 \end{matrix}]} = \frac{1}{[\begin{matrix} 1 & 1 / 2 \end{matrix}] [\begin{matrix} 3 / 2 \\ 0 \end{matrix}]} = \frac{1}{3 / 2} = \frac{2}{3}

Portanto

x_{2} = x_{1} + t_{1} d_{1} = [\begin{matrix} 10 \\ 5 \end{matrix}] - 15 \frac{2}{3} [\begin{matrix} 1 \\ 1 / 2 \end{matrix}] = [\begin{matrix} 10 \\ 5 \end{matrix}] - 10 [\begin{matrix} 1 \\ 1 / 2 \end{matrix}] = [\begin{matrix} 0 \\ 0 \end{matrix}]

Obviamente, este é o minimizador procurado (pois o método tem a propriedade de convergência quadrática, ou seja utiliza no máximo $n$ iterações para chegar a solução quando aplicado a funções quadráticas definidas em $ℝ^{n}$ )

Predefinição:Exercício

Implementação em Scilab

Abaixo é apresentada uma implementação deste algoritmo na linguagem de programação utilizada pelo Scilab.

A = [2 1; 1 2];

function [x] = min_gradiente_conjugado(xk)
  //Entrada: xk em R^n, qualquer "chute inicial"
  //  Saída: x, o ponto em que f assume o valor mínimo
  
  k        = 0        //Indica quantos loops já foram feitos
  epsilon  = 0.01
  n        = size(xk,1)
  g        = df(xk)
  seq      = zeros(n,n+1)
  seq(:,1) = xk
  while (norm(g) > epsilon) & (k <= n)
    if (k == 0)
      d = -g
    else
      d = Hestenes(g,d,A)
    end
    t  = busca_linear(g,d,A)
    xk = xk + t*d
    k  = k+1
    seq(:,k+1) = xk
    g  = df(xk)
  end
  plot(seq(1,:),seq(2,:))
  x = xk  
endfunction


function [fu] = f(u)
  fu=(1/2)*(u'*A*u)
endfunction


function [grf] = df(u)
  grf = A*u
endfunction


function [d] = Hestenes(g,d,A)
  d=-g + ((g'*A*d)/(d'*A*d))*d
endfunction


function [t] = busca_linear(g,d,A)
  t=(g'*g)/(d'*A*d)
endfunction

Para facilitar a compreensão do método, pode ser útil exibir as curvas de nível da função. Uma forma de implementar uma função com esse propósito é a seguinte:

function plotar_curvas
  qtd=101
  tam=max(seq)
  x=linspace(-tam,tam,qtd)
  y=x
  z=zeros(qtd,qtd)
  for i=1:qtd
    for j=1:qtd
      z(i,j)=f([x(i);y(j)])
    end
  end
  contour2d(x,y,z,10)
  a=gca();
  a.x_location = "middle"; 
  a.y_location = "middle"; 
endfunction

Algoritmo de Fletcher-Reeves

Predefinição:Tarefa

Esta versão é na verdade uma extensão do algoritmo anterior, permitindo a aplicação no caso de funções que não são quadráticas.

Primeiro passo: Escolha  $x_{0} \in ℝ^{n}$ 
 Se  $\nabla f (x_{0}) = 0$ , então pare:  $\bar{x} = x_{0}$ 
 Senão:  $d_{0} = - \nabla f (x_{0})$  (como em todo método de descida)
 Calcular  $t_{0}$ , através de uma busca linear
  $x_{1} = x_{0} + t_{0} d_{0}$ 
Passo iterativo:
 Se  $\nabla f (x_{k}) = 0$ , então pare:  $\bar{x} = x_{k}$ 
 Senão:  $d_{k} = - \nabla f (x_{k}) + \frac{‖ \nabla f (x_{k}) ‖^{2}}{‖ \nabla f (x_{k - 1}) ‖^{2}} d_{k - 1}$ 
 Calcular  $t_{k}$ , através de uma busca linear
  $x_{k + 1} = x_{k} + t_{k} d_{k}$ 
  $k = k + 1$

Predefinição:Tarefa

Algoritmo de Polak-Ribière

Predefinição:Tarefa

Uma outra versão é a seguinte:

Primeiro passo: Tomar  $x_{0} \in ℝ^{n}$ 
 Se  $\nabla f (x_{0}) = 0$ , então pare:  $\bar{x} = x_{0}$ 
 Senão:  $d_{0} = - \nabla f (x_{0})$  (como em todo método de descida)
 Calcular  $t_{0}$ , através de uma busca linear
  $x_{1} = x_{0} + t_{0} d_{0}$ 
  $k = 1$ 
Passo iterativo:
 Se  $\nabla f (x_{k}) = 0$ , então pare:  $\bar{x} = x_{k}$ 
 Senão:  $d_{k} = - \nabla f (x_{k}) + \frac{\nabla f (x_{k})^{⊤} (\nabla f (x_{k}) - \nabla f (x_{k - 1}))}{‖ \nabla f (x_{k - 1}) ‖^{2}} d_{k - 1}$ 
 Calcular  $t_{k}$ , através de uma busca linear
  $x_{k + 1} = x_{k} + t_{k} d_{k}$ 
  $k = k + 1$

Predefinição:Tarefa

Predefinição:Exercício Predefinição:Exercício

Algoritmo auxiliar

Para o caso de funções não quadráticas, é preciso usar algum método de busca linear para a implementação do método dos gradientes conjugados, seja a versão de Fletcher-Reeves ou a de Polak-Ribière. Uma possibilidade é a busca de linear de Armijo (ver Izmailov & Solodov (2007), vol 2, pag. 65), cujo algoritmo é esboçado a seguir:

function busca_linear_Armijo (f, theta, alpha, delta, t0)
  while (alpha * pred > ared)
    t = d * t
  end
endfunction

com:

$p r e d = - t θ$
$θ (t) = f (x + t d)$
$θ^{'} (t) = \nabla f (x + t d)^{⊤} d$

Predefinição:Tarefa

Predefinição:AutoCat

Otimização/Método de gradientes conjugados

Índice

Algumas considerações históricas

O método

Exemplos de conjuntos convexos e côncavos

Esquema do método de descida

Algoritmo de Hestenes-Stiefel

Exemplos

Implementação em Scilab

Algoritmo de Fletcher-Reeves

Algoritmo de Polak-Ribière

Algoritmo auxiliar

Menu de navegação

Otimização/Método de gradientes conjugados

Algumas considerações históricas

O método

Exemplos de conjuntos convexos e côncavos

Esquema do método de descida

Algoritmo de Hestenes-Stiefel

Exemplos

Implementação em Scilab

Algoritmo de Fletcher-Reeves

Algoritmo de Polak-Ribière

Algoritmo auxiliar

Menu de navegação

Pesquisa