Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Introduccion A La Optimizacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 143

INSTITUTO POLITECNICO NACIONAL

ESCUELA SUPERIOR DE INGENIERÍA QUÍMICA E INDUSTRIAS EXTRACTIVAS

REPORTE FINAL DE SEMESTRE SABATICO

APUNTES PARA EL CURSO


OPTIMIZACIÓN Y SIMULACIÓN DE PROCESOS

Dr. Enrique Arce Medina

Febrero de 2018
Contenido

Capítulo 1. Aplicaciones del Cálculo para la Optimización Matemática

Capítulo 2. Modelación Matemática

Capítulo 3. Optimización de Funciones no Lineales con Restricciones

Capítulo 4. Optimización de Funciones no Lineales Univariables

Capítulo 5. Optimización de Funciones no Lineales Multivariables

Capítulo 6. Programación Geométrica

Capítulo 7. Programación Lineal

Capítulo 8. Simulación de Procesos

2
INTRODUCCIÓN.

El presente reporte es parte de las actividades de semestre sabático propuestas por el Dr. Enrique
Arce Medina y aprobadas por la Academia de Procesos de la Escuela Superior de Ingeniería
Química. Se presentan los apuntes de acuerdo al programa de la Unidad de Aprendizaje
Optimización y simulación de Procesos.

Para la elaboración de los apuntes se sigue el orden de los temas del programa de la Unidad de
Aprendizaje haciendo algunos cambios en el orden de la presentación de los temas para darle un
orden más lógico y congruente con el desarrollo de las herramientas matemáticas de la teoría de
la optimización matemática. Además se incluyen temas que no están descritos en el programa de
estudio.

En el capítulo 1 se tratan los temas introductorios a la optimización, que cubre en gran parte los
temas de la Unidad Temática I del programa de estudios: temas 1.1, 1.2. Y se describe el tema 2.1
de la Unidad Temática II. Los temas 1.3 y 1.5 se tratan en el capítulo 2, mientras que el tema 1.4 se
trata en el capítulo 8. Cabe hacer la aclaración que el tema 1.4 que se relaciona con el desarrollo
de modelos para la simulación de procesos se trata en estos apuntes en el capítulo 8, pero en el
desarrollo de los temas en el aula si sigue el orden de los temas de la unidad temática I.

En el Capítulo 2 como ya se mencionó se tratan los temas 1.3 y 1.5 de la unidad temática I.

En el capítulo 3 se tratan los temas 2.2 y 2.3 de la Unidad temática II. El tema 2.3.1 (Programación
Lineal), de la unidad temática II se trata en el Capítulo 7.

En los capítulos 4 y 5 se tratan los temas de optimización de funciones no lineales univariables y


multivariables con algoritmos de aproximación numérica. Temas que no están incluidos en el
programa de la Unidad de Aprendizaje pero que son fundamentales de la teoría de la
optimización.

El capítulo 6 cubre el tema de Programación Geométrica.

Se incluyen suficientes problemas al final de cada capítulo con las respuestas.

3
CAPITULO 1
Conceptos Básicos

La optimización matemática tiene un pasado que se remonta a casi dos ciclos,


con la aplicación del cálculo. En muchos problemas de optimización no es fácil
encontrar la solución a las derivadas del gradiente de la función objetivo, por lo
que tendrán que usarse técnicas de aproximación numérica. Las raíces de las
derivadas de la función igualadas a cero pueden tener varias raíces, que
conducen a varios máximos o mínimos. Para la caracterización de las raíces en
máximos, mínimos o puntos de inflexión se usa la segunda derivada. En este
capítulo se presentan los conceptos básicos de la teoría de la optimización
matemática: la función objetivo, las variables de decisión y las restricciones. Se
definen las condiciones de optimalidad para funciones univariables y
multivariables. Se describe la forma en que se usa la Hessiana y los valores
propios para caracterizar las funciones como cóncavas o convexas. Se presentan
ejemplos de aplicaciones a problemas de ingeniería y se describe el uso de la
calculadora TI-nspire como ayuda en la resolución gráfica y numérica de los
problemas de optimización.

4
Aplicaciones del cálculo para la optimización matemática.

El concepto de optimización va siempre asociado a la idea de mejoramiento, como obtener más con menos. Ese menos
se refiere a cosas que se pueden modificar, variables interrelacionadas, que usadas en la cantidad adecuada (óptima)
conducen a la obtención de algo que mejora y que depende de las variables, es decir ese algo es una función. La función
suele expresarse matemáticamente como un modelo que interrelaciona a las variables. Optimizar implica buscar los
valores de las variables que hacen que la función alcance un máximo o un mínimo. Por ejemplo la determinación de las
dimensiones óptimas de una caja rectangular sin tapa, la altura (H), ancho (W) y largo (L), que definan el costo (C)
mínimo para contener un volumen determinado. El proceso de optimización usa técnicas numéricas o algoritmos cuyos
cálculos se pueden efectuar a mano o con la ayuda de una computadora o una calculadora programable. Diferentes
tipos de modelos matemáticos requieren diferentes algoritmos de optimización. En este texto se utilizan y describen los
tres métodos de cálculo.

Las técnicas de optimización matemática encuentran múltiples aplicaciones en los procesos químicos, por
ejemplo, para encontrar la eficiencia máxima de operación, para determinar las condiciones de operación que
maximicen las ganancias, para reducir los costos de producción, o establecer las dimensiones de los equipos que
minimicen los costos etc. Hay muchos campos donde la optimización encuentra múltiples aplicaciones, como en el
diseño. Considerando al diseño como la propuesta del arreglo de cosas, para que cumplir con ciertas especificaciones, el
diseño óptimo es la propuesta del mejor diseño.

Los métodos de optimización tratan con la determinación de los valores de las variables de los procesos o
diseños para que el desempeño del proceso o el diseño sea el óptimo, es decir el mejor, maximizando o minimizando el
resultado.

Matemáticamente se indica como: Optimizar f(x, p)


Donde f define el desempeño de lo que se está optimizando, se denomina función objetivo.
x es un conjunto de variables independientes denominadas variables de decisión y
P es un conjunto de especificaciones o parámetros fijos.
El problema de optimización puede contener especificaciones en las variables que limitan los posibles valores de
la función objetivo, estas limitaciones se conocen como restricciones del problema. Además se pueden tener varios
mínimos o máximos que optimizan la función objetivo.

𝑓𝑓(𝑥𝑥 ∗ ) Será el mínimo si se tiene para cualquier 𝑥𝑥 < 𝑥𝑥 ∗ o 𝑥𝑥 > 𝑥𝑥 ∗ y el valor de la función en 𝑥𝑥 ∗ es 𝑓𝑓(𝑥𝑥 ∗ ) < 𝑓𝑓(𝑥𝑥).

Este mínimo será óptimo local si es la mejor solución entre las cercanas, en cambio un óptimo global es la mejor
solución de las posibles. El punto en el que se cumple que 𝑥𝑥 = 𝑥𝑥 ∗ se denomina punto extremo, también conocido como
punto crítico o estacionario.

La determinación de la función objetivo que representa el modelo del problema es una parte fundamental de la
formulación del problema de optimización, los siguientes ejemplos ilustran ejemplos de formulación de modelos.

Ejemplo 1.1 Se requiere determinar el espesor del aislante de una tubería que minimice los costos. El costo del aislante
en tuberías depende tanto del valor del aislante (costo fijo, 𝑪𝑪𝒇𝒇 ) como de los costos causados por pérdida de calor (costos
variables, 𝑪𝑪𝒗𝒗 ) de acuerdo a las siguientes ecuaciones:

5
𝑪𝑪𝒇𝒇 (𝑥𝑥) = 80𝑥𝑥 + 396
𝑪𝑪𝒗𝒗 (𝑥𝑥) = 3465/𝑥𝑥

Donde 𝑥𝑥 = espesor del aislante y los costos en $/(año*m de tubería)


El costo total es la función objetivo 𝐶𝐶𝑇𝑇 (𝑥𝑥) = 𝐶𝐶𝑓𝑓 (𝑥𝑥) + 𝐶𝐶𝑉𝑉 (𝑥𝑥) entonces el problema de optimización es encontrar el
espesor de aislante 𝑥𝑥 que:

Minimice 𝐶𝐶𝑇𝑇 (𝑥𝑥) = 80𝑥𝑥 + 396 + 3465/𝑥𝑥

Esta última expresión es el modelo del problema a optimizar, 𝐶𝐶𝑇𝑇 es la función objetivo que depende de la variable 𝑥𝑥.

Ejemplo 1.2

Una compañía fabrica dos tipos de productos, el tipo A y el tipo B. Una unidad de producto A se vende en $27 y requiere
materia prima por un costo de $10. El costo de mano de obra de cada producto A es de $14. Por otro lado, un producto
B se vende en $21 y requiere materia prima por un costo de $9. El costo de mano de obra de cada producto B es de $10.
La manufactura de los productos A y B requiere dos tipos de labor: carpintería y acabado. Cada producto A requiere 2
horas de acabado y 1 de carpintería, mientras que un producto B requiere 1 hora de acabado y 1 hora de carpintería.
Cada semana la compañía dispone de 100 horas para acabado y 80 horas para carpintería. Mientras que la demanda de
producto B es ilimitada, se estima que la compañía vende a lo más 40 productos A por semana. La compañía desea hacer
un plan de producción semanal que maximice la ganancia.
Los datos pueden concentrarse en una tabla como la siguiente:

Producto Precio ($) Costo de materia Costo de mano Tiempo requerido de Tiempo requerido
tipo prima ($) de obra ($) carpintería (h) de acabado (h)

A 27 10 14 1 2

B 21 9 10 1 1

Total de tiempo disponible a la semana 80 100

Se definen dos variables para el problema:


𝑥𝑥 = cantidad de productos A a producir por semana
𝑦𝑦 = cantidad de productos B a producir por semana
El objetivo es maximizar la ganancia que resulte de la venta de productos menos los costos:
Ganancia = Ventas – Costos
Dónde:
$ $
Ventas = Suma de cantidades vendidas por su precio= 27 ∗ 𝑥𝑥 + 21 ∗ 𝑦𝑦
𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝐴𝐴 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝐵𝐵
$ $
Costo de materia prima = 10 ∗ 𝑥𝑥 + 9 ∗ 𝑦𝑦
𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑎𝑎𝑑𝑑 𝑑𝑑𝑑𝑑 𝐴𝐴 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝐵𝐵
$ $
Costo de mano de obra = 14 ∗ 𝑥𝑥 + 10 ∗ 𝑦𝑦
𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝐴𝐴 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝐵𝐵

Entonces: Ganancia = 27𝑥𝑥 + 21𝑦𝑦 − [(10𝑥𝑥 + 9𝑦𝑦) + (14𝑥𝑥 + 10𝑦𝑦)] = 3𝑥𝑥 + 2𝑦𝑦
La disponibilidad de los recursos es:

6
ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑠𝑠 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
Horas de Acabado: 2 ∗ 𝑥𝑥 + 1 ∗ 𝑦𝑦 ≤ 100 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐴𝐴 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐵𝐵
ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
Horas de carpintería: 1 ∗ 𝑥𝑥 + 1 ∗ 𝑦𝑦 ≤ 80 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐴𝐴 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐵𝐵
Además las variables no pueden ser negativas, 𝑥𝑥 ≥ 0, 𝑦𝑦 ≥ 0

Matemáticamente se tiene:
Maximizar: 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 3𝑥𝑥 + 2𝑦𝑦
Sujeto a las restricciones: 2𝑥𝑥 + 𝑦𝑦 ≤ 100
𝑥𝑥 + 𝑦𝑦 ≤ 80
𝑥𝑥 ≤ 40
𝑥𝑥 ≥ 0, 𝑦𝑦 ≥ 0
En este modelo las restricciones son condiciones que acotan los posibles valores de las variables para no sobrepasar
ciertos límites. En otras palabras, las variables tienen un dominio restringido. La formulación de los problemas de
optimización trata con la modelación del problema en términos de la función objetivo, las variables y las restricciones.
Mientras que el proceso de optimización trata con la determinación de máximos o mínimos de la función objetivo que
satisfaga las restricciones.

1.1 Condiciones de optimalidad en funciones univariables

La condición necesaria para que 𝑓𝑓(𝑥𝑥) tenga un óptimo en 𝑥𝑥 = 𝑥𝑥 ∗ es que la derivada sea cero:
𝑑𝑑𝑑𝑑
=0
𝑑𝑑𝑑𝑑
Las coordenadas de las variables en 𝑥𝑥 ∗ definen un punto estacionario o punto extremo o crítico.
𝑑𝑑 2 𝑓𝑓 𝑑𝑑 2 𝑓𝑓
La condición para que 𝑓𝑓(𝑥𝑥) tenga un mínimo en 𝑥𝑥 = 𝑥𝑥 ∗ es > 0. Si < 0 entonces 𝑥𝑥 ∗ corresponde a un máximo.
𝑑𝑑𝑥𝑥 2 𝑑𝑑𝑥𝑥 2
Sin embargo, 𝑓𝑓′(𝑥𝑥) puede ser cero y no obstante en ese valor 𝑓𝑓(𝑥𝑥) puede no tener un punto extremo, por ser punto de
silla.

Ejemplo 1.3 Encontrar los puntos estacionarios de la función 𝑓𝑓(𝑥𝑥) = 𝑥𝑥 2 𝑒𝑒 −𝑥𝑥

Derivando una vez la función e igualando a cero se encuentran los puntos estacionarios.
𝑑𝑑𝑑𝑑
= 𝑥𝑥𝑒𝑒 −𝑥𝑥 (2 − 𝑥𝑥) = 0 Se obtienen dos raíces, 𝑥𝑥1 = 0 𝑦𝑦 𝑥𝑥2 = 2.
𝑑𝑑𝑑𝑑

𝑑𝑑 2 𝑓𝑓
Con la segunda derivada se obtiene: = 𝑥𝑥𝑒𝑒 −𝑥𝑥 (2 − 4𝑥𝑥 + 𝑥𝑥 2 )
𝑑𝑑𝑥𝑥 2

Con 𝑥𝑥1 = 0 se obtiene 𝑓𝑓"(𝑥𝑥1 ) = 2 > 0 (el punto crítico 𝑥𝑥1 corresponde a un mínimo)

Con 𝑥𝑥1 = 2 se obtiene 𝑓𝑓"(𝑥𝑥2 ) < 0 (se tiene un máximo)


𝑑𝑑
Con la calculadora TI nspire-CAS se obtienen los puntos críticos de la función usando 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠( (𝑥𝑥 2 𝑒𝑒 −𝑥𝑥 ) = 0, 𝑥𝑥) ver
𝑑𝑑𝑑𝑑
figura 1.1(a). La gráfica de la función se muestra en la Figura 1.1(b)

7
(a)
(b)

Figura 1.1 Puntos críticos de la función 𝑓𝑓(𝑥𝑥) = 𝑥𝑥 2 𝑒𝑒 −𝑥𝑥 y su gráfica.

Ejemplo 1.4 Determinar el espesor del aislante que minimice los costos del ejemplo 1.1

El costo total es la función objetivo 𝐶𝐶𝑇𝑇 (𝑥𝑥) = 80𝑥𝑥 + 396 + 3465/𝑥𝑥


𝑑𝑑𝐶𝐶𝑇𝑇 3465
Derivando la función objetivo, se tiene = 80 − = 0,
𝑑𝑑𝑑𝑑 𝑥𝑥 2

Se resuelve y se obtiene, x* = 6.58 cm. Entonces el costo óptimo es, CT = 1449 $/año

𝑑𝑑 2 𝐶𝐶𝑇𝑇 6930 𝑑𝑑 2 𝐶𝐶𝑇𝑇


Con la segunda derivada, = evaluada en x0 = 6.58 da = 24.33 > 0 por lo que es un mínimo
𝑑𝑑𝑥𝑥 2 𝑥𝑥 3 𝑑𝑑𝑥𝑥 2

En la Figura 1.2 se muestran las curvas de los costos fijos y variables así como el costo total y la ubicación del óptimo.

En la calculadora TI nspire abrir dos ventanas la primera con la calculadora y la segunda para trazar gráficos, usar la tecla
¿ para agregar una página. La Figura 1.2(a) muestra las instrucciones para definir los costos fijos, los variables y los
costos totales, 𝐶𝐶𝑇𝑇 , 𝐶𝐶𝑣𝑣 𝑦𝑦 𝐶𝐶𝑓𝑓 respectivamente, mientras que la Figura 1.2 (b) muestra las curvas de estos costos.

(a) (b)

Figura 1.2 (a) Definición de los términos del ejemplo 1.1.(b) Gráfica de la función 𝐶𝐶𝑇𝑇 (𝑥𝑥) = 𝐶𝐶𝑣𝑣 + 𝐶𝐶𝑓𝑓 .
8
En la línea de ingreso de la hoja para hacer la gráfica escribir 𝑓𝑓1 (𝑥𝑥) = 𝑐𝑐𝑐𝑐. Después ajustar las escalas de los ejes de la
gráfica oprimiendo b 41 Escribir en la ventana emergente: Xmin:-1.5; Xmax: 15, Ymin:-100 y Ymax:2000.
Después con /-G, agregar en la línea de ingreso las funciones 𝑓𝑓2 (𝑥𝑥) = 𝑐𝑐𝑐𝑐 y 𝑓𝑓3 (𝑥𝑥) = 𝑐𝑐𝑐𝑐.

Muchos problemas de optimización tratan con minimizar los costos como en el ejemplo 1.4 o maximizar las ganancias,
como el ejemplo 1.2.

Ejemplo 1.5 El precio de cierto producto depende de la cantidad producida q, 𝑃𝑃 = 42 − 2𝑞𝑞 y la ecuación de costo es
𝐶𝐶(𝑞𝑞) = 2𝑞𝑞 + 80

a) ¿A qué nivel de producción se maximiza la utilidad?


b) ¿A qué precio se maximiza la utilidad?
c) ¿Cuál es la utilidad máxima?

La función objetivo es la utilidad que es igual a los ingresos (I) menos los costos ( C), U = I – C
Los ingresos se determinan con el producto del precio de cada producto por la cantidad de productos, I = p*q

Entonces: U = (42 – 4q)q – (2q + 80) = 40q – 4q2 -80


𝑑𝑑𝑈𝑈 40 𝑑𝑑 2 𝑈𝑈
Derivando se obtiene, = −8𝑞𝑞 + 40 = 0 dando 𝑞𝑞 = = 5 este corresponde a un máximo porque = −8
𝑑𝑑𝑑𝑑 8 𝑑𝑑𝑞𝑞2
a) La utilidad máxima se obtiene cuando se producen 5 unidades
b) El precio de la unidad para la utilidad máxima es, p = 42 – 4q = 42 – 4*5 = $22
c) La utilidad máxima es, U = 40(5) – 4(5)2 – 80 200 – 4*25 -80 = $20

1.2 Condiciones de optimalidad en funciones multivariables

La condición necesaria para que f(x) tenga un mínimo en x=x* es


𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑
∇𝑓𝑓 = � = =⋯= � =0 Donde 𝑥𝑥 = [𝑥𝑥1 , 𝑥𝑥2 , … , 𝑥𝑥𝑛𝑛 ]
𝑑𝑑𝑥𝑥1 𝑑𝑑𝑥𝑥2 𝑑𝑑𝑥𝑥𝑛𝑛

La matriz de las segundas derivadas denominada Hessiana 𝐻𝐻 se usa determinar el carácter de posibles óptimos, es decir,
para probar máximos y mínimos de las funciones.

𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓
⎡ 2 …. ⎤
⎢ 𝜕𝜕𝑥𝑥 1 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥𝑛𝑛 ⎥
𝐻𝐻 = ⎢ … … …
2 ⎥
⎢ 𝜕𝜕 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 ⎥
….
⎣ 𝜕𝜕𝑥𝑥𝑛𝑛 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥𝑛𝑛 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥𝑛𝑛2 ⎦

𝐻𝐻 es una matriz definitivamente positiva si Di > 0, para i= 1, 2, .. n. donde Di son los determinantes menores de H

𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
𝐻𝐻11 𝐻𝐻12 … . 𝐻𝐻1𝑛𝑛
𝜕𝜕2 𝑓𝑓 𝜕𝜕𝑥𝑥12 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2
𝐷𝐷𝑖𝑖 = � … … … � Se tiene: 𝐷𝐷1 = , 𝐷𝐷2 = � 𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
� , etc.
𝜕𝜕𝑥𝑥12
𝐻𝐻𝑖𝑖1 𝐻𝐻𝑖𝑖2 … . 𝐻𝐻𝑖𝑖𝑖𝑖 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥22

Esto implica que las derivadas de segundo orden de la función evaluadas en un punto crítico deben ser positivas para
tener un mínimo relativo (local). Si los signos de los determinantes menores se alternan de negativo a positivo, entonces
la función tiene un máximo,
Si Di ≤ 0 para i = 1,3,5,… y además Di ≥ 0 , para i= 2,4,6,… se tendrá un máximo.
Cuando se tenga un cambio de signo entre determinantes contiguos, se tendrá un punto de inflexión o de silla.

9
En general la matriz A simétrica de nxn dimensiones es definida positiva, negativa, semi positiva definida o semi
negativa definida si y solo si sus valore propios, λ , calculados con det(𝐴𝐴 − λ𝐼𝐼) = 0 son positivos, negativos, no
negativos o no positivos, respectivamente. Así, los valores propios y los determinantes de la Hessiana se usan para
definir el carácter de los puntos críticos.

Ejemplo 1.6 En el siguiente diagrama del proceso de polimerización simplificado, Figura 1.3, determinar el flujo de
recirculación R y la presión de operación P que minimicen los costos de operación. Los costos de operación anual es la
$ 109
función objetivo de acuerdo a: 𝐶𝐶 � � = 1000(𝑃𝑃) + 4 ∗ + 2.5 ∗ 105 (𝑅𝑅)
𝑎𝑎ñ𝑜𝑜 𝑃𝑃𝑃𝑃

Reciclo
Purga

Reactor Destilador
Carga
fresca de
monómero Bomba Polímero

Figura 1.3 Diagrama del proceso del Ejemplo 1.6

𝜕𝜕𝜕𝜕 109 𝜕𝜕𝜕𝜕 109


Se obtienen las derivadas: = 1000 + 4 ∗ 𝑅𝑅𝑃𝑃2 = 0 y = 2.5 ∗ 105 − 4 ∗ 𝑃𝑃𝑅𝑅2 = 0
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕

106
De la primera ecuación se despeja 𝑅𝑅 de la derivada parcial con respecto a P se obtiene: 𝑅𝑅 = 4 ∗
𝑃𝑃2

Se sustituye en la segunda derivada con respecto a 𝑅𝑅 y se obtiene: 2.5 ∗ 105 = 0.00025𝑃𝑃3

De donde se obtiene: 𝑃𝑃 = 1000 y 𝑅𝑅 = 4 , dando C = 3*106 $/año.

Para probar si es el mínimo se calculan los determinantes menores de la matriz Hessiana.

𝜕𝜕2 𝐶𝐶 109 109 𝜕𝜕2 𝐶𝐶 109 109


= 8 ∗ 𝑃𝑃3 𝑅𝑅 = 8 ∗ 10003 ∗4 = 2 , = 8 ∗ 𝑅𝑅3 𝑃𝑃 = 8 ∗ 45 ∗1000 = 125,000
𝜕𝜕𝑃𝑃2 𝜕𝜕𝑅𝑅2

𝜕𝜕2 𝐶𝐶 109 109


, =4∗ =4∗ = 250
𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝑃𝑃2 𝑅𝑅2 10002 4 2

𝜕𝜕2 𝐶𝐶 𝜕𝜕2 𝐶𝐶
𝜕𝜕2 𝐶𝐶 109 𝜕𝜕𝑃𝑃2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 2 250
𝐷𝐷1 = = 8∗ = 2 > 0 , 𝐷𝐷2 = � � =� � = 2 ∗ 125,000 − 250 ∗ 250 = 187,500 > 0
𝜕𝜕𝑃𝑃2 10003 ∗4 𝜕𝜕2 𝐶𝐶 𝜕𝜕2 𝐶𝐶 250 125,000
𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑅𝑅 2

Ambos valores son positivos por lo que es definitivamente positiva y se trata de un mínimo.

Este ejemplo ilustra paso a paso los detalles de los cálculos de las derivadas y la solución de las ecuaciones resultantes,
esto parece innecesario a los ojos de los estudiantes quienes encuentran mucho más sencillo escribir las ecuaciones en
la calculadora y que la calculadora las resuelva. La razón para entender los detalles paso a paso en la resolución de los
problemas es la comprensión de los razonamientos en los cálculos, además de que se tiene una visión concreta de las
evaluaciones de las ecuaciones paso a paso. Para hallar los valores propios de una matriz solo deben igual a cero el
siguiente determinante |(𝐴𝐴 − λ𝐼𝐼)| = 0. En el Ejemplo 1.6 el determinante se calcula de la siguiente manera

2 250 𝜆𝜆 0 2 − 𝜆𝜆 250
�� �−� �� = � � = (2 − 𝜆𝜆) ∗ (125,000 − 𝜆𝜆) − 2502 =
250 125,000 0 𝜆𝜆 250 125,000 − 𝜆𝜆

= 𝜆𝜆2 − 125002𝜆𝜆 + 187500 = 0


10
La solución de esta ecuación resulta 𝜆𝜆 = 1.5 𝑦𝑦 125,001. Puesto que los dos son positivos se trata de un mínimo.

En la calculadora TI nspire se usan los comandos: Menú/7/B/4

Con Excel se usa el complemento Solver según la siguiente Figura y se obtienen los mismos resultados:

En la gráfica de una función de dos variables en el plano (x, y) se tendrá una gráfica de figuras concéntricas
(círculos en el caso de una función cuadrática) con centro en el punto crítico que representa a las curvas de nivel
correspondientes a los contornos que se generarían al cortar la superficie de la función en tres dimensiones, con planos
horizontales (ver Figura 1.4). Cada curva de nivel une los puntos en los cuales la función toma un mismo valor,
𝑓𝑓(𝑥𝑥, 𝑦𝑦 ) = 𝑐𝑐.

f(X1,X2)

x2

X1 Mínimo

Figura 1.4 Curvas de nivel de una función de dos variables proyectadas en un plano.
11
En cartografía se utilizan las curvas de nivel para incorporar a un mapa alguna información tridimensional del relieve que
corresponde a la zona representada.

Algunas funciones pueden presentar varios óptimos, la Figura 1.5 muestra una función con un mínimo local y un mínimo
global.

Mínimo local Mínimo global


f(x)

x
Figura 1.5 Gráficas de una función con un mínimo local y un mínimo global.

1.3 Funciones convexas y cóncavas

Una función univariable f(x) será convexa si para cualquier par de puntos x1 y x2 que están en el intervalo [a, b] y para
cualquier constante 𝛾𝛾 con valores en el intervalo [0, 1], se cumple:

𝑓𝑓[𝛾𝛾𝑥𝑥1 + (1 − 𝛾𝛾)𝑥𝑥2 ] ≤ 𝛾𝛾𝛾𝛾(𝑥𝑥1 ) + (1 − 𝛾𝛾)𝑓𝑓(𝑥𝑥2 )

La interpretación geométrica de esta definición es que cualquier recta que une dos puntos del conjunto, se encuentra
totalmente contenida en el conjunto.
Esto indica que cualquier línea recta que une los puntos [𝑥𝑥1 , 𝑥𝑥2 ] cae en la región definida por la función f(x).

Solamente cuando aplica la desigualdad la región es estrictamente convexa. La función tiene una curvatura hacia abajo,
ver Figura 1.6 (b). Cuando se invierte la desigualdad de ≤ a ≥, entonces la función es cóncava. La función tiene una
curvatura hacia arriba, ver Figura 1.6 (a).
Nótese que si solo se cumple la igualdad, entonces los puntos extremos ocurren en los límites de la función y es
igualmente convexa y cóncava. Además, una función g(x) que sea convexa entonces –g(x) será cóncava.
Implicaciones de las propiedades de convexidad de las funciones univariables.

1. Si f′′(a) < 0, la función es cóncava en “a”, se tendrá un máximo relativo


2. Si f′′(a) > 0, la función es convexa en “a”, se tendrá un mínimo relativo
3. f′′(a) = 0, la prueba es inconclusa y es necesario probar con las “derivadas sucesivas”. Por ejemplo si la tercera
derivada en “a” es no cero, entonces se tendrá un punto de inflexión.
Máximo Mínimo

f(x) f(x)

x1 cóncava 2 x x x2 x
(a) Función (b) Función1convexa

Figura 1.6 (a) Gráfica de una función cóncava, (b) gráfica de una función convexa
12
Para dos variables se tendrán los casos:

1. D2 > 0 y D1 < 0, entonces se tendrá un máximo. (función cóncava)


2. D2 > 0 y D1 > 0, entonces se tendrá un mínimo. (función convexa)
3. D2 < 0 y D1 < 0 o >0, entonces se tendrá un punto de inflexión.
4. D2 = 0, se tendrá un caso dudoso.

La siguiente tabla resume las características de las funciones a optimizar.

F(x) es H(x) es Todos los valores Los determinantes menores


propios λ son principales de 𝐻𝐻(𝑥𝑥) son
Estrictamente convexa Definitivamente >0 D1 > 0 , D2 > 0
Se tiene un mínimo único positiva
Convexa Semidefinida positiva ≥0 D1 > 0 , D2 ≥ 0
Cóncava Semidefinida negativa ≤0 D1 < 0 , D2 ≥ 0 , D3 ≤ 0
Estrictamente Cóncava Definitivamente <0 D1 < 0 , D2 > 0 , D3 < 0
Se tiene un máximo único negativa

Ejemplo 1.8 Para la función 𝑓𝑓(𝑥𝑥) = 2𝑥𝑥 4 − 16𝑥𝑥 3 + 32𝑥𝑥 2 + 5 determinar los puntos críticos y definir si son máximos o
mínimos.
Calcular la primera derivada e igualar a 0: 𝑓𝑓′(𝑥𝑥) = 8𝑥𝑥 3 − 48𝑥𝑥 2 + 64𝑥𝑥 = 0

Se factoriza y se obtiene: 𝑓𝑓′(𝑥𝑥) = 8𝑥𝑥(𝑥𝑥 − 2)(𝑥𝑥 − 4) = 0 los puntos críticos son: 𝑥𝑥 = 0, 𝑥𝑥 = 2 𝑦𝑦 𝑥𝑥 = 4

Tomando la segunda derivada y evaluando los puntos críticos: 𝑓𝑓 ′′ (𝑥𝑥) = 24𝑥𝑥 2 − 96𝑥𝑥 + 64

En el primer punto 𝑥𝑥 = 0, 𝑓𝑓 ′′ (0) = 24(0)2 − 96(0) + 64 > 0 es convexo, tiene mínimo relativo
En el primer punto 𝑥𝑥 = 2, 𝑓𝑓 ′′ (2) = 24(2)2 − 96(2) + 64 − 32 < 0 es cóncavo, tiene máximo relativo
En el primer punto 𝑥𝑥 = 4, 𝑓𝑓 ′′ (4) = 24(4)2 − 96(4) + 64 = 64 > 0 es convexo, tiene mínimo relativo

Ejemplo 1.9 En la siguiente función encontrar los puntos críticos y determinar si éstos son máximos o mínimos relativos,
puntos de inflexión o puntos de silla.

𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 3 − 𝑥𝑥 ∙ 𝑦𝑦 2 + 3𝑦𝑦 3 − 5𝑦𝑦


Se obtienen las primeras derivadas:

𝜕𝜕𝜕𝜕(𝑥𝑥,𝑦𝑦) 𝜕𝜕𝜕𝜕(𝑥𝑥,𝑦𝑦)
= 3𝑥𝑥 2 − 𝑦𝑦 2 , = −2𝑥𝑥𝑥𝑥 + 9𝑦𝑦 2 − 5
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕

3𝑥𝑥 2 − 𝑦𝑦 2 = 0
Al igualar a cero y resolver con 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � , {𝑥𝑥, 𝑦𝑦}� se obtienen cuatro puntos críticos.
−2𝑥𝑥𝑥𝑥 + 9𝑦𝑦 2 − 5 = 0

(−0.460914, −0.798326) , (−0.405127, 0.7017), (0.405127, −0.7017), (0.460914, 0.798326)

Se calculan las segundas derivadas de la matriz Hessiana:

13
𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓
⎡ ⎤
⎢ 𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕⎥ 6𝑥𝑥 −2𝑦𝑦
𝐷𝐷2 = ⎢ 2 2 ⎥ = �−2𝑦𝑦 �
18𝑦𝑦 − 2𝑥𝑥
⎢ 𝜕𝜕 𝑓𝑓 𝜕𝜕 𝑓𝑓 ⎥
⎣𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2 ⎦

Se calcula el determinante de la matriz Hessiana en el primer punto crítico:

−2.76548 1.59665
� � = 34.641 = 𝐷𝐷2
1.59665 −13.448

Puesto que D1 = -2.76548 < 0 y D2 = 34.641 > 0, entonces el punto crítico (−0.460914, −0.798326) es un máximo, con
𝑓𝑓(−0.460914, −0.798326) = 2.66109

Se hace lo mismo con los otros puntos críticos y los resultados se compendian en la siguiente tabla:

Puntos críticos (x, y) Función f(x, y) D1 D2 λ1 λ2 Características

(−0.460914, −0.798326) 2.66109 -2.76548 34.641 -2.5319 -13.6816 Máximo

(−0.405127, 0.7017) -2.339 -2.43076 -34.641 Punto de inflexión

(0.405127, −0.7017), 2.339 2.43076 -34.641 Punto de inflexión

(0.460914, 0.798326) 2.66109 2.76548 34.641 Mínimo

Los cálculos para el primer punto crítico en la calculadora TI nspire son:

La identificación de los puntos críticos se puede hacer en la calculadora TI Nspire con la opción de gráficas, como se
ilustra en el siguiente ejemplo.
14
Ejemplo 1.10 Para la función 𝑓𝑓(𝑥𝑥) = 2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32 , determinar los puntos críticos y definir si son
máximos o mínimos.
Cuando se enciende la calculadora c al dar clic al icono de Añadir Gráficos, abre la página con una nueva gráfica. En la
línea de ingreso escribir:

𝑓𝑓1(𝑥𝑥) = 2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32

Luego a través del menú modificar las escalas seleccionando la secuencia de teclas b41 (Menú/Ventana/Zoom/
Configuración de Ventana) y definir los siguientes parámetros como se ilustra en la figura 1.7 (a). La gráfica se muestra
en la Figura 1.7 (b).

La identificación de los mínimos y máximos se hace oprimiendo b 62. Aparece la pregunta ¿límite inferior? Y
una línea punteada, oprimir · y luego mover la segunda línea a la derecha de la primera para que incluya al mínimo y
después de oprimir · otra vez aparece entre paréntesis las coordenadas del mínimo. Hacer lo mismo para el máximo
y el otro mínimo. O también usando seleccionar trazado de la gráfica al mover el curso sobre la gráfica identifica los
mínimos, máximos o los ceros b62. Otra forma es con b /trazado/Trazado gráfico, aparece dos pequeñas
líneas cruzadas con un círculo sobre la gráfica, mover el círculo con las flechas de movimiento del cursor sobre la curva
hasta que aparezca la palabra máximo.

(a)
(b)

Figura 1.7 (a) Configuración de las escalas de la gráfica. (b) Gráfica de 𝑓𝑓1(𝑥𝑥) = 2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32

Una forma interesante de relacionar los puntos extremos de la función con la derivada de la función en forma gráfica, es
sobreponiendo la gráfica de la derivada con la gráfica de la función. Primero oprimir las teclas /-G para que aparezca la
línea de ingreso, luego seleccionar la tecla de plantillas matemáticas t que se encuentra a la derecha del número 9,
𝑑𝑑
para definir la derivada de la función [] , ver Figura 1.8. Para mostrar que los puntos extremos de la función
𝑑𝑑[ ]
coinciden con los ceros de la derivada poner una perpendicular en la intersección de la curva derivada con el eje
horizontal usando la secuencia de comandos: b641 que abre los submenús Geometría, Construcción y
Perpendicular. Aparece un pequeño lápiz que se puede mover hasta el punto de intersección deseado y al dar clic
aparece una pequeña mano para indicar que se puede mover la perpendicular, volver a dar clic. Se puede observar que

15
los ceros de la segunda derivada de la función corresponden a los puntos de intersección de la gráfica con el eje
horizontal.

𝑑𝑑
Los puntos críticos se obtienen directamente con la instrucción 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � (2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32) = 0, 𝑥𝑥�
𝑑𝑑𝑑𝑑
dando los valores: x=-3.1968, x=-0.681847, x=2.75345; al aplicar la segunda derivada a la función evaluada en cada
punto crítico se determina que el primero es mínimo, el segundo es máximo y el tercero es mínimo. Otra forma es
usando la función fmin( ) y definiendo la región de búsqueda, fMin(2*x^(4)+3*x^(3)-34*x^(2)-48*x+32,x)|−5≤x≤0 da
como resultado x= -3.1968

Figura 1.8 Sobre posición de las gráficas de una función y su derivada.

Este ejemplo muestra un caso de función multimodal, ya que presenta varios mínimos y máximos. El punto de x=-3.1968
con f= -51.1494 es un mínimo local, mientras que el punto x=2.75345, con f=-180.353 corresponde a un mínimo global.

Para mostrar las gráficas de una función de dos variables en la calculadora TI nspire, se resuelve el siguiente problema.

𝑥𝑥 2
Ejemplo 1.11 Determinar el mínimo de la función 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + 𝑦𝑦 2 = 1
4

La solución con el cálculo de las derivadas igualadas a cero dan como resultado el punto crítico (𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = (0, 0)

Con la función objetivo igual a 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = −1, ver Figura 1.9 (a) y su gráfica en Figura 1.9 (b).

16
(a)
(b)

Figura 1.9 (a) Función de una elipse centrada en el origen, (b) gráfica de las elipses.

La gráfica en tres dimensiones se obtiene en una nueva página seleccionando la opción de Agregar gráficos, después
seleccionando b, y las opciones de ver y Gráficos 3D. En la Figura 1.10 se observa que el punto donde la grafica
tridimensional tiene una altura mínima es el origen de los ejes (𝑥𝑥, 𝑦𝑦). Mientras que en la gráfica de la Figura 1.9 (b) el
mínimo corresponde al punto donde todas las elipses tienen su centro, el origen.

Figura 1.10 Gráfica de la función 𝑥𝑥 2 /4 + 𝑦𝑦 2

En muchos problemas de optimización no es fácil encontrar la solución a las derivadas del gradiente de la función
objetivo, por lo que tendrán que usarse técnicas de aproximación numérica. Las técnicas de optimización son múltiples y
diversas y generalmente dependen del tipo de problema a resolver. Se han clasificado en diferentes formas, por ejemplo
se hace una distinción entre las técnicas de optimización lineal, como el método de programación lineal; de la no lineal,
como el método del descenso más rápido. Similarmente hay técnicas de optimización multivariables o para una sola
variable. Otra distinción de las técnicas es la que pone a las técnicas de optimización directa, es decir con
manipulaciones matemáticas sin que se repitan los cálculos, como el método de multiplicadores de Lagrange, y por otro
lado se ponen a las técnicas de optimización de búsqueda iterativa, como el método de la sección dorada. Hay métodos
17
especiales para funciones con estructuras especiales como el método de programación dinámica y el método de
regresión de datos con mínimos cuadrados.

La estrategia de resolución de la mayoría de los métodos para obtener el máximo o mínimo de la función objetivo
consiste en avanzar acercándose a la solución óptima por un procedimiento iterativo, por movimientos exploratorios a
partir de un punto base. Tres son las cuestiones que se presentan en esta estrategia a partir de los valores iniciales de las
variables que optimizan el problema:

1. ¿Cuál es la dirección adecuada que se debe seguir?


2. ¿Qué distancia se debe recorrer una vez que se ha elegido la dirección? Y
3. ¿Qué criterio se debe utilizar para indicar que se ha encontrado la solución?

Los métodos de optimización basados en derivadas, como el método de Newton-Raphson se fundamentan en los
conceptos de gradiente y Hessiana para determinar la dirección de búsqueda.

Las calculadoras gráficas como la TI nspire CAS permiten encontrar gráficamente la solución óptima de funciones
matemáticas lo cual abre nuevos campos de resolución que simplifican el problema de optimización. Las calculadoras
graficas son un alivio en el trabajo de manipulación algebraico y de cálculo en la resolución de problemas, aumentan la
efectividad en los procedimientos de cálculo. Pero una parte muy importante, sino es que la más importante, es la
formulación matemática del problema a partir de una descripción verbal.

La optimización más que un campo de las matemáticas o una herramienta de la ingeniería, se debe entender como una
actividad humana. De acuerdo al darwinismo social, donde sobresalen los más aptos, es decir, aquellos cuyos logros
superan a los demás. Optimizar es una pauta en la vida de los que constantemente están mejorando, no solo en el
desempeño diario de aquello a lo que se dediquen, sino también en cuestiones de salud, bienestar y relaciones sociales.
La competencia optimacional nos puede ayudar a ser mejores buscando cada día hacer mejor lo que tenemos que hacer.
No hay mejor descriptor de la competencia optimacional que el éxito.

18
Problemas

1.1 En la siguiente función encontrar los puntos críticos y determinar si éstos son máximos, mínimos relativos, o puntos
de inflexión. 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 3𝑥𝑥 3 − 225𝑥𝑥 − 5𝑦𝑦 2 + 70𝑦𝑦 + 23
Repuestas: punto crítico (5, 7) es punto de inflexión y punto crítico (-5,7) es un máximo.
1.2 Encontrar los puntos extremos de la función 𝑧𝑧 = 𝑥𝑥 2 + 𝑦𝑦 2 + 4𝑥𝑥 + 4𝑦𝑦, y determinar si son máximos o mínimos.

Repuestas: Único punto (x, y) = (-2, -2) es un mínimo


921,600
1.3 El costo total (en miles de pesos) de pedido y almacenaje de x automóviles es, 𝐶𝐶(𝑥𝑥) = 4𝑥𝑥 + 720 +
𝑥𝑥

Determine el tamaño del pedido que minimice el costo total.

Repuestas: 𝑥𝑥 = 480

1.4 Para las siguientes funciones. Hallar todos los puntos estacionarios de y clasificarlos.

𝑎𝑎) 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥𝑒𝑒 −𝑥𝑥 (𝑦𝑦 2 − 4𝑦𝑦)


2 −𝑦𝑦2
𝑏𝑏) 𝑔𝑔(𝑥𝑥, 𝑦𝑦) = (𝑥𝑥 2 + 3𝑦𝑦 2 )𝑒𝑒 −𝑥𝑥

𝑐𝑐) 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 12𝑥𝑥 5 − 45𝑥𝑥 4 + 40𝑥𝑥 3 + 5

𝑑𝑑) 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 3 + 𝑦𝑦 3 + 2𝑥𝑥 2 + 4𝑦𝑦 2 + 6

Respuestas: a) Se tienen tres puntos extremos: (1, 2), es mínimo local; (0, 0) y (0, 4) son puntos de silla.

b)

Puntos críticos (x, y) Características

(1,0) Punto de inflexión

(0, 1) Máximo

(0, 0), Mínimo

(0, −1) Máximo

(−1,0) Punto de inflexión

c) Puntos extremos: x=0,x=1, and x=2. 𝑥𝑥 = 1 es un máximo con 𝑓𝑓(𝑥𝑥 = 1) = 12; 𝑥𝑥 = 2 es un mínimo con 𝑓𝑓(𝑥𝑥 = 2) =
−11; 𝑥𝑥 = 0 es un punto de inflexión con 𝑓𝑓(𝑥𝑥 = 0) = 0.

d) Puntos extremos (0,0), (0,-8/3), (-4/3,0), y (-4/3,-8/3). (0,0) es un mínimo, (-4/3,-8/3 es un máximo, (0,-8/3) y (-
4/3,0) son puntos de silla.

1.5 Hallar los puntos críticos de 𝑓𝑓(𝑥𝑥) = (45 − 2𝑥𝑥)(25 − 2𝑥𝑥)𝑥𝑥 y determinar si son máximos o mínimos.
Respuestas: 𝑥𝑥 = 5.16 es un máximo, 𝑥𝑥 = 18.2 es un mínimo.
1.6 Encuentre el máximo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 50𝑥𝑥 4/5 𝑦𝑦1/5 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑎𝑎 𝑞𝑞𝑞𝑞𝑞𝑞 𝑥𝑥 + 𝑦𝑦 = 1000
19
Respuestas: Despejando a 𝑦𝑦 de la restricción y al sustituir en la función queda en términos de un variable. Se obtiene el
máximo en 𝑥𝑥 = 200, 𝑦𝑦 = 800
1.7 Se quiere construir una caja, sin tapa, partiendo de una lámina rectangular de 32 cm de larga por 24 de ancha. Para
ello se recortará un cuadradito en cada esquina y se doblará. ¿Cuál debe ser el lado del cuadradito cortado para que el
volumen de la caja resultante sea máximo?
Respuestas: Lado del cuadrito 𝑥𝑥 = 4.53 𝑐𝑐𝑐𝑐.
1.8 Determinar las dimensiones de una caja que pueda contener 6 dm3 con el mínimo de área superficial.
Respuestas: La base es un cuadrado de la 2.28943 y altura 1.14.471 con área= 15.8687 dm2.
1.9 Encontrar el min 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 4𝑥𝑥 2 + 𝑦𝑦 2 − 2𝑥𝑥𝑥𝑥 − 4𝑥𝑥 − 2𝑦𝑦 + 2 y trazar las curvas de nivel cambiando el valor de la
constante 2 en -1, 0, 0.5, 1.0 y 1.25
1 2
Respuestas: 𝑥𝑥 ∗ = , 𝑦𝑦 ∗ = , 𝑐𝑐𝑐𝑐𝑐𝑐 min 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 2/3
3 3
1.10 Determinar la relación óptima de altura al diámetro de recipientes cilíndricos para contener un volumen fijo.

Respuestas: = 1
𝑑𝑑
1.11 Hallar el máximo de 𝑓𝑓(𝑥𝑥) = 500 − 𝑥𝑥(𝑥𝑥 − 20)3
Respuestas: Con 𝑥𝑥 = 20 se obtiene 𝑓𝑓(𝑥𝑥) = 500. Con 𝑥𝑥 = 5 se obtiene 𝑓𝑓(𝑥𝑥) = 17,375 el máximo global es 𝑥𝑥 = 5

1.12 El beneficio que se obtiene produciendo 𝑥𝑥 unidades del producto 𝐴𝐴 e 𝑦𝑦 unidades del producto 𝐵𝐵 se aproxima
mediante el modelo: 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = −2𝑥𝑥 2 + 60𝑥𝑥 − 10𝑦𝑦 2 + 140𝑦𝑦 − 100. Hallar el nivel de producción para el que se
obtiene el máximo beneficio.

Respuestas: Producir 15 unidades de 𝐴𝐴 y 7 unidades de 𝐵𝐵 , para obtener, el máximo beneficio 840.

1.13 Se desea forrar un tanque que almacena un fluido caliente con un aislante térmico. El flujo de calor que se pierde al
𝑘𝑘𝑘𝑘 1
exterior es 𝑄𝑄( ) = + 10 . Donde 𝑥𝑥 es el espesor del aislante. Suponer que el costo de la generación de un kJ de calor
ℎ 𝑥𝑥
en el medio de calentamiento del fluido es de medio dólar. El costo del aislante es de un dólar al año por cada milímetro
de espesor que cubre al tanque. Se desea encontrar el espesor que minimice los costos.

$
Respuestas: Espesor 𝑥𝑥 = 66.18 mm 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 43,932.4 � �
𝑎𝑎ñ𝑜𝑜

1.14 Encontrar el máximo de cada función, trazar las curvas de nivel y la gráfica en tres dimensiones.
a) 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 4 + 5𝑥𝑥 − 0.5𝑥𝑥 2 − 𝑦𝑦 2 + 6𝑦𝑦 − 0.5𝑥𝑥𝑥𝑥

Respuesta: 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 20 𝑒𝑒𝑒𝑒 𝑥𝑥 ∗ = 4, 𝑦𝑦 ∗ = 2

20
CAPÍTULO 2
Planteamiento del problema de optimización

Obtener el modelo matemático de un problema implica un proceso de abstracción, en el


que se hace una representación matemática de la narrativa de un problema, este proceso
se conoce como modelación. En los procesos de la ingeniería química se usan los balances
de materia y energía junto con los conceptos de la termodinámica, la cinética química y
las operaciones unitarias para el desarrollo de modelos matemáticos. En este capítulo se
presentan en una primera parte ejemplos que usan estos principios para obtener los
modelos necesarios para la optimización matemática y en una segunda parte se muestra
la técnica de los mínimos cuadrados para obtener modelos a partir de datos
experimentales.

21
2.1 Modelación con balances de materia y energía

En los problemas de optimización matemática hay que formular el modelo matemático primero y luego aplicar el
método de resolución matemática que se requiera y por lo general esta parte suele ser más fácil que la primera. La
definición de la función objetivo, es decir lo que se desea optimizar y la especificación de las variables que controlan el
valor de la función objetivo, dependen del tipo de problema a resolver. En el planteamiento del modelo a optimizar se
tendrán además de las variables de decisión cantidades fijas como parámetros que son parte del modelo. Esta parte del
problema de optimización suele ser complicada si no se tiene conocimiento de los fenómenos que involucra el tipo de
problema. Obtener el modelo matemático de un problema implica un proceso de abstracción, en el que se hace una
representación matemática de la narrativa de un problema, este proceso se conoce como modelación. A continuación
se presentan unos ejemplos para el planteamiento de función objetivo y su optimización.

Ejemplo 2.1

Se desean producir 100 moles por hora de un producto R, de acuerdo a la reacción A  R, en un reactor tipo tanque de
flujo continuo. La alimentación del reactivo es 0.1 mol/litro, la reacción es de primer orden con una velocidad de
reacción dada por 𝑟𝑟𝐴𝐴 = (0.2 ℎ𝑟𝑟)𝐶𝐶𝐴𝐴. En la Figura 2.1 se muestra el diagrama de un reactor tanque de flujo continuo, con
las siguientes variables: 𝐹𝐹𝐴𝐴 , flujo molar de A en la alimentación, mol/hr𝐶𝐶𝐴𝐴0 , , concentración de 𝐴𝐴 en la alimentación,
mol/litro y 𝐶𝐶𝑅𝑅 concentración de 𝑅𝑅 en la salida.

Figura 2.1 Diagrama de entrada y salida de un reactor tanque de flujo continuo.


$
El costo del reactivo a la concentración de 0.1 mol/litro es 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 = 0.50 , El costo del reactor incluyendo la
𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐴𝐴
$
instrumentación, mano de obra, costo de operación, etc. Es 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = 0.01 ℎ𝑟𝑟−𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙.

Determinar el volumen mínimo del reactor (V, litros), el flujo de la alimentación (𝐹𝐹𝐴𝐴0 , mol/h) y la conversión (𝑋𝑋𝐴𝐴 ), para
una operación óptima. Además determinar el costo por unidad de R producida en las condiciones óptimas. Suponer que
todo el reactivo no convertido se desecha.

Datos: 𝐹𝐹𝑅𝑅 = producción de R = 100 moles/h


𝐶𝐶𝐴𝐴0 = Concentración del reactivo alimentado = 0.1 mol/litro
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 = $ 0.50/𝑚𝑚𝑚𝑚𝑚𝑚 𝐴𝐴
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 = 0.01 $⁄ℎ𝑟𝑟 − 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙
22
𝑘𝑘 = constante de velocidad de reacción =0.2 h
La solución requiere encontrar una expresión del costo total de operación y minimizarlo. Por cada hora de operación el
costo total de operación será la suma del costo del reactor más el costo del reactivo.

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ∗ 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 + 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 ∗ 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝐴𝐴

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑉𝑉 ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 + 𝐹𝐹𝐴𝐴0 ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴


𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴
Para una reacción de primer orden el volumen del reactor es: 𝑉𝑉 = 𝑘𝑘𝐶𝐶
𝐴𝐴0 (1−𝑋𝑋𝐴𝐴 )

𝑚𝑚𝑚𝑚𝑚𝑚
Por la estequiometria de la reacción, se tiene, 𝐹𝐹𝑅𝑅 = 𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 = 100
ℎ𝑟𝑟

Se puede eliminar 𝐹𝐹𝐴𝐴0 y escribir la expresión del costo total en términos de una sola variable 𝑋𝑋𝐴𝐴 , dando:

𝐹𝐹𝑅𝑅 𝐹𝐹𝑅𝑅
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅 + ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴
𝑘𝑘𝐶𝐶𝐴𝐴0 (1 − 𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴
100 100 50 50
Al sustituir los datos se obtiene: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 0.01 + ∗ 0.5 = +
(0.2)(0.1)(1−𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴 1−𝑋𝑋𝐴𝐴 𝑋𝑋𝐴𝐴

Para encontrar la conversión que da el costo mínimo se calcula la derivada de esta expresión y se iguala a cero,
𝑑𝑑𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 50 50
=0= + Dando 𝑋𝑋𝐴𝐴 = 0.5
𝑑𝑑𝑋𝑋𝐴𝐴 (1−𝑋𝑋𝐴𝐴 )2 𝑋𝑋𝐴𝐴2

𝐹𝐹 100 𝐴𝐴
El flujo de alimentación es 𝐹𝐹𝐴𝐴0 = 𝑋𝑋𝑅𝑅 = = 200 𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑
𝐴𝐴 0.5 ℎ𝑟𝑟

𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 100


El volumen mínimo del reactor es 𝑉𝑉 = = (0.2)(0.1)(0.5) = 10,000 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑜𝑜𝑜𝑜
𝑘𝑘𝐶𝐶𝐴𝐴0 (1−𝑋𝑋𝐴𝐴 )

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑉𝑉𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 +𝐹𝐹𝐴𝐴0 ∗𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 10,000∗0.01+200∗0.5 $


El costo del producto es: 𝐹𝐹𝑅𝑅
= 𝐹𝐹𝑅𝑅
= =2
100 𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑅𝑅

La segunda derivada del costo total en 𝑋𝑋𝐴𝐴 = 0.5 resulta positivo, por lo que se tiene un mínimo.

Ejemplo 2.2

En ejemplo 2.1 suponer que a la salida del reactor todo el reactivo A se puede separar del producto R por un
tratamiento de extracción y llevar a su concentración inicial 𝐶𝐶𝐴𝐴0 = 0.1 𝑚𝑚𝑚𝑚𝑚𝑚/𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 con un costo de separación
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑆𝑆 = 0.125 $/𝑚𝑚𝑚𝑚𝑚𝑚 𝐴𝐴

El reactivo recuperado se recicla al reactor, encontrar el nuevo óptimo y el costo por unidad de R producido óptimo.
Se hace un diagrama del proceso para visualizar las variables y equipos involucrados.

Reciclo FA0(1-XA)

Reactor
Carga fresca Separador
FAF, CA0 =0.1 FA0 FA=FA0(1-XA)
FR= FA0XA

FR= FAF=100 mol/h


Figura 2.1 Proceso con reciclo.

23
𝑚𝑚𝑚𝑚𝑚𝑚
Nótese que, 𝐹𝐹𝑅𝑅 = 𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 = 𝐹𝐹𝐴𝐴𝐴𝐴 = 100 ,
ℎ𝑟𝑟

𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴
Y volumen del reactor tanque: 𝑉𝑉 = −𝑟𝑟𝐴𝐴

El costo de operación es:

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ∗ 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 + 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 ∗ 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝐴𝐴 + 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑆𝑆 ∗ 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝐴𝐴

Sustituyendo las expresiones requeridas se obtiene:

𝐹𝐹𝐴𝐴𝐴𝐴 𝐹𝐹𝐴𝐴𝐴𝐴
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑜𝑜𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅 + 𝐹𝐹𝐴𝐴𝐴𝐴 ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 + (1 − 𝑋𝑋𝐴𝐴 ) ∗ 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑆𝑆
𝑘𝑘𝐶𝐶𝐴𝐴0 (1 − 𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴

Al sustituir los datos se obtiene:

100 1 − 𝑋𝑋𝐴𝐴 50 1 − 𝑋𝑋𝐴𝐴


𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 0.01 + 100 ∗ 0.5 + (100) = + 50 + 12.5
(0.2)(0.1)(1 − 𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴 1 − 𝑋𝑋𝐴𝐴 𝑋𝑋𝐴𝐴
𝑑𝑑𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 50 12.5
Al diferenciar con respecto a XA, e igualando a cero, se obtiene: =0= − dando 𝑋𝑋𝐴𝐴 = 0.33
𝑑𝑑𝑋𝑋𝐴𝐴 (1−𝑋𝑋𝐴𝐴 )2 𝑋𝑋𝐴𝐴2

𝑑𝑑 50 1−𝑥𝑥
En la calculadora TI-nspire se obtiene: 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � � + 50 + 12.5 ∗ = 0� , 𝑥𝑥� |𝑥𝑥 > 0 el resultado es 𝑥𝑥 = 0.3333
𝑑𝑑𝑑𝑑 1−𝑥𝑥 𝑥𝑥

𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 100


El volumen mínimo del reactor es: 𝑉𝑉 = 𝑘𝑘𝐶𝐶 = (0.2)(0.1)(0.667) = 7,500 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙
𝐴𝐴0 (1−𝑋𝑋𝐴𝐴 )

𝐹𝐹𝐴𝐴𝐴𝐴 100 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙


El flujo alimentado al reactor es: 𝐹𝐹𝐴𝐴0 = = = 300
𝑋𝑋𝐴𝐴 0.33 ℎ𝑟𝑟

𝑚𝑚𝑚𝑚𝑚𝑚
El flujo del reciclo es: 𝐹𝐹𝐴𝐴0 − 𝐹𝐹𝐴𝐴𝐴𝐴 = 300 − 100 = 200

200 𝑚𝑚𝑚𝑚𝑚𝑚 ⁄ℎ𝑟𝑟 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙


Dividiendo entre la concentración se obtiene 0.1 𝑚𝑚𝑚𝑚𝑚𝑚⁄𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 = 2,000
ℎ𝑟𝑟

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 50⁄0.67+50+12.5∗(0.67⁄0.33) $


Finalmente el costo del producto es: 𝐹𝐹𝑅𝑅
= 100
= 1.5
𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑅𝑅

Se observa que al agregar el reciclo el tamaño del reactor disminuye y el costo del producto también disminuye.

Ejemplo 2.3 Se propone aprovechar el calor residual que salen con los gases de combustión de un horno que tienen un
flujo de 60,000 lb/h y capacidad calorífica de 0.25 BTU/lbºF, a una temperatura de 500ºF. Para ello se debe instalar un
cambiador de calor que tiene un coeficiente global de calor de 4.0 BTU/h-pie2-ºF y se desea producir vapor a una
temperatura de 220ºF a partir de agua líquida saturada a 220ºF. El vapor que se obtendría tendría un valor de $0.75 por
millón de BTU y el costo de instalación del cambiador se puede estimar en $5 por pie cuadrado de área. El costo se
amortiza en 5 años a una tasa de interés de8%.

El beneficio económico de la inversión P por los cinco años de instalación considerando el valor del vapor y el costo del
cambiador es:
𝑃𝑃 = 𝑣𝑣 ∗ 𝑄𝑄 ∗ 𝑛𝑛 − 𝐶𝐶 ∗ 𝐴𝐴 ∗ (1 + 𝑖𝑖)𝑛𝑛
Esta es la función objetivo que se busca maximizar.
Dónde:
𝑃𝑃 = 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖ó𝑛𝑛
24
𝑣𝑣 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐵𝐵𝐵𝐵𝐵𝐵 = $0.75/106 𝐵𝐵𝐵𝐵𝐵𝐵
𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿
𝑛𝑛 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 = 5 𝑎𝑎ñ𝑜𝑜𝑜𝑜
𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = $5.0/𝑝𝑝𝑝𝑝𝑝𝑝 2
𝐴𝐴 = Á𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝 2
𝑙𝑙𝑙𝑙
𝑚𝑚 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ó𝑛𝑛 = 60,000

𝐵𝐵𝐵𝐵𝐵𝐵
𝐶𝐶𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐í𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 0.25
𝑙𝑙𝑙𝑙º𝐹𝐹
𝑇𝑇𝑖𝑖𝑖𝑖 = 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 500º𝐹𝐹
4𝐵𝐵𝐵𝐵𝐵𝐵
𝑈𝑈 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 =
ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 − º𝐹𝐹
�𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 �−(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
∆𝑇𝑇𝐿𝐿𝐿𝐿 = (𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )

500−𝑇𝑇𝑜𝑜𝑢𝑢𝑢𝑢
En la ecuación de la diferencia de temperatura logarítmica se obtiene: ∆𝑇𝑇𝐿𝐿𝐿𝐿 = 280
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −220)

De las ecuaciones del calor transferido despejar el área y sustituir en la función objetivo, se obtiene:

$0.75 60,000𝑙𝑙𝑙𝑙 0.25𝐵𝐵𝐵𝐵𝐵𝐵 24ℎ 365𝑑𝑑í𝑎𝑎𝑎𝑎


𝑃𝑃 = �
6
�� �� � (500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) � �� � (5 𝑎𝑎ñ𝑜𝑜𝑜𝑜)
10 𝐵𝐵𝐵𝐵𝐵𝐵 ℎ 𝑙𝑙𝑙𝑙 − º𝐹𝐹 𝑑𝑑í𝑎𝑎 𝑎𝑎ñ𝑜𝑜
$5 60,000𝑙𝑙𝑙𝑙 0.25𝐵𝐵𝐵𝐵𝑈𝑈 ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 º𝐹𝐹 1
− � 2� � �� � (500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) � � (1 + 0.08)5
𝑝𝑝𝑝𝑝𝑝𝑝 ℎ 𝑙𝑙𝑙𝑙 − º𝐹𝐹 4𝐵𝐵𝐵𝐵𝐵𝐵 500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 º𝐹𝐹
280
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 − 220)

Al simplificar se obtiene: 𝑃𝑃 = 91,137 − 492.75𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 + 27,549.9 ln(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 − 220)

Se tiene un problema de maximización de beneficios en términos de una variable que en este caso es la temperatura de
los gases a la salida del cambiador, 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 . Con la calculadora se obtiene:

Se encuentra el valor óptimo buscado, 𝑥𝑥 = 275.911 dando un máximo beneficio 𝑃𝑃 de 66,0361dolares.

El área del cambiador de calor se determina de la ecuación:

𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿

En donde el calor de acuerdo al flujo es, 𝑄𝑄 = 60,000(0.25)(500 − 275.91) = 3,361,350 𝐵𝐵𝐵𝐵𝐵𝐵


500−275.91
Entonces de la ecuación de diseño se obtiene, 𝑄𝑄 = 4(𝐴𝐴) 280 = 3,361,350
𝑙𝑙𝑙𝑙(275.91−220)

Se despeja el área óptima del cambiador: 𝐴𝐴 = 11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2

$
Y el costo del cambiador es: 𝐶𝐶 = 5 (11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2 ) = $56,139.82
𝑝𝑝𝑝𝑝𝑝𝑝 2
25
Ejemplo 2.4 Un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una disolución acuosa,
utilizando disolvente nuevo en cada etapa, ver en la Figura 2. La disolución entra al sistema con un caudal de 500 kg de
agua/h y con una concentración xo = 0.20 kg de soluto por kg de agua. Dadas las distintas condiciones de mezcla en cada
etapa, puede admitirse que en la primera la relación de equilibrio entre las corrientes que salen de ella viene expresada
por 𝑦𝑦1 = 1.8 𝑥𝑥1 , mientras que en la segunda sería 𝑦𝑦2 = 2.2 𝑥𝑥2, donde:

yi: kg de soluto/kg de disolvente en el extracto que sale de la etapa i.

xi: kg de soluto/kg de agua en el refinado que sale de la etapa i.


W1 = kg d/h W2 = kg d/h

W0 = 500 kg A/h
① Etapa ③ Etapa
1 2
x0 = 0.2 kg S/kg A X1= kg S/kg A X2= kg S/kg A


y1 = 1.8x1 kg S/kg d y2 = 2.2x2 kg S/kg d

Figura 2.2 Diagrama de bloques de dos unidades de extracción.

Si el valor del soluto recuperado es de 1,000 $/kg y el precio del disolvente de 80 $/kg, determinar el caudal óptimo de
disolvente a utilizar en cada una de las etapas, W1 y W2 (kg/h), para maximizar la diferencia entre el valor del soluto
recuperado y el costo del disolvente gastado. Considere que el flujo de W1 + W2 no deben ser mayor al caudal de la
disolución a tratar.

𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑞𝑞𝑞𝑞𝑞𝑞 𝑆𝑆𝑜𝑜𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑞𝑞𝑞𝑞𝑞𝑞 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑞𝑞𝑞𝑞𝑞𝑞


Balance del soluto en la etapa 1 es: � �=� �+� �
𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 1 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑒𝑒𝑒𝑒 3 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑒𝑒𝑒𝑒 4

Es decir:

500 𝑘𝑘𝑘𝑘 𝐴𝐴 0.2 𝑘𝑘𝑘𝑘 𝑆𝑆 500 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑥𝑥1 𝑘𝑘𝑘𝑘 𝑆𝑆 𝑦𝑦1 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑤𝑤1 𝑘𝑘𝑘𝑘 𝑑𝑑
� �� �=� �� �+� �� �
ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑘𝑘𝑘𝑘 𝑑𝑑 ℎ
500∗0.2
Puesto 𝑦𝑦1 = 1.8 𝑥𝑥1 se obtiene: 500 ∗ 0.2 = 500𝑥𝑥1 + 1.8𝑥𝑥1 𝑤𝑤1 de donde: 𝑥𝑥1 =
(500+1.8𝑤𝑤1 )

𝑥𝑥1 500
Del balance de la segunda etapa se obtiene: 𝑥𝑥2 =
(500+2.2𝑤𝑤2

La función objetivo es: 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 − 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝

Entonces:
500 500 ∗ 0.2
max 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 500 �0.2 − � 1000 − (𝑤𝑤1 + 𝑤𝑤2 )80
(500 + 2.2𝑤𝑤2 (500 + 1.8𝑤𝑤1 )

Con la restricción: 𝑤𝑤1 + 𝑤𝑤2 < 500

La solución en la calculadora TI nspire se muestra en la Figura 2.2:

26
𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘
La solución es: 𝑤𝑤1 = 151.1876 𝑦𝑦 𝑤𝑤2 = 201.6258 con valor de la función de 𝑓𝑓 = 37,461.19 $/ℎ
ℎ ℎ

Figura 2.2 Instrucciones del método del gradiente para resolver el ejemplo2.5.

2.2 Regresión de datos con mínimos cuadrados

El método de mínimos cuadrados es una técnica de optimización para encontrar el mejor ajuste de un conjunto de datos
a una función matemática. Se trata de minimizar la suma de cuadrados de las diferencias en las ordenadas entre los
puntos generados por la función elegida y los datos. Con el modelo se pueden hacer predicciones o encontrar valores
óptimos.
Para un conjunto de n datos {𝑥𝑥𝑖𝑖 , 𝑦𝑦𝑖𝑖 } , 𝑦𝑦𝑖𝑖 es la variable dependiente, por ejemplo la temperatura, la concentración, etc. y
𝑥𝑥𝑖𝑖 la variable independiente, por ejemplo el tiempo, la conversión, etc. El método trata de encontrar la función 𝑓𝑓(𝑥𝑥𝑖𝑖 ) ,
como una ecuación algebraica con m coeficientes constantes 𝑦𝑦𝑖𝑖𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 , 𝑐𝑐1 , 𝑐𝑐2 , … 𝑐𝑐𝑚𝑚 ) que hagan que la
función produzca la mejor aproximación de los n datos. Los datos son observaciones que pueden ser el resultado de una
serie de experimentos al medir la variable dependiente para valores diferentes de la variable independiente.
El método de mínimos cuadrados se propone encontrar el mínimo de la suma de los errores en cada punto entre los
valores observados y los valores calculados de la variable dependiente, elevados al cuadrado, estos errores se conocen
como residuos.
𝑒𝑒𝑖𝑖 = 𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 ) = 𝑦𝑦𝑖𝑖𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 − 𝑦𝑦𝑖𝑖𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐

Por ejemplo para un ajuste con la ecuación cuadrática 𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 la suma de errores a minimizar será:
𝑛𝑛 𝑛𝑛
2
𝑆𝑆𝑆𝑆 = ��𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 )� = �(𝑦𝑦𝑖𝑖 − 𝑎𝑎𝑥𝑥𝑖𝑖2 − 𝑏𝑏𝑥𝑥𝑖𝑖 − 𝑐𝑐)2
𝑖𝑖=1 𝑖𝑖=1

La función objetivo 𝑆𝑆𝑆𝑆 depende de los valores 𝑎𝑎, 𝑏𝑏 𝑦𝑦 𝑐𝑐, el busca estos valores que hacen mínima la función objetivo.

y
Medición

e=yi – a0 – a1x

x
Figura 2.3 Error en la regresión

27
En la Figura 2.3 se muestra el error de la regresión de un modelo lineal. La ecuación así determinada se llama curva de
regresión y representa la tendencia general de los datos observados. Para un modelo de ajuste lineal se tendrá una
regresión lineal. Se pueden hacer ajustes de la variable dependiente para varias variables independientes, teniéndose
una regresión múltiple. Otros modelos de regresión son:

Modelo lineal: 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏


Modelo logarítmico: 𝑦𝑦 = 𝑐𝑐 ∗ 𝑙𝑙𝑙𝑙(𝑥𝑥) + 𝑏𝑏
Modelo exponencial: 𝑦𝑦 = 𝑐𝑐𝑒𝑒 𝑏𝑏𝑏𝑏

El método procede de la siguiente forma.

1. Como primer paso se recomienda graficar los datos para probar si no hay datos que estén muy alejados de una
tendencia que muestren un patrón específico.
2. Definir el modelo de la función que se desea ajustar a los datos.
3. Calcular las derivadas parciales de 𝑆𝑆𝑆𝑆 con respecto a los parámetros del modelo. El óptimo se encuentra
igualando estas derivadas a cero. Se obtiene un conjunto de m ecuaciones, estas se denominan ecuaciones
normales.
4. Se calculan las sumas de las variables en los datos y se sustituyen en las ecuaciones normales.
5. Se resuelven las ecuaciones en términos de los parámetros del modelo.

Este procedimiento aplicado al modelo lineal procede de la siguiente forma:

2
La función objetivo para un ajuste lineal es: 𝑆𝑆𝑆𝑆 = ∑𝑛𝑛𝑖𝑖=1�𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 )� = ∑𝑛𝑛𝑖𝑖=1(𝑦𝑦𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑏𝑏)2

Las derivadas parciales son:


𝜕𝜕𝜕𝜕𝜕𝜕
= 2 ∑𝑛𝑛𝑖𝑖=1(𝑦𝑦𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑏𝑏) =0
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕𝜕𝜕
= 2 ∑𝑛𝑛𝑖𝑖=1(𝑦𝑦𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑏𝑏)(−𝑥𝑥) = 0
𝜕𝜕𝜕𝜕

Las sumas se pueden obtener al hacer los cálculos en forma de tabla, de la siguiente forma:

𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 𝑥𝑥𝑖𝑖2 𝑦𝑦𝑖𝑖2 𝑥𝑥𝑖𝑖 ∗ 𝑦𝑦𝑖𝑖


𝑥𝑥1 𝑦𝑦1 𝑥𝑥12 𝑦𝑦12 𝑥𝑥𝑖𝑖 ∗ 𝑦𝑦𝑖𝑖
… … … … …
𝑥𝑥𝑛𝑛 𝑦𝑦𝑛𝑛 𝑥𝑥𝑛𝑛2 𝑦𝑦𝑛𝑛2 𝑥𝑥𝑛𝑛 ∗ 𝑦𝑦𝑛𝑛
𝛴𝛴𝛴𝛴 𝛴𝛴𝛴𝛴 𝛴𝛴𝛴𝛴 2 𝛴𝛴𝛴𝛴 2 𝛴𝛴𝛴𝛴 ∗ 𝑦𝑦

Las ecuaciones que resultan se denominan ecuaciones normales son:

𝑛𝑛 ∗ 𝑎𝑎 + 𝑏𝑏 ∗ 𝛴𝛴𝛴𝛴 = 𝛴𝛴𝛴𝛴
𝑎𝑎 ∗ 𝛴𝛴𝛴𝛴 + 𝑏𝑏 ∗ 𝛴𝛴𝑥𝑥 2 = 𝛴𝛴𝛴𝛴𝛴𝛴

Al resolver simultáneamente estas ecuaciones se obtienen los valores de los parámetros a y b

28
𝛴𝛴𝛴𝛴𝛴𝛴𝛴𝛴
𝛴𝛴𝛴𝛴𝛴𝛴−
Entonces: 𝑏𝑏 = 𝑛𝑛
(𝛴𝛴𝛴𝛴)2
, 𝑎𝑎 = 𝑦𝑦� − 𝑏𝑏 ∗ 𝑥𝑥̅ , donde 𝑦𝑦� = 𝛴𝛴𝛴𝛴𝑖𝑖 /𝑛𝑛, 𝑥𝑥̅ = 𝛴𝛴𝛴𝛴𝑖𝑖 /𝑛𝑛
𝛴𝛴𝑥𝑥 2 −
𝑛𝑛

El coeficiente de correlación que mide la bondad del ajuste se determina con la fórmula:

∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ) ∗ ∑(𝑦𝑦𝑖𝑖 − 𝑦𝑦�)


𝑅𝑅 =
�(∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ ))2 ∗ (∑(𝑦𝑦𝑖𝑖 − 𝑦𝑦�))2

El coeficiente será positivo si la correlación es positiva (al aumentar x aumenta y) y será negativo en el caso contrario.
Cuando el modelo a determinar es no lineal se puede proceder a hacer una transformación algebraica para obtener un
modelo lineal al cual se le puede aplicar el procedimiento descrito. En la Figura 2.4 se muestran algunos casos de
linearización.

y y
y

y = α1e β1x y = α 2 x β2 y = α3
x
β3 + x
x x
x
(a)
(b) (c)

ln y log y 1/y

Pendiente = β3/α3

Pendiente = β
1 Pendiente = β2
log x Intersección = 1/α3
x
1/x
Intersección = ln α1
Intersección = log α2
(d)
(e) (f)

Figura 2.4 Seis casos de modelos no lineales que se pueden linearizar, (a,b y) modelos originales
(d,e y f) modelos linearizados.

Ejemplo 2.5

Se realizan una serie de experimentos en un dilatómetro en el que se verifica la reacción de la hidrolisis de la sacarosa en
soluciones de ácido clorhídrico diluido, para determinar la constante de velocidad de reacción. La reacción produce
29
glucosa y fructuosa, teniendo la característica de que a medida que procede la reacción ocurre una rotación óptica de
derecha a izquierda y debido a esta variación la reacción es también conocida como inversión de la sacarosa. A esta
mezcla se le llama azúcar invertida y sus componentes tienen un poder edulcorante mayor y es más fácilmente
fermentable. Otra característica de la inversión de la sacarosa es que sufre una dilatación volumétrica y debido a esto se
implementa una técnica dilatométrica que permite seguir la cinética de la reacción.
La reacción tiene una cinética de primer orden, por lo que la variación de la concentración de la sacarosa (C) con
el tiempo es:
𝐶𝐶 = 𝐶𝐶0 𝑒𝑒 −𝑘𝑘𝑘𝑘

Donde k es la constante de velocidad de reacción y. 𝐶𝐶0 es la concentración inicial.

Puesto que el cambio de concentración es proporcional al cambio de volumen, en el reactor de laboratorio, se sigue con
un dilatómetro midiendo la altura en un tubo capilar instalado en el reactor, entonces la cinética es equivalente a:
𝐻𝐻 = 𝐻𝐻0 𝑒𝑒 −𝑘𝑘𝑘𝑘
Donde H es la altura del nivel en el tubo capilar. Se reportan los datos en la siguiente tabla y se aplica el método de
mínimos cuadrados para encontrar la constante de velocidad de reacción.

t, min 0 30 60 90 120 150 180 200


H, mm 48.93 39.63 29.3 22.91 18.3 15.62 13.06 12.6

La ecuación cinética en términos de la altura después de aplicar logaritmos resulta:

ln(𝐻𝐻) = −𝑘𝑘𝑘𝑘 + ln(𝐻𝐻0 )

Haciendo 𝑦𝑦 = ln(𝐻𝐻) , x = t , b = k y ln(𝐻𝐻0 ) = 𝑎𝑎 resulta un modelo lineal. 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏


Los cálculos se resumen en la siguiente tabla:

x𝑖𝑖 = t H, mm 𝑦𝑦𝑖𝑖 = ln(𝐻𝐻) 𝑥𝑥𝑖𝑖2 x𝑖𝑖 𝑦𝑦𝑖𝑖


0 48.93 3.89039071 0 0
30 39.63 3.67958641 900 110.387592
60 29.3 3.37758752 3600 202.655251
90 22.91 3.1315735 8100 281.841615
120 18.3 2.90690106 14400 348.828127
150 15.62 2.74855214 22500 412.282822
180 13.06 2.56955412 32400 462.519742
200 12.6 2.53369681 40000 506.739363
𝑛𝑛 𝑛𝑛 𝑛𝑛

�(𝑥𝑥𝑖𝑖 ) = 830 �(𝑦𝑦𝑖𝑖 ) = 24.8374 �(𝑥𝑥𝑖𝑖 𝑦𝑦𝑖𝑖 ) = 2,325.25


𝑖𝑖=1 𝑖𝑖=1
∑𝑛𝑛𝑖𝑖=1�𝑥𝑥𝑖𝑖2 � =121,900 𝑖𝑖=1

Las ecuaciones normales quedan:


8 ∗ 𝑎𝑎 + 𝑏𝑏 ∗ 830 = 24.8374

𝑎𝑎 ∗ 830 + 𝑏𝑏 ∗ 121,900 = 2,325.25

30
La solución resulta: b= −0.007, a = 3.8341, por lo que el modelo linearizado es 𝑦𝑦 = 3.8341 − 0.007𝑥𝑥 Puesto que
b = −0.007 = k y ln(𝐻𝐻0 ) = 𝑎𝑎 = 3.8341 siendo 𝐻𝐻0 = 𝑒𝑒 3.8341 = 48.308 la cinética de reacción queda:

𝐻𝐻 = 48.308𝑒𝑒 −0.007𝑡𝑡

La gráfica de los datos y la curva ajustada se muestra en la Figura 2.5

Figura 2.5 Datos y curva de ajuste del Ejemplo 2.5


En la calculadora TI-Nspire seleccionar Calculadora. Después introducir las listas de datos.

{0, 30, 60, 90, 120, 150, 180, 200} x ·w

{48.93, 39.63, 29.3, 22.91, 18.3, 15.62, 13.06, 12.6}h ··

Luego determinar el logaritmo de las alturas con ln(h)y··

Determinar la regresión lineal con LinRegMx x,y,1·

Luego seleccionar con la tecla h seleccionar stat.results para ver los resultados. Da la línea recta: y=3.8343-0.007x, ver la
Figura 2.6 (a). La gráfica de los datos y la ecuación de regresión se despliega en una nueva página oprimiendo las teclas
/ y +page simultáneamente. En la nueva página seleccionar Agregar Gráficos, con Menú se selecciona Diagrama de
dispersión en la opción Tipo de Grafico, b34. A la pregunta de los nombres de las variables seleccionar 𝑥𝑥,y que
aparecerán en los ejes 𝑥𝑥,y. En la gráfica muestra un solo punto, Con Menú seleccionar Zoom-Datos en la opción Ventana
Zoom b 49. Luego agregar la recta de regresión con la tecla Menú seleccionar Función en Tipo de Gráfico
b31. En la línea de entrada escribir la ecuación 3.8343-0.007x, y traza la recta sobre los puntos de los datos. La
gráfica de la Figura 2.6 (b) no es igual a la Figura 2.5 porque 𝑦𝑦 representa los logaritmos de las alturas en la gráfica Figura
2.6 (b) mientras que en la Figura 2.5 en el eje vertical se presentan los valores de las alturas.

31
(a) (b)

Figura 2.6 Ventanas de la calculadora TI-Nspire para el Ejemplo 2.5, (a) resultados de la regresión, (b) gráfica.

Otra forma de resolver el problema es usando una hoja de cálculo. En la columna A se define el tiempo, en la B la altura
y en la C el logaritmo de la altura, “lndeh”. Se dan los datos de tiempo, la altura y se calcula el logaritmo de la altura.

Oprimir c y seleccionar Datos y Estadísticos. Mover el cursor y dar clic a la escala del eje horizontal y seleccionar la
variable “tiempo”. Hacer lo mismo en el eje vertical y seleccionar “lndeh”. Luego con b seleccionar Analizar y
Regresión luego seleccionar la Forma Lineal. Aparece la ecuación de regresión y la línea que pasa por los puntos de la
gráfica.

32
El modelo del ejemplo 3.1 es una relación exponencial entre las variables que comúnmente se encuentra en las
reacciones químicas con una cinética de primer orden. Otro caso de aplicación del modelo exponencial es el que se usa
para determinar los intereses que se generan en una inversión bajo interés compuesto, 𝑦𝑦 = 𝑃𝑃𝑒𝑒 𝑟𝑟𝑟𝑟 , donde 𝑃𝑃 es la
inversión inicial, 𝑟𝑟 es la tasa de interés y 𝑡𝑡 es el tiempo en años.

Ejemplo 2.6

Determinar cuál modelo representa mejor los siguientes datos:

X 5 10 15 20 25 30 35 40 45 50
y 16 25 32 33 38 36 39 40 42 42

Modelos:
1. 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏
2. 𝑦𝑦 = 𝑐𝑐 + 𝑏𝑏𝑏𝑏 + 𝑎𝑎𝑥𝑥 2
3. 𝑦𝑦 = 𝑎𝑎𝑥𝑥 𝑏𝑏
𝑥𝑥
4. 𝑦𝑦 = 𝑎𝑎
𝑏𝑏+𝑥𝑥

En la calculadora se forman las listas con los datos.

{5,10,15,20,25,30,35,40,45,50}→x
{16,25,32,33,38,36,39,40,42,42}→y
((1)/(x))→u
((1)/(y))→v

Para el modelo lineal se usa la función LinRegBx x,y,1, (b613), para el modelo cuadrático se usa la función
QuadReg x,y,1, (b616 ), para el modelo de potencia se usa la función PowerReg x,y,1, (b619),
1
mientras que para el modelo 4 se hace una transformación a los datos 𝑢𝑢 = 𝑦𝑦 𝑣𝑣 = 1/𝑦𝑦 para ajustar un modelo lineal,
𝑥𝑥
LinRegBx u,v,1. Los resultados de la calculadora se muestran en la Tabla 3.1

Tabla 3.1 Resultados del ajuste de los datos del Ejemplo 3.2.
LinRegBx x,y,1 QuadReg x,y,1 PowerReg x,y,1 LinRegBx u,v,1
"Regresión lineal (a+bx)" "Regresión cuadrática" "Regresión potencial" "Regresión lineal (a+bx)"
"RegEqn","a+b*x" "RegEqn","a*x^2+b*x+c" "RegEqn","a*x^b" "RegEqn","a+b*x"
"a",20.6667 "a",−0.015455 "a",9.65828 "a",0.019142
"b",0.495758 "b",1.34576 "b",0.395029 "b",0.213368
"r²",0.820113 "c",12.1667 "r²",0.930901 "r²",0.991973
"r",0.905601 "R²",0.94763 "r",0.964832 "r",0.995978

Las ecuaciones resultantes para cada modelo son:


1 𝑦𝑦 = 20.6667 + 0.49576𝑥𝑥

33
2 𝑦𝑦 = 12.1667 + 1.34576𝑥𝑥 − 0.01545𝑥𝑥 2

3. 𝑦𝑦 = 9.65828𝑥𝑥 0.39029
𝑥𝑥
4. 𝑦𝑦 = 52.241
11.147+𝑥𝑥

Este último modelo es el mejor de acuerdo a un coeficiente de correlación R2 = .9919,


La gráfica de los datos y las curvas de los modelos se muestran en la Figura 2.7, se observa que la curva que mejor se
sobrepone a los puntos de los datos es el modelo 4.

Figura 2.7 Datos del Ejemplo 2.6 y las curvas de los modelos que representan los datos.

Cuando no se conoce el modelo que se puede ajustar a los datos entre dos variables, se deben graficar los datos y por
observación se puede proponer el modelo funcional apropiado que mejor se ajuste a la relación que existe en las
variables de los datos. La calculadora se utiliza para ensayar cada una de las opciones de ajuste disponibles hasta
encontrar la gráfica que mejor se ajuste a los datos. El proceso de búsqueda del mejor ajuste algunos autores lo
denominan análisis de regresión.

Para la regresión polinomial el método se aplica de la misma manera, lo cual se ilustra en el siguiente ejemplo.

Ejemplo 2.7

En la tabla se muestran los valores que se determinaron experimentalmente de la capacidad calorífica de una sustancia
a diferentes temperaturas. Encontrar los parámetros del mejor ajuste para la ecuación. 𝐶𝐶𝐶𝐶 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐𝑇𝑇 2 .

T(K) 273.15 283.2 293.25 313.05 333.18 353.31 373.15


CP (J/mol-K) 75.158 75.254 79.339 85.539 105.727 122.915 136.101

La suma de errores cuadrados y las ecuaciones normales para este modelo son:
𝑛𝑛 𝑛𝑛
2 2
𝑆𝑆𝑆𝑆 = ��𝐶𝐶𝐶𝐶𝑖𝑖 − 𝑓𝑓(𝑇𝑇𝑖𝑖 )� = ��𝐶𝐶𝐶𝐶𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑇𝑇𝑖𝑖 − 𝑐𝑐𝑇𝑇𝑖𝑖2 �
𝑖𝑖=1 𝑖𝑖=1

34
𝑛𝑛 𝑛𝑛 𝑛𝑛

𝑎𝑎𝑎𝑎 + 𝑏𝑏 �(𝑇𝑇𝑖𝑖 ) + 𝑐𝑐 �� 𝑇𝑇𝑖𝑖2 � = �( 𝐶𝐶𝐶𝐶𝑖𝑖 )


𝑖𝑖=1 𝑖𝑖=1 𝑖𝑖=1

𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑛𝑛

𝑎𝑎 �(𝑇𝑇𝑖𝑖 ) + 𝑏𝑏 �� 𝑇𝑇𝑖𝑖2 � + 𝑐𝑐 �� 𝑇𝑇𝑖𝑖3 � = �(𝑇𝑇𝑖𝑖 𝐶𝐶𝐶𝐶𝑖𝑖 )


𝑖𝑖=1 𝑖𝑖=1 𝑖𝑖=1 𝑖𝑖=1

𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑛𝑛

𝑎𝑎 ��𝑇𝑇𝑖𝑖2 �+ 𝑏𝑏 �� 𝑇𝑇𝑖𝑖3 � + 𝑐𝑐 �� 𝑇𝑇𝑖𝑖4 � = ��𝑇𝑇𝑖𝑖2 𝐶𝐶𝐶𝐶𝑖𝑖 �


𝑖𝑖=1 𝑖𝑖=1 𝑖𝑖=1 𝑖𝑖=1

Se calculan las sumas y se obtiene:

T Cp T2 T3 T4 T*Cp Cp*T2
273.15 75.158 74610.9225 20379973.5 5566789756 20529.4077 5607607.71
283.2 75.254 80202.24 22713274.4 6432399301 21311.9328 6035539.37
293.25 79.339 85995.5625 25218198.7 7395236770 23266.1618 6822801.93
313.05 85.539 98000.3025 30678994.7 9604059290 26777.984 8382847.88
333.18 105.73 111008.9124 36985949.4 1.2323E+10 35226.1219 11736639.3
353.31 122.92 124827.9561 44102965.2 1.5582E+10 43427.0987 15343228.2
373.15 136.101 139240.9225 51957750.2 1.9388E+10 50786.0882 18950828.8
Sumas: 2222.3 680.03 713886.81850 232037106 7.6292E+10 221324.795 72879493.2

∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖 � =2222.29 , ∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖2 � = 7,138.868 ∗ 102 , ∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖3 � = 2,320.371 ∗ 105

∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖4 � = 7,629.151 ∗ 107 , ∑7𝑖𝑖=1( 𝐶𝐶𝐶𝐶𝑖𝑖 ) = 680.033 , ∑7𝑖𝑖=1(𝑇𝑇𝑖𝑖 𝐶𝐶𝐶𝐶𝑖𝑖 ) = 2,213.248 ∗ 102 ,

∑7𝑖𝑖=1�𝑇𝑇𝑖𝑖2 𝐶𝐶𝐶𝐶𝑖𝑖 � = 7,287.949 ∗ 104

Se obtiene el sistema de tres ecuaciones:

7𝑎𝑎 + 2,222.29𝑏𝑏 + 7,138.868 ∗ 102 𝑐𝑐 = 680.033

2,222.29𝑎𝑎 + 7,138.868 ∗ 102 𝑏𝑏 + 2,320.371 ∗ 105 𝑐𝑐 = 2,213.248 ∗ 102

7,138.868 ∗ 102 𝑎𝑎 + 2,320.371 ∗ 105 𝑏𝑏 + 7,629.151 ∗ 107 𝑐𝑐 = 7,287.949 ∗ 104

Se resuelven las ecuaciones y se obtiene: a = 293.255, b = -1.8759 y c = 0.0039

La ecuación de la capacidad calorífica queda.


𝐶𝐶𝐶𝐶 = 293.255 − 1.8759𝑇𝑇 + 0.0039𝑇𝑇 2

Usando operaciones con matrices en Excel se obtiene:

35
En la calculadora TI nspire se obtienen los resultados.

En la calculadora usar la combinación de teclas para abrir la ventana de la función de regresión cuadrática: ·66,
para definir a la lista de los datos de t en la variable x y la lista de datos de cp en la variable y. Luego con la instrucción
QuadReg para obtener la regresión cuadrática, obtener el ajuste cuadrático.

Es de notar el valor del coeficiente de correlación R2 que da un valor de 0.9863. Un valor de R2 cercano a la unidad es
indicativo de un buen ajuste.

Cuando se resuelve en Excel se grafican los datos y se agrega una línea de tendencia se obtiene la gráfica:

36
150
140 y = 0.0039x2 - 1.8759x + 293.26
R² = 0.9864
130
Capacidad Calorífica
120
110
100
90
80
70
60
50
250 270 290 310 330 350 370 390
Temperatura

Figura 2.8 Gráfica de los datos del Ejemplo 2.7 con la línea de tendencia.

Las opciones para la línea de tendencia son las indicadas en la Figura 2.9

37
Figura 2.9 Opciones de la línea de tendencia para la gráfica de datos en Excel.

Tambien se puede usar el complemento Solver de Excel para hacer el ajuste de los mínimos cuadrados. Por ejemplo para
𝑥𝑥
el caso (4) con el modelo 𝑦𝑦 = 𝑎𝑎 del Ejemplo 2.6 se obtiene:
𝑏𝑏+𝑥𝑥

𝑥𝑥
𝑦𝑦 = 51.255
10.606 + 𝑥𝑥

Para lo que se definen dos celdas para los parametros a ajustar, a en la celda C4 y b en la celda C5, con valores iniciales
de 1 en cada celda. Los valores de x se introducen en las celdas de la A8 a la A17, similarmente los datos de y de la celda
B8 a la B17. En las celdas de la C8 se introduce la fórmula del valor calculado de y, $C$4*A8/($C$5+A8) y la fórmula se
2
𝑦𝑦 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
repite hasta la celda C17. Luego se calculan los residuos � − 1� desde la celda D8 con ((C8-B8)/B8)^2 y la
𝑦𝑦 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
fórmula se repite hasta la celda D17. Luego se calcula la suma de los errores al cuadrado en la celda D19, SUMA(D8:D17)
y se abre el Solver para especificar la celda objetivo (celda D19), y definir las celdas de las variables a cambiar,
$C$4:$C$5, y dar clic en boton de resolver. La hoja de cálculo se muestra en la Figura 2.10

Figura 2.10 Hoja de cálculo con ajuste del modelo 4 Ejemplo 2.6

38
Problemas

2.1 Determine las dimensiones óptimas de un recipiente de acero, tipo cilíndrico circular, si se sabe que el costo de
manufactura, incluido el material, por unidad de superficie de cada tapa es de 10 $/m2 y el cuerpo 8 $/m2. El volumen
de líquido que almacenara el tanque es 20π (m3).

Respuesta: 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 = 2 𝑚𝑚 , 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 = 5 𝑚𝑚 , Costo= 753.98 $

2.2 Una caja con base cuadrada y sin tapa debe contener 1,000 cm3. Encontrar las dimensiones que requieran el mínimo
consumo de material para construir la caja. Suponer que el espesor es uniforme en la caja.

Respuestas ⇒. Base = 12.6 cm y altura= 6.3 cm.

2.3 La ecuación de Clausius Clapeyron relaciona el calor latente de vaporización de sustancias líquidas con la
temperatura de ebullición y la presión de vapor.
∆𝐻𝐻𝑣𝑣
ln(𝑝𝑝) = − + 𝑘𝑘 𝑇𝑇(℃) 𝑦𝑦 𝑝𝑝(𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐻𝐻𝐻𝐻)
𝑅𝑅𝑅𝑅
𝐽𝐽
𝑅𝑅 es la constante universal de los gases, 𝑅𝑅 = 8.314
𝐾𝐾−𝑚𝑚𝑚𝑚𝑚𝑚

Con el método de los mínimos cuadrados determinar el calor latente de vaporización ∆𝐻𝐻𝑣𝑣 en kJ/mol usando los datos de
la tabla.

𝑇𝑇𝑒𝑒𝑒𝑒 , ℃ Presión de vapor


𝑝𝑝, 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝐻𝐻𝐻𝐻, 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔
26 19.3
38 16
42 13
45 11
50.5 8
53 6
55 4
59 0
𝑘𝑘𝑘𝑘
26.2976
Respuestas: Se obtiene la ecuación: ln(𝑝𝑝) = − 𝑚𝑚𝑚𝑚𝑚𝑚
+ 16.1184 𝑐𝑐𝑐𝑐𝑐𝑐 ∆𝐻𝐻𝑣𝑣 = 26.2976 𝑘𝑘𝑘𝑘/𝑚𝑚𝑚𝑚𝑚𝑚
8.314∗𝑇𝑇

2.4 Una planta química produce urea y amoniaco, los cuales se venden a 1,000 y 1,500 dólares la tonelada de cada uno
respectivamente. Ambos se producen en dos etapas, reacción y secado, el número de horas necesarias para su
elaboración se da en la siguiente tabla.

Horas necesarias de fabricación


Etapas del Urea Nitrato de
proceso amonio
Reacción 4 2
Secado 2 5

Por limitaciones de mano de obra solamente se dispone de 80 horas por semana para atender las reacciones y 60 horas
por semana en el secado. Se dispone de 75 toneladas de materia prima, misma que se usa para los dos productos. Cada
producto requiere 4 toneladas de materia prima para su fabricación.

39
Formule el modelo matemático para maximizar las ganancias. Explique claramente como obtiene la función objetivo y
las restricciones.

2.5 La capacidad de producción de refrigeradores de una empresa es 𝑃𝑃 unidades por día. Los costos variables por
refrigerador se determinan como $47.73 + 0.1𝑃𝑃1.2 . Los costos fijos de manufactura corresponde a $1,750 y los gastos
de mano de obra son $7,325 por día. Si el precio de venta de cada refrigerador es $173, determinar:

a) El nivel de producción (número de refrigeradores producidos diariamente) que minimizan los costos.
b) La ganancia diaria que minimiza los costos.
c) El nivel de producción que maximiza las ganancias y la ganancia máxima diaria.
d) Cuál es la capacidad de producción de refrigerados en el que la utilidad es nula.

2.6 La velocidad de crecimiento 𝑣𝑣 de ciertos micro organismos en función de la concentración del sustrato, 𝐶𝐶, sigue la
cinética enzimática de Michaelis-Menten.

𝑣𝑣𝑚𝑚 𝐶𝐶 2
𝑣𝑣 =
𝑘𝑘 + 𝐶𝐶 2
Con el método de los mínimos cuadrados determinar los parámetros del modelo para los datos:
C 1.3 1.8 3 4.5 6 8 9
𝑣𝑣 0.07 0.13 0.22 0.275 0.335 0.35 0.36

Escriba la ecuación de Michaelis-Menten con los parámetros encontrados.

1 1 𝑘𝑘 1 𝟎𝟎.𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝑪𝑪𝟐𝟐
Respuestas: Se lineariza el modelo invirtiendo la ecuación: = + para dar: 𝒗𝒗 =
𝑣𝑣 𝑣𝑣𝑚𝑚 𝑣𝑣𝑚𝑚 𝐶𝐶 2 𝟐𝟐.𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖+𝑪𝑪𝟐𝟐

2.7 Experimentalmente se encontró que La conductividad térmica 𝒌𝒌 de cierto metal depende de la temperatura 𝑻𝑻.
Encuentre con el método de los mínimos cuadrados los coeficientes 𝑎𝑎 𝑦𝑦 𝑏𝑏 del modelo:

𝑻𝑻𝒌𝒌𝒂𝒂 = 𝒃𝒃
Con los siguientes datos:

T/K 200 600 1000 1400


k/(W/cm-K) 1 0.4 0.3 0.25

Escriba la ecuación que relaciona a 𝑘𝑘 𝑦𝑦 𝑇𝑇 con los parámetros encontrados.


Respuesta:
𝑻𝑻𝒌𝒌𝟏𝟏𝟏𝟏𝟏𝟏.𝟏𝟏 = 𝟏𝟏. 𝟑𝟑𝟑𝟑𝟑𝟑𝟑𝟑

40
CAPÍTULO 3
Optimización de Funciones no Lineales con Restricciones

Las restricciones en los problemas de optimización son limitaciones que se imponen a


las variables del problema y acotan la región posible de soluciones. La formulación del
problema puede tener restricciones de igualdad o desigualdad. En los casos de
restricciones de igualdad se aplica el método de los multiplicadores de Lagrange. Pero
para problemas con restricciones de desigualdad o con restricciones mixtas de igualdad
y desigualdad, se usa el método de las condiciones de Kuhn Tucker. Ambos métodos se
describen en este capítulo con ejemplos que ilustran su uso.

41
3.1 Problemas de funciones no lineales con restricciones.

Las restricciones en los problemas de optimización son limitaciones que se imponen a las variables del problema y
acotan la región posible de soluciones.

La formulación del problema puede tener restricciones de igualdad o desigualdad.

Minimizar o maximizar la función objetivo 𝑓𝑓(𝑋𝑋),

𝑓𝑓(𝑋𝑋) = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … . 𝑥𝑥𝑛𝑛 ) (3-1)

Sujeto a las restricciones:


𝑔𝑔1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0
𝑔𝑔2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0
...
𝑔𝑔𝑘𝑘 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0 (3-2)
Y
ℎ1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0
ℎ2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0
...
ℎ𝑗𝑗 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0 (3-3)

Cualquier conjunto (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 𝑋𝑋 que satisfaga las restricciones es un punto viable. La región de viabilidad está
comprendida por todos los puntos viables.

Cualquier solución de 𝑓𝑓(𝑋𝑋) que quede dentro de la región de viabilidad es una solución óptima.

Cualquier problema de maximización puede convertirse en minimización, cambiando el signo de la función.

𝑚𝑚á𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥 𝑓𝑓(𝑋𝑋) = 𝑚𝑚í𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 − 𝑓𝑓(𝑋𝑋)

Transformaciones de las restricciones.

a) 𝑐𝑐𝑖𝑖 (𝑋𝑋) ≥ 𝐴𝐴 es equivalente a 𝑐𝑐𝑖𝑖 (𝑋𝑋) − 𝐴𝐴 ≥ 0


b) 𝑐𝑐𝑖𝑖 (𝑋𝑋) ≤ 0 es equivalente a − 𝑐𝑐𝑖𝑖 (𝑋𝑋) ≥ 0
c) 𝑢𝑢 ≤ 𝑥𝑥𝑖𝑖 ≤ 𝑣𝑣 es equivalente 𝑥𝑥𝑖𝑖 − 𝑢𝑢 ≥ 0 y 𝑣𝑣 − 𝑥𝑥𝑖𝑖 ≥ 0
d) 𝑐𝑐𝑖𝑖 (𝑋𝑋) ≥ 𝐴𝐴 es equivalente a 𝑐𝑐𝑖𝑖 (𝑋𝑋) + 𝛾𝛾 = 𝐴𝐴 donde 𝛾𝛾 = variable de holgura.
e) Las restricciones en forma de igualdad pueden usarse para eliminar algunas variables independientes,
reduciendo las dimensiones del problema.

3.2 Optimización de funciones con el método de multiplicadores de Lagrange

El método de multiplicadores de Lagrange se usa para minimizar o maximizar la función objetivo 𝑓𝑓(𝑋𝑋), con restricciones.

𝑓𝑓(𝑋𝑋) = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … . 𝑥𝑥𝑛𝑛 )

Sujeto a las restricciones de igualdad:


𝑔𝑔1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0
𝑔𝑔2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0
...
𝑔𝑔𝑘𝑘 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 0

42
Para este tipo de problemas con n variables y K restricciones se propone un nueva función ℒ (x, λ) denominada
lagrangiano que incluye las restricciones, ampliado en K variables λ denominadas multiplicadores de Lagrange.

Para encontrar la solución a este nuevo tipo de problema, se debe establecer una nueva función L que debe ser
formada por (1) definiendo cada restricción como igual a cero, (2) multiplicándola por (el multiplicador de Lagrange) y
(3) sumando el producto a la función original:

ℒ(𝑥𝑥1 , 𝑥𝑥2 , … . 𝑥𝑥𝑛𝑛 , 𝜆𝜆1 , 𝜆𝜆, … . 𝜆𝜆𝑘𝑘 ) = ℒ(𝑥𝑥, 𝜆𝜆 ) = 𝑓𝑓(𝑋𝑋) + ∑𝐾𝐾


𝑘𝑘=1 𝜆𝜆𝑘𝑘 𝑔𝑔𝑘𝑘 (3-4)

𝑓𝑓(𝑋𝑋) = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓ó𝑛𝑛 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜


ℒ(𝑥𝑥1 , 𝑥𝑥2 , … . 𝑥𝑥𝑛𝑛 , 𝜆𝜆1 , 𝜆𝜆, … . 𝜆𝜆𝑘𝑘 ) = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓ó𝑛𝑛 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙

𝜆𝜆1 , 𝜆𝜆, … . 𝜆𝜆𝑘𝑘 = 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿

Los multiplicadores de Lagrange son factores indeterminados que vienen a ser nuevas variables del problema, se incluye
una por cada restricción.

Del gradiente y las restricciones se obtiene el óptimo:

𝑑𝑑𝑑𝑑 𝑑𝑑𝑔𝑔
∇ℒ(𝑥𝑥, 𝜆𝜆) = � + ∑𝑗𝑗 𝜆𝜆𝑗𝑗 𝑑𝑑𝑥𝑥𝑗𝑗� = 0, (3-5)
𝑑𝑑𝑥𝑥𝑖𝑖 𝑖𝑖

𝑔𝑔(𝑥𝑥, 𝜆𝜆) = 0 (3-6)

Se obtendrán n+K ecuaciones algebraicas con n+K incógnitas. Que se resuelven simultáneamente y la solución es el
óptimo buscado. Para que exista una solución óptima debe cumplirse que las ecuaciones del gradiente sean linealmente
independientes.

Ejemplo 3.1

Encontrar las dimensiones de una caja rectangular sin tapa, para contener un volumen de 1,000 cm3 que tenga el área
superficial mínima.

La Figura 3.1 muestra el dibujo de la caja y las ecuaciones de la función objetivo y la restricción.

Función objetivo y restricción:

Área = 2*h*w +l*w +2*h*l

Sujeto a: l*w*h = 1000


h
w
l
Figura 3.1 Dibujo de la caja y ecuaciones de la función objetivo y la restricción del Ejemplo 3.1

El lagrangiano resulta: ℒ(𝑤𝑤, ℎ, 𝑙𝑙, 𝜆𝜆) = 2ℎ𝑤𝑤 + 𝑙𝑙𝑙𝑙 + 2ℎ𝑙𝑙 + 𝜆𝜆(𝑙𝑙𝑙𝑙ℎ − 100) se obtienen las derivadas del gradiente.

Con la calculadora se obtiene

43
Para definir la función de resolución de ecuaciones usar, b371 y solicita el número de ecuaciones y las variables como se
despliega en la Figura 3.2

Figura 3.2 caja de dialogo de la calculadora con el menú de solucionar sistema de ecuaciones.

Nótese que en lugar de λ se usa lam.

Después de calcular las derivadas igualadas a cero se pueden resolver a mano obteniéndose:

w = 10002/3 = 12.6, l = w=12.6, h = w/2= 6.3 y λ = -4/w=-0.3175, con área= 476.22 cm2

Para obtener la solución en Excel abrir una plantilla con la información como se muestra en la Figura 3.3.

Escribir los nombres para identificar a los valores de las celdas ajustables, en A6 escribir ‘Altura (H). En B6 escribir ‘Largo
(L) y en C6 ′Ancho (W). Luego en las celdas A7, B7 y C7 escribir los valores iniciales para empezar el proceso de
minimización, puede escribir 5, 5, y 5, respectivamente.

En la Línea 9 escribir la restricción del volumen requerido. En A9 ‘Restricción:, en B9 la fórmula A7*B7*C7.

En la Línea 10 escribir la ecuación del área. En A10 ‘Area:, en B10 la fórmula 2*A7*C7+B7*C7+2*A7*B7

La plantilla de Excel se muestra en la Figura 3.3

44
Figura 3.3 Resolución en Excel del problema del Ejemplo 3.1

Ejemplo 3.2
Se desea determinar el costo mínimo de operación de un reactor tanque de flujo continuo, el costo de operación
corresponde a la suma de los costos del flujo del reactivo, 𝐶𝐶𝑓𝑓 𝐶𝐶𝐴𝐴0 𝐹𝐹 más el costo de mezclado, 𝐶𝐶𝑚𝑚 𝑉𝑉.

𝐶𝐶𝑇𝑇 = 𝐶𝐶𝑓𝑓 ∗ 𝐶𝐶𝐴𝐴0 ∗ 𝐹𝐹 + 𝐶𝐶𝑚𝑚 ∗ 𝑉𝑉

Dónde:

𝐶𝐶𝑇𝑇 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜ó𝑛𝑛, $/ℎ𝑟𝑟

5$
𝐶𝐶𝑓𝑓 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟,
𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑 𝐴𝐴

𝐶𝐶𝐴𝐴0 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶ó𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛, 0.04 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑 𝐴𝐴/𝑝𝑝𝑝𝑝𝑝𝑝 3

𝑝𝑝𝑝𝑝𝑝𝑝 3
𝐹𝐹 = 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎, ℎ𝑟𝑟

0.3
𝐶𝐶𝑚𝑚 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑧𝑧𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐, $
ℎ𝑟𝑟−𝑝𝑝𝑝𝑝𝑝𝑝 3

𝑉𝑉 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟, 𝑝𝑝𝑝𝑝𝑝𝑝 3

La reacción es de primer orden 𝐴𝐴 → 𝐵𝐵 con una velocidad de formación de 𝐵𝐵 , 𝑟𝑟𝐵𝐵 = 𝑘𝑘 ∗ 𝐶𝐶𝐶𝐶 con 𝑘𝑘 = 0.1 ℎ𝑟𝑟 −1 y se desea
producir 10 lbmol/hr de 𝐵𝐵 sin tener 𝐵𝐵 en la alimentación. 𝐶𝐶𝐶𝐶 es la concentración de 𝐴𝐴 a la salida del reactor.

Para completar el modelo se requieren los balances de materiales de 𝐴𝐴 𝑦𝑦 𝐵𝐵.

Balance de 𝐴𝐴 :

45
Acumulación = flujo de entrada – flujo de salida ⇒ 0 = 𝐶𝐶𝐴𝐴0 ∗ 𝐹𝐹 − (𝑟𝑟𝐵𝐵∗ 𝑉𝑉 + 𝐹𝐹 ∗ 𝐶𝐶𝐶𝐶)

Balance de 𝐵𝐵 :

Acumulación = flujo de entrada – flujo de salida ⇒ 0 = 0 + 𝑘𝑘 ∗ 𝐶𝐶𝐶𝐶 ∗ 𝑉𝑉 − 10

Estas son restricciones al problema:

Restricción 1: (𝐶𝐶𝐴𝐴0 − 𝐶𝐶𝐶𝐶) ∗ 𝐹𝐹 − 𝑘𝑘 ∗ 𝑉𝑉 ∗ 𝐶𝐶𝐶𝐶 = 0

Restricción 2: 10 − 𝑘𝑘 ∗ 𝐶𝐶𝐴𝐴0 ∗ 𝑉𝑉 = 0

Al sustituir los datos se tiene:

Función objetivo: 𝐶𝐶𝑇𝑇 = 5.0(0.04)𝐹𝐹 + 0.3𝑉𝑉

Restricción 1: (0.04 − 𝐶𝐶𝐶𝐶) ∗ 𝐹𝐹 − 0.1𝑉𝑉 ∗ 𝐶𝐶𝐶𝐶 = 0

Restricción 2: 10 − (0.1)𝐶𝐶𝐶𝐶 ∗ 𝑉𝑉 = 0

Se obtienen tres variables, 𝐹𝐹, 𝑉𝑉 𝑦𝑦 𝐶𝐶𝐶𝐶

Se forma el Lagrangiano: ℒ(𝐹𝐹, 𝑉𝑉, 𝐶𝐶𝐶𝐶, 𝜆𝜆1 , 𝜆𝜆2 ) = 0.2𝐹𝐹 + 0.3𝑉𝑉 + 𝜆𝜆1 [(0.04 − 𝐶𝐶𝐶𝐶)𝐹𝐹 − 0.1𝑉𝑉𝑉𝑉𝑉𝑉] + 𝜆𝜆2 [10 − 0.1𝐶𝐶𝐶𝐶𝐶𝐶]

En la calculadora se obtiene:

Se obtienen dos series de resultados:

𝐹𝐹 𝑉𝑉 𝐶𝐶𝐶𝐶 𝜆𝜆1 𝜆𝜆2


Serie 1 1,854.5 -718.246 0.05392 14.3649 41.2702
Serie 2 1,218.25 3,145.5 0.3179 -24.3649 118.73

Puesto que el volumen no puede ser negativo, entonces, la primera serie se descarta y la solución es:

Flujo = 1,218.25 pie3/hr

Volumen= 3,145.5 pie3

Concentración de salida de A = 0.3179 lbmol/pie3

46
Para obtener el costo mínimo se sustituyen los resultados en la función objetivo 𝐶𝐶𝑇𝑇 = 𝐶𝐶𝑓𝑓 ∗ 𝐶𝐶𝐴𝐴0 ∗ 𝐹𝐹 + 𝐶𝐶𝑚𝑚 ∗ 𝑉𝑉

𝐶𝐶𝑇𝑇 = (5)(0.04)(1,218.25) + (0.3)(3,145.5) = $1,187.3

Ejemplo 3.3
Una empresa fabrica dos tipos de piezas, la primera se vende a $500 por unidad y la otra al doble.
Maximizar el beneficio en la fábrica si el total de horas disponibles de fabricación depende de la cantidad de piezas
𝑥𝑥1 𝑦𝑦 𝑥𝑥2 a producir según la ecuación 𝑥𝑥12 + 𝑥𝑥22 /4 = 1700.
Si 𝑥𝑥1 = cantidad de piezas del primer tipo y 𝑥𝑥2 = cantidad de piezas del segundo tipo.
El problema es: Maximizar 𝐺𝐺 = 500𝑥𝑥1 + 1000𝑥𝑥2
Sujeto a 𝑥𝑥12 + 𝑥𝑥22 /4 = 1700

Se forma el lagrangiano: ℒ(𝑥𝑥1 , 𝑥𝑥2 , 𝜆𝜆) = 500𝑥𝑥1 + 1000𝑥𝑥2 − 𝜆𝜆(𝑥𝑥12 + 𝑥𝑥22 /4 − 1700)

Las derivadas del gradiente son:


𝜕𝜕ℒ
= 500−2𝜆𝜆𝑥𝑥1 = 0 de aquí se obtiene, 𝜆𝜆 = 250/𝑥𝑥1
𝜕𝜕𝑥𝑥1

𝜕𝜕ℒ
= 1000−0.5𝜆𝜆𝑥𝑥2 = 0 , de aquí se obtiene, 𝜆𝜆 = 2000/𝑥𝑥2
𝜕𝜕𝑥𝑥2

Igualando los términos de 𝜆𝜆 se obtiene: 𝑥𝑥2 = 8𝑥𝑥1 , luego reemplazando en la restricción se obtiene.

𝑥𝑥1 = 10 , 𝑥𝑥2 = 80 , 𝜆𝜆 = 25 y 𝐺𝐺 = 500(10) + 1000(80) = $85,000

En la calculadora TI-nspire se tiene:

47
Para el caso de problemas con una restricción se puede despejar una de las incógnitas de la restricción y sustituir en la
función objetivo. Así se reduce a un problema univariable que se puede resolver fácilmente. En la calculadora TI-Nspire
se obtiene:

3.3 Método de las condiciones de Kuhn Tucker.

Este método es una extensión del método de los multiplicadores de Lagrange aplicable a problemas con restricciones
que tienen signo de desigualdad. El problema se puede formular como:

Minimizar la función objetivo 𝑓𝑓(𝑋𝑋),

𝑓𝑓(𝑋𝑋) = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … . 𝑥𝑥𝑛𝑛 )

Sujeto a las restricciones:


ℎ1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0
ℎ2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0
...
ℎ𝑚𝑚 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≤ 0

Las condiciones de Kuhn Tucker indican que si el problema tiene un mínimo en 𝑋𝑋 ∗ = (𝑥𝑥1∗ , 𝑥𝑥2∗ , … , 𝑥𝑥𝑛𝑛∗ ) y es un punto local
para el conjunto de restricciones, entonces existe un vector de multiplicadores 𝜇𝜇 que cumple:

𝜕𝜕𝜕𝜕 𝑑𝑑ℎ𝑗𝑗
+ ∑𝑗𝑗 𝜇𝜇𝑗𝑗 𝑑𝑑𝑥𝑥 = 0, 𝑖𝑖 = 1,2, … , 𝑛𝑛 (3-7)
𝜕𝜕𝑥𝑥𝑖𝑖 𝑖𝑖

𝜇𝜇𝑗𝑗 ℎ𝑗𝑗 (𝑥𝑥) = 0, 𝑗𝑗 = 1,2, … , 𝑚𝑚 (3-8)

ℎ𝑗𝑗 ≤ 0 𝑗𝑗 = 1,2, … , 𝑚𝑚 (3-9)

𝜇𝜇𝑗𝑗 ≥ 0 𝑗𝑗 = 1,2, … , 𝑚𝑚 (3-10)

Estas expresiones también son conocidas como condiciones de Karush Kuhn Tucker.
48
En problemas de minimización, si las restricciones son de la forma ℎ𝑗𝑗 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≥ 0 entonces los multiplicadores
serán no positivos, 𝜇𝜇𝑗𝑗 ≤ 0. Pero si el problema es de maximización con restricciones en la forma ℎ𝑗𝑗 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≥ 0,
entonces debe cumplirse 𝜇𝜇𝑗𝑗 ≥ 0. Estos multiplicadores son variables de holgura que transforman las restricciones de
desigualdad a restricciones de igualdad “en el óptimo”.

Las ecuaciones (3-7) son las condiciones necesarias de optimalidad.

Las ecuaciones (3-8) son las condiciones de viabilidad.

Las ecuaciones (3-9) se denominan condiciones de holgura complementaria y

Las condiciones (3-10) son las condiciones de no negatividad.

Si el problema incluye restricciones mixtas de igualdad y desigualdad, entonces las condiciones de optimalidad son:

𝜕𝜕𝜕𝜕 𝑑𝑑𝑔𝑔𝑗𝑗 𝑑𝑑ℎ𝑗𝑗


+ + ∑𝑗𝑗 𝜆𝜆𝑗𝑗 + ∑𝑗𝑗 𝜇𝜇𝑗𝑗 = 0, 𝑖𝑖 = 1,2, … , 𝑛𝑛 (3-11)
𝜕𝜕𝑥𝑥𝑖𝑖 𝑑𝑑𝑥𝑥𝑖𝑖 𝑑𝑑𝑥𝑥𝑖𝑖

La condición suficiente para que el óptimo encontrado sea estrictamente un mínimo local (la función será estrictamente
convexa), la matriz Hessiana debe ser definida positiva.

∇2 ℒ(𝑥𝑥 ∗ ) = ∇2 𝑓𝑓(𝑥𝑥 ∗ ) + ∑ 𝜆𝜆𝑘𝑘 ∇2 ℎ𝑘𝑘 (𝑥𝑥 ∗ ) + ∑ 𝜇𝜇𝑗𝑗 ∇2 𝑔𝑔𝑗𝑗 (𝑥𝑥 ∗ ) (3-12)

Puesto que normalmente en problemas multivariables se pueden encontrar múltiples soluciones, los puntos óptimos
deben cumplir simultáneamente todas condiciones. El procedimiento prueba cada restricción de desigualdad por
separado. Se toma una como posible solución y se analiza si el punto mínimo encontrado cumple con las condiciones de
no negatividad del multiplicador. Si lo cumple es un punto factible y posiblemente crítico, si no se descarta esa
restricción como activa y se toma otra. De los puntos críticos encontrados uno o más serán óptimos por lo que habrá
que compararlos para encontrar el máximo o mínimo global. En escasos problemas no habrá solución alguna.

Ejemplo 3.4

Encontrar: Mínimo 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 𝑥𝑥12 + 𝑥𝑥22 + 60𝑥𝑥1


Sujeto a ℎ1 = 𝑥𝑥1 − 80 ≥ 0
ℎ2 = 𝑥𝑥1 − 𝑥𝑥2 − 120 ≥ 0

Se tienen dos variables y dos restricciones por lo que las condiciones de Kuhn Tucker son:

𝜕𝜕𝜕𝜕 𝑑𝑑𝑔𝑔𝑗𝑗 𝑑𝑑ℎ𝑗𝑗 2𝑥𝑥1 + 60 + 𝜇𝜇1 + 𝜇𝜇2 = 0 (3-13)


+ + � 𝜆𝜆𝑗𝑗 + � 𝜇𝜇𝑗𝑗 = 0, 𝑖𝑖 = 1,2
𝜕𝜕𝑥𝑥𝑖𝑖 𝑑𝑑𝑥𝑥𝑖𝑖 𝑑𝑑𝑥𝑥𝑖𝑖 2𝑥𝑥2 + 𝜇𝜇2 = 0 (3-14)
𝑗𝑗 𝑗𝑗
𝜇𝜇𝑗𝑗 ℎ𝑗𝑗 (𝑥𝑥) = 0, 𝑗𝑗 = 1,2 𝜇𝜇1 (𝑥𝑥1 − 80) = 0 (3-15)
𝜇𝜇2 (𝑥𝑥1 + 𝑥𝑥2 − 120) = 0 (3-16)
ℎ𝑗𝑗 ≤ 0 𝑗𝑗 = 1,2 𝑥𝑥1 − 80 ≥ 0 (3-17)
𝑥𝑥1 + 𝑥𝑥2 − 120 ≥ 0 (3-18)
𝜇𝜇𝑗𝑗 ≥ 0 𝑗𝑗 = 1,2 𝜇𝜇1 ≤ 0 (3-19)
𝜇𝜇2 ≤ 0 (3-20)

El Lagrangiano es: ℒ(𝑥𝑥1 , 𝑥𝑥2 , 𝜇𝜇1 , 𝜇𝜇2 ) = 𝑥𝑥12 + 𝑥𝑥22 + 60𝑥𝑥1 − 𝜇𝜇1 (𝑥𝑥1 − 80) − 𝜇𝜇2 (𝑥𝑥1 − 𝑥𝑥2 − 120)
49
Se analizan los posibles valores de 𝜇𝜇 en las condiciones de viabilidad (3-15) y (3-16), para explorar los puntos que puedan
ser críticos.

De (3-15) se deduce que 𝜇𝜇1 = 0 o que (𝑥𝑥1 − 80) = 0 Por lo que se tendrán dos casos uno para cada una de estas
igualdades.

Caso 1: con 𝜇𝜇1 = 0


𝜇𝜇2
De (3-13) y (3-14) se obtiene: 𝑥𝑥1 = − 30 y 𝑥𝑥2 = −𝜇𝜇2 /2
2

Al sustituir estos valores en (3-16) se obtiene: 𝜇𝜇2 (𝜇𝜇2 − 150) = 0

Por lo que 𝜇𝜇2 es 𝜇𝜇2 = 0 o 𝜇𝜇2 = −150

Caso 1a: Considerando 𝜇𝜇2 = 0 se obtiene 𝑋𝑋 ∗ = [30, 0] pero esta solución viola las condiciones (3-17) y (3-18) por lo que
no es viable.

Caso 1b: Considerando 𝜇𝜇2 = −150 se obtiene 𝑋𝑋 ∗ = [45,75] pero esta solución viola las condiciones (3-17)

Caso 2: con (𝑥𝑥1 − 80) = 0

Si se usa 𝑥𝑥1 = 80 en (3-13) y (3-14) se obtiene:

𝜇𝜇2 = −2𝑥𝑥2 𝑦𝑦 𝜇𝜇1 = 2𝑥𝑥2 − 220 (3-21)

Al sustituir (3-21) en (3-16) se obtiene −2𝑥𝑥2 (𝑥𝑥2 − 40) = 0 por lo que se obtienen dos soluciones.

𝑥𝑥2 = 0 o 𝑥𝑥2 − 40 = 0

Caso 2a: Con 𝑥𝑥2 = 0 se obtiene 𝜇𝜇2 = −220 pero se violan las condiciones (3-17) y (3-18)

Caso 2b: Con 𝑥𝑥2 − 40 = 0 se obtiene 𝜇𝜇1 = −140 y 𝜇𝜇2 = −80 con esto se cumplen todas las condiciones por lo que la
solución es:

𝑋𝑋 ∗ = [80,40]

50
Problemas

3.1 Maximizar la función 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −3𝑥𝑥12 − 6𝑥𝑥1 𝑥𝑥2 − 5𝑥𝑥22 + 7𝑥𝑥1 + 5𝑥𝑥2 sujeto a 𝑥𝑥1 + 𝑥𝑥2 = 5
11 1
El punto extremo es: 𝑥𝑥1∗ = , 𝑥𝑥2∗ = − , 𝜆𝜆∗ = 23 y 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −39.5
2 2

Para determinar que es el máximo se obtienen los valores propios del determinante de la Hessiana. Dando d1=-6, d2=24.
Por lo que sí es un máximo.

3.2 Resolver el problema del Ejemplo 1.6 sujeto a la restricción 𝑃𝑃𝑃𝑃 = 9000

Respuestas: 𝐶𝐶 = 34 ∗ 106 , 𝑃𝑃 = 1500 𝑦𝑦 𝑅𝑅 = 6

3.3 Encuentre los valores de las variables que definen el máximo de la función:

𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −10𝑥𝑥12 + 8𝑥𝑥1 𝑥𝑥2 − 6𝑥𝑥22 + 40𝑥𝑥1 + 55𝑥𝑥2

Sujeto a la restricción: 𝑥𝑥1 + 𝑥𝑥2 10 con 𝑥𝑥1 , 𝑥𝑥2 ≥ 0

Respuestas: x1 = 3.854, x2 = 6.146 y f(x*)=306.51

3.4 Maximizar 60𝑥𝑥 1/3 𝑦𝑦 2/3 sujeto a la restricción: x + y =120,000


1 2
Respuestas: 𝑥𝑥 = 40,000 , 𝑦𝑦 = 80,000, con 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 60 ∗ 400003 ∗ 8000003 = 3.809 ∗ 106

3.5 Una compañía planea gastar 10,000 euros en publicidad. Se sabe que un minuto de publicidad en televisión cuesta
3000 euros y 1,000 euros en la radio. Si la empresa compra x minutos de publicidad en televisión e y minutos en la radio,
su ingreso, está dado por

−2𝑥𝑥 2 − 𝑦𝑦 2 + 𝑥𝑥𝑥𝑥 + 8𝑥𝑥 + 3𝑦𝑦

¿Cómo puede la empresa maximizar sus ingresos?, ¿cuál es la ganancia neta de la compañía?

Respuestas: Se deben comprar 2.46 minutos de televisión y 2.6 minutos de radio para dar una máxima ganancia de
15,018 euros.
La ganancia neta será: 15,018 – 10,000 = 5,018 euros.

𝑥𝑥 2 20𝑦𝑦 𝑥𝑥 𝑦𝑦 2𝑦𝑦 3
3.6 Encontrar el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + + sujeto a la restricción ≤1
𝑦𝑦 2 𝑥𝑥 2 𝑥𝑥

Use el método de los multiplicadores de Lagrange o la sustitución directa de una de las variables. Demuestre con el
cálculo de la Hessiana que se trata de un mínimo.

Respuestas: x = 2, y= 1 y f(x*)=15

Los determinantes menores de la Hessiana dan: d1=7, d2=47/4. Ambos son positivos, por lo que sí es un mínimo.

51
CAPÍTULO 4
Optimización de Funciones no Lineales Univariables

Los problemas de funciones no lineales con una sola variable se pueden resolver de dos
formas, con algoritmos de aproximaciones directos e indirectos. A los métodos directos
se conocen como métodos de búsqueda por reducción de intervalos porque localizan el
óptimo mediante la eliminación sucesiva de subintervalos que reducen el intervalo de
búsqueda restante. Los métodos de búsqueda directos hacen uso de las derivadas de la
función, como el método de Newton Raphson. En este capítulo se presentan ambos
métodos.

52
En la mayoría de los problemas se sabe que el óptimo se encuentra dentro de un rango específico de las variables
independientes, por ejemplo la conversión que debe estar entre los valores de cero y uno. En este ejemplo la conversión
𝑥𝑥 cae en el intervalo [0 , 1] pero se desconoce su valor por lo que al intervalo [a , b]=[0 , 1] se le denomina intervalo o
región de incertidumbre. Los métodos de aproximación numérica que encuentran el óptimo en regiones de intervalos
conocidos se llaman métodos de búsqueda por reducción de intervalos porque localizan el óptimo mediante la
eliminación sucesiva de subintervalos que reducen el intervalo de búsqueda restante.

4.1 Métodos de búsqueda por reducción de intervalos

Los métodos directos univariables hacen la búsqueda de los puntos óptimos mediante sucesivas reducciones del
intervalo de estudio, con tres o más puntos en los que se evalúa la función objetivo y posteriormente se hace la
eliminación de subintervalos, acotando la región de búsqueda y terminar cuando se logra una precisión requerida en el
último intervalo.

Se considera que la función objetivo es unimodal, se puede definir un criterio para eliminar regiones donde
seguro el óptimo no se encuentra. Para ello se necesita evaluar la función en al menos dos puntos dentro del intervalo y
aplicar algún criterio para eliminar una parte de la región de incertidumbre y se continúa reduciendo hasta que se
encuentre un intervalo suficientemente pequeño. A este tipo de métodos también se les conoce como métodos directos
en oposición a los métodos que usan derivadas y que son conocidos como métodos indirectos.

4.2 Método de la bisección o división dicotómica.

Este método divide la región de búsqueda por la mitad y se aplica de la siguiente forma:

Empezando la búsqueda en la región delimitada por 𝑎𝑎 ≤ 𝑥𝑥 ≤ 𝑏𝑏 se prueba la función en dos valores da 𝑥𝑥1 y 𝑥𝑥2
comprendidos entre a y b, 𝑎𝑎 < 𝑥𝑥1 < 𝑥𝑥2 < 𝑏𝑏 para determinar cuál es el que más se aproxima al optimo, ya sea el
máximo o mínimo buscado. Si lo que se busca es el máximo se tendrán tres casos:

𝑆𝑆𝑆𝑆 𝑓𝑓( 𝑥𝑥1 ) > 𝑓𝑓( 𝑥𝑥2 ), entonces el máximo se encuentra en el intervalo (𝑎𝑎, 𝑥𝑥2 )

Si 𝑓𝑓( 𝑥𝑥1 ) < 𝑓𝑓( 𝑥𝑥2 ) entonces el máximo se encuentra entre 𝑥𝑥1 𝑦𝑦 𝑏𝑏

Si 𝑓𝑓( 𝑥𝑥1 ) = 𝑓𝑓( 𝑥𝑥2 ) entonces el máximo se encuentra entre 𝑥𝑥1 𝑦𝑦 𝑥𝑥2

Los valores 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 se determinan muy cercanos al punto medio de la región de búsqueda,

𝑎𝑎+𝑏𝑏 𝑎𝑎+𝑏𝑏
𝑥𝑥1 = 2
− 𝑒𝑒 y 𝑥𝑥2 = 2
+ 𝑒𝑒 (4-1)

Se elige un valor de 𝑒𝑒 muy pequeño, por ejemplo 𝑒𝑒 = 0.01

Se puede determinar el número de iteraciones 𝑛𝑛 para reducir el intervalo de incertidumbre final a una longitud 𝑡𝑡, la
fórmula:

53
ln(𝑏𝑏−𝑎𝑎)/𝑡𝑡
𝑛𝑛 = � � (4-2)
ln(2)

Con 𝑡𝑡 = 0.2 se espera una reducción del intervalo original en 2%.

El algoritmo procede de acuerdo a los siguientes pasos (para el caso de maximización):

1. Determinar el número de iteraciones requeridas para lograr una reducción del intervalo de incertidumbre a una
cantidad muy pequeña, con la ecuación (4-2).
2. Repetir los pasos 3 y 4, 𝑛𝑛 veces.
3. Aplicar las fórmulas (4-1) y calcular 𝑓𝑓( 𝑥𝑥1 ) 𝑦𝑦 𝑓𝑓( 𝑥𝑥2 )
4. 𝑆𝑆𝑆𝑆 𝑓𝑓( 𝑥𝑥1 ) > 𝑓𝑓( 𝑥𝑥2 ) entonces hacer 𝑏𝑏 = 𝑥𝑥2 si no entonces 𝑎𝑎 = 𝑥𝑥1
𝑥𝑥2 + 𝑥𝑥1
5. Se determina el óptimo de la función 𝑓𝑓( 𝑥𝑥 ∗ ) con los últimos valores de 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 , 𝑥𝑥 ∗ =
2

Ejemplo 4.1

En la prueba balística de un cañón se sabe que el proyectil sigue una trayectoria definida por:

ℎ(𝑡𝑡) = 75𝑡𝑡 3/4 − 2.5𝑡𝑡 2


Donde 𝑡𝑡 es el tiempo y ℎ es la altura.

Determine el valor de la altura máxima que alcanza el proyectil y a que tiempo se logra el máximo.

El problema se resuelve con la ayuda de la calculadora TI nspire como se muestra en la Figura 4.1

54
Figura 4.1 Resolución del problema del proyectil del Ejemplo 4.1

En la Figura 4.1 se indica en las primeras instrucciones que se determina el tiempo al cual el proyectil toca el piso con la
instrucción solve(h(x)=0,x)

El algoritmo de búsqueda se implementa con un pequeño programa en una línea, la cual en su forma completa es:

For i,1,7:x1:=((a+b)/2)-e:x2:=((a+b)/2)+e:If (h(x)|x=x1)≥(h(x)|x=x2)Then:x2→b:Else:x1→a:EndIf:Disp a,b,h(x1),h(x2):EndFor

Después de 7 iteraciones se obtiene el último intervalo 𝑥𝑥1 = 6.9048 𝑦𝑦 𝑥𝑥2 = 7.0419 por lo que el tiempo del máximo
6.9048 + 7.0419
estimado en 𝑥𝑥 ∗ = = 6.9148 con una altura máxima de 200.277.
2

Los valores exactos son: 𝑡𝑡 = 6.933 con una altura ℎ = 200.278

La gráfica de la trayectoria también se grafica en la calculadora como se muestra en la Figura 4.2

55
Figura 4.2 Trayectoria del proyectil del Ejemplo 4.1

La línea con las instrucciones del algoritmo se desglosa de la siguiente manera:

For i,1,7
X1:=((a+b)/2)-e
X2:=((a+b)/2)+e
If (h(x)evaluado en x=x1≥(h(x)evaluado en x=x2)
Then x2→b
Else x1→a
EndIf
Disp a,b,h(x1),h(x2)
EndFor

Los resultados de los cálculos se resumen en la siguiente Tabla 4.1

Tabla 4.1 Resumen de resultados del Ejemplo 4.1

X1 X2 h(x1) h(x2)
0 7.51 199.315  199.244
3.745 7.51 166.844  167.277
5.6175 7.51  194.774  194.941
6.55375 7.51 199.826  199.873
6.55375 7.04188 200.253  200.241
6.78781 7.04188 200.212  200.229
6.90484 7.04188 200.275  200.278

Se observa que en casi todas las iteraciones el límite derecho no cambia por lo que el límite izquierdo es sustituido por
un nuevo valor en cada iteración excepto la quinta.

56
4.3 Método de la Sección Dorada.

Primero se define el intervalo inicial de búsqueda y segundo se aplica un procedimiento de búsqueda que reduzca la
región de búsqueda partiendo el intervalo anterior en tres segmentos y eliminando el que no contenga al óptimo (ver
Figura 4.3).

La forma de dividir los intervalos es en una proporción fija denominada sección dorada o proporción aurea. El origen del
método se basa en la división constante de cualquier segmento rectilíneo cuya longitud se divide en dos partes 𝐴𝐴 y 𝐵𝐵 de
tal forma que la proporción entre 𝐴𝐴 y 𝐵𝐵 sea igual a la proporción entre la suma de ambos (𝐴𝐴 + 𝐵𝐵) y el segmento más
largo 𝐴𝐴, la figura 4.4 ilustra esta división.

𝐴𝐴 (𝐴𝐴+𝐵𝐵)
Entonces:
𝐵𝐵
= 𝐴𝐴

𝐴𝐴 𝐴𝐴 𝐵𝐵 1
Si esta proporción se denota por τ se obtiene: 𝜏𝜏 = = + =1+
𝐵𝐵 𝐴𝐴 𝐴𝐴 𝜏𝜏

Se obtiene: 𝜏𝜏 2 − 𝜏𝜏 − 1 =0, cuya solución da,


√5−1
𝜏𝜏 = = 0.618033 (4-3)
2

ƒ(x)

a x1 x
x2 b

Figura 4.3 División de la región de búsqueda (a, b) en tres segmentos.

B A

A-B

a x1 x2 b

A B

Figura 4.4 Gráfica de la división en dos regiones A y B del intervalo de búsqueda (a, b)

57
La ubicación de coordenadas inicial y final de cada segmento se determina con:

𝑥𝑥1 = 𝑏𝑏 − 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑎𝑎 + 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) (4-4)

Equivalentemente se pueden aplicar las fórmulas: 𝑥𝑥1 = 𝑎𝑎 + (1 − 𝜏𝜏)(𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑏𝑏 − (1 − 𝜏𝜏)(𝑏𝑏 − 𝑎𝑎)

Si la función 𝑓𝑓(𝑥𝑥) es monótona en la región [𝑎𝑎, 𝑏𝑏] el método de la sección dorada procede eliminando uno de los
segmentos, supuestamente el que no contiene el óptimo. El método para minimizar una función univariable 𝑓𝑓(𝑥𝑥)
procede iterativamente hasta llegar a una reducción del intervalo original que contenga el mínimo.

Las pruebas para determinar que segmento se elimina son:

Si 𝑓𝑓(𝑥𝑥1) < 𝑓𝑓(𝑥𝑥2), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥2 → 𝑏𝑏; 𝑥𝑥1 → 𝑥𝑥2 ; 𝑓𝑓(𝑥𝑥1) → 𝑓𝑓(𝑥𝑥2) 𝑦𝑦 𝑥𝑥1 = 𝑏𝑏 − 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) Eliminar segmento [𝑥𝑥2 , 𝑏𝑏]

Si 𝑓𝑓(𝑥𝑥2) < 𝑓𝑓(𝑥𝑥1), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥1 → 𝑎𝑎; 𝑥𝑥2 → 𝑥𝑥1 ; 𝑓𝑓(𝑥𝑥2) → 𝑓𝑓(𝑥𝑥1) 𝑦𝑦 𝑥𝑥2 = 𝑎𝑎 + 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) Eliminar segmento [𝑎𝑎, 𝑥𝑥1 ]

Los puntos intermedios se colocan simétricamente equidistantes con respecto a los límites iniciales por lo que se elimina
un segmento que tiene la misma longitud que el segmento que se conserva. En la búsqueda sólo se requiere la
evaluación de uno de los puntos intermedios y la función en ese punto.

Entonces si 𝐿𝐿0 es la longitud inicial del intervalo [𝑎𝑎, 𝑏𝑏] y 𝐿𝐿𝑘𝑘 es la longitud luego de k iteraciones, corresponde a la región
de incertidumbre y donde se puede continuar la búsqueda.

Después de aplicar el método 𝑛𝑛 iteraciones al intervalo inicial 𝐿𝐿0 = (𝑏𝑏 − 𝑎𝑎) el intervalo final 𝐿𝐿𝑛𝑛 tendrá una longitud
𝐿𝐿𝑛𝑛 = 𝜏𝜏 𝑛𝑛−1 𝐿𝐿0. Al aplicar logaritmos se obtiene:

log(𝐿𝐿𝑛𝑛 )
𝑛𝑛 − 1 = (4-5)
log(𝐿𝐿0 )

Para reducir el intervalo inicial a 1% al tomar logaritmos se obtiene; (𝑛𝑛 − 1)log(𝜏𝜏) ≤ log(0.01) se requieren al menos
10 iteraciones al despejar 𝑛𝑛 − 1

log(0.01) −2
𝑛𝑛 − 1 = = = 9.57
log(0.618033) −0.20899

Ejemplo 4.2 Se propone aprovechar el calor residual que salen con los gases de combustión de un horno que tienen un
flujo de 60,000 lb/h y capacidad calorífica de 0.25 BTU/lbºF, a una temperatura de 500ºF. Para ello se debe instalar un
cambiador de calor que tiene un coeficiente global de calor de 4.0 BTU/h-pie2-ºF y se desea producir vapor a una
temperatura de 220ºF a partir de agua líquida saturada a 220ºF. El vapor que se obtendría tendría un valor de $0.75 por
millón de BTU y el costo de instalación del cambiador se puede estimar en $5 por pie cuadrado de área. El costo se
amortiza en 5 años a una tasa de interés de8%.

El beneficio económico de la inversión P por los cinco años de instalación considerando el valor del vapor (ingresos por
ahorro de energía) y el costo del nuevo cambiador es:
𝑃𝑃 = 𝑣𝑣 ∗ 𝑄𝑄 ∗ 𝑛𝑛 − 𝐶𝐶 ∗ 𝐴𝐴 ∗ (1 + 𝑖𝑖)𝑛𝑛
Dónde:
𝑃𝑃 = 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑖𝑖𝑛𝑛𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣ó𝑛𝑛
𝑣𝑣 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐵𝐵𝐵𝐵𝐵𝐵 = $0.75/106 𝐵𝐵𝐵𝐵𝐵𝐵
𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿
58
𝑛𝑛 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 = 5 𝑎𝑎ñ𝑜𝑜𝑜𝑜
𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = $5.0/𝑝𝑝𝑝𝑝𝑝𝑝 2
𝐴𝐴 = Á𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝 2
𝑙𝑙𝑙𝑙
𝑚𝑚 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ó𝑛𝑛 = 60,000

𝐵𝐵𝐵𝐵𝐵𝐵
𝐶𝐶𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐í𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 0.25
𝑙𝑙𝑙𝑙º𝐹𝐹
𝑇𝑇𝑖𝑖𝑖𝑖 = 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 500º𝐹𝐹
4𝐵𝐵𝐵𝐵𝐵𝐵
𝑈𝑈 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 =
ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 − º𝐹𝐹
�𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 �−(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
∆𝑇𝑇𝐿𝐿𝐿𝐿 = (𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑢𝑢𝑢𝑢 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )

En la ecuación de la diferencia de temperatura logarítmica se obtiene:


500−𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜
∆𝑇𝑇𝐿𝐿𝐿𝐿 = 280
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −220)

Al sustituir los datos se obtiene:

$0.75 60,000𝑙𝑙𝑙𝑙 0.25𝐵𝐵𝐵𝐵𝐵𝐵 24ℎ 365𝑑𝑑í𝑎𝑎𝑎𝑎


𝑃𝑃 = � 6 �� �� � (500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) � �� � (5 𝑎𝑎ñ𝑜𝑜𝑜𝑜)
10 𝐵𝐵𝐵𝐵𝐵𝐵 ℎ 𝑙𝑙𝑙𝑙 − º𝐹𝐹 𝑑𝑑í𝑎𝑎 𝑎𝑎ñ𝑜𝑜
$5 60,000𝑙𝑙𝑙𝑙 0.25𝐵𝐵𝐵𝐵𝐵𝐵 ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 º𝐹𝐹 1
− � 2� � �� � (500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) � � (1 + 0.8)5
𝑝𝑝𝑝𝑝𝑝𝑝 ℎ 𝑙𝑙𝑙𝑙 − º𝐹𝐹 4𝐵𝐵𝐵𝐵𝐵𝐵 500 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 º𝐹𝐹
280
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 − 220)

Al simplificar se obtiene:

𝑃𝑃 = 91,137 − 492.75𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 + 27,549.9 ln(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 -220)

Se tiene un problema de maximización de beneficios en términos de una variable que en este caso es la temperatura de
los gases a la salida del cambiador, 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜

Resolución con la calculadora TI-nspire. Empezar abriendo tres ventanas, la primera con una página de notas para
describir el problema, la segunda con una calculadora para insertar la función a optimizar y la tercera con una hoja de
cálculo para ingresar los cálculos con el método de la sección dorada.

La página de notas se muestra en la Figura 4.5 (a). En la página con la calculadora se define la función, Figura 4.5 (b).
También se calcula el máximo con fMax condicionando a que el valor de la variable sea mayor a 230, es decir,
𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓(𝑓𝑓(𝑥𝑥), 𝑥𝑥)|𝑥𝑥 > 230.

59
(a) (b)
Figura 4.5 (a) Página de notas, (b) Página de la calculadora con la función y el óptimo.

En la página con la calculadora se define la función. También se calcula el máximo con fMax condicionando a que el
valor de la variable sea mayor a 230, es decir, 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓(𝑓𝑓(𝑥𝑥), 𝑥𝑥)|𝑥𝑥 > 230.

Las hojas de cálculo como Excel muestran un formato de tabla en la que las celdas son identificadas por una letra para
cada columna y por un número para cada fila. En la hoja de cálculo de la calculadora después de definir los rótulos de las
primeras 6 columnas para a, b, x1, x2, f(x1) y f(x2) que son: a y b los valores extremos del intervalo con que inicia la
búsqueda; x1, x2, son los segmentos internos izquierdo y derecho; f(x1) y f(x2) son la función en el segmento izquierdo y
la función en el segmento derecho, respectivamente.

Después se definen en a1 y b1 los valores del intervalo inicial 230 y 350 respectivamente y luego en las celdas c1 y d1
ingresar las fórmulas para determinar el segmento izquierdo y el derecho de la sección dorada:
1.618−1 𝑏𝑏−𝑎𝑎
𝑥𝑥1 = 𝑎𝑎 + (𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑎𝑎 + , Figuras 4.6 (a) y (b) respectivamente.
1.618 1.618

(a) (b)
Figura 4.6 Ingreso de las fórmulas para los segmentos internos de la sección dorada.

Luego en la línea de ingreso para la celda e1 se escribe =f(c1) para evaluar la función con el valor de la celda c1. Lo
mismo se hace para la celda f1 para evaluar la función con el valor de la celda d1. Figuras 4.7 (a) y 4.7 (b).
60
(a) (b)
Figura 4.7 (a) Definición de la función en los valores de los segmentos internos.

En la celda a2 definir la función = 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) para indicar que si el valor de la celda f1 es mayor que el de la
celda e1, entonces poner en a2 el valor de c1 en caso contrario poner el valor de a1 ver Figuras 4.8 (a) y (b). Lo anterior
se repite para todas las hileras de la 2 en adelante. En la columna a se indica la siguiente prueba para ubicar el óptimo: Si
𝑓𝑓(𝑥𝑥1) > 𝑓𝑓(𝑥𝑥2) 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 = 𝑥𝑥1, 𝑠𝑠𝑠𝑠 𝑛𝑛𝑛𝑛, 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 = 𝑎𝑎

Similarmente en la columna b: 𝑓𝑓(𝑥𝑥2) > 𝑓𝑓(𝑥𝑥1) 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑏𝑏 = 𝑥𝑥2, 𝑠𝑠𝑠𝑠 𝑛𝑛𝑛𝑛, 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑏𝑏 = 𝑏𝑏

Estas dos condiciones en la columna 𝑎𝑎 y la 𝑏𝑏 prueban si el óptimo cae cerca del extremo izquierdo o el derecho,
respectivamente.

(a) (b)
Figura 4.8 (a) Pruebas de la condición de acotamiento del óptimo entre los límites a y b.

Luego copiar las fórmulas de las celdas desde c1 hasta f1 en c2 y f2 respectivamente, Figura 4.9 (a). Después copiar la
hilera 2 en la hilera 3 y repetir sucesivamente hasta alcanzar el óptimo. Al término de nueve iteraciones se obtiene una
diferencia menor a un grado en los dos últimos valores calculados de la temperatura y se toma el promedio de valores
como el valor de convergencia, Figura 4.9 (b).

61
(a) (b)
Figura 4.9 (a) Copiado de fórmulas en hilera 2, (b) Cálculos en las nueve iteraciones.

Entre los dos últimos valores de la temperatura 𝑥𝑥1 = 275.836 y 𝑥𝑥2 = 276.44 se encuentra el valor óptimo buscado,
𝑥𝑥 = 275.911 dando un máximo beneficio de 66,0361dolares.

El área del cambiador de calor se determina de la ecuación:

𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿

𝑄𝑄 = 60,000(0.25)(500 − 275.91) = 3,361,350 𝐵𝐵𝐵𝐵𝐵𝐵


500−275.91
Entonces de la ecuación, 𝑄𝑄 = 4(𝐴𝐴) 280 = 3,361,350
𝑙𝑙𝑙𝑙(275.91−220)

Se obtiene el área óptima del cambiador: 𝐴𝐴 = 11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2

$
Y el costo del cambiador es: 𝐶𝐶 = 5 (11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2 ) = $56,139.82
𝑝𝑝𝑝𝑝𝑝𝑝 2

Es importante resaltar que la secuencia de cálculos de la Figura 4.7 (b) es una plantilla de la hoja de cálculo que permite
usar el método de búsqueda de la sección dorada para cualquier problema, generándose una aplicación de hoja de
cálculo personalizada.

El porciento de reducción del intervalo inicial después de nueve iteraciones es aproximadamente 2%:

𝐿𝐿8 276.44 − 275.836


= = 0.021
𝐿𝐿0 350 − 230
4.4 Método de Fibonacci

La secuencia de los números de Fibonacci se forma con: 𝐹𝐹𝑛𝑛 = 𝐹𝐹𝑛𝑛−1 + 𝐹𝐹𝑛𝑛−2 empezando en 𝐹𝐹1 = 1 y 𝐹𝐹2 = 1

La fórmula para definir los puntos intermedios son:


𝐹𝐹𝑛𝑛−1 𝐹𝐹𝑛𝑛−1
𝑥𝑥1 = 𝑏𝑏 − (𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑎𝑎 + (𝑏𝑏 − 𝑎𝑎)
𝐹𝐹𝑛𝑛 𝐹𝐹𝑛𝑛

El método se aplica como el de la sección dorada para reducir el intervalo de búsqueda.

62
Se tendrán cuatro puntos en los valores 𝑎𝑎, 𝑏𝑏, 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 con sus respectivos valores de la función
𝑓𝑓(𝑎𝑎), 𝑓𝑓(𝑏𝑏), 𝑓𝑓(𝑥𝑥1 ) 𝑦𝑦 𝑓𝑓(𝑥𝑥2 ). Para determinar que segmento se elimina se comparan los valores 𝑓𝑓(𝑥𝑥1 ) con 𝑓𝑓(𝑥𝑥2 ). En el
caso de buscar el máximo se elimina el segmento que contenga al menor valor de la función. Por ejemplo si 𝑓𝑓(𝑥𝑥2 ) es
menor de 𝑓𝑓(𝑥𝑥1 ) se elimina el segmento comprendido entre 𝑓𝑓(𝑥𝑥2 ) y 𝑏𝑏, la siguiente Figura 4.10 muestra este caso.

F(x1) F(x2)

a x1 x2 b

Segmento a eliminar

Figura 4.10 Los cuatro segmentos para la búsqueda del máximo.

El nuevo intervalo de búsqueda está comprendido entre 𝑎𝑎 y 𝑥𝑥2 , se hace 𝑥𝑥2 equivalente a 𝑏𝑏 y se repite el procedimiento
como se muestra en Figura 4.11.
F(x1) F(x2)

a x1 x2 b
Este pasa a ser x2 Este pasa a ser el
nuevo valor de b
a x1 x2 b

Figura 4.11 Nuevos segmentos para la búsqueda en segunda iteración.

Ejemplo 4.3 Se resuelve el problema del Ejemplo 4.2 en la calculador TI nspire, pero con la fórmula de Fibonacci.
Primero se define la secuencia de los números de Fibonacci, por ejemplo para nueve términos se tiene:
1,1,2,3,5,8,13,21,34,55,89. Estos números se colocan primero en la columna H de la Hoja de cálculo empezando en 89 y
55 en la línea 1.

El intervalo inicial es 𝑎𝑎 = 230 y 𝑏𝑏 = 350. Colocarlos en las celdas a1 y b1. Los valores de la serie de Fibonacci se colocan
en la columna H de la Hoja de cálculo empezando en 89 y 55 en la línea 1.

A B C D E F G H
a b x1 x2 f(x1) f(x2) Fn Fn-1
1 230 350 ℎ1 ℎ1 F(c1) F(d1) 89 55
𝑏𝑏1 − (𝑏𝑏1 − 𝑎𝑎1) 𝑎𝑎1 + (𝑏𝑏1 − 𝑎𝑎1)
𝑔𝑔1 𝑔𝑔1
2 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑒𝑒1 > 𝑓𝑓1, 𝑑𝑑1, 𝑏𝑏1) ℎ2 ℎ2 F(c2) F(d2) 55 34
𝑏𝑏2 − (𝑏𝑏2 − 𝑎𝑎2) 𝑎𝑎2 + (𝑏𝑏2 − 𝑎𝑎2)
𝑔𝑔2 𝑔𝑔2

En las celdas 𝑐𝑐1 y 𝑑𝑑1 escribir las fórmulas para los puntos intermedios y en las celdas 𝑒𝑒1 y f1 las funciones a maximizar
evaluadas en 𝑐𝑐1 y 𝑑𝑑1 respectivamente. Las preguntas para determinar que segmento se elimina se colocan en a2 y b2,
𝑖𝑖𝑖𝑖𝑓𝑓𝑛𝑛(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) y 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑒𝑒1 > 𝑓𝑓1, 𝑑𝑑1, 𝑏𝑏1) respectivamente. Luego copiar las celdas 𝑐𝑐1 a la ℎ1y pegar en las celdas
de la 𝑐𝑐2 a la ℎ2. Finalmente, repetir las líneas de la 2 a la 9. Con estos pasos queda configurada la plantilla de hoja de
cálculo para aplicar el método de búsqueda de Fibonacci. La hoja de cálculo en la calculadora TI-Nspire es:

Se obtienen casi los mismos resultados que con el método de la sección dorada.

63
Se puede demostrar que la relación entre el enésimo intervalo y el primero se define por:

𝐿𝐿𝑛𝑛 𝐹𝐹1 1
= = (4-6)
𝐿𝐿𝑜𝑜 𝐹𝐹𝑛𝑛 𝐹𝐹𝑛𝑛

Esta expresión permite estimar previamente el número de pruebas necesarias para lograr una aproximación dada. Por
1 1
ejemplo con 8 iteraciones se tiene = = 0.029 ~0.03 una reducción al 3%.
𝐹𝐹𝑛𝑛 34

275.843−274.494
En el Ejemplo 4.3 se tiene para la octava iteración: = 0.01124 que representa finalmente, una reducción
350−230
de aproximadamente al 1% del intervalo inicial, hay que empezar con el valor 𝐹𝐹𝑛𝑛 = 89 y terminar con 𝐹𝐹1 = 3.

4.5 Método de interpolación cuadrática para minimizar

El método de interpolación cuadrática usa un polinomio de segundo orden empleando tres puntos 𝑥𝑥0 , 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 para
estimar un nuevo punto más cercano al óptimo 𝑥𝑥𝑚𝑚 . Ver Figura 4.12

La fórmula de interpolación en aproximaciones sucesivas es:


1 𝑓𝑓0 �𝑥𝑥12 −𝑥𝑥22 �+𝑓𝑓1 �𝑥𝑥22 −𝑥𝑥02 �+𝑓𝑓2 (𝑥𝑥02 −𝑥𝑥12 )
𝑥𝑥𝑚𝑚 = (4-7)
2 𝑓𝑓0 (𝑥𝑥1 −𝑥𝑥2 )+𝑓𝑓1 (𝑥𝑥2 −𝑥𝑥0 )+𝑓𝑓2 (𝑥𝑥0 −𝑥𝑥1 )

Donde 𝑥𝑥𝑚𝑚 es el valor interpolado usando una aproximación de una ecuación cuadrática 𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐

ƒ(x)

x
x0 x1 xm x2
Figura 4.12 Puntos seleccionados para la interpolación cuadrática.

64
La fórmula de interpolación se encuentra resolviendo un sistema de tres ecuaciones de la función cuadrática cada una
para cada punto.

𝑎𝑎𝑥𝑥02 + 𝑏𝑏𝑥𝑥0 + 𝑐𝑐 = 𝑓𝑓(𝑥𝑥0 )

𝑥𝑥02 𝑥𝑥0 1 𝑎𝑎 𝑓𝑓(𝑥𝑥0 )


𝑎𝑎𝑥𝑥12 + 𝑏𝑏𝑥𝑥1 + 𝑐𝑐 = 𝑓𝑓(𝑥𝑥1 ) en forma de matrices se obtiene: �𝑥𝑥12 𝑥𝑥1 1� � � = �𝑓𝑓(𝑥𝑥1 )�
𝑏𝑏
𝑥𝑥22 𝑥𝑥2 1 𝑐𝑐 𝑓𝑓(𝑥𝑥2 )
𝑎𝑎𝑥𝑥22 + 𝑏𝑏𝑥𝑥2 + 𝑐𝑐 = 𝑓𝑓(𝑥𝑥2 )

El punto óptimo para la función cuadrática propuesta se obtiene con la derivada de la función cuadratica,
𝑑𝑑
𝑓𝑓 ′ (𝑥𝑥) = (𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐) = 0 que resulta 𝑥𝑥𝑚𝑚 = −𝑏𝑏/2𝑎𝑎
𝑑𝑑𝑑𝑑

Con la regla de Cramer obtiene:

𝑓𝑓(𝑥𝑥0 ) 𝑥𝑥0 1
�𝑓𝑓(𝑥𝑥1 ) 𝑥𝑥1 1� = 𝐷𝐷𝑎𝑎 = 𝑓𝑓(𝑥𝑥0 )(𝑥𝑥1 − 𝑥𝑥2 ) + 𝑓𝑓(𝑥𝑥1 )(𝑥𝑥2 − 𝑥𝑥0 ) + 𝑓𝑓(𝑥𝑥2 )(𝑥𝑥0 − 𝑥𝑥1 )
𝑓𝑓(𝑥𝑥2 ) 𝑥𝑥2 1

𝑥𝑥02 𝑓𝑓(𝑥𝑥0 ) 1
�𝑥𝑥12 𝑓𝑓(𝑥𝑥1 ) 1� = 𝐷𝐷𝑏𝑏 = 𝑓𝑓(𝑥𝑥0 )(𝑥𝑥12 − 𝑥𝑥22 ) + 𝑓𝑓(𝑥𝑥1 )(𝑥𝑥22 − 𝑥𝑥02 ) + 𝑓𝑓(𝑥𝑥2 )(𝑥𝑥02 − 𝑥𝑥12 )
𝑥𝑥22 𝑓𝑓(𝑥𝑥2 ) 1

𝑥𝑥02 𝑥𝑥0 1
�𝑥𝑥12 𝑥𝑥1 1� = 𝐷𝐷 = 𝑥𝑥02 (𝑥𝑥1 − 𝑥𝑥2 ) + 𝑥𝑥12 (𝑥𝑥2 − 𝑥𝑥0 ) + 𝑥𝑥22 (𝑥𝑥0 − 𝑥𝑥1 )
𝑥𝑥22 𝑥𝑥2 1
𝐷𝐷
𝑏𝑏 � 𝑏𝑏 �
Puesto que 𝑎𝑎 = 𝐷𝐷𝑎𝑎 /𝐷𝐷 y 𝑏𝑏 = 𝐷𝐷𝑏𝑏 /𝐷𝐷 , entonces: 𝑥𝑥𝑚𝑚 = − = − 𝐷𝐷
𝐷𝐷
= 𝐷𝐷𝑏𝑏 /2𝐷𝐷𝑎𝑎
2𝑎𝑎 2� 𝑎𝑎 �
𝐷𝐷

1 𝑓𝑓0 �𝑥𝑥12 −𝑥𝑥22 �+𝑓𝑓1 �𝑥𝑥22 −𝑥𝑥02 �+𝑓𝑓2 (𝑥𝑥02 −𝑥𝑥12 )


Obteniéndose: 𝑥𝑥𝑚𝑚 =
2 𝑓𝑓0 (𝑥𝑥1 −𝑥𝑥2 )+𝑓𝑓1 (𝑥𝑥2 −𝑥𝑥0 )+𝑓𝑓2 (𝑥𝑥0 −𝑥𝑥1 )

En el caso de minimización para seleccionar los siguientes tres puntos se pueden presentar cuatro casos:

Si 𝑥𝑥𝑚𝑚 > 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) ≥ 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥1 → 𝑥𝑥0 ; 𝑥𝑥𝑚𝑚 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥2 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥0 , 𝑥𝑥1 )

Si 𝑥𝑥𝑚𝑚 > 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) < 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥0 → 𝑥𝑥0 ; 𝑥𝑥1 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥𝑚𝑚 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥𝑚𝑚 , 𝑥𝑥2 )

Si 𝑥𝑥𝑚𝑚 < 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) ≥ 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥0 → 𝑥𝑥0 ; 𝑥𝑥𝑚𝑚 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥1 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥𝑚𝑚 , 𝑥𝑥2 )

Si 𝑥𝑥𝑚𝑚 < 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) < 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥𝑚𝑚 → 𝑥𝑥0 ; 𝑥𝑥1 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥2 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥0 , 𝑥𝑥1 )

Estas pruebas en la variable y la función se aprecian mejor en un diagrama de flujo como el de la Figura 4.13

65
X0x0 si si si X1x0
no Xmx1
Xmx1 Xfm >f1 Xxm >x1 Xfm >f1
X1x2 X2x2
no no

Xmx0 X0x0
X1x1 X1x1
X2x2 Xmx2

Figura 4.13 Pruebas para la eliminación de intervalos por interpolación.

Ejemplo 4.4

La fabricación del percloroetileno se basa en la reacción simultánea de pirolisis y halogenación. La reacción principal es:

C3H8 +8*Cl2 --> Cl2C=CCl2 + CCl4 + 8 HCl

A 550 ºC y 1.5 atm con una relación de reactivos en la alimentación M= 15 (mol Cl2/mol C3H8), el tiempo de un lote
depende del tiempo en el reactor Tr más el tiempo de separación Ts

1 𝑀𝑀 − 𝑥𝑥
𝑇𝑇𝑇𝑇 = 𝑙𝑙𝑙𝑙
0.03(𝑀𝑀 − 1) 𝑀𝑀(1 − 𝑥𝑥)

𝑇𝑇𝑇𝑇 = 0.8 + 10(1 − 𝑥𝑥)

El costo de operación es una función de la suma de los tiempos de operación que a su vez dependen de la conversión del
propano en el reactor: x
El costo por uso de equipos es de 100 $/h en el reactor y 70 $/h en los destiladores
La función a minimizar es:
1 𝑀𝑀 − 𝑥𝑥
𝐶𝐶𝑇𝑇 = � 𝑙𝑙𝑙𝑙 � ∗ 100 + [0.8 + 10(1 − 𝑥𝑥)] ∗ 70
0.03(𝑀𝑀 − 1) 𝑀𝑀(1 − 𝑥𝑥)
Se simplifica a:
15 − 𝑥𝑥
𝑓𝑓(𝑥𝑥) = �238.095 ∗ 𝑙𝑙𝑙𝑙 � + 56 + 700(1 − 𝑥𝑥)
15(1 − 𝑥𝑥)

Iniciar la búsqueda con 𝑥𝑥0 = 0.1 𝑦𝑦 𝑥𝑥2 = 0.9

Se abren dos ventanas en la calculadora, la primera para definir la función y la segunda un con una hoja de cálculo para
aplicar el método, ver figura 4.14.

En la primera linea de la hoja de cálculo ingresar los valores:

A1 = 0.1; B1=(A1+D1)/2; D1=0.9; C1=la fórmula de interpolación; E1=f(B1); F1=f(C1)

En la segunda linea ingresar:


66
A2=iffn(c1>b1,iffn(f(f1)>f(e1),b1,a1),iffn(f(f1)>f(e1),a1,c1))
B2=iffn(c1>b1,iffn(f(f1)>f(e1),c1,b1),iffn(f(f1)>f(e1),c1,b1))
D2=iffn(c1>b1,iffn(f(f1)>f(e1),d1,c1),iffn(f(f1)>f(e1),b1,d1))

Duplicar las celdas C1 en C2 y E1 en E2 y F1 en F2

Figura 4.14 Resolución del Ejemplo 4.3 en la calculadora TI Nspire

El error es menor a 0.5% en la octava iteración

4.6 Método de Newton

De la misma manera que se desarrolla el método de Newton Raphson para encontrar las raíces de las funciones no
lineales, se puede aplicar para encontrar los puntos críticos de funciones no lineales.

Para una función 𝑓𝑓(𝑥𝑥) de una variable a ser minimizada y suponiendo que en 𝑥𝑥𝑘𝑘 es posible evaluar
𝑓𝑓(𝑥𝑥), 𝑓𝑓 ′ (𝑥𝑥𝑘𝑘 ) 𝑦𝑦 f”(xk). Entonces es posible construir una aproximación cuadrática a partir del desarrollo de Taylor:

1
𝑓𝑓(𝑥𝑥) ≈ 𝑓𝑓(𝑥𝑥𝑘𝑘 ) + 𝑓𝑓 ′ (𝑥𝑥𝑘𝑘 ) ∗ (𝑥𝑥 − 𝑥𝑥𝑘𝑘 ) + 2𝑓𝑓 ′′ (𝑥𝑥𝑘𝑘 ) ∗ (𝑥𝑥 − 𝑥𝑥𝑘𝑘 )2

Se puede estimar 𝑥𝑥𝑘𝑘+1 determinando el punto donde la derivada de 𝑓𝑓(𝑥𝑥) se hace cero:

𝑓𝑓 ′ (𝑥𝑥𝑘𝑘 ) = 𝑓𝑓′(𝑥𝑥𝑘𝑘 ) + 𝑓𝑓 ′′ (𝑥𝑥𝑘𝑘 ) ∗ (𝑥𝑥𝑘𝑘+1 − 𝑥𝑥𝑘𝑘 ) = 0

Se despeja 𝑥𝑥𝑘𝑘+1 da:

𝑓𝑓′(𝑥𝑥𝑘𝑘 )
𝑥𝑥𝑘𝑘+1 = 𝑥𝑥𝑘𝑘 − (4-8)
𝑓𝑓′′(𝑥𝑥𝑘𝑘 )

Esta es la fórmula de Newton Raphson para que a partir de un punto inicial (𝑥𝑥0 ) se llegue a un punto crítico
aproximándose mejor a cada nueva iteración.

Se usan como criterios para dar por terminada la búsqueda de los puntos críticos cuando ocurra lo siguiente:
67
a) Cuando el número de iteraciones sea mayor a un número preestablecido y/o,
𝑓𝑓(𝑥𝑥𝑘𝑘+1 )−𝑓𝑓(𝑥𝑥𝑘𝑘 )
b) � 𝑓𝑓(𝑥𝑥𝑘𝑘+1 )
� ≤ 𝑒𝑒 donde 𝑒𝑒 es un valor pequeño, por ejemplo, 10-4.

( ) ( )
f x k +1 − f x k < ε
Ejemplo 4.5

Encontrar las raíces y puntos críticos de la función: 𝑓𝑓(𝑥𝑥) = (4 − (𝑥𝑥 + 1)2 )𝑥𝑥

Se usa la calculadora TI nspire para resolver el problema.

Después de definir la función, se define la fórmula de Newton Raphson para encontrar raiceds:

𝑓𝑓(𝑥𝑥)
𝑛𝑛𝑛𝑛 = 𝑥𝑥 −
𝑑𝑑
(𝑓𝑓(𝑥𝑥))
𝑑𝑑𝑑𝑑

Y se aplica el algoritmo a partir del punto inicial 𝑥𝑥 = 0.1 con la instrucción:

𝐹𝐹𝐹𝐹𝐹𝐹 𝑖𝑖, 1,5: 𝑥𝑥 ≔ 𝑛𝑛𝑛𝑛(𝑥𝑥): 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑥𝑥, 𝑓𝑓(𝑥𝑥): 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸

Se aplica el algoritmo en cinco iteraciones. Se obtiene una primera raíz en 𝑥𝑥 = 0

Después se define la fórmula de Newton Raphson para encontrar los puntos críticos:
𝑑𝑑
𝑓𝑓(𝑥𝑥)
𝑛𝑛𝑛𝑛2 = 𝑥𝑥 − 2𝑑𝑑𝑑𝑑
𝑑𝑑
(𝑓𝑓(𝑥𝑥))
𝑑𝑑𝑥𝑥 2
Se encuentra el punto crítico en 𝑥𝑥 = 0.535184

Luego se inicia otra búsqueda alrededor del punto 𝑥𝑥 = −1


Se encuentra otro punto crítico en 𝑥𝑥 = −1.86812
Finalmente se evalúa la función en los puntos críticos y se obtiene la segunda derivada de la función en esos puntos
críticos para determinar sus características.

Los resultados se resumen en la siguiente tabla:

Puntos críticos, 𝑥𝑥 ∗ = Función, 𝑓𝑓(𝑥𝑥 ∗ ) 𝑑𝑑2


(𝑓𝑓(𝑥𝑥 ∗ )
𝑑𝑑𝑥𝑥 2
-1.86812 -6.0646 7.2111
0.535184 0.87942 -7.2111

Con lo que se determina que el primer punto crítico es un mínimo y el segundo un máximo.

Posteriormente se grafica la función y se identifican los puntos críticos, Figura 4.15.

68
69
Figura 4.15 Identificación de los puntos críticos de 𝑓𝑓(𝑥𝑥) = (4 − (𝑥𝑥 + 1)2 )𝑥𝑥

70
Problemas

4.1 En el intervalo de incertidumbre para x entre [0, 2], encontrar el óptimo de:

f ( x) = 4 4 − 14 x 3 + 60 x 2 − 70 x

a) Con el método de la sección dorada efectué tres iteraciones.


b) Con el método de Fibonacci efectué tres iteraciones empezando con el número F5 = 8.
c) Con el método de interpolación cuadrática efectué tres iteraciones
d) Compare los resultados para determinar cuál método da la mejor aproximación al verdadero mínimo.

71
CAPÍTULO 5
Optimización de Funciones no Lineales Multivariables

Los métodos numéricos de optimización multivariable se dividen en dos grupos. Los


primeros que usan algoritmos de aproximación sin el empleo de derivadas. En este
grupo se tienen el método de búsqueda paralela a los ejes, el método de Hook y
Jeeves, como principales. En el otro grupo se tienen métodos que usan derivadas
en sus aproximaciones numéricas. Los más empleados son el método del gradiente
y el método de Newton Raphson. En este capítulo se describen los métodos de
ambos grupos con ejemplos que ilustran la aplicación a problemas de dos variables.

72
Los métodos de optimización numérica proceden siguiendo un patrón fijo de operaciones en la que las variables tienen
cambios o movimientos sucesivos hasta llegar al objetivo que sea maximizar o minimizar la función objetivo. A partir de
un conjunto inicial de valores de las variables denominado punto base, luego se debe seleccionar tanto una dirección
del movimiento hacia una región mejor, como la distancia del movimiento a lo largo de dicha dirección, obteniendo así
un nuevo punto base para el movimiento siguiente.

Las coordenadas de un nuevo punto en las variables serán:


𝑥𝑥 𝑗𝑗+1 = 𝑥𝑥 𝑗𝑗 + 𝑠𝑠 ∙ 𝑑𝑑 𝑗𝑗 (5-1)
Dónde:
𝑥𝑥 𝑗𝑗 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏
𝑠𝑠 = 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑏𝑏ú𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
𝑑𝑑 𝑗𝑗 = 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑ó𝑛𝑛 𝑑𝑑𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚

5.1 Método de búsqueda paralela a los ejes coordenados.

Este método se aplica de dos formas diferentes:

a) Con un valor de magnitud del paso de búsqueda fijo y b) buscando un valor de cambio del paso variable que optimice
la función objetivo.

En el caso que la magnitud de cambio sea constante las coordenadas de un nuevo punto en las variables serán:

𝑥𝑥 𝑗𝑗+1 = 𝑥𝑥 𝑗𝑗 ± ∆𝑥𝑥 𝑗𝑗 (5-2)

Se aplica de la siguiente manera:

A partir de un punto inicial o base 𝑥𝑥 𝑏𝑏 y un valor de ∆𝑥𝑥 𝑗𝑗 para cada variable y la definición de la tolerancia de
convergencia, se procede de la siguiente manera.

a) Variar una de las variables manteniendo constantes las otras variables. Se prueba un cambio positivo y si la
función mejora pasar al siguiente paso. Si no mejora la función objetivo, cambiar la dirección de búsqueda.
b) Probar las otras variables con movimientos en la dirección que mejora la función.
c) Si al probar tanto el cambio positivo como el negativo y la función no mejora, reducir la magnitud del
movimiento.
d) Repetir (a) y (b) hasta lograr la tolerancia de la convergencia

Para el caso en que la magnitud de cambio no se mantiene fija, entonces 𝑠𝑠 se determina con una optimización de
búsqueda univariable como los que se describieron en el capítulo 4.

Este método es muy fácil de entender y programar pero es muy lento en converger especialmente en contornos
elípticos de la función con ejes rotados y muy alongados. En la Figura 5.1 se muestra una secuencia de movimientos
paralela a los ejes en una función de dos variables para encontrar el máximo.

73
x2
Δx2
Δx1

x1
Figura 5.1 Movimientos de búsqueda paralela a los ejes.

Ejemplo 5.1

Aplicar el método de búsqueda paralela a los ejes coordenados para minimizar la función:

𝑓𝑓(𝑥𝑥, 𝑦𝑦) = (𝑥𝑥 2 + 𝑦𝑦 − 11)2 + (𝑥𝑥 + 𝑦𝑦 2 − 7)2

A partir del punto inicial (1,1) y con incrementos iniciales de (0.5, 0.5), esta función se conoce como función de
Himmelblau, la cual es difícil de converger ya que tiene siete puntos extremos.

Los resultados de la búsqueda se dan en la siguiente tabla:

x1 x2 f1 delta1 delta2
1 1 106.0 0.5 0.5
1.5 1 80.3 0.5 0.5
1.5 1.5 63.1 0.5 0.5
2 1.5 37.8 0.5 0.5
2 2 26.0 0.5 0.5
2.5 2 7.8 0.5 0.5
2.5 2.5 8.1 0.5 0.25
2.5 2.25 6.6 0.5 0.25
3 2.25 1.2 0.5 -0.25
3 2 0

Se observa que el movimiento entre los puntos (2.5, 2) y (2.5, 2.5) la función deja de disminuir para aumentar de f(2.5,
2) = 7.8 a f(2.5, 2.5)=8.1, por lo que se debe disminuir el tamaño del incremento.

Los movimientos se observan en la gráfica de la Figura 5.2.

74
4.0

3.5

3.0

8.1
2.5

6.6 1.2
26 2.0
7.8 0.0

63 37 1.5

F=106 80 1.0

0.5

0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Figura 5.2 Movimientos de la búsqueda paralela a los ejes en el Ejemplo5.1.

Con la calculadora TI nspire se implementa la búsqueda paralela a los ejes de la función de Himmelblau y minimización
del paso de incremento ver Figura 5.3

75
Figura 5.3 Instrucciones de la búsqueda paralela a los ejes del Ejemplo 5.1

76
Ejemplo 5.2

Un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una disolución acuosa, utilizando
disolvente nuevo en cada etapa. La disolución entra al sistema con un caudal de 500 kg de agua/h y con una
concentración xo = 0.20 kg de soluto por kg de agua. Dadas las distintas condiciones de mezcla en cada etapa, puede
admitirse que en la primera la relación de equilibrio entre las corrientes que salen de ella viene expresada por

𝑦𝑦1 = 1.8 𝑥𝑥1 , mientras que en la segunda sería 𝑦𝑦2 = 2.2 𝑥𝑥2, siendo:

yi: kg de soluto/kg de disolvente en el extracto que sale de la etapa i.

xi: kg de soluto/kg de agua en el refinado que sale de la etapa i.

Si el valor del soluto recuperado es de 1,000 $/kg y el precio del disolvente de 80 $/kg, determinar el caudal óptimo de
disolvente a utilizar en cada una de las etapas, W1 y W2 (kg/h), para maximizar la diferencia entre el valor del soluto
recuperado y el costo del disolvente gastado. Considere que el flujo de W1 + W2 no deben ser mayor al caudal de la
disolución a tratar.

El diagrama de las dos etapas de extracción se da en la Figura 5.4:


W1 = kg d/h W2 = kg d/h

W0 = 500 kg A/h
① Etapa ③ Etapa
1 2
x0 = 0.2 kg S/kg A X1= kg S/kg A X2= kg S/kg A


y1 = 1.8x1 kg S/kg d y2 = 2.2x2 kg S/kg d

Figura 5.4 Diagrama del proceso de extracción por solventes.

Balance del soluto en la etapa 1 es:

𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑞𝑞𝑞𝑞𝑞𝑞 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑞𝑞𝑞𝑞𝑞𝑞 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑞𝑞𝑞𝑞𝑞𝑞


� �=� �+� �
𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 1 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑒𝑒𝑒𝑒 3 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑒𝑒𝑒𝑒 4

Es decir:

500 𝑘𝑘𝑘𝑘 𝐴𝐴 0.2 𝑘𝑘𝑘𝑘 𝑆𝑆 500 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑥𝑥1 𝑘𝑘𝑘𝑘 𝑆𝑆 𝑦𝑦1 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑤𝑤1 𝑘𝑘𝑘𝑘 𝑑𝑑
� �� �=� �� �+� �� �
ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑘𝑘𝑘𝑘 𝑑𝑑 ℎ
500∗0.2
Puesto 𝑦𝑦1 = 1.8 𝑥𝑥1 se obtiene: 500 ∗ 0.2 = 500𝑥𝑥1 + 1.8𝑥𝑥1 𝑤𝑤1 de donde: 𝑥𝑥1 =
(500+1.8𝑤𝑤1 )

𝑥𝑥1 500
Del balance de la segunda etapa se obtiene: 𝑥𝑥2 =
(500+2.2𝑤𝑤2

La función objetivo es: 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 − 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝

77
Entonces:
500 500 ∗ 0.2
max 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 500 �0.2 − � 1000
(500 + 2.2𝑤𝑤2 (500 + 1.8𝑤𝑤1 )
− (𝑤𝑤1 + 𝑤𝑤2 )80
Con la restricción: 𝑤𝑤1 + 𝑤𝑤2 < 500

Para aplicar el método de búsqueda paralela a los ejes 𝑤𝑤1 𝑦𝑦 𝑤𝑤2 se define 𝑤𝑤1 = 100 𝑦𝑦 𝑤𝑤2 = 100 ,

El procedimiento en la calculadora TI nspire se muestra a continuación:

78
En cinco iteraciones converge a la solución.
𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘
La solución exacta es: 𝑤𝑤1 = 151.1876 𝑦𝑦 𝑤𝑤2 = 201.6258 con valor de la función de 𝑓𝑓 = 37,461.19 $/ℎ
ℎ ℎ

5.2 Método de Hooke y Jeeves.

Este método funciona con dos tipos de movimientos de búsqueda, el primero denominado búsqueda exploratoria y el
segundo de búsqueda patrón. El procedimiento se describe a continuación:

Algoritmo para maximizar funciones no lineales con dos variables 𝑓𝑓(𝑥𝑥, 𝑦𝑦).

Iniciar un contador de iteraciones 𝑖𝑖 = 0 y definir los valores de los incrementos iniciales de las variables ∆𝑥𝑥 y ∆𝑦𝑦

1. Iniciar con un punto bases 𝑏𝑏0 = (𝑥𝑥0 , 𝑦𝑦0 ) y evaluar la función en este punto, 𝑓𝑓(𝑥𝑥0 , 𝑦𝑦0 )
2. Movimiento exploratorio: incrementar 𝑥𝑥 y probar si mejora la función, 𝑓𝑓(𝑥𝑥0 + ∆𝑥𝑥 , 𝑦𝑦0 ) > 𝑓𝑓(𝑥𝑥0 , 𝑦𝑦0 ) sino
disminuir 𝑥𝑥 𝑓𝑓(𝑥𝑥0 − ∆𝑥𝑥 , 𝑦𝑦0 ) y pasar a examinar cambios en la dirección de la otra variable, 𝑦𝑦 probando en qué
dirección mejora la función, ya sea con 𝑦𝑦 + ∆𝑦𝑦 o con 𝑦𝑦 − ∆𝑦𝑦 . Si no mejora en ambos movimientos, entonces
reducir los incrementos y repetir el movimiento patrón. El movimiento que define el mejor cambio se define
𝑝𝑝
como 𝑏𝑏𝑖𝑖+1 = (𝑥𝑥𝑖𝑖+1 , 𝑦𝑦𝑖𝑖+1 )
3. Movimiento patrón: se calcula un nuevo punto extrapolando el punto base anterior 𝑏𝑏𝑖𝑖 con el punto del
𝑝𝑝
movimiento patrón, 𝑏𝑏𝑖𝑖+1 con la fórmula:
𝑝𝑝
𝑏𝑏𝑖𝑖+1 = 2 ∗ 𝑏𝑏𝑖𝑖+1 − 𝑏𝑏𝑖𝑖 (5-3)

79
4. Si la función en 𝑏𝑏𝑖𝑖+1 comparada con el mejor de los valores calculados anteriormente es mejor, tomar como
nuevo punto base al punto 𝑏𝑏𝑖𝑖+1 incrementar 𝑖𝑖 y regresar a 2. Si el punto extrapolado no mejora tomar como
𝑝𝑝
nuevo punto base al punto 𝑏𝑏𝑖𝑖+1 , incrementar 𝑖𝑖 y regresar a 2.
5. Terminar cuando el error relativo entre dos valores de la función en iteraciones sucesivas es muy pequeño, por
ejemplo menor a 10−4 o cuando la norma de los incrementos es menor que una tolerancia preestablecida.

El movimiento exploratorio en la vecindad del último punto define un nuevo punto, con estos dos se define otro por
extrapolación. Si en cualquiera de los movimientos de exploración o patrón no se produce una mejoría en la función
objetivo, entonces reducir el tamaño del incremento y continuar la búsqueda en ambos movimientos.

Ejemplo 5.3

Maximizar 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 + 𝑦𝑦 − 0.12𝑦𝑦 3 + 2.5𝑥𝑥𝑥𝑥 − 0.12𝑥𝑥 3 con el método de Hooke y Jeeves empezar con (𝑥𝑥0, 𝑦𝑦0) =
(1.5,2.5)𝑦𝑦 ∆𝑥𝑥 = ∆𝑦𝑦 = 2.
Terminar cuando error relativo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) sea menor a 10-3 o Δ se reduzca 5 veces o se alcancen 5 iteraciones.

Con la calculadora TI nspire se resuelve el problema como se indica en las figuras 5.5, y 5.6

Figura 5.5 Primeras dos iteraciones del método Hooke y Jeeves del Ejemplo 5.3

Figura 5.6 Iteraciones tres y cuatro del método Hooke y Jeeves del Ejemplo 5.3

Converge en cuatro iteraciones y el óptimo con valores promedio es (𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = (7.3125, 7.3125), 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 54.4621
y se cumple que el error es menor a 10-3.

En la Tabla 5.2 se presentan los valores de las variables y la función en cada iteración.

80
Tabla 5.2 Valores de las variables y la función en la resolución del Ejemplo 5.3

Iteración 𝑥𝑥 𝑦𝑦 𝑓𝑓(𝑥𝑥, 𝑦𝑦)


0 1.5 2.5 11.095
1 3.5 4.5 31.295
2 7.5 7.5 54.375
3 7.25 7.25 54.4475
4 7.3125 7.3125 54.4621

5.3. Método del Gradiente

El método de gradiente también conocido como método del descenso más pronunciado del inglés steepest descent, es
el método más empleado para obtener el óptimo de funciones multivariables no lineales. Básicamente se aplica en una
serie de pasos en los que a cada iteración los nuevos valores calculados se aproximan cada vez más al óptimo.

La fórmula para obtener las coordenadas de un nuevo punto en las variables es:

𝑥𝑥 𝑗𝑗+1 = 𝑥𝑥 𝑗𝑗 + 𝑎𝑎 ∙ ∇𝑓𝑓�𝑥𝑥 𝑗𝑗 � (5-4)

Dónde: 𝑥𝑥 𝑗𝑗 𝑦𝑦 𝑥𝑥 𝑗𝑗+1 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑗𝑗 𝑦𝑦 𝑗𝑗 + 1

𝑎𝑎 = 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑏𝑏ú𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠

∇𝑓𝑓�𝑥𝑥 𝑗𝑗 � = 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓ó𝑛𝑛 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑥𝑥 𝑗𝑗

Para la maximización de la función 𝑓𝑓(𝑥𝑥, 𝑦𝑦) el método garantiza que 𝑓𝑓(𝑥𝑥 𝑗𝑗+1 , 𝑦𝑦 𝑗𝑗+1 ) > 𝑓𝑓(𝑥𝑥 𝑗𝑗 , 𝑦𝑦 𝑗𝑗 ), porque el gradiente
+∇𝑓𝑓(𝑥𝑥, 𝑦𝑦) define una dirección en que la función aumenta. Geométricamente el gradiente es ortogonal (perpendicular)
a los contornos de la función en el punto de mayor incremento de la función. Un gradiente negativo −∇𝑓𝑓(𝑥𝑥, 𝑦𝑦) apunta
en la dirección de mayor disminución de la función, ver Figura 5.7.

x2 f(x) = 5 k
-∇f(x )
f(x) = 20
k
∇f(x )

k
x

f(x) = 25
x1

Figura 5.7 Gráfica de los contornos de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) con los gradientes en 𝑓𝑓2.
81
Con la condición de ortogonalidad se determina que

𝛻𝛻𝛻𝛻(𝑥𝑥, 𝑦𝑦)𝑇𝑇 �−∇𝑓𝑓(𝑥𝑥, 𝑦𝑦)� < 0

𝛻𝛻𝛻𝛻(𝑥𝑥, 𝑦𝑦)𝑇𝑇 �−∇𝑓𝑓(𝑥𝑥, 𝑦𝑦)� = �𝛻𝛻𝛻𝛻(𝑥𝑥, 𝑦𝑦) �

Que representa la magnitud del gradiente

2
𝜕𝜕𝜕𝜕 2𝜕𝜕𝜕𝜕 2
�𝛻𝛻𝛻𝛻(𝑥𝑥, 𝑦𝑦) � = ��𝜕𝜕𝜕𝜕� + �𝜕𝜕𝜕𝜕� (5-5)

El procedimiento para la aplicación del método es:

1. Definir un punto de partida, 𝑥𝑥 0 , iniciar un contador de iteraciones, 𝑗𝑗 = 0 y definir el criterio de terminación.


2. Calcular el gradiente ∇𝑓𝑓(𝑥𝑥 𝑗𝑗 ) y la función 𝑓𝑓(𝑥𝑥 𝑗𝑗 )
3. Calcular la magnitud del paso de cambio en las coordenadas, 𝑎𝑎. Este valor se debe determinar maximizando o
minimizando, según sea al caso, la función 𝑓𝑓(𝑥𝑥 𝑗𝑗 − 𝑎𝑎 ∙ ∇𝑓𝑓�𝑥𝑥 𝑗𝑗 �). Esta es una función univariable y se puede usar
cualquier método de optimización univariable para encontrar 𝑎𝑎.
4. Determinar el nuevo punto aplicando la fórmula de actualización: 𝑥𝑥 𝑗𝑗+1 = 𝑥𝑥 𝑗𝑗 − 𝑎𝑎 ∙ ∇𝑓𝑓(𝑥𝑥 𝑗𝑗 )
5. Probar si converge. Si no converge incrementar el contador de iteraciones y regresar a 2.

Los pasos 3 y 4 son muy importantes en el método. Primero el cálculo de la magnitud del paso de cambio en las
coordenadas, 𝑎𝑎 que puede hacerse con una búsqueda de la sección dorada o interpolación cuadrática. Segundo la
fórmula de actualización con la cual progresivamente las coordenadas se acercan más al óptimo. En cada iteración el
error de las funciones en dos iteraciones sucesivas se hace más y más pequeño.

Como criterio de convergencia se puede usar el error relativo de la función en dos iteraciones sucesivas, el cual se puede
especificar como un valor pequeño, por ejemplo 10-4 o 10-5. También se pude usar la magnitud del gradiente o los
valores de las derivadas de la función en el gradiente cuyo valor disminuye a cada iteración, ya que la condición
necesaria para obtener el óptimo es que las derivadas sean cero en un punto estacionario.

Ejemplo 5.4 Obtener el máximo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥(𝑦𝑦 + 4) − 𝑥𝑥 2 − 0.5(𝑦𝑦 2 − 6𝑦𝑦 + 2) usando el método del gradiente
(ascenso más pronunciado) empezando en (𝑥𝑥 0 , 𝑦𝑦 0 ) = (2,2) y terminar cuando ��𝑓𝑓(𝑥𝑥 𝑘𝑘 ) − 𝑓𝑓(𝑥𝑥 𝑘𝑘−1 )�/𝑓𝑓(𝑥𝑥 𝑘𝑘 )� ≤ 10−4

𝑥𝑥 1 2 −2𝑥𝑥 + 𝑦𝑦 + 4 2 − 2𝑎𝑎
En la primera iteración: � 1 � = � � − 𝑎𝑎 � � =� �
𝑦𝑦 2 𝑥𝑥 − 𝑦𝑦 + 3 2 − 3𝑎𝑎

2 − 2𝑎𝑎
El máximo de 𝑓𝑓 �� � � = −2.5𝑎𝑎2 − 13𝑎𝑎 + 11 se puede obtener igualando a cero la primera derivada de 𝑓𝑓(𝑥𝑥, 𝑦𝑦)
2 − 3𝑎𝑎
en términos de 𝑎𝑎, 𝑓𝑓(1 − 2𝑎𝑎, 2 − 3𝑎𝑎) = (2 − 2𝑎𝑎)((2 − 3𝑎𝑎) + 4) − (2 − 2𝑎𝑎)2 − 0.5((2 − 3𝑎𝑎)2 − 6(2 − 3𝑎𝑎) + 2)
𝑑𝑑 −13
�𝑓𝑓(1 − 2𝑎𝑎, 2 − 3𝑎𝑎)� = −2.5𝑎𝑎2 − 13𝑎𝑎 + 11 = 0 da 𝑎𝑎 = = −2.6 , entonces:
𝑑𝑑𝑑𝑑 5

𝑥𝑥 1 2 2 7.2
� � = � � + 2.6 � � = � � con f(7.2, 9.8) = 27.9
𝑦𝑦1 2 3 9.8

𝑥𝑥 2 7.2 −0.6 6.97059


� � = � � − 0.38235 � �=� � con f(6.97059, 9.95294) = 27.9994
𝑦𝑦 2 9.8 0.4 9.95294
82
k xk yk f(xk,yk) 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅 𝒂𝒂
0 0 0 11 4 3
1 7.2 9.8 27.9 -0.6 0.4 -2.6
2 6.97059 9.95294 27.9994 0.01176 0.01765 -0.3823
3 7.00117 9.99884 28 -0.0035 0.00233

El error en la tercera iteración se tiene: |(𝑓𝑓(𝑥𝑥 3 ) − 𝑓𝑓(𝑥𝑥 2 ))/𝑓𝑓(𝑥𝑥 3 )| = 0.000021 < 10−4
Converge en tres iteraciones.
Se calculan los determinantes de la Hessiana para determinar si es un máximo o un mínimo.
𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 −2 1 −2 1
� 𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
� =� � se obtiene 𝑑𝑑1 = −2 y 𝑑𝑑2 = � �=1
1 −1 1 −1
𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2

Por lo que corresponde a un máximo. La solución exacta es: 𝑥𝑥 = 7, 𝑦𝑦 = 10, 𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓(7, 10) = 28.
La gráfica de las curvas de contorno se muestra en Figura 5.8

Figura 5.8 Gráfica de las curvas de contorno de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥(𝑦𝑦 + 4) − 𝑥𝑥 2 − 0.5(𝑦𝑦 2 − 6𝑦𝑦 + 2) con máximo en (7,10)

Las instrucciones en la calculadora TI nspire para resolver este problema usando una notación vectorial se muestran a
continuación:

83
84
Ejemplo 5.5

En el Ejemplo 6.2 se optimiza un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una
disolución acuosa, donde resulta la función objetivo:

500 500 ∗ 0.2


max 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 500 �0.2 − � 1000 − (𝑤𝑤1 + 𝑤𝑤2 )80
(500 + 2.2𝑤𝑤2 (500 + 1.8𝑤𝑤1 )

La fórmula de iteración del método del gradiente es:

𝑑𝑑
𝑤𝑤1 𝑖𝑖+1
𝑤𝑤1 𝑖𝑖 𝑓𝑓(𝑤𝑤1𝑖𝑖 , 𝑤𝑤2𝑖𝑖 )
𝑑𝑑𝑑𝑑1
=
� 𝑖𝑖+1 � � 𝑖𝑖 � + 𝑎𝑎 � 𝑑𝑑 � (5-6)
𝑤𝑤2 𝑤𝑤2 𝑓𝑓(𝑤𝑤1𝑖𝑖 , 𝑤𝑤2𝑖𝑖 )
𝑑𝑑𝑑𝑑2

El parámetro 𝑎𝑎 se determina con una búsqueda lineal que maximiza la función en la dirección del gradiente.

El procedimiento en la calculadora TI nspire se muestra en la Figura 5.9

85
Figura 5.9 Instrucciones del método del gradiente para resolver el ejemplo3.

En cuatro iteraciones converge a la solución con un error de 10-6 en la función objetivo.


𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘
La solución exacta es: 𝑤𝑤1 = 151.1876 𝑦𝑦 𝑤𝑤2 = 201.6258 con valor de la función de 𝑓𝑓 = 37,461.19 $/ℎ
ℎ ℎ

7.2 Método de Newton Raphson

Una aproximación al gradiente de f en un punto x0 usando el desarrollo de Taylor resulta:

∇f ( x ) ≈ ∇f ( x 0 ) + ∇ 2 f ( x 0 ) ⋅ ( x − x 0 ) (5-7)

X será un punto estacionario de 𝑓𝑓(𝑥𝑥) si 𝛁𝛁𝒇𝒇�𝒙𝒙 � = 𝟎𝟎. Podemos hacer el lado derecho de la ecuación igual a cero y re
arreglar para obtener

[
x = x 0 − ∇ 2 f (x 0 ) ] −1
⋅ ∇f ( x 0 ) (5-8)

Al generalizar esta ecuación para dar una expresión iterativa del Método de Newton:

[
x k +1 = x k − ∇ 2 f (x k ) ]−1
⋅ ∇f ( x k )
−𝟏𝟏
o 𝒙𝒙𝒌𝒌+𝟏𝟏 = 𝒙𝒙𝒌𝒌 − 𝑯𝑯�𝒙𝒙𝒌𝒌 � 𝛁𝛁𝒇𝒇(𝒙𝒙𝒌𝒌 ) (5-9)

[∇ 2
]
f (x k ) =H(x) es la matriz Hessiana en la fórmula de aproximación para dos variables queda:

86
−1
𝜕𝜕2 𝑓𝑓 𝜕𝜕 𝜕𝜕𝜕𝜕 𝑑𝑑𝑑𝑑
𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝑑𝑑𝑑𝑑
𝑥𝑥 𝑘𝑘+1 = 𝑥𝑥 𝑘𝑘 − � 𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕2 𝑓𝑓
� �𝑑𝑑𝑑𝑑 � (5-10)
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2 𝑑𝑑𝑑𝑑

El método de Newton aproxima 𝑓𝑓′(𝑥𝑥) como una línea recta a 𝒙𝒙𝒌𝒌 y obtiene un nuevo punto 𝒙𝒙𝒌𝒌+𝟏𝟏 que es usado para
aproximar la función a la siguiente iteración. Esto se repite hasta que el nuevo punto es suficientemente cercano a 𝒙𝒙∗ .
Gráficamente se muestra esta aproximación en la Figura 5.9

Tangente de f′
k
(x) en x

* k+1
f′ (x) x x x x
k

Figura 5.8 Diagrama del método de aproximación de Newton Raphson.

Si lo que se busca es un mínimo entonces debe cumplirse que 𝑓𝑓�𝑥𝑥 𝑘𝑘+1 � < 𝑓𝑓�𝑥𝑥 𝑘𝑘 � , y 𝑓𝑓�𝑥𝑥 𝑘𝑘+1 � > 𝑓𝑓�𝑥𝑥 𝑘𝑘 � para encontrar
un máximo.

Al comparar los métodos del gradiente y de Newton Raphson son muy similares, la principal diferencia es que el
Newton Raphson usa tanto el gradiente como la matriz Hessiana. Con esto se obtiene una convergencia más rápida
hacia los puntos críticos con el método de Newton Raphson que con el método del gradiente pero aumenta el cálculo
necesario para cada iteración. El cálculo de la inversa no se requiere si notamos que
−1
−𝐻𝐻�𝑥𝑥 𝑘𝑘 � ∇𝑓𝑓�𝑥𝑥 𝑘𝑘 � = 𝑝𝑝 (5-11)

Entonces el vector 𝒑𝒑 se puede obtener resolviendo el sistema lineal de ecuaciones:

𝐻𝐻�𝑥𝑥 𝑘𝑘 � 𝑝𝑝 = −∇𝑓𝑓�𝑥𝑥 𝑘𝑘 � (5-11)

Evitando así el cálculo de la inversa de la matriz Hessiana.

Ejemplo 5.6
Obtener el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 2 − 5𝑥𝑥𝑥𝑥 + 𝑦𝑦 4 − 25𝑥𝑥 − 8𝑦𝑦

Use el método de Newton Raphson empezando en (𝑥𝑥 0 , 𝑦𝑦 0 ) = (2,2) y terminar cuando ��𝑓𝑓(𝑥𝑥 𝑘𝑘 ) − 𝑓𝑓(𝑥𝑥 𝑘𝑘−1 )�/𝑓𝑓(𝑥𝑥 𝑘𝑘 )� ≤
10−4 .
𝑑𝑑𝑑𝑑 𝜕𝜕2 𝑓𝑓 𝜕𝜕 𝜕𝜕𝜕𝜕
𝑑𝑑𝑑𝑑 2𝑥𝑥 − 5𝑦𝑦 − 25 𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 2 −5
El Gradiente y la Hessiana: �𝑑𝑑𝑑𝑑 � =� � � 𝜕𝜕 𝜕𝜕𝜕𝜕 � =� �
−5𝑥𝑥 + 4𝑦𝑦 3 − 8 𝜕𝜕2 𝑓𝑓 −5 12𝑦𝑦 2
𝑑𝑑𝑑𝑑 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2
Iteración 1:
87
𝑥𝑥 1 𝑥𝑥 0 2 −5 −1 2𝑥𝑥 − 5𝑦𝑦 − 25 𝑥𝑥 1 2 2 −5 −1 −31
� � = � � − � � � � � 1� = � � − � � � �
𝑦𝑦1 𝑦𝑦 0 −5 12𝑦𝑦 2 −5𝑥𝑥 + 4𝑦𝑦 3 − 8 𝑦𝑦 2 −5 48 14

𝑥𝑥 1 21.9718
� 1� = � � con 𝑓𝑓(21.9718,3.78873) = −307.02
𝑦𝑦 3.78873

Iteración 2:

𝑑𝑑𝑑𝑑 𝜕𝜕2 𝑓𝑓 𝜕𝜕 𝜕𝜕𝜕𝜕


1
𝑥𝑥 21.9718 𝑑𝑑𝑑𝑑 0 𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 2 −5
𝑒𝑒𝑒𝑒 � 1 � = � � se obtiene �𝑑𝑑𝑑𝑑 � =� � y � 𝜕𝜕 𝜕𝜕𝜕𝜕 � =� �
𝑦𝑦 3.78873 16.7297 𝜕𝜕2 𝑓𝑓 −5 120.188
𝑑𝑑𝑑𝑑 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2

Los valores actualizados de las variables son:

𝑥𝑥 2 21.9718 2 −5 −1 0 20.4119
� 2 � = � � − � � � �=� � con 𝑓𝑓(20.4119, 3.16476) = −341.649
𝑦𝑦 3.78873 −5 120.188 16.7297 3.16476

Resumen de resultados:

k 𝒙𝒙𝒌𝒌 𝒚𝒚𝒌𝒌 𝒇𝒇(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 ) 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅
0 2 2 - 66 -31 14
1 21.9718 3.78873 -307.02 0 16.7297
2 20.4119 3.16476 −341.649 -0.00005 99.6819
3 20.0235 3.00941 −342.996 -0.00005 0.901971
4 20.0001 3.00003 -343 0.00005 0.00274

Se calcula el error en la cuarta iteración obteniéndose:

|(𝑓𝑓(𝑥𝑥 4 ) − 𝑓𝑓(𝑥𝑥 3 ))/𝑓𝑓(𝑥𝑥 4 )| = 1.2 ∗ 10−5 < 10−4

Por lo que los cálculos convergen en cuatro iteraciones. Se sustituye el valor de 𝑦𝑦 en la Hessiana y se obtiene que los
determinantes menores son positivos por lo que el valor encontrado corresponde a un mínimo.

88
CAPITULO 6
Programación geométrica

La programación geométrica es un método de optimización numérica que se


puede aplicar a problemas cuya función objetivo y las restricciones tienen una
forma particular de formulación matemática, con términos denominados
posinomios. El método puede aplicarse a una gran cantidad de problemas de
ingeniería que pueden ser representados por la programación geométrica y se
diferencia de los otros métodos de optimización porque no usa iteraciones para
encontrar los puntos extremos. Se describe la forma particular en la que se
formulan los problemas de programación geométrica y las definiciones básicas
del algoritmo de solución. Se presentan ejemplos en los que se ilustra como
reconocer la forma particular de la formulación de programación geométrica y
como transformar la función o las restricciones a la forma estándar de
representación matemática del método.

89
6.1 Introducción

Es un método de optimización aplicable a funciones no lineales de la forma:


𝑎𝑎
min 𝑓𝑓(𝑥𝑥) = ∑𝑛𝑛𝑖𝑖=1 𝑐𝑐𝑖𝑖 ∏𝑚𝑚
𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
(6-1)

La función objetivo 𝑓𝑓(𝑥𝑥) es un posinomial con n términos (posinomios) 𝑓𝑓(𝑥𝑥) = 𝑃𝑃1 + 𝑃𝑃2 + ⋯ + 𝑃𝑃𝑛𝑛 y m variables
independientes, 𝑥𝑥𝑗𝑗 todos positivos, ya que los n coeficientes son positivos (𝑐𝑐𝑖𝑖 ≥ 0) y las m variables también, (𝑥𝑥𝑗𝑗 ≥ 0)
mientras que los exponentes 𝑎𝑎𝑖𝑖,𝑗𝑗 no tienen restricciones de signo.

La definición de la función objetivo como un posinomial conlleva la idea de que se trata de un polinomio cuyos términos
son positivos.

La función objetivo se denomina función primal y suele expresarse en la forma:


𝑎𝑎
𝑓𝑓(𝑥𝑥) = ∑𝑛𝑛𝑖𝑖=1 𝑃𝑃𝑖𝑖 Donde, 𝑃𝑃𝑖𝑖 = 𝑐𝑐𝑖𝑖 ∏𝑚𝑚
𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
(6-2)

Y puede estar sujeta a las restricciones:


𝑇𝑇1 𝑚𝑚
𝑏𝑏
𝑔𝑔1 (𝑥𝑥) = � 𝑒𝑒𝑖𝑖 � 𝑥𝑥𝑗𝑗 𝑖𝑖,𝑗𝑗 ≤ 1
𝑖𝑖=1 𝑗𝑗=1

𝑏𝑏
𝑔𝑔2 (𝑥𝑥) = ∑𝑇𝑇2 𝑚𝑚
𝑖𝑖=1 𝑒𝑒𝑖𝑖 ∏𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
≤ 1 Etc. (6-3)

Por ejemplo:

Obtener el mínimo de 𝑓𝑓(𝑥𝑥) = 5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 + 𝑥𝑥1 𝑥𝑥2 𝑥𝑥3

Sujeto a la restricción: 𝑔𝑔(𝑥𝑥) = 4𝑥𝑥1 𝑥𝑥3−2 + 6𝑥𝑥2−2 𝑥𝑥3−1 ≤ 2

Las ecuaciones (6-2) y (6-3) representan la forma estándar de formulación de problemas de programación geométrica. El
método de la programación geométrica fue publicado en 1967 por Duffin, Peterson y Zener 1.

El algoritmo de resolución asocia a la función primal una función denominada dual, que tiene la forma:

𝑐𝑐 𝑤𝑤𝑖𝑖
𝐷𝐷(𝑤𝑤) = ∏𝑛𝑛𝑖𝑖=1 � 𝑖𝑖 � (6-4)
𝑤𝑤𝑖𝑖

De tal manera que en los puntos extremos existe una equivalencia geométrica entre el primal y el dual,

max 𝐷𝐷(𝑤𝑤 ∗ ) = min 𝑓𝑓(𝑥𝑥 ∗ ) (6-5)

Por lo tanto la minimización de la función primal es equivalente a la maximización del dual.

La función Dual tiene las restricciones:

Condición de normalidad: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 = 1 (6-6)

Condiciones de ortogonalidad: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 𝑎𝑎𝑖𝑖,𝑗𝑗 = 0 (6-7)

1
Duffin R, Peterson E y Zener C. (1967) Geometric programming—theory and application. Wiley, New York
90
El algoritmo de la programación geométrica para problemas sin restricciones procede de acuerdo a los siguientes pasos.

1) Definir la función primal del problema.


𝑐𝑐 𝑤𝑤𝑖𝑖
2) Establecer la función dual: 𝐷𝐷(𝑤𝑤) = ∏𝑛𝑛𝑖𝑖=1 �𝑤𝑤𝑖𝑖 � empleando los coeficientes del primal.
𝑖𝑖
3) Establecer la condición de normalidad: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖
=1
4) Establecer las condiciones de ortogonalidad, una para cada variable: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 𝑎𝑎𝑖𝑖,𝑗𝑗 = 0
5) Resolver el sistema de ecuaciones que resulte de las condiciones de normalidad y ortogonalidad, para obtener
los valores 𝑤𝑤𝑖𝑖 denominados factores de ponderación que vienen a ser variables de la función dual.
6) Sustituir los factores de ponderación en la función dual. Bajo la premisa de que el óptimo del dual también es el
óptimo del dual. max 𝐷𝐷(𝑤𝑤 ∗ ) = min 𝑓𝑓(𝑥𝑥 ∗ ) obtener el valor mínimo de la función objetivo.
7) Obtener los valores de las variables independientes en el óptimo con las condiciones de optimalidad.
𝑃𝑃1 𝑃𝑃2 𝑃𝑃𝑛𝑛
= =⋯= = 𝑓𝑓(𝑥𝑥 ∗ ), esto indica que cada peso de ponderación representa la contribución relativa de
𝑤𝑤1 𝑤𝑤2 𝑤𝑤𝑛𝑛
cada término como una fracción de la función objetivo en el óptimo.

La solución simultanea de las ecuaciones de normalidad y ortogonalidad depende de los grados de libertad.

g. l. = n – m –1

n es el número de términos en la función primal y m el número de variables independientes.

Si g. l. = 0 se tiene una solución única.

Si g. l. < 0 no hay solución y

Si g. l. > 0 hay muchas soluciones.

Los problemas a resolver tienen función objetivo cóncava, no es de naturaleza iterativa por lo que no se requiere
proveer una estimación inicial de las variables. La solución se encuentra por una transformación de la función objetivo
primal a una dual que es convexa con restricciones lineales.

Ejemplo 6.1 2

Encontrar la cantidad económica de pedido de producto, es decir, se debe decidir qué cantidad de un artículo conviene
almacenar periódicamente. Los costos totales asociados al producto y su almacenamiento se pueden expresar como:

𝐶𝐶𝐶𝐶 = 𝐶𝐶𝐶𝐶 + 𝐶𝐶𝐶𝐶 + 𝐶𝐶𝐶𝐶

Dónde:
CT = Costo total,
𝑄𝑄ℎ
CI = Costo asociado al inventario �= �
2
𝑎𝑎𝑎𝑎
CP = Costo por gestión de pedido �= �
𝑄𝑄
𝑑𝑑𝑑𝑑
CC = Precio de compra �= �
𝑄𝑄
Q = Cantidad económica de pedido,
h = Costo de almacenamiento por unidad = 300 $/unidad
a = Costo de hacer un pedido = $ 3.5

2
Operations Research: Principles and Practice. Don T. Phillips, A. Ravindran y J. J. Solberg. Wiley, 1976.
91
d = Consumo promedio al año = 10,000 unidades/año
P = Precio de compra por unidad = 10 $/unidad

𝑄𝑄ℎ 𝑑𝑑
La función objetivo es: 𝐶𝐶𝐶𝐶 = + (𝑎𝑎 + 𝑃𝑃)
2 𝑄𝑄
300
La función primal es: min 𝐶𝐶𝐶𝐶 = 𝑄𝑄 + 10,000(3.5 + 10)𝑄𝑄 −1
2
300
Solamente tiene dos términos, entonces: 𝑃𝑃1 (𝑄𝑄) = 𝑄𝑄 y 𝑃𝑃2 (𝑄𝑄) = 10,000(3.5 + 10)𝑄𝑄−1
2
150 𝑤𝑤1 135,000 𝑤𝑤2
La función dual es: 𝐷𝐷(𝑤𝑤) = � � � �
𝑤𝑤1 𝑤𝑤2
Condición de normalidad: 𝑤𝑤1 + 𝑤𝑤2 = 1
Condición de ortogonalidad: 𝑤𝑤1 − 𝑤𝑤2 = 0
Se resuelven las ecuaciones de las condiciones y se obtiene 𝑤𝑤1 = 𝑤𝑤2 = 1/2
150 1/2 135,000 1/2 2
El óptimo del dual es 𝐷𝐷(𝑤𝑤 ∗ ) = � � � � = �14(20,250,00) = 9000
1/2 1/2

En el óptimo con las condiciones de optimalidad para el primer término se tiene:


𝑃𝑃1 150𝑄𝑄
𝑤𝑤1
= = 𝑓𝑓(𝑄𝑄 ∗ ) = 9,000 se despeja y se obtiene: Q = 30 unidades.
1/2
Si se usa el segundo término se obtiene el mismo resultado.
𝑑𝑑𝑑𝑑𝑑𝑑 ℎ 135,000
Con la solución clásica al derivar la función objetivo se obtiene: = −
𝑑𝑑𝑑𝑑 2 𝑄𝑄 2
2∗135,000
Al igualar a cero y despejar se obtiene: 𝑄𝑄 = � = 30
300

Ejemplo 6.2

Se desea transportar 400 m3 de grava a través de un rio en una caja abierta sobre una barcaza, el contenedor tendrá una
longitud L, ancho W y altura H. Los costos de producción son de 10 $/m2 por el fondo y los laterales (A1) y los extremos
de la caja cuestan 20 $/m2 (A2). El costo por viaje es de 0.10 $/viaje (A3). Determinar: 3

a) Las dimensiones óptimas para el transporte de los 400 m3 de grava.


b) El costo mínimo de construcción de la caja.
c) El número de viajes que deberá realizar la barcaza y
d) El costo total de transporte.

Caja

Barcaza

Rio

Grava

Figura 6.1 Diagrama de la barcaza en el rio.

3
Duffin, R., Peterson, E., and Zener, C. (1967) Geometric Programming: Theory and Applications. New York: Wiley
92
Los componentes de la función objetivo son:

T1 = costo de transporte = A3/(L*W*H) = 40/(L*W*H)

T2= Costo de los lados laterales = 2(L*H)*A1 = 20(L*H)

T3= Costo de los extremos = 2(W*H)*A2 = 40(W*H)

T4= Costo del fondo = A1(L*W) = 10(L*W)

Costo total = CT = T1 + T2 + T3 +T4

La función objetivo queda: CT(L,W,H) = 40/(L*W*H) +40(W*H) + 20(L*H) + 10(L*W)

Los coeficientes de la función son: C1 = 40, C2 = 40, C3 = 20 y C4 = 10.

Grados de libertad = No. De términos –No. De variables – 1 = 4 -3 -1 = 0 (el sistema tiene solución única)

Condición de normalidad: w1 + w2 + w3 + w4 = 1 En la calculadora usar:


Condición de ortogonalidad de L: - w1 + w3 + w4 = 0 𝑥𝑥 + 𝑦𝑦 + 𝑢𝑢 + 𝑣𝑣 = 1
−𝑥𝑥 + 𝑢𝑢 + 𝑣𝑣 = 0
Condición de ortogonalidad de W: - w1 + w2 + w4 = 0 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 � −𝑥𝑥 + 𝑦𝑦 + 𝑣𝑣 = 0 , {𝑥𝑥, 𝑦𝑦, 𝑢𝑢, 𝑣𝑣}�
−𝑥𝑥 + 𝑦𝑦 + 𝑢𝑢 = 0
Condición de ortogonalidad de H: - w1 + w2 + w3 = 0
2 1 1 1
La solución da: x = w1 = 0.4 = , y = w2 = 0.2 = , u = w3 = 0.2 = , v = w4 = 0.2 =
5 5 5 5

𝐶𝐶 𝑤𝑤𝑖𝑖 40 2⁄5 40 1⁄5 20 1⁄5 10 1⁄5


La función dual es 𝐷𝐷(𝑤𝑤) = ∏ � 𝑖𝑖 � = � � � � � � � � = �1002⁄5 ��2001⁄5 ��1001⁄5 ��501⁄5 �
𝑤𝑤𝑖𝑖 2/5 1/5 1/5 1/5

𝐷𝐷(𝑤𝑤) = (1002⁄5 )�1,000,0001⁄5 � = $100 Respuesta (b) el Costo de construcción es $100.

Condiciones de optimalidad.

En el término Términos del primal Términos del Dual Sustitución


En T1 C1/(L*W*H) = w1*D(w*) 2 L*W*H = 1 (6-8)
40/(L ∗ W ∗ H) = 5
(100)

En T2 C2/(W*H) = w2*D(w*) 1 W*H = ½ (6-9)


40(W ∗ H) = 5
(100)

En T3 C3(L*H) = w3*D(w*) 1 L*H = 1 (6-10)


20(L ∗ H) = 5
(100)

En T4 C4/(L*W) = w4*D(w*) 1 L*W = 2 (6-11)


10(L ∗ W) = 5
(100)
𝐿𝐿∗𝐻𝐻 1
Dividir (6-10) entre (6-11) da:
𝐿𝐿∗𝑊𝑊
= 2 ; W = 2H (6-12)

𝑊𝑊∗𝐻𝐻 1/2
Dividir (6-9) entre (6-11) da:
𝐿𝐿∗𝑊𝑊
= 2
; 𝐻𝐻 = 1
4
𝐿𝐿 (6-13)

1
(6-13) en (6-12) da: 𝑊𝑊 = 2
𝐿𝐿 (6-14)

(6-13) y (6-14) en (6-7) da: 𝐿𝐿( 12𝐿𝐿)�14𝐿𝐿� = 1 L3 = 8, entonces,

3
𝐿𝐿 = √8 = 2,

93
1
𝑊𝑊 = 2
𝐿𝐿 = 12 2=1,

1 1
𝐻𝐻 = 4
𝐿𝐿 = 4 (2) = 0.5

(a) las dimensiones son: Costados (L)= 2 m, Ancho (W) = 1 m y Altura (H) = 0.5 m

El volumen de la caja es de 1 m3

(c) Número de viajes = Volumen total de grava/volumen por viaje = 400 m3/(1 m3/viaje) = 400 viajes.

(d) Costo total = (costo por viaje)(No. De viajes) = (0.1 $/viaje)(400 viajes)= $40

Componentes de la función primal:

CT(L,W,H) = 40/(L*W*H) +40(W*H) + 20(L*H) + 10(L*W)

= 40/(2*1*0.5) +40(1*0.5) + 20(2*0.5) + 10(2*1) = 40 + 20 + 20 +20

Nótese que los términos de la función objetivo (T1, T2, T3 y T4) están en la misma proporción que los pesos
(w1,w2,w3,w4)

Ahora suponer que el fondo y los laterales se pueden construir con metal recuperado de otras construcciones pero,
solamente se dispone de 4 m2.

Nueva función objetivo: CT(L,W,H) = 40/(L*W*H) +40(W*H)


𝐿𝐿∗𝐻𝐻 𝐿𝐿∗𝑊𝑊
Sujeta a la restricción: 𝑔𝑔(𝐿𝐿, 𝑊𝑊, 𝐻𝐻) = + ≤1
2 4

40 𝑤𝑤1 40 𝑤𝑤2 1 𝑤𝑤3 1 𝑤𝑤4


La nueva función dual es: 𝐷𝐷(𝑤𝑤) = � � � � � � � � (𝜆𝜆)𝜆𝜆
𝑤𝑤1 𝑤𝑤2 2𝑤𝑤3 4𝑤𝑤4

Grados de libertad = 4-3-1 = 0, con 𝜆𝜆 = 𝑤𝑤3 + 𝑤𝑤4

Condición de normalidad: w1 + w2 = 1

Condición de ortogonalidad de L: - w1 + w3 + w4 = 0

Condición de ortogonalidad de W: - w1 + w2 + w4 = 0

Condición de ortogonalidad de H: - w1 + w2 + w3 = 0
2 1 2
La solución es: w1 = , w2 = w3 = w4 = 𝑦𝑦 𝜆𝜆 = , entonces,
3 3 3

1⁄3 1⁄3
40 2⁄3 40 1⁄3 1 1
𝐷𝐷(𝑤𝑤) = � � � � � 1� � 1� = �402⁄3 �(120 ∗ 1.5 ∗ 0.75)1/3 = 60
2/3 1/3 2( ) 4( )
3 3

Luego: 𝑓𝑓(𝑥𝑥 ∗ ) = 60 𝑦𝑦 𝑔𝑔(𝑥𝑥 ∗ ) = 1. De las condiciones de optimalidad se obtiene:


40 2
𝑇𝑇1 = = (60) = 40, L*W*H = 1
𝐿𝐿∗𝑊𝑊∗𝐻𝐻 3

1
𝑇𝑇2 = 4(𝑊𝑊 ∗ 𝐻𝐻) = 3 (60) = 20, W*H = ½ , con estas dos últimas ecuaciones se obtiene: L = 2

94
𝐿𝐿∗𝐻𝐻 1 𝐿𝐿∗𝑊𝑊 1
𝐿𝐿1 = 2
= (60) = 20, que al combinar con 𝐿𝐿2 = = (60) = 20, da: W=2H, este combinado con el resultado de
3 4 3
T2, se obtiene, 2*H*H = ½ de donde 𝐻𝐻 = 2�1/4 = 1/2, entonces W = 2(1/2) = 1

Se obtienen las mismas dimensiones pero el costo disminuye.

6.2 Programación Geométrica con restricciones


𝑎𝑎
La función primal es: min 𝑓𝑓(𝑥𝑥) = ∑𝑛𝑛𝑖𝑖=1 𝑐𝑐𝑖𝑖 ∏𝑚𝑚
𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
con n términos (posinomios) 𝑓𝑓(𝑥𝑥) = 𝑃𝑃1 + 𝑃𝑃2 + ⋯ + 𝑃𝑃𝑛𝑛

Sujeta a las restricciones:


𝑏𝑏
𝑔𝑔1 (𝑥𝑥) = ∑𝑇𝑇1 𝑚𝑚
𝑖𝑖=1 𝑒𝑒𝑖𝑖 ∏𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
≤1

𝑏𝑏
𝑔𝑔2 (𝑥𝑥) = ∑𝑇𝑇2 𝑚𝑚
𝑖𝑖=1 𝑒𝑒𝑖𝑖 ∏𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
≤ 1 Etc.

𝑏𝑏 𝑏𝑏 𝑏𝑏
Cada una con T términos (posinomios) 𝑔𝑔𝑖𝑖 (𝑥𝑥) = 𝐿𝐿1 + 𝐿𝐿2 + ⋯ + 𝐿𝐿 𝑇𝑇 cada uno con: 𝐿𝐿𝑘𝑘 = 𝑒𝑒𝑘𝑘 𝑥𝑥1 1𝑘𝑘 ∙ 𝑥𝑥2 2𝑘𝑘 ∙ … ∙ 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚
𝑤𝑤𝑗𝑗
𝑐𝑐 𝑤𝑤𝑖𝑖 𝑐𝑐
El dual es: 𝐷𝐷(𝑤𝑤) = ∏𝑛𝑛𝑖𝑖=1 � 𝑖𝑖 � ∏𝑇𝑇𝑗𝑗=1 � 𝑗𝑗 � (𝜆𝜆)𝜆𝜆 donde 𝜆𝜆 = ∑𝑇𝑇𝑗𝑗=1 𝑤𝑤𝑗𝑗
𝑤𝑤𝑖𝑖 𝑤𝑤𝑗𝑗

λ es un multiplicador de Lagrange que corresponde a la suma de los pesos de los términos en las restricciones.

Las condiciones de normalidad son: Para la función objetivo: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 = 1

Para las restricciones: ∑𝑇𝑇𝑗𝑗=1 𝑤𝑤𝑗𝑗 = 𝜆𝜆

Condiciones de ortogonalidad: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 𝑎𝑎𝑖𝑖,𝑗𝑗 + ∑𝑇𝑇𝑘𝑘=1 𝑤𝑤𝑘𝑘 𝑏𝑏𝑘𝑘,𝑗𝑗 = 0 una para cada j variable de 1 a m.

Ejemplo 6.3

Obtener el mínimo de 𝑓𝑓(𝑥𝑥) = 5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 + 𝑥𝑥1 𝑥𝑥2 𝑥𝑥3

Sujeto a la restricción: 𝑔𝑔(𝑥𝑥) = 4𝑥𝑥1 𝑥𝑥3−2 + 6𝑥𝑥2−2 𝑥𝑥3−1 ≤ 2

Se divide entre 2 la restricción y resulta: 𝑔𝑔(𝑥𝑥) = 2𝑥𝑥1 𝑥𝑥3−2 + 3𝑥𝑥2−2 𝑥𝑥3−1 ≤ 1

Se tienen 2 términos en el primal: 𝑓𝑓(𝑥𝑥) = 𝑃𝑃1 + 𝑃𝑃2 y 2 términos en la restricción 𝑔𝑔(𝑥𝑥) = 𝐿𝐿1 + 𝐿𝐿2

Con 3 variables independientes, entonces se tendrán 4 pesos: 𝑤𝑤 = {𝑤𝑤1 , 𝑤𝑤2 , 𝑤𝑤3 , 𝑤𝑤4 } con 𝜆𝜆 = 𝑤𝑤3 + 𝑤𝑤4

𝑃𝑃1 = 5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 , 𝑃𝑃2 =𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 , 𝐿𝐿1 = 2𝑥𝑥1 𝑥𝑥3−2 y 𝐿𝐿2 = 3𝑥𝑥2−2 𝑥𝑥3−1

5 𝑤𝑤1 1 𝑤𝑤2 2 𝑤𝑤3 3 𝑤𝑤4


La función dual es: 𝐷𝐷(𝑤𝑤) = � � � � � � � � (𝜆𝜆)𝜆𝜆
𝑤𝑤1 𝑤𝑤2 𝑤𝑤3 𝑤𝑤4

Condición de normalidad en f(x) : 𝑤𝑤1 + 𝑤𝑤2 = 1

Condición de ortogonalidad en x1 : −3𝑤𝑤1 + 𝑤𝑤2 + 𝑤𝑤3 = 0

Condición de ortogonalidad en x2 : 𝑤𝑤1 + 𝑤𝑤2 − 2𝑤𝑤4 = 0

Condición de ortogonalidad en x3 : 𝑤𝑤1 + 𝑤𝑤2 − 2𝑤𝑤3 − 𝑤𝑤4 = 0


95
Se resuelve el sistema y se obtiene: 𝑤𝑤1 = 0.3125, 𝑤𝑤2 = 0.6875, 𝑤𝑤3 = 0.25, 𝑤𝑤4 = 0.5 , 𝜆𝜆 = 𝑤𝑤3 + 𝑤𝑤4 = .25 + .5 = .75

5 0.3125 1 0.6875 2 0.25 3 0.5


La función dual queda: 𝐷𝐷(𝑤𝑤) = � � � � � � � � (. 75).75 = 10.215
0.3125 0.6875 0.25 0.5

Entonces el mínimo de f(x) = 10.215

En el primer término del primal se tiene:

5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 = 𝑤𝑤1 𝑓𝑓(𝑥𝑥 ∗ ) = 0.3125 ∗ 10.215 = 3.1921 (6-15)

Similarmente con los otros términos se tendrá:

𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 = 0.6875 ∗ 10.215 = 7.0228 (6-16)

2𝑥𝑥1 𝑥𝑥3−2 =0.25*10.215= 2.55375 (6-17)

3𝑥𝑥2−2 𝑥𝑥3−1 = 0.5 ∗ 10.215 = 5.1075 (6-18)

𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 𝑤𝑤 0.6875 4 5∗0.6875


Dividiendo (6-16) entre (6-15) se obtiene: = 𝑤𝑤2 = 0.3125 entonces, 𝑥𝑥1 = � = 1.8212
5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 1 0.3125

Sustituyendo el valor de 𝑥𝑥1 en (6-17) se obtiene 𝑥𝑥3 = 3.8169 que sustituido en (6-18) da, 𝑥𝑥2 = 1.2537

Ejemplo 6.4

En cierta compañía petroquímica se incendia un tanque cilíndrico de 3,141.59 m3. La compañía de seguros les paga
1,200 dólares por el siniestro. La reconstrucción del tanque a través de un bufete de ingeniería les cuesta un dólar por
m2 de metal del tanque.

¿Qué dimensiones debe tener el tanque para tener el mismo volumen y a menor costo?

Costo = costo del fondo y la tapa + costo del cilindro lateral

Función objetivo: min 𝑓𝑓(𝑅𝑅, 𝐻𝐻) = 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 2 + 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 ∗ 𝐻𝐻

Sujeto a que Volumen del tanque ≥ volumen requerido, 𝜋𝜋 ∗ 𝑅𝑅 2 𝐻𝐻 ≥ 3,141.59

Se modifica la restricción: 𝑔𝑔(𝑅𝑅, 𝐻𝐻) = 1000 ∗ 𝑅𝑅 −2 𝐻𝐻 −1 ≤ 1

2𝜋𝜋 𝑤𝑤1 2𝜋𝜋 𝑤𝑤2 1000 𝑤𝑤3


La función Dual tendrá tres términos: 𝐷𝐷(𝑤𝑤) = � � �𝑤𝑤 � � � (𝜆𝜆)𝜆𝜆
𝑤𝑤1 2 𝑤𝑤3

Condición de normalidad en f(R, H): 𝑤𝑤1 + 𝑤𝑤2 = 1

Condición de normalidad en g(R, H): el factor de Lagrange se asocia a cada restricción en este caso 𝑤𝑤3 = 𝜆𝜆

Condición de ortogonalidad según exponentes de R: 2𝑤𝑤1 + 𝑤𝑤2 − 2𝑤𝑤3 = 0

Condición de ortogonalidad según exponentes de H: 𝑤𝑤2 − 𝑤𝑤3 = 0


1 2
Se resuelve simultáneamente y se obtiene: 𝑤𝑤1 = , 𝑤𝑤2 = 𝑤𝑤3 =
3 3

96
2𝜋𝜋 1/3 2𝜋𝜋 2/3 1000 2/3 2 2/3
La función dual queda: 𝐷𝐷(𝑤𝑤) = �1/3� �2/3� � 2/3 � � � = 1,187.45 = 𝑓𝑓(𝑅𝑅 ∗ , 𝐻𝐻 ∗ )
3

Se aplican las condiciones de optimalidad: En el primer término del primal: 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 2 = 𝑤𝑤1 𝑓𝑓(𝑅𝑅 ∗ , 𝐻𝐻 ∗ )

2 1
� �(1,187.45)
Se despeja R y se obtiene: 𝑅𝑅 = � 32∗3.1416 = 7.93701 𝑚𝑚

Con el segundo término y la condición de optimalidad se obtiene: 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 𝐻𝐻 = 𝑤𝑤2 𝑓𝑓(𝑅𝑅 ∗ , 𝐻𝐻 ∗ )


1
� �(1,187.45)
Se sustituye R y se despeja H para dar: 𝐻𝐻 = 2∗3.1416∗7.93701
3
= 15.874 𝑚𝑚

El costo de construcción será: 𝑓𝑓(𝑅𝑅, 𝐻𝐻) = 2 ∗ 𝜋𝜋 ∗ (7.93701 )2 + 2 ∗ 𝜋𝜋 ∗ ( 7.93701) ∗ (15.874 ) = $1,187.45

Lo que ofrece la aseguradora apenas cubre el costo del tanque.

Dos ecuaciones fueron suficientes para resolver el problema, la ecuación de la restricción que contribuye con el tercer
término se puede usar para comprobar resultados.

Se puede usar el método de los multiplicadores de Lagrange para resolver este problema de la siguiente manera:

Lagrangiano: 𝐿𝐿(𝑅𝑅, 𝐻𝐻) = 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 2 + 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 ∗ 𝐻𝐻 − 𝜆𝜆(𝜋𝜋 ∗ 𝑅𝑅 2 𝐻𝐻 − 3,1416)

Se calculan las derivadas y se igualan a cero:

𝜕𝜕𝜕𝜕
= 4𝜋𝜋𝜋𝜋 + 2𝜋𝜋𝜋𝜋 − 2𝜆𝜆𝜋𝜋𝜋𝜋𝜋𝜋 = 0
𝜕𝜕𝜕𝜕

𝜕𝜕𝜕𝜕
= 2𝜋𝜋𝜋𝜋 − 𝜆𝜆𝜋𝜋𝑅𝑅 2 = 0
𝜕𝜕𝜕𝜕

𝜕𝜕𝜕𝜕
= 𝜋𝜋𝑅𝑅 2 − 1000𝜋𝜋 = 0
𝜕𝜕𝜆𝜆

Se resuelve el sistema de ecuaciones y se obtiene: 𝑅𝑅 = 7.93701 𝑚𝑚, 𝐻𝐻 = 15.874 𝑚𝑚 y 𝜆𝜆 = 0.251984

Otra forma de resolver el problema es despejar el valor de H de la restricción y sustituir en la función objetivo.
2000𝜋𝜋
𝐻𝐻 = 1000/𝑅𝑅2 , entonces la función objetivo queda: 𝑓𝑓(𝑅𝑅, 𝐻𝐻) = 2𝜋𝜋𝑅𝑅 2 +
𝑅𝑅

Se calcula la deriva, se iguala a cero y se despeja el valor de R,

𝜕𝜕𝜕𝜕 2000 1/3


= 4𝜋𝜋𝜋𝜋 − 2000𝜋𝜋𝑅𝑅 −2 = 0 , se obtiene: 𝑅𝑅 = � � = 7.9370 𝑚𝑚
𝜕𝜕𝜕𝜕 4

Se obtiene el mismo resultado.

97
Problemas

1. Encontrar los valores de las variables 𝑥𝑥1 , 𝑥𝑥2 𝑦𝑦 𝑥𝑥3 que minimizan
1
𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 ) = + 2𝑥𝑥2 𝑥𝑥3 + 3𝑥𝑥1 𝑥𝑥3 + 4𝑥𝑥1 𝑥𝑥2 , sujeto a 𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 > 0
𝑥𝑥1 𝑥𝑥2 𝑥𝑥3

Respuestas: 𝑥𝑥1 = 0.48836 , 𝑥𝑥2 = 0.73264, 𝑥𝑥3 = 0.9767, 𝑓𝑓(𝑥𝑥1∗ , 𝑥𝑥2∗ , 𝑥𝑥3∗ ) = 7.15485

2. Encontrar los valores de las variables 𝑥𝑥, 𝑦𝑦 que minimizan


4𝑥𝑥 2 2𝑦𝑦 2
𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 3 + 3 + 𝑥𝑥 2 𝑦𝑦 2
𝑦𝑦 𝑥𝑥

Respuestas: D(w*)= 6.59754, 𝑥𝑥 ∗ = 1, 𝑦𝑦 ∗ = 1.14869, 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 6.59754

3. Obtener el mínimo de
𝑥𝑥 3 2𝑦𝑦
𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + 2 + 2𝑥𝑥 𝑦𝑦
𝑦𝑦 3 𝑥𝑥

Respuestas: 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 𝑓𝑓(0.7937, 0.7492) = 4.7568

4. encuentre el mínimo de:


4 2
𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 8𝑥𝑥𝑥𝑥 + +
𝑥𝑥 𝑦𝑦
Respuestas: Entonces el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 12 con 𝑥𝑥 ∗ = 1, 𝑦𝑦 ∗ = 1/2
𝑥𝑥 2 4 𝑦𝑦
5. Obtener el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 8
+ +
𝑥𝑥 𝑦𝑦 2

Respuestas: 𝑓𝑓(𝑥𝑥 ∗ ) = 2.5 con 𝑥𝑥 ∗ = 2, 𝑦𝑦 ∗ = 2

98
CAPITULO 7
Programación Lineal

La programación lineal es un método de optimización numérica que se desarrolló


durante la segunda guerra mundial en los Estados Unidos de América, sus
creadores, principalmente George Dantzing lo empleo para optimizar las
operaciones militares del ejército de los Estados Unidos. El método se aplica a
resolver problemas que puedan formularse con ecuaciones lineales, es decir
tanto la función objetivo como las restricciones son ecuaciones lineales, por lo
que es el método de optimización más empleado. Para problemas con dos
variables se puede encontrar los máximos y mínimos de forma gráfica pero para
problemas de dos o más variables el método Simplex es el procedimiento de
resolución más aplicado. Se describe la forma particular en la que se formulan los
problemas de programación lineal y el procedimiento de cálculo del método
Simplex resumido en una tabla denominada Tableau. Se presentan ejemplos en
los que se ilustran el método Simplex.

99
7.1 Introducción

El método de la programación lineal resuelve problemas de optimización cuya función objetivo y las restricciones se
pueden expresar como ecuaciones lineales de la forma:

𝑀𝑀𝑀𝑀𝑀𝑀 𝑍𝑍(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 𝑐𝑐1 𝑥𝑥1 + 𝑐𝑐2 𝑥𝑥2 + ⋯ 𝑐𝑐𝑛𝑛 𝑥𝑥𝑛𝑛 (7-1)

Sujeta a: 𝑔𝑔1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + ⋯ 𝑎𝑎1𝑛𝑛 𝑥𝑥𝑛𝑛 ≤ 𝑏𝑏1

𝑔𝑔2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎21 𝑥𝑥1 + 𝑎𝑎22 𝑥𝑥2 + ⋯ 𝑎𝑎2𝑛𝑛 𝑥𝑥𝑛𝑛 = 𝑏𝑏2 (7-2)


𝑔𝑔𝑚𝑚 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎𝑚𝑚1 𝑥𝑥1 + 𝑎𝑎𝑚𝑚2 𝑥𝑥2 + ⋯ 𝑎𝑎𝑚𝑚𝑚𝑚 𝑥𝑥𝑛𝑛 ≥ 𝑏𝑏𝑚𝑚

Además: 𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ≥ 0 (7-3)

Las “m” restricciones pueden ser de igualdad o desigualdad. Estas suelen ser requerimientos estipulados sobre las “n”
variables tales como especificaciones de operación en los procesos, limitaciones del mercado o de capacidad,
cumplimiento de balances de materiales o restricciones sobre la disponibilidad de recursos. Nótese que la función
objetivo se distingue por la letra 𝑍𝑍

Se puede aplicar a una gran cantidad de problemas por ejemplo; Determinación del mezclado óptimo en la fabricación
de materiales compuestos, Desarrollo de planes de envió de productos a diferentes destinos que minimicen los costos
de envió, considerando las limitaciones de capacidad. La identificación de la mejor manera de asignar diferentes tareas o
diferentes trabajadores, etc.

En forma matricial se tiene:


𝑥𝑥1
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = [𝑐𝑐1 𝑐𝑐2 𝑥𝑥
… 𝑐𝑐𝑛𝑛 ] � …1 � (7-4)
𝑥𝑥𝑛𝑛

𝑎𝑎11 𝑎𝑎12 … 𝑎𝑎𝑛𝑛2 𝑥𝑥1 𝑏𝑏1


𝑎𝑎 𝑎𝑎22 … 𝑎𝑎𝑛𝑛2 𝑥𝑥1 𝑏𝑏
� … 21
… … … � � … � ≤ 𝑜𝑜 = 𝑜𝑜 ≥ � …1 � (7-5)
𝑎𝑎𝑚𝑚1 𝑎𝑎𝑚𝑚2 … 𝑎𝑎𝑚𝑚𝑚𝑚 𝑥𝑥𝑛𝑛 𝑏𝑏𝑛𝑛

La función objetivo 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) es la ecuación cuyo óptimo se desea encontrar, ya se máximo o mínimo. Contiene “n
variables 𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 , denominadas variables de decisión. Los coeficientes 𝑐𝑐1 , 𝑐𝑐2 , … 𝑐𝑐𝑛𝑛 , de la función objetivo, los
coeficientes de las restricciones 𝑎𝑎11 , 𝑎𝑎12 , … 𝑎𝑎𝑛𝑛𝑛𝑛 y el vector de constantes 𝑏𝑏1 , 𝑏𝑏2 , … 𝑏𝑏𝑛𝑛 , son parámetros del modelo de
programación lineal.

Un modelo de programación lineal puede escribirse de tal forma que sus restricciones sean todas de igualdad, es decir,
que formen un sistema lineal de ecuaciones. Lo anterior es necesario para su solución por el método Simplex que se
explica más adelante. Con ello se expresan las ecuaciones como un modelo de Forma Estándar. Para escribir una
desigualdad como igualdad es necesario sumar una variable adicional que se denomina variable de holgura o variable
artificial, en caso que la desigualdad sea del tipo menor o igual, se debe restar una variable que en este caso se

100
denomina variable de exceso, estas variables deben ser no negativas. En la forma estándar todas las restricciones son
igualdades.

∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 ≤ 𝑏𝑏𝑖𝑖 Se convierte en ∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 + 𝑆𝑆𝑛𝑛+𝑖𝑖 = 𝑏𝑏𝑖𝑖

∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 ≥ 𝑏𝑏𝑖𝑖 Se convierte en ∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 − 𝑆𝑆𝑛𝑛+𝑖𝑖 = 𝑏𝑏𝑖𝑖

En un problema con dos variables y tres restricciones la forma estándar es:

𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + 𝑆𝑆1 + 0𝑆𝑆2 + 0𝑆𝑆3 = 𝑏𝑏1


𝑎𝑎21 𝑥𝑥1 + 𝑎𝑎22 𝑥𝑥2 + 0𝑆𝑆1 + 𝑆𝑆2 + 0𝑆𝑆3 = 𝑏𝑏2
𝑎𝑎31 𝑥𝑥1 + 𝑎𝑎32 𝑥𝑥2 + 0𝑆𝑆1 + 0𝑆𝑆2 + 𝑆𝑆3 = 𝑏𝑏3

Ejemplo 7.1.

Expresar el siguiente problema de programación lineal en su forma estándar.

𝑀𝑀𝑀𝑀𝑀𝑀 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 60𝑥𝑥1 + 50𝑥𝑥2


s. a.
2𝑥𝑥1 + 4𝑥𝑥2 ≤ 80
3𝑥𝑥1 + 2𝑥𝑥2 ≤ 60
Se agregan las variables de holgura 𝑆𝑆1 𝑦𝑦 𝑆𝑆2 , a la función objetivo y las restricciones.

𝑀𝑀𝑀𝑀𝑀𝑀 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = 60𝑥𝑥1 + 50𝑥𝑥2 + 0𝑆𝑆1 + 0𝑆𝑆2

2𝑥𝑥1 + 4𝑥𝑥2 + 𝑆𝑆1 = 80


3𝑥𝑥1 + 2𝑥𝑥2 + 𝑆𝑆2 = 60
En su forma matricial o forma estándar se tiene

𝑥𝑥1
𝑀𝑀𝑀𝑀𝑀𝑀 𝑍𝑍 = [60 50] �𝑥𝑥 �
2
s. a
𝑥𝑥1
2 4 1 0 2𝑥𝑥 80
� �� � = � �
3 2 0 1 𝑆𝑆1 60
𝑆𝑆2

Nótese que la matriz de coeficientes de las restricciones originales ha sido ampliada con una matriz identidad. Cuando
𝑥𝑥1 , = 0 𝑦𝑦 𝑥𝑥2 = 0, entonces 𝑆𝑆1 = 80 𝑦𝑦 𝑆𝑆2 = 60 es una solución pero no la óptima. Nótese que los coeficientes de las
variables artificiales en la función objetivo son “0”, mientras que los coeficientes de estas variables en las restricciones
es “1”.

Cualquier conjunto de las variables o punto que satisface todas las restricciones es un vector viable o punto viable o
factible. El espacio encerrado por todos los puntos viables es la región viable o factible. Cualquier punto dentro de esta
región es una solución. Los puntos de intersección entre las ecuaciones de las restricciones así como los puntos de cruce
con los ejes coordenados forman soluciones básicas. El óptimo máximo se encuentra entre las soluciones básicas que
sean factibles, en estos puntos tanto las variables de decisión como las variables de holgura serán no negativas.

Para un problema con “n” variables y con “m” restricciones en su forma estándar, dos soluciones básicas factibles serán
soluciones básicas factibles adyacentes si acaso tienen m-1 variables básicas en común.

101
Para problemas con dos variables se puede encontrar la región viable y el óptimo de forma gráfica, como en el siguiente
ejemplo.

Ejemplo 7.2

En una refinería se procesan dos tipos de crudos, ligero (crudo1) y pesado (crudo2), con costos de 24 $/barril y 15
$/barril, respectivamente. Los cuatro principales productos son: gasolina, queroseno, gasóleo y residuo cuyo precio de
venta es para cada producto, $36/barril, 24 $/barril, 21 $/barril y 10 $/barril. Los datos de producción y rendimientos
son:

Rendimientos Rendimientos Máxima producción permitida


del Crudo 1 del Crudo 2 barriles/día
Gasolina 80 % 44 % 24,000
Queroseno 5% 10 % 2,000
Gasóleo 10 % 36 % 6,000
Costo de procesamiento ($/barril) 0.50 1.0

Determinar qué cantidades de cada crudo se deben procesar para maximizar las ganancias.

Formulación del modelo:

La función objetivo depende de las utilidades por las ventas de productos y corresponde a:

Utilidades = ganancia por ventas – costo de materias primas – costo de producción

Se propone un esquema de la situación, indicando como entradas a la refinería los crudos (x= barriles/día de crudo 1),
(y= barriles/día de crudo 1) y como salidas los productos (gasolina (x3), queroseno (x4), gasóleo (x5) y residuo (x6)).

Crudo 1 (x) Gasolina (x3)


Queroseno (x4)

Crudo 2 (y)
Refinería Gasóleo (x5)
Residuo (x6)
Figura 7.1 Esquema de la formulación del problema del Ejemplo 7.1

Considerando que el objetivo es maximizar las utilidades por venta de los productos y que estos dependen de los
rendimientos que tienen cada crudo entonces:

Cantidad de gasolina producida (barriles/día): 𝑥𝑥3 = 0.8 𝑥𝑥 + 0.44 𝑦𝑦

Cantidad de queroseno producido (barriles/día): 𝑥𝑥4 = 0.05 𝑥𝑥 + 0.10 𝑦𝑦

Cantidad de gasóleo producido (barriles/día): 𝑥𝑥5 = 0.10 𝑥𝑥 + 0.36 𝑦𝑦

Cantidad de residuo producido (barriles/día): 𝑥𝑥6 = 0.05 𝑥𝑥 + 0.10 𝑦𝑦

Al multiplicar cada una de estas cantidades por su precio se obtienen las ganancias por ventas:

102
36(0.8 𝑥𝑥 + 0.44 𝑦𝑦) + 24(0.05 𝑥𝑥 + 0.10 𝑦𝑦 ) + 21(0.10 𝑥𝑥 + 0.36 𝑦𝑦) + 10(0.05 𝑥𝑥 + 0.10 𝑦𝑦)

Dando: Ganancias por ventas= 32.6 𝑥𝑥 + 26.8 𝑦𝑦

Costo de materia prima= 24 𝑥𝑥 + 15 𝑦𝑦

Costos de producción: 0.5 𝑥𝑥 + 𝑦𝑦

La función objetivo es: Utilidades = 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 32.6 𝑥𝑥 + 26.8 𝑦𝑦 − 24 𝑥𝑥 + 15 𝑦𝑦 − 0.5 𝑥𝑥 + 𝑦𝑦 = 8.1 𝑥𝑥 + 10.8 𝑦𝑦

Las restricciones de acuerdo a la producción máxima permitida de cada producto son:

Para la gasolina: 0.8 𝑥𝑥 + 0.44 𝑦𝑦 ≤ 24,000

Para el queroseno: 0.05 𝑥𝑥 + 0.01 𝑦𝑦 ≤ 2,000

Para el gasóleo: 0.10 𝑥𝑥 + 0.36 𝑦𝑦 ≤ 6,000

En la calculadora Ti nspire primero se definen las restricciones como ecuaciones en la calculadora:

Luego se abre una hoja para graficar y se ingresan las ecuaciones de las rectas.

Figura 7.2 Gráfica de las restricciones del Ejemplo 7.1

103
Después se ubican los puntos de intersección de las rectas con b/6: Analizar gráfico/4: Intersección.

Figura 7.3 Gráfica de las restricciones del Ejemplo 7.1 con las soluciones básicas

Luego abril una página nueva con una Hoja de cálculo y rotular las columnas A y B con Crudo1 y Crudo2
respectivamente.

En la primera línea dar las coordenadas del primer punto y en las líneas 2 y 3 las de los otros puntos de intersección. En
la columna C escribir objetivo como rotulo y en cada celda la fórmula de la función objetivo (8.1 𝐴𝐴 + 10.8 𝐵𝐵).
𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏
Se nota que con 𝑥𝑥 = 2,620 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 1 e 𝑦𝑦 = 6,900 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 2 se obtiene la máxima utilidad,
𝑑𝑑í𝑎𝑎 𝑑𝑑í𝑎𝑎
286,740 $/𝑑𝑑í𝑎𝑎

El método de solución grafica es muy conveniente para problemas con dos variables pero es impráctico para un número
mayor de variables. La región acotada por todas las líneas de las restricciones define la región de viabilidad y en las
esquinas de dicha región se encuentran los puntos extremos de la función objetivo.

Este tipo de problemas de mezclas son muy comunes. Se tiene un conjunto de productos a vender y un número finito de
recursos para su elaboración. Asociados a cada producto se tiene una ganancia por unidad de producto y una taza de
contribución por el uso de los recursos. El objetivo es encontrar la mezcla de los recursos que maximizan las ganancias
considerando que cada recurso se puede usar en una cantidad restringida.

Como se muestra en el Ejemplo anterior, pueden existir múltiples puntos o soluciones que satisfagan las restricciones
que definen un conjunto de soluciones factibles.

104
7.2 El método Simplex

Este método encuentra el óptimo de la función objetivo y los valores de las variables en el óptimo usando operaciones
elementales de hilera en una tabla, denominada Tableau, que se escribe partiendo de la forma estándar de
programación lineal. El objetivo del Método Simplex es lograr sucesivas mejoras para el valor de la función objetivo
asociada a la selección de alguna solución factible

El Tableau inicial del Ejemplo 7.1 es:

60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 2 4 1 0 80
0 S2 3 2 0 1 60
Z=0 0 0 0 0 Zj
60 50 0 0 Cj - Zj

La primera hilera contiene los coeficientes de la función objetivo, 𝐶𝐶𝑗𝑗 . La columna rotulada con la palabra Base contiene a
las variables básicas que son 𝑆𝑆1 𝑦𝑦 𝑆𝑆2 mientras que las variables no básicas son 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 no están en esta columna. La
primera columna llamada 𝐶𝐶𝐵𝐵 contiene los coeficientes de la función objetivo de las variables básicas. Los coeficientes de
la matriz ampliada de las restricciones en la forma estándar están bajo las columnas rotuladas con las variables de
decisión y las de holgura. La columna 𝑏𝑏𝑗𝑗 contiene el vector de coeficientes independientes de las restricciones. Las dos
últimas hileras se usan para determinar si después de varias iteraciones se alcanza el óptimo o no. Los coeficientes de la
hilera 𝑍𝑍𝑗𝑗 se determina con 𝑍𝑍𝑗𝑗 = ∑ 𝑎𝑎𝑖𝑖,𝑗𝑗 𝐶𝐶𝐵𝐵𝐵𝐵 . Para problemas de maximización se terminan los cálculos cuando todos los
valores de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 son cero o negativos. El significado de la columna 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 , se explica más adelante.

Observamos que si se incrementa cualquiera de las variables no básicas, el valor de 𝑍𝑍 se incrementa. El método
simplex busca substituir estas variables básicas del Tableau inicial por las variables de decisión usando operaciones
elementales de hilera.

7.2 Método Simplex

El método Simplex supone que inicialmente se cuenta con una solución factible, cuyas variables forman una solución
básica. Estas variables corresponden a las columnas del Tableau con vectores unitarios, definidas por las variables
artificiales. El fundamento del método está en intercambiar una de las columnas que está en el Tableau por otro que no
este.

Primero, se debe elegir como variable entrante a la base aquella no-básica con mayor coeficiente en el renglón de la
hilera 𝑍𝑍𝑗𝑗 . En este ejemplo la variable 𝑥𝑥1 que tiene el mayor coeficiente por lo tanto tiene el mayor impacto en el
crecimiento de la función objetivo. Este criterio se denomina “condición de optimalidad.”

Segundo, se debe definir por cuál variable básica cambiar, es decir establecer la variable saliente de la base. Para
determinar la variable básica saliente se determina la razón entre los lados derechos de las ecuaciones (columna 𝑏𝑏𝑗𝑗 )
dividida entre los coeficientes de la variable entrante 𝑎𝑎𝑖𝑖,𝑝𝑝 en cada hilera, la hilera en la que la razón 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 tenga el
menor valor, determina a la variable saliente y se define como hilera pivote. El subíndice “p” en 𝑎𝑎𝑖𝑖,𝑝𝑝 se define como
índice de la columna pivote. El cálculo de esta razón se registra en la columna 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 . Esta razón se conoce como
“prueba de mínima razón”, el elemento de esta columna que sea el menor define la variable de la hilera pivote que
tenga la mayor restricción para aumentar 𝑍𝑍. La aplicación de la prueba de mínima razón para estipular que variable es la
que sale de la base, se conoce como “condición de factibilidad.”

105
Tercero, con operaciones de hilera del tipo Gauss-Jordan en la tabla el elemento pivote (el elemento del cruce de la
columna pivote con la hilera pivote), contendrá un “1” en y los demás elementos de la columna pivote contendrán
ceros. Al final de las operaciones en la columna 𝑏𝑏𝑗𝑗 quedaran los valores de las variables 𝑥𝑥𝑖𝑖 en el óptimo y las 𝑆𝑆𝑖𝑖 serán
sustituidas por las 𝑥𝑥𝑖𝑖 en la columna 𝐶𝐶𝐵𝐵 . Se prevén dos tipos de operaciones, la primera para cambiar el valor del
elemento pivote a “1” y la segunda para eliminar (poner ceros) los elementos arriba y abajo del elemento pivote. La
aplicación de estas operaciones es conocida como pivoteo.

Estos pasos se repiten hasta que ninguna mejora de la función objetivo sea posible.

En el Tableau inicial del ejemplo la columna pivote es la columna de 𝑥𝑥1 porque tiene el coeficiente de mayor valor en la
𝑏𝑏 80 𝑏𝑏 60
función objetivo (𝑐𝑐1 = 60) y los valores de la prueba de mínima razón son 1 = = 40 y 𝑎𝑎 2 = = 20 por lo que la
𝑎𝑎 1,1 2 2,1 3
hilera pivote es la segunda hilera (20<40) y se dice que 𝑥𝑥1 entra a la base y 𝑆𝑆2 sale de la base, el Tableau queda:

60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 2 4 1 0 80 80/2=40
60 X1 3 2 0 1 60 60/3=20
Z=0 0 0 0 0 Zj
60 50 0 0 Cj - Zj

1
Las operaciones de hilera son: 𝑅𝑅 → 𝑅𝑅2′ y 𝑅𝑅1 − 2 𝑅𝑅2′ → 𝑅𝑅1′
3 2

Así, 𝑅𝑅2′ queda:

60 X1 3 2 0 1 60
=1 = 20
3 3 3 3

Y 𝑅𝑅1′ queda:

0 S1 2−2=0 2 8 1 −2 80 − 2(20) = 40
4− 2� � =
3 3 3

En la columna 𝐶𝐶𝐵𝐵 en la hilera 2 entra el valor del coeficiente de 𝑥𝑥1 de la función objetivo.

Los valores de la hilera 𝑍𝑍𝑗𝑗 se determinan multiplicando los elementos de las hileras por el valor de cada elemento en la
columna 𝐶𝐶𝐵𝐵

Z=0 60(1)=60 60(2/3)=40 60(0)=0 60(1/3)=20 Zj

El Tableau después de la primera eliminación resulta.

60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 0 8/3 1 -2/3 40
60 X1 1 2/3 0 1/3 20
Z=1200 60 40 0 20 Zj
60-60=0 50-40=10 0 0-20=-20 Cj - Zj

106
Para esta iteración 𝑥𝑥1 = 20 𝑦𝑦 𝑥𝑥2 = 0 por lo que la función objetivo vale 𝑍𝑍 = 60𝑥𝑥1 + 50𝑥𝑥2 = 60 ∗ 20 = 1200
𝑏𝑏 40
La nueva columna pivote es la columna de 𝑥𝑥2 y los valores de la prueba de mínima razón son 𝑎𝑎 1 = = 15 y
1,2 8/3
𝑏𝑏2 20
𝑎𝑎2,2
= = 30 por lo que la hilera pivote es la primera hilera y se dice que 𝑥𝑥2 entra a la base y 𝑆𝑆1 sale de la base.
2/3

3 ′
Las operaciones de hilera son: 𝑅𝑅 → 𝑅𝑅1" y 𝑅𝑅2′ − 23𝑅𝑅1′ → 𝑅𝑅2"
8 1

El Tableau queda:

60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
50 X2 0 1 3/8 -1/4 15 15
60 X1 1 0 -1/4 1/2 10 30
Z=1350 60 50 15/4 35/2 Zj
0 0 -15/4 -35/2 Cj - Zj

La solución es óptima ya que ningún valor en la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 es positivo.

Los resultados se interpretan de la siguiente manera:

Los valores de las variables en el óptimo están en la columna 𝑏𝑏𝑗𝑗 , 𝑥𝑥1 = 15 𝑦𝑦 𝑥𝑥2 = 10 y la función objetivo tiene un valor
𝑍𝑍 = 1350

Las siguientes instrucciones ilustran el uso de la calculadora TI nspire para ayudar a resolver este ejemplo con el método
Simplex.

Escribir en la calculadora TI nspire las siguientes matrices que definen el Tableau inicial.

Primero definir las dimensiones de la matriz y definir los valores de los elementos de la matriz con b/7: Matriz y
Vector/1: Crear/1: Matriz.

Figura 7.4 Menú de definición de las dimensiones al crear una matriz.

107
Se definen dos matrices para el Tableau por conveniencia en las operaciones. También se consideran por separado el
vector de mínima razón y la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 . Se observa que la columna pivote esta en 𝑥𝑥1 .

Ahora se determina los elementos de la columna de la prueba de mínima razón. Usar b/7: Matriz y Vector/1:
Crear/7: Submatriz para abrir el comando subMat(Matrix, [startRow], [startCol], [endRow], [endCol], en el cual Matrix
identifica a la matriz elegida, startRow identifica a la hilera de inicio mientras que startCol identifica a la columna de
inicio. Las opciones endRow y endCol identifican a la hilera y columna finales. Así la instrucción subMat(a,1,5,2,5) es para
referirse a los elementos (1,5) y (2,5) de la matriz a, que corresponden 𝑎𝑎 los valores 80 y 60 respectivamente.

Para hacer la división de estos valores entre los elementos (1,1) y (2,1) de la matriz se usa el comando ./ que se define
con b/7: Matriz y Vector/A: Operaciones con elementos/4: Dividir con punto decimal.

El menor valor está en la hilera 2 así que el elemento pivote es “3” siendo 𝑥𝑥1 la variable entrante y 𝑆𝑆2 la variable 2
1
Se procede a hacer las operaciones de hilera, 𝑅𝑅2 → 𝑅𝑅2′ y 𝑅𝑅1 − 𝑅𝑅2′ → 𝑅𝑅1′ con la calculadora. Para multiplicar una fila
3

por una constante se define el comando mRow( ). Usar b/7: Matriz y Vector/9: Operaciones con Filas/ 3: Multiplicar
fila. Así como mRowAdd( ) para Multiplicar fila y sumar.

𝑎𝑎2 Representa al nuevo Tableau. En la hilera 2 decolumna 𝐶𝐶𝐵𝐵 entra el valor del coeficiente de 𝑥𝑥1 de la función objetivo:

108
Se determinan los nuevos valores de la hilera 𝑍𝑍𝑗𝑗 y de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗

El valor de la función objetivo en esta primera iteración es:

Se procede de la misma manera para obtener el segundo Tableau.


La columna pivote es la de 𝑥𝑥2 y la hilera pivote se define con la prueba de mínima razón.

3 2
La hilera pivote es la 1 sale 𝑆𝑆1 de la base y entre 𝑥𝑥2 , las operaciones de hilera, 𝑅𝑅1′ → 𝑅𝑅1" y 𝑅𝑅2′ − 𝑅𝑅1" → 𝑅𝑅2" con las
8 3
operaciones en la calculadora:

Se determinan los nuevos valores de la hilera 𝑍𝑍𝑗𝑗 y de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗

Como cada elemento de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 es no positivo entonces se alcanzó el óptimo
En la columna 𝐶𝐶𝐵𝐵 en la hilera 1 entra el valor del coeficiente de 𝑥𝑥2 de la función objetivo:

El valor de la función objetivo es

109
Los valores de las variables en el óptimo están en la columna 𝑏𝑏𝑗𝑗 , 𝑥𝑥1 = 15 𝑦𝑦 𝑥𝑥2 = 10

Aunque parece que el método Simplex es muy complejo, simplemente imita el proceso de prueba gráfica de los puntos
viables en las esquinas de la región viable. Empieza con los valores de las variables en el origen (0, 0), estos valores
corresponden a las variables artificiales, que no son reales y definen el Tableau inicial. El método prueba las esquinas
vecinas en la dirección en que progresa la función objetivo. A través de la elección adecuada del pivote que define la
variable entrante y la saliente en la base, se obtiene un nuevo Tableau y se termina cuando se obtiene el óptimo.

7.3 Programación lineal en Excel

La hoja de cálculo Excel de Microsoft se puede usar para proponer y resolver problemas de programación lineal. Excel
cuenta con una opción de cálculo denominado Solver, con el cual se pueden encontrar máximos o mínimos.

El menú de captura de la formulación de modelos para Solver se muestra en la Figura 7.5.

Figura 7.5 Menú de datos del Solver, con datos del Ejemplo 7.1.

Los datos de la hoja de cálculo se muestran en la Figura 7.6.

110
Figura 7.6 Hola de cálculo con los datos del Ejemplo 7.1

Se puede notar que las celdas A2 y B2 son las celdas de referencia para las variables X1 y X2 respectivamente, que
corresponden a x e y del Ejemplo 7.1. Se puede observar que Solver se encuentra en el Menú Datos.

En las celdas C5 a C7 se definen las ecuaciones de la función objetivo y las restricciones, en la columna D se dan los
valores de las constantes del lado derecho de las restricciones.

Cuando se activa Solver el Menú se muestra como en la Figura 7.7

Figura 7.7 Menú de datos del Solver.

111
En un nuevo problema se debe cambiar la referencia a la celda de la función objetivo que inicialmente se define como
$A$1 y activar el botón Máx puesto que se trata de un problema de maximización. Para definir las celdas de referencia
de las restricciones dar clic en el botón Agregar y aparecer la ventana de captura de las restricciones, ver Figura 7.8

Figura 7.8 Ventana de datos de las restricciones.

Finalmente en la opción del Método de Resolución elegir Simplex LP y oprimir el botón Resolver. La solución aparece
directamente en la hoja de cálculo como se muestra en la Figura 7.9.

Figura 7.9 Resultados del Solver para el Ejemplo 7.1

112
Problemas

7.1 La sección de galletas de una fábrica de dulces elabora dos tipos de galletas. Las normales y las Premium, las
Premium tienen chispas de chocolate y las otras no. La ganancia en las normales es de 0.5 dólares por caja mientras que
en las Premium se gana 0.60 dólares por caja. Las galletas se procesan en tres etapas: mezclado, horneado y empaque,
se empacan dos galletas en cada bolsa de papel transparente para su venta. Los datos de tiempo requerido para cada
etapa en cada tipo de galleta se definen en la siguiente tabla:

Minutos requeridos para la elaboración de una caja de galletas.

Mezclado Horneado Empacado


Galletas normales 1 5 3
Galletas Premium 2 4 1

Las máquinas que se usan en cada etapa tienen una disponibilidad de tiempo limitado en cada lote, 14 horas máximo en
la máquina de mezclado, el equipo de horneado se puede usar cuando mucho 40 horas y la máquina de empacado 15
horas a lo mucho. Si cada máquina se puede asignar a fabricar uno u otro tipo de galletas, determinar cuántas cajas de
cada tipo de galletas se deben fabricar para maximizar las ganancias.

Respuestas: Ganancia máxima 𝑍𝑍 = 290.4 en 𝑥𝑥1 = 192 y 𝑥𝑥2 = 324.


𝑥𝑥1 𝑦𝑦 𝑥𝑥2 = número de cajas de galletas normales y premium por lote respectivamente.

7.2 Con el método Simplex y las iteraciones del Tableau encuentre el óptimo de la función:

Max 𝑍𝑍 = 2𝑥𝑥1 + 4𝑥𝑥2

Sujeto a: −𝑥𝑥1 + 𝑥𝑥2 ≤ 3 y

𝑥𝑥1 + 𝑥𝑥2 ≤ 5

Con 𝑥𝑥1 , 𝑥𝑥2 ≥ 0

Respuestas: 𝑥𝑥1 = 1 ; 𝑥𝑥1 = 4 con: 𝑍𝑍(1 ,4) = 18

113
CAPITULO 8
Simulación

La simulación en computadoras ha contribuido considerablemente al desarrollo


de la ingeniería y de muchas ramas del conocimiento. La simulación no solo se
aplica en la etapa de diseño de los procesos, también durante la operación,
control y optimización. En este capítulo se describe el uso del simulador PRO/II
en su versión 9.3, para simular el proceso de fabricación del benceno a partir de
la des hidrogenación del tolueno.

114
8.1 Introducción

El gran desarrollo de la tecnología de computadoras tanto en el hardware como en el software, provoca día con día
nuevos avances y transformaciones. En particular los métodos de cálculo para el análisis, síntesis, diseño y optimización
de sistemas en todas las ramas de la ingeniería han sido desplazados o modificados por el uso de diversas técnicas de
simulación.

La simulación es la imitación de un sistema por un sustituto denominado modelo. El objetivo de la simulación es la


construcción y experimentación con modelos. Los usos típicos de los simuladores son:

• Diseño de nuevos proceso

• Estudios de viabilidad, evaluación y selección de alternativas

• Escalamiento de diseños

• Ensayo de sensibilidad

• Entrenamiento de operadores

• Probar condiciones extremas y situaciones riesgosas sin comprometer la integridad del sistema real.

El poder de la simulación consiste en reemplazar la realidad por un modelo. Así que el modelo es una representación del
mundo real. Los ensayos de sensibilidad se refiere a las pruebas que permiten determinar los cambios en la salida de un
sistema que son atribuibles a cambios en la entrada.

Un modelo debe reflejar en alguna manera los atributos esenciales del sistema que representa. Debe ser preciso, simple,
útil y robusto. Los modelos pueden ser teóricos o empíricos. La construcción de modelos va más allá de elaborar
relaciones funcionales, implica:

1. El entendimiento de los fenómenos que ocurren en el objeto que se modelo,

2. La elucidación de las fuerzas que causan estos fenómenos y el alcance de sus efectos

3. Dar sentido a los términos que contiene.

Los tipos de simulación según el modelo puede ser: de estado estacionario, dinámico o estocástico.

En la simulación de estado estacionario fijamos el interés en los cambios alrededor del volumen de control y no en lo
que pasa adentro. Los modelos son de ecuaciones algebraicas no lineales

En la simulación dinámica se incluyen los cambios de las variables dentro del volumen de control con respecto al tiempo.
Los modelos son de ecuaciones diferenciales

En la simulación estocástica se busca representar los cambios en el estado de los elementos del sistema con respecto a
estados previos. Los modelos son de funciones probabilísticas

8.2 Los simuladores de estado estacionario.

Los simuladores de procesos a régimen permanente se basan en una biblioteca de algoritmos de cálculo para los
equipos. Cada uno se considera como un elemento independiente. La simulación de un proceso se efectúa armando una
secuencia de llamadas a los algoritmos que representan los equipos. La secuencia de transformaciones físicas y químicas
115
en los procesos, a su paso por los equipos, así como el flujo de los materiales se indica en un esquema llamado diagrama
del proceso, dicho diagrama representa el modelo del proceso. La construcción de los diagramas de proceso es una de
las actividades más importantes en el uso de los simuladores.

Los simuladores de procesos químicos cuenta con un número determinado de módulos que calculan los procedimientos
de las operaciones unitarias, destiladores, reactores, cambiadores de calor y otros equipos. Estos procedimientos de
cálculo forman el corazón de los simuladores. Además se tiene un conjunto de procedimientos para calcular las
propiedades termo físicas y cinéticas que se requieran en los módulos de cálculo de las operaciones unitarias. Para la
construcción de los diagramas de proceso y la selección de los procedimientos de cálculo de las propiedades
termodinámicas se cuenta con protocolos de comunicación para el acopio de datos a través de ventanas y menús. De
igual manera se emplean menús para definir las sustancias a emplear y los parámetros de operación de los equipos. El
diagrama de proceso se construye directamente en la pantalla del monitor de la computadora o Tablet uniendo las
figuras o iconos que representan a los equipos. La estructura de un simulador de procesos químicos se muestra en la
Figura 8.1 que indica cómo se relacionan los bloques de los algoritmos de cálculo de las operaciones unitarias con los
bloques de cálculo de las propiedades termodinámicas y los procedimientos de cálculo de convergencia. Todos estos
bloques coordinados por programa ejecutivo del simulador.

Bloques de enlace Bloques de propiedades fisicoquímicas

Iniciación, captura de datos, creación Estimación de propiedades, bancos de


del diagrama de flujo, etc. datos, etc.

Programa ejecutivo

Bloques de construcción Bloques especiales

Cálculo de balances de los equipos, Aceleración de convergencia,


costos etc. optimización, etc.

Figura 8.1Estructura general de un simulador de procesos de estado estacionario.

8.3 Instrucciones para el uso del simulador PRO/II

El simulador PRO/II es un software comercial que calcula balances de materia y energía de una cantidad de equipos de
procesos químicos. Dispone de modelos matemáticos de las principales operaciones unitarias y reactores así como de
múltiples ecuaciones de estado para el cálculo de equilibrios químicos y físicos.

116
En esta sección se describen las principales ventanas y menús del simulador, para ilustrar el uso del simulador,
se usa como ejemplo la simulación paso a paso del diseño del proceso de des alquilación del tolueno para obtener
benceno.

Se aplican la información del libro de J. M. Douglas. Conceptual Design of Chemical Process, de acuerdo a los
siguientes datos.

Alimentación de hidrógeno: T:100 °F, P: 535 psia, Flujo Molar: 492.5 lbmol/h, 95% H2 y 5% de CH4.
Alimentación de tolueno: T:100 °F, P: 535 psia, Flujo Molar: 279.4 lbmol/h, tolueno puro.
Caída de presión en los equipos: 0.5 psia.
Condición de la corriente de salida del precalentador de la carga: Totalmente vaporizado.
Condición de la corriente de salida del horno a la entrada del reactor: T:1150 °F.
Condición de la corriente de entrada al flash: T: 100°F.
Condición de la corriente de purga: Fracción de separación 5%.
Condición de la corriente de salida del compresor: P:535 psia. (Eficiencia del compresor 75%)
Recuperación de los componentes claves en destiladores mayor al 99%.

Reacción 1: Tolueno + Hidrógeno  Benceno + Metano

Reacción 2: 2*Benceno  Difenilo + Hidrógeno

Conversiones en el reactor: reacción 1: 0.75, reacción 2: 0.0307

Descripción del proceso.

Se alimentan las corrientes de tolueno e hidrógeno, el tolueno ingresa puro mientras que el hidrógeno trae metano.
Estas corrientes se mezclan con las corrientes de recirculación para pasar a un cambiador de calor y entrar al reactor,
dentro de los tubos del cambiador de calor pasa el efluente del reactor. En el reactor ocurren dos reacciones, la principal
en la que el tolueno se combina con el hidrógeno para formar benceno y tolueno. En la reacción secundaria el benceno
se dimeriza para formar di fenilo. Después de ceder calor el efluente del reactor pasa por un separador de fases (flash).
La corriente de vapor del flash se divide en dos, una de las corrientes se purga del proceso, esta purga busca eliminar
parte del metano para que no se acumule en la corriente de reciclo, y la otra se recicla al reactor, pero antes pasa por un
compresor para recuperar la presión que haya perdido.

La corriente líquida del fondo del flash pasa por una válvula reductora de presión y luego ingresa a un destilador. El
destilador es una columna estabilizadora en la que se eliminan los gases que se encuentran disueltos en los aromáticos.
Los aromáticos benceno, tolueno y di fenilo salen por el fondo. Esta corriente pasa por una válvula reductora de presión
para luego ingresar a otro destilador (columna de benceno), en el cual por el domo se recupera casi todo el benceno,
que se extrae como producto y el resto de los aromáticos salen por el fondo. El fondo de la columna de benceno pasa a
una tercera columna, columna de tolueno, en la que se obtiene por el fondo el di fenilo que se extrae del proceso,
mientras que la corriente del domo se recicla al reactor, a través de una bomba.

Se recomienda seguir un procedimiento de siete pasos para la simulación de procesos.

1. Crear el diagrama de proceso (Flowsheet)


2. Definir los componentes
3. Seleccionar el método de cálculo termodinámico
4. Definir las corrientes de alimentación

117
5. Proveer las condiciones de operación del proceso
6. Correr la simulación.
7. Desplegar los resultados.

El PRO/II usa un código de colores para identificar si los datos que se alimentan al simulador son suficientes o
faltan. Al inicio del programa el simulador despliega un cuadro de dialogo que indica el significado de los colores, como
se muestra en la Figura 8.2.

Figura 8.2. Cuadro inicial del simulador con el significado de los colores.

Estos colores aparecen como bordes en los cuadros de dialogo, el rojo indica que se requieren datos o acciones,
el verde indica que el simulador puede dar datos por omisión y que el usuario los puede cambiar y sobre escribir. Con el
color azul indica que los datos son suministrados por el usuario y se aceptan satisfactoriamente, finalmente el amarillo
indica que los datos suministrados por el usuario están fuera de los límites normales.

Para iniciar dar clic en el botón OK. En la pantalla principal del simulador seleccionar una hoja en blanco, después
desplegar la paleta de equipos (PFD), como se muestra en la figura 8.3.

118
Figura 8.3. Inicio de una nueva hoja de trabajo y apertura de la paleta de equipos.

Antes de empezar a crear el diagrama de proceso seleccionar las unidades con el icono de unidades y tomar la opción
que se conveniente, para cerrar la ventana dar clic en OK, ver la Figura 8.4. El simulador ofrece por omisión es el sistema
inglés, puesto que el problema usa esta unidades, no se hace ningún cambio a las unidades en 8.4 (c).

(a)

(b)

( c)
Figura 8.4. Selección de las unidades. (a) Botón de unidades de medida (UOM), (b) Menú con bases de datos de las
unidades, ( c) Unidades disponibles.
119
La selección de los equipos del diagrama de proceso se toma de la paleta de operaciones PFD. Para empezar la
simulación del proceso del benceno se efectuaran los cálculos del reactor y recirculación sin el tren de destiladores. En la
Figura 8.5 se muestra como se seleccionan primero el mezclador (mixer) que servirá para combinar las corrientes de
alimentación y de reciclo. Se observa que la paleta de operaciones PFD contiene diferentes carpetas que contienen los
equipos agrupados por categorías. La carpeta general solamente contiene cinco opciones, la de corrientes (Streams),
Block Diagram, el separador de fases, Flash, el mezclador, mixer y el divisor de corrientes, splitter.

Figura 8.5. Selección del mezclador de reciclo en el diagrama de proceso.

También se incluye un cambiador de calor para aumentar la temperatura de la carga a la temperatura de


reacción. Pasar a la carpeta Heat Exchangers y seleccionar el icono de Simple HX. Para la selección se da clic sobre el
icono del equipo en la paleta de equipos y se mueve el Mouse a donde se desea poner el equipo, con un nuevo clic el
equipo queda en el área de dibujo. Después se selecciona el reactor de conversión (conversión reactor) entre las
diferentes opciones de reactores que ofrece la paleta de equipos en la carpeta de Reactors, así como los otros equipos
de la estructura de reciclo, el flash y otro cambiador de calor, ver Figura 8.6.

120
Figura 8.6. Selección de los equipos alrededor del reactor.

Para colocar las corrientes y conectar los equipos en el diagrama dar clic en el botón “Streams” de la paleta de
equipos. Empezar a unir los equipos de izquierda a derecha con ayuda del Mouse, como se muestra en la Figura 8.7.
Nótese que las corrientes de entrada tienen etiquetas rojas, este color indica que faltan datos en estas corrientes. En los
cambiadores de calor se tienen dos entradas y dos salidas disponibles para colocar las corrientes, en este caso se usan
sólo dos corrientes ya que se emplearan un calentador y un enfriador que usan corrientes de servicio, tanto de
calentamiento como de enfriamiento. Al activar el botón de Streams el puntero del Mouse cambia con una S. Se observa
que el flash tiene en el fondo dos salidas, se debe elegir la corriente lateral que corresponde a la salida de líquido, la otra
es para separar agua. Grabar el diagrama de simulación en la computadora.

121
Figura 8.7. Colocación de corrientes en los equipos alrededor del reactor.

El segundo paso de la simulación es la selección de los componentes de la base de datos.

Primero se oprime el botón de componentes de la lista de iconos del menú principal, “Component Selection”
(tiene la figura de una pequeña molécula de benceno) como se muestra en la Figura 8.8. Se abre una ventana de
selección de componentes y en esta se puede escribir directamente el nombre de cada componente, uno a la vez, o bien
seleccionarlos de una base de datos. Para seleccionar de la base de datos, oprimir el botón “Selection from list” y se
abre otra ventana de bases de datos “Component Family”, en la lista de las diferentes categorías de bases de datos
seleccionar la primera opción, “Most Commonly Used”. Oprimir OK para aceptar. Los componentes se pueden
seleccionar directamente de la lista, tal como aparece en la Figura 8.8, Por ejemplo para seleccionar el Benceno se
puede dar doble clic sobre el nombre o se puede dar el nombre en la caja de “Search String”. Ordenar los componentes
del más volátil al menos volátil, usando los botones a la derecha de la lista. Ver Figura 8.9.

122
Figura 8.8. Definición de la base de datos para seleccionar los componentes.

Figura 8.9. Lista ordenada de los componentes.

El tercer paso es la selección del método de cálculo de procedimientos termodinámicos.

Primero se oprime el botón de datos termodinámicos (Thermodynamic Data) de la lista de iconos del menú principal,
como se muestra en la Figura 8.10. Se abre la ventana de dialogo, en esta seleccionar en la opción “Category”, la base
“Most Commonly Used”. En la caja de “Primary Method” se despliega una lista de métodos, seleccionar para este
problema el método de “Peng-Robinson” y oprimir el botón “Add->”. Se pueden seleccionar varios métodos para
emplearse en los diferentes equipos del proceso o si se desea pueden hacerse modificaciones a los procedimientos de
cálculo oprimiendo el botón “modify”.

123
Figura 8.10. Menú del botón Thermodynamic Data para la selección del modelo para los cálculos termodinámicos.

El cuarto paso trata con la definición de las corrientes de alimentación al proceso.

Dar doble clic sobre una de las corrientes de alimentación y se abre una ventana de dialogo, Figura 8.11. Dar clic
sobre el botón “Flowrate and Composition”, nótese que está rodeado de un rectángulo rojo, el cual indica que faltan
datos. Se abre otra ventana y de esta escoger que tipo de datos se suministran, el flujo total “Total Fluid Rates” o el flujo
individual de los componentes “Individual Component Flowrates”. Activar la primera opción y dar los datos que se
tienen del problema en la lista de los componentes como se muestra en la Figura 8.11. Primero la corriente de
hidrógeno. En la caja de la esquina superior derecha identificada como “Stream” dar el nombre de la corriente
HIDROGENO.

Después dar las especificaciones de temperatura y presión de la corriente de hidrógeno, en la sección de


“Thermal Condition”. En la caja de “First Specification” seleccionar en la lista deslizable la temperatura y dar el valor de
100.0 ºF. En la segunda especificación elegir la presión y dar el valor de 535 psia, como se muestra en la Figura 8.12.
Para terminar, dar clic en el botón OK.

De la misma forma se dan los datos de la corriente de alimentación de tolueno.

124
Figura 8.11. Definición de la corriente de alimentación de hidrógeno.

Figura 8.12. Definición de la temperatura y presión de la corriente de alimentación de hidrógeno.

Se pueden cambiar los nombres de los equipos y corrientes usando el menú del Mouse, botón derecho del
Mouse, como se muestra en la Figura 8.13.

El siguiente paso es proveer las condiciones de operación en los equipos del proceso. Empezar con las
reacciones. Dar clic en el botón “Reaction Data” del menú principal, ver Figura 8.14. Dar un nombre al conjunto de
reacciones y oprimir el botón “Enter Data”. Aparece una ventana denominada “Reaction Definitions”, en esta dar los
nombres de las dos reacciones y dar clic sobre la definición de reaciones “Definition” en la primera reacción que aparece
en letras rojas como “Reactants=Products”. En la nueva ventana dar los coeficientes estequiométricos de los reactantes
y los productos según las reacciones del proceso, ver Figura 8.14. En la parte media de la ventana en la frase
“Stoichiometric Balance” aparece en rojo la frase “Does not equal” indicando que el balance no se cumple. Dar clic sobre
el letrero rojo y si la reacción se dio correctamente, se elimina el color rojo. Dar clic en OK para cerrar la ventana.

125
Figura 8.13. Cambio del nombre de las corrientes con el menú del Mouse.

Después de dar los datos de las reacciones se pueden dar las especificaciones del reactor, dando doble clic
sobre la figura del reactor. A través de las ventanas dar los datos de la conversión de las reacciones como se muestra en
la Figura 8.15. En la primera ventana oprimir el botón “Extent of Reaction” y en la segunda elegir el componente clave
para el cual se tiene la conversión de la reacción.

Figura 8.14. Datos de las reacciones del proceso.

126
Figura 8.15. Datos de conversión de reacciones en el reactor.

A continuación dar los datos de los cambiadores de calor, por ejemplo en el cambiador a la entrada del reactor
se requiere que la corriente de carga se caliente hasta 1150 ºF, esta especificación se da de acuerdo a la Figura 8.16. En
la primera ventana oprimir el botón “Specification”, en la segunda seleccionar de la lista deslizable la opción “Hot
Product Temperature” y en la última dar el valor de 1150 ºF y dar clic en el botón OK.

Figura 8.16. Especificaciones del cambiador de calor de entrada al reactor.

127
En las especificaciones del flash activar en la segunda especificación “Second Specification” el botón “Unit
Specification” y seleccionar operación adiabatica, “Duty” con una valor cero, ver Figura 8.17.

Figura 8.17. Especificaciones del flash.

Después que se suministraron todas las especificaciones de los equipos, el último paso de la simulación es correr
la simulación oprimiendo el botón “Run” del menú principal, ver Figura 8.18. Los colores de los equipos y corrientes
cambian a azul indicando que se procedió con la simulación satisfactoriamente.

Figura 8.18. Botón RUN de ejecución de la simulación.

Se pueden observar los resultados de varias formas, por ejemplo en una tabla de balance materiales, usando el
menú “Output” y la opción “Stream Property Table”, ver Figura 8.19

128
Figura 8.19. Opciones para el despliegue de tabla de resultados.

Aparece una ventana en color verde, arrastrar hasta una posición fuera del diagrama de proceso y dar doble clic
sobre esta ventana. Seleccionar las corrientes que se desean incluir en la tabla, de acuerdo a la Figura 8.20.

Figura 8.20. Selección de corrientes para la tabla de resultados.

Los resultados se muestran en la tabla según la Figura 8.21, Se puede ajustar el tamaño de la tabla estirando las esquinas
de la misma.

129
Figura 8.21. Tabla de resultados de la simulación.

La simulación de la planta de producción de benceno continúa siguiendo el procedimiento establecido en el libro


de Douglas. Primero se hace una integración térmica entre la corriente de salida del reactor y la entrada para
aprovechar el calor generado en las reacciones, para ello se agrega un intercambiador de calor. Además se agrega un
divisor de corrientes “splitter”, para definir el flujo de la purga y un compresor de reciclo. En el divisor se usa una
relación de 0.1283 moles de flujo en la purga con respecto al flujo molar en la corriente de vapor del flash. Los
resultados son similares a los que se obtienen en el libro de Douglas.

Para exportar la figura del diagrama de proceso con los resultados a una hoja de Word se usa la opción “export”
del menú “File”. En la ventana que se abre activar la opción “Flow sheet Drawing” y dar OK en el mensaje que despliega.
Ver Figura 8.22. Se le agrega un título al diagrama con el menú Draw y submenú Text.

Figura 8.22. Simulación de la estructura de reciclo.

130
Para la simulación de las columnas de destilación en la estructura de separadores se empieza por colocar una
columna para estabilizar la mezcla de aromáticos y separar el remanente de los gases incondensables, hidrógeno y
metano. Primero se inserta una válvula a la salida del líquido del fondo del flash, para reducir la presión hasta 150 psia.
Seleccionar el icono de valve en la carpeta de “Pressure Change”, ver Figura 8.23.

Figura 8.23. Colocación del icono de la válvula en el diagrama.

Luego se agrega un bloque que use los métodos cortos para diseño de columnas de destilación, “Shortcut”, de la carpeta
de opciones “Column” Activar la opción de reboiler ya que la columna solamente tendrá el hervidor o tal vez un
condensador parcial. En la Figura 8.24 se muestran las ventanas para dar esta información en PRO/II.

Figura 8.24. Adicción de una columna de métodos cortos.

131
El módulo ShortCut usa el método de Fenske, Underwood y Guillilan para determinar el número mínimo de
platos teóricos del destilador así como el reflujo mínimo necesario y el plato de alimentación. Agregar las corrientes de
salida en el domo y en el fondo, renombrar como DOMO1 y FONDO1 respectivamente, unir la columna con la corriente
de salida de la válvula. Después dar doble clic sobre la columna Shortcut. Se abre una primera ventana con varias
opciones ver Figura 8.25. Dar clic en la opción “Minimum Reflux”, en la segunda ventana activar la opción “Perform
Minimum Reflux Calculation” y elegir los nombres de los componentes ligero y pesado, en el primer caso elegir al
metano, en el segundo al benceno.

Figura 8.25. Especificación de reflujo mínimo y componentes clave.

Oprimir OK y en la primera ventana dar clic en la opción “Specifications”. En la segunda ventana dar clic en la palabra
“parameter” de la primera especificación. Puesto que se va a especificar una recuperación del hidrogeno y metano en el
domo de 99%, se debe introducir la ecuación

𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝐻𝐻2 𝑦𝑦 𝐶𝐶𝐶𝐶4 𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑


= 0.99
𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝐻𝐻2 𝑦𝑦 𝐶𝐶𝐶𝐶4 𝑒𝑒𝑒𝑒 𝑙𝑙𝑎𝑎 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛

Se debe seleccionar en “parameter” la opción “Stream” y en la caja de “Stream Name” seleccionar Domo1. Luego como
parámetro para esta corriente seleccionar Flowrate y definir que se trata de componentes seleccionados, es decir el
hidrogeno y el metano. Luego en el signo de igualdad aparece una lista deslizable, de ahí tomar la opción “/”. Aparece
en rojo la palabra “parameter”, hacer lo mismo pero para la corriente S4 con los mismos componentes. Después del
signo igual escribir 0.99 y oprimir OK. Ver Figura 8.26.

132
Figura 8.26. Definición de la especificación de separación dos gases en el domo.

En la segunda especificación especificar el flujo deseado de benceno en el domo, aproximadamente 1.0 lbmol/hr, Como
se muestra en la Figura 8.27

Figura 8.26. Definición de la especificación de separación dos gases en el domo.

133
Finalmente dar en la opción “Products” de la primera ventana el flujo en el domo de aproximadamente 12
lbmol/hr, este valor es una estimación por lo que no se requiere un valor exacto, Figura 8.27, y en la opción de
“Condenser/Reboiler” activar la opción “Partial Condenser Type”, cerrar la ventana dando clic en el botón OK.

Figura 8.27. Definición de la estimación del flujo de benceno y de productos en el domo

Al correr la simulación el color de todos los bloques cambia a azul. Se despliegan los resultados en las corrientes
alrededor del destilador y se observa que la separación es como se especificó, ver Figura 8.28.

Figura 8.28. Resultados de las corrientes alrededor del destilador.

134
Para ver los resultados del bloque de métodos cortos activar el menú del Mouse oprimiendo el botón derecho
sobre el bloque de shortcut y en el menú dar clic en la opción “View Results”. Con esto se abre el editor de textos del
simulador desplegando los resultados como puede observarse en la Figura 8.29. En los resultados además de los flujos
calculados se puede ver el número mínimo de platos requeridos 2.36

Figura 8.29. Despliegue de resultados del bloque Shortcut con el reflujo mínimo.

Ahora hay que cambiar la columna estabilizadora que se definió con los métodos cortos por una columna de
cálculo riguroso. Primero se borra la columna de shortcut y con la paleta de equipos se elige un bloque “Distillation”.
Primero solicita el número de etapas que tendrá la columna de destilación, “Number of Theoretical Trays”, escribir 5 y
dar clic en OK. Después de unir las corrientes de entrada y salida dar doble clic sobre el icono de la columna y se abre
una ventana, Figura 8.30. Primero dar clic en el botón “Pressure Profile…” y en la ventana que se abre escribir el valor
de 150 psia en la caja de “Top Tray Pressure”, oprimir el botón OK.

Después oprimir el botón “Feeds and Products…” y en la ventana de Feeds and products escribir 1 en la caja de Feed
Tray. Agregar una estimación del flujo del producto en el domo de la columna de12 lbmol/hr, dar este valor en la caja
con el nombre de la corriente del domo, se puede ver que este es flujo que se calculó con el módulo de métodos cortos.
Al oprimir OK el PRO/II pregunta si se desea que el dato del flujo del fondo de la columna sea tomado como una
especificación de la columna, en este caso dar clic en NO, ver Figura 8.31. En el botón “Condenser” elegir un
condensador parcial.

135
Figura 8.30. Definición de la presión de operación en la columna.

Figura 8.31. Especificación del plato de alimentación y el flujo en el domo de la columna.

A continuación oprimir el botón “Performance Specifications…” ver Figura 8.32. En la primera


especificación de la ventana de “Specifications and Variables” dar clic en la palabra “Parameter” y se abre una
ventana y en esta seleccionar Stream en la primera caja y en la segunda el nombre de la corriente para la cual
136
se dan las especificaciones, tomar la corriente DOMO1 y oprimir la Parameter que aparece en rojo. Se abre
una ventana de “Parameter Selection”. Elegir el flujo dando clic en Flowrate, seleccionar la opción “Selected
Components” y como en el caso del módulo de Shortcut seleccioar el hidrogeno y el metano. Después
seleccionar el símbolo “/” de la lista deslizable en el signo de igualdad, Proceder como se hizo en el módulo de Shortcut.

Figura 8.32. Datos de operación de la columna estabilizadora.

El bloque de destilación del PRO/II permite hacer varias especificaciones, por ejemplo en la ventana de la Figura
8.32 se puede especificar la composición deseada de separación en vez del flujo molar. Después de correr la simulación
los resultados se pueden desplegar en una hoja de cálculo como Excel, ver figura 8.33. Para hacerlo seleccionar el menú
“Tools” y en las opciones ir a “Spreadsheet”, ahí seleccionar la opción “Component Rates”. Se abre en Excel una plantilla
con los flujos de los componentes en todas las corrientes, dejar solo las que sean de interés, como se observa en la
figura 8.33.

Figura 8.33. Flujo de los componentes en las corrientes en Excel.

137
Para completar la simulación se agregan dos columnas de destilación para separar el benceno, tolueno y
difenilo. Primero se coloca una válvula a la salida del fondo de la torre estabilizadora, para reducir la presión hasta 15
psia. Después se coloca un destilador, torre de benceno, con 32 platos, con alimentación en el plato 18, presión en el
domo de 15 psia y con flujo aproximado de 265 lbmol/hr de benceno en el domo (estos datos se obtienen usando un
módulo Shortcut). En el condensador activar en la caja de “condenser Type” la opción de “Bubble Temperatura”. En el
botón de Performance specification definir una composición de benceno en el fondo de la torre de 0.05 % molar y una
relación de reflujo de 2. Por el domo se obtendrá benceno casi puro y en el fondo una mezcla de tolueno y difenilo. Esta
mezcla se pasa a otra columna, torre de tolueno, con 6 platos y alimentación en el plato 3, operando a 15 psia de
presión. En el condensador activar en la caja de “condenser Type” la opción de “Bubble Temperature”. En el botón de
Performance specification definir una composición de difenilo en el fondo de la torre de 0.999 % molar y una relación de
reflujo de 2.

Al correr la simulación se requiere dar clic varias veces en el botón “Run”. Para acelerar la convergencia de los
cálculos cambiar las especificaciones de iteraciones en reciclos con el botón del menú “Recycle Data”, ver Figura 8.34. En
la ventana de opciones de reciclo aumentar el número de iteraciones para la convergencia a 100 y activar el método de
cálculos iterativos de Wegstein, “Apply Wegstein Acceleration” y el botón de “converge only tear streams” en las
opciones de aceleración. Luego oprimir “accelerated tear streams” y se habre el menú de selección de las corrientes a
acelerar.

Figura 8.34. Opciones de aceleración de convergencia en recirculaciones.

El diagrama completo de la simulación se muestra en la Figura 8.35.

138
Figura 8.35. Diagrama completo de la simulación.

En la Figura 8.36 se muestra la tabla de las corrientes de entrada y salida del proceso con los resultados finales de la
simulación. Se observa que se obtienen 262.76 lbmol/hr de benceno en la corriente de benceno y 5.62 lbmol/hr de
difenilo en la corriente de difenilo. En estas dos corrientes se pierde algo de tolueno (menos de 1 lbmol/hr), por lo que
se pueden hacer cambios a las especificaciones de operación e los separadores para tratar de reducir esta perdida.

Figura 8.35. Tabla de las corrientes del proceso con resultados de la simulación.

139
Problemas

1. Compruebe las regla heurísticas: Si va a aumentar la presión de una corriente, bombeé un líquido en vez de
comprimir un gas.

Use los siguientes datos. 100,000 lb/h de etilbenceno va desde el tanque de alimentación a 25 ºC y 1 atm hasta el
reactor a 400 ºC y 5 atm. Emplear el modelo termodinámico de Peng-Robinson.

Respuestas:

Bombear un líquido

Comprimir un gas

El trabajo de compresión, 144,784.48 Hp es mucho mayor que el de bombeo, 842.07 Hp. Por lo que se
comprueba la regla heurística.

2. Se requiere simular una planta para producir metanol, el cual se obtiene a partir de las reacciones:

Reacción 1: CO + 2H2  CH3OH Conversión de CO, 30%

Reacción 2: CO2 + 3H2  CH3OH H2O Conversión de CO2, 20%

Las reacciones se efectúan a 30 psia y 392 °F en un reactor adiabático.

140
Datos de la alimentación a la planta: Flujo = 45 kmol/hr, T = 77 ºF, P = 30 psia, Composición: H2 = 69 %, CO2=7 %, CO =
21 % y CH4 = 3 %, En porcentajes molares.

El efluente del reactor debe enfriarse hasta 104 ºF para separar los productos de los gases incondensables, la
separación es en un flash adiabático. Estos gases son reciclados al reactor, el 10 % de los gases que salen del flash se
purgan para evitar altas concentraciones de metano. Los líquidos del fondo del flash, metanol y agua, principalmente
pasan a un destilador en el cual por el domo se obtiene casi todo el flujo del metanol y el resto de los gases que no se
separaron en el flash. Por el fondo del destilador se obtiene casi toda el agua que se manda a tratamiento biológico. La
columna tiene 20 platos con alimentación en el plato 8, opera a 15 psia, la composición del agua en el fondo debe ser
mayor a 98 % y la composición del metanol en el domo es superior a 80%.

Determine la simulación de la planta considerando que la caída de presión en cambiadores de calor es de 0.9 psi y que la
eficiencia de compresores es de 85%. Use el método termodinámico de NRTL, con modificación en el cálculo de entropía
usando el método de SRK.

PLANTA PRODUCTORA DE METANOL PURGA

RECICLO

1
SP1
C1

2
S7 3
METANOL
4
5
6
7
8
GASES 9
10
11
LIQUIDO
R-OUT 12
S2 13
14
M1 R-IN S1
ALIMENTACION FLASH 15
E2
E1 16
F1 V1
R1 17
18
19

T1 20 AGUA

Stream Name ALIMENTACION R-IN R-OUT GASES LIQUIDO PURGA RECICLO METANOL AGUA
Stream Description
Phase Vapor Vapor Vapor Vapor Mixed Vapor Vapor Liquid Liquid
Temperature F 77.000 106.087 641.010 104.000 103.844 104.000 104.000 -117.909 213.020
Pressure PSIA 30.000 30.000 29.100 28.200 15.000 28.200 28.200 15.000 15.000
Flowrate LB-MOL/HR 99.208 404.862 361.204 339.626 21.578 33.962 305.654 21.000 0.578
Composition
CO 0.210 0.139 0.109 0.116 0.000 0.116 0.116 0.000 0.000
H2 0.690 0.609 0.548 0.582 0.004 0.583 0.583 0.004 0.000
CO2 0.070 0.061 0.055 0.058 0.001 0.058 0.058 0.001 0.000
METHANE 0.030 0.073 0.082 0.087 0.000 0.087 0.087 0.000 0.000
METHANOL 0.000 0.109 0.183 0.145 0.782 0.145 0.145 0.804 0.000
H2O 0.000 0.008 0.023 0.011 0.212 0.011 0.011 0.190 1.000

3. Comparación de los modelos termodinámicos de NRTL, Soave-Redlich-Kwon y Soave-Redlich-Kwon modificado


para determinar propiedades de equilibrio.

Se tiene una mezcla de Etanol 12%, ácido acético 20% y agua 68% (porcentajes molares) a una presión de 3 atm. Para
esta mezcla se desea calcular sus propiedades físicas de cambio de fase. Determinar el punto de burbuja y el punto de
rocío. Se desea conocer el punto de los azeótropos a 0,5 atm y a 3 atm.

141
Respuestas:

142
El mejor método es el de NRTL.

143

También podría gustarte