Introduccion A La Optimizacion
Introduccion A La Optimizacion
Introduccion A La Optimizacion
Febrero de 2018
Contenido
2
INTRODUCCIÓN.
El presente reporte es parte de las actividades de semestre sabático propuestas por el Dr. Enrique
Arce Medina y aprobadas por la Academia de Procesos de la Escuela Superior de Ingeniería
Química. Se presentan los apuntes de acuerdo al programa de la Unidad de Aprendizaje
Optimización y simulación de Procesos.
Para la elaboración de los apuntes se sigue el orden de los temas del programa de la Unidad de
Aprendizaje haciendo algunos cambios en el orden de la presentación de los temas para darle un
orden más lógico y congruente con el desarrollo de las herramientas matemáticas de la teoría de
la optimización matemática. Además se incluyen temas que no están descritos en el programa de
estudio.
En el capítulo 1 se tratan los temas introductorios a la optimización, que cubre en gran parte los
temas de la Unidad Temática I del programa de estudios: temas 1.1, 1.2. Y se describe el tema 2.1
de la Unidad Temática II. Los temas 1.3 y 1.5 se tratan en el capítulo 2, mientras que el tema 1.4 se
trata en el capítulo 8. Cabe hacer la aclaración que el tema 1.4 que se relaciona con el desarrollo
de modelos para la simulación de procesos se trata en estos apuntes en el capítulo 8, pero en el
desarrollo de los temas en el aula si sigue el orden de los temas de la unidad temática I.
En el Capítulo 2 como ya se mencionó se tratan los temas 1.3 y 1.5 de la unidad temática I.
En el capítulo 3 se tratan los temas 2.2 y 2.3 de la Unidad temática II. El tema 2.3.1 (Programación
Lineal), de la unidad temática II se trata en el Capítulo 7.
3
CAPITULO 1
Conceptos Básicos
4
Aplicaciones del cálculo para la optimización matemática.
El concepto de optimización va siempre asociado a la idea de mejoramiento, como obtener más con menos. Ese menos
se refiere a cosas que se pueden modificar, variables interrelacionadas, que usadas en la cantidad adecuada (óptima)
conducen a la obtención de algo que mejora y que depende de las variables, es decir ese algo es una función. La función
suele expresarse matemáticamente como un modelo que interrelaciona a las variables. Optimizar implica buscar los
valores de las variables que hacen que la función alcance un máximo o un mínimo. Por ejemplo la determinación de las
dimensiones óptimas de una caja rectangular sin tapa, la altura (H), ancho (W) y largo (L), que definan el costo (C)
mínimo para contener un volumen determinado. El proceso de optimización usa técnicas numéricas o algoritmos cuyos
cálculos se pueden efectuar a mano o con la ayuda de una computadora o una calculadora programable. Diferentes
tipos de modelos matemáticos requieren diferentes algoritmos de optimización. En este texto se utilizan y describen los
tres métodos de cálculo.
Las técnicas de optimización matemática encuentran múltiples aplicaciones en los procesos químicos, por
ejemplo, para encontrar la eficiencia máxima de operación, para determinar las condiciones de operación que
maximicen las ganancias, para reducir los costos de producción, o establecer las dimensiones de los equipos que
minimicen los costos etc. Hay muchos campos donde la optimización encuentra múltiples aplicaciones, como en el
diseño. Considerando al diseño como la propuesta del arreglo de cosas, para que cumplir con ciertas especificaciones, el
diseño óptimo es la propuesta del mejor diseño.
Los métodos de optimización tratan con la determinación de los valores de las variables de los procesos o
diseños para que el desempeño del proceso o el diseño sea el óptimo, es decir el mejor, maximizando o minimizando el
resultado.
𝑓𝑓(𝑥𝑥 ∗ ) Será el mínimo si se tiene para cualquier 𝑥𝑥 < 𝑥𝑥 ∗ o 𝑥𝑥 > 𝑥𝑥 ∗ y el valor de la función en 𝑥𝑥 ∗ es 𝑓𝑓(𝑥𝑥 ∗ ) < 𝑓𝑓(𝑥𝑥).
Este mínimo será óptimo local si es la mejor solución entre las cercanas, en cambio un óptimo global es la mejor
solución de las posibles. El punto en el que se cumple que 𝑥𝑥 = 𝑥𝑥 ∗ se denomina punto extremo, también conocido como
punto crítico o estacionario.
La determinación de la función objetivo que representa el modelo del problema es una parte fundamental de la
formulación del problema de optimización, los siguientes ejemplos ilustran ejemplos de formulación de modelos.
Ejemplo 1.1 Se requiere determinar el espesor del aislante de una tubería que minimice los costos. El costo del aislante
en tuberías depende tanto del valor del aislante (costo fijo, 𝑪𝑪𝒇𝒇 ) como de los costos causados por pérdida de calor (costos
variables, 𝑪𝑪𝒗𝒗 ) de acuerdo a las siguientes ecuaciones:
5
𝑪𝑪𝒇𝒇 (𝑥𝑥) = 80𝑥𝑥 + 396
𝑪𝑪𝒗𝒗 (𝑥𝑥) = 3465/𝑥𝑥
Esta última expresión es el modelo del problema a optimizar, 𝐶𝐶𝑇𝑇 es la función objetivo que depende de la variable 𝑥𝑥.
Ejemplo 1.2
Una compañía fabrica dos tipos de productos, el tipo A y el tipo B. Una unidad de producto A se vende en $27 y requiere
materia prima por un costo de $10. El costo de mano de obra de cada producto A es de $14. Por otro lado, un producto
B se vende en $21 y requiere materia prima por un costo de $9. El costo de mano de obra de cada producto B es de $10.
La manufactura de los productos A y B requiere dos tipos de labor: carpintería y acabado. Cada producto A requiere 2
horas de acabado y 1 de carpintería, mientras que un producto B requiere 1 hora de acabado y 1 hora de carpintería.
Cada semana la compañía dispone de 100 horas para acabado y 80 horas para carpintería. Mientras que la demanda de
producto B es ilimitada, se estima que la compañía vende a lo más 40 productos A por semana. La compañía desea hacer
un plan de producción semanal que maximice la ganancia.
Los datos pueden concentrarse en una tabla como la siguiente:
Producto Precio ($) Costo de materia Costo de mano Tiempo requerido de Tiempo requerido
tipo prima ($) de obra ($) carpintería (h) de acabado (h)
A 27 10 14 1 2
B 21 9 10 1 1
Entonces: Ganancia = 27𝑥𝑥 + 21𝑦𝑦 − [(10𝑥𝑥 + 9𝑦𝑦) + (14𝑥𝑥 + 10𝑦𝑦)] = 3𝑥𝑥 + 2𝑦𝑦
La disponibilidad de los recursos es:
6
ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑠𝑠 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
Horas de Acabado: 2 ∗ 𝑥𝑥 + 1 ∗ 𝑦𝑦 ≤ 100 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐴𝐴 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐵𝐵
ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
Horas de carpintería: 1 ∗ 𝑥𝑥 + 1 ∗ 𝑦𝑦 ≤ 80 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐴𝐴 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝐵𝐵
Además las variables no pueden ser negativas, 𝑥𝑥 ≥ 0, 𝑦𝑦 ≥ 0
Matemáticamente se tiene:
Maximizar: 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 3𝑥𝑥 + 2𝑦𝑦
Sujeto a las restricciones: 2𝑥𝑥 + 𝑦𝑦 ≤ 100
𝑥𝑥 + 𝑦𝑦 ≤ 80
𝑥𝑥 ≤ 40
𝑥𝑥 ≥ 0, 𝑦𝑦 ≥ 0
En este modelo las restricciones son condiciones que acotan los posibles valores de las variables para no sobrepasar
ciertos límites. En otras palabras, las variables tienen un dominio restringido. La formulación de los problemas de
optimización trata con la modelación del problema en términos de la función objetivo, las variables y las restricciones.
Mientras que el proceso de optimización trata con la determinación de máximos o mínimos de la función objetivo que
satisfaga las restricciones.
La condición necesaria para que 𝑓𝑓(𝑥𝑥) tenga un óptimo en 𝑥𝑥 = 𝑥𝑥 ∗ es que la derivada sea cero:
𝑑𝑑𝑑𝑑
=0
𝑑𝑑𝑑𝑑
Las coordenadas de las variables en 𝑥𝑥 ∗ definen un punto estacionario o punto extremo o crítico.
𝑑𝑑 2 𝑓𝑓 𝑑𝑑 2 𝑓𝑓
La condición para que 𝑓𝑓(𝑥𝑥) tenga un mínimo en 𝑥𝑥 = 𝑥𝑥 ∗ es > 0. Si < 0 entonces 𝑥𝑥 ∗ corresponde a un máximo.
𝑑𝑑𝑥𝑥 2 𝑑𝑑𝑥𝑥 2
Sin embargo, 𝑓𝑓′(𝑥𝑥) puede ser cero y no obstante en ese valor 𝑓𝑓(𝑥𝑥) puede no tener un punto extremo, por ser punto de
silla.
Derivando una vez la función e igualando a cero se encuentran los puntos estacionarios.
𝑑𝑑𝑑𝑑
= 𝑥𝑥𝑒𝑒 −𝑥𝑥 (2 − 𝑥𝑥) = 0 Se obtienen dos raíces, 𝑥𝑥1 = 0 𝑦𝑦 𝑥𝑥2 = 2.
𝑑𝑑𝑑𝑑
𝑑𝑑 2 𝑓𝑓
Con la segunda derivada se obtiene: = 𝑥𝑥𝑒𝑒 −𝑥𝑥 (2 − 4𝑥𝑥 + 𝑥𝑥 2 )
𝑑𝑑𝑥𝑥 2
Con 𝑥𝑥1 = 0 se obtiene 𝑓𝑓"(𝑥𝑥1 ) = 2 > 0 (el punto crítico 𝑥𝑥1 corresponde a un mínimo)
7
(a)
(b)
Ejemplo 1.4 Determinar el espesor del aislante que minimice los costos del ejemplo 1.1
Se resuelve y se obtiene, x* = 6.58 cm. Entonces el costo óptimo es, CT = 1449 $/año
En la Figura 1.2 se muestran las curvas de los costos fijos y variables así como el costo total y la ubicación del óptimo.
En la calculadora TI nspire abrir dos ventanas la primera con la calculadora y la segunda para trazar gráficos, usar la tecla
¿ para agregar una página. La Figura 1.2(a) muestra las instrucciones para definir los costos fijos, los variables y los
costos totales, 𝐶𝐶𝑇𝑇 , 𝐶𝐶𝑣𝑣 𝑦𝑦 𝐶𝐶𝑓𝑓 respectivamente, mientras que la Figura 1.2 (b) muestra las curvas de estos costos.
(a) (b)
Figura 1.2 (a) Definición de los términos del ejemplo 1.1.(b) Gráfica de la función 𝐶𝐶𝑇𝑇 (𝑥𝑥) = 𝐶𝐶𝑣𝑣 + 𝐶𝐶𝑓𝑓 .
8
En la línea de ingreso de la hoja para hacer la gráfica escribir 𝑓𝑓1 (𝑥𝑥) = 𝑐𝑐𝑐𝑐. Después ajustar las escalas de los ejes de la
gráfica oprimiendo b 41 Escribir en la ventana emergente: Xmin:-1.5; Xmax: 15, Ymin:-100 y Ymax:2000.
Después con /-G, agregar en la línea de ingreso las funciones 𝑓𝑓2 (𝑥𝑥) = 𝑐𝑐𝑐𝑐 y 𝑓𝑓3 (𝑥𝑥) = 𝑐𝑐𝑐𝑐.
Muchos problemas de optimización tratan con minimizar los costos como en el ejemplo 1.4 o maximizar las ganancias,
como el ejemplo 1.2.
Ejemplo 1.5 El precio de cierto producto depende de la cantidad producida q, 𝑃𝑃 = 42 − 2𝑞𝑞 y la ecuación de costo es
𝐶𝐶(𝑞𝑞) = 2𝑞𝑞 + 80
La función objetivo es la utilidad que es igual a los ingresos (I) menos los costos ( C), U = I – C
Los ingresos se determinan con el producto del precio de cada producto por la cantidad de productos, I = p*q
La matriz de las segundas derivadas denominada Hessiana 𝐻𝐻 se usa determinar el carácter de posibles óptimos, es decir,
para probar máximos y mínimos de las funciones.
𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓
⎡ 2 …. ⎤
⎢ 𝜕𝜕𝑥𝑥 1 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥𝑛𝑛 ⎥
𝐻𝐻 = ⎢ … … …
2 ⎥
⎢ 𝜕𝜕 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓 ⎥
….
⎣ 𝜕𝜕𝑥𝑥𝑛𝑛 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥𝑛𝑛 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥𝑛𝑛2 ⎦
𝐻𝐻 es una matriz definitivamente positiva si Di > 0, para i= 1, 2, .. n. donde Di son los determinantes menores de H
𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
𝐻𝐻11 𝐻𝐻12 … . 𝐻𝐻1𝑛𝑛
𝜕𝜕2 𝑓𝑓 𝜕𝜕𝑥𝑥12 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2
𝐷𝐷𝑖𝑖 = � … … … � Se tiene: 𝐷𝐷1 = , 𝐷𝐷2 = � 𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
� , etc.
𝜕𝜕𝑥𝑥12
𝐻𝐻𝑖𝑖1 𝐻𝐻𝑖𝑖2 … . 𝐻𝐻𝑖𝑖𝑖𝑖 𝜕𝜕𝑥𝑥1 𝜕𝜕𝑥𝑥2 𝜕𝜕𝑥𝑥22
Esto implica que las derivadas de segundo orden de la función evaluadas en un punto crítico deben ser positivas para
tener un mínimo relativo (local). Si los signos de los determinantes menores se alternan de negativo a positivo, entonces
la función tiene un máximo,
Si Di ≤ 0 para i = 1,3,5,… y además Di ≥ 0 , para i= 2,4,6,… se tendrá un máximo.
Cuando se tenga un cambio de signo entre determinantes contiguos, se tendrá un punto de inflexión o de silla.
9
En general la matriz A simétrica de nxn dimensiones es definida positiva, negativa, semi positiva definida o semi
negativa definida si y solo si sus valore propios, λ , calculados con det(𝐴𝐴 − λ𝐼𝐼) = 0 son positivos, negativos, no
negativos o no positivos, respectivamente. Así, los valores propios y los determinantes de la Hessiana se usan para
definir el carácter de los puntos críticos.
Ejemplo 1.6 En el siguiente diagrama del proceso de polimerización simplificado, Figura 1.3, determinar el flujo de
recirculación R y la presión de operación P que minimicen los costos de operación. Los costos de operación anual es la
$ 109
función objetivo de acuerdo a: 𝐶𝐶 � � = 1000(𝑃𝑃) + 4 ∗ + 2.5 ∗ 105 (𝑅𝑅)
𝑎𝑎ñ𝑜𝑜 𝑃𝑃𝑃𝑃
Reciclo
Purga
Reactor Destilador
Carga
fresca de
monómero Bomba Polímero
106
De la primera ecuación se despeja 𝑅𝑅 de la derivada parcial con respecto a P se obtiene: 𝑅𝑅 = 4 ∗
𝑃𝑃2
𝜕𝜕2 𝐶𝐶 𝜕𝜕2 𝐶𝐶
𝜕𝜕2 𝐶𝐶 109 𝜕𝜕𝑃𝑃2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 2 250
𝐷𝐷1 = = 8∗ = 2 > 0 , 𝐷𝐷2 = � � =� � = 2 ∗ 125,000 − 250 ∗ 250 = 187,500 > 0
𝜕𝜕𝑃𝑃2 10003 ∗4 𝜕𝜕2 𝐶𝐶 𝜕𝜕2 𝐶𝐶 250 125,000
𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑅𝑅 2
Ambos valores son positivos por lo que es definitivamente positiva y se trata de un mínimo.
Este ejemplo ilustra paso a paso los detalles de los cálculos de las derivadas y la solución de las ecuaciones resultantes,
esto parece innecesario a los ojos de los estudiantes quienes encuentran mucho más sencillo escribir las ecuaciones en
la calculadora y que la calculadora las resuelva. La razón para entender los detalles paso a paso en la resolución de los
problemas es la comprensión de los razonamientos en los cálculos, además de que se tiene una visión concreta de las
evaluaciones de las ecuaciones paso a paso. Para hallar los valores propios de una matriz solo deben igual a cero el
siguiente determinante |(𝐴𝐴 − λ𝐼𝐼)| = 0. En el Ejemplo 1.6 el determinante se calcula de la siguiente manera
2 250 𝜆𝜆 0 2 − 𝜆𝜆 250
�� �−� �� = � � = (2 − 𝜆𝜆) ∗ (125,000 − 𝜆𝜆) − 2502 =
250 125,000 0 𝜆𝜆 250 125,000 − 𝜆𝜆
Con Excel se usa el complemento Solver según la siguiente Figura y se obtienen los mismos resultados:
En la gráfica de una función de dos variables en el plano (x, y) se tendrá una gráfica de figuras concéntricas
(círculos en el caso de una función cuadrática) con centro en el punto crítico que representa a las curvas de nivel
correspondientes a los contornos que se generarían al cortar la superficie de la función en tres dimensiones, con planos
horizontales (ver Figura 1.4). Cada curva de nivel une los puntos en los cuales la función toma un mismo valor,
𝑓𝑓(𝑥𝑥, 𝑦𝑦 ) = 𝑐𝑐.
f(X1,X2)
x2
X1 Mínimo
Figura 1.4 Curvas de nivel de una función de dos variables proyectadas en un plano.
11
En cartografía se utilizan las curvas de nivel para incorporar a un mapa alguna información tridimensional del relieve que
corresponde a la zona representada.
Algunas funciones pueden presentar varios óptimos, la Figura 1.5 muestra una función con un mínimo local y un mínimo
global.
x
Figura 1.5 Gráficas de una función con un mínimo local y un mínimo global.
Una función univariable f(x) será convexa si para cualquier par de puntos x1 y x2 que están en el intervalo [a, b] y para
cualquier constante 𝛾𝛾 con valores en el intervalo [0, 1], se cumple:
La interpretación geométrica de esta definición es que cualquier recta que une dos puntos del conjunto, se encuentra
totalmente contenida en el conjunto.
Esto indica que cualquier línea recta que une los puntos [𝑥𝑥1 , 𝑥𝑥2 ] cae en la región definida por la función f(x).
Solamente cuando aplica la desigualdad la región es estrictamente convexa. La función tiene una curvatura hacia abajo,
ver Figura 1.6 (b). Cuando se invierte la desigualdad de ≤ a ≥, entonces la función es cóncava. La función tiene una
curvatura hacia arriba, ver Figura 1.6 (a).
Nótese que si solo se cumple la igualdad, entonces los puntos extremos ocurren en los límites de la función y es
igualmente convexa y cóncava. Además, una función g(x) que sea convexa entonces –g(x) será cóncava.
Implicaciones de las propiedades de convexidad de las funciones univariables.
f(x) f(x)
x1 cóncava 2 x x x2 x
(a) Función (b) Función1convexa
Figura 1.6 (a) Gráfica de una función cóncava, (b) gráfica de una función convexa
12
Para dos variables se tendrán los casos:
Ejemplo 1.8 Para la función 𝑓𝑓(𝑥𝑥) = 2𝑥𝑥 4 − 16𝑥𝑥 3 + 32𝑥𝑥 2 + 5 determinar los puntos críticos y definir si son máximos o
mínimos.
Calcular la primera derivada e igualar a 0: 𝑓𝑓′(𝑥𝑥) = 8𝑥𝑥 3 − 48𝑥𝑥 2 + 64𝑥𝑥 = 0
Tomando la segunda derivada y evaluando los puntos críticos: 𝑓𝑓 ′′ (𝑥𝑥) = 24𝑥𝑥 2 − 96𝑥𝑥 + 64
En el primer punto 𝑥𝑥 = 0, 𝑓𝑓 ′′ (0) = 24(0)2 − 96(0) + 64 > 0 es convexo, tiene mínimo relativo
En el primer punto 𝑥𝑥 = 2, 𝑓𝑓 ′′ (2) = 24(2)2 − 96(2) + 64 − 32 < 0 es cóncavo, tiene máximo relativo
En el primer punto 𝑥𝑥 = 4, 𝑓𝑓 ′′ (4) = 24(4)2 − 96(4) + 64 = 64 > 0 es convexo, tiene mínimo relativo
Ejemplo 1.9 En la siguiente función encontrar los puntos críticos y determinar si éstos son máximos o mínimos relativos,
puntos de inflexión o puntos de silla.
𝜕𝜕𝜕𝜕(𝑥𝑥,𝑦𝑦) 𝜕𝜕𝜕𝜕(𝑥𝑥,𝑦𝑦)
= 3𝑥𝑥 2 − 𝑦𝑦 2 , = −2𝑥𝑥𝑥𝑥 + 9𝑦𝑦 2 − 5
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕
3𝑥𝑥 2 − 𝑦𝑦 2 = 0
Al igualar a cero y resolver con 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � , {𝑥𝑥, 𝑦𝑦}� se obtienen cuatro puntos críticos.
−2𝑥𝑥𝑥𝑥 + 9𝑦𝑦 2 − 5 = 0
13
𝜕𝜕 2 𝑓𝑓 𝜕𝜕 2 𝑓𝑓
⎡ ⎤
⎢ 𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕⎥ 6𝑥𝑥 −2𝑦𝑦
𝐷𝐷2 = ⎢ 2 2 ⎥ = �−2𝑦𝑦 �
18𝑦𝑦 − 2𝑥𝑥
⎢ 𝜕𝜕 𝑓𝑓 𝜕𝜕 𝑓𝑓 ⎥
⎣𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2 ⎦
−2.76548 1.59665
� � = 34.641 = 𝐷𝐷2
1.59665 −13.448
Puesto que D1 = -2.76548 < 0 y D2 = 34.641 > 0, entonces el punto crítico (−0.460914, −0.798326) es un máximo, con
𝑓𝑓(−0.460914, −0.798326) = 2.66109
Se hace lo mismo con los otros puntos críticos y los resultados se compendian en la siguiente tabla:
La identificación de los puntos críticos se puede hacer en la calculadora TI Nspire con la opción de gráficas, como se
ilustra en el siguiente ejemplo.
14
Ejemplo 1.10 Para la función 𝑓𝑓(𝑥𝑥) = 2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32 , determinar los puntos críticos y definir si son
máximos o mínimos.
Cuando se enciende la calculadora c al dar clic al icono de Añadir Gráficos, abre la página con una nueva gráfica. En la
línea de ingreso escribir:
Luego a través del menú modificar las escalas seleccionando la secuencia de teclas b41 (Menú/Ventana/Zoom/
Configuración de Ventana) y definir los siguientes parámetros como se ilustra en la figura 1.7 (a). La gráfica se muestra
en la Figura 1.7 (b).
La identificación de los mínimos y máximos se hace oprimiendo b 62. Aparece la pregunta ¿límite inferior? Y
una línea punteada, oprimir · y luego mover la segunda línea a la derecha de la primera para que incluya al mínimo y
después de oprimir · otra vez aparece entre paréntesis las coordenadas del mínimo. Hacer lo mismo para el máximo
y el otro mínimo. O también usando seleccionar trazado de la gráfica al mover el curso sobre la gráfica identifica los
mínimos, máximos o los ceros b62. Otra forma es con b /trazado/Trazado gráfico, aparece dos pequeñas
líneas cruzadas con un círculo sobre la gráfica, mover el círculo con las flechas de movimiento del cursor sobre la curva
hasta que aparezca la palabra máximo.
(a)
(b)
Figura 1.7 (a) Configuración de las escalas de la gráfica. (b) Gráfica de 𝑓𝑓1(𝑥𝑥) = 2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32
Una forma interesante de relacionar los puntos extremos de la función con la derivada de la función en forma gráfica, es
sobreponiendo la gráfica de la derivada con la gráfica de la función. Primero oprimir las teclas /-G para que aparezca la
línea de ingreso, luego seleccionar la tecla de plantillas matemáticas t que se encuentra a la derecha del número 9,
𝑑𝑑
para definir la derivada de la función [] , ver Figura 1.8. Para mostrar que los puntos extremos de la función
𝑑𝑑[ ]
coinciden con los ceros de la derivada poner una perpendicular en la intersección de la curva derivada con el eje
horizontal usando la secuencia de comandos: b641 que abre los submenús Geometría, Construcción y
Perpendicular. Aparece un pequeño lápiz que se puede mover hasta el punto de intersección deseado y al dar clic
aparece una pequeña mano para indicar que se puede mover la perpendicular, volver a dar clic. Se puede observar que
15
los ceros de la segunda derivada de la función corresponden a los puntos de intersección de la gráfica con el eje
horizontal.
𝑑𝑑
Los puntos críticos se obtienen directamente con la instrucción 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � (2𝑥𝑥 4 + 3𝑥𝑥 3 − 34𝑥𝑥 2 − 48𝑥𝑥 + 32) = 0, 𝑥𝑥�
𝑑𝑑𝑑𝑑
dando los valores: x=-3.1968, x=-0.681847, x=2.75345; al aplicar la segunda derivada a la función evaluada en cada
punto crítico se determina que el primero es mínimo, el segundo es máximo y el tercero es mínimo. Otra forma es
usando la función fmin( ) y definiendo la región de búsqueda, fMin(2*x^(4)+3*x^(3)-34*x^(2)-48*x+32,x)|−5≤x≤0 da
como resultado x= -3.1968
Este ejemplo muestra un caso de función multimodal, ya que presenta varios mínimos y máximos. El punto de x=-3.1968
con f= -51.1494 es un mínimo local, mientras que el punto x=2.75345, con f=-180.353 corresponde a un mínimo global.
Para mostrar las gráficas de una función de dos variables en la calculadora TI nspire, se resuelve el siguiente problema.
𝑥𝑥 2
Ejemplo 1.11 Determinar el mínimo de la función 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + 𝑦𝑦 2 = 1
4
La solución con el cálculo de las derivadas igualadas a cero dan como resultado el punto crítico (𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = (0, 0)
Con la función objetivo igual a 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = −1, ver Figura 1.9 (a) y su gráfica en Figura 1.9 (b).
16
(a)
(b)
Figura 1.9 (a) Función de una elipse centrada en el origen, (b) gráfica de las elipses.
La gráfica en tres dimensiones se obtiene en una nueva página seleccionando la opción de Agregar gráficos, después
seleccionando b, y las opciones de ver y Gráficos 3D. En la Figura 1.10 se observa que el punto donde la grafica
tridimensional tiene una altura mínima es el origen de los ejes (𝑥𝑥, 𝑦𝑦). Mientras que en la gráfica de la Figura 1.9 (b) el
mínimo corresponde al punto donde todas las elipses tienen su centro, el origen.
En muchos problemas de optimización no es fácil encontrar la solución a las derivadas del gradiente de la función
objetivo, por lo que tendrán que usarse técnicas de aproximación numérica. Las técnicas de optimización son múltiples y
diversas y generalmente dependen del tipo de problema a resolver. Se han clasificado en diferentes formas, por ejemplo
se hace una distinción entre las técnicas de optimización lineal, como el método de programación lineal; de la no lineal,
como el método del descenso más rápido. Similarmente hay técnicas de optimización multivariables o para una sola
variable. Otra distinción de las técnicas es la que pone a las técnicas de optimización directa, es decir con
manipulaciones matemáticas sin que se repitan los cálculos, como el método de multiplicadores de Lagrange, y por otro
lado se ponen a las técnicas de optimización de búsqueda iterativa, como el método de la sección dorada. Hay métodos
17
especiales para funciones con estructuras especiales como el método de programación dinámica y el método de
regresión de datos con mínimos cuadrados.
La estrategia de resolución de la mayoría de los métodos para obtener el máximo o mínimo de la función objetivo
consiste en avanzar acercándose a la solución óptima por un procedimiento iterativo, por movimientos exploratorios a
partir de un punto base. Tres son las cuestiones que se presentan en esta estrategia a partir de los valores iniciales de las
variables que optimizan el problema:
Los métodos de optimización basados en derivadas, como el método de Newton-Raphson se fundamentan en los
conceptos de gradiente y Hessiana para determinar la dirección de búsqueda.
Las calculadoras gráficas como la TI nspire CAS permiten encontrar gráficamente la solución óptima de funciones
matemáticas lo cual abre nuevos campos de resolución que simplifican el problema de optimización. Las calculadoras
graficas son un alivio en el trabajo de manipulación algebraico y de cálculo en la resolución de problemas, aumentan la
efectividad en los procedimientos de cálculo. Pero una parte muy importante, sino es que la más importante, es la
formulación matemática del problema a partir de una descripción verbal.
La optimización más que un campo de las matemáticas o una herramienta de la ingeniería, se debe entender como una
actividad humana. De acuerdo al darwinismo social, donde sobresalen los más aptos, es decir, aquellos cuyos logros
superan a los demás. Optimizar es una pauta en la vida de los que constantemente están mejorando, no solo en el
desempeño diario de aquello a lo que se dediquen, sino también en cuestiones de salud, bienestar y relaciones sociales.
La competencia optimacional nos puede ayudar a ser mejores buscando cada día hacer mejor lo que tenemos que hacer.
No hay mejor descriptor de la competencia optimacional que el éxito.
18
Problemas
1.1 En la siguiente función encontrar los puntos críticos y determinar si éstos son máximos, mínimos relativos, o puntos
de inflexión. 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 3𝑥𝑥 3 − 225𝑥𝑥 − 5𝑦𝑦 2 + 70𝑦𝑦 + 23
Repuestas: punto crítico (5, 7) es punto de inflexión y punto crítico (-5,7) es un máximo.
1.2 Encontrar los puntos extremos de la función 𝑧𝑧 = 𝑥𝑥 2 + 𝑦𝑦 2 + 4𝑥𝑥 + 4𝑦𝑦, y determinar si son máximos o mínimos.
Repuestas: 𝑥𝑥 = 480
1.4 Para las siguientes funciones. Hallar todos los puntos estacionarios de y clasificarlos.
Respuestas: a) Se tienen tres puntos extremos: (1, 2), es mínimo local; (0, 0) y (0, 4) son puntos de silla.
b)
(0, 1) Máximo
c) Puntos extremos: x=0,x=1, and x=2. 𝑥𝑥 = 1 es un máximo con 𝑓𝑓(𝑥𝑥 = 1) = 12; 𝑥𝑥 = 2 es un mínimo con 𝑓𝑓(𝑥𝑥 = 2) =
−11; 𝑥𝑥 = 0 es un punto de inflexión con 𝑓𝑓(𝑥𝑥 = 0) = 0.
d) Puntos extremos (0,0), (0,-8/3), (-4/3,0), y (-4/3,-8/3). (0,0) es un mínimo, (-4/3,-8/3 es un máximo, (0,-8/3) y (-
4/3,0) son puntos de silla.
1.5 Hallar los puntos críticos de 𝑓𝑓(𝑥𝑥) = (45 − 2𝑥𝑥)(25 − 2𝑥𝑥)𝑥𝑥 y determinar si son máximos o mínimos.
Respuestas: 𝑥𝑥 = 5.16 es un máximo, 𝑥𝑥 = 18.2 es un mínimo.
1.6 Encuentre el máximo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 50𝑥𝑥 4/5 𝑦𝑦1/5 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑎𝑎 𝑞𝑞𝑞𝑞𝑞𝑞 𝑥𝑥 + 𝑦𝑦 = 1000
19
Respuestas: Despejando a 𝑦𝑦 de la restricción y al sustituir en la función queda en términos de un variable. Se obtiene el
máximo en 𝑥𝑥 = 200, 𝑦𝑦 = 800
1.7 Se quiere construir una caja, sin tapa, partiendo de una lámina rectangular de 32 cm de larga por 24 de ancha. Para
ello se recortará un cuadradito en cada esquina y se doblará. ¿Cuál debe ser el lado del cuadradito cortado para que el
volumen de la caja resultante sea máximo?
Respuestas: Lado del cuadrito 𝑥𝑥 = 4.53 𝑐𝑐𝑐𝑐.
1.8 Determinar las dimensiones de una caja que pueda contener 6 dm3 con el mínimo de área superficial.
Respuestas: La base es un cuadrado de la 2.28943 y altura 1.14.471 con área= 15.8687 dm2.
1.9 Encontrar el min 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 4𝑥𝑥 2 + 𝑦𝑦 2 − 2𝑥𝑥𝑥𝑥 − 4𝑥𝑥 − 2𝑦𝑦 + 2 y trazar las curvas de nivel cambiando el valor de la
constante 2 en -1, 0, 0.5, 1.0 y 1.25
1 2
Respuestas: 𝑥𝑥 ∗ = , 𝑦𝑦 ∗ = , 𝑐𝑐𝑐𝑐𝑐𝑐 min 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 2/3
3 3
1.10 Determinar la relación óptima de altura al diámetro de recipientes cilíndricos para contener un volumen fijo.
ℎ
Respuestas: = 1
𝑑𝑑
1.11 Hallar el máximo de 𝑓𝑓(𝑥𝑥) = 500 − 𝑥𝑥(𝑥𝑥 − 20)3
Respuestas: Con 𝑥𝑥 = 20 se obtiene 𝑓𝑓(𝑥𝑥) = 500. Con 𝑥𝑥 = 5 se obtiene 𝑓𝑓(𝑥𝑥) = 17,375 el máximo global es 𝑥𝑥 = 5
1.12 El beneficio que se obtiene produciendo 𝑥𝑥 unidades del producto 𝐴𝐴 e 𝑦𝑦 unidades del producto 𝐵𝐵 se aproxima
mediante el modelo: 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = −2𝑥𝑥 2 + 60𝑥𝑥 − 10𝑦𝑦 2 + 140𝑦𝑦 − 100. Hallar el nivel de producción para el que se
obtiene el máximo beneficio.
1.13 Se desea forrar un tanque que almacena un fluido caliente con un aislante térmico. El flujo de calor que se pierde al
𝑘𝑘𝑘𝑘 1
exterior es 𝑄𝑄( ) = + 10 . Donde 𝑥𝑥 es el espesor del aislante. Suponer que el costo de la generación de un kJ de calor
ℎ 𝑥𝑥
en el medio de calentamiento del fluido es de medio dólar. El costo del aislante es de un dólar al año por cada milímetro
de espesor que cubre al tanque. Se desea encontrar el espesor que minimice los costos.
$
Respuestas: Espesor 𝑥𝑥 = 66.18 mm 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 43,932.4 � �
𝑎𝑎ñ𝑜𝑜
1.14 Encontrar el máximo de cada función, trazar las curvas de nivel y la gráfica en tres dimensiones.
a) 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 4 + 5𝑥𝑥 − 0.5𝑥𝑥 2 − 𝑦𝑦 2 + 6𝑦𝑦 − 0.5𝑥𝑥𝑥𝑥
20
CAPÍTULO 2
Planteamiento del problema de optimización
21
2.1 Modelación con balances de materia y energía
En los problemas de optimización matemática hay que formular el modelo matemático primero y luego aplicar el
método de resolución matemática que se requiera y por lo general esta parte suele ser más fácil que la primera. La
definición de la función objetivo, es decir lo que se desea optimizar y la especificación de las variables que controlan el
valor de la función objetivo, dependen del tipo de problema a resolver. En el planteamiento del modelo a optimizar se
tendrán además de las variables de decisión cantidades fijas como parámetros que son parte del modelo. Esta parte del
problema de optimización suele ser complicada si no se tiene conocimiento de los fenómenos que involucra el tipo de
problema. Obtener el modelo matemático de un problema implica un proceso de abstracción, en el que se hace una
representación matemática de la narrativa de un problema, este proceso se conoce como modelación. A continuación
se presentan unos ejemplos para el planteamiento de función objetivo y su optimización.
Ejemplo 2.1
Se desean producir 100 moles por hora de un producto R, de acuerdo a la reacción A R, en un reactor tipo tanque de
flujo continuo. La alimentación del reactivo es 0.1 mol/litro, la reacción es de primer orden con una velocidad de
reacción dada por 𝑟𝑟𝐴𝐴 = (0.2 ℎ𝑟𝑟)𝐶𝐶𝐴𝐴. En la Figura 2.1 se muestra el diagrama de un reactor tanque de flujo continuo, con
las siguientes variables: 𝐹𝐹𝐴𝐴 , flujo molar de A en la alimentación, mol/hr𝐶𝐶𝐴𝐴0 , , concentración de 𝐴𝐴 en la alimentación,
mol/litro y 𝐶𝐶𝑅𝑅 concentración de 𝑅𝑅 en la salida.
Determinar el volumen mínimo del reactor (V, litros), el flujo de la alimentación (𝐹𝐹𝐴𝐴0 , mol/h) y la conversión (𝑋𝑋𝐴𝐴 ), para
una operación óptima. Además determinar el costo por unidad de R producida en las condiciones óptimas. Suponer que
todo el reactivo no convertido se desecha.
𝑚𝑚𝑚𝑚𝑚𝑚
Por la estequiometria de la reacción, se tiene, 𝐹𝐹𝑅𝑅 = 𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 = 100
ℎ𝑟𝑟
Se puede eliminar 𝐹𝐹𝐴𝐴0 y escribir la expresión del costo total en términos de una sola variable 𝑋𝑋𝐴𝐴 , dando:
𝐹𝐹𝑅𝑅 𝐹𝐹𝑅𝑅
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅 + ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴
𝑘𝑘𝐶𝐶𝐴𝐴0 (1 − 𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴
100 100 50 50
Al sustituir los datos se obtiene: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 0.01 + ∗ 0.5 = +
(0.2)(0.1)(1−𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴 1−𝑋𝑋𝐴𝐴 𝑋𝑋𝐴𝐴
Para encontrar la conversión que da el costo mínimo se calcula la derivada de esta expresión y se iguala a cero,
𝑑𝑑𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 50 50
=0= + Dando 𝑋𝑋𝐴𝐴 = 0.5
𝑑𝑑𝑋𝑋𝐴𝐴 (1−𝑋𝑋𝐴𝐴 )2 𝑋𝑋𝐴𝐴2
𝐹𝐹 100 𝐴𝐴
El flujo de alimentación es 𝐹𝐹𝐴𝐴0 = 𝑋𝑋𝑅𝑅 = = 200 𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑
𝐴𝐴 0.5 ℎ𝑟𝑟
La segunda derivada del costo total en 𝑋𝑋𝐴𝐴 = 0.5 resulta positivo, por lo que se tiene un mínimo.
Ejemplo 2.2
En ejemplo 2.1 suponer que a la salida del reactor todo el reactivo A se puede separar del producto R por un
tratamiento de extracción y llevar a su concentración inicial 𝐶𝐶𝐴𝐴0 = 0.1 𝑚𝑚𝑚𝑚𝑚𝑚/𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 con un costo de separación
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑆𝑆 = 0.125 $/𝑚𝑚𝑚𝑚𝑚𝑚 𝐴𝐴
El reactivo recuperado se recicla al reactor, encontrar el nuevo óptimo y el costo por unidad de R producido óptimo.
Se hace un diagrama del proceso para visualizar las variables y equipos involucrados.
Reciclo FA0(1-XA)
Reactor
Carga fresca Separador
FAF, CA0 =0.1 FA0 FA=FA0(1-XA)
FR= FA0XA
23
𝑚𝑚𝑚𝑚𝑚𝑚
Nótese que, 𝐹𝐹𝑅𝑅 = 𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴 = 𝐹𝐹𝐴𝐴𝐴𝐴 = 100 ,
ℎ𝑟𝑟
𝐹𝐹𝐴𝐴0 𝑋𝑋𝐴𝐴
Y volumen del reactor tanque: 𝑉𝑉 = −𝑟𝑟𝐴𝐴
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ∗ 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 + 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 ∗ 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝐴𝐴 + 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑆𝑆 ∗ 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑑𝑑𝑑𝑑 𝐴𝐴
𝐹𝐹𝐴𝐴𝐴𝐴 𝐹𝐹𝐴𝐴𝐴𝐴
𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑜𝑜𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝑅𝑅 + 𝐹𝐹𝐴𝐴𝐴𝐴 ∗ 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐴𝐴 + (1 − 𝑋𝑋𝐴𝐴 ) ∗ 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑆𝑆
𝑘𝑘𝐶𝐶𝐴𝐴0 (1 − 𝑋𝑋𝐴𝐴 ) 𝑋𝑋𝐴𝐴
𝑑𝑑 50 1−𝑥𝑥
En la calculadora TI-nspire se obtiene: 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 � � + 50 + 12.5 ∗ = 0� , 𝑥𝑥� |𝑥𝑥 > 0 el resultado es 𝑥𝑥 = 0.3333
𝑑𝑑𝑑𝑑 1−𝑥𝑥 𝑥𝑥
𝑚𝑚𝑚𝑚𝑚𝑚
El flujo del reciclo es: 𝐹𝐹𝐴𝐴0 − 𝐹𝐹𝐴𝐴𝐴𝐴 = 300 − 100 = 200
ℎ
Se observa que al agregar el reciclo el tamaño del reactor disminuye y el costo del producto también disminuye.
Ejemplo 2.3 Se propone aprovechar el calor residual que salen con los gases de combustión de un horno que tienen un
flujo de 60,000 lb/h y capacidad calorífica de 0.25 BTU/lbºF, a una temperatura de 500ºF. Para ello se debe instalar un
cambiador de calor que tiene un coeficiente global de calor de 4.0 BTU/h-pie2-ºF y se desea producir vapor a una
temperatura de 220ºF a partir de agua líquida saturada a 220ºF. El vapor que se obtendría tendría un valor de $0.75 por
millón de BTU y el costo de instalación del cambiador se puede estimar en $5 por pie cuadrado de área. El costo se
amortiza en 5 años a una tasa de interés de8%.
El beneficio económico de la inversión P por los cinco años de instalación considerando el valor del vapor y el costo del
cambiador es:
𝑃𝑃 = 𝑣𝑣 ∗ 𝑄𝑄 ∗ 𝑛𝑛 − 𝐶𝐶 ∗ 𝐴𝐴 ∗ (1 + 𝑖𝑖)𝑛𝑛
Esta es la función objetivo que se busca maximizar.
Dónde:
𝑃𝑃 = 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖ó𝑛𝑛
24
𝑣𝑣 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐵𝐵𝐵𝐵𝐵𝐵 = $0.75/106 𝐵𝐵𝐵𝐵𝐵𝐵
𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿
𝑛𝑛 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 = 5 𝑎𝑎ñ𝑜𝑜𝑜𝑜
𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = $5.0/𝑝𝑝𝑝𝑝𝑝𝑝 2
𝐴𝐴 = Á𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝 2
𝑙𝑙𝑙𝑙
𝑚𝑚 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ó𝑛𝑛 = 60,000
ℎ
𝐵𝐵𝐵𝐵𝐵𝐵
𝐶𝐶𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐í𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 0.25
𝑙𝑙𝑙𝑙º𝐹𝐹
𝑇𝑇𝑖𝑖𝑖𝑖 = 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 500º𝐹𝐹
4𝐵𝐵𝐵𝐵𝐵𝐵
𝑈𝑈 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 =
ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 − º𝐹𝐹
�𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 �−(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
∆𝑇𝑇𝐿𝐿𝐿𝐿 = (𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
500−𝑇𝑇𝑜𝑜𝑢𝑢𝑢𝑢
En la ecuación de la diferencia de temperatura logarítmica se obtiene: ∆𝑇𝑇𝐿𝐿𝐿𝐿 = 280
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −220)
De las ecuaciones del calor transferido despejar el área y sustituir en la función objetivo, se obtiene:
Se tiene un problema de maximización de beneficios en términos de una variable que en este caso es la temperatura de
los gases a la salida del cambiador, 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 . Con la calculadora se obtiene:
$
Y el costo del cambiador es: 𝐶𝐶 = 5 (11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2 ) = $56,139.82
𝑝𝑝𝑝𝑝𝑝𝑝 2
25
Ejemplo 2.4 Un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una disolución acuosa,
utilizando disolvente nuevo en cada etapa, ver en la Figura 2. La disolución entra al sistema con un caudal de 500 kg de
agua/h y con una concentración xo = 0.20 kg de soluto por kg de agua. Dadas las distintas condiciones de mezcla en cada
etapa, puede admitirse que en la primera la relación de equilibrio entre las corrientes que salen de ella viene expresada
por 𝑦𝑦1 = 1.8 𝑥𝑥1 , mientras que en la segunda sería 𝑦𝑦2 = 2.2 𝑥𝑥2, donde:
②
W1 = kg d/h W2 = kg d/h
W0 = 500 kg A/h
① Etapa ③ Etapa
1 2
x0 = 0.2 kg S/kg A X1= kg S/kg A X2= kg S/kg A
④
y1 = 1.8x1 kg S/kg d y2 = 2.2x2 kg S/kg d
Si el valor del soluto recuperado es de 1,000 $/kg y el precio del disolvente de 80 $/kg, determinar el caudal óptimo de
disolvente a utilizar en cada una de las etapas, W1 y W2 (kg/h), para maximizar la diferencia entre el valor del soluto
recuperado y el costo del disolvente gastado. Considere que el flujo de W1 + W2 no deben ser mayor al caudal de la
disolución a tratar.
Es decir:
500 𝑘𝑘𝑘𝑘 𝐴𝐴 0.2 𝑘𝑘𝑘𝑘 𝑆𝑆 500 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑥𝑥1 𝑘𝑘𝑘𝑘 𝑆𝑆 𝑦𝑦1 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑤𝑤1 𝑘𝑘𝑘𝑘 𝑑𝑑
� �� �=� �� �+� �� �
ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑘𝑘𝑘𝑘 𝑑𝑑 ℎ
500∗0.2
Puesto 𝑦𝑦1 = 1.8 𝑥𝑥1 se obtiene: 500 ∗ 0.2 = 500𝑥𝑥1 + 1.8𝑥𝑥1 𝑤𝑤1 de donde: 𝑥𝑥1 =
(500+1.8𝑤𝑤1 )
𝑥𝑥1 500
Del balance de la segunda etapa se obtiene: 𝑥𝑥2 =
(500+2.2𝑤𝑤2
La función objetivo es: 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 − 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
Entonces:
500 500 ∗ 0.2
max 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 500 �0.2 − � 1000 − (𝑤𝑤1 + 𝑤𝑤2 )80
(500 + 2.2𝑤𝑤2 (500 + 1.8𝑤𝑤1 )
26
𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘
La solución es: 𝑤𝑤1 = 151.1876 𝑦𝑦 𝑤𝑤2 = 201.6258 con valor de la función de 𝑓𝑓 = 37,461.19 $/ℎ
ℎ ℎ
Figura 2.2 Instrucciones del método del gradiente para resolver el ejemplo2.5.
El método de mínimos cuadrados es una técnica de optimización para encontrar el mejor ajuste de un conjunto de datos
a una función matemática. Se trata de minimizar la suma de cuadrados de las diferencias en las ordenadas entre los
puntos generados por la función elegida y los datos. Con el modelo se pueden hacer predicciones o encontrar valores
óptimos.
Para un conjunto de n datos {𝑥𝑥𝑖𝑖 , 𝑦𝑦𝑖𝑖 } , 𝑦𝑦𝑖𝑖 es la variable dependiente, por ejemplo la temperatura, la concentración, etc. y
𝑥𝑥𝑖𝑖 la variable independiente, por ejemplo el tiempo, la conversión, etc. El método trata de encontrar la función 𝑓𝑓(𝑥𝑥𝑖𝑖 ) ,
como una ecuación algebraica con m coeficientes constantes 𝑦𝑦𝑖𝑖𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 , 𝑐𝑐1 , 𝑐𝑐2 , … 𝑐𝑐𝑚𝑚 ) que hagan que la
función produzca la mejor aproximación de los n datos. Los datos son observaciones que pueden ser el resultado de una
serie de experimentos al medir la variable dependiente para valores diferentes de la variable independiente.
El método de mínimos cuadrados se propone encontrar el mínimo de la suma de los errores en cada punto entre los
valores observados y los valores calculados de la variable dependiente, elevados al cuadrado, estos errores se conocen
como residuos.
𝑒𝑒𝑖𝑖 = 𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 ) = 𝑦𝑦𝑖𝑖𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 − 𝑦𝑦𝑖𝑖𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Por ejemplo para un ajuste con la ecuación cuadrática 𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐 la suma de errores a minimizar será:
𝑛𝑛 𝑛𝑛
2
𝑆𝑆𝑆𝑆 = ��𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 )� = �(𝑦𝑦𝑖𝑖 − 𝑎𝑎𝑥𝑥𝑖𝑖2 − 𝑏𝑏𝑥𝑥𝑖𝑖 − 𝑐𝑐)2
𝑖𝑖=1 𝑖𝑖=1
La función objetivo 𝑆𝑆𝑆𝑆 depende de los valores 𝑎𝑎, 𝑏𝑏 𝑦𝑦 𝑐𝑐, el busca estos valores que hacen mínima la función objetivo.
y
Medición
e=yi – a0 – a1x
x
Figura 2.3 Error en la regresión
27
En la Figura 2.3 se muestra el error de la regresión de un modelo lineal. La ecuación así determinada se llama curva de
regresión y representa la tendencia general de los datos observados. Para un modelo de ajuste lineal se tendrá una
regresión lineal. Se pueden hacer ajustes de la variable dependiente para varias variables independientes, teniéndose
una regresión múltiple. Otros modelos de regresión son:
1. Como primer paso se recomienda graficar los datos para probar si no hay datos que estén muy alejados de una
tendencia que muestren un patrón específico.
2. Definir el modelo de la función que se desea ajustar a los datos.
3. Calcular las derivadas parciales de 𝑆𝑆𝑆𝑆 con respecto a los parámetros del modelo. El óptimo se encuentra
igualando estas derivadas a cero. Se obtiene un conjunto de m ecuaciones, estas se denominan ecuaciones
normales.
4. Se calculan las sumas de las variables en los datos y se sustituyen en las ecuaciones normales.
5. Se resuelven las ecuaciones en términos de los parámetros del modelo.
2
La función objetivo para un ajuste lineal es: 𝑆𝑆𝑆𝑆 = ∑𝑛𝑛𝑖𝑖=1�𝑦𝑦𝑖𝑖 − 𝑓𝑓(𝑥𝑥𝑖𝑖 )� = ∑𝑛𝑛𝑖𝑖=1(𝑦𝑦𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑏𝑏)2
Las sumas se pueden obtener al hacer los cálculos en forma de tabla, de la siguiente forma:
𝑛𝑛 ∗ 𝑎𝑎 + 𝑏𝑏 ∗ 𝛴𝛴𝛴𝛴 = 𝛴𝛴𝛴𝛴
𝑎𝑎 ∗ 𝛴𝛴𝛴𝛴 + 𝑏𝑏 ∗ 𝛴𝛴𝑥𝑥 2 = 𝛴𝛴𝛴𝛴𝛴𝛴
28
𝛴𝛴𝛴𝛴𝛴𝛴𝛴𝛴
𝛴𝛴𝛴𝛴𝛴𝛴−
Entonces: 𝑏𝑏 = 𝑛𝑛
(𝛴𝛴𝛴𝛴)2
, 𝑎𝑎 = 𝑦𝑦� − 𝑏𝑏 ∗ 𝑥𝑥̅ , donde 𝑦𝑦� = 𝛴𝛴𝛴𝛴𝑖𝑖 /𝑛𝑛, 𝑥𝑥̅ = 𝛴𝛴𝛴𝛴𝑖𝑖 /𝑛𝑛
𝛴𝛴𝑥𝑥 2 −
𝑛𝑛
El coeficiente de correlación que mide la bondad del ajuste se determina con la fórmula:
El coeficiente será positivo si la correlación es positiva (al aumentar x aumenta y) y será negativo en el caso contrario.
Cuando el modelo a determinar es no lineal se puede proceder a hacer una transformación algebraica para obtener un
modelo lineal al cual se le puede aplicar el procedimiento descrito. En la Figura 2.4 se muestran algunos casos de
linearización.
y y
y
y = α1e β1x y = α 2 x β2 y = α3
x
β3 + x
x x
x
(a)
(b) (c)
ln y log y 1/y
Pendiente = β3/α3
Pendiente = β
1 Pendiente = β2
log x Intersección = 1/α3
x
1/x
Intersección = ln α1
Intersección = log α2
(d)
(e) (f)
Figura 2.4 Seis casos de modelos no lineales que se pueden linearizar, (a,b y) modelos originales
(d,e y f) modelos linearizados.
Ejemplo 2.5
Se realizan una serie de experimentos en un dilatómetro en el que se verifica la reacción de la hidrolisis de la sacarosa en
soluciones de ácido clorhídrico diluido, para determinar la constante de velocidad de reacción. La reacción produce
29
glucosa y fructuosa, teniendo la característica de que a medida que procede la reacción ocurre una rotación óptica de
derecha a izquierda y debido a esta variación la reacción es también conocida como inversión de la sacarosa. A esta
mezcla se le llama azúcar invertida y sus componentes tienen un poder edulcorante mayor y es más fácilmente
fermentable. Otra característica de la inversión de la sacarosa es que sufre una dilatación volumétrica y debido a esto se
implementa una técnica dilatométrica que permite seguir la cinética de la reacción.
La reacción tiene una cinética de primer orden, por lo que la variación de la concentración de la sacarosa (C) con
el tiempo es:
𝐶𝐶 = 𝐶𝐶0 𝑒𝑒 −𝑘𝑘𝑘𝑘
Puesto que el cambio de concentración es proporcional al cambio de volumen, en el reactor de laboratorio, se sigue con
un dilatómetro midiendo la altura en un tubo capilar instalado en el reactor, entonces la cinética es equivalente a:
𝐻𝐻 = 𝐻𝐻0 𝑒𝑒 −𝑘𝑘𝑘𝑘
Donde H es la altura del nivel en el tubo capilar. Se reportan los datos en la siguiente tabla y se aplica el método de
mínimos cuadrados para encontrar la constante de velocidad de reacción.
30
La solución resulta: b= −0.007, a = 3.8341, por lo que el modelo linearizado es 𝑦𝑦 = 3.8341 − 0.007𝑥𝑥 Puesto que
b = −0.007 = k y ln(𝐻𝐻0 ) = 𝑎𝑎 = 3.8341 siendo 𝐻𝐻0 = 𝑒𝑒 3.8341 = 48.308 la cinética de reacción queda:
𝐻𝐻 = 48.308𝑒𝑒 −0.007𝑡𝑡
Luego seleccionar con la tecla h seleccionar stat.results para ver los resultados. Da la línea recta: y=3.8343-0.007x, ver la
Figura 2.6 (a). La gráfica de los datos y la ecuación de regresión se despliega en una nueva página oprimiendo las teclas
/ y +page simultáneamente. En la nueva página seleccionar Agregar Gráficos, con Menú se selecciona Diagrama de
dispersión en la opción Tipo de Grafico, b34. A la pregunta de los nombres de las variables seleccionar 𝑥𝑥,y que
aparecerán en los ejes 𝑥𝑥,y. En la gráfica muestra un solo punto, Con Menú seleccionar Zoom-Datos en la opción Ventana
Zoom b 49. Luego agregar la recta de regresión con la tecla Menú seleccionar Función en Tipo de Gráfico
b31. En la línea de entrada escribir la ecuación 3.8343-0.007x, y traza la recta sobre los puntos de los datos. La
gráfica de la Figura 2.6 (b) no es igual a la Figura 2.5 porque 𝑦𝑦 representa los logaritmos de las alturas en la gráfica Figura
2.6 (b) mientras que en la Figura 2.5 en el eje vertical se presentan los valores de las alturas.
31
(a) (b)
Figura 2.6 Ventanas de la calculadora TI-Nspire para el Ejemplo 2.5, (a) resultados de la regresión, (b) gráfica.
Otra forma de resolver el problema es usando una hoja de cálculo. En la columna A se define el tiempo, en la B la altura
y en la C el logaritmo de la altura, “lndeh”. Se dan los datos de tiempo, la altura y se calcula el logaritmo de la altura.
Oprimir c y seleccionar Datos y Estadísticos. Mover el cursor y dar clic a la escala del eje horizontal y seleccionar la
variable “tiempo”. Hacer lo mismo en el eje vertical y seleccionar “lndeh”. Luego con b seleccionar Analizar y
Regresión luego seleccionar la Forma Lineal. Aparece la ecuación de regresión y la línea que pasa por los puntos de la
gráfica.
32
El modelo del ejemplo 3.1 es una relación exponencial entre las variables que comúnmente se encuentra en las
reacciones químicas con una cinética de primer orden. Otro caso de aplicación del modelo exponencial es el que se usa
para determinar los intereses que se generan en una inversión bajo interés compuesto, 𝑦𝑦 = 𝑃𝑃𝑒𝑒 𝑟𝑟𝑟𝑟 , donde 𝑃𝑃 es la
inversión inicial, 𝑟𝑟 es la tasa de interés y 𝑡𝑡 es el tiempo en años.
Ejemplo 2.6
X 5 10 15 20 25 30 35 40 45 50
y 16 25 32 33 38 36 39 40 42 42
Modelos:
1. 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏
2. 𝑦𝑦 = 𝑐𝑐 + 𝑏𝑏𝑏𝑏 + 𝑎𝑎𝑥𝑥 2
3. 𝑦𝑦 = 𝑎𝑎𝑥𝑥 𝑏𝑏
𝑥𝑥
4. 𝑦𝑦 = 𝑎𝑎
𝑏𝑏+𝑥𝑥
{5,10,15,20,25,30,35,40,45,50}→x
{16,25,32,33,38,36,39,40,42,42}→y
((1)/(x))→u
((1)/(y))→v
Para el modelo lineal se usa la función LinRegBx x,y,1, (b613), para el modelo cuadrático se usa la función
QuadReg x,y,1, (b616 ), para el modelo de potencia se usa la función PowerReg x,y,1, (b619),
1
mientras que para el modelo 4 se hace una transformación a los datos 𝑢𝑢 = 𝑦𝑦 𝑣𝑣 = 1/𝑦𝑦 para ajustar un modelo lineal,
𝑥𝑥
LinRegBx u,v,1. Los resultados de la calculadora se muestran en la Tabla 3.1
Tabla 3.1 Resultados del ajuste de los datos del Ejemplo 3.2.
LinRegBx x,y,1 QuadReg x,y,1 PowerReg x,y,1 LinRegBx u,v,1
"Regresión lineal (a+bx)" "Regresión cuadrática" "Regresión potencial" "Regresión lineal (a+bx)"
"RegEqn","a+b*x" "RegEqn","a*x^2+b*x+c" "RegEqn","a*x^b" "RegEqn","a+b*x"
"a",20.6667 "a",−0.015455 "a",9.65828 "a",0.019142
"b",0.495758 "b",1.34576 "b",0.395029 "b",0.213368
"r²",0.820113 "c",12.1667 "r²",0.930901 "r²",0.991973
"r",0.905601 "R²",0.94763 "r",0.964832 "r",0.995978
33
2 𝑦𝑦 = 12.1667 + 1.34576𝑥𝑥 − 0.01545𝑥𝑥 2
3. 𝑦𝑦 = 9.65828𝑥𝑥 0.39029
𝑥𝑥
4. 𝑦𝑦 = 52.241
11.147+𝑥𝑥
Figura 2.7 Datos del Ejemplo 2.6 y las curvas de los modelos que representan los datos.
Cuando no se conoce el modelo que se puede ajustar a los datos entre dos variables, se deben graficar los datos y por
observación se puede proponer el modelo funcional apropiado que mejor se ajuste a la relación que existe en las
variables de los datos. La calculadora se utiliza para ensayar cada una de las opciones de ajuste disponibles hasta
encontrar la gráfica que mejor se ajuste a los datos. El proceso de búsqueda del mejor ajuste algunos autores lo
denominan análisis de regresión.
Para la regresión polinomial el método se aplica de la misma manera, lo cual se ilustra en el siguiente ejemplo.
Ejemplo 2.7
En la tabla se muestran los valores que se determinaron experimentalmente de la capacidad calorífica de una sustancia
a diferentes temperaturas. Encontrar los parámetros del mejor ajuste para la ecuación. 𝐶𝐶𝐶𝐶 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐𝑇𝑇 2 .
La suma de errores cuadrados y las ecuaciones normales para este modelo son:
𝑛𝑛 𝑛𝑛
2 2
𝑆𝑆𝑆𝑆 = ��𝐶𝐶𝐶𝐶𝑖𝑖 − 𝑓𝑓(𝑇𝑇𝑖𝑖 )� = ��𝐶𝐶𝐶𝐶𝑖𝑖 − 𝑎𝑎 − 𝑏𝑏𝑇𝑇𝑖𝑖 − 𝑐𝑐𝑇𝑇𝑖𝑖2 �
𝑖𝑖=1 𝑖𝑖=1
34
𝑛𝑛 𝑛𝑛 𝑛𝑛
𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑛𝑛
𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑛𝑛
T Cp T2 T3 T4 T*Cp Cp*T2
273.15 75.158 74610.9225 20379973.5 5566789756 20529.4077 5607607.71
283.2 75.254 80202.24 22713274.4 6432399301 21311.9328 6035539.37
293.25 79.339 85995.5625 25218198.7 7395236770 23266.1618 6822801.93
313.05 85.539 98000.3025 30678994.7 9604059290 26777.984 8382847.88
333.18 105.73 111008.9124 36985949.4 1.2323E+10 35226.1219 11736639.3
353.31 122.92 124827.9561 44102965.2 1.5582E+10 43427.0987 15343228.2
373.15 136.101 139240.9225 51957750.2 1.9388E+10 50786.0882 18950828.8
Sumas: 2222.3 680.03 713886.81850 232037106 7.6292E+10 221324.795 72879493.2
∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖 � =2222.29 , ∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖2 � = 7,138.868 ∗ 102 , ∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖3 � = 2,320.371 ∗ 105
∑7𝑖𝑖=1� 𝑇𝑇𝑖𝑖4 � = 7,629.151 ∗ 107 , ∑7𝑖𝑖=1( 𝐶𝐶𝐶𝐶𝑖𝑖 ) = 680.033 , ∑7𝑖𝑖=1(𝑇𝑇𝑖𝑖 𝐶𝐶𝐶𝐶𝑖𝑖 ) = 2,213.248 ∗ 102 ,
35
En la calculadora TI nspire se obtienen los resultados.
En la calculadora usar la combinación de teclas para abrir la ventana de la función de regresión cuadrática: ·66,
para definir a la lista de los datos de t en la variable x y la lista de datos de cp en la variable y. Luego con la instrucción
QuadReg para obtener la regresión cuadrática, obtener el ajuste cuadrático.
Es de notar el valor del coeficiente de correlación R2 que da un valor de 0.9863. Un valor de R2 cercano a la unidad es
indicativo de un buen ajuste.
Cuando se resuelve en Excel se grafican los datos y se agrega una línea de tendencia se obtiene la gráfica:
36
150
140 y = 0.0039x2 - 1.8759x + 293.26
R² = 0.9864
130
Capacidad Calorífica
120
110
100
90
80
70
60
50
250 270 290 310 330 350 370 390
Temperatura
Figura 2.8 Gráfica de los datos del Ejemplo 2.7 con la línea de tendencia.
Las opciones para la línea de tendencia son las indicadas en la Figura 2.9
37
Figura 2.9 Opciones de la línea de tendencia para la gráfica de datos en Excel.
Tambien se puede usar el complemento Solver de Excel para hacer el ajuste de los mínimos cuadrados. Por ejemplo para
𝑥𝑥
el caso (4) con el modelo 𝑦𝑦 = 𝑎𝑎 del Ejemplo 2.6 se obtiene:
𝑏𝑏+𝑥𝑥
𝑥𝑥
𝑦𝑦 = 51.255
10.606 + 𝑥𝑥
Para lo que se definen dos celdas para los parametros a ajustar, a en la celda C4 y b en la celda C5, con valores iniciales
de 1 en cada celda. Los valores de x se introducen en las celdas de la A8 a la A17, similarmente los datos de y de la celda
B8 a la B17. En las celdas de la C8 se introduce la fórmula del valor calculado de y, $C$4*A8/($C$5+A8) y la fórmula se
2
𝑦𝑦 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
repite hasta la celda C17. Luego se calculan los residuos � − 1� desde la celda D8 con ((C8-B8)/B8)^2 y la
𝑦𝑦 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
fórmula se repite hasta la celda D17. Luego se calcula la suma de los errores al cuadrado en la celda D19, SUMA(D8:D17)
y se abre el Solver para especificar la celda objetivo (celda D19), y definir las celdas de las variables a cambiar,
$C$4:$C$5, y dar clic en boton de resolver. La hoja de cálculo se muestra en la Figura 2.10
Figura 2.10 Hoja de cálculo con ajuste del modelo 4 Ejemplo 2.6
38
Problemas
2.1 Determine las dimensiones óptimas de un recipiente de acero, tipo cilíndrico circular, si se sabe que el costo de
manufactura, incluido el material, por unidad de superficie de cada tapa es de 10 $/m2 y el cuerpo 8 $/m2. El volumen
de líquido que almacenara el tanque es 20π (m3).
2.2 Una caja con base cuadrada y sin tapa debe contener 1,000 cm3. Encontrar las dimensiones que requieran el mínimo
consumo de material para construir la caja. Suponer que el espesor es uniforme en la caja.
2.3 La ecuación de Clausius Clapeyron relaciona el calor latente de vaporización de sustancias líquidas con la
temperatura de ebullición y la presión de vapor.
∆𝐻𝐻𝑣𝑣
ln(𝑝𝑝) = − + 𝑘𝑘 𝑇𝑇(℃) 𝑦𝑦 𝑝𝑝(𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐻𝐻𝐻𝐻)
𝑅𝑅𝑅𝑅
𝐽𝐽
𝑅𝑅 es la constante universal de los gases, 𝑅𝑅 = 8.314
𝐾𝐾−𝑚𝑚𝑚𝑚𝑚𝑚
Con el método de los mínimos cuadrados determinar el calor latente de vaporización ∆𝐻𝐻𝑣𝑣 en kJ/mol usando los datos de
la tabla.
2.4 Una planta química produce urea y amoniaco, los cuales se venden a 1,000 y 1,500 dólares la tonelada de cada uno
respectivamente. Ambos se producen en dos etapas, reacción y secado, el número de horas necesarias para su
elaboración se da en la siguiente tabla.
Por limitaciones de mano de obra solamente se dispone de 80 horas por semana para atender las reacciones y 60 horas
por semana en el secado. Se dispone de 75 toneladas de materia prima, misma que se usa para los dos productos. Cada
producto requiere 4 toneladas de materia prima para su fabricación.
39
Formule el modelo matemático para maximizar las ganancias. Explique claramente como obtiene la función objetivo y
las restricciones.
2.5 La capacidad de producción de refrigeradores de una empresa es 𝑃𝑃 unidades por día. Los costos variables por
refrigerador se determinan como $47.73 + 0.1𝑃𝑃1.2 . Los costos fijos de manufactura corresponde a $1,750 y los gastos
de mano de obra son $7,325 por día. Si el precio de venta de cada refrigerador es $173, determinar:
a) El nivel de producción (número de refrigeradores producidos diariamente) que minimizan los costos.
b) La ganancia diaria que minimiza los costos.
c) El nivel de producción que maximiza las ganancias y la ganancia máxima diaria.
d) Cuál es la capacidad de producción de refrigerados en el que la utilidad es nula.
2.6 La velocidad de crecimiento 𝑣𝑣 de ciertos micro organismos en función de la concentración del sustrato, 𝐶𝐶, sigue la
cinética enzimática de Michaelis-Menten.
𝑣𝑣𝑚𝑚 𝐶𝐶 2
𝑣𝑣 =
𝑘𝑘 + 𝐶𝐶 2
Con el método de los mínimos cuadrados determinar los parámetros del modelo para los datos:
C 1.3 1.8 3 4.5 6 8 9
𝑣𝑣 0.07 0.13 0.22 0.275 0.335 0.35 0.36
1 1 𝑘𝑘 1 𝟎𝟎.𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝟒𝑪𝑪𝟐𝟐
Respuestas: Se lineariza el modelo invirtiendo la ecuación: = + para dar: 𝒗𝒗 =
𝑣𝑣 𝑣𝑣𝑚𝑚 𝑣𝑣𝑚𝑚 𝐶𝐶 2 𝟐𝟐.𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖𝟖+𝑪𝑪𝟐𝟐
2.7 Experimentalmente se encontró que La conductividad térmica 𝒌𝒌 de cierto metal depende de la temperatura 𝑻𝑻.
Encuentre con el método de los mínimos cuadrados los coeficientes 𝑎𝑎 𝑦𝑦 𝑏𝑏 del modelo:
𝑻𝑻𝒌𝒌𝒂𝒂 = 𝒃𝒃
Con los siguientes datos:
40
CAPÍTULO 3
Optimización de Funciones no Lineales con Restricciones
41
3.1 Problemas de funciones no lineales con restricciones.
Las restricciones en los problemas de optimización son limitaciones que se imponen a las variables del problema y
acotan la región posible de soluciones.
Cualquier conjunto (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 𝑋𝑋 que satisfaga las restricciones es un punto viable. La región de viabilidad está
comprendida por todos los puntos viables.
Cualquier solución de 𝑓𝑓(𝑋𝑋) que quede dentro de la región de viabilidad es una solución óptima.
El método de multiplicadores de Lagrange se usa para minimizar o maximizar la función objetivo 𝑓𝑓(𝑋𝑋), con restricciones.
42
Para este tipo de problemas con n variables y K restricciones se propone un nueva función ℒ (x, λ) denominada
lagrangiano que incluye las restricciones, ampliado en K variables λ denominadas multiplicadores de Lagrange.
Para encontrar la solución a este nuevo tipo de problema, se debe establecer una nueva función L que debe ser
formada por (1) definiendo cada restricción como igual a cero, (2) multiplicándola por (el multiplicador de Lagrange) y
(3) sumando el producto a la función original:
Los multiplicadores de Lagrange son factores indeterminados que vienen a ser nuevas variables del problema, se incluye
una por cada restricción.
𝑑𝑑𝑑𝑑 𝑑𝑑𝑔𝑔
∇ℒ(𝑥𝑥, 𝜆𝜆) = � + ∑𝑗𝑗 𝜆𝜆𝑗𝑗 𝑑𝑑𝑥𝑥𝑗𝑗� = 0, (3-5)
𝑑𝑑𝑥𝑥𝑖𝑖 𝑖𝑖
Se obtendrán n+K ecuaciones algebraicas con n+K incógnitas. Que se resuelven simultáneamente y la solución es el
óptimo buscado. Para que exista una solución óptima debe cumplirse que las ecuaciones del gradiente sean linealmente
independientes.
Ejemplo 3.1
Encontrar las dimensiones de una caja rectangular sin tapa, para contener un volumen de 1,000 cm3 que tenga el área
superficial mínima.
La Figura 3.1 muestra el dibujo de la caja y las ecuaciones de la función objetivo y la restricción.
El lagrangiano resulta: ℒ(𝑤𝑤, ℎ, 𝑙𝑙, 𝜆𝜆) = 2ℎ𝑤𝑤 + 𝑙𝑙𝑙𝑙 + 2ℎ𝑙𝑙 + 𝜆𝜆(𝑙𝑙𝑙𝑙ℎ − 100) se obtienen las derivadas del gradiente.
43
Para definir la función de resolución de ecuaciones usar, b371 y solicita el número de ecuaciones y las variables como se
despliega en la Figura 3.2
Figura 3.2 caja de dialogo de la calculadora con el menú de solucionar sistema de ecuaciones.
Después de calcular las derivadas igualadas a cero se pueden resolver a mano obteniéndose:
w = 10002/3 = 12.6, l = w=12.6, h = w/2= 6.3 y λ = -4/w=-0.3175, con área= 476.22 cm2
Para obtener la solución en Excel abrir una plantilla con la información como se muestra en la Figura 3.3.
Escribir los nombres para identificar a los valores de las celdas ajustables, en A6 escribir ‘Altura (H). En B6 escribir ‘Largo
(L) y en C6 ′Ancho (W). Luego en las celdas A7, B7 y C7 escribir los valores iniciales para empezar el proceso de
minimización, puede escribir 5, 5, y 5, respectivamente.
En la Línea 10 escribir la ecuación del área. En A10 ‘Area:, en B10 la fórmula 2*A7*C7+B7*C7+2*A7*B7
44
Figura 3.3 Resolución en Excel del problema del Ejemplo 3.1
Ejemplo 3.2
Se desea determinar el costo mínimo de operación de un reactor tanque de flujo continuo, el costo de operación
corresponde a la suma de los costos del flujo del reactivo, 𝐶𝐶𝑓𝑓 𝐶𝐶𝐴𝐴0 𝐹𝐹 más el costo de mezclado, 𝐶𝐶𝑚𝑚 𝑉𝑉.
Dónde:
5$
𝐶𝐶𝑓𝑓 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟,
𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑 𝐴𝐴
𝑝𝑝𝑝𝑝𝑝𝑝 3
𝐹𝐹 = 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎, ℎ𝑟𝑟
0.3
𝐶𝐶𝑚𝑚 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑚𝑚𝑚𝑚𝑧𝑧𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐, $
ℎ𝑟𝑟−𝑝𝑝𝑝𝑝𝑝𝑝 3
La reacción es de primer orden 𝐴𝐴 → 𝐵𝐵 con una velocidad de formación de 𝐵𝐵 , 𝑟𝑟𝐵𝐵 = 𝑘𝑘 ∗ 𝐶𝐶𝐶𝐶 con 𝑘𝑘 = 0.1 ℎ𝑟𝑟 −1 y se desea
producir 10 lbmol/hr de 𝐵𝐵 sin tener 𝐵𝐵 en la alimentación. 𝐶𝐶𝐶𝐶 es la concentración de 𝐴𝐴 a la salida del reactor.
Balance de 𝐴𝐴 :
45
Acumulación = flujo de entrada – flujo de salida ⇒ 0 = 𝐶𝐶𝐴𝐴0 ∗ 𝐹𝐹 − (𝑟𝑟𝐵𝐵∗ 𝑉𝑉 + 𝐹𝐹 ∗ 𝐶𝐶𝐶𝐶)
Balance de 𝐵𝐵 :
Restricción 2: 10 − 𝑘𝑘 ∗ 𝐶𝐶𝐴𝐴0 ∗ 𝑉𝑉 = 0
Restricción 2: 10 − (0.1)𝐶𝐶𝐶𝐶 ∗ 𝑉𝑉 = 0
Se forma el Lagrangiano: ℒ(𝐹𝐹, 𝑉𝑉, 𝐶𝐶𝐶𝐶, 𝜆𝜆1 , 𝜆𝜆2 ) = 0.2𝐹𝐹 + 0.3𝑉𝑉 + 𝜆𝜆1 [(0.04 − 𝐶𝐶𝐶𝐶)𝐹𝐹 − 0.1𝑉𝑉𝑉𝑉𝑉𝑉] + 𝜆𝜆2 [10 − 0.1𝐶𝐶𝐶𝐶𝐶𝐶]
En la calculadora se obtiene:
Puesto que el volumen no puede ser negativo, entonces, la primera serie se descarta y la solución es:
46
Para obtener el costo mínimo se sustituyen los resultados en la función objetivo 𝐶𝐶𝑇𝑇 = 𝐶𝐶𝑓𝑓 ∗ 𝐶𝐶𝐴𝐴0 ∗ 𝐹𝐹 + 𝐶𝐶𝑚𝑚 ∗ 𝑉𝑉
Ejemplo 3.3
Una empresa fabrica dos tipos de piezas, la primera se vende a $500 por unidad y la otra al doble.
Maximizar el beneficio en la fábrica si el total de horas disponibles de fabricación depende de la cantidad de piezas
𝑥𝑥1 𝑦𝑦 𝑥𝑥2 a producir según la ecuación 𝑥𝑥12 + 𝑥𝑥22 /4 = 1700.
Si 𝑥𝑥1 = cantidad de piezas del primer tipo y 𝑥𝑥2 = cantidad de piezas del segundo tipo.
El problema es: Maximizar 𝐺𝐺 = 500𝑥𝑥1 + 1000𝑥𝑥2
Sujeto a 𝑥𝑥12 + 𝑥𝑥22 /4 = 1700
Se forma el lagrangiano: ℒ(𝑥𝑥1 , 𝑥𝑥2 , 𝜆𝜆) = 500𝑥𝑥1 + 1000𝑥𝑥2 − 𝜆𝜆(𝑥𝑥12 + 𝑥𝑥22 /4 − 1700)
𝜕𝜕ℒ
= 1000−0.5𝜆𝜆𝑥𝑥2 = 0 , de aquí se obtiene, 𝜆𝜆 = 2000/𝑥𝑥2
𝜕𝜕𝑥𝑥2
Igualando los términos de 𝜆𝜆 se obtiene: 𝑥𝑥2 = 8𝑥𝑥1 , luego reemplazando en la restricción se obtiene.
47
Para el caso de problemas con una restricción se puede despejar una de las incógnitas de la restricción y sustituir en la
función objetivo. Así se reduce a un problema univariable que se puede resolver fácilmente. En la calculadora TI-Nspire
se obtiene:
Este método es una extensión del método de los multiplicadores de Lagrange aplicable a problemas con restricciones
que tienen signo de desigualdad. El problema se puede formular como:
Las condiciones de Kuhn Tucker indican que si el problema tiene un mínimo en 𝑋𝑋 ∗ = (𝑥𝑥1∗ , 𝑥𝑥2∗ , … , 𝑥𝑥𝑛𝑛∗ ) y es un punto local
para el conjunto de restricciones, entonces existe un vector de multiplicadores 𝜇𝜇 que cumple:
𝜕𝜕𝜕𝜕 𝑑𝑑ℎ𝑗𝑗
+ ∑𝑗𝑗 𝜇𝜇𝑗𝑗 𝑑𝑑𝑥𝑥 = 0, 𝑖𝑖 = 1,2, … , 𝑛𝑛 (3-7)
𝜕𝜕𝑥𝑥𝑖𝑖 𝑖𝑖
Estas expresiones también son conocidas como condiciones de Karush Kuhn Tucker.
48
En problemas de minimización, si las restricciones son de la forma ℎ𝑗𝑗 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≥ 0 entonces los multiplicadores
serán no positivos, 𝜇𝜇𝑗𝑗 ≤ 0. Pero si el problema es de maximización con restricciones en la forma ℎ𝑗𝑗 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) ≥ 0,
entonces debe cumplirse 𝜇𝜇𝑗𝑗 ≥ 0. Estos multiplicadores son variables de holgura que transforman las restricciones de
desigualdad a restricciones de igualdad “en el óptimo”.
Si el problema incluye restricciones mixtas de igualdad y desigualdad, entonces las condiciones de optimalidad son:
La condición suficiente para que el óptimo encontrado sea estrictamente un mínimo local (la función será estrictamente
convexa), la matriz Hessiana debe ser definida positiva.
Puesto que normalmente en problemas multivariables se pueden encontrar múltiples soluciones, los puntos óptimos
deben cumplir simultáneamente todas condiciones. El procedimiento prueba cada restricción de desigualdad por
separado. Se toma una como posible solución y se analiza si el punto mínimo encontrado cumple con las condiciones de
no negatividad del multiplicador. Si lo cumple es un punto factible y posiblemente crítico, si no se descarta esa
restricción como activa y se toma otra. De los puntos críticos encontrados uno o más serán óptimos por lo que habrá
que compararlos para encontrar el máximo o mínimo global. En escasos problemas no habrá solución alguna.
Ejemplo 3.4
Se tienen dos variables y dos restricciones por lo que las condiciones de Kuhn Tucker son:
El Lagrangiano es: ℒ(𝑥𝑥1 , 𝑥𝑥2 , 𝜇𝜇1 , 𝜇𝜇2 ) = 𝑥𝑥12 + 𝑥𝑥22 + 60𝑥𝑥1 − 𝜇𝜇1 (𝑥𝑥1 − 80) − 𝜇𝜇2 (𝑥𝑥1 − 𝑥𝑥2 − 120)
49
Se analizan los posibles valores de 𝜇𝜇 en las condiciones de viabilidad (3-15) y (3-16), para explorar los puntos que puedan
ser críticos.
De (3-15) se deduce que 𝜇𝜇1 = 0 o que (𝑥𝑥1 − 80) = 0 Por lo que se tendrán dos casos uno para cada una de estas
igualdades.
Caso 1a: Considerando 𝜇𝜇2 = 0 se obtiene 𝑋𝑋 ∗ = [30, 0] pero esta solución viola las condiciones (3-17) y (3-18) por lo que
no es viable.
Caso 1b: Considerando 𝜇𝜇2 = −150 se obtiene 𝑋𝑋 ∗ = [45,75] pero esta solución viola las condiciones (3-17)
Al sustituir (3-21) en (3-16) se obtiene −2𝑥𝑥2 (𝑥𝑥2 − 40) = 0 por lo que se obtienen dos soluciones.
𝑥𝑥2 = 0 o 𝑥𝑥2 − 40 = 0
Caso 2a: Con 𝑥𝑥2 = 0 se obtiene 𝜇𝜇2 = −220 pero se violan las condiciones (3-17) y (3-18)
Caso 2b: Con 𝑥𝑥2 − 40 = 0 se obtiene 𝜇𝜇1 = −140 y 𝜇𝜇2 = −80 con esto se cumplen todas las condiciones por lo que la
solución es:
𝑋𝑋 ∗ = [80,40]
50
Problemas
3.1 Maximizar la función 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −3𝑥𝑥12 − 6𝑥𝑥1 𝑥𝑥2 − 5𝑥𝑥22 + 7𝑥𝑥1 + 5𝑥𝑥2 sujeto a 𝑥𝑥1 + 𝑥𝑥2 = 5
11 1
El punto extremo es: 𝑥𝑥1∗ = , 𝑥𝑥2∗ = − , 𝜆𝜆∗ = 23 y 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 ) = −39.5
2 2
Para determinar que es el máximo se obtienen los valores propios del determinante de la Hessiana. Dando d1=-6, d2=24.
Por lo que sí es un máximo.
3.2 Resolver el problema del Ejemplo 1.6 sujeto a la restricción 𝑃𝑃𝑃𝑃 = 9000
3.3 Encuentre los valores de las variables que definen el máximo de la función:
3.5 Una compañía planea gastar 10,000 euros en publicidad. Se sabe que un minuto de publicidad en televisión cuesta
3000 euros y 1,000 euros en la radio. Si la empresa compra x minutos de publicidad en televisión e y minutos en la radio,
su ingreso, está dado por
¿Cómo puede la empresa maximizar sus ingresos?, ¿cuál es la ganancia neta de la compañía?
Respuestas: Se deben comprar 2.46 minutos de televisión y 2.6 minutos de radio para dar una máxima ganancia de
15,018 euros.
La ganancia neta será: 15,018 – 10,000 = 5,018 euros.
𝑥𝑥 2 20𝑦𝑦 𝑥𝑥 𝑦𝑦 2𝑦𝑦 3
3.6 Encontrar el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + + sujeto a la restricción ≤1
𝑦𝑦 2 𝑥𝑥 2 𝑥𝑥
Use el método de los multiplicadores de Lagrange o la sustitución directa de una de las variables. Demuestre con el
cálculo de la Hessiana que se trata de un mínimo.
Respuestas: x = 2, y= 1 y f(x*)=15
Los determinantes menores de la Hessiana dan: d1=7, d2=47/4. Ambos son positivos, por lo que sí es un mínimo.
51
CAPÍTULO 4
Optimización de Funciones no Lineales Univariables
Los problemas de funciones no lineales con una sola variable se pueden resolver de dos
formas, con algoritmos de aproximaciones directos e indirectos. A los métodos directos
se conocen como métodos de búsqueda por reducción de intervalos porque localizan el
óptimo mediante la eliminación sucesiva de subintervalos que reducen el intervalo de
búsqueda restante. Los métodos de búsqueda directos hacen uso de las derivadas de la
función, como el método de Newton Raphson. En este capítulo se presentan ambos
métodos.
52
En la mayoría de los problemas se sabe que el óptimo se encuentra dentro de un rango específico de las variables
independientes, por ejemplo la conversión que debe estar entre los valores de cero y uno. En este ejemplo la conversión
𝑥𝑥 cae en el intervalo [0 , 1] pero se desconoce su valor por lo que al intervalo [a , b]=[0 , 1] se le denomina intervalo o
región de incertidumbre. Los métodos de aproximación numérica que encuentran el óptimo en regiones de intervalos
conocidos se llaman métodos de búsqueda por reducción de intervalos porque localizan el óptimo mediante la
eliminación sucesiva de subintervalos que reducen el intervalo de búsqueda restante.
Los métodos directos univariables hacen la búsqueda de los puntos óptimos mediante sucesivas reducciones del
intervalo de estudio, con tres o más puntos en los que se evalúa la función objetivo y posteriormente se hace la
eliminación de subintervalos, acotando la región de búsqueda y terminar cuando se logra una precisión requerida en el
último intervalo.
Se considera que la función objetivo es unimodal, se puede definir un criterio para eliminar regiones donde
seguro el óptimo no se encuentra. Para ello se necesita evaluar la función en al menos dos puntos dentro del intervalo y
aplicar algún criterio para eliminar una parte de la región de incertidumbre y se continúa reduciendo hasta que se
encuentre un intervalo suficientemente pequeño. A este tipo de métodos también se les conoce como métodos directos
en oposición a los métodos que usan derivadas y que son conocidos como métodos indirectos.
Este método divide la región de búsqueda por la mitad y se aplica de la siguiente forma:
Empezando la búsqueda en la región delimitada por 𝑎𝑎 ≤ 𝑥𝑥 ≤ 𝑏𝑏 se prueba la función en dos valores da 𝑥𝑥1 y 𝑥𝑥2
comprendidos entre a y b, 𝑎𝑎 < 𝑥𝑥1 < 𝑥𝑥2 < 𝑏𝑏 para determinar cuál es el que más se aproxima al optimo, ya sea el
máximo o mínimo buscado. Si lo que se busca es el máximo se tendrán tres casos:
𝑆𝑆𝑆𝑆 𝑓𝑓( 𝑥𝑥1 ) > 𝑓𝑓( 𝑥𝑥2 ), entonces el máximo se encuentra en el intervalo (𝑎𝑎, 𝑥𝑥2 )
Si 𝑓𝑓( 𝑥𝑥1 ) < 𝑓𝑓( 𝑥𝑥2 ) entonces el máximo se encuentra entre 𝑥𝑥1 𝑦𝑦 𝑏𝑏
Si 𝑓𝑓( 𝑥𝑥1 ) = 𝑓𝑓( 𝑥𝑥2 ) entonces el máximo se encuentra entre 𝑥𝑥1 𝑦𝑦 𝑥𝑥2
Los valores 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 se determinan muy cercanos al punto medio de la región de búsqueda,
𝑎𝑎+𝑏𝑏 𝑎𝑎+𝑏𝑏
𝑥𝑥1 = 2
− 𝑒𝑒 y 𝑥𝑥2 = 2
+ 𝑒𝑒 (4-1)
Se puede determinar el número de iteraciones 𝑛𝑛 para reducir el intervalo de incertidumbre final a una longitud 𝑡𝑡, la
fórmula:
53
ln(𝑏𝑏−𝑎𝑎)/𝑡𝑡
𝑛𝑛 = � � (4-2)
ln(2)
1. Determinar el número de iteraciones requeridas para lograr una reducción del intervalo de incertidumbre a una
cantidad muy pequeña, con la ecuación (4-2).
2. Repetir los pasos 3 y 4, 𝑛𝑛 veces.
3. Aplicar las fórmulas (4-1) y calcular 𝑓𝑓( 𝑥𝑥1 ) 𝑦𝑦 𝑓𝑓( 𝑥𝑥2 )
4. 𝑆𝑆𝑆𝑆 𝑓𝑓( 𝑥𝑥1 ) > 𝑓𝑓( 𝑥𝑥2 ) entonces hacer 𝑏𝑏 = 𝑥𝑥2 si no entonces 𝑎𝑎 = 𝑥𝑥1
𝑥𝑥2 + 𝑥𝑥1
5. Se determina el óptimo de la función 𝑓𝑓( 𝑥𝑥 ∗ ) con los últimos valores de 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 , 𝑥𝑥 ∗ =
2
Ejemplo 4.1
En la prueba balística de un cañón se sabe que el proyectil sigue una trayectoria definida por:
Determine el valor de la altura máxima que alcanza el proyectil y a que tiempo se logra el máximo.
El problema se resuelve con la ayuda de la calculadora TI nspire como se muestra en la Figura 4.1
54
Figura 4.1 Resolución del problema del proyectil del Ejemplo 4.1
En la Figura 4.1 se indica en las primeras instrucciones que se determina el tiempo al cual el proyectil toca el piso con la
instrucción solve(h(x)=0,x)
El algoritmo de búsqueda se implementa con un pequeño programa en una línea, la cual en su forma completa es:
Después de 7 iteraciones se obtiene el último intervalo 𝑥𝑥1 = 6.9048 𝑦𝑦 𝑥𝑥2 = 7.0419 por lo que el tiempo del máximo
6.9048 + 7.0419
estimado en 𝑥𝑥 ∗ = = 6.9148 con una altura máxima de 200.277.
2
55
Figura 4.2 Trayectoria del proyectil del Ejemplo 4.1
For i,1,7
X1:=((a+b)/2)-e
X2:=((a+b)/2)+e
If (h(x)evaluado en x=x1≥(h(x)evaluado en x=x2)
Then x2→b
Else x1→a
EndIf
Disp a,b,h(x1),h(x2)
EndFor
X1 X2 h(x1) h(x2)
0 7.51 199.315 199.244
3.745 7.51 166.844 167.277
5.6175 7.51 194.774 194.941
6.55375 7.51 199.826 199.873
6.55375 7.04188 200.253 200.241
6.78781 7.04188 200.212 200.229
6.90484 7.04188 200.275 200.278
Se observa que en casi todas las iteraciones el límite derecho no cambia por lo que el límite izquierdo es sustituido por
un nuevo valor en cada iteración excepto la quinta.
56
4.3 Método de la Sección Dorada.
Primero se define el intervalo inicial de búsqueda y segundo se aplica un procedimiento de búsqueda que reduzca la
región de búsqueda partiendo el intervalo anterior en tres segmentos y eliminando el que no contenga al óptimo (ver
Figura 4.3).
La forma de dividir los intervalos es en una proporción fija denominada sección dorada o proporción aurea. El origen del
método se basa en la división constante de cualquier segmento rectilíneo cuya longitud se divide en dos partes 𝐴𝐴 y 𝐵𝐵 de
tal forma que la proporción entre 𝐴𝐴 y 𝐵𝐵 sea igual a la proporción entre la suma de ambos (𝐴𝐴 + 𝐵𝐵) y el segmento más
largo 𝐴𝐴, la figura 4.4 ilustra esta división.
𝐴𝐴 (𝐴𝐴+𝐵𝐵)
Entonces:
𝐵𝐵
= 𝐴𝐴
𝐴𝐴 𝐴𝐴 𝐵𝐵 1
Si esta proporción se denota por τ se obtiene: 𝜏𝜏 = = + =1+
𝐵𝐵 𝐴𝐴 𝐴𝐴 𝜏𝜏
ƒ(x)
a x1 x
x2 b
B A
A-B
a x1 x2 b
A B
Figura 4.4 Gráfica de la división en dos regiones A y B del intervalo de búsqueda (a, b)
57
La ubicación de coordenadas inicial y final de cada segmento se determina con:
Equivalentemente se pueden aplicar las fórmulas: 𝑥𝑥1 = 𝑎𝑎 + (1 − 𝜏𝜏)(𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑏𝑏 − (1 − 𝜏𝜏)(𝑏𝑏 − 𝑎𝑎)
Si la función 𝑓𝑓(𝑥𝑥) es monótona en la región [𝑎𝑎, 𝑏𝑏] el método de la sección dorada procede eliminando uno de los
segmentos, supuestamente el que no contiene el óptimo. El método para minimizar una función univariable 𝑓𝑓(𝑥𝑥)
procede iterativamente hasta llegar a una reducción del intervalo original que contenga el mínimo.
Si 𝑓𝑓(𝑥𝑥1) < 𝑓𝑓(𝑥𝑥2), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥2 → 𝑏𝑏; 𝑥𝑥1 → 𝑥𝑥2 ; 𝑓𝑓(𝑥𝑥1) → 𝑓𝑓(𝑥𝑥2) 𝑦𝑦 𝑥𝑥1 = 𝑏𝑏 − 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) Eliminar segmento [𝑥𝑥2 , 𝑏𝑏]
Si 𝑓𝑓(𝑥𝑥2) < 𝑓𝑓(𝑥𝑥1), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥1 → 𝑎𝑎; 𝑥𝑥2 → 𝑥𝑥1 ; 𝑓𝑓(𝑥𝑥2) → 𝑓𝑓(𝑥𝑥1) 𝑦𝑦 𝑥𝑥2 = 𝑎𝑎 + 𝜏𝜏(𝑏𝑏 − 𝑎𝑎) Eliminar segmento [𝑎𝑎, 𝑥𝑥1 ]
Los puntos intermedios se colocan simétricamente equidistantes con respecto a los límites iniciales por lo que se elimina
un segmento que tiene la misma longitud que el segmento que se conserva. En la búsqueda sólo se requiere la
evaluación de uno de los puntos intermedios y la función en ese punto.
Entonces si 𝐿𝐿0 es la longitud inicial del intervalo [𝑎𝑎, 𝑏𝑏] y 𝐿𝐿𝑘𝑘 es la longitud luego de k iteraciones, corresponde a la región
de incertidumbre y donde se puede continuar la búsqueda.
Después de aplicar el método 𝑛𝑛 iteraciones al intervalo inicial 𝐿𝐿0 = (𝑏𝑏 − 𝑎𝑎) el intervalo final 𝐿𝐿𝑛𝑛 tendrá una longitud
𝐿𝐿𝑛𝑛 = 𝜏𝜏 𝑛𝑛−1 𝐿𝐿0. Al aplicar logaritmos se obtiene:
log(𝐿𝐿𝑛𝑛 )
𝑛𝑛 − 1 = (4-5)
log(𝐿𝐿0 )
Para reducir el intervalo inicial a 1% al tomar logaritmos se obtiene; (𝑛𝑛 − 1)log(𝜏𝜏) ≤ log(0.01) se requieren al menos
10 iteraciones al despejar 𝑛𝑛 − 1
log(0.01) −2
𝑛𝑛 − 1 = = = 9.57
log(0.618033) −0.20899
Ejemplo 4.2 Se propone aprovechar el calor residual que salen con los gases de combustión de un horno que tienen un
flujo de 60,000 lb/h y capacidad calorífica de 0.25 BTU/lbºF, a una temperatura de 500ºF. Para ello se debe instalar un
cambiador de calor que tiene un coeficiente global de calor de 4.0 BTU/h-pie2-ºF y se desea producir vapor a una
temperatura de 220ºF a partir de agua líquida saturada a 220ºF. El vapor que se obtendría tendría un valor de $0.75 por
millón de BTU y el costo de instalación del cambiador se puede estimar en $5 por pie cuadrado de área. El costo se
amortiza en 5 años a una tasa de interés de8%.
El beneficio económico de la inversión P por los cinco años de instalación considerando el valor del vapor (ingresos por
ahorro de energía) y el costo del nuevo cambiador es:
𝑃𝑃 = 𝑣𝑣 ∗ 𝑄𝑄 ∗ 𝑛𝑛 − 𝐶𝐶 ∗ 𝐴𝐴 ∗ (1 + 𝑖𝑖)𝑛𝑛
Dónde:
𝑃𝑃 = 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑖𝑖𝑛𝑛𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣ó𝑛𝑛
𝑣𝑣 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑝𝑝𝑝𝑝𝑝𝑝 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝐵𝐵𝐵𝐵𝐵𝐵 = $0.75/106 𝐵𝐵𝐵𝐵𝐵𝐵
𝑄𝑄 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝑚𝑚 ∗ 𝐶𝐶𝐶𝐶 ∗ (𝑇𝑇𝑖𝑖𝑖𝑖 − 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 ) = 𝑈𝑈 ∗ 𝐴𝐴 ∗ ∆𝑇𝑇𝐿𝐿𝐿𝐿
58
𝑛𝑛 = 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎ó𝑛𝑛 = 5 𝑎𝑎ñ𝑜𝑜𝑜𝑜
𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = $5.0/𝑝𝑝𝑝𝑝𝑝𝑝 2
𝐴𝐴 = Á𝑟𝑟𝑟𝑟𝑟𝑟 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝 2
𝑙𝑙𝑙𝑙
𝑚𝑚 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ó𝑛𝑛 = 60,000
ℎ
𝐵𝐵𝐵𝐵𝐵𝐵
𝐶𝐶𝐶𝐶 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐í𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 0.25
𝑙𝑙𝑙𝑙º𝐹𝐹
𝑇𝑇𝑖𝑖𝑖𝑖 = 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 = 500º𝐹𝐹
4𝐵𝐵𝐵𝐵𝐵𝐵
𝑈𝑈 = 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑𝑑𝑑 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 =
ℎ − 𝑝𝑝𝑝𝑝𝑝𝑝 2 − º𝐹𝐹
�𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 �−(𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
∆𝑇𝑇𝐿𝐿𝐿𝐿 = (𝑇𝑇𝑖𝑖𝑖𝑖 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
𝑙𝑙𝑙𝑙
(𝑇𝑇𝑜𝑜𝑢𝑢𝑢𝑢 −𝑇𝑇𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 )
Al simplificar se obtiene:
Se tiene un problema de maximización de beneficios en términos de una variable que en este caso es la temperatura de
los gases a la salida del cambiador, 𝑇𝑇𝑜𝑜𝑜𝑜𝑜𝑜
Resolución con la calculadora TI-nspire. Empezar abriendo tres ventanas, la primera con una página de notas para
describir el problema, la segunda con una calculadora para insertar la función a optimizar y la tercera con una hoja de
cálculo para ingresar los cálculos con el método de la sección dorada.
La página de notas se muestra en la Figura 4.5 (a). En la página con la calculadora se define la función, Figura 4.5 (b).
También se calcula el máximo con fMax condicionando a que el valor de la variable sea mayor a 230, es decir,
𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓(𝑓𝑓(𝑥𝑥), 𝑥𝑥)|𝑥𝑥 > 230.
59
(a) (b)
Figura 4.5 (a) Página de notas, (b) Página de la calculadora con la función y el óptimo.
En la página con la calculadora se define la función. También se calcula el máximo con fMax condicionando a que el
valor de la variable sea mayor a 230, es decir, 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓(𝑓𝑓(𝑥𝑥), 𝑥𝑥)|𝑥𝑥 > 230.
Las hojas de cálculo como Excel muestran un formato de tabla en la que las celdas son identificadas por una letra para
cada columna y por un número para cada fila. En la hoja de cálculo de la calculadora después de definir los rótulos de las
primeras 6 columnas para a, b, x1, x2, f(x1) y f(x2) que son: a y b los valores extremos del intervalo con que inicia la
búsqueda; x1, x2, son los segmentos internos izquierdo y derecho; f(x1) y f(x2) son la función en el segmento izquierdo y
la función en el segmento derecho, respectivamente.
Después se definen en a1 y b1 los valores del intervalo inicial 230 y 350 respectivamente y luego en las celdas c1 y d1
ingresar las fórmulas para determinar el segmento izquierdo y el derecho de la sección dorada:
1.618−1 𝑏𝑏−𝑎𝑎
𝑥𝑥1 = 𝑎𝑎 + (𝑏𝑏 − 𝑎𝑎) y 𝑥𝑥2 = 𝑎𝑎 + , Figuras 4.6 (a) y (b) respectivamente.
1.618 1.618
(a) (b)
Figura 4.6 Ingreso de las fórmulas para los segmentos internos de la sección dorada.
Luego en la línea de ingreso para la celda e1 se escribe =f(c1) para evaluar la función con el valor de la celda c1. Lo
mismo se hace para la celda f1 para evaluar la función con el valor de la celda d1. Figuras 4.7 (a) y 4.7 (b).
60
(a) (b)
Figura 4.7 (a) Definición de la función en los valores de los segmentos internos.
En la celda a2 definir la función = 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) para indicar que si el valor de la celda f1 es mayor que el de la
celda e1, entonces poner en a2 el valor de c1 en caso contrario poner el valor de a1 ver Figuras 4.8 (a) y (b). Lo anterior
se repite para todas las hileras de la 2 en adelante. En la columna a se indica la siguiente prueba para ubicar el óptimo: Si
𝑓𝑓(𝑥𝑥1) > 𝑓𝑓(𝑥𝑥2) 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 = 𝑥𝑥1, 𝑠𝑠𝑠𝑠 𝑛𝑛𝑛𝑛, 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑎𝑎 = 𝑎𝑎
Similarmente en la columna b: 𝑓𝑓(𝑥𝑥2) > 𝑓𝑓(𝑥𝑥1) 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑏𝑏 = 𝑥𝑥2, 𝑠𝑠𝑠𝑠 𝑛𝑛𝑛𝑛, 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑏𝑏 = 𝑏𝑏
Estas dos condiciones en la columna 𝑎𝑎 y la 𝑏𝑏 prueban si el óptimo cae cerca del extremo izquierdo o el derecho,
respectivamente.
(a) (b)
Figura 4.8 (a) Pruebas de la condición de acotamiento del óptimo entre los límites a y b.
Luego copiar las fórmulas de las celdas desde c1 hasta f1 en c2 y f2 respectivamente, Figura 4.9 (a). Después copiar la
hilera 2 en la hilera 3 y repetir sucesivamente hasta alcanzar el óptimo. Al término de nueve iteraciones se obtiene una
diferencia menor a un grado en los dos últimos valores calculados de la temperatura y se toma el promedio de valores
como el valor de convergencia, Figura 4.9 (b).
61
(a) (b)
Figura 4.9 (a) Copiado de fórmulas en hilera 2, (b) Cálculos en las nueve iteraciones.
Entre los dos últimos valores de la temperatura 𝑥𝑥1 = 275.836 y 𝑥𝑥2 = 276.44 se encuentra el valor óptimo buscado,
𝑥𝑥 = 275.911 dando un máximo beneficio de 66,0361dolares.
$
Y el costo del cambiador es: 𝐶𝐶 = 5 (11,227.96 𝑝𝑝𝑝𝑝𝑝𝑝 2 ) = $56,139.82
𝑝𝑝𝑝𝑝𝑝𝑝 2
Es importante resaltar que la secuencia de cálculos de la Figura 4.7 (b) es una plantilla de la hoja de cálculo que permite
usar el método de búsqueda de la sección dorada para cualquier problema, generándose una aplicación de hoja de
cálculo personalizada.
El porciento de reducción del intervalo inicial después de nueve iteraciones es aproximadamente 2%:
La secuencia de los números de Fibonacci se forma con: 𝐹𝐹𝑛𝑛 = 𝐹𝐹𝑛𝑛−1 + 𝐹𝐹𝑛𝑛−2 empezando en 𝐹𝐹1 = 1 y 𝐹𝐹2 = 1
62
Se tendrán cuatro puntos en los valores 𝑎𝑎, 𝑏𝑏, 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 con sus respectivos valores de la función
𝑓𝑓(𝑎𝑎), 𝑓𝑓(𝑏𝑏), 𝑓𝑓(𝑥𝑥1 ) 𝑦𝑦 𝑓𝑓(𝑥𝑥2 ). Para determinar que segmento se elimina se comparan los valores 𝑓𝑓(𝑥𝑥1 ) con 𝑓𝑓(𝑥𝑥2 ). En el
caso de buscar el máximo se elimina el segmento que contenga al menor valor de la función. Por ejemplo si 𝑓𝑓(𝑥𝑥2 ) es
menor de 𝑓𝑓(𝑥𝑥1 ) se elimina el segmento comprendido entre 𝑓𝑓(𝑥𝑥2 ) y 𝑏𝑏, la siguiente Figura 4.10 muestra este caso.
F(x1) F(x2)
a x1 x2 b
↑
Segmento a eliminar
El nuevo intervalo de búsqueda está comprendido entre 𝑎𝑎 y 𝑥𝑥2 , se hace 𝑥𝑥2 equivalente a 𝑏𝑏 y se repite el procedimiento
como se muestra en Figura 4.11.
F(x1) F(x2)
a x1 x2 b
Este pasa a ser x2 Este pasa a ser el
nuevo valor de b
a x1 x2 b
Ejemplo 4.3 Se resuelve el problema del Ejemplo 4.2 en la calculador TI nspire, pero con la fórmula de Fibonacci.
Primero se define la secuencia de los números de Fibonacci, por ejemplo para nueve términos se tiene:
1,1,2,3,5,8,13,21,34,55,89. Estos números se colocan primero en la columna H de la Hoja de cálculo empezando en 89 y
55 en la línea 1.
El intervalo inicial es 𝑎𝑎 = 230 y 𝑏𝑏 = 350. Colocarlos en las celdas a1 y b1. Los valores de la serie de Fibonacci se colocan
en la columna H de la Hoja de cálculo empezando en 89 y 55 en la línea 1.
A B C D E F G H
a b x1 x2 f(x1) f(x2) Fn Fn-1
1 230 350 ℎ1 ℎ1 F(c1) F(d1) 89 55
𝑏𝑏1 − (𝑏𝑏1 − 𝑎𝑎1) 𝑎𝑎1 + (𝑏𝑏1 − 𝑎𝑎1)
𝑔𝑔1 𝑔𝑔1
2 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑒𝑒1 > 𝑓𝑓1, 𝑑𝑑1, 𝑏𝑏1) ℎ2 ℎ2 F(c2) F(d2) 55 34
𝑏𝑏2 − (𝑏𝑏2 − 𝑎𝑎2) 𝑎𝑎2 + (𝑏𝑏2 − 𝑎𝑎2)
𝑔𝑔2 𝑔𝑔2
En las celdas 𝑐𝑐1 y 𝑑𝑑1 escribir las fórmulas para los puntos intermedios y en las celdas 𝑒𝑒1 y f1 las funciones a maximizar
evaluadas en 𝑐𝑐1 y 𝑑𝑑1 respectivamente. Las preguntas para determinar que segmento se elimina se colocan en a2 y b2,
𝑖𝑖𝑖𝑖𝑓𝑓𝑛𝑛(𝑓𝑓1 > 𝑒𝑒1, 𝑐𝑐1, 𝑎𝑎1) y 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖(𝑒𝑒1 > 𝑓𝑓1, 𝑑𝑑1, 𝑏𝑏1) respectivamente. Luego copiar las celdas 𝑐𝑐1 a la ℎ1y pegar en las celdas
de la 𝑐𝑐2 a la ℎ2. Finalmente, repetir las líneas de la 2 a la 9. Con estos pasos queda configurada la plantilla de hoja de
cálculo para aplicar el método de búsqueda de Fibonacci. La hoja de cálculo en la calculadora TI-Nspire es:
Se obtienen casi los mismos resultados que con el método de la sección dorada.
63
Se puede demostrar que la relación entre el enésimo intervalo y el primero se define por:
𝐿𝐿𝑛𝑛 𝐹𝐹1 1
= = (4-6)
𝐿𝐿𝑜𝑜 𝐹𝐹𝑛𝑛 𝐹𝐹𝑛𝑛
Esta expresión permite estimar previamente el número de pruebas necesarias para lograr una aproximación dada. Por
1 1
ejemplo con 8 iteraciones se tiene = = 0.029 ~0.03 una reducción al 3%.
𝐹𝐹𝑛𝑛 34
275.843−274.494
En el Ejemplo 4.3 se tiene para la octava iteración: = 0.01124 que representa finalmente, una reducción
350−230
de aproximadamente al 1% del intervalo inicial, hay que empezar con el valor 𝐹𝐹𝑛𝑛 = 89 y terminar con 𝐹𝐹1 = 3.
El método de interpolación cuadrática usa un polinomio de segundo orden empleando tres puntos 𝑥𝑥0 , 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 para
estimar un nuevo punto más cercano al óptimo 𝑥𝑥𝑚𝑚 . Ver Figura 4.12
Donde 𝑥𝑥𝑚𝑚 es el valor interpolado usando una aproximación de una ecuación cuadrática 𝑓𝑓(𝑥𝑥) = 𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐
ƒ(x)
x
x0 x1 xm x2
Figura 4.12 Puntos seleccionados para la interpolación cuadrática.
64
La fórmula de interpolación se encuentra resolviendo un sistema de tres ecuaciones de la función cuadrática cada una
para cada punto.
El punto óptimo para la función cuadrática propuesta se obtiene con la derivada de la función cuadratica,
𝑑𝑑
𝑓𝑓 ′ (𝑥𝑥) = (𝑎𝑎𝑥𝑥 2 + 𝑏𝑏𝑏𝑏 + 𝑐𝑐) = 0 que resulta 𝑥𝑥𝑚𝑚 = −𝑏𝑏/2𝑎𝑎
𝑑𝑑𝑑𝑑
𝑓𝑓(𝑥𝑥0 ) 𝑥𝑥0 1
�𝑓𝑓(𝑥𝑥1 ) 𝑥𝑥1 1� = 𝐷𝐷𝑎𝑎 = 𝑓𝑓(𝑥𝑥0 )(𝑥𝑥1 − 𝑥𝑥2 ) + 𝑓𝑓(𝑥𝑥1 )(𝑥𝑥2 − 𝑥𝑥0 ) + 𝑓𝑓(𝑥𝑥2 )(𝑥𝑥0 − 𝑥𝑥1 )
𝑓𝑓(𝑥𝑥2 ) 𝑥𝑥2 1
𝑥𝑥02 𝑓𝑓(𝑥𝑥0 ) 1
�𝑥𝑥12 𝑓𝑓(𝑥𝑥1 ) 1� = 𝐷𝐷𝑏𝑏 = 𝑓𝑓(𝑥𝑥0 )(𝑥𝑥12 − 𝑥𝑥22 ) + 𝑓𝑓(𝑥𝑥1 )(𝑥𝑥22 − 𝑥𝑥02 ) + 𝑓𝑓(𝑥𝑥2 )(𝑥𝑥02 − 𝑥𝑥12 )
𝑥𝑥22 𝑓𝑓(𝑥𝑥2 ) 1
𝑥𝑥02 𝑥𝑥0 1
�𝑥𝑥12 𝑥𝑥1 1� = 𝐷𝐷 = 𝑥𝑥02 (𝑥𝑥1 − 𝑥𝑥2 ) + 𝑥𝑥12 (𝑥𝑥2 − 𝑥𝑥0 ) + 𝑥𝑥22 (𝑥𝑥0 − 𝑥𝑥1 )
𝑥𝑥22 𝑥𝑥2 1
𝐷𝐷
𝑏𝑏 � 𝑏𝑏 �
Puesto que 𝑎𝑎 = 𝐷𝐷𝑎𝑎 /𝐷𝐷 y 𝑏𝑏 = 𝐷𝐷𝑏𝑏 /𝐷𝐷 , entonces: 𝑥𝑥𝑚𝑚 = − = − 𝐷𝐷
𝐷𝐷
= 𝐷𝐷𝑏𝑏 /2𝐷𝐷𝑎𝑎
2𝑎𝑎 2� 𝑎𝑎 �
𝐷𝐷
En el caso de minimización para seleccionar los siguientes tres puntos se pueden presentar cuatro casos:
Si 𝑥𝑥𝑚𝑚 > 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) ≥ 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥1 → 𝑥𝑥0 ; 𝑥𝑥𝑚𝑚 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥2 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥0 , 𝑥𝑥1 )
Si 𝑥𝑥𝑚𝑚 > 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) < 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥0 → 𝑥𝑥0 ; 𝑥𝑥1 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥𝑚𝑚 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥𝑚𝑚 , 𝑥𝑥2 )
Si 𝑥𝑥𝑚𝑚 < 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) ≥ 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥0 → 𝑥𝑥0 ; 𝑥𝑥𝑚𝑚 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥1 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥𝑚𝑚 , 𝑥𝑥2 )
Si 𝑥𝑥𝑚𝑚 < 𝑥𝑥1 𝑦𝑦 𝑓𝑓(𝑥𝑥𝑚𝑚 ) < 𝑓𝑓(𝑥𝑥1 ), 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑥𝑥𝑚𝑚 → 𝑥𝑥0 ; 𝑥𝑥1 → 𝑥𝑥1 ; 𝑦𝑦 𝑥𝑥2 → 𝑥𝑥2 Eliminar segmento (𝑥𝑥0 , 𝑥𝑥1 )
Estas pruebas en la variable y la función se aprecian mejor en un diagrama de flujo como el de la Figura 4.13
65
X0x0 si si si X1x0
no Xmx1
Xmx1 Xfm >f1 Xxm >x1 Xfm >f1
X1x2 X2x2
no no
Xmx0 X0x0
X1x1 X1x1
X2x2 Xmx2
Ejemplo 4.4
La fabricación del percloroetileno se basa en la reacción simultánea de pirolisis y halogenación. La reacción principal es:
A 550 ºC y 1.5 atm con una relación de reactivos en la alimentación M= 15 (mol Cl2/mol C3H8), el tiempo de un lote
depende del tiempo en el reactor Tr más el tiempo de separación Ts
1 𝑀𝑀 − 𝑥𝑥
𝑇𝑇𝑇𝑇 = 𝑙𝑙𝑙𝑙
0.03(𝑀𝑀 − 1) 𝑀𝑀(1 − 𝑥𝑥)
El costo de operación es una función de la suma de los tiempos de operación que a su vez dependen de la conversión del
propano en el reactor: x
El costo por uso de equipos es de 100 $/h en el reactor y 70 $/h en los destiladores
La función a minimizar es:
1 𝑀𝑀 − 𝑥𝑥
𝐶𝐶𝑇𝑇 = � 𝑙𝑙𝑙𝑙 � ∗ 100 + [0.8 + 10(1 − 𝑥𝑥)] ∗ 70
0.03(𝑀𝑀 − 1) 𝑀𝑀(1 − 𝑥𝑥)
Se simplifica a:
15 − 𝑥𝑥
𝑓𝑓(𝑥𝑥) = �238.095 ∗ 𝑙𝑙𝑙𝑙 � + 56 + 700(1 − 𝑥𝑥)
15(1 − 𝑥𝑥)
Se abren dos ventanas en la calculadora, la primera para definir la función y la segunda un con una hoja de cálculo para
aplicar el método, ver figura 4.14.
De la misma manera que se desarrolla el método de Newton Raphson para encontrar las raíces de las funciones no
lineales, se puede aplicar para encontrar los puntos críticos de funciones no lineales.
Para una función 𝑓𝑓(𝑥𝑥) de una variable a ser minimizada y suponiendo que en 𝑥𝑥𝑘𝑘 es posible evaluar
𝑓𝑓(𝑥𝑥), 𝑓𝑓 ′ (𝑥𝑥𝑘𝑘 ) 𝑦𝑦 f”(xk). Entonces es posible construir una aproximación cuadrática a partir del desarrollo de Taylor:
1
𝑓𝑓(𝑥𝑥) ≈ 𝑓𝑓(𝑥𝑥𝑘𝑘 ) + 𝑓𝑓 ′ (𝑥𝑥𝑘𝑘 ) ∗ (𝑥𝑥 − 𝑥𝑥𝑘𝑘 ) + 2𝑓𝑓 ′′ (𝑥𝑥𝑘𝑘 ) ∗ (𝑥𝑥 − 𝑥𝑥𝑘𝑘 )2
Se puede estimar 𝑥𝑥𝑘𝑘+1 determinando el punto donde la derivada de 𝑓𝑓(𝑥𝑥) se hace cero:
𝑓𝑓′(𝑥𝑥𝑘𝑘 )
𝑥𝑥𝑘𝑘+1 = 𝑥𝑥𝑘𝑘 − (4-8)
𝑓𝑓′′(𝑥𝑥𝑘𝑘 )
Esta es la fórmula de Newton Raphson para que a partir de un punto inicial (𝑥𝑥0 ) se llegue a un punto crítico
aproximándose mejor a cada nueva iteración.
Se usan como criterios para dar por terminada la búsqueda de los puntos críticos cuando ocurra lo siguiente:
67
a) Cuando el número de iteraciones sea mayor a un número preestablecido y/o,
𝑓𝑓(𝑥𝑥𝑘𝑘+1 )−𝑓𝑓(𝑥𝑥𝑘𝑘 )
b) � 𝑓𝑓(𝑥𝑥𝑘𝑘+1 )
� ≤ 𝑒𝑒 donde 𝑒𝑒 es un valor pequeño, por ejemplo, 10-4.
( ) ( )
f x k +1 − f x k < ε
Ejemplo 4.5
Encontrar las raíces y puntos críticos de la función: 𝑓𝑓(𝑥𝑥) = (4 − (𝑥𝑥 + 1)2 )𝑥𝑥
Después de definir la función, se define la fórmula de Newton Raphson para encontrar raiceds:
𝑓𝑓(𝑥𝑥)
𝑛𝑛𝑛𝑛 = 𝑥𝑥 −
𝑑𝑑
(𝑓𝑓(𝑥𝑥))
𝑑𝑑𝑑𝑑
Después se define la fórmula de Newton Raphson para encontrar los puntos críticos:
𝑑𝑑
𝑓𝑓(𝑥𝑥)
𝑛𝑛𝑛𝑛2 = 𝑥𝑥 − 2𝑑𝑑𝑑𝑑
𝑑𝑑
(𝑓𝑓(𝑥𝑥))
𝑑𝑑𝑥𝑥 2
Se encuentra el punto crítico en 𝑥𝑥 = 0.535184
Con lo que se determina que el primer punto crítico es un mínimo y el segundo un máximo.
68
69
Figura 4.15 Identificación de los puntos críticos de 𝑓𝑓(𝑥𝑥) = (4 − (𝑥𝑥 + 1)2 )𝑥𝑥
70
Problemas
4.1 En el intervalo de incertidumbre para x entre [0, 2], encontrar el óptimo de:
f ( x) = 4 4 − 14 x 3 + 60 x 2 − 70 x
71
CAPÍTULO 5
Optimización de Funciones no Lineales Multivariables
72
Los métodos de optimización numérica proceden siguiendo un patrón fijo de operaciones en la que las variables tienen
cambios o movimientos sucesivos hasta llegar al objetivo que sea maximizar o minimizar la función objetivo. A partir de
un conjunto inicial de valores de las variables denominado punto base, luego se debe seleccionar tanto una dirección
del movimiento hacia una región mejor, como la distancia del movimiento a lo largo de dicha dirección, obteniendo así
un nuevo punto base para el movimiento siguiente.
a) Con un valor de magnitud del paso de búsqueda fijo y b) buscando un valor de cambio del paso variable que optimice
la función objetivo.
En el caso que la magnitud de cambio sea constante las coordenadas de un nuevo punto en las variables serán:
A partir de un punto inicial o base 𝑥𝑥 𝑏𝑏 y un valor de ∆𝑥𝑥 𝑗𝑗 para cada variable y la definición de la tolerancia de
convergencia, se procede de la siguiente manera.
a) Variar una de las variables manteniendo constantes las otras variables. Se prueba un cambio positivo y si la
función mejora pasar al siguiente paso. Si no mejora la función objetivo, cambiar la dirección de búsqueda.
b) Probar las otras variables con movimientos en la dirección que mejora la función.
c) Si al probar tanto el cambio positivo como el negativo y la función no mejora, reducir la magnitud del
movimiento.
d) Repetir (a) y (b) hasta lograr la tolerancia de la convergencia
Para el caso en que la magnitud de cambio no se mantiene fija, entonces 𝑠𝑠 se determina con una optimización de
búsqueda univariable como los que se describieron en el capítulo 4.
Este método es muy fácil de entender y programar pero es muy lento en converger especialmente en contornos
elípticos de la función con ejes rotados y muy alongados. En la Figura 5.1 se muestra una secuencia de movimientos
paralela a los ejes en una función de dos variables para encontrar el máximo.
73
x2
Δx2
Δx1
x1
Figura 5.1 Movimientos de búsqueda paralela a los ejes.
Ejemplo 5.1
Aplicar el método de búsqueda paralela a los ejes coordenados para minimizar la función:
A partir del punto inicial (1,1) y con incrementos iniciales de (0.5, 0.5), esta función se conoce como función de
Himmelblau, la cual es difícil de converger ya que tiene siete puntos extremos.
x1 x2 f1 delta1 delta2
1 1 106.0 0.5 0.5
1.5 1 80.3 0.5 0.5
1.5 1.5 63.1 0.5 0.5
2 1.5 37.8 0.5 0.5
2 2 26.0 0.5 0.5
2.5 2 7.8 0.5 0.5
2.5 2.5 8.1 0.5 0.25
2.5 2.25 6.6 0.5 0.25
3 2.25 1.2 0.5 -0.25
3 2 0
Se observa que el movimiento entre los puntos (2.5, 2) y (2.5, 2.5) la función deja de disminuir para aumentar de f(2.5,
2) = 7.8 a f(2.5, 2.5)=8.1, por lo que se debe disminuir el tamaño del incremento.
74
4.0
3.5
3.0
8.1
2.5
6.6 1.2
26 2.0
7.8 0.0
63 37 1.5
F=106 80 1.0
0.5
0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Con la calculadora TI nspire se implementa la búsqueda paralela a los ejes de la función de Himmelblau y minimización
del paso de incremento ver Figura 5.3
75
Figura 5.3 Instrucciones de la búsqueda paralela a los ejes del Ejemplo 5.1
76
Ejemplo 5.2
Un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una disolución acuosa, utilizando
disolvente nuevo en cada etapa. La disolución entra al sistema con un caudal de 500 kg de agua/h y con una
concentración xo = 0.20 kg de soluto por kg de agua. Dadas las distintas condiciones de mezcla en cada etapa, puede
admitirse que en la primera la relación de equilibrio entre las corrientes que salen de ella viene expresada por
𝑦𝑦1 = 1.8 𝑥𝑥1 , mientras que en la segunda sería 𝑦𝑦2 = 2.2 𝑥𝑥2, siendo:
Si el valor del soluto recuperado es de 1,000 $/kg y el precio del disolvente de 80 $/kg, determinar el caudal óptimo de
disolvente a utilizar en cada una de las etapas, W1 y W2 (kg/h), para maximizar la diferencia entre el valor del soluto
recuperado y el costo del disolvente gastado. Considere que el flujo de W1 + W2 no deben ser mayor al caudal de la
disolución a tratar.
②
W1 = kg d/h W2 = kg d/h
W0 = 500 kg A/h
① Etapa ③ Etapa
1 2
x0 = 0.2 kg S/kg A X1= kg S/kg A X2= kg S/kg A
④
y1 = 1.8x1 kg S/kg d y2 = 2.2x2 kg S/kg d
Es decir:
500 𝑘𝑘𝑘𝑘 𝐴𝐴 0.2 𝑘𝑘𝑘𝑘 𝑆𝑆 500 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑥𝑥1 𝑘𝑘𝑘𝑘 𝑆𝑆 𝑦𝑦1 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑤𝑤1 𝑘𝑘𝑘𝑘 𝑑𝑑
� �� �=� �� �+� �� �
ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 ℎ 𝑘𝑘𝑘𝑘 𝐴𝐴 𝑘𝑘𝑘𝑘 𝑑𝑑 ℎ
500∗0.2
Puesto 𝑦𝑦1 = 1.8 𝑥𝑥1 se obtiene: 500 ∗ 0.2 = 500𝑥𝑥1 + 1.8𝑥𝑥1 𝑤𝑤1 de donde: 𝑥𝑥1 =
(500+1.8𝑤𝑤1 )
𝑥𝑥1 500
Del balance de la segunda etapa se obtiene: 𝑥𝑥2 =
(500+2.2𝑤𝑤2
La función objetivo es: 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 − 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑑𝑑𝑑𝑑 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 ∗ 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
77
Entonces:
500 500 ∗ 0.2
max 𝑓𝑓(𝑤𝑤1 , 𝑤𝑤2 ) = 500 �0.2 − � 1000
(500 + 2.2𝑤𝑤2 (500 + 1.8𝑤𝑤1 )
− (𝑤𝑤1 + 𝑤𝑤2 )80
Con la restricción: 𝑤𝑤1 + 𝑤𝑤2 < 500
Para aplicar el método de búsqueda paralela a los ejes 𝑤𝑤1 𝑦𝑦 𝑤𝑤2 se define 𝑤𝑤1 = 100 𝑦𝑦 𝑤𝑤2 = 100 ,
78
En cinco iteraciones converge a la solución.
𝑘𝑘𝑘𝑘 𝑘𝑘𝑘𝑘
La solución exacta es: 𝑤𝑤1 = 151.1876 𝑦𝑦 𝑤𝑤2 = 201.6258 con valor de la función de 𝑓𝑓 = 37,461.19 $/ℎ
ℎ ℎ
Este método funciona con dos tipos de movimientos de búsqueda, el primero denominado búsqueda exploratoria y el
segundo de búsqueda patrón. El procedimiento se describe a continuación:
Algoritmo para maximizar funciones no lineales con dos variables 𝑓𝑓(𝑥𝑥, 𝑦𝑦).
Iniciar un contador de iteraciones 𝑖𝑖 = 0 y definir los valores de los incrementos iniciales de las variables ∆𝑥𝑥 y ∆𝑦𝑦
1. Iniciar con un punto bases 𝑏𝑏0 = (𝑥𝑥0 , 𝑦𝑦0 ) y evaluar la función en este punto, 𝑓𝑓(𝑥𝑥0 , 𝑦𝑦0 )
2. Movimiento exploratorio: incrementar 𝑥𝑥 y probar si mejora la función, 𝑓𝑓(𝑥𝑥0 + ∆𝑥𝑥 , 𝑦𝑦0 ) > 𝑓𝑓(𝑥𝑥0 , 𝑦𝑦0 ) sino
disminuir 𝑥𝑥 𝑓𝑓(𝑥𝑥0 − ∆𝑥𝑥 , 𝑦𝑦0 ) y pasar a examinar cambios en la dirección de la otra variable, 𝑦𝑦 probando en qué
dirección mejora la función, ya sea con 𝑦𝑦 + ∆𝑦𝑦 o con 𝑦𝑦 − ∆𝑦𝑦 . Si no mejora en ambos movimientos, entonces
reducir los incrementos y repetir el movimiento patrón. El movimiento que define el mejor cambio se define
𝑝𝑝
como 𝑏𝑏𝑖𝑖+1 = (𝑥𝑥𝑖𝑖+1 , 𝑦𝑦𝑖𝑖+1 )
3. Movimiento patrón: se calcula un nuevo punto extrapolando el punto base anterior 𝑏𝑏𝑖𝑖 con el punto del
𝑝𝑝
movimiento patrón, 𝑏𝑏𝑖𝑖+1 con la fórmula:
𝑝𝑝
𝑏𝑏𝑖𝑖+1 = 2 ∗ 𝑏𝑏𝑖𝑖+1 − 𝑏𝑏𝑖𝑖 (5-3)
79
4. Si la función en 𝑏𝑏𝑖𝑖+1 comparada con el mejor de los valores calculados anteriormente es mejor, tomar como
nuevo punto base al punto 𝑏𝑏𝑖𝑖+1 incrementar 𝑖𝑖 y regresar a 2. Si el punto extrapolado no mejora tomar como
𝑝𝑝
nuevo punto base al punto 𝑏𝑏𝑖𝑖+1 , incrementar 𝑖𝑖 y regresar a 2.
5. Terminar cuando el error relativo entre dos valores de la función en iteraciones sucesivas es muy pequeño, por
ejemplo menor a 10−4 o cuando la norma de los incrementos es menor que una tolerancia preestablecida.
El movimiento exploratorio en la vecindad del último punto define un nuevo punto, con estos dos se define otro por
extrapolación. Si en cualquiera de los movimientos de exploración o patrón no se produce una mejoría en la función
objetivo, entonces reducir el tamaño del incremento y continuar la búsqueda en ambos movimientos.
Ejemplo 5.3
Maximizar 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 + 𝑦𝑦 − 0.12𝑦𝑦 3 + 2.5𝑥𝑥𝑥𝑥 − 0.12𝑥𝑥 3 con el método de Hooke y Jeeves empezar con (𝑥𝑥0, 𝑦𝑦0) =
(1.5,2.5)𝑦𝑦 ∆𝑥𝑥 = ∆𝑦𝑦 = 2.
Terminar cuando error relativo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) sea menor a 10-3 o Δ se reduzca 5 veces o se alcancen 5 iteraciones.
Con la calculadora TI nspire se resuelve el problema como se indica en las figuras 5.5, y 5.6
Figura 5.5 Primeras dos iteraciones del método Hooke y Jeeves del Ejemplo 5.3
Figura 5.6 Iteraciones tres y cuatro del método Hooke y Jeeves del Ejemplo 5.3
Converge en cuatro iteraciones y el óptimo con valores promedio es (𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = (7.3125, 7.3125), 𝑓𝑓(𝑥𝑥 ∗ , 𝑦𝑦 ∗ ) = 54.4621
y se cumple que el error es menor a 10-3.
En la Tabla 5.2 se presentan los valores de las variables y la función en cada iteración.
80
Tabla 5.2 Valores de las variables y la función en la resolución del Ejemplo 5.3
El método de gradiente también conocido como método del descenso más pronunciado del inglés steepest descent, es
el método más empleado para obtener el óptimo de funciones multivariables no lineales. Básicamente se aplica en una
serie de pasos en los que a cada iteración los nuevos valores calculados se aproximan cada vez más al óptimo.
La fórmula para obtener las coordenadas de un nuevo punto en las variables es:
Para la maximización de la función 𝑓𝑓(𝑥𝑥, 𝑦𝑦) el método garantiza que 𝑓𝑓(𝑥𝑥 𝑗𝑗+1 , 𝑦𝑦 𝑗𝑗+1 ) > 𝑓𝑓(𝑥𝑥 𝑗𝑗 , 𝑦𝑦 𝑗𝑗 ), porque el gradiente
+∇𝑓𝑓(𝑥𝑥, 𝑦𝑦) define una dirección en que la función aumenta. Geométricamente el gradiente es ortogonal (perpendicular)
a los contornos de la función en el punto de mayor incremento de la función. Un gradiente negativo −∇𝑓𝑓(𝑥𝑥, 𝑦𝑦) apunta
en la dirección de mayor disminución de la función, ver Figura 5.7.
x2 f(x) = 5 k
-∇f(x )
f(x) = 20
k
∇f(x )
k
x
f(x) = 25
x1
Figura 5.7 Gráfica de los contornos de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) con los gradientes en 𝑓𝑓2.
81
Con la condición de ortogonalidad se determina que
2
𝜕𝜕𝜕𝜕 2𝜕𝜕𝜕𝜕 2
�𝛻𝛻𝛻𝛻(𝑥𝑥, 𝑦𝑦) � = ��𝜕𝜕𝜕𝜕� + �𝜕𝜕𝜕𝜕� (5-5)
Los pasos 3 y 4 son muy importantes en el método. Primero el cálculo de la magnitud del paso de cambio en las
coordenadas, 𝑎𝑎 que puede hacerse con una búsqueda de la sección dorada o interpolación cuadrática. Segundo la
fórmula de actualización con la cual progresivamente las coordenadas se acercan más al óptimo. En cada iteración el
error de las funciones en dos iteraciones sucesivas se hace más y más pequeño.
Como criterio de convergencia se puede usar el error relativo de la función en dos iteraciones sucesivas, el cual se puede
especificar como un valor pequeño, por ejemplo 10-4 o 10-5. También se pude usar la magnitud del gradiente o los
valores de las derivadas de la función en el gradiente cuyo valor disminuye a cada iteración, ya que la condición
necesaria para obtener el óptimo es que las derivadas sean cero en un punto estacionario.
Ejemplo 5.4 Obtener el máximo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥(𝑦𝑦 + 4) − 𝑥𝑥 2 − 0.5(𝑦𝑦 2 − 6𝑦𝑦 + 2) usando el método del gradiente
(ascenso más pronunciado) empezando en (𝑥𝑥 0 , 𝑦𝑦 0 ) = (2,2) y terminar cuando ��𝑓𝑓(𝑥𝑥 𝑘𝑘 ) − 𝑓𝑓(𝑥𝑥 𝑘𝑘−1 )�/𝑓𝑓(𝑥𝑥 𝑘𝑘 )� ≤ 10−4
𝑥𝑥 1 2 −2𝑥𝑥 + 𝑦𝑦 + 4 2 − 2𝑎𝑎
En la primera iteración: � 1 � = � � − 𝑎𝑎 � � =� �
𝑦𝑦 2 𝑥𝑥 − 𝑦𝑦 + 3 2 − 3𝑎𝑎
2 − 2𝑎𝑎
El máximo de 𝑓𝑓 �� � � = −2.5𝑎𝑎2 − 13𝑎𝑎 + 11 se puede obtener igualando a cero la primera derivada de 𝑓𝑓(𝑥𝑥, 𝑦𝑦)
2 − 3𝑎𝑎
en términos de 𝑎𝑎, 𝑓𝑓(1 − 2𝑎𝑎, 2 − 3𝑎𝑎) = (2 − 2𝑎𝑎)((2 − 3𝑎𝑎) + 4) − (2 − 2𝑎𝑎)2 − 0.5((2 − 3𝑎𝑎)2 − 6(2 − 3𝑎𝑎) + 2)
𝑑𝑑 −13
�𝑓𝑓(1 − 2𝑎𝑎, 2 − 3𝑎𝑎)� = −2.5𝑎𝑎2 − 13𝑎𝑎 + 11 = 0 da 𝑎𝑎 = = −2.6 , entonces:
𝑑𝑑𝑑𝑑 5
𝑥𝑥 1 2 2 7.2
� � = � � + 2.6 � � = � � con f(7.2, 9.8) = 27.9
𝑦𝑦1 2 3 9.8
El error en la tercera iteración se tiene: |(𝑓𝑓(𝑥𝑥 3 ) − 𝑓𝑓(𝑥𝑥 2 ))/𝑓𝑓(𝑥𝑥 3 )| = 0.000021 < 10−4
Converge en tres iteraciones.
Se calculan los determinantes de la Hessiana para determinar si es un máximo o un mínimo.
𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 −2 1 −2 1
� 𝜕𝜕2 𝑓𝑓 𝜕𝜕2 𝑓𝑓
� =� � se obtiene 𝑑𝑑1 = −2 y 𝑑𝑑2 = � �=1
1 −1 1 −1
𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2
Por lo que corresponde a un máximo. La solución exacta es: 𝑥𝑥 = 7, 𝑦𝑦 = 10, 𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓(7, 10) = 28.
La gráfica de las curvas de contorno se muestra en Figura 5.8
Figura 5.8 Gráfica de las curvas de contorno de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥(𝑦𝑦 + 4) − 𝑥𝑥 2 − 0.5(𝑦𝑦 2 − 6𝑦𝑦 + 2) con máximo en (7,10)
Las instrucciones en la calculadora TI nspire para resolver este problema usando una notación vectorial se muestran a
continuación:
83
84
Ejemplo 5.5
En el Ejemplo 6.2 se optimiza un sistema de extracción de dos etapas se utiliza para recuperar el soluto de una
disolución acuosa, donde resulta la función objetivo:
𝑑𝑑
𝑤𝑤1 𝑖𝑖+1
𝑤𝑤1 𝑖𝑖 𝑓𝑓(𝑤𝑤1𝑖𝑖 , 𝑤𝑤2𝑖𝑖 )
𝑑𝑑𝑑𝑑1
=
� 𝑖𝑖+1 � � 𝑖𝑖 � + 𝑎𝑎 � 𝑑𝑑 � (5-6)
𝑤𝑤2 𝑤𝑤2 𝑓𝑓(𝑤𝑤1𝑖𝑖 , 𝑤𝑤2𝑖𝑖 )
𝑑𝑑𝑑𝑑2
El parámetro 𝑎𝑎 se determina con una búsqueda lineal que maximiza la función en la dirección del gradiente.
85
Figura 5.9 Instrucciones del método del gradiente para resolver el ejemplo3.
∇f ( x ) ≈ ∇f ( x 0 ) + ∇ 2 f ( x 0 ) ⋅ ( x − x 0 ) (5-7)
X será un punto estacionario de 𝑓𝑓(𝑥𝑥) si 𝛁𝛁𝒇𝒇�𝒙𝒙 � = 𝟎𝟎. Podemos hacer el lado derecho de la ecuación igual a cero y re
arreglar para obtener
[
x = x 0 − ∇ 2 f (x 0 ) ] −1
⋅ ∇f ( x 0 ) (5-8)
Al generalizar esta ecuación para dar una expresión iterativa del Método de Newton:
[
x k +1 = x k − ∇ 2 f (x k ) ]−1
⋅ ∇f ( x k )
−𝟏𝟏
o 𝒙𝒙𝒌𝒌+𝟏𝟏 = 𝒙𝒙𝒌𝒌 − 𝑯𝑯�𝒙𝒙𝒌𝒌 � 𝛁𝛁𝒇𝒇(𝒙𝒙𝒌𝒌 ) (5-9)
[∇ 2
]
f (x k ) =H(x) es la matriz Hessiana en la fórmula de aproximación para dos variables queda:
86
−1
𝜕𝜕2 𝑓𝑓 𝜕𝜕 𝜕𝜕𝜕𝜕 𝑑𝑑𝑑𝑑
𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝑑𝑑𝑑𝑑
𝑥𝑥 𝑘𝑘+1 = 𝑥𝑥 𝑘𝑘 − � 𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕2 𝑓𝑓
� �𝑑𝑑𝑑𝑑 � (5-10)
𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2 𝑑𝑑𝑑𝑑
El método de Newton aproxima 𝑓𝑓′(𝑥𝑥) como una línea recta a 𝒙𝒙𝒌𝒌 y obtiene un nuevo punto 𝒙𝒙𝒌𝒌+𝟏𝟏 que es usado para
aproximar la función a la siguiente iteración. Esto se repite hasta que el nuevo punto es suficientemente cercano a 𝒙𝒙∗ .
Gráficamente se muestra esta aproximación en la Figura 5.9
Tangente de f′
k
(x) en x
* k+1
f′ (x) x x x x
k
Si lo que se busca es un mínimo entonces debe cumplirse que 𝑓𝑓�𝑥𝑥 𝑘𝑘+1 � < 𝑓𝑓�𝑥𝑥 𝑘𝑘 � , y 𝑓𝑓�𝑥𝑥 𝑘𝑘+1 � > 𝑓𝑓�𝑥𝑥 𝑘𝑘 � para encontrar
un máximo.
Al comparar los métodos del gradiente y de Newton Raphson son muy similares, la principal diferencia es que el
Newton Raphson usa tanto el gradiente como la matriz Hessiana. Con esto se obtiene una convergencia más rápida
hacia los puntos críticos con el método de Newton Raphson que con el método del gradiente pero aumenta el cálculo
necesario para cada iteración. El cálculo de la inversa no se requiere si notamos que
−1
−𝐻𝐻�𝑥𝑥 𝑘𝑘 � ∇𝑓𝑓�𝑥𝑥 𝑘𝑘 � = 𝑝𝑝 (5-11)
Ejemplo 5.6
Obtener el mínimo de 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 𝑥𝑥 2 − 5𝑥𝑥𝑥𝑥 + 𝑦𝑦 4 − 25𝑥𝑥 − 8𝑦𝑦
Use el método de Newton Raphson empezando en (𝑥𝑥 0 , 𝑦𝑦 0 ) = (2,2) y terminar cuando ��𝑓𝑓(𝑥𝑥 𝑘𝑘 ) − 𝑓𝑓(𝑥𝑥 𝑘𝑘−1 )�/𝑓𝑓(𝑥𝑥 𝑘𝑘 )� ≤
10−4 .
𝑑𝑑𝑑𝑑 𝜕𝜕2 𝑓𝑓 𝜕𝜕 𝜕𝜕𝜕𝜕
𝑑𝑑𝑑𝑑 2𝑥𝑥 − 5𝑦𝑦 − 25 𝜕𝜕𝑥𝑥 2 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 2 −5
El Gradiente y la Hessiana: �𝑑𝑑𝑑𝑑 � =� � � 𝜕𝜕 𝜕𝜕𝜕𝜕 � =� �
−5𝑥𝑥 + 4𝑦𝑦 3 − 8 𝜕𝜕2 𝑓𝑓 −5 12𝑦𝑦 2
𝑑𝑑𝑑𝑑 𝜕𝜕𝜕𝜕 𝜕𝜕𝜕𝜕 𝜕𝜕𝑦𝑦 2
Iteración 1:
87
𝑥𝑥 1 𝑥𝑥 0 2 −5 −1 2𝑥𝑥 − 5𝑦𝑦 − 25 𝑥𝑥 1 2 2 −5 −1 −31
� � = � � − � � � � � 1� = � � − � � � �
𝑦𝑦1 𝑦𝑦 0 −5 12𝑦𝑦 2 −5𝑥𝑥 + 4𝑦𝑦 3 − 8 𝑦𝑦 2 −5 48 14
𝑥𝑥 1 21.9718
� 1� = � � con 𝑓𝑓(21.9718,3.78873) = −307.02
𝑦𝑦 3.78873
Iteración 2:
𝑥𝑥 2 21.9718 2 −5 −1 0 20.4119
� 2 � = � � − � � � �=� � con 𝑓𝑓(20.4119, 3.16476) = −341.649
𝑦𝑦 3.78873 −5 120.188 16.7297 3.16476
Resumen de resultados:
k 𝒙𝒙𝒌𝒌 𝒚𝒚𝒌𝒌 𝒇𝒇(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 ) 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅 𝒅𝒅𝒅𝒅(𝒙𝒙𝒌𝒌 , 𝒚𝒚𝒌𝒌 )/𝒅𝒅𝒅𝒅
0 2 2 - 66 -31 14
1 21.9718 3.78873 -307.02 0 16.7297
2 20.4119 3.16476 −341.649 -0.00005 99.6819
3 20.0235 3.00941 −342.996 -0.00005 0.901971
4 20.0001 3.00003 -343 0.00005 0.00274
Por lo que los cálculos convergen en cuatro iteraciones. Se sustituye el valor de 𝑦𝑦 en la Hessiana y se obtiene que los
determinantes menores son positivos por lo que el valor encontrado corresponde a un mínimo.
88
CAPITULO 6
Programación geométrica
89
6.1 Introducción
La función objetivo 𝑓𝑓(𝑥𝑥) es un posinomial con n términos (posinomios) 𝑓𝑓(𝑥𝑥) = 𝑃𝑃1 + 𝑃𝑃2 + ⋯ + 𝑃𝑃𝑛𝑛 y m variables
independientes, 𝑥𝑥𝑗𝑗 todos positivos, ya que los n coeficientes son positivos (𝑐𝑐𝑖𝑖 ≥ 0) y las m variables también, (𝑥𝑥𝑗𝑗 ≥ 0)
mientras que los exponentes 𝑎𝑎𝑖𝑖,𝑗𝑗 no tienen restricciones de signo.
La definición de la función objetivo como un posinomial conlleva la idea de que se trata de un polinomio cuyos términos
son positivos.
𝑏𝑏
𝑔𝑔2 (𝑥𝑥) = ∑𝑇𝑇2 𝑚𝑚
𝑖𝑖=1 𝑒𝑒𝑖𝑖 ∏𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
≤ 1 Etc. (6-3)
Por ejemplo:
Las ecuaciones (6-2) y (6-3) representan la forma estándar de formulación de problemas de programación geométrica. El
método de la programación geométrica fue publicado en 1967 por Duffin, Peterson y Zener 1.
El algoritmo de resolución asocia a la función primal una función denominada dual, que tiene la forma:
𝑐𝑐 𝑤𝑤𝑖𝑖
𝐷𝐷(𝑤𝑤) = ∏𝑛𝑛𝑖𝑖=1 � 𝑖𝑖 � (6-4)
𝑤𝑤𝑖𝑖
De tal manera que en los puntos extremos existe una equivalencia geométrica entre el primal y el dual,
1
Duffin R, Peterson E y Zener C. (1967) Geometric programming—theory and application. Wiley, New York
90
El algoritmo de la programación geométrica para problemas sin restricciones procede de acuerdo a los siguientes pasos.
La solución simultanea de las ecuaciones de normalidad y ortogonalidad depende de los grados de libertad.
g. l. = n – m –1
Los problemas a resolver tienen función objetivo cóncava, no es de naturaleza iterativa por lo que no se requiere
proveer una estimación inicial de las variables. La solución se encuentra por una transformación de la función objetivo
primal a una dual que es convexa con restricciones lineales.
Ejemplo 6.1 2
Encontrar la cantidad económica de pedido de producto, es decir, se debe decidir qué cantidad de un artículo conviene
almacenar periódicamente. Los costos totales asociados al producto y su almacenamiento se pueden expresar como:
Dónde:
CT = Costo total,
𝑄𝑄ℎ
CI = Costo asociado al inventario �= �
2
𝑎𝑎𝑎𝑎
CP = Costo por gestión de pedido �= �
𝑄𝑄
𝑑𝑑𝑑𝑑
CC = Precio de compra �= �
𝑄𝑄
Q = Cantidad económica de pedido,
h = Costo de almacenamiento por unidad = 300 $/unidad
a = Costo de hacer un pedido = $ 3.5
2
Operations Research: Principles and Practice. Don T. Phillips, A. Ravindran y J. J. Solberg. Wiley, 1976.
91
d = Consumo promedio al año = 10,000 unidades/año
P = Precio de compra por unidad = 10 $/unidad
𝑄𝑄ℎ 𝑑𝑑
La función objetivo es: 𝐶𝐶𝐶𝐶 = + (𝑎𝑎 + 𝑃𝑃)
2 𝑄𝑄
300
La función primal es: min 𝐶𝐶𝐶𝐶 = 𝑄𝑄 + 10,000(3.5 + 10)𝑄𝑄 −1
2
300
Solamente tiene dos términos, entonces: 𝑃𝑃1 (𝑄𝑄) = 𝑄𝑄 y 𝑃𝑃2 (𝑄𝑄) = 10,000(3.5 + 10)𝑄𝑄−1
2
150 𝑤𝑤1 135,000 𝑤𝑤2
La función dual es: 𝐷𝐷(𝑤𝑤) = � � � �
𝑤𝑤1 𝑤𝑤2
Condición de normalidad: 𝑤𝑤1 + 𝑤𝑤2 = 1
Condición de ortogonalidad: 𝑤𝑤1 − 𝑤𝑤2 = 0
Se resuelven las ecuaciones de las condiciones y se obtiene 𝑤𝑤1 = 𝑤𝑤2 = 1/2
150 1/2 135,000 1/2 2
El óptimo del dual es 𝐷𝐷(𝑤𝑤 ∗ ) = � � � � = �14(20,250,00) = 9000
1/2 1/2
Ejemplo 6.2
Se desea transportar 400 m3 de grava a través de un rio en una caja abierta sobre una barcaza, el contenedor tendrá una
longitud L, ancho W y altura H. Los costos de producción son de 10 $/m2 por el fondo y los laterales (A1) y los extremos
de la caja cuestan 20 $/m2 (A2). El costo por viaje es de 0.10 $/viaje (A3). Determinar: 3
Caja
Barcaza
Rio
Grava
3
Duffin, R., Peterson, E., and Zener, C. (1967) Geometric Programming: Theory and Applications. New York: Wiley
92
Los componentes de la función objetivo son:
Grados de libertad = No. De términos –No. De variables – 1 = 4 -3 -1 = 0 (el sistema tiene solución única)
Condiciones de optimalidad.
𝑊𝑊∗𝐻𝐻 1/2
Dividir (6-9) entre (6-11) da:
𝐿𝐿∗𝑊𝑊
= 2
; 𝐻𝐻 = 1
4
𝐿𝐿 (6-13)
1
(6-13) en (6-12) da: 𝑊𝑊 = 2
𝐿𝐿 (6-14)
3
𝐿𝐿 = √8 = 2,
93
1
𝑊𝑊 = 2
𝐿𝐿 = 12 2=1,
1 1
𝐻𝐻 = 4
𝐿𝐿 = 4 (2) = 0.5
(a) las dimensiones son: Costados (L)= 2 m, Ancho (W) = 1 m y Altura (H) = 0.5 m
El volumen de la caja es de 1 m3
(c) Número de viajes = Volumen total de grava/volumen por viaje = 400 m3/(1 m3/viaje) = 400 viajes.
(d) Costo total = (costo por viaje)(No. De viajes) = (0.1 $/viaje)(400 viajes)= $40
Nótese que los términos de la función objetivo (T1, T2, T3 y T4) están en la misma proporción que los pesos
(w1,w2,w3,w4)
Ahora suponer que el fondo y los laterales se pueden construir con metal recuperado de otras construcciones pero,
solamente se dispone de 4 m2.
Condición de normalidad: w1 + w2 = 1
Condición de ortogonalidad de L: - w1 + w3 + w4 = 0
Condición de ortogonalidad de W: - w1 + w2 + w4 = 0
Condición de ortogonalidad de H: - w1 + w2 + w3 = 0
2 1 2
La solución es: w1 = , w2 = w3 = w4 = 𝑦𝑦 𝜆𝜆 = , entonces,
3 3 3
1⁄3 1⁄3
40 2⁄3 40 1⁄3 1 1
𝐷𝐷(𝑤𝑤) = � � � � � 1� � 1� = �402⁄3 �(120 ∗ 1.5 ∗ 0.75)1/3 = 60
2/3 1/3 2( ) 4( )
3 3
1
𝑇𝑇2 = 4(𝑊𝑊 ∗ 𝐻𝐻) = 3 (60) = 20, W*H = ½ , con estas dos últimas ecuaciones se obtiene: L = 2
94
𝐿𝐿∗𝐻𝐻 1 𝐿𝐿∗𝑊𝑊 1
𝐿𝐿1 = 2
= (60) = 20, que al combinar con 𝐿𝐿2 = = (60) = 20, da: W=2H, este combinado con el resultado de
3 4 3
T2, se obtiene, 2*H*H = ½ de donde 𝐻𝐻 = 2�1/4 = 1/2, entonces W = 2(1/2) = 1
𝑏𝑏
𝑔𝑔2 (𝑥𝑥) = ∑𝑇𝑇2 𝑚𝑚
𝑖𝑖=1 𝑒𝑒𝑖𝑖 ∏𝑗𝑗=1 𝑥𝑥𝑗𝑗
𝑖𝑖,𝑗𝑗
≤ 1 Etc.
𝑏𝑏 𝑏𝑏 𝑏𝑏
Cada una con T términos (posinomios) 𝑔𝑔𝑖𝑖 (𝑥𝑥) = 𝐿𝐿1 + 𝐿𝐿2 + ⋯ + 𝐿𝐿 𝑇𝑇 cada uno con: 𝐿𝐿𝑘𝑘 = 𝑒𝑒𝑘𝑘 𝑥𝑥1 1𝑘𝑘 ∙ 𝑥𝑥2 2𝑘𝑘 ∙ … ∙ 𝑥𝑥𝑚𝑚𝑚𝑚𝑚𝑚
𝑤𝑤𝑗𝑗
𝑐𝑐 𝑤𝑤𝑖𝑖 𝑐𝑐
El dual es: 𝐷𝐷(𝑤𝑤) = ∏𝑛𝑛𝑖𝑖=1 � 𝑖𝑖 � ∏𝑇𝑇𝑗𝑗=1 � 𝑗𝑗 � (𝜆𝜆)𝜆𝜆 donde 𝜆𝜆 = ∑𝑇𝑇𝑗𝑗=1 𝑤𝑤𝑗𝑗
𝑤𝑤𝑖𝑖 𝑤𝑤𝑗𝑗
λ es un multiplicador de Lagrange que corresponde a la suma de los pesos de los términos en las restricciones.
Condiciones de ortogonalidad: ∑𝑛𝑛𝑖𝑖=1 𝑤𝑤𝑖𝑖 𝑎𝑎𝑖𝑖,𝑗𝑗 + ∑𝑇𝑇𝑘𝑘=1 𝑤𝑤𝑘𝑘 𝑏𝑏𝑘𝑘,𝑗𝑗 = 0 una para cada j variable de 1 a m.
Ejemplo 6.3
Se tienen 2 términos en el primal: 𝑓𝑓(𝑥𝑥) = 𝑃𝑃1 + 𝑃𝑃2 y 2 términos en la restricción 𝑔𝑔(𝑥𝑥) = 𝐿𝐿1 + 𝐿𝐿2
Con 3 variables independientes, entonces se tendrán 4 pesos: 𝑤𝑤 = {𝑤𝑤1 , 𝑤𝑤2 , 𝑤𝑤3 , 𝑤𝑤4 } con 𝜆𝜆 = 𝑤𝑤3 + 𝑤𝑤4
𝑃𝑃1 = 5𝑥𝑥1−3 𝑥𝑥2 𝑥𝑥3 , 𝑃𝑃2 =𝑥𝑥1 𝑥𝑥2 𝑥𝑥3 , 𝐿𝐿1 = 2𝑥𝑥1 𝑥𝑥3−2 y 𝐿𝐿2 = 3𝑥𝑥2−2 𝑥𝑥3−1
Sustituyendo el valor de 𝑥𝑥1 en (6-17) se obtiene 𝑥𝑥3 = 3.8169 que sustituido en (6-18) da, 𝑥𝑥2 = 1.2537
Ejemplo 6.4
En cierta compañía petroquímica se incendia un tanque cilíndrico de 3,141.59 m3. La compañía de seguros les paga
1,200 dólares por el siniestro. La reconstrucción del tanque a través de un bufete de ingeniería les cuesta un dólar por
m2 de metal del tanque.
¿Qué dimensiones debe tener el tanque para tener el mismo volumen y a menor costo?
Condición de normalidad en g(R, H): el factor de Lagrange se asocia a cada restricción en este caso 𝑤𝑤3 = 𝜆𝜆
96
2𝜋𝜋 1/3 2𝜋𝜋 2/3 1000 2/3 2 2/3
La función dual queda: 𝐷𝐷(𝑤𝑤) = �1/3� �2/3� � 2/3 � � � = 1,187.45 = 𝑓𝑓(𝑅𝑅 ∗ , 𝐻𝐻 ∗ )
3
Se aplican las condiciones de optimalidad: En el primer término del primal: 2 ∗ 𝜋𝜋 ∗ 𝑅𝑅 2 = 𝑤𝑤1 𝑓𝑓(𝑅𝑅 ∗ , 𝐻𝐻 ∗ )
2 1
� �(1,187.45)
Se despeja R y se obtiene: 𝑅𝑅 = � 32∗3.1416 = 7.93701 𝑚𝑚
Dos ecuaciones fueron suficientes para resolver el problema, la ecuación de la restricción que contribuye con el tercer
término se puede usar para comprobar resultados.
Se puede usar el método de los multiplicadores de Lagrange para resolver este problema de la siguiente manera:
𝜕𝜕𝜕𝜕
= 4𝜋𝜋𝜋𝜋 + 2𝜋𝜋𝜋𝜋 − 2𝜆𝜆𝜋𝜋𝜋𝜋𝜋𝜋 = 0
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 2𝜋𝜋𝜋𝜋 − 𝜆𝜆𝜋𝜋𝑅𝑅 2 = 0
𝜕𝜕𝜕𝜕
𝜕𝜕𝜕𝜕
= 𝜋𝜋𝑅𝑅 2 − 1000𝜋𝜋 = 0
𝜕𝜕𝜆𝜆
Otra forma de resolver el problema es despejar el valor de H de la restricción y sustituir en la función objetivo.
2000𝜋𝜋
𝐻𝐻 = 1000/𝑅𝑅2 , entonces la función objetivo queda: 𝑓𝑓(𝑅𝑅, 𝐻𝐻) = 2𝜋𝜋𝑅𝑅 2 +
𝑅𝑅
97
Problemas
1. Encontrar los valores de las variables 𝑥𝑥1 , 𝑥𝑥2 𝑦𝑦 𝑥𝑥3 que minimizan
1
𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 ) = + 2𝑥𝑥2 𝑥𝑥3 + 3𝑥𝑥1 𝑥𝑥3 + 4𝑥𝑥1 𝑥𝑥2 , sujeto a 𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 > 0
𝑥𝑥1 𝑥𝑥2 𝑥𝑥3
Respuestas: 𝑥𝑥1 = 0.48836 , 𝑥𝑥2 = 0.73264, 𝑥𝑥3 = 0.9767, 𝑓𝑓(𝑥𝑥1∗ , 𝑥𝑥2∗ , 𝑥𝑥3∗ ) = 7.15485
3. Obtener el mínimo de
𝑥𝑥 3 2𝑦𝑦
𝑓𝑓(𝑥𝑥, 𝑦𝑦) = + 2 + 2𝑥𝑥 𝑦𝑦
𝑦𝑦 3 𝑥𝑥
98
CAPITULO 7
Programación Lineal
99
7.1 Introducción
El método de la programación lineal resuelve problemas de optimización cuya función objetivo y las restricciones se
pueden expresar como ecuaciones lineales de la forma:
𝑀𝑀𝑀𝑀𝑀𝑀 𝑍𝑍(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) = 𝑐𝑐1 𝑥𝑥1 + 𝑐𝑐2 𝑥𝑥2 + ⋯ 𝑐𝑐𝑛𝑛 𝑥𝑥𝑛𝑛 (7-1)
Sujeta a: 𝑔𝑔1 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎11 𝑥𝑥1 + 𝑎𝑎12 𝑥𝑥2 + ⋯ 𝑎𝑎1𝑛𝑛 𝑥𝑥𝑛𝑛 ≤ 𝑏𝑏1
𝑔𝑔2 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎21 𝑥𝑥1 + 𝑎𝑎22 𝑥𝑥2 + ⋯ 𝑎𝑎2𝑛𝑛 𝑥𝑥𝑛𝑛 = 𝑏𝑏2 (7-2)
…
𝑔𝑔𝑚𝑚 (𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ): 𝑎𝑎𝑚𝑚1 𝑥𝑥1 + 𝑎𝑎𝑚𝑚2 𝑥𝑥2 + ⋯ 𝑎𝑎𝑚𝑚𝑚𝑚 𝑥𝑥𝑛𝑛 ≥ 𝑏𝑏𝑚𝑚
Las “m” restricciones pueden ser de igualdad o desigualdad. Estas suelen ser requerimientos estipulados sobre las “n”
variables tales como especificaciones de operación en los procesos, limitaciones del mercado o de capacidad,
cumplimiento de balances de materiales o restricciones sobre la disponibilidad de recursos. Nótese que la función
objetivo se distingue por la letra 𝑍𝑍
Se puede aplicar a una gran cantidad de problemas por ejemplo; Determinación del mezclado óptimo en la fabricación
de materiales compuestos, Desarrollo de planes de envió de productos a diferentes destinos que minimicen los costos
de envió, considerando las limitaciones de capacidad. La identificación de la mejor manera de asignar diferentes tareas o
diferentes trabajadores, etc.
La función objetivo 𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ) es la ecuación cuyo óptimo se desea encontrar, ya se máximo o mínimo. Contiene “n
variables 𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 , denominadas variables de decisión. Los coeficientes 𝑐𝑐1 , 𝑐𝑐2 , … 𝑐𝑐𝑛𝑛 , de la función objetivo, los
coeficientes de las restricciones 𝑎𝑎11 , 𝑎𝑎12 , … 𝑎𝑎𝑛𝑛𝑛𝑛 y el vector de constantes 𝑏𝑏1 , 𝑏𝑏2 , … 𝑏𝑏𝑛𝑛 , son parámetros del modelo de
programación lineal.
Un modelo de programación lineal puede escribirse de tal forma que sus restricciones sean todas de igualdad, es decir,
que formen un sistema lineal de ecuaciones. Lo anterior es necesario para su solución por el método Simplex que se
explica más adelante. Con ello se expresan las ecuaciones como un modelo de Forma Estándar. Para escribir una
desigualdad como igualdad es necesario sumar una variable adicional que se denomina variable de holgura o variable
artificial, en caso que la desigualdad sea del tipo menor o igual, se debe restar una variable que en este caso se
100
denomina variable de exceso, estas variables deben ser no negativas. En la forma estándar todas las restricciones son
igualdades.
∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 ≤ 𝑏𝑏𝑖𝑖 Se convierte en ∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 + 𝑆𝑆𝑛𝑛+𝑖𝑖 = 𝑏𝑏𝑖𝑖
∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 ≥ 𝑏𝑏𝑖𝑖 Se convierte en ∑𝑛𝑛𝑗𝑗=1 𝑎𝑎𝑖𝑖𝑖𝑖 𝑥𝑥𝑗𝑗 − 𝑆𝑆𝑛𝑛+𝑖𝑖 = 𝑏𝑏𝑖𝑖
Ejemplo 7.1.
𝑥𝑥1
𝑀𝑀𝑀𝑀𝑀𝑀 𝑍𝑍 = [60 50] �𝑥𝑥 �
2
s. a
𝑥𝑥1
2 4 1 0 2𝑥𝑥 80
� �� � = � �
3 2 0 1 𝑆𝑆1 60
𝑆𝑆2
Nótese que la matriz de coeficientes de las restricciones originales ha sido ampliada con una matriz identidad. Cuando
𝑥𝑥1 , = 0 𝑦𝑦 𝑥𝑥2 = 0, entonces 𝑆𝑆1 = 80 𝑦𝑦 𝑆𝑆2 = 60 es una solución pero no la óptima. Nótese que los coeficientes de las
variables artificiales en la función objetivo son “0”, mientras que los coeficientes de estas variables en las restricciones
es “1”.
Cualquier conjunto de las variables o punto que satisface todas las restricciones es un vector viable o punto viable o
factible. El espacio encerrado por todos los puntos viables es la región viable o factible. Cualquier punto dentro de esta
región es una solución. Los puntos de intersección entre las ecuaciones de las restricciones así como los puntos de cruce
con los ejes coordenados forman soluciones básicas. El óptimo máximo se encuentra entre las soluciones básicas que
sean factibles, en estos puntos tanto las variables de decisión como las variables de holgura serán no negativas.
Para un problema con “n” variables y con “m” restricciones en su forma estándar, dos soluciones básicas factibles serán
soluciones básicas factibles adyacentes si acaso tienen m-1 variables básicas en común.
101
Para problemas con dos variables se puede encontrar la región viable y el óptimo de forma gráfica, como en el siguiente
ejemplo.
Ejemplo 7.2
En una refinería se procesan dos tipos de crudos, ligero (crudo1) y pesado (crudo2), con costos de 24 $/barril y 15
$/barril, respectivamente. Los cuatro principales productos son: gasolina, queroseno, gasóleo y residuo cuyo precio de
venta es para cada producto, $36/barril, 24 $/barril, 21 $/barril y 10 $/barril. Los datos de producción y rendimientos
son:
Determinar qué cantidades de cada crudo se deben procesar para maximizar las ganancias.
La función objetivo depende de las utilidades por las ventas de productos y corresponde a:
Se propone un esquema de la situación, indicando como entradas a la refinería los crudos (x= barriles/día de crudo 1),
(y= barriles/día de crudo 1) y como salidas los productos (gasolina (x3), queroseno (x4), gasóleo (x5) y residuo (x6)).
Crudo 2 (y)
Refinería Gasóleo (x5)
Residuo (x6)
Figura 7.1 Esquema de la formulación del problema del Ejemplo 7.1
Considerando que el objetivo es maximizar las utilidades por venta de los productos y que estos dependen de los
rendimientos que tienen cada crudo entonces:
Al multiplicar cada una de estas cantidades por su precio se obtienen las ganancias por ventas:
102
36(0.8 𝑥𝑥 + 0.44 𝑦𝑦) + 24(0.05 𝑥𝑥 + 0.10 𝑦𝑦 ) + 21(0.10 𝑥𝑥 + 0.36 𝑦𝑦) + 10(0.05 𝑥𝑥 + 0.10 𝑦𝑦)
La función objetivo es: Utilidades = 𝑓𝑓(𝑥𝑥, 𝑦𝑦) = 32.6 𝑥𝑥 + 26.8 𝑦𝑦 − 24 𝑥𝑥 + 15 𝑦𝑦 − 0.5 𝑥𝑥 + 𝑦𝑦 = 8.1 𝑥𝑥 + 10.8 𝑦𝑦
Luego se abre una hoja para graficar y se ingresan las ecuaciones de las rectas.
103
Después se ubican los puntos de intersección de las rectas con b/6: Analizar gráfico/4: Intersección.
Figura 7.3 Gráfica de las restricciones del Ejemplo 7.1 con las soluciones básicas
Luego abril una página nueva con una Hoja de cálculo y rotular las columnas A y B con Crudo1 y Crudo2
respectivamente.
En la primera línea dar las coordenadas del primer punto y en las líneas 2 y 3 las de los otros puntos de intersección. En
la columna C escribir objetivo como rotulo y en cada celda la fórmula de la función objetivo (8.1 𝐴𝐴 + 10.8 𝐵𝐵).
𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏
Se nota que con 𝑥𝑥 = 2,620 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 1 e 𝑦𝑦 = 6,900 𝑑𝑑𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 2 se obtiene la máxima utilidad,
𝑑𝑑í𝑎𝑎 𝑑𝑑í𝑎𝑎
286,740 $/𝑑𝑑í𝑎𝑎
El método de solución grafica es muy conveniente para problemas con dos variables pero es impráctico para un número
mayor de variables. La región acotada por todas las líneas de las restricciones define la región de viabilidad y en las
esquinas de dicha región se encuentran los puntos extremos de la función objetivo.
Este tipo de problemas de mezclas son muy comunes. Se tiene un conjunto de productos a vender y un número finito de
recursos para su elaboración. Asociados a cada producto se tiene una ganancia por unidad de producto y una taza de
contribución por el uso de los recursos. El objetivo es encontrar la mezcla de los recursos que maximizan las ganancias
considerando que cada recurso se puede usar en una cantidad restringida.
Como se muestra en el Ejemplo anterior, pueden existir múltiples puntos o soluciones que satisfagan las restricciones
que definen un conjunto de soluciones factibles.
104
7.2 El método Simplex
Este método encuentra el óptimo de la función objetivo y los valores de las variables en el óptimo usando operaciones
elementales de hilera en una tabla, denominada Tableau, que se escribe partiendo de la forma estándar de
programación lineal. El objetivo del Método Simplex es lograr sucesivas mejoras para el valor de la función objetivo
asociada a la selección de alguna solución factible
60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 2 4 1 0 80
0 S2 3 2 0 1 60
Z=0 0 0 0 0 Zj
60 50 0 0 Cj - Zj
La primera hilera contiene los coeficientes de la función objetivo, 𝐶𝐶𝑗𝑗 . La columna rotulada con la palabra Base contiene a
las variables básicas que son 𝑆𝑆1 𝑦𝑦 𝑆𝑆2 mientras que las variables no básicas son 𝑥𝑥1 𝑦𝑦 𝑥𝑥2 no están en esta columna. La
primera columna llamada 𝐶𝐶𝐵𝐵 contiene los coeficientes de la función objetivo de las variables básicas. Los coeficientes de
la matriz ampliada de las restricciones en la forma estándar están bajo las columnas rotuladas con las variables de
decisión y las de holgura. La columna 𝑏𝑏𝑗𝑗 contiene el vector de coeficientes independientes de las restricciones. Las dos
últimas hileras se usan para determinar si después de varias iteraciones se alcanza el óptimo o no. Los coeficientes de la
hilera 𝑍𝑍𝑗𝑗 se determina con 𝑍𝑍𝑗𝑗 = ∑ 𝑎𝑎𝑖𝑖,𝑗𝑗 𝐶𝐶𝐵𝐵𝐵𝐵 . Para problemas de maximización se terminan los cálculos cuando todos los
valores de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 son cero o negativos. El significado de la columna 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 , se explica más adelante.
Observamos que si se incrementa cualquiera de las variables no básicas, el valor de 𝑍𝑍 se incrementa. El método
simplex busca substituir estas variables básicas del Tableau inicial por las variables de decisión usando operaciones
elementales de hilera.
El método Simplex supone que inicialmente se cuenta con una solución factible, cuyas variables forman una solución
básica. Estas variables corresponden a las columnas del Tableau con vectores unitarios, definidas por las variables
artificiales. El fundamento del método está en intercambiar una de las columnas que está en el Tableau por otro que no
este.
Primero, se debe elegir como variable entrante a la base aquella no-básica con mayor coeficiente en el renglón de la
hilera 𝑍𝑍𝑗𝑗 . En este ejemplo la variable 𝑥𝑥1 que tiene el mayor coeficiente por lo tanto tiene el mayor impacto en el
crecimiento de la función objetivo. Este criterio se denomina “condición de optimalidad.”
Segundo, se debe definir por cuál variable básica cambiar, es decir establecer la variable saliente de la base. Para
determinar la variable básica saliente se determina la razón entre los lados derechos de las ecuaciones (columna 𝑏𝑏𝑗𝑗 )
dividida entre los coeficientes de la variable entrante 𝑎𝑎𝑖𝑖,𝑝𝑝 en cada hilera, la hilera en la que la razón 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 tenga el
menor valor, determina a la variable saliente y se define como hilera pivote. El subíndice “p” en 𝑎𝑎𝑖𝑖,𝑝𝑝 se define como
índice de la columna pivote. El cálculo de esta razón se registra en la columna 𝑏𝑏𝑗𝑗 /𝑎𝑎𝑖𝑖,𝑝𝑝 . Esta razón se conoce como
“prueba de mínima razón”, el elemento de esta columna que sea el menor define la variable de la hilera pivote que
tenga la mayor restricción para aumentar 𝑍𝑍. La aplicación de la prueba de mínima razón para estipular que variable es la
que sale de la base, se conoce como “condición de factibilidad.”
105
Tercero, con operaciones de hilera del tipo Gauss-Jordan en la tabla el elemento pivote (el elemento del cruce de la
columna pivote con la hilera pivote), contendrá un “1” en y los demás elementos de la columna pivote contendrán
ceros. Al final de las operaciones en la columna 𝑏𝑏𝑗𝑗 quedaran los valores de las variables 𝑥𝑥𝑖𝑖 en el óptimo y las 𝑆𝑆𝑖𝑖 serán
sustituidas por las 𝑥𝑥𝑖𝑖 en la columna 𝐶𝐶𝐵𝐵 . Se prevén dos tipos de operaciones, la primera para cambiar el valor del
elemento pivote a “1” y la segunda para eliminar (poner ceros) los elementos arriba y abajo del elemento pivote. La
aplicación de estas operaciones es conocida como pivoteo.
Estos pasos se repiten hasta que ninguna mejora de la función objetivo sea posible.
En el Tableau inicial del ejemplo la columna pivote es la columna de 𝑥𝑥1 porque tiene el coeficiente de mayor valor en la
𝑏𝑏 80 𝑏𝑏 60
función objetivo (𝑐𝑐1 = 60) y los valores de la prueba de mínima razón son 1 = = 40 y 𝑎𝑎 2 = = 20 por lo que la
𝑎𝑎 1,1 2 2,1 3
hilera pivote es la segunda hilera (20<40) y se dice que 𝑥𝑥1 entra a la base y 𝑆𝑆2 sale de la base, el Tableau queda:
60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 2 4 1 0 80 80/2=40
60 X1 3 2 0 1 60 60/3=20
Z=0 0 0 0 0 Zj
60 50 0 0 Cj - Zj
1
Las operaciones de hilera son: 𝑅𝑅 → 𝑅𝑅2′ y 𝑅𝑅1 − 2 𝑅𝑅2′ → 𝑅𝑅1′
3 2
60 X1 3 2 0 1 60
=1 = 20
3 3 3 3
Y 𝑅𝑅1′ queda:
0 S1 2−2=0 2 8 1 −2 80 − 2(20) = 40
4− 2� � =
3 3 3
En la columna 𝐶𝐶𝐵𝐵 en la hilera 2 entra el valor del coeficiente de 𝑥𝑥1 de la función objetivo.
Los valores de la hilera 𝑍𝑍𝑗𝑗 se determinan multiplicando los elementos de las hileras por el valor de cada elemento en la
columna 𝐶𝐶𝐵𝐵
60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
0 S1 0 8/3 1 -2/3 40
60 X1 1 2/3 0 1/3 20
Z=1200 60 40 0 20 Zj
60-60=0 50-40=10 0 0-20=-20 Cj - Zj
106
Para esta iteración 𝑥𝑥1 = 20 𝑦𝑦 𝑥𝑥2 = 0 por lo que la función objetivo vale 𝑍𝑍 = 60𝑥𝑥1 + 50𝑥𝑥2 = 60 ∗ 20 = 1200
𝑏𝑏 40
La nueva columna pivote es la columna de 𝑥𝑥2 y los valores de la prueba de mínima razón son 𝑎𝑎 1 = = 15 y
1,2 8/3
𝑏𝑏2 20
𝑎𝑎2,2
= = 30 por lo que la hilera pivote es la primera hilera y se dice que 𝑥𝑥2 entra a la base y 𝑆𝑆1 sale de la base.
2/3
3 ′
Las operaciones de hilera son: 𝑅𝑅 → 𝑅𝑅1" y 𝑅𝑅2′ − 23𝑅𝑅1′ → 𝑅𝑅2"
8 1
El Tableau queda:
60 50 0 0 Cj
CB Base X1 X2 S1 S2 bj bj/ajp
50 X2 0 1 3/8 -1/4 15 15
60 X1 1 0 -1/4 1/2 10 30
Z=1350 60 50 15/4 35/2 Zj
0 0 -15/4 -35/2 Cj - Zj
Los valores de las variables en el óptimo están en la columna 𝑏𝑏𝑗𝑗 , 𝑥𝑥1 = 15 𝑦𝑦 𝑥𝑥2 = 10 y la función objetivo tiene un valor
𝑍𝑍 = 1350
Las siguientes instrucciones ilustran el uso de la calculadora TI nspire para ayudar a resolver este ejemplo con el método
Simplex.
Escribir en la calculadora TI nspire las siguientes matrices que definen el Tableau inicial.
Primero definir las dimensiones de la matriz y definir los valores de los elementos de la matriz con b/7: Matriz y
Vector/1: Crear/1: Matriz.
107
Se definen dos matrices para el Tableau por conveniencia en las operaciones. También se consideran por separado el
vector de mínima razón y la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 . Se observa que la columna pivote esta en 𝑥𝑥1 .
Ahora se determina los elementos de la columna de la prueba de mínima razón. Usar b/7: Matriz y Vector/1:
Crear/7: Submatriz para abrir el comando subMat(Matrix, [startRow], [startCol], [endRow], [endCol], en el cual Matrix
identifica a la matriz elegida, startRow identifica a la hilera de inicio mientras que startCol identifica a la columna de
inicio. Las opciones endRow y endCol identifican a la hilera y columna finales. Así la instrucción subMat(a,1,5,2,5) es para
referirse a los elementos (1,5) y (2,5) de la matriz a, que corresponden 𝑎𝑎 los valores 80 y 60 respectivamente.
Para hacer la división de estos valores entre los elementos (1,1) y (2,1) de la matriz se usa el comando ./ que se define
con b/7: Matriz y Vector/A: Operaciones con elementos/4: Dividir con punto decimal.
El menor valor está en la hilera 2 así que el elemento pivote es “3” siendo 𝑥𝑥1 la variable entrante y 𝑆𝑆2 la variable 2
1
Se procede a hacer las operaciones de hilera, 𝑅𝑅2 → 𝑅𝑅2′ y 𝑅𝑅1 − 𝑅𝑅2′ → 𝑅𝑅1′ con la calculadora. Para multiplicar una fila
3
por una constante se define el comando mRow( ). Usar b/7: Matriz y Vector/9: Operaciones con Filas/ 3: Multiplicar
fila. Así como mRowAdd( ) para Multiplicar fila y sumar.
𝑎𝑎2 Representa al nuevo Tableau. En la hilera 2 decolumna 𝐶𝐶𝐵𝐵 entra el valor del coeficiente de 𝑥𝑥1 de la función objetivo:
108
Se determinan los nuevos valores de la hilera 𝑍𝑍𝑗𝑗 y de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗
3 2
La hilera pivote es la 1 sale 𝑆𝑆1 de la base y entre 𝑥𝑥2 , las operaciones de hilera, 𝑅𝑅1′ → 𝑅𝑅1" y 𝑅𝑅2′ − 𝑅𝑅1" → 𝑅𝑅2" con las
8 3
operaciones en la calculadora:
Como cada elemento de la hilera 𝐶𝐶𝑗𝑗 − 𝑍𝑍𝑗𝑗 es no positivo entonces se alcanzó el óptimo
En la columna 𝐶𝐶𝐵𝐵 en la hilera 1 entra el valor del coeficiente de 𝑥𝑥2 de la función objetivo:
109
Los valores de las variables en el óptimo están en la columna 𝑏𝑏𝑗𝑗 , 𝑥𝑥1 = 15 𝑦𝑦 𝑥𝑥2 = 10
Aunque parece que el método Simplex es muy complejo, simplemente imita el proceso de prueba gráfica de los puntos
viables en las esquinas de la región viable. Empieza con los valores de las variables en el origen (0, 0), estos valores
corresponden a las variables artificiales, que no son reales y definen el Tableau inicial. El método prueba las esquinas
vecinas en la dirección en que progresa la función objetivo. A través de la elección adecuada del pivote que define la
variable entrante y la saliente en la base, se obtiene un nuevo Tableau y se termina cuando se obtiene el óptimo.
La hoja de cálculo Excel de Microsoft se puede usar para proponer y resolver problemas de programación lineal. Excel
cuenta con una opción de cálculo denominado Solver, con el cual se pueden encontrar máximos o mínimos.
Figura 7.5 Menú de datos del Solver, con datos del Ejemplo 7.1.
110
Figura 7.6 Hola de cálculo con los datos del Ejemplo 7.1
Se puede notar que las celdas A2 y B2 son las celdas de referencia para las variables X1 y X2 respectivamente, que
corresponden a x e y del Ejemplo 7.1. Se puede observar que Solver se encuentra en el Menú Datos.
En las celdas C5 a C7 se definen las ecuaciones de la función objetivo y las restricciones, en la columna D se dan los
valores de las constantes del lado derecho de las restricciones.
111
En un nuevo problema se debe cambiar la referencia a la celda de la función objetivo que inicialmente se define como
$A$1 y activar el botón Máx puesto que se trata de un problema de maximización. Para definir las celdas de referencia
de las restricciones dar clic en el botón Agregar y aparecer la ventana de captura de las restricciones, ver Figura 7.8
Finalmente en la opción del Método de Resolución elegir Simplex LP y oprimir el botón Resolver. La solución aparece
directamente en la hoja de cálculo como se muestra en la Figura 7.9.
112
Problemas
7.1 La sección de galletas de una fábrica de dulces elabora dos tipos de galletas. Las normales y las Premium, las
Premium tienen chispas de chocolate y las otras no. La ganancia en las normales es de 0.5 dólares por caja mientras que
en las Premium se gana 0.60 dólares por caja. Las galletas se procesan en tres etapas: mezclado, horneado y empaque,
se empacan dos galletas en cada bolsa de papel transparente para su venta. Los datos de tiempo requerido para cada
etapa en cada tipo de galleta se definen en la siguiente tabla:
Las máquinas que se usan en cada etapa tienen una disponibilidad de tiempo limitado en cada lote, 14 horas máximo en
la máquina de mezclado, el equipo de horneado se puede usar cuando mucho 40 horas y la máquina de empacado 15
horas a lo mucho. Si cada máquina se puede asignar a fabricar uno u otro tipo de galletas, determinar cuántas cajas de
cada tipo de galletas se deben fabricar para maximizar las ganancias.
7.2 Con el método Simplex y las iteraciones del Tableau encuentre el óptimo de la función:
𝑥𝑥1 + 𝑥𝑥2 ≤ 5
113
CAPITULO 8
Simulación
114
8.1 Introducción
El gran desarrollo de la tecnología de computadoras tanto en el hardware como en el software, provoca día con día
nuevos avances y transformaciones. En particular los métodos de cálculo para el análisis, síntesis, diseño y optimización
de sistemas en todas las ramas de la ingeniería han sido desplazados o modificados por el uso de diversas técnicas de
simulación.
• Escalamiento de diseños
• Ensayo de sensibilidad
• Entrenamiento de operadores
• Probar condiciones extremas y situaciones riesgosas sin comprometer la integridad del sistema real.
El poder de la simulación consiste en reemplazar la realidad por un modelo. Así que el modelo es una representación del
mundo real. Los ensayos de sensibilidad se refiere a las pruebas que permiten determinar los cambios en la salida de un
sistema que son atribuibles a cambios en la entrada.
Un modelo debe reflejar en alguna manera los atributos esenciales del sistema que representa. Debe ser preciso, simple,
útil y robusto. Los modelos pueden ser teóricos o empíricos. La construcción de modelos va más allá de elaborar
relaciones funcionales, implica:
2. La elucidación de las fuerzas que causan estos fenómenos y el alcance de sus efectos
Los tipos de simulación según el modelo puede ser: de estado estacionario, dinámico o estocástico.
En la simulación de estado estacionario fijamos el interés en los cambios alrededor del volumen de control y no en lo
que pasa adentro. Los modelos son de ecuaciones algebraicas no lineales
En la simulación dinámica se incluyen los cambios de las variables dentro del volumen de control con respecto al tiempo.
Los modelos son de ecuaciones diferenciales
En la simulación estocástica se busca representar los cambios en el estado de los elementos del sistema con respecto a
estados previos. Los modelos son de funciones probabilísticas
Los simuladores de procesos a régimen permanente se basan en una biblioteca de algoritmos de cálculo para los
equipos. Cada uno se considera como un elemento independiente. La simulación de un proceso se efectúa armando una
secuencia de llamadas a los algoritmos que representan los equipos. La secuencia de transformaciones físicas y químicas
115
en los procesos, a su paso por los equipos, así como el flujo de los materiales se indica en un esquema llamado diagrama
del proceso, dicho diagrama representa el modelo del proceso. La construcción de los diagramas de proceso es una de
las actividades más importantes en el uso de los simuladores.
Los simuladores de procesos químicos cuenta con un número determinado de módulos que calculan los procedimientos
de las operaciones unitarias, destiladores, reactores, cambiadores de calor y otros equipos. Estos procedimientos de
cálculo forman el corazón de los simuladores. Además se tiene un conjunto de procedimientos para calcular las
propiedades termo físicas y cinéticas que se requieran en los módulos de cálculo de las operaciones unitarias. Para la
construcción de los diagramas de proceso y la selección de los procedimientos de cálculo de las propiedades
termodinámicas se cuenta con protocolos de comunicación para el acopio de datos a través de ventanas y menús. De
igual manera se emplean menús para definir las sustancias a emplear y los parámetros de operación de los equipos. El
diagrama de proceso se construye directamente en la pantalla del monitor de la computadora o Tablet uniendo las
figuras o iconos que representan a los equipos. La estructura de un simulador de procesos químicos se muestra en la
Figura 8.1 que indica cómo se relacionan los bloques de los algoritmos de cálculo de las operaciones unitarias con los
bloques de cálculo de las propiedades termodinámicas y los procedimientos de cálculo de convergencia. Todos estos
bloques coordinados por programa ejecutivo del simulador.
Programa ejecutivo
El simulador PRO/II es un software comercial que calcula balances de materia y energía de una cantidad de equipos de
procesos químicos. Dispone de modelos matemáticos de las principales operaciones unitarias y reactores así como de
múltiples ecuaciones de estado para el cálculo de equilibrios químicos y físicos.
116
En esta sección se describen las principales ventanas y menús del simulador, para ilustrar el uso del simulador,
se usa como ejemplo la simulación paso a paso del diseño del proceso de des alquilación del tolueno para obtener
benceno.
Se aplican la información del libro de J. M. Douglas. Conceptual Design of Chemical Process, de acuerdo a los
siguientes datos.
Alimentación de hidrógeno: T:100 °F, P: 535 psia, Flujo Molar: 492.5 lbmol/h, 95% H2 y 5% de CH4.
Alimentación de tolueno: T:100 °F, P: 535 psia, Flujo Molar: 279.4 lbmol/h, tolueno puro.
Caída de presión en los equipos: 0.5 psia.
Condición de la corriente de salida del precalentador de la carga: Totalmente vaporizado.
Condición de la corriente de salida del horno a la entrada del reactor: T:1150 °F.
Condición de la corriente de entrada al flash: T: 100°F.
Condición de la corriente de purga: Fracción de separación 5%.
Condición de la corriente de salida del compresor: P:535 psia. (Eficiencia del compresor 75%)
Recuperación de los componentes claves en destiladores mayor al 99%.
Se alimentan las corrientes de tolueno e hidrógeno, el tolueno ingresa puro mientras que el hidrógeno trae metano.
Estas corrientes se mezclan con las corrientes de recirculación para pasar a un cambiador de calor y entrar al reactor,
dentro de los tubos del cambiador de calor pasa el efluente del reactor. En el reactor ocurren dos reacciones, la principal
en la que el tolueno se combina con el hidrógeno para formar benceno y tolueno. En la reacción secundaria el benceno
se dimeriza para formar di fenilo. Después de ceder calor el efluente del reactor pasa por un separador de fases (flash).
La corriente de vapor del flash se divide en dos, una de las corrientes se purga del proceso, esta purga busca eliminar
parte del metano para que no se acumule en la corriente de reciclo, y la otra se recicla al reactor, pero antes pasa por un
compresor para recuperar la presión que haya perdido.
La corriente líquida del fondo del flash pasa por una válvula reductora de presión y luego ingresa a un destilador. El
destilador es una columna estabilizadora en la que se eliminan los gases que se encuentran disueltos en los aromáticos.
Los aromáticos benceno, tolueno y di fenilo salen por el fondo. Esta corriente pasa por una válvula reductora de presión
para luego ingresar a otro destilador (columna de benceno), en el cual por el domo se recupera casi todo el benceno,
que se extrae como producto y el resto de los aromáticos salen por el fondo. El fondo de la columna de benceno pasa a
una tercera columna, columna de tolueno, en la que se obtiene por el fondo el di fenilo que se extrae del proceso,
mientras que la corriente del domo se recicla al reactor, a través de una bomba.
117
5. Proveer las condiciones de operación del proceso
6. Correr la simulación.
7. Desplegar los resultados.
El PRO/II usa un código de colores para identificar si los datos que se alimentan al simulador son suficientes o
faltan. Al inicio del programa el simulador despliega un cuadro de dialogo que indica el significado de los colores, como
se muestra en la Figura 8.2.
Figura 8.2. Cuadro inicial del simulador con el significado de los colores.
Estos colores aparecen como bordes en los cuadros de dialogo, el rojo indica que se requieren datos o acciones,
el verde indica que el simulador puede dar datos por omisión y que el usuario los puede cambiar y sobre escribir. Con el
color azul indica que los datos son suministrados por el usuario y se aceptan satisfactoriamente, finalmente el amarillo
indica que los datos suministrados por el usuario están fuera de los límites normales.
Para iniciar dar clic en el botón OK. En la pantalla principal del simulador seleccionar una hoja en blanco, después
desplegar la paleta de equipos (PFD), como se muestra en la figura 8.3.
118
Figura 8.3. Inicio de una nueva hoja de trabajo y apertura de la paleta de equipos.
Antes de empezar a crear el diagrama de proceso seleccionar las unidades con el icono de unidades y tomar la opción
que se conveniente, para cerrar la ventana dar clic en OK, ver la Figura 8.4. El simulador ofrece por omisión es el sistema
inglés, puesto que el problema usa esta unidades, no se hace ningún cambio a las unidades en 8.4 (c).
(a)
(b)
( c)
Figura 8.4. Selección de las unidades. (a) Botón de unidades de medida (UOM), (b) Menú con bases de datos de las
unidades, ( c) Unidades disponibles.
119
La selección de los equipos del diagrama de proceso se toma de la paleta de operaciones PFD. Para empezar la
simulación del proceso del benceno se efectuaran los cálculos del reactor y recirculación sin el tren de destiladores. En la
Figura 8.5 se muestra como se seleccionan primero el mezclador (mixer) que servirá para combinar las corrientes de
alimentación y de reciclo. Se observa que la paleta de operaciones PFD contiene diferentes carpetas que contienen los
equipos agrupados por categorías. La carpeta general solamente contiene cinco opciones, la de corrientes (Streams),
Block Diagram, el separador de fases, Flash, el mezclador, mixer y el divisor de corrientes, splitter.
120
Figura 8.6. Selección de los equipos alrededor del reactor.
Para colocar las corrientes y conectar los equipos en el diagrama dar clic en el botón “Streams” de la paleta de
equipos. Empezar a unir los equipos de izquierda a derecha con ayuda del Mouse, como se muestra en la Figura 8.7.
Nótese que las corrientes de entrada tienen etiquetas rojas, este color indica que faltan datos en estas corrientes. En los
cambiadores de calor se tienen dos entradas y dos salidas disponibles para colocar las corrientes, en este caso se usan
sólo dos corrientes ya que se emplearan un calentador y un enfriador que usan corrientes de servicio, tanto de
calentamiento como de enfriamiento. Al activar el botón de Streams el puntero del Mouse cambia con una S. Se observa
que el flash tiene en el fondo dos salidas, se debe elegir la corriente lateral que corresponde a la salida de líquido, la otra
es para separar agua. Grabar el diagrama de simulación en la computadora.
121
Figura 8.7. Colocación de corrientes en los equipos alrededor del reactor.
Primero se oprime el botón de componentes de la lista de iconos del menú principal, “Component Selection”
(tiene la figura de una pequeña molécula de benceno) como se muestra en la Figura 8.8. Se abre una ventana de
selección de componentes y en esta se puede escribir directamente el nombre de cada componente, uno a la vez, o bien
seleccionarlos de una base de datos. Para seleccionar de la base de datos, oprimir el botón “Selection from list” y se
abre otra ventana de bases de datos “Component Family”, en la lista de las diferentes categorías de bases de datos
seleccionar la primera opción, “Most Commonly Used”. Oprimir OK para aceptar. Los componentes se pueden
seleccionar directamente de la lista, tal como aparece en la Figura 8.8, Por ejemplo para seleccionar el Benceno se
puede dar doble clic sobre el nombre o se puede dar el nombre en la caja de “Search String”. Ordenar los componentes
del más volátil al menos volátil, usando los botones a la derecha de la lista. Ver Figura 8.9.
122
Figura 8.8. Definición de la base de datos para seleccionar los componentes.
Primero se oprime el botón de datos termodinámicos (Thermodynamic Data) de la lista de iconos del menú principal,
como se muestra en la Figura 8.10. Se abre la ventana de dialogo, en esta seleccionar en la opción “Category”, la base
“Most Commonly Used”. En la caja de “Primary Method” se despliega una lista de métodos, seleccionar para este
problema el método de “Peng-Robinson” y oprimir el botón “Add->”. Se pueden seleccionar varios métodos para
emplearse en los diferentes equipos del proceso o si se desea pueden hacerse modificaciones a los procedimientos de
cálculo oprimiendo el botón “modify”.
123
Figura 8.10. Menú del botón Thermodynamic Data para la selección del modelo para los cálculos termodinámicos.
Dar doble clic sobre una de las corrientes de alimentación y se abre una ventana de dialogo, Figura 8.11. Dar clic
sobre el botón “Flowrate and Composition”, nótese que está rodeado de un rectángulo rojo, el cual indica que faltan
datos. Se abre otra ventana y de esta escoger que tipo de datos se suministran, el flujo total “Total Fluid Rates” o el flujo
individual de los componentes “Individual Component Flowrates”. Activar la primera opción y dar los datos que se
tienen del problema en la lista de los componentes como se muestra en la Figura 8.11. Primero la corriente de
hidrógeno. En la caja de la esquina superior derecha identificada como “Stream” dar el nombre de la corriente
HIDROGENO.
124
Figura 8.11. Definición de la corriente de alimentación de hidrógeno.
Se pueden cambiar los nombres de los equipos y corrientes usando el menú del Mouse, botón derecho del
Mouse, como se muestra en la Figura 8.13.
El siguiente paso es proveer las condiciones de operación en los equipos del proceso. Empezar con las
reacciones. Dar clic en el botón “Reaction Data” del menú principal, ver Figura 8.14. Dar un nombre al conjunto de
reacciones y oprimir el botón “Enter Data”. Aparece una ventana denominada “Reaction Definitions”, en esta dar los
nombres de las dos reacciones y dar clic sobre la definición de reaciones “Definition” en la primera reacción que aparece
en letras rojas como “Reactants=Products”. En la nueva ventana dar los coeficientes estequiométricos de los reactantes
y los productos según las reacciones del proceso, ver Figura 8.14. En la parte media de la ventana en la frase
“Stoichiometric Balance” aparece en rojo la frase “Does not equal” indicando que el balance no se cumple. Dar clic sobre
el letrero rojo y si la reacción se dio correctamente, se elimina el color rojo. Dar clic en OK para cerrar la ventana.
125
Figura 8.13. Cambio del nombre de las corrientes con el menú del Mouse.
Después de dar los datos de las reacciones se pueden dar las especificaciones del reactor, dando doble clic
sobre la figura del reactor. A través de las ventanas dar los datos de la conversión de las reacciones como se muestra en
la Figura 8.15. En la primera ventana oprimir el botón “Extent of Reaction” y en la segunda elegir el componente clave
para el cual se tiene la conversión de la reacción.
126
Figura 8.15. Datos de conversión de reacciones en el reactor.
A continuación dar los datos de los cambiadores de calor, por ejemplo en el cambiador a la entrada del reactor
se requiere que la corriente de carga se caliente hasta 1150 ºF, esta especificación se da de acuerdo a la Figura 8.16. En
la primera ventana oprimir el botón “Specification”, en la segunda seleccionar de la lista deslizable la opción “Hot
Product Temperature” y en la última dar el valor de 1150 ºF y dar clic en el botón OK.
127
En las especificaciones del flash activar en la segunda especificación “Second Specification” el botón “Unit
Specification” y seleccionar operación adiabatica, “Duty” con una valor cero, ver Figura 8.17.
Después que se suministraron todas las especificaciones de los equipos, el último paso de la simulación es correr
la simulación oprimiendo el botón “Run” del menú principal, ver Figura 8.18. Los colores de los equipos y corrientes
cambian a azul indicando que se procedió con la simulación satisfactoriamente.
Se pueden observar los resultados de varias formas, por ejemplo en una tabla de balance materiales, usando el
menú “Output” y la opción “Stream Property Table”, ver Figura 8.19
128
Figura 8.19. Opciones para el despliegue de tabla de resultados.
Aparece una ventana en color verde, arrastrar hasta una posición fuera del diagrama de proceso y dar doble clic
sobre esta ventana. Seleccionar las corrientes que se desean incluir en la tabla, de acuerdo a la Figura 8.20.
Los resultados se muestran en la tabla según la Figura 8.21, Se puede ajustar el tamaño de la tabla estirando las esquinas
de la misma.
129
Figura 8.21. Tabla de resultados de la simulación.
Para exportar la figura del diagrama de proceso con los resultados a una hoja de Word se usa la opción “export”
del menú “File”. En la ventana que se abre activar la opción “Flow sheet Drawing” y dar OK en el mensaje que despliega.
Ver Figura 8.22. Se le agrega un título al diagrama con el menú Draw y submenú Text.
130
Para la simulación de las columnas de destilación en la estructura de separadores se empieza por colocar una
columna para estabilizar la mezcla de aromáticos y separar el remanente de los gases incondensables, hidrógeno y
metano. Primero se inserta una válvula a la salida del líquido del fondo del flash, para reducir la presión hasta 150 psia.
Seleccionar el icono de valve en la carpeta de “Pressure Change”, ver Figura 8.23.
Luego se agrega un bloque que use los métodos cortos para diseño de columnas de destilación, “Shortcut”, de la carpeta
de opciones “Column” Activar la opción de reboiler ya que la columna solamente tendrá el hervidor o tal vez un
condensador parcial. En la Figura 8.24 se muestran las ventanas para dar esta información en PRO/II.
131
El módulo ShortCut usa el método de Fenske, Underwood y Guillilan para determinar el número mínimo de
platos teóricos del destilador así como el reflujo mínimo necesario y el plato de alimentación. Agregar las corrientes de
salida en el domo y en el fondo, renombrar como DOMO1 y FONDO1 respectivamente, unir la columna con la corriente
de salida de la válvula. Después dar doble clic sobre la columna Shortcut. Se abre una primera ventana con varias
opciones ver Figura 8.25. Dar clic en la opción “Minimum Reflux”, en la segunda ventana activar la opción “Perform
Minimum Reflux Calculation” y elegir los nombres de los componentes ligero y pesado, en el primer caso elegir al
metano, en el segundo al benceno.
Oprimir OK y en la primera ventana dar clic en la opción “Specifications”. En la segunda ventana dar clic en la palabra
“parameter” de la primera especificación. Puesto que se va a especificar una recuperación del hidrogeno y metano en el
domo de 99%, se debe introducir la ecuación
Se debe seleccionar en “parameter” la opción “Stream” y en la caja de “Stream Name” seleccionar Domo1. Luego como
parámetro para esta corriente seleccionar Flowrate y definir que se trata de componentes seleccionados, es decir el
hidrogeno y el metano. Luego en el signo de igualdad aparece una lista deslizable, de ahí tomar la opción “/”. Aparece
en rojo la palabra “parameter”, hacer lo mismo pero para la corriente S4 con los mismos componentes. Después del
signo igual escribir 0.99 y oprimir OK. Ver Figura 8.26.
132
Figura 8.26. Definición de la especificación de separación dos gases en el domo.
En la segunda especificación especificar el flujo deseado de benceno en el domo, aproximadamente 1.0 lbmol/hr, Como
se muestra en la Figura 8.27
133
Finalmente dar en la opción “Products” de la primera ventana el flujo en el domo de aproximadamente 12
lbmol/hr, este valor es una estimación por lo que no se requiere un valor exacto, Figura 8.27, y en la opción de
“Condenser/Reboiler” activar la opción “Partial Condenser Type”, cerrar la ventana dando clic en el botón OK.
Al correr la simulación el color de todos los bloques cambia a azul. Se despliegan los resultados en las corrientes
alrededor del destilador y se observa que la separación es como se especificó, ver Figura 8.28.
134
Para ver los resultados del bloque de métodos cortos activar el menú del Mouse oprimiendo el botón derecho
sobre el bloque de shortcut y en el menú dar clic en la opción “View Results”. Con esto se abre el editor de textos del
simulador desplegando los resultados como puede observarse en la Figura 8.29. En los resultados además de los flujos
calculados se puede ver el número mínimo de platos requeridos 2.36
Figura 8.29. Despliegue de resultados del bloque Shortcut con el reflujo mínimo.
Ahora hay que cambiar la columna estabilizadora que se definió con los métodos cortos por una columna de
cálculo riguroso. Primero se borra la columna de shortcut y con la paleta de equipos se elige un bloque “Distillation”.
Primero solicita el número de etapas que tendrá la columna de destilación, “Number of Theoretical Trays”, escribir 5 y
dar clic en OK. Después de unir las corrientes de entrada y salida dar doble clic sobre el icono de la columna y se abre
una ventana, Figura 8.30. Primero dar clic en el botón “Pressure Profile…” y en la ventana que se abre escribir el valor
de 150 psia en la caja de “Top Tray Pressure”, oprimir el botón OK.
Después oprimir el botón “Feeds and Products…” y en la ventana de Feeds and products escribir 1 en la caja de Feed
Tray. Agregar una estimación del flujo del producto en el domo de la columna de12 lbmol/hr, dar este valor en la caja
con el nombre de la corriente del domo, se puede ver que este es flujo que se calculó con el módulo de métodos cortos.
Al oprimir OK el PRO/II pregunta si se desea que el dato del flujo del fondo de la columna sea tomado como una
especificación de la columna, en este caso dar clic en NO, ver Figura 8.31. En el botón “Condenser” elegir un
condensador parcial.
135
Figura 8.30. Definición de la presión de operación en la columna.
El bloque de destilación del PRO/II permite hacer varias especificaciones, por ejemplo en la ventana de la Figura
8.32 se puede especificar la composición deseada de separación en vez del flujo molar. Después de correr la simulación
los resultados se pueden desplegar en una hoja de cálculo como Excel, ver figura 8.33. Para hacerlo seleccionar el menú
“Tools” y en las opciones ir a “Spreadsheet”, ahí seleccionar la opción “Component Rates”. Se abre en Excel una plantilla
con los flujos de los componentes en todas las corrientes, dejar solo las que sean de interés, como se observa en la
figura 8.33.
137
Para completar la simulación se agregan dos columnas de destilación para separar el benceno, tolueno y
difenilo. Primero se coloca una válvula a la salida del fondo de la torre estabilizadora, para reducir la presión hasta 15
psia. Después se coloca un destilador, torre de benceno, con 32 platos, con alimentación en el plato 18, presión en el
domo de 15 psia y con flujo aproximado de 265 lbmol/hr de benceno en el domo (estos datos se obtienen usando un
módulo Shortcut). En el condensador activar en la caja de “condenser Type” la opción de “Bubble Temperatura”. En el
botón de Performance specification definir una composición de benceno en el fondo de la torre de 0.05 % molar y una
relación de reflujo de 2. Por el domo se obtendrá benceno casi puro y en el fondo una mezcla de tolueno y difenilo. Esta
mezcla se pasa a otra columna, torre de tolueno, con 6 platos y alimentación en el plato 3, operando a 15 psia de
presión. En el condensador activar en la caja de “condenser Type” la opción de “Bubble Temperature”. En el botón de
Performance specification definir una composición de difenilo en el fondo de la torre de 0.999 % molar y una relación de
reflujo de 2.
Al correr la simulación se requiere dar clic varias veces en el botón “Run”. Para acelerar la convergencia de los
cálculos cambiar las especificaciones de iteraciones en reciclos con el botón del menú “Recycle Data”, ver Figura 8.34. En
la ventana de opciones de reciclo aumentar el número de iteraciones para la convergencia a 100 y activar el método de
cálculos iterativos de Wegstein, “Apply Wegstein Acceleration” y el botón de “converge only tear streams” en las
opciones de aceleración. Luego oprimir “accelerated tear streams” y se habre el menú de selección de las corrientes a
acelerar.
138
Figura 8.35. Diagrama completo de la simulación.
En la Figura 8.36 se muestra la tabla de las corrientes de entrada y salida del proceso con los resultados finales de la
simulación. Se observa que se obtienen 262.76 lbmol/hr de benceno en la corriente de benceno y 5.62 lbmol/hr de
difenilo en la corriente de difenilo. En estas dos corrientes se pierde algo de tolueno (menos de 1 lbmol/hr), por lo que
se pueden hacer cambios a las especificaciones de operación e los separadores para tratar de reducir esta perdida.
Figura 8.35. Tabla de las corrientes del proceso con resultados de la simulación.
139
Problemas
1. Compruebe las regla heurísticas: Si va a aumentar la presión de una corriente, bombeé un líquido en vez de
comprimir un gas.
Use los siguientes datos. 100,000 lb/h de etilbenceno va desde el tanque de alimentación a 25 ºC y 1 atm hasta el
reactor a 400 ºC y 5 atm. Emplear el modelo termodinámico de Peng-Robinson.
Respuestas:
Bombear un líquido
Comprimir un gas
El trabajo de compresión, 144,784.48 Hp es mucho mayor que el de bombeo, 842.07 Hp. Por lo que se
comprueba la regla heurística.
2. Se requiere simular una planta para producir metanol, el cual se obtiene a partir de las reacciones:
140
Datos de la alimentación a la planta: Flujo = 45 kmol/hr, T = 77 ºF, P = 30 psia, Composición: H2 = 69 %, CO2=7 %, CO =
21 % y CH4 = 3 %, En porcentajes molares.
El efluente del reactor debe enfriarse hasta 104 ºF para separar los productos de los gases incondensables, la
separación es en un flash adiabático. Estos gases son reciclados al reactor, el 10 % de los gases que salen del flash se
purgan para evitar altas concentraciones de metano. Los líquidos del fondo del flash, metanol y agua, principalmente
pasan a un destilador en el cual por el domo se obtiene casi todo el flujo del metanol y el resto de los gases que no se
separaron en el flash. Por el fondo del destilador se obtiene casi toda el agua que se manda a tratamiento biológico. La
columna tiene 20 platos con alimentación en el plato 8, opera a 15 psia, la composición del agua en el fondo debe ser
mayor a 98 % y la composición del metanol en el domo es superior a 80%.
Determine la simulación de la planta considerando que la caída de presión en cambiadores de calor es de 0.9 psi y que la
eficiencia de compresores es de 85%. Use el método termodinámico de NRTL, con modificación en el cálculo de entropía
usando el método de SRK.
RECICLO
1
SP1
C1
2
S7 3
METANOL
4
5
6
7
8
GASES 9
10
11
LIQUIDO
R-OUT 12
S2 13
14
M1 R-IN S1
ALIMENTACION FLASH 15
E2
E1 16
F1 V1
R1 17
18
19
T1 20 AGUA
Stream Name ALIMENTACION R-IN R-OUT GASES LIQUIDO PURGA RECICLO METANOL AGUA
Stream Description
Phase Vapor Vapor Vapor Vapor Mixed Vapor Vapor Liquid Liquid
Temperature F 77.000 106.087 641.010 104.000 103.844 104.000 104.000 -117.909 213.020
Pressure PSIA 30.000 30.000 29.100 28.200 15.000 28.200 28.200 15.000 15.000
Flowrate LB-MOL/HR 99.208 404.862 361.204 339.626 21.578 33.962 305.654 21.000 0.578
Composition
CO 0.210 0.139 0.109 0.116 0.000 0.116 0.116 0.000 0.000
H2 0.690 0.609 0.548 0.582 0.004 0.583 0.583 0.004 0.000
CO2 0.070 0.061 0.055 0.058 0.001 0.058 0.058 0.001 0.000
METHANE 0.030 0.073 0.082 0.087 0.000 0.087 0.087 0.000 0.000
METHANOL 0.000 0.109 0.183 0.145 0.782 0.145 0.145 0.804 0.000
H2O 0.000 0.008 0.023 0.011 0.212 0.011 0.011 0.190 1.000
Se tiene una mezcla de Etanol 12%, ácido acético 20% y agua 68% (porcentajes molares) a una presión de 3 atm. Para
esta mezcla se desea calcular sus propiedades físicas de cambio de fase. Determinar el punto de burbuja y el punto de
rocío. Se desea conocer el punto de los azeótropos a 0,5 atm y a 3 atm.
141
Respuestas:
142
El mejor método es el de NRTL.
143