Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Gimenez

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 75

UNIVERSIDAD DE BUENOS AIRES

Facultad de Ciencias Exactas y Naturales


Departamento de Matemática

Tesis de Licenciatura

COMPLEJIDAD DE ALGORITMOS PARA LA


INTERPOLACIÓN POLINOMIAL EN VARIAS
VARIABLES

Nardo Giménez

Director: Guillermo Matera.

Fecha de Presentación: 26 de Julio de 2007.


Agradecimientos

Deseo expresar mi agradecimiento a Guillermo Matera y Pablo Solernó, por su


paciencia y dedicación a lo largo de este trabajo, que no hubiera sido posible sin ellos.
Quiero agradecer además a Joos Heintz, cuya influencia es manifiesta en el carácter de
esta tesina.
A Cecilia, el Amor de mi vida, que estuvo a mi lado en todas las circunstancias, y
que fue y será mi musa inspiradora.
A mi querida familia, mis padres Guillermo y Alfreda y mi hermano Julián, que
siempre me acompañaron y alentaron a continuar en el camino elegido, aun en momentos
de incertidumbre y dificultad.
A todos ellos agradezco por haber considerado mis estudios como parte de su propio
proyecto.
Quiero agradecer por último a mis amigos incondicionales que de distintos modos
estuvieron presentes en estos años, Sebastián Borrachia, Alberto Penas, Jorge Flolasco
y Andrés Racket.

ii
iii
Resumen

El tema principal de esta tesina es la interpolación polinomial multivariada consi-


derada desde el punto de vista algorı́tmico.
En la primera mitad del trabajo se estudia el problema de la interpolación poli-
nomial multivariada cuando el conjunto de nodos es una Q–variedad algebraica afı́n
0–dimensional V de Cn , que se supone dada en forma implı́cita por un sistema de
ecuaciones polinomiales F1 = 0, . . . , Fn = 0 con coeficientes en Q. A partir de estos
polinomios se construye un subespacio de interpolantes ΠV de “bajo grado”. Final-
mente se considera una versión algorı́tmica de este problema, basada en el modelo de
computación de los straight–line programs.
En la segunda mitad del trabajo se obtienen cotas inferiores de complejidad para
ciertos problemas de interpolación. Para tal fin se fija un modelo para procesos de
interpolación, que permite modelizar además de los problemas de interpolación clásicos,
otros problemas de interpolación que presentan “singularidades”. Además, se conside-
ran fenómenos de coalescencia, a través de la noción de robustez para algoritmos que
resuelven problemas de interpolación. En este contexto, básicamente obtenemos cotas
inferiores en términos del número de nodos involucrados, y cotas inferiores en términos
del costo de la “longitud” de la representación de los interpolantes.

iv
Índice general

Resumen IV

1. Introducción 1

2. Preliminares 5
2.1. Geometrı́a algebraica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1. Variedades algebraicas . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2. Conjuntos y aplicaciones construibles . . . . . . . . . . . . . . . 6
2.1.3. Morfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Resolución geométrica de una variedad de dimensión 0 . . . . . . . . . 8

I Interpolación implı́cita 11
3. Bezoutianos e interpolación multivariada 13
3.1. Fórmula de interpolación de Kronecker . . . . . . . . . . . . . . . . . . 14
3.1.1. Fórmula de interpolación de Kronecker en una variable . . . . . 16
3.2. Bezoutianos y trazas en álgebras
0-dimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2.1. Bezoutianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2.2. Trazas en álgebras 0-dimensionales . . . . . . . . . . . . . . . . 18

4. Construcción del espacio de interpolantes 21

5. Cálculo del polinomio interpolante 25


5.1. Estructuras de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
5.2. Algunos resultados básicos de complejidad . . . . . . . . . . . . . . . . 26
5.2.1. Operaciones aritméticas con polinomios univariados . . . . . . . 26
5.2.2. Cálculo del determinante . . . . . . . . . . . . . . . . . . . . . . 28
5.2.3. La complejidad del cálculo de la resolución geométrica de una
Q-variedad 0-dimensional . . . . . . . . . . . . . . . . . . . . . 28
5.3. Cálculo de la base del espacio de interpolantes . . . . . . . . . . . . . . 28

v
5.4. Cálculo de los coeficientes . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.4.1. Cálculo del jacobiano . . . . . . . . . . . . . . . . . . . . . . . . 34
5.4.2. Inversión del jacobiano . . . . . . . . . . . . . . . . . . . . . . . 35
5.4.3. Cálculo de las trazas . . . . . . . . . . . . . . . . . . . . . . . . 35
5.5. Estimación de complejidad del algoritmo completo . . . . . . . . . . . . 37

II Cotas inferiores 39

6. Un modelo para procesos de interpolación 41


6.1. Algoritmos para familias de problemas de interpolación . . . . . . . . . 41
6.2. Tres ejemplos crı́ticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
6.2.1. Interpolación de Lagrange univariada . . . . . . . . . . . . . . . 43
6.2.2. Interpolación univariada de Lagrange-Hermite de un polinomio fijo 43
6.2.3. Interpolación de Lagrange-Hermite bivariada sobre la curva X 3 −
Y2 =0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.2.4. Un ejemplo no lineal: sucesiones de identificación e interpolación 46
6.3. Complejidad de una familia de problemas de interpolación . . . . . . . 47

7. Algoritmos robustos de interpolación 49


7.1. Hechos básicos de la teorı́a de places . . . . . . . . . . . . . . . . . . . 49
7.2. La noción de robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.2.1. Robustez bajo restricción . . . . . . . . . . . . . . . . . . . . . . 52
7.3. Ejemplos de algoritmos robustos . . . . . . . . . . . . . . . . . . . . . . 54
7.3.1. Interpolación de Lagrange y de Lagrange–Hermite univariada clásica:
ejemplos 6.2.1 y 6.2.2 . . . . . . . . . . . . . . . . . . . . . . . . 54
7.3.2. Robustez en puntos singulares: ejemplo 6.2.3 . . . . . . . . . . . 54
7.3.3. Robustez de algoritmos para interpolar polinomios codificados
por sus valores: ejemplo 6.2.4 . . . . . . . . . . . . . . . . . . . 55

8. Cotas inferiores de complejidad para algoritmos robustos 57


8.1. Problemas de interpolación de Lagrange . . . . . . . . . . . . . . . . . 57
8.1.1. Familias codificadas por un abierto de Zariski no vacı́o en el es-
pacio afı́n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
8.1.2. Una familia codificada por el gráfico de una aplicación polinomial 58
8.2. Polinomios codificados por sus valores: la reconstrucción es difı́cil . . . 61

Bibliografı́a 67

vi
Capı́tulo 1

Introducción

En esta tesina estudiamos el aspecto algorı́tmico de la interpolación polinomial


multivariada. Fı́jese n ∈ N y denotemos con Π := C[X1 , . . . , Xn ] al anillo de polinomios
en las indeterminadas X1 , . . . , Xn con coeficientes en C. En la Parte I partimos de la
consideración del siguiente problema de interpolación de Lagrange:

Problema 1 El problema de interpolación de Lagrange (lineal y genérico) en los nodos


x(1) , . . . , x(δ) ∈ Cn definido en un subespacio O ⊂ Π, consiste en hallar para cada
conjunto ordenado de valores y1 , . . . , yδ ∈ C un polinomio P (un interpolante) “simple”
en O, que verifique las condiciones de interpolación P (x(j) ) = yj (1 ≤ j ≤ δ).

Al contrario que en el caso univariado, donde el subespacio de interpolantes canónico


O es el conjunto de polinomios de grado a lo sumo δ − 1, en el caso multivariado la
elección del subespacio O, depende fuertemente de las propiedades impuestas a los
interpolantes [9, Introduction]. La noción de simplicidad del interpolante P se precisa
según el contexto, pero en términos generales significa que P posee buenas propiedades
con respecto a posibles aplicaciones. Por ejemplo, para que la interpolación polinomial
sea útil como método de aproximación es necesario evitar que el interpolante tenga
grandes oscilaciones. Siendo el grado del polinomio lo que causa dichas oscilaciones, un
requerimiento generalmente adoptado es que P tenga grado “bajo”([9, Introduction],
[16, 3.2, 3.1].) ası́ pues, vamos a preocuparnos de controlar el grado del interpolante.
Usualmente los nodos y los valores que definen el problema de interpolación son
dados explı́citamente. Por otra parte ya en 1865 Kronecker [26] investigó la interpo-
lación cuando el conjunto de nodos es el conjunto de ceros de un sistema de ecuaciones
polinomiales y de hecho empleó dichas ecuaciones para construir el polinomio inter-
polante, aunque todavı́a suponiendo el conocimiento de los nodos. Inspirados en la idea
de Kronecker nosotros consideramos un problema de interpolación implı́cita, en donde
únicamente se supone el conocimiento de las ecuaciones que definen los nodos. Más
precisamente, vamos a considerar la siguiente reformulación del Problema 1:

1
Problema 2 Sean dados polinomios F1 , . . . , Fn en Q[X1 , . . . , Xn ] tales que el conjunto
de ceros del sistema de ecuaciones F1 (x) = 0, . . . , Fn (x) = 0 es el conjunto de nodos V =
{x(1) , . . . , x(δ) } ⊂ Cn . Asimismo supongamos dado un polinomio F ∈ Q[X1 , . . . , Xn ]. El
problema de la interpolación de Lagrange (implı́cita) consiste en hallar un polinomio
P ∈ Q[X1 , . . . , Xn ] “simple” tal que P (x(i) ) = F (x(i) ) para 1 ≤ i ≤ δ.

Ahora los datos de entrada, esto es, los polinomios F1 , . . . , Fn y F , se pueden repre-
sentar a partir de parámetros racionales de los cuales obtenemos el polinomio interpo-
lante P de F mediante un número finito de operaciones racionales. En efecto, a partir
de estos polinomios construimos una base (G1 , . . . , Gδ ) de polinomios en Q[X1 , . . . , Xn ]
de grados a lo sumo n(d − 1), donde d es una cota a priori para los grados de los
polinomios F1 , . . . , Fn , y tales que generan un subespacio de interpolantes O := ΠV
para el problema en consideración. Luego se calculan las coordenadas del interpolante
P ∈ ΠV en dicha base, por medio de un algoritmo probabilı́stico cuyo costo depende
linealmente del costo de evaluar los polinomios de entrada y cuadráticamente de un
invariante geométrico asociado al sistema de entrada, que denominamos el grado del
sistema (Teorema 5.18). Este grado está siempre acotado por el número de Bézout del
sistema de entrada (el producto de los grados de los polinomios F1 , . . . , Fn ) y en ciertos
casos de interés práctico resulta considerablemente menor que éste. En este sentido,
nuestro algoritmo mejora significativamente el costo de los algoritmos que utilizan bases
de Gröbner.
En la Parte II estudiamos la complejidad de resolver familias de problemas de inter-
polación. Para tal fin fijamos un modelo para los procesos de interpolación. En éste, la
familia de problemas de interpolación está codificada por un subconjunto construible
D de un cierto espacio ambiente afı́n. Aquı́, las coordenadas de un código d ∈ D se
interpretan como la lista de nodos/valores que definen un problema de interpolación
particular. Un algoritmo de interpolación que resuelve la familia de problemas está dado
por una codificación del espacio de interpolantes, mediante un constructible D∗ y por
una aplicación racional Ψ de D en la estructura de datos D∗ . La complejidad del algo-
ritmo Ψ se define entonces como la dimensión del espacio ambiente donde está incluida
la estructura de datos D∗ que codifica las salidas del algoritmo. Ası́ pues, nuestro obje-
tivo es obtener cotas inferiores de complejidad para la representación de las salidas (es
decir, los interpolantes) de algoritmos de interpolación que resuelven (genéricamente)
familias de problemas de interpolación.
Considérese, por ejemplo, la clásica familia de problemas de interpolación de La-
grange con N nodos. Esta familia de problemas está representada por la estructura de
datos D := {(ξ1 , y1 , . . . , ξN , y1 ) ∈ C(n+1)N : ξi ∈ Cn , yi ∈ C para 1 ≤ i ≤ N, ξi 6=
ξj , para 1 ≤ i < j ≤ N} ⊂ C(n+1)N , de modo que cada punto d := ((ξ1 , y1 , . . . , ξN , y1 ) ∈
D determina un problema de interpolación de Lagrange que consiste en hallar un poli-
nomio interpolante P ∈ C[X1 , . . . , Xn ] que verifique P (ξi ) = yi para 1 ≤ i ≤ N .
Obsérvese que en este caso la estructura de datos D es un subconjunto denso Zaris-

2
ki del espacio afı́n C(n+1)N . Esta es la situación tı́pica de muchas otras familias de
problemas de interpolación clásicas.
Ahora bien, es un hecho que, fijando una complejidad de representación para el
aproximante de una función dada, los espacios no lineales proveen aproximantes con
mejores calidades aproximativas que las obtenidas con aproximantes tomados de espa-
cios lineales (véase [38, 5.8 y 5.9]). Por otra parte, la interpolación polinomial constituye
uno de los métodos más simples de aproximación. Por tales motivos, nosotros consi-
deramos, más generalmente, familias de problemas de interpolación cuyas estructuras
de datos son subconjuntos construibles D de dimensión estrictamente menor que la
dimensión del espacio afı́n donde están incluidos, y aun con presencia de puntos sin-
gulares, pues tı́picamente las familias de problemas de interpolación no lineales están
representadas por estructuras de datos de este tipo (Ejemplo 6.2.4).
El primer resultado que obtenemos demuestra que toda familia de problemas de
interpolación de Lagrange con un número fijo de nodos codificada por un conjunto
abierto Zariski tiene esencialmente la complejidad del método usual de interpolación
lineal univariado, es decir, el número de nodos (Teorema 8.1).
Con el fin de obtener cotas inferiores de complejidad para las familias de problemas
de interpolación no lineales introducidas en los Ejemplos 8.1.2 y 6.2.4, suponemos que
los algoritmos de interpolación son robustos. Esencialmente Ψ es un algoritmo robusto
de interpolación, si admite una única extensión a toda instancia de la familia de proble-
mas donde Ψ no está definida. Nosotros formalizamos la noción de robustez mediante la
teorı́a de places de la geometrı́a algebraica y el álgebra conmutativa. El resultado más
importante que obtenemos en este contexto es la cota inferior para la familia de proble-
mas del Ejemplo 6.2.4. En este ejemplo el espacio de interpolantes es el conjunto On,L
de polinomios n-variados que se pueden evaluar mediante un straight-line program de
longitud no escalar a lo sumo L. Consideramos la familia de problemas de interpolación
que consiste en reconstruir un polinomio f ∈ On,L a partir de sus valores en suficientes
nodos (un sucesión de identificación). En este caso obtenemos una cota inferior que
depende exponencialmente del número de nodos (Teorema 8.3).

3
4
Capı́tulo 2

Preliminares

2.1. Geometrı́a algebraica


Uno de los aspectos del método de interpolación que desarrollamos en la Parte
I de este trabajo es el uso de las propiedades geométricas del conjunto de nodos en
consideración. Por esta razón, comenzamos repasando algunas nociones básicas de la
geometrı́a algebraica.

2.1.1. Variedades algebraicas


Sea k := Q o C. Un subconjunto V ⊆ Cn se llama una k–variedad (algebraica) afı́n
de Cn (brevemente una k–variedad) si existen polinomios F1 , . . . , Fs en k[X1 , . . . , Xn ]
tales que
V = {x ∈ Cn : F1 (x) = 0, . . . , Fs (x) = 0}.
Denotamos esto brevemente con V = V (F1 , . . . , Fs ). Una k–variedad V := V (F ) defini-
da por un solo polinomio F no constante se llama una hipersuperficie.
Las k–variedades afı́nes de Cn son los conjuntos cerrados de la topologı́a de Cn
llamada la topologı́a de Zariski sobre k. Cada k–variedad V ⊆ Cn se considera equipada
con la topologı́a inducida por la topologı́a de Zariski de Cn . Una k–variedad V ⊆ Cn se
dice irreducible si es un espacio topológico irreducible con esta topologı́a. Es decir, V es
irreducible si no se puede expresar como una descomposición irredundante V = V1 ∪ V2 ,
donde V1 , V2 son k–variedades. Toda k–variedad tiene una única (salvo reordenamientos)
descomposición irredundante como unión finita de k–variedades irreducibles V = C1 ∪
· · · ∪ Ch . Las k–variedades C1 , . . . , Ch se denominan las componentes irreducibles de V .
Dada una k–variedad V ⊆ Cn , su ideal asociado I(V ) es el ideal de k[X1 , . . . , Xn ]
formado por todos los polinomios que se anulan idénticamente sobre V . El anillo de
coordenadas k[V ] de V se define como el anillo cociente k[X1 , . . . , Xn ]/I(V ). Se tiene
que V es irreducible si y solo si k[V ] es ı́ntegro. En tal caso el cuerpo de fracciones k(V )

5
de k[V ] se denomina el cuerpo de funciones racionales de V . Si V es una k–variedad
irreducible, la dimensión de V se define como el máximo m ≥ 0 tal que existe una
cadena V0 ⊂ . . . ⊂ Vm = V donde Vi es una k–variedad irreducible para todo 0 ≤ i ≤ m.
Equivalentemente, la dimensión de V puede definirse como el grado de trascendencia de
la extensión de cuerpos k ,→ k(V ). La dimensión de una k–variedad arbitraria V ⊆ Cn
se define como el máximo de las dimensiones de sus componentes irreducibles. Una k–
variedad se dice equidimensional si todas sus componentes irreducibles tienen la misma
dimensión. En particular una, k–variedad V es de dimensión cero, o 0–dimensional, si
y solo si V es un conjunto finito. Los conjuntos de nodos que vamos a considerar para
los problemas de interpolación en la Parte I son Q–variedades 0–dimensionales.
Si V es irreducible, definimos su grado gr (V ) como el máximo número de puntos
en la intersección de V con un subespacio lineal afı́n L de An de codimensión dim V ,
para el cual se verifica #(V ∩ L) < ∞. Más generalmente, si V = C1 ∪ · · · ∪ CN es
la descomposición de una variedad afı́n arbitraria
PN V en componentes irreducibles sobre
C, definimos el grado de V como gr (V ) := i=1 gr (Ci ) (véase [22]). En lo que sigue
usaremos la siguiente desigualdad de Bézout ([22]; véase también [15], [37]): si V y W
son subvariedades de An , entonces vale la siguiente desigualdad:

gr (V ∩ W ) ≤ gr (V ) gr (W ). (2.1)

2.1.2. Conjuntos y aplicaciones construibles


Una k–variedad algebraica afı́n V ⊆ Cn también se llama una variedad k–definible
o k–construible. Más generalmente, un subconjunto X ⊆ Cn es k–construible si es una
combinación Booleana (f inita) de k–variedades algebraicas afines de Cn . Equivalente-
mente, X es una unión disjunta V1 ∪ · · · ∪ Vk , donde Vi es de la forma Vi = Vi0 \ Vi00 ,
siendo Vi0 , Vi00 k–variedades de Cn con Vi00 ⊆ Vi0 .
Asimismo, una aplicación ϕ : X → Y entre conjuntos construibles se dice k–
construible si su gráfico es un subconjunto k–construible de Cn × Cm .

2.1.3. Morfismos
Sean V ⊆ Cn y W ⊆ Cm dos k–variedades. Una aplicación f : V → W se llama
un morfismo regular (k–definible) si existen m polinomios f1 , . . . , fm en k[X1 , . . . , Xn ]
tales que f (x) = (f1 (x), . . . , fm (x)) para todo x ∈ V . Un morfismo regular f : V → W
es un isomorfismo si tiene inversa, es decir, si existe un morfismo regular g : W → V
tal que f ◦ g = IdV y g ◦ f = IdW .
Ahora sea V ⊆ Cn una k–variedad irreducible, y sea f ∈ k(V ) una función racional.
Se dice que f está definida en un punto x ∈ V si existe una representación f = h/g,
con h, g en k[V ], tal que g(x) 6= 0. El conjunto de todos los puntos x ∈ V tales

6
que f está definida en x se denomina el dominio de definición de f y es un abierto
denso de V . Un morfismo racional f : V 99K Cm está definido por una sucesión de
funciones racionales f1 , . . . , fm en k(V ). El dominio de definición de f se define como
la intersección de los dominios de definición de todas las fi , se nota domf y es un
abierto denso de V . Ası́, el morfismo f es una aplicación parcialmente definida tal que
f (x) := (f1 (x), . . . , fm (x)) para todo x en el dominio de definición de f . Un morfismo
racional f : V 99K Cm se llama regular si domf = V . La imagen de f se define como el
conjunto de los valores f (x) con x en el dominio de definición de f y se nota im f .
Sean V ⊆ Cn y W ⊆ Cm dos k–variedades irreducibles. Un morfismo racional
f : V 99K W es un morfismo racional f : V → Cm tal que f (x) ∈ W para todo x en el
dominio de definición de f .
Sean f : V 99K W un morfismo racional. Supóngase que f está dada por funciones
racionales f1 , . . . , fm ∈ k(V ). Entonces f induce un homomorfismo de anillos

f ∗ : k[W ] → k(V )

definido por f ∗ (F̄ ) := F (f1 , . . . , fm ) (obsérvese que f ∗ está bien definida pues imf ⊆
W ). Puesto que im f es la imagen del conjunto irreducible dom f , se sigue que la
clausura im f es un subconjunto cerrado irreducible de W . En consecuencia el ideal P
de k[W ] asociado a im f es un ideal primo. Por otra parte es claro que el núcleo de f ∗
es precisamente el ideal P. Sea k[W ]P el anillo local asociado al ideal P. Entonces f ∗
admite una única extensión

f ∗ : k[W ]P → k(V ).

Sea g : W 99K Cl otro morfismo racionale tal que im f ∩ dom g 6= ∅. Sean g1 , . . . , gl ∈


k(W ) las funciones racionales que definen a g. La hipótesis im f ∩dom g 6= ∅ es quivalente
a gi ∈ k[W ]P para todo i. Las funciones racionales f ∗ (g1 ), . . . , f ∗ (gl ) ∈ k(V ) definen
entonces un morfismo racional g ◦ f : V 99K Cl que se llama la composición de f
con g. Obsérvese que por construcción f −1 (dom g) ⊆ dom (g ◦ f ) y que para todo
x ∈ f −1 (dom g) vale (g ◦ f )(x) = g(f (x)).
En particular, si la imagen de f es un subconjunto denso de W , la aplicación racional
f : V 99K W se llama dominante, y f se puede componer con toda otra aplicación
racional g : W 99K Cl . Un morfismo racional dominante f : V → W se denomina un
morfismo biracional si es inversible, esto es, si existe un morfismo racional dominante
g : W → V tal que se verifican las identidades g ◦ f = IdU1 y f ◦ g = IdU2 en abiertos
Zariski U1 de V y U2 de W respectivamente.

7
2.2. Resolución geométrica de una variedad de di-
mensión 0
En esta sección, sea k := Q el cuerpo base de la topologı́a Zariski. Nuestro prin-
cipal objetivo en esta sección es mostrar que toda Q–variedad 0–dimensional V de un
espacio afı́n Cn para n arbitrario se puede parametrizar por los ceros de un polinomio
univariado con coeficientes racionales. Es sabido que toda Q–variedad equidimensional
de dimensión r es biracionalmente equivalente a una Q–hipersuperficie [35, Chapter I,
§ 3, Theorem 6] de Cr+1 . Más aun, una Q–variedad 0–dimensional es isomorfa a una
Q–hipersuperficie de C1 , es decir, el conjunto de ceros de un polinomio con coeficien-
tes racionales, hecho que demostraremos a continuación. En estos términos, tenemos la
siguiente definición preliminar:

Definición 2.1 Resolver geométricamente una Q–variedad 0–dimensional V significa


hallar un polinomio en Q[T ] que define una hipersuperficie de C1 birracionalmente
equivalente a V y los polinomios que determinan el isomorfismo entre V y el conjunto
de ceros de ese polinomio.

El concepto central aquı́ es el de elemento primitivo, que es una herramienta común-


mente usada en el ámbito del Cálculo formal para la resolución simbólica de sistemas
de ecuaciones polinomiales 0-dimensionales, pues reduce la resolución de los mismos a
cómputos en una sola variable.
Sea entonces V ⊆ Cn una Q–variedad afı́n de dimensión cero e I := I(V ) su
ideal asociado. De ahora en adelante, sea B el anillo de coordenadas de V , es decir,
la Q–álgebra Q[X1 , . . . , Xn ]/I. Es sabido que cuando la variedad V es 0–dimensional,
B resulta un Q–espacio vectorial de dimensión finita [7, Theorem 2.10]. Más aun, la
dimensión dimQ B coincide con la cardinalidad δ de la variedad V .
Un polinomio G ∈ Q[X1 , . . . , Xn ] se dice separante de un conjunto finito V :=
{x(1) , . . . , x(δ) } ⊆ Cn , o que separa los puntos de V , si se verifica G(x(i) ) 6= G(x(j) ) para
todo par de puntos x(i) y x(j) distintos de V . En el siguiente lema se afirma que siempre
existe una forma lineal separante de cualquier conjunto finito.

Lema 2.2 Sea V := {x(1) , . . . , x(δ) } ⊆ Cn un conjunto finito de puntos. Entonces existe
una forma lineal U = λ1 X1 + · · · + λn Xn ∈ Q[X1 , . . . , Xn ] separante de V .

Demostración: Sean U1 , . . . ,Un nuevas indeterminadas sobre C y sea f ∈ Q[U1 , . . . ,Un ,


X1 , . . . , Xn ] el polinomio f := U1 X1 + · · · + Un Xn . Para cada 1 ≤ i ≤ δ consideramos la
(i) (i)
forma lineal fi := U1 x1 +· · ·+Un xn ∈ C[U1 , . . . , Un ] en las variables U1 , . . . , Un , que se
obtiene al especializar las variables X1 , . . . , Xn del polinomio f en las coordenadas del
(i) (i)
punto x(i) = (x1 , . . . , xn ) de V . Para todo i 6= j esQx(i) 6= x(j) , con lo cual fi −fj es una
forma lineal no nula en C[U1 , . . . , Un ]. Luego ∆ := i<j (fi −fj ) es un polinomio no nulo

8
en C[U1 , . . . , Un ]. Ahora bien, siendo Q un subconjunto infinito de C, existe una n-tupla
(λ1 , . . . , λn ) ∈ Qn tal que ∆(λ1 , . . . , λn ) 6= 0. Sea U ∈ Q[X
Q 1 , . . . , Xn ] la forma lineal
U := λ1 X1 + · · · + λn Xn . Se concluye que ∆(λ1 , . . . , λn ) = i<j (U (x(i) ) − U (x(j) )) 6= 0,
o equivalentemente, U (x(i) ) 6= U (x(j) ) para todo i 6= j.

Cabe mencionar que la construcción de una forma lineal separante se puede hacer en
forma efectiva mediante un algoritmo probabilı́stico conocido como el test de Schwartz–
Zippel. Más precisamente, dada una probabilidad admisible µ, existe un subconjunto
finito de Cn , tal que la probabilidad de que un elemento seleccionado al azar de ese
conjunto con distribución uniforme, sea la n–tupla de coeficientes de una forma lineal
separante, es mayor que µ (para más detalles ver [34], [40], [38, Lemma 6.44]).
En consecuencia, podemos dar la siguiente definición:
Definición 2.3 Sea V ⊆ Cn una Q–variedad 0-dimensional. Un elemento primitivo de
V es la imagen u en B de una forma lineal U = λ1 X1 + · · · + λn Xn ∈ Q[X1 , . . . , Xn ]
separante de V .
Sea ahora EndQ (B) el conjunto de endomorfismos Q–lineales de B dotado con la es-
tructura de Q–álgebra mediante las operaciones usuales de multiplicación por escalares,
suma y composición de funciones. A cada elemento g ∈ B asociamos la homotecia
ηg : B → B definida por la multiplicación por g, es decir, ηg (f ) := gf para todo f ∈ B.
Ası́ pues, ηg es un elemento de EndQ (B), y como B es de dimensión finita δ, está definido
el polinomio minimal de ηg en Q[T ], notado qg , mónico y con grado gr(qg ) ≤ δ. Lla-
mamos a qg simplemente el polinomio minimal de g. De este modo, se tiene definida
una aplicación η : B → EndQ (B), g 7→ ηg , que claramente es un morfismo inyectivo
de Q–álgebras. De aquı́ deducimos que el polinomio minimal qg de g es el polinomio
mónico q ∈ Q[T ] de menor grado que anula a g en B, es decir, tal que q(g) = 0 en B.
De este modo obtenemos la siguiente caracterización del polinomio minimal:
Lema 2.4 Sea V ⊆ Cn una Q–variedad 0–dimensional. Entonces el polinomio min-
imal qu ∈ Q[T ] de un elemento primitivo u de V inducido por una forma lineal
U ∈ Q[X1 , . . . , Xn ] tiene grado δ = #(V ) y tiene todas sus raı́ces simples. En for-
ma explı́cita se tiene:
δ
Y
qu (T ) = (T − U (x(j) )).
j=1

Demostración: Sabemos que qu (u) = 0 en B, con lo cual se verifica qu (U (x(j) )) = 0


para todo punto x(j) ∈ V . Es decir que el conjunto {U (x(j) ) : x(j) ∈ V } está incluı́do en
el conjunto de raı́ces de qu . Por otro lado, como U separa los puntos de V , obtenemos
la igualdad de cardinales:
#{U (x(j) ) : x(j) ∈ V } = #V = δ.

9
Por lo tanto, como en principio gr(qu ) ≤ δ, el conjunto de raı́ces de qu debe ser
exactamente {U (x(j) ) : x(j) ∈ V } y la conclusión del lema es inmediata.
Consideremos ahora el subconjunto algebraico Hu de C determinado por el conjunto
de ceros del polinomio minimal de u, es decir, Hu := {ξ ∈ C : qu (ξ) = 0}. Siendo qu
libre de cuadrados, el anillo de coordenadas de Hu es el anillo cociente Au := Q[T ]/(qu ).
Ahora bien Au es una Q–álgebra monógena generada por la imagen t en Au de la inde-
terminada T , lo que denotamos escribiendo Au = Q[t]. Se tiene el siguiente corolario:
Corolario 2.5 Los anillos de coordenadas B y Au son Q–álgebras isomorfas por medio
de un isomorfismo que aplica u en t.

Demostración: Afirmamos que B es una Q–álgebra monógena con generador u. En


efecto, como gr(qu ) = δ, el conjunto {1, u, . . . , uδ−1 } es linealmente independiente sobre
Q y por lo tanto una Q–base de B. Ası́ pues, B = Q[u] y Au = Q[t] son Q–álgebras
monógenas cuyos generadores respectivos, u y t, poseen el mismo polinomio minimal
qu ∈ Q[T ]. Esto implica el enunciado del corolario.
El Corolario 2.5 admite una interpretación geométrica en los siguientes términos.
Tomemos una forma Q–lineal U = λ1 X1 +· · ·+λn Xn cuya imagen u en B es un elemento
primitivo de V . Como {1, t, . . . , tδ−1 } es una base del Q–espacio vectorial Au , entonces
para todo i con 1 ≤ i ≤ n existe un único polinomio vi (T ) ∈ Q[T ] de grado a lo sumo
δ − 1 tal que el elemento vi (t) de Au se aplica en el elemento X̄i de B (donde X̄i denota
la clase residual de la indeterminada Xi ), o equivalentemente, tal que Xi − vi (U ) se
halla en el ideal I. Entonces U induce el morfismo regular
U : Cn → C,
(x1 , . . . , xn ) 7→ (λ1 x1 + · · · + λn xn ),
que define un isomorfismo entre V y Hu . Es claro que el morfismo inverso de U viene
dado por U −1 (T ) = (v1 (T ), . . . , vn (T )). En tal caso se dice que los polinomios v1 , . . . , vn
parametrizan la variedad V , por los ceros de Hu .
Ahora estamos en condiciones de definir en forma precisa la noción de resolución
geométrica de una variedad 0–dimensional (Compárese con [20], [31], [18], [19]).
Definición 2.6 Sea V ⊆ Cn una Q–variedad 0–dimensional e I su ideal asociado. Los
siguientes ı́tems definen una resolución geométrica de la variedad V :
Una forma Q–lineal U = λ1 X1 +· · ·+λn Xn cuya imagen u en B := Q[X1 , . . . , Xn ]/I
es un elemento primitivo de V .
El polinomio minimal mónico qu ∈ Q[T ] de u.
La parametrización de V dada por polinomios v1 , . . . , vn en Q[T ] tales que Xj −
vj (U ) ∈ I y gr(vi ) < gr(qu ) para todo 1 ≤ j ≤ n.

10
Parte I

Interpolación implı́cita

11
Capı́tulo 3

Bezoutianos e interpolación
multivariada

Nuestro algoritmo se deriva esencialmente de un método de interpolación multiva-


riada expuesto por Kronecker en [26] (véase también [17]), que explicaremos a conti-
nuación.
Como es sabido, el método de Lagrange consiste en construir para un conjunto dado
de nodos t(1) , . . . , t(δ) ∈ C una “base de Lagrange”

k=1,k6=j (T − t(k) )
Pj (T ) = Qδ , 1 ≤ j ≤ δ,
(j) − t(k) )
k=1,k6=j (t

del espacio de polinomios Πδ−1 . Estos polinomios verifican Pj (t(k) ) = 0 si j 6= k y


Pj (t(k) ) = 1 si j = k, de modo que el polinomio P que interpola los valores f (t(1) ), . . . ,
f (t(δ) ) ∈ C se escribe P = δj=1 f (t(j) )Pj .
P
El método de interpolación de Kronecker generaliza esta construcción al caso mul-
tivariado de modo que para cada conjunto de nodos x(1) , . . . , x(δ) ∈ Cn se hallan
polinomios P1 , . . . , Pδ en C[X1 , . . . , Xn ] que forman una base de un espacio de inter-
polantes tal que, como en el P caso univariado, el polinomio que interpola los valores
F (x ), . . . , F (x ) se escribe δj=1 F (x(j) )Pj .
(1) (δ)

Por otro lado, a diferencia del método de Lagrange, que se aplica a un conjunto
arbitrario de nodos, el método de Kronecker asume que el conjunto de nodos V ⊆ Cn
viene representado por un conjunto de polinomios F1 , . . . , Fn en C[X1 , . . . , Xn ] tales
que V = V (F1 , . . . , Fn ), y de hecho hace referencia a las ecuaciones F1 = 0, . . . , Fn = 0
para construir la antedicha base de polinomios.
Antes de explicar este método vamos a establecer las siguientes hipótesis que serán
asumidas de ahora en adelante: Supondremos que la Q–variedad 0-dimensional V =
{x(1) , . . . , x(δ) } ⊆ Cn viene dada por n polinomios F1 , . . . , Fn en Q[X1 , . . . , Xn ] que
verifican la siguiente condición:

13
El ideal (F1 , . . . , Fi ) es radical para 1 ≤ i ≤ n.

Los polinomios F1 , . . . , Fn forman una sucesión regular, es decir, la variedad


V (F1 , . . . , Fi ) es de dimensión n − i para 1 ≤ i ≤ n.

Observamos que la condición de que (F1 , . . . , Fn ) sea un ideal radical 0-dimensional, que
fuera también requerida por Kronecker en [26], es esencial para el método. Por otro lado,
la condición de radicalidad y (n−i)–dimensionalidad para 1 ≤ i ≤ n−1 no es realmente
restrictiva, ya que es posible recuperar esta situación mediante una combinación lineal
genérica de las ecuaciones originales, como se demuestra por ejemplo en [14] y [25].

3.1. Fórmula de interpolación de Kronecker


El método de Kronecker se puede describir en los siguientes términos:
Sea J := J(F1 , . . . , Fn ) el jacobiano de la sucesión de polinomios F1 , . . . , Fn , es decir,
J es el polinomio en Q[X1 , . . . , Xn ] definido mediante el determinante

 
∂Fj
J(F1 , . . . , Fn ) := det (3.1)
∂Xk

Recordemos que el ideal 0-dimensional (F1 , . . . , Fn ) es radical si y solo si todo punto


x(i) de la variedad V es no singular (véase por ejemplo [7, Corollary 2.6]). Por el criterio
del jacobiano ([27, VI, Theorem 1.15], [11, Theorem 16.19]), esto a su vez equivale a
que J(x(i) ) 6= 0 para todo punto x(i) de V , o también, a que la clase residual J de J es
una unidad en el anillo cociente Q[X1 , . . . , Xn ]/(F1 , . . . , Fn ) .
Para cada i con 1 ≤ i ≤ δ, sea Mi ⊆ C[X1 , . . . , Xn ] el ideal de los polinomios que se
anulan en x(i) . Como C es un cuerpo algebraicamente cerrado, Mi es el ideal maximal
(i) (i)
de C[X1 , . . . , Xn ] generado por los polinomios X1 − x1 , . . . , Xn − xn . Ciertamente todo
polinomio Fj (1 ≤ j ≤ n) está en el ideal Mi . Por lo tanto para cada par de ı́ndices
(i)
i, j con 1 ≤ i ≤ δ, 1 ≤ j ≤ n existen n polinomios, no únicos, γj,k (X) (1 ≤ k ≤ n) en
C[X1 , . . . , Xn ] que satisfacen las identidades

n
X (i) (i)
Fj (X) = γj,k (X)(Xk − xk ). (3.2)
k=1

(i)
Fijemos arbitrariamente una elección de los polinomios γj,k . Para cada i con 1 ≤
i ≤ δ se define el polinomio Di ∈ C[X1 , . . . , Xn ] como el determinante de la matriz
(i) (i)
(γj,k )1≤j,k≤n , cuya entrada de la fila j y la columna k es el polinomio γj,k . En el lema
siguiente se enuncia una importante propiedad que satisfacen los polinomios Di .

14
Lema 3.1 Para todo par de ı́ndices i, h con 1 ≤ i, h ≤ δ vale Di (x(h) ) = 0 si i 6= h y
Di (x(i) ) = J(x(i) ) 6= 0 si i = h.

Demostración: Sean i, h un par de ı́ndices distintos con 1 ≤ i, h ≤ δ. Especializando


X = x(h) en la identidad (3.2) para 1 ≤ j ≤ n se obtiene un sistema homogéneo de
(i)
ecuaciones lineales con matriz de coeficientes (γj,k (x(h) ))1≤j,k≤n ∈ Cn×n , que posee la
solución no trivial x(h) − x(i) ∈ Cn . Por lo tanto el determinante del sistema debe ser
(i)
cero, es decir, Di (x(h) ) = det(γj,k (x(h) )) = 0.
Sea ahora i = h. Derivando ambos miembros de la identidad (3.2) respecto de la
variable Xk resulta

n (i)
∂Fj (X) (i)
X ∂γj,h (X) (i)
= γj,k (X) + (Xh − xh ).
∂Xk h=1
∂X k

(i)
Especializando X en x(i) se obtiene γj,k (x(i) ) = ∂Fj (x(i) )/∂Xk . Por lo tanto

∂Fj (x(i) )
 
(i) (i)
Di (x ) = det(γj,k (x(i) )) = det = J(x(i) ),
∂Xk

lo que concluye la demostración.

En vista de la analogı́a con la base de Lagrange establecida en el Lema 3.1, nos


referimos a la sucesión de polinomios D1 , . . . , Dδ como a una base de Kronecker asociada
al conjunto de nodos x(1) , . . . , x(δ) .
Sea ahora un polinomio arbitrario F en Q[X1 , . . . , Xn ]. Como consecuencia inmedi-
ata del Lema 3.1 se obtiene el siguiente corolario:

Corolario 3.2 El polinomio en C[X1 , . . . , Xn ] expresado por la fórmula


δ
X Dj (X)
F (x(j) ) , (3.3)
j=1
J(x(j) )

interpola a F en los puntos x(1) , . . . , x(δ) de V .

Llamamos a la expresión (3.3) la fórmula de interpolación de Kronecker.


Por último observamos que para calcular el interpolante mediante la fórmula (3.3) es
necesario conocer tanto los nodos x(1) , . . . , x(δ) como las ecuaciones F1 = 0, . . . , Fn = 0
que los definen. Por otra parte el método descripto no es completamente constructivo
(i)
pues solo se afirma la existencia de los polinomios γj,k .

15
3.1.1. Fórmula de interpolación de Kronecker en una variable
Como mencionamos al comienzo de esta sección la fórmula de interpolación de Kro-
necker (3.3) es una generalización de la fórmula de Lagrange en una variable. De hecho,
si n = 1 y q(T ) = (T − t(1) ) · · · (T − t(δ) ) es un polinomio en Q[T ] libre de cuadrados y
de grado δ, el jacobiano de q es simplemente la derivada primera de q, que notamos q 0 .
En este caso los polinomios Dj están unı́vocamente determinados por las identidades
Dj (T ) = δk=1,k6=j (T − t(k) ) para todo 1 ≤ j ≤ δ, de modo que con D1 (T ), . . . , Dδ (T )
Q
recuperamos la base de Lagrange. Por consiguiente obtenemos el siguiente corolario:

Corolario 3.3 Sea f ∈ Q[T ] un polinomio arbitrario. Con las notaciones anteriores
el polinomio interpolante de Lagrange de f en los nodos t(1) , . . . , t(δ) se expresa en la
forma
δ
X Dj (T )
f (t(j) ) . (3.4)
j=1
q 0 (t(j) )

En adelante nos referiremos a (3.4) como a la fórmula de interpolación de Lagrange.

3.2. Bezoutianos y trazas en álgebras


0-dimensionales
Nuestro objetivo es expresar el polinomio interpolante del Corolario 3.3 sin hacer
referencia explı́cita a los nodos x(1) , . . . , x(δ) ni a los valores F (x(1) ), . . . , F (x(δ) ), sino solo
a los polinomios F1 , . . . , Fn y F . Esto será llevado a cabo en el Capı́tulo 4. Como primer
paso en esta dirección vamos a introducir en esta sección la noción de bezoutiano de la
sucesión F1 , . . . , Fn (véase [14], [25], [32], [12]). Este concepto nos permitirá encontrar
un procedimiento constructivo y eficiente para obtener los polinomios D1 , . . . , Dδ de
una base de Kronecker, cuyos grados estén además convenientemente acotados.

3.2.1. Bezoutianos
Introduzcamos un nuevo conjunto de variables Y1 , . . . , Yn . La idea del bezoutiano
surge naturalmente al realizar la misma contrucción hecha en la Sección 3.1 con los
puntos concretos x(i) de V , pero ahora con el punto “genérico” Y := (Y1 , . . . , Yn ). Para
(Y )
cada 1 ≤ j ≤ n sea Fj := Fj (Y1 , . . . , Yn ) el polinomio de Q[Y1 , . . . , Yn ] que se obtiene
substituyendo en Fj las variables X1 , . . . , Xn por Y1 , . . . , Yn . En el siguiente lema se
establece una identidad análoga a (3.2):

16
Lema 3.4 Sea d una cota para los grados de los polinomios F1 , . . . , Fn . Existen n2
polinomios γj,k (X, Y ) (1 ≤ j, k ≤ n) en Q[X1 , . . . , Xn , Y1 , . . . , Yn ] de grados totales en
las variables X1 , . . . , Xn , Y1 , . . . , Yn acotados por d − 1 tales que se verifica la relación:

n
X
(Y )
Fj − Fj = γj,k (X, Y )(Xk − Yk ). (3.5)
k=1

Al igual que antes, los polinomios γj,k no están unı́vocamente determinados por la
sucesión F1 , . . . , Fn .

(k)
Demostración: Sea 1 ≤ j ≤ n fijo. Para cada 0 ≤ k ≤ n sea Fj el polinomio en
Q[X, Y ] que resulta de reemplazar en Fj las variables (X1 , . . . , Xk ) por (Y1 , . . . Yk ), en
(0) (k−1)
particular Fj = Fj . Para cada 1 ≤ k ≤ n escribimos a Fj como un polinomio en
la variable Xk :
d
X
(k−1) (k−1)
Fj = Aj,m Xkm ,
m=0

(k−1)
donde los Aj,m son polinomios en Q[X, Y ] que no contienen la variable Xk . Se observa
(k−1) (k)
que el grado total de Aj,m está acotado por d − m. Ahora, como Fj se obtiene de
(k−1)
Fj substituyendo la variable Xk por Yk , de la expresión anterior se deduce:

d
X
(k) (k−1)
Fj = Aj,m Ykm .
m=0

Para 1 ≤ m ≤ d y 1 ≤ k ≤ n, sea Bkm el polinomio Bkm := m−1 l m−1−l


P
l=0 Xk Yk , que
m m m (k) (k−1)
satisface la identidad Bk (Xk − Yk ) = Xk − Yk . Entonces restando Fj de Fj se
obtiene
d
!
(k−1) (k)
X (k−1) m
Fj − Fj = Aj,m Bk (Xk − Yk ), (1 ≤ k ≤ n).
m=1

(k−1)
(Obsérvese que el término Aj,0 se cancela).
Pd (k−1) m
Por último definimos γj,k := m=1 Aj,m Bk . Por construcción es claro que los
grados de los polinomios γj,k están acotados por d − 1 y verifican
n
X n
X
(Y ) (k−1) (k)
Fj − Fj = Fj − Fj = γj,k (Xk − Yk ).
k=1 k=1

17
Esto concluye la demostración.

Por supuesto, es posible demostrar el lema anterior considerando el desarrollo de


Taylor de los polinomios Fj , sin embargo se optó por la demostración dada ya que se
usa en la construcción efectiva en el Lema 5.11.
El lema 3.4 nos permite dar la siguiente definición:

Definición 3.5 Para una elección arbitraria de polinomios γj,k que verifiquen las iden-
tidades (3.5), sea D el polinomio en Q[X1 , . . . , Xn , Y1 , . . . , Yn ] definido como el deter-
minante de la matriz (γj,k )1≤j,k≤n cuya entrada de la fila j y la columna k es el poli-
nomio γj,k (X, Y ). El polinomio D se llama un bezoutiano de la sucesión de polinomios
F1 , . . . , Fn .

De la demostración del Lema 3.4 dedujimos que es posible construir a partir de los
polinomios F1 , . . . , Fn un bezoutiano D cuyo grado total en las variables X1 , . . . , Xn ,
(i)
Y1 , . . . , Yn sea a lo sumo n(d − 1). Por otro lado es claro que los polinomios γj,k definidos
(i)
en la forma γj,k (X) := γj,k (X, x(i) ) verifican las identidades (3.2). Por lo tanto los poli-
nomios Di de la fórmula de Kronecker (3.3) pueden tomarse como Di := D(X, x(i) )
para un tal bezoutiano D. Este hecho, junto con los resultados sobre trazas en álgebras
0–dimensionales de la próxima sección, permitirán en el Capı́tulo 4 eliminar completa-
mente los puntos x(i) y los valores F (x(i) ) de la expresión del polinomio interpolante.

3.2.2. Trazas en álgebras 0-dimensionales


Sea nuevamente B := Q[X1 , . . . , Xn ]/(F1 , . . . , Fn ) el anillo de coordenadas de la
variedad V := V (F1 , . . . , Fn ) y sea B ∗ := HomQ (B, Q) el espacio dual del Q–espacio
vectorial B. Existe un elemento relevante de B ∗ que se denota con T r y se llama la
traza estándar de B. Se define de la siguiente manera: dado f ∈ B, sea ηf la homotecia
de multiplicación por f , como fue definida en la Sección 2.2. La imagen T r(f ) por T r
se define como la traza ordinaria del endomorfismo ηf . En el Capı́tulo 4 hallaremos una
base de un espacio de interpolación para el conjunto de nodos V , de tal modo que las
coordenadas del polinomio interpolante en dicha base se pueden expresar en términos
de la traza. En la presente sección estudiamos las propiedades de la traza necesarias a
tal efecto.
Mediante el empleo del elemento primitivo podemos reducir el estudio de la traza
estándar al caso univariado. Sea entonces u ∈ B un elemento primitivo de V , qu ∈ Q[T ]
su polinomio minimal y Au la Q–álgebra Au := Q[T ]/(qu ). En forma análoga al caso
multivariado consideramos el espacio dual A∗u = HomQ (Au , Q) y la correspondiente-
mente traza estándar de Au , que notamos con tr. En vista del próximo lema, hacemos
las siguientes observaciones. En primer lugar, como sabemos por el Corolario 2.5 exis-
te un isomorfismo de Q–álgebras θ : B → Au , tal que θ(u) = t (donde t denota la

18
clase residual de la indeterminada T ). Luego es claro que T r = tr ◦ θ. Considérese
ahora una forma lineal U ∈ Q[X1 , . . . , Xn ] que induce el elemento primitivo u de V .
Como vimos en la Sección 2.2, la forma lineal U determina una biyección entre V y el
conjunto de raı́ces de qu . Luego si para cada punto x(k) ∈ V definimos t(k) ∈ C como
t(k) := U (x(k) ), se tiene que qu (T ) = (T − t(1) ) · · · (T − t(δ) ). Sea F un polinomio arbi-
trario en Q[X1 , . . . , Xn ] y f su imagen en B. Sea además P ∈ Q[T ] un representante
del elemento de Au definido por p := θ(f ). Entonces de la identidad f = P (U ) en
B se sigue que para todo 1 ≤ k ≤ δ vale F (x(k) ) = P (U (x(k) )) = P (t(k) ). Con estas
observaciones y notaciones en mente enunciamos el siguiente lema:

Lema
Pδ 3.6 Sea T r la traza estándar de B. Entonces para todo f ∈ B vale T r(f ) =
(k)
k=1 (x ).
F

Demostración: Como antes sea f ∈ B arbitrario y p := θ(f ) ∈ Au . Sea Mt la matriz


de la homotecia ηt en la base A := {1, t, . . . , tδ−1 } de Au . Puesto que qu es un polinomio
anulador de ηt , Mt es la matriz compañera de qu . Además, como qu es libre de cuadrados
(Lema 2.4) la matriz Mt es diagonalizable. Es decir, si qu (T ) = (T − t(1) ) . . . (T − t(δ) ),
entonces se tiene la siguiente semejanza de matrices en Cδ×δ :
 
t(1)
Mt ∼ 
 .. .

.
(δ)
t

Como antes, sea f ∈ B arbitrario y p := θ(f ) ∈ Au . Luego, si Mp es la matriz de la


homotecia ηp , también en la base A, entonces se tiene que

 
P (t(1) )
Mp = P (Mt ) ∼ 
 ... .

P (t(δ) )

Finalmente puesto que la traza es invariante por semejanza de matrices, se obtiene


δ
X δ
X
T r(f ) = tr(p) = P (t(k) ) = F (x(k) ).
k=1 k=1

Esto completa la demostración.

Ahora dotamos a B ∗ con la estructura de B–módulo definida a partir del homo-


morfismo B × B ∗ → B ∗ que asocia a cada par (f, σ) en B × B ∗ el morfismo Q–lineal
f σ : B → Q definido por (f σ)(g) = σ(f g) para cada elemento g ∈ B. En particular

19
A∗u resulta un Au –módulo. Además de la traza estándar es conveniente introducir un
segundo elemento β0 de B ∗ que se define de la siguiente manera: recordando que la clase
residual J del Jacobiano J es una unidad de B, definimos β0 := J¯−1 T r. El elemento σ0
de A∗u que corresponde a β0 es σ0 := (q̄u0 )−1 tr y es conocido como la traza de Tate. El
siguiente lema es importante para la evaluación efectiva de la traza estándar.

Lema 3.7 Sea σ0 en A∗u la traza de Tate. Supóngase que un elemento p de Au se


escribe en la forma p = bδ−1 tδ−1 + · · · + b0 en la base {1, t, . . . , tδ−1 } de Au . Entonces
vale σ0 (p) = bδ−1 .

Demostración: Sea P = bδ−1 T δ−1 + · · · + b0 ∈ Q[T ] el representante Q de p con


deg(P ) < δ. Sean D1 , . . . , Dδ−1 los polinomios en C[T ] definidos por D1 := j6=1 (T −
t(j) ), . . . , Dδ := j6=δ (T −t(j) ). Entonces según la fórmula de Lagrange (3.4), P se puede
Q

escribir en la forma P = δj=1 P (t(j) )Dj /qu0 (t(j) ). Como los polinomios Dj son mónicos
P

y de grado δ − 1, el coeficiente bδ−1 de P debe ser bδ−1 = δj=1 P (t(j) )/qu0 (t(j) ). Luego
P

aplicando el Lema 3.6 para B = Au resulta bδ−1 = tr(q̄u0 −1 p) = (q̄u0 −1 tr)(p) = σ0 (p).

20
Capı́tulo 4

Construcción del espacio de


interpolantes

En este capı́tulo abordamos el problema de hallar un espacio de interpolantes ΠV


para el conjunto de nodos definido por la Q-variedad V ⊆ Cn . Ahora bien, si queremos
reducir el grado de los interpolantes lo mejor que se puede esperar del espacio ΠV es
que sea un espacio de interpolantes de grado minimal. Esto significa que para todo
F ∈ Q[X1 , . . . , Xn ] el interpolante P ∈ ΠV , definido por las condiciones P (x(i) ) =
F (x(i) ), 1 ≤ i ≤ δ − 1, satisface gr(P ) ≤ gr(F ). En un contexto diferente al nuestro,
a saber, cuando el conjunto de nodos está dado en forma explı́cita, han habido dos
construcciones sistemáticas de espacios de interpolantes con esa propiedad: los “least
maps” de de Boor y Ron ([9], [10]) y los espacios obtenidos apartir de las H-bases ([29],
[33]).
Notemos con Πnk el subespacio de Q[X1 , . . . , Xn ] formado por los polinomios de
grado total a lo sumo k. Sea m la cota óptima para los grados de los polinomios en
ΠV , es decir, m := mı́n{k : k ∈ N0 , ΠV ⊆ Πnk }. Por comodidad llamamos a m el grado
del espacio ΠV . El hecho de que ΠV sea un espacio de grado minimal implica que no
existe ningún subespacio de Πnm−1 que sea un espacio de interpolantes para V . Para ver
esto, elı́jase una base P1 , . . . , Pδ de ΠV . Entonces uno de estos polinomios, digamos P1 ,
debe tener grado m. Sin embargo, del supuesto de que existe un subespacio de Πnm−1
que permite interpolar, se deduce la existencia de un polinomio Q ∈ Πnm−1 que satisface
Q(x(i) ) = P1 (x(i) ) para 1 ≤ i ≤ δ. Luego el interpolante con respecto a Q en ΠV es P1 .
Pero gr(P1 ) > gr(Q), lo que contradice que ΠV es de grado minimal.
Consideremos ahora el caso univariado (n = 1). Sea q0 ∈ Q[T ] libre de cuadrados y
de grado δ y sea V = {t(1) , . . . , t(δ) } ⊆ C el conjunto de ceros de q0 . Veamos que Π1δ−1
es un espacio de interpolantes de grado minimal para V . En efecto, sea f ∈ Q[T ] un
polinomio arbitrario. Mediante el algoritmo de división obtenemos polinomios h ∈ Q[T ]
y r ∈ Π1δ−1 tales que f = q0 h + r. Pero entonces f (t(i) ) = r(t(i) ) para 1 ≤ i ≤ δ, con
lo cual r es el único interpolante en Π1δ−1 con respecto a f . Es claro además que r = 0

21
o gr(f ) ≥ gr(r). Se concluye que en el caso univariado el grado del interpolante debe
ser en general del mismo orden que la cardinalidad del conjunto de nodos. Sin embargo
en el caso multivariado existen espacios de interpolantes ΠV de grado esencialmente
menor a la cardinalidad de V . Primeramente observamos que si U es una forma lineal
en Q[X1 , . . . , Xn ] separante de V podemos obtener un espacio de interpolantes P de la
siguiente forma obvia: P :=< 1, U, . . . , U δ−1 >Q .
Por otra parte, en nuestro caso, la variedad V está dada por n polinomios F1 , . . . , Fn
en Q[X1 , . . . , Xn ], que forman una sucesión regular reducida y que generan un ideal
radical (F1 , . . . , Fn ). En esta situación la desigualdad de Bézout ([22], [15], [37]) afirma
que si d := máx{gr(F1 ), . . . , gr(Fn )}, entonces δ = #V ≤ dn y esta es una cota óptima
para la cardinalidad δ. No obstante, en el teorema siguiente se demuestra la existencia
de un espacio de interpolantes ΠV para V , que, aunque no es de grado minimal, tiene
grado a lo sumo n(d − 1). De modo que en el peor caso el grado de P es dn , mientras
que para el grado de ΠV se tiene una cota esencialmente menor.

Teorema 4.1 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados a lo sumo d que


definen una sucesión regular reducida y que generan el ideal radical (F1 , . . . , Fn ). Sea
V := V (F1 , . . . , Fn ) la Q-variedad 0-dimensional de cardinalidad δ definida por estos
polinomios y B su anillo de coordenadas. Sea U una forma lineal en Q[X1 , . . . , Xn ] cuya
imagen u en B es un elemento primitivo de V y sea T r la traza estándar de B. Entonces
existen δ polinomios G0 , . . . , Gδ−1 en Q[X1 , . . . , Xn ] de grados a lo sumo n(d − 1) tales
que sus imagenes g0 , . . . , gδ−1 en B forman una base del Q-espacio vectorial B y todo
f ∈ B se escribe en la forma:
δ−1
X
f= T r(J¯−1 f ui )gi . (4.1)
i=0

En particular ΠV :=< G0 , . . . , Gδ−1 >Q es un espacio de interpolantes para V .

Demostración: Sea qu en Q[T ] el polinomio minimal de u. Sean también v1 , . . . , vn


los polinomios en Q[T ] de grados acotados por δ − 1 que determinan la parametrización
de la variedad V con respecto a u. Se verifican por lo tanto las congruencias:

Yk ≡ vk (U (Y )) mod (F1 (Y ), . . . , Fn (Y )) (1 ≤ k ≤ n), (4.2)


qu (U (Y )) ≡ 0 mod (F1 (Y ), . . . , Fn (Y )).

Sea D(X, Y ) en Q[X1 , . . . , Xn , Y1 , . . . , Yn ] un bezoutiano de la sucesión de polinomios


F1 , . . . , Fn , de grado total en las variables X1 , . . . , Xn , Y1 , . . . , Yn acotado por n(d − 1)
según se construyó en la Subsección 3.2.1. Sea D1 := D(X1 , . . . , Xn , v1 (T ), . . . , vn (T )) el
polinomio en Q[X1 , . . . , Xn , T ] que se obtiene al substituir en D las variables Y1 , . . . , Yn
por los polinomios univariados v1 (T ), . . . , vn (T ) respectivamente. Consideramos a D1

22
como un polinomio en la variable T con coeficientes en el anillo Q[X1 , . . . , Xn ]. Puesto
que qu es mónico, podemos realizar la división con resto de D1 por qu en el anillo de
polinomios Q[X1 , . . . , Xn ][T ]. El resto r de D1 se escribe por lo tanto en la forma:
δ−1
X
r= Gj (X1 , . . . , Xn )T j ,
j=0

para ciertos polinomios Gj en Q[X1 , . . . , Xn ] (1 ≤ j ≤ n), ya que Q[X, T ]/(qu (T )) es un


Q[X]-módulo libre con base {1, T, . . . , T δ−1 }. Como D1 es de grado a lo sumo n(d−1) en
las variables X1 , . . . , Xn y qu no depende de las variables Xi , los polinomios Gj también
tienen sus grados acotados por n(d − 1). Ahora la congruencia D1 ≡ r mod (qu ) en el
anillo Q[X1 , . . . , Xn ][T ] junto con las ecuaciones (4.2) implican la congruencia:
δ−1
X
D(X, Y ) ≡ Gj (X1 , . . . , Xn )U (Y )j mod (F1 (Y ), . . . , Fn (Y )), (4.3)
j=0

en el anillo Q[Y1 , . . . , Yn ].
Tomemos un polinomio arbitrario F en Q[X1 , . . . , Xn ] y sea f su imagen en B.
Según la fórmula de interpolación de Kronecker (3.3), el polinomio
δ
X D(X, x(k) )
P := F (x(k) )
k=1
J(x(k) )

interpola a F en los puntos x(1) , . . . , x(δ) de V . En principio no es claro que este poli-
nomio tenga coeficientes racionales. No obstante, especializando en la congruencia (4.3)
la variable Y en el punto x(k) de V para 1 ≤ k ≤ δ, se obtienen las identidades
δ−1
X
D(X, x(k) ) = Gi (X1 , . . . , Xn )U (x(k) )i (1 ≤ k ≤ δ).
i=0

En consecuencia, podemos reescribir al polinomio interpolante P en la forma:


δ δ−1
!
(k)
X F (x ) X
P (X) = (k)
Gi (X1 , . . . , Xn )U (x(k) )i
k=1
J(x ) i=0
δ−1 δ
!
X X F (x(k) )U (x(k) )i
= Gi (X1 , . . . , Xn ).
i=0 k=1
J(x(k) )

Luego aplicando el Lema 3.6 obtenemos la identidad


δ−1
X
P (X) = T r(J¯−1 f ui )Gi (X).
i=0

23
En particular P es un polinomio en Q[X1 , . . . , Xn ] que interpola a F sobre los
puntos de V . Puesto que el ideal (F1 , . . . , Fn ) es radical, se deduce la identidad de
clases residuales P̄ = f en B. En consecuencia, tomando clases residuales en ambos
miembros de la última expresión de P obtenemos la fórmula (4.1).
En particular, puesto que dimQ B = δ, deducimos que B = {g0 , . . . , gδ−1 } es una
base del Q-espacio vectorial B.

Como hecho interesante cabe mencionar que la fórmula (4.1) implica, com veremos
a continuación, que B ∗ es un B-módulo libre de rango 1. Cada elemento σ de B ∗ que
genera a B ∗ como B-módulo se dice una traza de B. En estos términos, tenemos el
siguiente corolario:

Corolario 4.2 El elemento β0 := J¯−1 .T r de B ∗ es una traza de B. En particular, la


traza de Tate σ0 es un traza de Au .

Demostración: Si en (4.1) substituimos f por gj deducimos que (ui β0 )(gj ) = δi,j para
todo 0 ≤ i, j ≤ δ − 1. Es decir, {β0 , uβ0 , . . . , uδ−1 β0 } es la base dual de B. Entonces es
inmediato que β0 genera a B ∗ como B-módulo. Pues entonces todo β en PB ∗ se escribe

Pδ−1 j δ−1 j
en la forma β = j=0 (λj u )β0 para ciertos λj en Q. Por lo tanto β = j=0 λj u β0
Pδ−1
con j=0 λj uj en B. Por último β0 es libre de torsión, dado que si para algún f es
f β0 = 0, entonces 0 = (f β0 )(uj ) = β0 (uj f ) para todo 0 ≤ j ≤ δ − 1, y por lo tanto de
(4.1) se sigue f = 0.

Conclusión A partir del Teorema 4.1 podemos concluir que para un polinomio F ∈
Q[X1 , . . . , Xn ] de grado arbitrario, el polinomio
δ−1
X
P := T r(J¯−1 F̄ ui )Gi (X), (4.4)
i=0

interpola a F sobre el conjunto de nodos V y además gr(P ) ≤ n(d − 1). Según se vió en
la demostración de este teorema, P no es otra cosa que una reescritura del polinomio
interpolante de Kronecker (3.3).

24
Capı́tulo 5

Cálculo del polinomio interpolante

En este capı́tulo vamos exhibir un procedimiento algorı́tmico para calcular la expre-


sión del polinomio interpolante dada en (4.4). Comenzamos precisando las estructuras
de datos que se utilizan.

5.1. Estructuras de datos


Los objetos matemáticos que manipulamos tanto en la entrada y salida como en los
pasos intermedios del algoritmo son polinomios con coeficientes racionales. A lo largo de
esta sección todos los polinomios univariados y formas lineales se suponen representados
en forma densa, i.e, por un vector de coeficientes. Ası́ por ejemplo la forma lineal
U ∈ Q[X1 , . . . , Xn ], el polinomio minimal qu ∈ Q[T ] y los polinomios v1 (T ), . . . , vn (T ) ∈
Q[T ] que definen la parametrización de la resolución geométrica de una Q-variedad 0-
dimensional se suponen dados en forma densa y nos referiremos a los coeficientes de
dichos polinomios simplemente como los coeficientes de la resolución geométrica. Por
otra parte, como principio general es necesario evitar la representación densa de los
polinomios multivariados ya que esto podrı́a implicar un crecimiento exponencial de la
complejidad debido a la cantidad de monomios distintos de grado d en n variables. Por
esta razón, todos los polinomios multivariados serán siempre representados mediante
straight-line programs, cuya definición damos a continuación.
Sea R un anillo arbitrario. Denotamos con R[X1 , . . . , Xn ] al anillo de polinomios
en las indeterminadas X1 , . . . , Xn con coeficientes en R. Sean F1 , . . . , Fs polinomios en
R[X1 , . . . , Xn ].

Definición 5.1 Un straight-line program (libre de divisiones) en R[X1 , . . . , Xn ] que


calcula o evalúa el conjunto de polinomios {F1 , . . . , Fs } es una sucesión β = (Q1 , . . . , Qr )
de polinomios en R[X1 , . . . , Xn ] con las siguientes propiedades:

1. {F1 , . . . , Fs } ⊆ {Q1 , . . . , Qr }.

25
2. Para cada 1 ≤ ρ ≤ r, el polinomio Qρ pertenece a R ∪ {X1 , . . . , Xn } o existen
1 ≤ ρ1 , ρ2 < ρ y una operación aritmética opρ en {+, −, ·} tales que vale Qρ =
Qρ1 opρ Qρ2 .

Los polinomios Q1 , . . . , Qr se llaman los resultados intermedios del straight-line pro-


gram β y los polinomios F1 , . . . , Fs son los resultados finales o salidas de β. Entre los
resultados intermedios, las variables X1 , . . . , Xn se clasifican como las entradas y los el-
ementos de R como los parámetros de β. Llamamos longitud de β al número de “pasos
de computación” Qρ = Qρ1 opρ Qρ2 del ı́tem 2 de la Definición 5.1. También definimos
la longitud no escalar de β como el número de pasos de computación correspondientes
a multiplicaciones “esenciales”, es decir, pasos de computación Qρ = Qρ1 opρ Qρ2 tales
que Qρi ∈ / R para i = 1, 2, y opρ es la operación de multiplicación.
Alternativamente utilizamos también la representación mixta de un polinomio multi-
variado dado con respecto a una variable distinguida. Sea F un polinomio en R[X1 , . . . , Xn ]
de grado total a lo sumo d. Sea 1 ≤ k ≤ n y sea Xk una variable distinguida. Inter-
pretamos a F como un polinomio multivariado en la variable P Xk con coeficientes en
R[X1 , . . . , Xk−1 , Xk+1 , . . . , Xn ]. Entonces F tiene la forma F = 0≤j≤d Fj Xkj donde los
coeficientes Fj son polinomios en las variables X1 , . . . , Xk−1 , Xk+1 , . . . , Xn con coeficien-
tes en R. Una representación mixta del polinomio F con respecto a la variable Xk es
un straight-line program libre de divisiones con entradas X1 , . . . , Xk−1 , Xk+1 , . . . , Xn ,
parámetros en R y con d + 1 salidas que representan los polinomios F0 , . . . , Fd .

5.2. Algunos resultados básicos de complejidad


5.2.1. Operaciones aritméticas con polinomios univariados
En esta subsección vamos a presentar algunos resultados estándar sobre la comple-
jidad de las operaciones aritméticas con polinomios univariados. (Para más detalles ver
[4], [2], [38].) Más precisamente si R es un anillo conmutativo con unidad y R[T ] es el
anillo de polinomios sobre R en la indeterminada T , vamos a discutir el costo de realizar
las operaciones aritméticas de adición, substracción, multiplicación y división con resto
en R[T ] medido en términos del número de operaciones en el anillo de base R (adición,
substracción, multiplicación y división por unidades de R), suponiendo que tanto los
polinomios de entrada como los de salida de la operación aritmética en consideración
se representan en forma densa.
Antes de pasar a los enunciados vamos a precisar el tipo de algoritmo que con-
sideramos para el cálculo de tales operaciones. Primeramente observamos que si los
polinomios están codificados en forma densa, entonces cualquiera de las operaciones
mencionadas (con un divisor mónico en el caso de la división) son funciones polinomia-
les de los datos de entrada. Mas generalmente sea α : Rm → Rr una función polinomial
arbitraria. Diremos que α se puede calcular usando a lo sumo L operaciones en R si

26
se da la siguiente situación: Sean X1 , . . . , Xm nuevas indeterminadas (que conmutan)
sobre R y sea R∗ el conjunto de unidades de R. Existe un straight-line program libre
de divisiones β en R[X1 , . . . , Xm ] con entradas X = {X1 , . . . , Xm } y de longitud L, que
satisface la siguiente propiedad:
Notemos con S ⊂ R∗ el conjunto de parámetros, con V = {P1 , . . . , PL } el conjunto
de resultados intermedios y con {F1 , . . . , Fr } ⊂ V las salidas de β. Entonces para toda
interpretación J : S ∪X → R de β (donde se supone que J(s) = s para s ∈ S), su exten-
sión consistente J : S ∪ X ∪ V → R verifica (J(F1 ), . . . , J(Fr )) = α(J(X1 ), . . . , J(Xm )).
Con esta terminologı́a en mente, procedemos a los enunciados. Dados dos polinomios
en R[T ] de grados menores que δ, es claro que su suma o su resta se pueden obtener
con a lo sumo δ adiciones o substracciones en R. Para la multiplicación se tiene el
siguiente resultado, que surge como consecuencia del algoritmo de multiplicación rápida
de Schönhage-Strassen ([2], [4], [38]).

Teorema 5.2 La multiplicación de dos polinomios de grados menores que δ en el anillo


R[T ] se puede efectuar usando O(δ log(δ) log(log(δ))) operaciones en R.

Es usual que en cuestiones de complejidad en álgebra computacional se suela consid-


erar la complejidad de la multiplicación de polinomios univariados como un invariante.
En tal sentido, vamos a utilizar frecuentemente la notación M (δ) := δ log(δ) log(log(δ)).
El siguiente resultado, la complejidad del cálculo de la división con resto por un
polinomio mónico de R[T ], es consecuencia del conocido algoritmo de Sieveking-Kung
([2], [38]).

Teorema 5.3 Sean polinomios P, Q en R[T ] arbitrarios tales que Q es mónico con
gr(Q) = δ, gr(P ) < δ + k y δ ≥ k. Entonces el cociente y el resto de la división de
P por Q se pueden calcular usando 4M (δ) + M (k) + O(δ) = O(M (δ)) operaciones
aritméticas en R.

Sea Q en R[T ] mónico de grado δ. Los resultados anteriores permiten estimar el costo
de la multiplicación en el anillo cociente R[T ]/(Q), asumiendo que una clase residual P̄
se representa por la forma densa de su representante P de grado menor que δ. Tenemos
entonces el siguiente corolario:

Corolario 5.4 Una multiplicación en el anillo cociente R[T ]/(Q) se puede calcular
usando O(M (δ)) operaciones aritméticas en R.

Máximo común divisor


Por último consideramos el costo del cálculo del máximo común divisor de dos
polinomios univariados. Sea K[T ] el anillo de polinomios en la indeterminada T con
coeficientes en un cuerpo arbitrario K. Como consecuencia del Algoritmo Extendido de
Euclides (véase [2], [38]), tenemos el siguiente resultado:

27
Lema 5.5 Sean F, G polinomios en K[T ] de grados a lo sumo δ. Entonces los siguientes
ı́tems se pueden calcular con O(M (δ)log(δ)) operaciones en K:

El máximo común divisor H en K[T ] de F y G.

Polinomios R, S en K[T ] de grados a lo sumo δ − 1 con RF + SG = H.

5.2.2. Cálculo del determinante


Consideramos ahora el costo del cálculo del determinante de una matriz con coefi-
cientes en R de tamaño n × n en términos de operaciones aritméticas en R. A partir
del algoritmo de Samuelson para el cálculo del polinomio caracterı́stico, tenemos el
siguiente resultado:

Teorema 5.6 [13] El cálculo del determinante de una matriz arbitraria A en Rn×n se
puede realizar usando O(n4 ) operaciones en R.

5.2.3. La complejidad del cálculo de la resolución geométrica


de una Q-variedad 0-dimensional
En el siguiente resultado expresamos la complejidad del cálculo de un elemento
primitivo y de la resolución geométrica asociada, medida en términos del número de
operaciones en el cuerpo de base Q. (Ver [21], [23], [5].)

Teorema 5.7 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados a lo sumo d que


definen una sucesión regular reducida, codificados por un straight-line program de lon-
gitud L. Sea V ⊆ Cn la variedad algebraica 0-dimensional definida por estos polinomios
y δ := #(V ). Entonces existe un algoritmo probabilı́stico que calcula la resolución ge-
ométrica de V con O(n(nL + n4 )(M (dδ))2 ) operaciones aritméticas en Q.

5.3. Cálculo de la base del espacio de interpolantes


Sean nuevamente F1 , . . . , Fn polinomios de Q[X1 , . . . , Xn ] que forman una sucesión
regular reducida y definen la variedad 0-dimensional V ⊆ Cn . De ahora en adelante
vamos a suponer que tal sucesión viene dada por un straight-line program libre de
divisiones β con entradas X1 , . . . , Xn y con n salidas que representan los polinomios
F1 , . . . , Fn . En la Sección 4 se demostró la existencia de polinomios G0 , . . . , Gδ−1 en
Q[X1 , . . . , Xn ] de grados a lo sumo n(d − 1) que generan un espacio de interpolantes
para el conjunto de nodos V . En esta sección vamos a describir un procedimiento
algorı́tmico para calcular estos polinomios. Como siempre, es necesario evitar el cálculo
de la representación densa de los polinomios G0 , . . . , Gδ−1 para evitar un crecimiento

28
exponencial de la complejidad de los correspondientes algoritmos. Por eso los polinomios
G0 , . . . , Gδ−1 se van a representar mediante un straight-line program.
Comenzamos con las siguientes consideraciones de carácter general. Sean n, s y N
números naturales y X1 , . . . , Xn , Y1 , . . . , Ys un conjunto de n + s indeterminadas so-
bre Q. Sea F un polinomio en Q[X1 , . . . , Xn , Y1 , . . . , Ys ] de grado total en las varia-
bles X1 , . . . , Xn , Y1 , . . . , Ys a lo sumo N . Supóngase además que F está representado
por un straight-line program libre de divisiones β con entradas X1 , . . . , Xn , Y1 , . . . , Ys .
Introduzcamos ahora otra indeterminada T sobre Q y supóngase que son dados poli-
nomios v1 , . . . , vs de grados a lo sumo δ − 1 y un polinomio q mónico y de grado δ
en Q[T ] (estos polinomios no necesariamente representan la parametrización y el poli-
nomio minimal de una resolución geométrica de V ). A continuación consideramos el
anillo cociente Q[X1 , . . . , Xn , T ]/(q), que es un Q[X1 , . . . , Xn ]-módulo libre con base
B = {1, T̄ , . . . , T̄ δ−1 }. Definimos a G como el polinomio en Q[X1 , . . . , Xn , T ] que se
obtiene de F al substituir la variable Yj por el polinomio vj para todo 1 ≤ j ≤ s, es
decir:
G(X1 , . . . , Xn , T ) := F (X1 , . . . , Xn , v1 (T ), . . . , vs (T )). (5.1)

Notemos con G a la imagen de G en el cociente Q[X1 , . . . , Xn , T ]/(q). Sean Gj (0 ≤


j ≤ δ − 1) los (únicos) polinomios en Q[X1 , . . . , Xn ] que representan los coordenadas
de Ḡ en la base B. Estos polinomios Gj (0 ≤ j ≤ δ − 1) se pueden obtener del siguiente
modo: Interpretamos a G como un polinomio univariado en la variable T con coeficientes
en Q[X1 , . . . , Xn ]. Puesto que q es mónico podemos realizar la división con resto de G
por q en Q[X1 , . . . , Xn ][T ]. Luego el resto R de esta división es de la forma
X
R= Gj (X)T j , (5.2)
0≤j≤δ−1

donde los polinomios Gj (0 ≤ j ≤ δ − 1) en Q[X1 , . . . , Xn ] son precisamente las co-


ordenadas de Ḡ en la base B. Obsérvese que como G tiene grado a lo sumo N en las
variables X1 , . . . , Xn y q no depende de las variables Xk , los polinomios Gj también
tienen sus grados menores o iguales a N . En el siguiente teorema se plantea el problema
de hallar un straight-line program que evalúe los polinomios G0 , . . . , Gδ−1 , es decir, una
representación mixta del polinomio R con respecto a la variable T .
Teorema 5.8 Sea F un polinomio en Q[X1 , . . . , Xn , Y1 , . . . , Ys ] de grado acotado por N
en las variables X1 , . . . , Xn , Y1 , . . . , Ys . Supóngase entonces que son dados los siguientes
ı́tems como entrada:
Un straight-line program β libre de divisiones, de longitud L con entradas X1 , . . . ,
Xn , Y1 , . . . , Ys que evalúa el polinomio F .
Un polinomio q mónico de grado δ y s polinomios v1 , . . . , vs de grados a lo sumo
δ − 1 en Q[T ].

29
Entonces existe un straight-line program libre de divisiones β 0 de longitud O(LM (δ))
que representa los polinomios Gj (0 ≤ j ≤ δ − 1) arriba definidos.

Demostración: Recordemos (Definición 5.1) que el straight-line program β es una


sucesión β = (Q1 , . . . , Qr ) de polinomios en Q[X1 , . . . , Xn , Y1 , . . . , Ys ] que verifica:

1. Qr = F .

2. Para cada ρ con 1 ≤ ρ ≤ r, el polinomio Qρ pertenece a Q ∪ {X1 , . . . , Xn ,


Y1 , . . . , Ys } o existen ı́ndices ρ1 , ρ2 con 1 ≤ ρ1 , ρ2 < ρ y una operación aritmética
opρ ∈ {+, −, ·} tales que:

Qρ = Qρ1 opρ Qρ2 . (5.3)

Para cada ı́ndice ρ con 1 ≤ ρ ≤ r sea Pρ el polinomio en Q[X1 , . . . , Xn , T ] definido


como
Pρ := Qρ (X1 , . . . , Xn , v1 (T ), . . . , vs (T )),
y sea Rρ el resto de la división de Pρ por q. En particular, según (5.1) y (5.2) es
Pr = G y Rr = R. A continuación calculamos en forma sucesiva los coeficientes de
todos los polinomios Rρ (1 ≤ ρ ≤ r), considerados como polinomios en la variable T
con coeficientes en Q[X1 , . . . , Xn ]. Procedemos por inducción en el subı́ndice ρ.
Si ρ = 1 se presentan tres posibilidades:

1. Qρ es un parámetro de β en Q y en tal caso Rρ = Qρ .

2. Qρ es alguna entrada Xi de β, con lo cual Rρ = Pρ = Xi .

3. Qρ es alguna entrada Yi de β, con lo cual Rρ = Pρ = vi (T ).

En cualquier caso, Rρ es dato.


Supongamos ahora que 1 < ρ y que ya han sido calculados los coeficientes de los
polinomios Rµ para todos los ı́ndices 1 ≤ µ < ρ. De la identidad (5.3) deducimos la
siguiente congruencia en el anillo Q[X1 , . . . , Xn ][T ]:

Rρ ≡ Rρ1 opρ Rρ2 mod(q).

Por hipótesis inductiva conocemos los coeficientes de Rρ1 y Rρ2 . Como estos poli-
nomios tienen grado menor que δ en la variable T sabemos por el Corolario 5.4 que
los coeficientes de Rρ se pueden calcular a partir de los coeficientes de Rρ1 , Rρ2 y de
q usando O(M (δ)) operaciones aritméticas en Q[X1 , . . . , Xn ] (aplicamos el corolario
cuando el anillo de coeficientes es R := Q[X1 , . . . , Xn ]). Continuando de este modo
vemos que es posible calcular los coeficientes de todos los polinomios Rρ (1 ≤ ρ ≤ r)
y en particular los polinomios Gj (0 ≤ j ≤ δ − 1). Por otro lado, puesto que en β

30
tenemos L operaciones aritméticas se deduce que los cálculos anteriores requieren a lo
sumo O(LM (δ)) operaciones aritméticas en Q[X1 , . . . , Xn ]. En otras palabras, hemos
descripto un straight-line program libre de divisiones β 0 con entradas X1 , . . . , Xn de
longitud O(LM (δ)), que es una representación mixta del polinomio R con respecto a
la variable T . Con esto queda demostrado el teorema.

Sea nuevamente B la Q-álgebra B = Q[X1 , . . . , Xn ]/(F1 , . . . , Fn ). Sea U cualquier


forma lineal en Q[X1 , . . . , Xn ] cuya imagen u en B es un elemento primitivo de V .
Como sabemos, B = {1, u, . . . , uδ−1 } es una base de B. Sea dado un polinomio F en
Q[X1 , . . . , Xn ] y notemos con f a su imagen en B. Consideramos ahora el problema de
hallar los coeficientes de f en la base B o equivalentemente el polinomio P en Q[T ] de
grado a lo sumo δ − 1 que verifica P (u) = f . La solución de este problema es un caso
especial del Teorema 5.8 que enunciamos separadamente:

Corolario 5.9 Sea F un polinomio arbitrario en Q[X1 , . . . , Xn ] y f su imagen en B.


Supóngase que son dados los siguientes ı́tems:

Un straight-line program libre de divisiones β de longitud L con entradas X1 , . . . , Xn


que evalúa el polinomio F .

El polinomio minimal qu y la parametrización dada por los polinomios v1 , . . . , vn


de la resolución geométrica de V asociada al elemento primitivo u.

Entonces el polinomio P en Q[T ] de grado a lo sumo δ − 1 tal que P (u) = f se


puede calcular con O(LM (δ)) operaciones en Q.

Una segunda aplicación del Teorema 5.8 es la siguiente: Sea F un polinomio en


Q[X1 , . . . , Xn ] de grado total acotado por d representado mediante un straigh-line pro-
gram libre de divisiones β con entradas X1 , . . . , Xn de longitud L. Sea 1 ≤ k ≤ n fijo.
Ahora el problema es hallar una representación mixta de F con respecto a la variable
distinguida Xk .

Corolario 5.10 Bajo las hipótesis anteriores existe una representación mixta del poli-
nomio F con respecto a una variable cualquiera de longitud O(LM (d)).

Demostración: Supongamos en efecto que Xn es la variable distiguida de F y tomem-


os el monomio q(Xn ) := Xnd+1 . Según el Teorema 5.8 existe un straight-line program β 0
de longitud O(LM (d)) que evalúa d + 1 polinomios F0 , . . . , Fd en Q[X1 , . . . , Xn−1 ] tales
que se verifica la siguiente congruencia en el anillo Q[X1 , . . . , Xn ]:
d
X
F (X1 , . . . , Xn ) ≡ Fk (X1 , . . . , Xn−1 )Xnk mod(Xnd+1 ).
k=0

31
Como grXn (F ) ≤ d, se deduce la igualdad
d
X
F = Fk (X1 , . . . , Xn−1 )Xnk ,
k=0

de modo que β 0 es la representación mixta de F anunciada en el corolario.

Sean nuevamente F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] cuyos grados están aco-


tados por d y supóngase que vienen representados mediante un straight-line program
libre de divisiones β con entradas X1 , . . . , Xn de longitud L. Tomemos el Bezoutiano
D(X, Y ) en Q[X, Y ] asociado a la sucesión F1 , . . . , Fn conforme fue construı́do en la
Sección 3.2.1.
En el siguiente lema se afirma que es posible transformar el straight-line program β
en un straight-line program que evalúa el Bezoutiano D.

Lema 5.11 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados acotados por d da-


dos mediante un straight-line program libre de divisiones β 0 con entradas X1 , . . . , Xn
de longitud L. Entonces existe un straight-line program libre de divisiones de longi-
tud O(Ln2 M (d) + n2 (d2 + n2 )) con entradas X1 , . . . , Xn , Y1 , . . . , Yn que evalúa un Be-
zoutiano D(X, Y ) para la sucesión F1 , . . . , Fn tal que el grado total de D en las variables
X1 , . . . , Xn , Y1 , . . . , Yn es a lo sumo n(d − 1).

(k) (k)
Demostración: Sean Fj (1 ≤ j ≤ n, 0 ≤ k ≤ n), Bkm (1 ≤ m ≤ d, 1 ≤ k ≤ n), Aj,m
(0 ≤ k ≤ n − 1, 1 ≤ j ≤ n, 0 ≤ m ≤ d) y γj,k (1 ≤ j, k ≤ n) los polinomios definidos en
la demostración del Lema 3.4 de la Sección 3.2.1.
Primeramente vamos calcular los polinomios γj,k . Procedemos como sigue: Para cada
j, k con 1 ≤ j ≤ n y 0 ≤ k ≤ n − 1, substituı́mos en el straight-line program β las
(k)
variables (X1 , . . . , Xk ) por (Y1 , . . . , Yk ), obteniendo un straight-line program βj que
(k) (k)
evalúa el polinomio Fj con longitud L. Por lo tanto cada polinomio Fj se evalúa con L
operaciones aritméticas en Q[X, Y ] y tiene grado menor o igual a d. Por el Corolario 5.10
(k)
existe una representación mixta de Fj con respecto a la variable Xk+1 , cuyas salidas
(k) (k)
representan los polinomios Aj,0 , . . . , Aj,d , con longitud O(LM (d)). En conclusión, como
(k)
se tienen n2 pares (j, k) con 1 ≤ j ≤ n, 0 ≤ k ≤ n − 1, el conjunto de polinomios Aj,m
(0 ≤ k ≤ n − 1, 1 ≤ j ≤ n, 1 ≤ m ≤ d), se puede evaluar con O(Ln2 M (d)) operaciones
aritméticas en Q[X, Y ]. Por otra parte es claro que los polinomios Bkm (1 ≤ m ≤ d, 1 ≤
k ≤ n), se evalúan con O(nd2 ) operaciones. A continuación, para obtener los polinomios
(k−1)
γj,k := dm=1 Aj,m Bkm (1 ≤ j, k ≤ n), se requieren O(n2 d) operaciones adicionales. Por
P
lo tanto el conjunto de polinomios γj,k (1 ≤ j, k ≤ n) se puede evaluar por un straight-
line program de longitud O(Ln2 M (d)+n2 d2 ). Finalmente recordemos que el Bezoutiano
D(X, Y ) está definido como el determinante D := det(γj,k ). Luego aplicando el Lema

32
5.6 sobre el cálculo del determinante, concluı́mos que existe un straight-line program
β 0 de longitud O(Ln2 M (d) + n2 (d2 + n2 )) que evalúa el Bezoutiano D.

Ahora estamos en condiciones de calcular los polinomios G0 , . . . , Gδ−1 que forman


una base de un espacio de interpolación tal como se describen en el Teorema 4.1.

Teorema 5.12 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados a lo sumo d


que definen una sucesión regular reducida y que generan el ideal radical (F1 , . . . , Fn ).
Sea V := V (F1 , . . . , Fn ) la Q-variedad 0-dimensional de cardinalidad δ definida por
estos polinomios y B su anillo de coordenadas. Supóngase que como entrada son dados
los siguientes ı́tems

Un straight-line program libre de divisiones β con entradas X1 , . . . , Xn de longitud


L que evalúa los polinomios F1 , . . . , Fn .

El polinomio minimal qu y la parametrización dada por los polinomios v1 , . . . , vn


de la resolución geométrica de V asociada a un elemento primitivo u.

Entonces existe un straight-line program libre de divisiones β 0 con entradas X1 , . . . , Xn


de longitud O(n(nL+n4 )M (d2 δ)) y con δ salidas que representan polinomios G0 , . . . , Gδ−1
en Q[X1 , . . . , Xn ] de grados a lo sumo n(d − 1) que verifican la siguiente propiedad: De-
notemos con g0 , . . . , gδ−1 las imágenes en B de los polinomios G0 , . . . , Gδ−1 . Entonces
para todo elemento f en B vale la fórmula de la traza:
δ−1
X
f= T r(J¯−1 f uk )gk . (5.4)
k=0

En particular {g0 , . . . , gδ−1 } es una base de B y los polinomios G0 , . . . , Gδ−1 generan


un espacio de interpolación para el conjunto de nodos V .

Demostración: Por hipótesis tenemos un straight-line program libre de divisiones β


de longitud a lo sumo L que evalúa el conjunto de polinomios F1 , . . . , Fn . Por el Lema
5.11 se puede transformar a β en un straight-line program libre de divisiones β1 de
longitud a lo sumo O(Ln2 M (d) + n2 (d2 + n2 )) con entradas X1 , . . . , Xn , Y1 , . . . , Yn que
evalúa un Bezoutiano D de la sucesión F1 , . . . , Fn de grado acotado por n(d − 1). Sea
D1 el polinomio en Q[X1 , . . . , Xn , T ] que se obtiene al substituir en D las variables
Y1 , . . . , Yn por los polinomios univariados v1 (T ), . . . , vn (T ) respectivamente, es decir

D1 := D(X1 , . . . , Xn , v1 (T ), . . . , vn (T )).

Como sabemos el anillo cociente Q[X1 , . . . , Xn , T ]/(qu ) es un Q[X1 , . . . , Xn ]-módu-


lo libre con base B = {1, T̄ , . . . , T̄ δ−1 }. Denotemos con D̄1 a la imagen de D1 en

33
el cociente Q[X, T ]/(qu ). Sean G0 , . . . , Gδ−1 los polinomios en Q[X1 , . . . , Xn ] que re-
presentan las coordenadas de D̄1 en la base B. Según la demostración del Teorema
4.1, los polinomios G0 , . . . , Gδ−1 verifican todas las propiedades del enunciado del pre-
sente teorema. Ahora bien, de acuerdo con el Teorema 5.9 es posible obtener a par-
tir de β1 y de la resolución geométrica de V un straight-line program β 0 de longitud
O((Ln2 M (d) + n2 (d2 + n2 ))M (δ)) = O(n(nL + n4 )M (d2 δ)) que evalúa los polinomios
Gj (1 ≤ j ≤ δ − 1), lo que concluye la demostración.

5.4. Cálculo de los coeficientes


En la sección anterior hemos calculado polinomios G0 , . . . , Gδ−1 que forman una
base para un espacio de interpolación. Además esta base posee la propiedad que dado
un polinomioParbitrario F en Q[X1 , . . . , Xn ] su interpolante en dicho espacio se escribe
en la forma 0≤j≤δ−1 T r(J¯−1 f uj )Gj . En esta sección nos ocupamos del cálculo de los
coeficientes T r(J¯−1 f uj ) (0 ≤ j ≤ δ − 1), suponiendo que los polinomios F1 , . . . , Fn y F
vienen dados por un straight-line program de longitud L.

5.4.1. Cálculo del jacobiano


En primer término consideramos el problema de calcular las derivadas parciales
primeras ∂F/∂X1 , . . . , ∂F/∂Xn de un polinomio F en Q[X1 , . . . , Xn ] arbitrario. Tene-
mos el siguiente lema:
Lema 5.13 Sea F un polinomio en Q[X1 , . . . , Xn ] dado mediante un straight-line pro-
gram β de longitud L. Entonces, existe un straight-line program β 0 que evalúa el conjunto
de polinomios {∂F/∂X1 , . . . , ∂F/∂Xn } con longitud O(nL).

Demostración: La idea es calcular “paso a paso” cada derivada primera de F siguien-


do el esquema de computación β que calcula F . Procedemos de la siguiente manera:
Por cada paso de computación ρ de β se calculan las n derivadas primeras de la función
calculada en ρ. A fin de calcular esas derivadas basta tener en cuenta que en pasos
de computación anteriores se tienen calculadas las derivadas primeras de los resultados
intermedios predecesores de ρ, por lo que el esquema de cálculo de las derivadas de
la función calulada en ρ es una consecuencia directa de las reglas de derivación para
funciones de tipo P op Q con op ∈ {+, −, ·}.
Combinando el Lema 5.13 con el Teorema 5.6 sobre el cálculo del determinante, se
obtiene el corolario:
Corolario 5.14 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] dados mediante un straight-
line program β de longitud L. Entonces existe un straight-line program β 0 que evalúa el
Jacobiano J(F1 , . . . , Fn ) con longitud O(nL + n4 ).

34
5.4.2. Inversión del jacobiano
Sea J¯ la imagen en B del polinomio jacobiano J(F1 , . . . , Fn ). Consideramos ahora
el problema de calcular su inverso J¯−1 en B. Sea u el elemento primitivo previamente
fijado en B. Para nuestro propósito es suficiente hallar el polinomio H en Q[T ] de grado
a lo sumo δ − 1 que verifica H(u) = J¯−1 . Tenemos el siguiente resultado:

Teorema 5.15 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] que definen una sucesión


regular reducida y que generan un ideal radical (F1 , . . . , Fn ). Sea V = V (F1 , . . . , Fn ) la
Q-variedad 0-dimensional de cardinalidad δ definida por estos polinomios y B su anillo
de coordenadas. Supóngase que los siguientes ı́tems son dados como entrada:

Un straight-line program β de longitud L que evalúa los polinomios F1 , . . . , Fn .

Una resolución geométrica de V .

Entonces el polinomio H en Q[T ] de grado a lo sumo δ − 1 que verifica la identidad


H(u) = J¯−1 en B se puede calcular con O((nL + n4 )M (δ) log(δ)) operaciones en Q.

Demostración: Por el Corolario 5.14 existe un straight-line program β 0 que evalúa el


jacobiano J con longitud O(nL+n4 ). Luego, por el Corolario 5.9 el polinomio G en Q[T ]
de grado a lo sumo δ − 1 tal que G(u) = J¯ se puede calcular usando O((nL + n4 )M (δ))
operaciones en Q. Sea ahora H el polinomio en Q[T ] de grado gr(H) ≤ δ − 1 tal que
HG ≡ 1 mod(qu ). Es claro que H verifica la identidad H(u) = J¯−1 . Aplicando el
Lema 5.5 (cálculo del máximo común divisor) el polinomio H se puede calcular a partir
de qu y G con O(M (δ) log(δ)) operaciones en Q. En conclusión es necesario realizar
O((nL + n4 )M (δ) log(δ)) operaciones en Q.

5.4.3. Cálculo de las trazas


Dado un elemento primitivo u en B consideramos nuevamente la Q-álgebra Au =
Q[T ]/(qu ) de clases residuales en Q[T ] módulo el polinomio minimal qu de u. En el
siguiente lema se establece el costo de evaluar la traza estándar tr de Au .

Lema 5.16 Sea p una clase residual dada en Au . Supóngase que son dados los siguien-
tes ı́tems:

El representante P en Q[T ] de grado a lo sumo δ − 1 de la clase residual p.

El polinomio minimal qu .

Entonces la traza estándar tr(p) de p se puede calcular con O(M (δ)) operaciones
aritméticas en Q.

35
Demostración: Sea qu0 la derivada de qu . Por el Lema 3.7 sabemos que si R =
bδ−1 T δ−1 +· · ·+b0 es el resto de la división del producto qu0 P por qu entonces tr(p) = bδ−1 .
A fin de demostrar el enunciado basta observar que por el Corolario 5.4 podemos calcular
R a partir de P y qu0 con O(M (δ)) operaciones aritméticas en Q.

En consecuencia, podemos determinar el costo de calcular las trazas que necesitamos


a fin de calcular un polinomio interpolante.

Teorema 5.17 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados acotados por d


que definen una sucesión regular reducida y que generan un ideal radical (F1 , . . . , Fn ).
Sea V = V (F1 , . . . , Fn ) la Q-variedad 0-dimensional de cardinalidad δ definida por estos
polinomios y B su anillo de coordenadas. Sea además F un polinomio en Q[X1 , . . . , Xn ]
de grado arbitrario, y denótese con f su imagen en B . Supóngase que los siguientes
ı́tems son dados como entrada:

Un straight-line program libre de divisiones β de longitud L que evalúa los poli-


nomios F1 , . . . , Fn y F .

Una resolución geométrica de V .

Entonces todas las trazas T r(J¯−1 f uj ) (0 ≤ j ≤ δ − 1) se pueden calcular a partir de


los coeficientes de la resolución geométrica y de los parámetros de β usando O((nL +
n4 )M (δ)2 ) operaciones en Q.

Demostración: Sea u el elemento primitivo de la resolución geométrica dada. Sean


P y H los polinomios en Q[T ] de grados a lo sumo δ − 1 tales que valen las igualdades
P (u) = f y H(u) = J¯−1 en B. Por el Teorema 5.15 y el Corolario 5.9 los polinomios
P y H se pueden calcular a partir de los coeficientes de la resolución geométrica y de
los parámetros de β con O((nL + n4 )M (δ) log(δ)) operaciones en Q. A continuación
hallamos para todo 0 ≤ j ≤ δ − 1 el polinomio Kj en Q[T ] de grado a lo sumo δ − 1
representante de la clase residual K̄j = H̄ P̄ T̄ j del cociente Au = Q[T ]/(qu ). Este cálculo
requiere O(δ) multiplicaciones en Au y por lo tanto, según el Corolario 5.4, el cálculo
de la representación densa de las clases K̄0 , . . . , K̄δ−1 requiere O(δM (δ)) operaciones
aritméticas en Q. En virtud del isomorfismo de Q-álgebras θ : B → Au dado por
θ(u) = T̄ tenemos que T r = tr ◦ θ. Por lo tanto T r(J¯−1 f uj ) = tr(K̄j ) para todo
0 ≤ j ≤ δ − 1. Por el Lema 5.16 una traza estándar tr(K̄j ) se puede calcular a partir de
los polinomios qu y Kj con O(M (δ)) operaciones en Q. En consecuencia el costo total
es de O((nL + n4 )M (δ) log(δ) + δM (δ)) = O((nL + n4 )M (δ)2 ).

36
5.5. Estimación de complejidad del algoritmo com-
pleto
En conclusión podemos decir que la eficiencia del método de interpolación expuesto
en las páginas precedentes reside en el cálculo del interpolante, es decir, de las trazas,
junto con el costo del cálculo de los polinomios G0 , . . . , Gδ−1 de la base del espacio de
interpolantes.
Finalmente resumimos los resultados anteriores en el siguiente teorema:

Teorema 5.18 Sean F1 , . . . , Fn polinomios en Q[X1 , . . . , Xn ] de grados acotados por d


que definen una sucesión regular reducida y que generan un ideal radical (F1 , . . . , Fn ).
Sea V = V (F1 , . . . , Fn ) la Q-variedad 0-dimensional de cardinalidad δ definida por estos
polinomios y B su anillo de coordenadas. Sea además F un polinomio en Q[X1 , . . . , Xn ]
de grado arbitrario, y denótese con f a su imagen en B. Supóngase que es dado como
entrada un straight-line program libre de divisiones β de longitud L que evalúa los
polinomios F1 , . . . , Fn y F . Entonces:

Probabilı́sticamente puede construirse un straight-line program libre de divisiones


β 0 de longitud O(n(nL + n4 )M (dδ)2 ) que evalúa δ polinomios G0 , . . . , Gδ−1 en
Q[X1 , . . . , Xn ] cuyos grados están acotados por n(d − 1) y tales que sus imágenes
B = {g0 , . . . , gδ−1 } forman una Q-base de B.

Las coordenadas (α0 , . . . , αδ−1 ) en la base B del elemento f de B se pueden calcular


a partir de los parámetros de β con O((nL + n4 )M (δ))2 ) operaciones aritméticas
en Q.

En particular, el polinomio P := δ−1


P
j=0 αj Gj es un interpolante de F en los puntos
de la variedad V , tiene grado acotado por n(d − 1) y se evalúa mediante un straight-line
program de longitud O(n(nL + n4 )M (dδ)2 ).

Demostración: Dado que el cálculo de la resolución geométrica de V requiere O(n(nL+


n4 )M (dδ)2 ) operaciones aritméticas en Q, y según el Teorema 5.12 los polinomios
G0 , . . . , Gδ−1 se evalúan a partir de β y de la resolución geométrica de V con O(n(nL +
n4 )M (d2 δ)) operaciones aritméticas en Q[X1 , . . . , Xn ], fácilmente se deduce la esti-
mación de complejidad del enunciado.

37
38
Parte II

Cotas inferiores

39
Capı́tulo 6

Un modelo para procesos de


interpolación

6.1. Algoritmos para familias de problemas de in-


terpolación
En lo que sigue vamos a ocuparnos de familias de problemas de interpolación. Una
familia de problemas de interpolación está representada por una estructura de datos, que
es un subconjunto construible D de un espacio ambiente afı́n CN dado. Cada instancia
admisible d ∈ D, o código de entrada, determina o codifica un problema de interpolación,
interpretando las coordenadas de d como la lista de nodos y valores que definen el pro-
blema. Ası́, por ejemplo, cada punto (x(1) , y1 , . . . , x(δ) , yδ ) ∈ C(n+1)K , donde x(i) ∈ Cn ,
yi ∈ C para todo 1 ≤ i ≤ δ y x(i) 6= x(j) para i 6= j, determina de forma natural
un problema de interpolación de Lagrange con nodos x(1) , . . . , x(δ) y valores y1 , . . . , yδ .
En forma análoga se puede representar una amplia variedad de familias de problemas
de interpolación, como quedará claro en los ejemplos que se darán en la Sección 6.2.
Recalcamos que para toda familia de problemas interpolación considerada aquı́, existen
n, D ∈ N, tales que todas las instancias de la familia tienen una solución (no necesari-
amente única) en el espacio ΠD de los polinomios n–variados con coeficientes en C de
grado a lo sumo D. En otras palabras, tenemos una aplicación Φ : D → ΠD tal que para
cada d ∈ D el polinomio Φ(d) resuelve el problema de interpolación determinado por
d. Más aun, vamos a restringirnos a los casos en que esta aplicación Φ es un morfismo
racional regular sobre un subconjunto abierto Zariski de D y además es continua (en la
topologı́a fuerte) en todo su dominio D.

En suma, una familia de problemas de interpolación de grado D consiste de:


un subconjunto construible D de un espacio afı́n CN , donde cada d ∈ D codifica
un problema de interpolación con una solución en el espacio ΠD .

41
un morfismo racional Φ : D → ΠD que se extiende con continuidad (en la topologı́a
fuerte) a todo D y tal que Φ(d) resuelve el problema de interpolación definido por
d para todo d ∈ D.

Definimos ahora la noción de algoritmo que resuelve (genéricamente) una familia


dada de problemas de interpolación.

Definición 6.1 Un algoritmo de interpolación para la familia de problemas de inter-


polación D, Φ : D → ΠD está dado por un conjunto construible D∗ ⊂ CM , llamado la
estructura de datos de salida, junto con una aplicación (polinomial) ω ∗ : D∗ → ΠD , y
una aplicación racional Ψ : D 99K D∗ , tal que Ψ(d) resuelve el problema de interpolación
codificado por cada d ∈ D donde Ψ está definida. En otras palabras Ψ(d) representa el
código del interpolante Φ(d) ∈ ΠD . En suma, el siguiente diagrama conmuta:

Ψ
D _NNN_ _ _ _ _/ D∗ (6.1)
NNN
NNN
N ω∗
Φ NNN& 
ΠD

Denotamos con D la clausura Zariski de D en su espacio ambiente CN . En adelante,


vamos a suponer que D es un conjunto algebraico irreducible.
Como Ψ se supone una aplicación racional, existe un conjunto denso y abierto
Zariski U ⊆ D, tal que Ψ es una función regular en U, i.e, Ψ es una M –tupla de
funciones racionales Ψj ∈ C(D), 1 ≤ j ≤ M , bien definidas en U.

6.2. Tres ejemplos crı́ticos


El propósito de esta sección es ilustrar las nociones de la sección anterior, las cuales
se discuten en tres significativas familias de problemas de interpolación. Estas famil-
ias de problemas de interpolación constituyen nuestros ejemplos prototı́picos, y serán
retomados en las Secciones 7.3 y 8.
La primera familia que consideramos es la interpolación de Lagrange univariada
clásica, que está parametrizada por una estructura de datos suave. Luego consideramos
un caso de interpolación de Lagrange multivariada sobre una curva singular. Nuestro
último ejemplo es el de una familia no lineal de problemas de interpolación, esto es, el
conjunto de interpolantes no es un subespacio lineal, sino un conjunto construible del
correspondiente espacio ambiente afı́n.

42
6.2.1. Interpolación de Lagrange univariada
Fı́jese N ∈ N y γ := (γ1 , . . . , γN ) ∈ CN con γi 6= γj para i 6= j. El problema de
interpolación de Lagrange univariado (genérico) en nodos fijos γ1 , . . . , γN consiste en
hallar, para cada d := (d1 , . . . , dN ) ∈ CN , el único polinomio pd ∈ ΠN −1 que satisface
pd (γj ) = dj para 1 ≤ j ≤ d.
Con el fin de representar estos problemas de interpolación en nuestros términos sea
D := N − 1, D := CN y la aplicación Φ : D → ΠN −1 definida por Φ(d) := pd . Ahora
bien, como para todo d := (d1 , . . . , dN ) ∈ D, la representación densa de pd ∈ ΠN −1
está dada por el vector V −1 d, donde V := (γij−1 )1≤i,j≤N ∈ CN ×N es la matriz de
Vandermonde asociada a γ1 , . . . , γN , es claro que Φ es un morfismo regular y continuo
en todo D. Luego, la familia de problemas de interpolación de Lagrange univariados
en nodos fijos γ1 , . . . , γN está representada por todo el espacio afı́n D := CN , y la
aplicación Φ : D → ΠN −1 en el sentido de la Sección 6.1.
Sea D∗ := CN y ω ∗ : D∗ → ΠN −1 la codificación de los elementosP −1 de ΠN −1 deter-
minada por su representación densa, i.e, ω ∗ (a0 , . . . , an−1 ) := N j=0 a j X j
. Por lo tanto,
∗ −1
la aplicación regular Ψ : D → D definida por Ψ(d) := V (d) es un algoritmo de
interpolación en el sentido de arriba que está definido en todo D.
Esta construcción se puede modificar fácilmente para modelar también la clásica
interpolación de Lagrange univariada con nodos genéricos: sea U ⊂ CN el conjunto
abierto U := { (γ1 , . . . , γN ) | γi 6= γj , 1 ≤ i < j ≤ N } y sea D := U × CN ⊂ CN × CN .
Cada (γ, d) ∈ D define un problema de interpolación de Lagrange como antes mu-
tatis mutandis en los nodos γ1 , . . . , γN con valores d1 , . . . , dN . Luego el problema de
interpolación de Lagrange genérico está representado por la estructura de datos D y el
morfismo Φ : D → ΠN −1 que aplica cada d ∈ D en el único p(γ,d) ∈ ΠN −1 que satisface
p(γ,d) (γi ) = di para 1 ≤ i ≤ N . Puesto que la representación densa de p(γ,d) está dada
por el vector V (γ)−1P d, vemos que para D∗ := CN , la aplicación ω ∗ : D∗ → ΠN −1 ,
N −1
ω ∗ (p0 , . . . , pN −1 ) := j ∗
j=0 pj X , y el morfismo Ψ : D → D , Ψ(γ, d) := V (γ) d,
−1

constituyen un algoritmo que resuelve esta familia de problemas de interpolación.

6.2.2. Interpolación univariada de Lagrange-Hermite de un


polinomio fijo
Fı́jese N ∈ N y un polinomio univariado f ∈ Π := C[X] con gr(f )  N , y sea
D := CN . Para cada d ∈ CN consideramos el problema de interpolación de Lagrange-
Hermite que consiste en hallar el único polinomio pd ∈ ΠN −1 que satisface

Dj pd (z) = Dj f (z) para 0 ≤ j < uz , (6.2)

donde uz := #{j ∈ {1, . . . , N } : z = dj }, z ∈ C.


Sea D∗ := CN y ω ∗ : D∗ → ΠN −1 la codificación densa de los elementos de ΠN −1 . El
conocido método de interpolación de Newton o de diferencias divididas permite expresar

43
el único polinomio de ΠN −1 que satisface las condiciones de interpolación (6.2) en la
forma:
N
X
f [d1 , . . . , dj ](X − d1 ) . . . (X − dj ), (6.3)
j=1

donde f [d1 , . . . , dj ] denota la j-ésima diferencia dividida. Afirmamos que las diferencias
divididas f [d1 , . . . , dj ] son polinomiales en d. En efecto, sean nuevas indeterminadas
X1 , . . . , XN y definamos los polinomios Pj ∈ C[X1 , . . . , Xj ], 1 ≤ j ≤ N , inductivamente
como:

P1 := f (X1 ),
Pj−1 (X2 , . . . , Xj ) − Pj−1 (X1 , . . . , Xj−1 )
Pj := , 2 ≤ j ≤ N.
Xj − X1

Sabemos que para todo d := (d1 , . . . , dN ) ∈ CN con di 6= dj para i 6= j, valen las


identidades:

Pj (d1 , . . . , dj ) = f [d1 , . . . , dj ], 1 ≤ j ≤ N. (6.4)

Puesto que además las diferencias divididas f [d1 , . . . , dj ] son funciones continuas de d
en la topologı́a fuerte de CN (véase [8]), concluimos que la identidad (6.4) vale para
todo d ∈ CN , lo que demuestra nuestra afirmación.
Ahora, definimos Ψ : D → D∗ como la aplicación tal que los valores Ψ1 (d), . . . , ΨN (d)
son los coeficientes del polinomio de (6.3) considerado como un polinomio en C[d][X]
para cada d ∈ D. En consecuencia con ω ∗ : D∗ → ΠN −1 y Ψ : D → D∗ ası́ definidas,
obtenemos un algoritmo de interpolación regular, esto es, definido en todo D, para la
familia de problemas de interpolación de Lagrange-Hermite definida por D.
Por otra parte, es claro que el subconjunto D0 := {(d1 , . . . , dN ) ∈ CN : di 6=
dj , para i 6= j} de D se puede interpretar como una estructura de datos que codi-
fica la subfamilia de problemas de interpolación de Lagrange del polinomio fijo f en
nodos genéricos.
Si V (d) := (dj−1 i )1≤i,j≤N ∈ CN ×N representa la matriz de Vandermonde asociada a
d1 , . . . , dN , la representación densa del único interpolante pd ∈ ΠN −1 para el problema
de interpolación de Lagrange definido por d está dado por V (d)−1 f (d), donde f (d) :=
(f (d1 ), . . . , f (dN )). Por lo tanto el morfismo racional ψ : D0 → CN definido por ψ(d) :=
V (d)−1 f (d) es un algoritmo de interpolación para la familia de problemas de Lagrange
D0 .
A primera vista podrı́a pensarse que este algoritmo ψ es una aplicación racional
bien definida sobre D0 , que no se extiende a D0 \ D0 = CN \ D0 . Sin embargo como ψ
y Ψ son idénticas sobre el conjunto denso D0 , se deduce que ψ ≡ Ψ y por lo tanto ψ es
polinomial.

44
6.2.3. Interpolación de Lagrange-Hermite bivariada sobre la
curva X 3 − Y 2 = 0
Sea D := C\{(−1, ±i)}, donde C ⊂ C2 es la curva algebraica definida por la ecuación
X 3 − Y 2 = 0. Para cada (u, v) ∈ D distinto de (0, 0) consideramos la interpolación de
una función polinomial dada f : C2 → C en los puntos (u, v) y (0, 0).
Más precisamente, cada (u, v) ∈ D \ {(0, 0)}, define un problema de interpolación
de Lagrange en los nodos (0, 0) y (u, v) con valores asociados f (0, 0) y f (u, v) respecti-
vamente. Por otro lado, para el punto (0, 0) consideramos el problema de interpolación
∂f
de Hermite en el nodo (0, 0) con valores f (0, 0) y ∂X (0, 0), donde este último repre-
senta la evaluación en (0, 0) de la derivada parcial con respecto a la variable X, y
que consiste en hallar un polinomio I(0,0) ∈ Π1 tal que verifique I(0,0) (0, 0) = f (0, 0),
∂I(0,0) ∂f
∂X
(0, 0) = ∂X (0, 0).
Es fácil ver que para cada (u, v) ∈ D\{(0, 0)} existe un único polinomio interpolante
I(u,v) que se halla en el espacio lineal C⊕C·(uX+vY ) ⊂ Π1 (este espacio de interpolantes
corresponde al “least solution space” introducido en [10], véase también [9]):

(f (u, v) − f (0, 0))uX (f (u, v) − f (0, 0))vY


I(u,v) := f (0, 0) + + .
u2 + v 2 u2 + v 2

Para (u, v) = (0, 0), tomamos

∂f
I(0,0) := f (0, 0) + (0, 0)X,
∂X

que de hecho es el único interpolante que se halla en el espacio lineal C ⊕ C · X ⊂ Π1


para el problema de interpolación definido por el punto (0, 0).
La aplicación Φ : D → Π1 definida por Φ(u, v) := I(u,v) , es claramante un morfismo
racional sobre el abierto D \ {(0, 0)} y es fácil ver que también es continua (en la
topologı́a fuerte) en el punto (0, 0). Por lo tanto tenemos una familia de problemas de
interpolación de grado 1 codificada por D y Φ : D → Π1 en el sentido de la Sección 6.1.
Ahora, definiendo D∗ := C3 y ω ∗ : D∗ → Π1 como ω ∗ (a, b, c) := a + bX + cY
(la representación canónica densa de los polinomios bivariados de grado a lo sumo 1),
tenemos que la aplicación racional Ψ : D 99K D∗ definida como:

(f (u, v) − f (0, 0))u (f (u, v) − f (0, 0))v 


Ψ(u, v) := f (0, 0), , , (6.5)
u2 + v 2 u2 + v 2

junto con ω ∗ constituyen un algoritmo que resuelve la familia de problemas de interpo-


lación D, Φ : D → Π1 sobre el conjunto abierto Zariski D \ {(0, 0)}.

45
6.2.4. Un ejemplo no lineal: sucesiones de identificación e in-
terpolación

Sean n, L ∈ N que satisfacen 2L ≥ n, y sea OL,n ⊂ Π := C[X1 , . . . , Xn ] el conjunto


de los polinomios que se pueden evaluar mediante un straight-line program de longitud
no escalar a lo sumo L. Observamos que todo polinomio f ∈ OL,n tiene grado acotado
por 2L (véase [4, Exercise 9.18] o [24, Theorem 3.2]). En consecuencia OL,n ⊂ Π2L puede
L
considerarse como un subconjunto construible de CNL , donde NL := 2 n+n .


Denotemos con OL,n a la clausura Zariski de OL,n en su espacio ambiente CNL . Se


tiene que OL,n es una variedad absolutamente irreducible. Los elementos de este con-
junto algebraico se corresponden con los polinomios n-variados que tienen complejidad
aproximativa acotada por L (véase [1, Lemma 2 y Satz 4]).
Sea nL := 4(L + n + 1)2 + 2. De acuerdo con [6, Corollary 2] existen vectores

γ1 , . . . , γnL ∈ Cn tales que para f, g ∈ OL,n las igualdades f (γi ) = g(γi ) para i =
1, . . . , nL implican f = g. Tal conjunto de vectores {γ1 , . . . , γnL } se denomina una
sucesión de identificación para la clase de polinomios OL,n .
Sea Ξ : OL,n → CnL la aplicación polinomial (lineal) definida por

Ξ(f ) := (f (γ1 ), . . . , f (γnL )).

Sea DL,n := Ξ(OL,n ) ⊂ CnL . Entonces [6, Theorem 2] muestra que DL,n es un cono
irreducible afı́n de CnL y Ξ : OL,n → DL,n es un morfismo bijectivo, birracional, finito de
variedades algebraicas y un homeomorfismo en la topologı́a fuerte. Vamos a considerar
a DL,n como una estructura de datos que representa en forma natural una familia de
problemas de interpolación.
Más precisamente, obsérvese que la elección γ1 , . . . , γnL como una sucesión de iden-
tificación implica que para cada d ∈ DL,n , existe un único elemento f ∈ OL,n que
satisface f (γj ) = dj para 1 ≤ j ≤ nL , a saber, el elemento f = Ξ−1 (d). Ası́ pues, si
definimos Φ : DL,n → Π2L como Φ(d) = Ξ−1 (d) obtenemos una familia de problemas de
interpolación parametrizada por DL,n en el sentido de la Sección 6.1. Obsérvese además
que esta familia de problemas de interpolación es no lineal en el sentido que el espacio
de interpolantes OL,n es no lineal (no es cerrado para la adición).
La Sección 8.2 será dedicada al estudio de la complejidad algorı́tmica de resolver
esta familia particular de problemas de interpolación, o equivalentemente, la comple-
jidad de reconstruir los polinomios de OL,n a partir de sus valores en una sucesión de
identificación.

46
6.3. Complejidad de una familia de problemas de
interpolación
Sea una familia de problemas de interpolación de grado D dada por una estruc-
tura de datos D y una aplicación Φ : D → ΠD . Para todo algoritmo de interpolación
ω ∗ : D∗ → ΠD , Ψ : D 99K D∗ , la dimensión del espacio ambiente de D∗ se llama
la complejidad del algoritmo de interpolación (ω ∗ , Ψ). Asimismo, la La complejidad de
una familia dada de problemas de interpolación se define como la complejidad mı́ni-
ma de todos los algoritmos de interpolación que resuelven la familia de problemas de
interpolación D, Φ : D → ΠD .
Por ejemplo, la complejidad de la interpolación de Lagrange univariada (genérica)
en N nodos fijos (Ejemplo 6.2.1) es a lo sumo N .
Recalcamos que esta noción de complejidad es una generalización adecuada de tres
medidas usuales de complejidad en teorı́a de eliminación efectiva: el tamaño de la repre-
sentación densa o rala y la longitud (no escalar) de la representación por straight–line
programs. En efecto, es claro que el tamaño mı́nimo de la representación densa o rala
(el número total de monomios o de monomios no nulos en consideración) de una familia
“continua” dada F := {Qj ; j ∈ J } ⊂ C[X1 , . . . , Xn ] de polinomios de grado acotado es
una cota inferior para la complejidad de calcular un miembro genérico de F. En otras
palabras, podemos estimar inferiormente tal complejidad mediante la dimensión del
menor espacio ambiente AM que contiene F. Por otro lado, para un polinomio dado F ∈
C[X1 , . . . , Xn ] podemos considerar la longitud no escalar mı́nima L(F ) de un straight–
line program que evalúa F . Sea L ∈ N y defı́nase WL := {F ∈ C[X1 , . . . , Xn ]; L(F ) ≤
L}. De [4, Exercise 9.18] (véase también [24, Theorem 3.2]) deducimos que WL es un
2
subconjunto construible de A(L+n+1) y por lo tanto la dimensión (L + n + 1)2 del
espacio ambiente de WL refleja la longitud (no escalar) del straight–line program de un
polinomio genérico F ∈ WL .

47
48
Capı́tulo 7

Algoritmos robustos de
interpolación

Con el fin de incluir fenómenos de coalescencia en nuestro modelo (véase, e.g., [3],
[10], [30]), vamos a considerar resoluciones de problemas de interpolación lı́mites medi-
ante la noción de algoritmo robusto.

7.1. Hechos básicos de la teorı́a de places


Comenzamos recordando algunos hechos básicos de la teorı́a de places en el álgebra
conmutativa y la geometrı́a algebraica que necesitaremos después (seguimos los libros
clásicos [39] y [28]) con el fin de dar un marco teórico adecuado a nuestra noción de
robustez.
Un place (o un place ∆–valuado) de un cuerpo K es un homomorfismo de anillos
ϑ : Rϑ → ∆ donde ∆ es otro cuerpo y Rϑ ⊂ K es un subanillo que verifica que si
x ∈ K \ Rϑ entonces 1/x ∈ Rϑ y ϑ(1/x) = 0. Para x ∈ / Rϑ escribimos ϑ(x) = ∞. El
anillo Rϑ se llama el anillo de valuación asociado a ϑ. Si el cuerpo K es una k–álgebra
para otro cuerpo k y ϑ es un morfismo de k–espacios vectoriales, decimos que ϑ es un
k–place.
Recordamos los siguientes resultados básicos y bien conocidos:
Teorema I (Extensión de places) ([39, Theorem 5’, Ch.VI, §4] y [28, Ch.
VII, §3, Corollary 3.3]) Sea A un dominio ı́ntegro contenido en un cuerpo K y sea
 : A → L una especialización (i.e., un homomorfismo de anillos) de A sobre otro anillo
L. Entonces  se puede extender a un place ϑ de K. Si L es algebraicamente cerrado,
el place ϑ puede elegirse L–valuado.
Obsérvese que si K, L y A son k–álgebras para cierto cuerpo k y  es un k–
homomorfismo, el place ϑ resulta un k–place.

49
Teorema II (Places y clausura entera) ([39, Theorem 6, Ch.VII, T §5]) Sea A
un dominio ı́ntegro contenido en un cuerpo K. Entonces la intersección ϑ Rϑ , donde
ϑ recorre todos los places de K tales que A ⊂ Rϑ , es la clausura entera de A en K.
Si A es la localización de una C–álgebra finitamente generada, la clausura entera de
A en su cuerpo de fracciones es la intersección de los anillos de valuación asociados a
los C–places C–valuados que contienen A.

7.2. La noción de robustez


Ahora procedemos a introducir la noción de robustez para algoritmos de interpo-
lación.
Con la terminologı́a de la Sección 6.1, sea ω ∗ : D∗ → ΠD , Ψ : D 99K D∗ ⊆ CM un
algoritmo que resuelve un familia dada D, Φ : D → ΠD de problemas de interpolación.
En lo que sigue, denotamos con Md al ideal maximal asociado a un punto dado d ∈ D
en el anillo de coordenadas C[D].
Informalmente hablando, un algoritmo robusto de interpolación para una familia
dada de problemas de interpolación es un algoritmo que admite una única extensión a
los problemas lı́mites bien definidos, esto es, los problemas correspondientes a puntos
de D donde Ψ no está definido, y que los resuelve. Formalizamos esta idea mediante la
teorı́a de places.

Definición 7.1 Con las notaciones anteriores, decimos que el algoritmo ω ∗ : D∗ →


ΠD , Ψ : D 99K D∗ es robusto si y solo si la siguiente condición se satisface en todo
punto d ∈ D: para todo C–place ϑ : C(D) → C ∪ {∞} que es finito sobre el anillo
local C[D]Md , el valor ϑ(Ψj ) es finito y depende solo del punto d y del ı́ndice j, pero no
depende del place ϑ. Denotaremos este valor con Ψj (d), aun si Ψj no está definida en
d.

En la próxima sección exhibiremos algoritmos robustos que resuelven las familias


de problemas de las Subsecciones 6.2.1 y 6.2.3 con el objeto de ilustrar esta noción.
Ahora establecemos algunos comentarios y consecuencias concernientes a esta defini-
ción que necesitaremos más tarde.
Sea d ∈ D y sea ϑ un place C–valuado del cuerpo C(D) cuyo anillo de valuación
asociado Rϑ contiene el anillo local C[D]Md . El place ϑ induce por restricción un C-
homomorfismo  : C[D]Md → C, que es necesariamente la evaluación en el punto d.
Si la función racional Ψj está definida en d (i.e., Ψj ∈ C[D]Md para 1 ≤ j ≤ M ), el
valor ϑ(Ψj ) no depende del place ϑ y coincide con Ψj (d). Por lo tanto, la condición de
robustez se satisface trivialmente en todo punto del dominio de Ψ y tenemos la siguiente
observación:

50
Observación 7.2 Un algoritmo definido por una aplicación regular Ψ : D → D∗ es
necesariamente robusto.

Sin embargo, la condición de la Definición 7.1 tiene un sentido no trivial (en el


espı́ritu de la regla de L’Hôpital) si d anula tanto el numerador como el denominador
de Ψj . Esta analogı́a sugiere nuestra notación extendida Ψ(d) para puntos d de D donde
Ψ no está definida.
Del Teorema II inferimos que si Ψ es robusto, el morfismo natural C[D]Md
,→ C[D]Md [Ψ1 , . . . , ΨM ] es una extensión entera para todo punto d ∈ D, i.e., las fun-
ciones racionales Ψj son enteras sobre C[D]Md . En particular, si d es un punto suave
de D esto implica que la aplicación Ψ puede ser realmente evaluada en d, puesto que
el anillo local C[D]Md es integralmente cerrado y entonces contiene a las funciones Ψj .
Esto justifica la siguiente observación:

Observación 7.3 Si el conjunto construible D es suave y el algoritmo es robusto, la


aplicación racional Ψ : D → D∗ está definida en todas partes, i.e, es una aplicación
regular sobre todo el espacio D.

Este es el caso para la clásica interpolación univariada de Lagrange-Hermite (véase


las Secciones 6.2.1 y 6.2.2). Para la robustez en puntos singulares, véase el ejemplo
considerado en las Subsecciones 6.2.3 y 7.3.2.
Nuestra definición de robustez afirma que la aplicación Ψ se puede extender a todo el
conjunto D, produciendo puntos bien definidos en CM . Las imágenes correspondientes
a puntos lı́mites, esto es, a puntos de D donde Ψ no está definida, no necesariamente
pertenecen al conjunto construible D∗ , sino a su clausura Zariski en CM . En efecto, para
todo polinomio g que se anula sobre D∗ , la composición g ◦ Ψ es una función racional en
C(D) que se anula en un conjunto U ⊂ D (a saber, la intersección de D con el dominio
de Ψ) denso en D y por lo tanto, es la función racional cero. En consecuencia, para todo
place ϑ de C(D) tenemos 0 = ϑ(g ◦ Ψ) = g(ϑ(Ψ)), lo que prueba nuestra afirmación.
Las imágenes por la extensión de Ψ de los puntos lı́mites representan de hecho el
código de polinomios en ΠD , que son recuperados mediante la aplicación polinomial
ω ∗ . Por otro lado, el algoritmo Ψ resuelve el problema de interpolación definido por
cada punto de su dominio. En consecuencia es natural preguntarse si la extensión de
Ψ a los puntos lı́mites por medio de los places produce códigos en D∗ correspondientes
a polinomios que resuelven los respectivos problemas de interpolación particulares. En
otras palabras, nos preguntamos si la identidad Φ(d) = ω ∗ (Ψ(d)) es válida aun para
puntos fuera del dominio de Ψ. No intentaremos establecer las condiciones necesarias
y suficientes en las que esto se verifica en general, pero podremos constatarlo en los
ejemplos particulares de la Sección 7.3.

51
7.2.1. Robustez bajo restricción
Como dijimos antes, la condición de robustez asegura que el algoritmo Ψ se puede
especializar en todo punto (cerrado) de D. De hecho podemos mostrar algo más fuerte
y muy natural: aun si las funciones racionales Ψj no están definidas en todo punto de
D, para toda subvariedad cerrada Z ⊂ D tal que D ∩ Z es un subconjunto denso en
Z, las funciones Ψj inducen “funciones restricción” ψj que son racionales sobre Z. Más
precisamente:

Proposición 7.4 Sea ω ∗ : D∗ → ΠD , Ψ : D 99K D∗ ⊂ CM un algoritmo robusto que


resuelve una familia de problemas de interpolación D, Ψ : D → ΠD , y sea Z ⊂ D
un cerrado irreducible Zariski tal que D ∩ Z es un subconjunto Zariski denso en Z.
Entonces, existen funciones racionales ψ1 , . . . , ψM ∈ C(Z) tales que para todo punto
d ∈ D∩Z y para todo par de C-places ϑ, ϑ0 de los cuerpos C(D) y C(Z) respectivamente,
que son finitos sobre los anillos locales C[D]Md y C[Z]Md , la identidad ϑ(Ψj ) = ϑ0 (ψj )
vale para todo j = 1, . . . , M .

Demostración: Considérese el morfismo surjectivo canónico π : C[D] → C[Z] in-


ducido por la inclusión Z ⊂ D. Por la propiedad de extensión de places (Teorema I)
se sigue que existe un C–place ℘ de C(D) que extiende π. Denotamos con Ω el cuerpo
residual asociado. En consecuencia, tenemos el siguiente diagrama conmutativo:

π / C[Z]

C[D]
_ _
σ
 
R℘ /Ω

donde el anillo local R℘ ⊂ C(D) asociado a ℘ contiene C[D] y σ es un monomorfismo.


Sea d0 ∈ D ∩ Z. Por la condición de robustez, la función racional Ψj pertenece a
la clausura entera del anillo C[D]Md0 y por lo tanto existe un polinomio P := T N +
aN −1 T N −1 + · · · + a0 ∈ C[D]Md0 [T ] que anula a Ψj . Sea V ⊂ D un conjunto abierto
Zariski, que contiene a d0 , donde todos los coeficientes ai están bien definidos. Por lo
tanto P = 0 también es una ecuación de dependencia entera para Ψj sobre el anillo
local de todo punto que se halla en D ∩ V. Como d0 ∈ V ∩ Z, concluı́mos que V ∩ Z
también es un subconjunto abierto Zariski denso de Z.
Puesto que el morfismo π también está bien definido en el anillo local del punto d0 ,
por el Teorema II se sigue que el anillo R℘ contiene al anillo C[D]Md0 y al elemento
entero Ψj . En consecuencia, el elemento ξ := ℘(Ψj ) se halla en el cuerpo Ω y es entero
sobre C[Z]Md0 . En particular, ξ es algebraico sobre C(Z) y π(P ) = 0 es una ecuación
de dependencia algebraica (no necesariamente minimal) para ξ sobre C(Z). Para evitar
notaciones innecesarias consideramos C(Z) como un subcuerpo de Ω.

52
Sea mξ ∈ C(Z)[T ] el polinomio unitario minimal de ξ sobre C(Z). Tenemos que
mξ es libre de cuadrados y su discriminante ∆ es no nulo. En consecuencia, existe
un conjunto abierto Zariski no vacı́o V 0 ⊆ Z tal que, para todo d ∈ V 0 , el polinomio
mξ (d, T ) está bien definido y resulta ∆(d) 6= 0, en otras palabras, el polinomio mξ (d, T )
es libre de cuadrados para todo d en este subconjunto abierto de Z. Sin pérdida de
generalidad podemos suponer V 0 ⊂ V ∩ Z y d0 ∈ V 0 (recuérdese que D ∩ Z se supone
denso en Z).
Sea I ⊂ C[D]Md0 [T ] el ideal generado por los polinomios univariados que se anulan
en Ψj (en particular, P ∈ I). Tenemos un isomorfismo natural
C[D]Md0 [Ψj ] ' C[D]Md0 [T ]/I.

Por otro lado, el morfismo π induce una aplicación ϕ : C[D]Md0 [T ] → C[Z]Md0 [T ]/mξ ,
cuyo núcleo contiene al ideal I: si Q(Ψj ) = 0, aplicando el place ℘ tenemos π(Q)(ξ) = 0,
por lo tanto π(Q) es divisible por el polinomio minimal mξ in C(Z)[T ]; puesto que π(Q)
y mξ pertenecen a C[Z]Md0 [T ] y mξ es unitario, la división ocurre en este anillo, y por
lo tanto π(Q) es un múltiplo de mξ en C[Z]Md0 [T ]. Resumiendo, tenemos el siguiente
diagrama:

C[D]Md0 π / C[Z]M
d 0

 
C[D]Md0 [Ψj ] / C[Z]M [T ]/mξ
ϕ d 0

Sea ahora ω ∈ C una raı́z de mξ (d0 , T ). Tenemos que


evd0
C[D]Md0 /9 C
sss
ss
ss
sev
s
s ω
 ss
C[Z]Md0 [T ]/mξ

conmuta, donde evω es la aplicación obtenida mediante la evaluación de toda función


racional de C[Z]Md0 en d0 y T en ω. Siguiendo el Teorema I, la aplicación evω ◦ ϕ :
C[D]Md0 [Ψj ] → C se puede extender a un C–place ϑω del cuerpo de fracciones C(D)
con valores en C ∪ {∞}. Este place también extiende la evaluación in d0 , su anillo local
asociado Rϑω contiene C[D]Md0 y verifica ϑω (Ψj ) = ω.
Por la hipótesis de robustez, el valor ϑω (Ψj ) no depende del place ϑω , lo que en
particular implica que es independiente de la elección de la raı́z ω. Por lo tanto el
polinomio mξ (d0 , T ) es de grado uno y por ende lo es mξ . En consecuencia el elemento
ξ es una función racional de C(Z).
Escribamos ψj := ξ. Afirmamos que con esta definición, las funciones racionales ψj
para 1 ≤ j ≤ M verifican el enunciado de la proposición.

53
Sea d ∈ D ∩ Z y sea ϑ0 : C(Z) → C ∪ {∞} un C–place que es finito sobre el anillo
local C[Z]Md . En particular, ϑ0 extiende la evaluación evd : C[Z]Md → C. Claramente
ϑ0 (ψj ) es finito pues ψj es entero sobre C[Z]Md . Si Rϑ0 ⊂ C(Z) ⊂ Ω denota su anillo de
valuación asociado, existe un place θ : Ω → C ∪ {∞} que extiende ϑ0 : Rϑ0 → C y, en
particular, es finito sobre C[Z]Md ⊂ Rϑ0 .
Finalmente, considérese el homomorfismo θ ◦ ℘ : C[D]Md [Ψj ] → C. Este morfismo
se puede extender a un C–place ϑ : C(D) → C ∪ {∞} finito sobre C[D]Md , y por lo
tanto vale ϑ0 (ψj ) = θ(ψj ) = θ ◦ ℘(Ψj ) = ϑ(Ψj ). Esto concluye la demostración de la
proposición.

7.3. Ejemplos de algoritmos robustos


En esta sección analizamos si los algoritmos que resuelven las familias de problemas
de interpolación introducidas en la Sección 6.2 son robustos.

7.3.1. Interpolación de Lagrange y de Lagrange–Hermite uni-


variada clásica: ejemplos 6.2.1 y 6.2.2
Los algoritmos que resuelven las familias de problemas de interpolación univariados
de Lagrange y de Lagrange–Hermite de las Subsecciones 6.2.1 y 6.2.2 respectivamente,
son ambos regulares, y por lo tanto, de acuerdo a la Observación 7.2, son trivialmente
robustos. Más interesante es el caso de la familia de problemas de interpolación de
Lagrange bivariada de la Subsección 6.2.3 que discutimos a continuación.

7.3.2. Robustez en puntos singulares: ejemplo 6.2.3


Ahora analizamos el algoritmo para la familia de problemas de interpolación dis-
cutida en la Subsección 6.2.3: la interpolación de Lagrange bivariado de una función
polinomial arbitraria f : C2 → C en los nodos (0, 0) y (u, v), donde (u, v) recorre la
curva abierta D := {X 3 − Y 2 = 0} \ {(−1, ±i)}. Este ejemplo difiere de los anteri-
ores en que la estructura de datos D de la familia de problemas de interpolación en
consideración no es suave en el punto (0, 0).
Procedemos a mostrar la robustez en (0, 0) del algoritmo ω ∗ : D∗ → Π1 , Ψ : D 99K
D∗ definido en la Subsección 6.2.3, donde D∗ := C3 , la codificación ω ∗ : D∗ → Π1
corresponde a la representación densa, y Ψ está definida por:

(f (u, v) − f (0, 0))u (f (u, v) − f (0, 0))v 


Ψ(u, v) := f (0, 0), , .
u2 + v 2 u2 + v 2

54
Puesto que X 2 + Y 2 = X 2 (1 + X) sobre la curva, tenemos las siguientes expresiones
equivalentes para las funciones racionales Ψ2 , Ψ3 ∈ C(D):

(f (X, Y ) − f (0, 0)) (f (X, Y ) − f (0, 0))X


Ψ2 (X, Y ) = , Ψ3 (X, Y ) = .
X(1 + X) Y (1 + X)

Primeramente analizamos si es posible definir el valor de Ψ2 en (0, 0) en el sentido


de la Definición 7.1. Claramente, el elemento 1/1 + X es una unidad en el anillo local
C[D]M(0,0) y ϑ(1/1 + X) = 1 para todo C–place ϑ cuyo anillo de valuación contiene
C[D]M(0,0) . Además, tenemos la siguiente identidad en C(D):

f (X, Y ) − f (0, 0) ∂f Y ∂f
= (0, 0) + (0, 0) + X Q1 (X, Y )+
X ∂X X ∂Y

Y2
Q2 (X, Y ) + Y Q3 (X, Y )
X
para polinomios Q1 , Q2 y Q3 adecuados. De la igualdad
2
Y2 X3

Y
−X = − Y = −X =0 (7.1)
X X2 X2

en C(D), concluimos que Y /X pertenece a la clausura entera de C[D]M(0,0) y por lo


tanto, para todo C–place ϑ finito sobre C[D]M(0,0) tenemos ϑ(Y /X) 6= ∞. Además, de
(7.1) concluimos que (Y /X)2 pertenece a M(0,0) Rϑ y por lo tanto Y /X pertenece al ideal
maximal de Rϑ . En consecuencia, tenemos ϑ(Y /X) = 0, lo que implica que ϑ(Ψ2 ) =
∂f ∂f
∂X
(0, 0). Esto muestra que el valor Ψ2 (0, 0) puede definirse como Ψ2 (0, 0) := ∂X (0, 0).
Con un análisis similar se infiere que ϑ(Ψ3 ) = 0 para todo C–place ϑ finito sobre
C[D]M(0,0) y por lo tanto, podemos definir Ψ3 (0, 0) := 0. Se sigue que el algoritmo
ω ∗ : D∗ → Π1 , Ψ : D 99K D∗ de la Subsección 6.2.3 es robusto en (0, 0) y que vale
∂f
Ψ(0, 0) = (f (0, 0), ∂X (0, 0), 0).
Cabe mencionar que mediante las mismas relaciones entre las variables X, Y es-
tablecidas en la discusión anterior es posible deducir que el algoritmo Ψ se extiende con
continuidad (en la topologı́a fuerte) al punto (0, 0), y que el valor lı́mite en este sentido
coincide con el hallado mediante places.

7.3.3. Robustez de algoritmos para interpolar polinomios co-


dificados por sus valores: ejemplo 6.2.4
Retomamos aquı́ el análisis de la familia de problemas de interpolación de la Sub-
sección 6.2.4: la reconstrucción de los polinomios n–variados con coeficientes complejos

55
que se evalúan por un straight–line program de longitud no escalar a lo sumo L, a par-
tir de sus valores en una sucesión de identificación. Siguiendo las notaciones de aquella
subsección, esta familia de problemas está representada por la estructura de datos DL,n
y la aplicación Φ : DL,n → OL,n ⊂ Π2L , que es la inversa de la aplicación polinomial
Ξ : OL,n → DL,n dada por la evaluación en una sucesión de identificación del conjunto

OL,n .
Considérese un algoritmo robusto ω ∗ : D∗ → OL,n , Ψ : DL,n 99K D∗ para esta familia
de problemas de interpolación. Como se mencionó en los comentarios a la Definición
7.1, de la hipótesis de robustez se sigue que para cada d ∈ DL,n tenemos un vector

bien definido Ψ(d) de la clausura D . En el siguiente lema se confirma que este vec-
tor Ψ(d) resulta un código de la solución Φ(d) ∈ OL,n del problema de interpolación
correspondiente al punto d.

Lema 7.5 Sea ω ∗ : D∗ → OL,n , Ψ : DL,n 99K D∗ un algoritmo robusto que resuelve
la familia de problemas de interpolación DL,n , Φ : DL,n → OL,n . Entonces se verifica
ω ∗ (Ψ(d)) = Φ(d) para todo d ∈ DL,n .

Demostración: Sea U el abierto Zariski de la clausura DL,n donde está definida


la aplicación racional Ψ y sea V := DL,n ∩ U. De la Definición 6.1 de algoritmo de
interpolación, es inmediato que ω ∗ (Ψ(d)) = Φ(d) para todo d ∈ V. Equivalentemente,
la aplicación racional Ξ ◦ ω ∗ ◦ Ψ coincide con la identidad en el conjunto V. Puesto que
V es un subconjunto denso de DL,n deducimos que Ξ ◦ ω ∗ ◦ Ψ es la aplicación racional
identidad. Por lo tanto, recordando que Ξ y ω ∗ son polinomiales, tenemos que para todo
d ∈ DL,n y todo C–place ϑ : C(DL,n ) → C ∪ {∞} finito sobre el anillo local C[DL,n ]Md ,
vale la igualdad (Ξ ◦ ω ∗ )(ϑ(Ψ)) = d. En otras palabras, ω ∗ (ϑ(Ψ)) = Φ(d) como se querı́a
demostrar.

56
Capı́tulo 8

Cotas inferiores de complejidad


para algoritmos robustos

En esta sección obtenemos los resultados principales de la Parte II, a saber, cotas
inferiores de complejidad (en el sentido de la Sección 6.3) de ciertas familias de pro-
blemas de interpolación. Nuestros resultados pueden clasificarse en dos grupos: cotas
inferiores en términos del número de nodos involucrados, que se presentan en la Sección
8.1, y cotas inferiores en términos del costo de la “longitud” de la representación de los
interpolantes, que son consideradas en la Sección 8.2.

8.1. Problemas de interpolación de Lagrange


En esta sección exhibimos cotas inferiores de complejidad de problemas de interpo-
lación de Lagrange. Primeramente, en la Sección 8.1.1 mostramos que la complejidad
de una familia de problemas de interpolación de Lagrange con N nodos, codificada
por un subconjunto abierto Zariski no vacı́o de todo el espacio afı́n CN , es lineal en el
número N de nodos, mostrando por lo tanto que los conocidos métodos de interpolación
son esencialmente óptimos. Reforzamos significativamente esta conclusión en la Sección
8.1.2 para algoritmos robustos, demostrando que la conclusión anterior también vale
para una familia de problemas de interpolación con N nodos que tienen interpolantes
“fáciles” de evaluar.

8.1.1. Familias codificadas por un abierto de Zariski no vacı́o


en el espacio afı́n
Sea D ⊂ C(n+1)N un conjunto abierto Zariski no vacı́o que codifica una familia de
problemas de interpolación de Lagrange n–variados de grado D con N nodos. Más
precisamente, supóngase que para cada d := (ξ1 , y1 , . . . , ξN , yN ) ∈ D con ξi ∈ Cn y

57
yi ∈ C, se tiene el problema de interpolación, que consiste en hallar un polinomio n–
variado p de grado a lo sumo D tal que p(ξi ) = yi , 1 ≤ i ≤ N . Supóngase además que
el problema está bien definido para todo d ∈ D, esto es, que para cada d ∈ D, existe
el correspondiente interpolante de manera que existe una aplicación Φ : D → ΠD que
asocia cada d ∈ D con un interpolante.
Tenemos el siguiente resultado:
Teorema 8.1 Sea D∗ ⊆ CM un conjunto construible para el cual existe un algoritmo
ω ∗ : D∗ → ΠD , Ψ : D 99K D∗ que resuelve la familia de problemas de interpolación de
Lagrange D, Φ : D → ΠD . Entonces M ≥ N .
En otras palabras, todo algoritmo que resuelve toda familia de problemas de inter-
polación de Lagrange codificada por un conjunto abierto Zariski con un número fijo de
nodos N tiene complejidad al menos lineal en N .

Demostración: Sea U un subconjunto abierto Zariski no vacı́o de D ⊂ C(n+1)N donde


la función racional Ψ es regular. Fı́jese un elemento a := (a1 , . . . , aN ) ∈ CnN tal que el
conjunto
A := {(y1 , . . . , yN ) ∈ CN |(a1 , y1 , . . . , aN , yN ) ∈ U}
contenga un conjunto abierto Zariski no vacı́o en CN . Un tal elemento a ∈ CnN debe
existir ya que U es un subconjunto abierto Zariski no vacı́o de C(n+1)N y la projección
es una aplicación abierta.
Considérese la aplicación de A a CN definida por la siguiente regla:
y 7→ (Φ(a, y)(a1 ), . . . , Φ(a, y)(aN )),
donde a := (a1 , . . . , aN ), y := (y1 , . . . , yN ) y (a, y) := (a1 , y1 , . . . , aN , yN ). De esta
definición se sigue que esta aplicación es simplemente la aplicación identidad sobre el
conjunto A. Por otro lado, por la definición de un algoritmo de interpolación tenemos
la identidad Φ = ω ∗ ◦ Ψ en U. Por lo tanto, la aplicación identidad sobre U también
se puede escribir como la composición idU = ϕ2 ◦ ϕ1 , donde ϕ1 : U → D∗ está definida
por y 7→ Ψ(a, y) y ϕ2 : D∗ → CN por d∗ 7→ (ω ∗ (d∗ )(a1 ), . . . , ω ∗ (d∗ )(aN )). Obviamente
las aplicaciones ϕ1 y ϕ2 son ambas regulares sobre sus dominios.
Puesto que la dimensión nunca aumenta bajo aplicaciones regulares y dim U = N ,
concluimos que M ≥ dim D∗ ≥ dim im(ϕ1 ) ≥ dim im(ϕ2 ◦ ϕ1 ) = dim U = N .

8.1.2. Una familia codificada por el gráfico de una aplicación


polinomial
Sea N ∈ N, sean T, X dos indeterminadas sobre C y sea
N
X −1
N
F (X, T ) := (T − 1) T iX i.
i=0

58
Considérese el conjunto construible D ⊂ C2N definido como:

D := {(x1 , y1 , . . . , xN , yN )| ∃ t ∈ C tal que yi = F (xi , t) para i = 1, . . . , N


y xi 6= xj para 1 ≤ i < j ≤ N }.

Sea U := {(x1 , . . . , xN ) ∈ CN |xi 6= xj para 1 ≤ i < j ≤ N } y sea σ : U × C → C2N


la siguiente aplicación polinomial:

σ(x1 , . . . , xN , t) := (x1 , F (x1 , t), . . . , xN , F (xN , t)).

Claramente D = Im(σ), lo que en particular implica que la clausura Zariski D es


irreducible. Para todo z := (x1 , y1 , . . . , xN , yN ) ∈ D, la fibra σ −1 es un conjunto finito y
por lo tanto, por el Teorema de la dimensión de las fibras [36], concluı́mos que dim D =
dim Im(σ) = N +1. [§I.6.3, Theorem] El conjunto D codifica una familia de problemas de
interpolación de Lagrange univariados con N nodos, donde el morfismo Φ : D → ΠN −1
asigna a cada z := (x1 , y1 , . . . , xN , yN ) ∈ D el único polinomio de la forma F (X, t)
(t ∈ C) que satisface las condiciones de interpolación definidas por z.
Obsérvese que en este caso la estructura de datos D que codifica la familia de
problemas de interpolación de Lagrange D, Φ : D → ΠN −1 no es un subconjunto
denso Zariski del espacio de nodos/valores C2N , como en la subsección anterior, sino
un subconjunto de dimensión N + 1 en un espacio ambiente 2N –dimensional.

Proposición 8.2 Con las notaciones de arriba, supóngase que existe un conjunto con-
struible D∗ ⊆ CM para el cual existe un algoritmo robusto ω ∗ : D∗ → ΠN −1 , Ψ : D 99K
D∗ que resuelve la familia de problemas de interpolación D, Φ : D → ΠN −1 . Entonces
M ≥ N.

Demostración: De la definición de algoritmo de interpolación (Definición 6.1), tene-


mos que para cada z := (x1 , y1 , . . . , xN , yN ) en el dominio de Ψ, el polinomio (ω ∗ ◦ Ψ)(z)
es un polinomio univariado asume el valor yi en cada xi para i = 1, . . . , N . Sea
U un subconjunto abierto de D incluı́do en el dominio de Ψ, y fı́jese un elemento
(a1 , b1 , . . . , aN , bN ) ∈ U. Escrı́base a := (a1 , . . . , aN ).
Considérese la aplicación polinomial ε : C → D definida por:

ε(t) := (a1 , F (a1 , t), . . . , aN , F (aN , t)).

Entonces ψ := Ψ ◦ ε es una aplicación racional sobre la recta C. Escrı́base ψ :=


(ψ1 , . . . , ψM ), con ψj ∈ C(T ), para j = 1, . . . , M . Afirmamos que cada ψj es regular
en un entorno de T = η para cada elemento η ∈ GN , donde GN ⊂ C es el conjunto de
todas las raı́ces N –ésimas de la unidad.
Para probar esta afirmación, obsérvese que la hipótesis de robustez implica que Ψj es
entera sobre el anillo local C[D]M , donde M denota el ideal maximal asociado al punto

59
(a1 , 0, . . . , aN , 0). Por lo tanto existe s ∈ N y polinomios Pi , Qi ∈ C[X1 , Y1 , . . . , XN , YN ]
con Qi (a1 , 0, . . . , aN , 0) 6= 0 para 1 ≤ i ≤ s tales que
Ps−1 s−1 P0
Ψsj + Ψj + · · · + =0
Qs−1 Q0
en C(D).
Si escribimos pi := Pi ◦ ε y qi := Qi ◦ ε para 1 ≤ i ≤ s, de la identidad anterior
obtenemos la siguiente identidad en C(T ):
ps−1 s−1 p0
ψjs + Ψj + · · · + = 0,
qs−1 q0
y ahora las funciones racionales pqii pertenecen al anillo local C[T ]N donde N ⊂ C[T ]
es el ideal principal generado por T − η. Puesto que el anillo C[T ]N es integralmente
cerrado en su cuerpo de fracciones, tenemos que ψj ∈ C[T ]N para todo j = 1, . . . , M .
Esto muestra que la aplicación ψj es regular en un entorno de η para todo η ∈ GN y
concluye la demostración de nuestra afirmación.
Ahora considérese la aplicación polinomial ϕ : D∗ → CN definida por
ϕ(u) := (ω ∗ (u)(a1 ), . . . , ω ∗ (u)(aN )).
La composición θ := ϕ ◦ Ψ ◦ ε : C → CN está definida simplemente por
θ(t) = (F (a1 , t), . . . , F (aN , t)),
y por lo tanto es regular en un entorno de todo η ∈ GN . Si GN := {η1 , . . . , ηN }, aplicando
la Regla de la cadena para cada ηj ∈ GN , tenemos:
 PN −1 
i i
i=0 η j a 1
 
 P 
N −1 i i 

i=0 η a
j 2 
N ηjN −1 

..  = Dθ(ηj )

 . 

 .. 
 . 
PN −1 i i
i=0 ηj aN
= Dϕ((Ψ ◦ ε)(ηj )) D(Ψ ◦ ε)(ηj )
= Dϕ(Ψ(a1 , 0, . . . , aN , 0)) D(Ψ ◦ ε)(ηj ). (8.1)
1
Sea vj := N ηjN −1
Dθ(ηj ) ∈ CN para cada j = 1, . . . , N . La relación (8.1) implica que to-
dos los vectores vj pertenecen a la imagen de la matriz Jacobiana Dϕ(Ψ(a1 , 0, . . . , aN , 0)).
Afirmamos que estos vectores son linealmente independientes. Para probar esta afir-
mación, denótese por M la matriz N × N que tiene los vectores vj como sus columnas.
Tenemos la siguiente descomposición:
M = V (η1 , . . . , ηN )t V (a1 , . . . , aN ),

60
donde V (η1 , . . . , ηN ) := (ηij−1 )1≤i,i≤N es la matriz de Vandermonde asociada al conjunto
GN de todas las raı́ces N -ésimas de la unidad, V (a1 , . . . , aN ) := (aj−1
i )1≤i,i≤N es la matriz
de Vandermonde asociada a los números complejos a1 , . . . , aN (que son distintos de a
pares) y t denota la trasposición. Puesto que ambas matrices del miembro derecho de
la última expresión son no singulares, también lo es M.
Como consecuencia de nuestra afirmación, el rango de la matriz
Dϕ(Ψ(a1 , 0, . . . , aN , 0)) ∈ CN ×M es al menos N y por lo tanto M ≥ N . Esto concluye
la demostración de la proposición.

8.2. Polinomios codificados por sus valores: la re-


construcción es difı́cil
Con las nociones y notaciones de la Subsección 6.2.4, aquı́ mostramos que la comple-
jidad de todo algoritmo robusto de interpolación que reconstruye todos los polinomios
multivariados de una complejidad dada mediante una sucesión de identificación es in-
trı́nsecamente exponencial.

Teorema 8.3 Sea D∗ ⊆ CM un conjunto construible para el cual existe un algoritmo


robusto ω ∗ : D∗ → OL,n , Ψ : DL,n 99K D∗ que resuelve la familia de problemas de
interpolación DL,n , Φ : DL,n → OL,n de la Subsección 6.2.4. Entonces se verifica la
siguiente desigualdad:
 b L +1c 
2 2 −1+n
M≥ = 2O(Ln) .
n

Demostración: Sea ` := b L2 + 1c y sea Y el siguiente subconjunto de Π2L :


` −1
2X
Y := {t (λ1 X1 + · · · + λn Xn )i ; (t, λ1 , . . . , λn ) ∈ Cn+1 }.
i=0

Teniendo en cuenta que la longitud no escalar de cualquier g ∈ Y está acotada por


2(` − 1), concluı́mos que Y ⊆ OL,n . Denotemos con Y su clausura Zariski en CNL .
Vemos que Y es una subvariedad irreducible de OL,n , pues es la clausura Zariski de la
imagen bajo un morfismo regular de la variedad irreducible Cn+1 .
Sea Z la subvariedad irreducible afı́n de DL,n definida por Z := Ξ(Y) (nótese que Z
es cerrado Zariski pues Ξ : OL,n → DL,n es una aplicación polinomial finita). Obsérvese
que el punto 0 pertenece a Z.
Sea U ⊂ DL,n un conjunto abierto Zariski no vacı́o donde las funciones racionales Ψj
de la aplicación racional Ψ están definidas. Si bien algunas de estas funciones pueden

61
no estar definidas en Z, la Proposición 7.4 asegura la existencia de funciones racionales
ψj ∈ C(Z) que juegan el rol de restricciones de las Ψj a la subvariedad Z.
No asumimos que el punto 0 se halla en el abierto U. Sin embargo, la hipótesis de
robustez implica que estas funciones racionales ψj verifican ecuaciones de dependencia
entera sobre el anillo local C[Z]M , donde M denota el ideal maximal asociado al punto
0.
Sean T, U1 , . . . , Un nuevas indeterminadas, U := (U1 , . . . , Un ) y sea
` −1
2X
gT,U (X) := T (U1 X1 + · · · + Un Xn )i .
i=0

Los polinomios fi := gT,U (γi ) ∈ C[T, U ], 1 ≤ i ≤ nL inducen las funciones coorde-


nadas de una aplicación polinomial dominante f : Cn+1 → Z ⊆ CnL . Sea f ∗ : C(Z) →
C(T, U ) el homomorfismo de cuerpos de funciones racionales inducido por f y para cada
ı́ndice j sea ψej la función racional en C(T, U ) definida como ψej := f ∗ (ψj ) (es decir, ψej
es la composición ψj ◦ f : Cn+1 99K C).
Ahora bien, mediante el morfismo f ∗ podemos identificar:
el anillo de coordenadas C[Z] con C[f1 , . . . , fnL ],
el ideal maximal M asociado al punto 0 con el ideal (f1 , . . . , fnL ),
el cuerpo de fracciones C(Z) con C(f1 , . . . , fnL ),
el anillo local C[Z]M con el anillo S −1 C[f1 , . . . , fnL ], donde S es el subconjunto
multiplicativo de C[f1 , . . . , fnL ] definido por
S := {P (f1 , . . . , fnL )|P ∈ C[Y1 , . . . , YnL ], P (0, . . . , 0) 6= 0} ⊂ C[T, U ].

De esta manera, podemos considerar a C[Z]M como un subanillo de S −1 C[T, U ] y


C(Z) como un subcuerpo de C(T, U ).
En consecuencia, como en particular las funciones racionales ψj (1 ≤ j ≤ M ) son en-
teras sobre C[Z]M , deducimos que las funciones racionales ψej pertenecen a S −1 C[T, U ],
que es un anillo integralmente cerrado.
Para cada u ∈ C denotemos con M(0,u) al ideal maximal asociado al punto (0, u) ∈
n+1
C en el anillo C[T, U ]. De la identidad fi (0, U ) = g0,U (γi ) = 0 para 1 ≤ k ≤ nL y de
la definición del conjunto S, deducimos que S −1 C[T, U ] es un subanillo del anillo local
C[T, U ]M(0,u) para todo u ∈ C. En particular las funciones racionales ψej pertenecen al
anillo local C[T, U ]M(0,u) para todo u ∈ C. En otras palabras el punto (0, u) pertenece
al dominio de definición de la función racional ψej para todo u ∈ C.
Sea una ecuación de dependencia entera de ψej sobre S −1 C[f1 , . . . , fnL ]:
pm−1 e m−1 p0
(ψej )m + (ψj ) + ··· + = 0,
qm−1 q0

62
donde pi , qi ∈ C[f1 , . . . , fnL ] y qi ∈ S. Especializando T = 0 los polinomios pi , qi resultan
números complejos pei y qei con qei 6= 0. En consecuencia, de la anterior ecuación de
dependencia entera deducimos que la función racional ψej (0, U ) satisface una ecuación
mónica cuyos coeficientes son números complejos, y por lo tanto

ψej (0, U ) ∈ C para 1 ≤ j ≤ M, (8.2)

en otras palabras, las funciones racionales ψej (0, U ) no dependen de las variables U .
Sea Σ := {α := (α1 , . . . , αn ) ∈ Nn0 ; |α| := α1 + · · · + αn ≤ 2L }. Obsérvese que Σ
L
consiste de NL := 2 n+n elementos. Puesto que todo polinomio de OL,n tiene grado


acotado por 2L , para cada α ∈ Σ consideraremos la función coordenada θα de C[OL,n ]


que, aplicada a f ∈ OL,n , da el α-ésimo coeficiente de f .
En particular, para cada gt,u ∈ Y tenemos
` −1
2X X i!
gt,u = t uα1 xα1 . . . uαnn xαnn
i=0 α ∈ Nn
α1 !α2 ! . . . αn ! 1 1
0
|α| = i

X |α|!
= t uα1 1 xα1 1 . . . uαnn xαnn ,
α ∈ Nn
α1 !α2 ! . . . αn !
0
0 ≤ |α| ≤ 2` − 1

y por lo tanto, θα (gt,u ) = α1t|α|!


!...αn !
uα para todo α ∈ Σ.
Para ρ ∈ C fijo definimos la aplicación βρ : C → Cn+1 como
` 2` (n−1)`
βρ (t) := (t, ρ, ρ2 , ρ2 , . . . , ρ2 ).

De los argumentos anteriores se infiere que las ψej son regulares en un entorno de βρ (0)
y por lo tanto la aplicación

σρ := ω ∗ ◦ ψe ◦ βρ ,

donde ψe := (ψe1 , . . . , ψeM ), está bien definida y es regular en un entorno de t = 0 (re-


cuérdese que ω ∗ se supone siempre una función polinomial definida en todo el espacio).
Más aun, podemos dar una descripción explı́cita de σρ en un entorno de t = 0
como sigue: sea ∆ρ un disco en torno de t = 0 tal que todas las ψej son regulares en
βρ (t). Para cada t ∈ ∆ρ , el punto f (βρ (t)) = (gt,ρ (γ1 ), . . . , gt,ρ (γnL )), siendo gt,ρ :=
gt,ρ,ρ2` ,ρ22` ,...,ρ2(n−1)` , se halla en DL,n ∩ Z. Combinando la hipótesis de robustez con el
Lema 7.5, tenemos la identidad:

ω ∗ ◦ Ψ(f (βρ (t))) = Φ ◦ ω(f (βρ (t))) (8.3)

63
Ahora, para cada C–place ϕ : C(T, U ) → C∪{∞} finito sobre el anillo local C[T, U ]Mβρ (t) ,
la composición ϑ0 := ϕ ◦ f ∗ : C(Z) → C ∪ {∞} es un C–place finito sobre el anillo local
C[Z]Mf (βρ (t)) . Como ψej está definida en βρ (t) deducimos que

ϑ0 (ψj ) = ϕ(f ∗ (ψj )) = ϕ(ψej ) = ψej (βρ (t)). (8.4)

Por la Proposición 7.4, para cada j el valor Ψj (f (βρ (t))) es igual a ϑ0 (ψj ), con lo cual
a partir de (8.3) y (8.4) deducimos la identidad:

σρ (t) = Φ ◦ ω(f (βρ (t))), (8.5)

y esta última expresión es exactamente la tupla de coeficientes de gt,ρ . En suma, tene-


mos:
 
|α|! α1 +···+αn 2(n−1)`
σρ (t) = t ρ ;α ∈ Σ .
α1 ! . . . αn !
Luego, podemos calcular explı́citamente la diferencial:
 
|α|! α1 +···+αn 2(n−1)`
dσρ (0) = ρ ; α ∈ Σ ∈ CN L .
α1 ! . . . αn !
Nótese que todos los exponentes de ρ en las coordenadas de dσρ (0) son números nat-
urales distintos pues las coordenadas αi que aparecen en la expresión de arriba son
menores o iguales que 2` − 1. Por otro lado, aplicando la regla de la cadena en el punto
t = 0, obtenemos:

Dσρ (0) = Dω ∗ (ψe ◦ βρ (0))D(ψe ◦ βρ )(0).

De (8.2) tenemos que ψe ◦ βρ (0) es un vector complejo independiente de ρ. Por lo tanto


concluı́mos que la matriz C := Dω ∗ (ψe ◦ βρ (0)) es una matriz constante (i.e., indepen-
diente de ρ) en CNL ×M . Por lo tanto, puesto que Dσρ (0) = CD(ψe ◦ βρ (0))(0) vale para
todo ρ ∈ C, concluı́mos que el vector Dσρ (0) pertenece al rango de C para todo ρ ∈ C.
Por el Lema 8.4 siguiente, deducimos que, para valores ρ1 , . . . , ρNL ∈ C adecuados,
los vectores Dσρi (0) son linealmente independientes y pertenecen al rango de C, lo
L
` 2b 2 +1c −1+n
que implica M ≥ NL = 2 −1+n
 
n
= n
. Esto concluye la demostración del
teorema.

Lema 8.4 Sean m ∈ N, n1 < n2 < · · · < nm ∈ N0 y sean a1 , . . . , am ∈ C elemen-


tos no nulos. Sean Z1 , . . . , Zm indeterminadas sobre C y sea M := (Mi,j )1≤i,j≤m ∈
n
C[Z1 , . . . , Zm ]m×m la matriz definida por Mi,j := aj Zi j . Entonces det(M ) 6= 0.
En particular, existen elementos ρ1 , . . . , ρm ∈ C de norma arbitrariamente pequeña
n
para los cuales la matriz (aj ρi j )1≤i,j≤m es no singular.

64
Demostración: Argumentamos por inducción en m. Puesto que el enunciado es obvio
para m = 1, suponemos m > 1. Desarrollando el determinante por la última columna de
M , vemos que det M = am Z1nm det Q1 +· · ·+am Zm nm
det Qm , donde todas las matrices Qi
tienen determinante no nulo, y por su forma particular concluimos que grZj (Qi ) ≤ nm−1
para 1 ≤ i, j ≤ m. En particular, am det Q1 es el coeficiente de la mayor potencia de Z1
que aparece en det M y es no nulo. Por lo tanto det M es no nulo.

65
66
Bibliografı́a

[1] A. Alder, Grenzrang und Grenzkomplexität aus algebraischer und topologischer sicht, Ph.D. thesis,
Universität Zürich, Philosophische Fakultät II, 1984.
[2] D. Bini and V. Pan, Polynomial and matrix computations, Progress in Theoretical Computer
Science, Birkhäuser, Boston, 1994.
[3] T. Bloom and J.-P. Calvi, A continuity property of multivariate Lagrange interpolation, Math.
Comp. 66 (1997), no. 220, 1561–1577.
[4] P. Bürgisser, M. Clausen, and M.A. Shokrollahi, Algebraic complexity theory, Grundlehren Math.
Wiss., vol. 315, Springer, Berlin, 1997.
[5] A. Cafure and G. Matera, Improved explicit estimates on the number of solutions of equations
over a finite field, Finite Fields Appl. 12 (2006), no. 2, 155–185.
[6] D. Castro, M. Giusti, J. Heintz, G. Matera, and L.M. Pardo, The hardness of polynomial equation
solving, Found. Comput. Math. 3 (2003), no. 4, 347–420.
[7] D. Cox, J. Little, and D. O’Shea, Using algebraic geometry, Grad. Texts in Math., vol. 185,
Springer, New York, 1998.
[8] C. de Boor, On multivariate polynomial interpolation, Surv. Approx. Theory 1 (2005), 46–69.
[9] C. de Boor and A. Ron, On multivariate polynomial interpolation, Constr. Approx. 6 (1990),
no. 3, 287–302.
[10] , The least solution for the polynomial interpolation problem, Math. Z. 210 (1992), no. 3,
347–378.
[11] D. Eisenbud, Commutative algebra with a view toward algebraic geometry, Grad. Texts in Math.,
vol. 150, Springer, New York, 1995.
[12] I. Emiris and B. Mourrain, Computer algebra methods for studying and computing molecular
conformations, Algorithmica 25 (1999), no. 2-3, 372–402, Special Issue on Algorithms for Com-
putational Biology.
[13] D.K. Faddeev and V.N. Faddeeva, Computational methods of linear algebra, Freeman, San Fran-
cisco, 1963.
[14] N. Fitchas, M. Giusti, and F. Smietanski, Sur la complexité du théorème des zéros, Approximation
and Optimization in the Caribbean II, Proceedings 2nd International Conference on Non–Linear
Optimization and Approximation (J. Guddat et al, ed.), Approximation and Optimization, vol. 8,
Peter Lange Verlag, Frankfurt am Main, 1995, pp. 247–329.
[15] W. Fulton, Intersection theory, Springer, Berlin Heidelberg New York, 1984.

67
[16] M. Gasca and T. Sauer, Polynomial interpolation in several variables, Adv. Comput. Math. 12
(2000), no. 4, 377–410.
[17] M. Gasca and T. Sauer, On the history of polynomial interpolation, J. Comput. Appl. Math. 122
(2000), no. 1–2, 23–35.
[18] M. Giusti, K. Hägele, J. Heintz, J.E. Morais, J.L. Montaña, and L.M. Pardo, Lower bounds for
Diophantine approximation, J. Pure Appl. Algebra 117,118 (1997), 277–317.
[19] M. Giusti, J. Heintz, J.E. Morais, J. Morgenstern, and L.M. Pardo, Straight–line programs in
geometric elimination theory, J. Pure Appl. Algebra 124 (1998), 101–146.
[20] M. Giusti, J. Heintz, J.E. Morais, and L.M. Pardo, When polynomial equation systems can be
solved fast?, Applied Algebra, Algebraic Algorithms and Error Correcting Codes, Proceedings
AAECC-11 (Berlin) (G. Cohen, M. Giusti, and T. Mora, eds.), Lecture Notes in Comput. Sci.,
vol. 948, Springer, 1995, pp. 205–231.
[21] M. Giusti, G. Lecerf, and B. Salvy, A Gröbner free alternative for polynomial system solving, J.
Complexity 17 (2001), no. 1, 154–211.
[22] J. Heintz, Definability and fast quantifier elimination in algebraically closed fields, Theoret. Com-
put. Sci. 24 (1983), no. 3, 239–277.
[23] J. Heintz, G. Matera, and A. Waissbein, On the time–space complexity of geometric elimination
procedures, Appl. Algebra Engrg. Comm. Comput. 11 (2001), no. 4, 239–296.
[24] J. Heintz and C. P. Schnorr, Testing polynomials which are easy to compute, International Sympo-
sium on Logic and Algorithmic, Zurich 1980, Monogr. Enseig. Math., vol. 30, 1982, pp. 237–254.
[25] T. Krick and L.M. Pardo, A computational method for Diophantine approximation, Algorithms
in Algebraic Geometry and Applications, Proceedings of MEGA’94 (Boston) (L. González-Vega
and T. Recio, eds.), Progr. Math., vol. 143, Birkhäuser Boston, 1996, pp. 193–254.
[26] L. Kronecker, Über Einige Interpolationsformeln für Ganze Functionen Mehrer Variabeln, Monats-
berichte der Königlich Preussischen Akademie der Wissenschafften zu Berlin vom Jahre 1865,
686–691.
[27] E. Kunz, Introduction to commutative algebra and algebraic geometry, Birkhäuser, Boston, 1985.
[28] S. Lang, Algebra, third ed., Addison–Wesley, Reading, Massachusetts, 1993.
[29] H.M. Möller and T. Sauer, H-bases for polynomial interpolation and system solving, Adv. Comput.
Math. 12 (2000), no. 4, 335–362.
[30] P. Olver, On multivariate interpolation, Stud. Appl. Math. 116 (2006), no. 2, 201–240.
[31] L.M. Pardo, How lower and upper complexity bounds meet in elimination theory, Applied Algebra,
Algebraic Algorithms and Error Correcting Codes, Proceedings of AAECC–11 (Berlin) (G. Cohen,
M. Giusti, and T. Mora, eds.), Lecture Notes in Comput. Sci., vol. 948, Springer, 1995, pp. 33–69.
[32] J. Sabia and P. Solernó, Bounds for traces in complete intersections and degrees in the Nullstel-
lensatz, Appl. Algebra Engrg. Comm. Comput. 6 (1996), no. 6, 353–376.
[33] T. Sauer, Gröbner basis, h–bases and interpolation, Trans. Amer. Math. Soc. 353 (2001), no. 6,
2293–2308.
[34] J.T. Schwartz, Probabilistic algorithms for verification of polynomial identities, EUROSAM ’79:
Proceedings of International Symposium on Symbolic and Algebraic Computation, Marseille 1979
(Berlin), Lecture Notes in Comput. Sci., vol. 72, Springer, 1979, pp. 200–215.

68
[35] I.R. Shafarevich, Basic algebraic geometry, Springer, Berlin Heidelberg, 1974.
[36] I.R. Shafarevich. Basic Algebraic Geometry: Varieties in Projective Space, Springer, Berlin Hei-
delberg New York, 1994.
[37] W. Vogel, Results on Bézout’s theorem, Tata Inst. Fundam. Res. Lect. Math., vol. 74, Tata Inst.
Fund. Res., Bombay, 1984.
[38] J. von zur Gathen and J. Gerhard, Modern computer algebra, Cambridge Univ. Press, Cambridge,
1999.
[39] O. Zariski and P. Samuel, Commutative algebra II, Grad. Texts in Math., vol. 39, Springer, New
York, 1960.
[40] R. Zippel, Probabilistic algorithms for sparse polynomials, EUROSAM ’79: Proceedings of Inter-
national Symposium on Symbolic and Algebraic Computation, Marseille 1979 (Berlin), Lecture
Notes in Comput. Sci., vol. 72, Springer, 1979, pp. 216–226.

69

También podría gustarte