Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
LIBROCON ✐ 2000/9/17 ✐ page i ✐ ✐ Introducción v Capítulo 1. Breve reseña histórica 1. Introducción 2. La vida de Cantor 3. Desarrollo de la teoría de conjuntos por otros matemáticos 1 2 3 19 Capítulo 2. Teoría elemental de conjuntos 1. Introducción 2. Los axiomas 3. Órdenes 4. Buen orden 5. Cortaduras 6. Los números naturales 7. Ordinales 8. Relaciones bien fundadas 9. La jerarquía de Von Neumann 10. El rango 11. Números cardinales 12. Equivalentes del axioma de elección 13. Aritmética cardinal 14. Aritmética de ordinales y más sobre cardinales 15. Conjuntos numerables e innumerables 16. Cardinales regulares y singulares 17. Sucesiones de ordinales 18. Ejercicios 29 30 31 43 45 47 50 56 66 74 76 77 82 84 88 96 99 108 111 Capítulo 3. Cardinales 1. Los álef 2. Sumas débiles 3. Los números beth 4. HGC 5. Cardinales inaccesibles 6. Cubiertas de conjuntos 7. Teoría PCF 8. Ejercicios 125 126 135 142 147 149 154 162 163 i ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page ii ✐ ✐ Capítulo 4. Lógica 171 1. Introducción 172 2. Signaturas 173 3. Estructuras matemáticas 174 4. Homomorfismos 177 5. Lenguajes formales 178 6. Términos y fórmulas 180 7. Inducción y recursión sobre la construcción de términos y fórmulas186 8. Modelos 190 9. La relación de consecuencia lógica 200 10. Modelos y sistemas axiomáticos 205 11. Un cálculo lógico 207 12. El teorema de completud de Gödel 218 13. Conjuntos y relaciones definibles 236 14. Los teoremas de incompletud de Gödel 248 15. Formas normales prenexa y de Skolem 249 16. El teorema de Herbrand 255 17. Ejercicios 260 Capítulo 5. Teoría de modelos 1. Modelos infinitos 2. Clases elementales y ∆0 -elementales 3. Un poco de topología y el teorema de compacidad 4. Cadenas de modelos 5. Teorías y clases axiomatizables 6. Diagramas 7. Existencia de subestructuras y extensiones elementales 8. Extensiones conservativas y extensiones por definiciones 9. Categoricidad 10. La teoría ΦAP y la teoría Teo(N) 11. Aplicaciones a la teoría de gráficas 12. Funciones de Skolem 13. Más aplicaciones a campos 14. Teorema de consistencia de Robinson 15. Indicernibles 16. Ejercicios 277 278 281 285 287 294 297 313 317 323 328 338 340 343 344 352 358 ii ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page iii ✐ ✐ Conjuntos y modelos. Curso avanzado Capítulo 6. Ultrafiltros y ultraproductos 1. Filtros 2. Ultrapotencias 3. Propiedades de los ultraproductos 4. Ejemplos 5. Campos real cerrados 6. Ejercicios 369 370 383 392 395 399 405 Capítulo 7. Combinatoria infinita 1. Introducción 2. Funciones normales 3. El lema de la raíz 4. Clubes y conjuntos estacionarios 5. El teorema de Silver 6. El principio ♦ y otros principios combinatorios 7. 2ℵ0 < 2ℵ1 implica una versión débil de ♦. 8. Árboles 9. Relaciones flecha 10. Cardinales débilmente compactos 11. Aplicaciones al álgebra Apéndice 12. Ejercicios 413 414 415 421 426 439 447 463 474 493 504 511 519 521 Capítulo 8. Relativización y absolutez 1. Relativización de una fórmula respecto a un ∈-término 2. Absolutez de fórmulas 3. Relativización de términos respecto a términos 4. Absolutez de LTC-términos 5. Relativización y absolutez de cardinales 6. Pruebas de consistencia relativa 7. Principios de reflexión 8. Jerarquía de Lévy 9. Ejercicios 531 532 542 545 552 561 566 575 592 601 Capítulo 9. El universo construible 1. Lenguaje LV 2. El universo construible 607 610 628 iii ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page iv ✐ ✐ 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Operaciones de Gödel El axioma de constructibilidad Axioma de elección en L La hipótesis generalizada del continuo en L Algunos principios combinatorios en L Aplicaciones Un ejemplo en teoría de la medida Más sobre cardinales débilmente compactos 0# Ejercicios 635 644 657 665 672 681 685 693 704 715 Bibliografía 731 Índice de símbolos 739 Índice Contenido 745 iv ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page v ✐ ✐ Introducción La obra que el lector tiene en sus manos surge por las siguientes razones. Los autores han impartido el curso de teoría de conjuntos en numerosas ocasiones (incluso con otros nombres, ante la ausencia de cursos de Teoría de Conjuntos II, III, etc.) en la uami y la unam. En el nivel de licenciatura, es usual que los estudiantes no puedan seguir un texto en inglés o alemán, de modo que su estudio se ve dramáticamente limitado. Por supuesto que este problema es válido no sólo en la teoría de conjuntos, sino en muchas otras disciplinas. Pero aun en el caso del posgrado, en que los alumnos suelen dominar un idioma extranjero, es difícil encontrar un texto de teoría de conjuntos que tome a los alumnos de la teoría elemental y los lleve a entender los nuevos avances en el área, es decir, un texto de nivel avanzado, que es como nosotros clasificamos este libro. En consecuencia, pretendemos cubrir dos carencias en la literatura disponible: un texto en español y, lo que es más importante, una obra que permita al estudiante de posgrado obtener los conocimientos necesarios para incorporarse a la investigación. Un libro que no obligue al lector a buscar nociones, técnicas o resultados previos en un sinfín de revistas o libros, sino que permita la adquisición gradual pero continua de las ideas necesarias para cada etapa del aprendizaje. El presente texto se ha utilizado en numerosos cursos, principalmente en la uam, en donde se ha retroalimentado con las opiniones de los alumnos, lo que ha permitido incluir el material necesario y realizar las modificaciones pertinentes. Otra razón para escribir este libro fue la necesidad de cubrir algunos temas que casi no se encuentran en otros textos ([Am97] o [Her98], por citar algunos), o que sólo aparecen en artículos de investigación inaccesibles, por su nivel, para el lector promedio. Además, el texto es concebido como el primer volumen de una serie que pretende exponer temas avanzados de la teoría de conjuntos, fundamentalmente la teoría de modelos internos o modelos núcleo, que ha merecido gran atención de los estudiosos de la teoría de conjuntos, en buena v ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page vi ✐ ✐ Introducción medida debido al trabajo de R. B. Jensen. Esta excepcionalmennte bella pero muy complicada teoría requiere de gran cantidad de conocimientos previos, los cuales pretendemos cubrir en una serie de dos volúmenes. Sería poco razonable generar varios textos sólo con el propósito de estudiar un área específica de la teoría de conjuntos; por ello, cada uno de los volúmenes está pensado como un compendio de resultados útiles para la teoría de modelos núcleo y también para cualquier matemático activo en otras áreas, como el álgebra, la teoría de la medida, la probabilidad o la topología. Los resultados se presentan en forma sistemática y autosuficiente, es decir, sin que el lector tenga que referirse a otro texto para obtener una demostración completa, excepción hecha de las aplicaciones al álgebra o a la topología, en las que se requieren conocimientos de esas disciplinas. El libro comienza con un apartado “histórico”. Se considera importante restablecer la figura de Cantor como fundador e impulsor de la teoría de conjuntos, quien además introdujo ideas y métodos absolutamente originales. También se presenta un esbozo de la historia de esta teoría, y se menciona a los principales personajes que han influido en ella. En general los estudiantes presentan tal diversidad en su grado de conocimiento de la teoría de conjuntos, que es necesario dedicar algunas semanas a uniformar a la audiencia. Por ello, el capítulo 2 presenta con todo detalle la teoría elemental de conjuntos, junto con temas fundamentales para la teoría moderna que en pocas ocasiones aparecen en textos introductorios. Tal es el caso del tratamiento de clases, de las relaciones bien fundadas, etc., temas imprescindibles incluso en otras áreas de las matemáticas. Sugerimos al lector novicio leer con detenimiento ese capítulo, y al experimentado, al menos hojearlo, pues seguramente encontrará materias desconocidas para él. El capítulo 3 consiste de un estudio sistemático de la aritmética cardinal, en particular dentro de la teoría ZFE . Presenta un estudio detallado de los números álef e introduce los números beth, indispensables en la determinación de cardinalidades de ciertos sistemas de conjuntos, como ideales, ultrafiltros o los niveles de las jerarquías de Von Neumann, Gödel o Jensen. Involucra la exponenciación de cardinales con ayuda de las fórmulas de recursión de Hausdorff, Tarski y Bernstein, o de la hipótesis (generalizada) del continuo, para finalmente estudiar cubiertas de conjuntos. El capítulo 4 es un breve “curso” de lógica matemática que abarca sólo lo indispensable: estructuras matemáticas, morfismos entre ellas, sintaxis y vi ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page vii ✐ ✐ Conjuntos y modelos. Curso avanzado semántica de la lógica de primer orden, un cálculo de secuencias, para continuar con el teorema de completud de Gödel y el teorema de compacidad. Finalmente se estudian conjuntos y relaciones definibles. No creimos conveniente remitir al lector a la abundante literatura sobre esta materia (p. ej., [ToSo95]), pues generalmente los libros sobre lógica matemática tratan muchos temas innecesarios para nuestros propósitos. El único resultado que utilizamos en varias ocasiones y que sólo se formula pero no se demuestra, es el teorema de incompletud de Gödel, cuya demostración se pospone para el segundo volumen. El siguiente capítulo, el 5, está dedicado a los fundamentos de la teoría de modelos. Se presentan los importantes teoremas de Löwenheim-Skolem, que aseguran la existencia de modelos de ciertas cardinalidades. Estudiamos teorías, diagramas, extensiones por definición. También se incluye un breve análisis de categoricidad. Muchos de estos temas originan líneas de investigación en la moderna teoría de modelos. El capítulo de ultraproductos 6 incluye un tratamiento de la teoría de ultrafiltros extenso como se requiere para desarrollar los ultraproductos. Este es un método para generar modelos de extraordinaria importancia, por lo que decidimos conformar un capítulo aparte. El capítulo 7 se dedica a la combinatoria infinita, es decir, aritmética cardinal más sofisticada, que en muchos casos da lugar a principios independientes de ZFE . Incluimos funciones normales, familias casi disjuntas, clubes y conjuntos estacionarios. Se presenta un extenso tratamiento del principio ♦ y muchas de sus equivalencias, para continuar con árboles y relaciones flecha o cálculo de particiones. Finalizamos con cardinales débilmente compactos. El gran ausente en esta sección es el axioma de Martin, cuyo estudio hemos pospuesto para el segundo volumen. Estos capítulos constituyen la primera parte, que pudiéramos llamar de nivel medio, la cual involucra conocimientos indispensables para cualquier estudioso de la teoría de conjuntos, pero también para aquellos interesados en su aplicación en otras áreas. Con el capítulo 8 se inicia la segunda parte del libro con una categoría más avanzada. Aquí se estudian temas de teoría de conjuntos fundamentales, tanto para los lectores que deseen continuar con el método de Forcing, como para aquellos interesados en modelos núcleo o teoría descriptiva de conjuntos. vii ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page viii ✐ ✐ Introducción En este capítulo se revisa la relativización de fórmulas, y teoremas de gran importancia, como el del colapso de Mostowski o el de reflexión de LevyMontague. Introducimos el concepto de absolutez para fórmulas, presentando la relativización de los axiomas de nuestra teoría a clases. Finalmente introducimos una clasificación de las fórmulas del lenguaje de la teoría de conjuntos, la jerarquía de Levy, que permite determinar cuáles fórmulas son absolutas. El capítulo 9 constituye la culminación del primer volumen. Presentamos allí el universo de conjuntos construibles. Para estudiarlo con detalle requerimos desarrollar un lenguaje, el lenguaje LV , dentro de ZFE , así como varios resultados sobre absolutez en este lenguaje. Introducimos la jerarquía Lα de Gödel, por medio de la cual probamos la consistencia relativa del axioma de elección y de la hipótesis generalizada del continuo. El lector encontrará los dos métodos de Gödel para construir L. Además, hemos incluido la demostración de que ambas técnicas son equivalentes. Cada capítulo tiene al final numerosos ejercicios, especialmente en la parte básica. Para la parte avanzada el lector experimentado reconocerá que en el texto se encuentran ocultos muchos ejercicios, disimulados con frases como “es fácil verificar”, “el lector puede demostrar”, etc. Éstas son “lagunas” intencionales que el lector debe “llenar”. Pensamos que se deben intentar tantos ejercicios como sea posible, pero por ningún motivo debe haber desaliento por la imposibilidad de resolver algún problema. La capacidad de resolver problemas es un asunto de madurez matemática. Conforme se avanza en el texto la misma se incrementa y el lector notará que adquiere más destreza en la solución de ejercicios. Algunos problemas son precedidos por uno, dos o tres asteriscos, que denotan el grado de complejidad del problema. Ninguno de los ejercicios representa un problema abierto, pero esto no quiere decir que todos sean sencillos; nada más alejado de la realidad, pues algunos de ellos son excepcionalmente difíciles y esto debe ser una motivación adicional para el lector. En toda obra matemática es usual establecer una serie de convenciones para facilitar y simplificar la escritura del texto. Aquí no somos ajenos a esta buena costumbre, y a continuación detallamos algunas convenciones. Aunque debemos aclarar que en ocasiones las abandonamos, siempre y cuando esto propicie una mejor comprensión por parte del lector y no produzca confusión. Por ejemplo, en las demostraciones por inducción sobre la construcción de fórmulas, se acostumbra utilizar sólo una parte de los conectivos lógicos, viii ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page ix ✐ ✐ Conjuntos y modelos. Curso avanzado dejando el resto como conectivos derivados. Nosotros hacemos lo mismo con la salvedad de que los conectivos considerados básicos pueden variar. Con esto pretendemos presentar las demostraciones con los conectivos que mejor ilustren la prueba, dejando los otros casos al lector. Otra buena costumbre, que respetamos sólo en el primer capítulo (y no en su totalidad), es usar letras minúsculas para denotar conjuntos (a, b, x, y, etc.). Esto se ha vuelto común en la teoría de conjuntos moderna, pero cuando un lector de otras áreas intenta estudiar, por ejemplo, la combinatoria infinita, en ocasiones encuentra extraña esta práctica, pues es usual en otras disciplinas denotar los conjuntos mediante letras mayúsculas. Este cambio, que el lector notará en el primer capítulo y algunos de los restantes, tiene la intención de no introducir dificultades artificiales en la lectura, para aquellos lectores que busquen en esta obra alguna materia específica y no pretendan seguirla de principio a fin. Las referencias dentro de un capítulo serán de la forma (por ejemplo) 3.4, donde el 3 denota la sección y 4 el número de proposición, lema, teorema o definición. Si nos referimos a un resultado de otro capítulo, entonces anteponemos el número de capítulo, por ejemplo: 4.5.7, que se refiere al resultado 7 de la sección 5 del capítulo 4. Cómo leer el libro. El capítulo 1 es opcional y no se requiere en el resto del libro. En cambio el capítulo 2 es indispensable, aunque aquellos lectores con experiencia previa en teoría de conjuntos pueden consultarlo conforme lo vayan necesitando, lo mismo que el capítulo 3, que depende del capítulo 2. Para el resto de los capítulos tenemos las siguientes dependencias: Capítulo 4 5 6 7 8 9 Requisito 2 4, 2 2, 4, 5 4, 4, 5 4, 5 4, 5, 8 Def Usamos la siguiente simbología: = para denotar una definición, ◭ para marcar el fin de una demostración parcial dentro de una prueba, y ✷ para significar el fin de una demostración. La notación ∃ !xΦ se lee: existe un único elemento que satisface la fórmula Φ. ix ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page x ✐ ✐ Introducción Porciones de este libro se han utilizado en el curso de Teoría de Conjuntos en la licenciatura de Matemáticas de la uami, y en la Facultad de Ciencias de la unam. Del capítulo 4 en adelante se ha utilizado como texto en cursos de posgrado de teoría de conjuntos y teoría de modelos. En el departamento de matemáticas de la uami tiene lugar el seminario sobre modelos internos que sirvió como base para el capítulo de constructibilidad. De acuerdo con nuestra experiencia, este libro sirve de apoyo en otros cursos de licenciatura: el capítulo 4 se puede utilizar para el curso de lógica (de la uami) y el capítulo 2 para el curso de Teoría de Conjuntos I. Los capítulos 3 y 7, en los cursos subsecuentes de teoría de conjuntos. El resto de los capítulos son más adecuados para cursos de posgrado o seminarios de investigación para alumnos a punto de terminar la licenciatura en Matemáticas. Es importante aclarar el uso de algunas palabras en el texto. Para denotar cardinales históricamente se utiliza la primera letra del alfabeto hebreo ℵ, que nosotros hemos castellanizado como álef, de acuerdo con su pronunciación real, donde la sílaba tónica es la primera. Cantor, Gödel, Hilbert y otros utilizaron la palabra alemana Vollständigkeit, que nosotros utilizamos como completud, pues no encontramos ninguna razón para usar completitud, como se hace en algunos textos recientes. Agradecemos a los alumnos y participantes de los seminarios las numerosas sugerencias para mejorar el manuscrito y las correcciones efectuadas al mismo. La experiencia de impartir los cursos mencionados ha sido invaluable para nosotros, y esperamos que esto se refleje en alguna medida en el texto. Un agradecimiento muy especial merece el profesor Ronald B. Jensen, cuyas enseñanzas modificaron enormemente el texto original, en particular los capítulos 8 y 9. Si aún permanecen errores, son responsabilidad exclusiva de los autores. Sólo nos resta expresar nuestro deseo de que el texto sea de utilidad a los estudiantes y que sirva para motivarlos a continuar sus estudios en esta bellísima teoría. Los autores Coyoacán, 2 de noviembre de 1999. x ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 1 ✐ ✐ CAPÍTULO 1 Breve reseña histórica 1 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 2 ✐ ✐ 1. Breve reseña histórica Das Unendliche hat wie keine andere Frage von jeher so tief das Gemüt des Menschen bewegt; das Unendliche hat wie kaum eiene andere Idee auf den Verstand so anregend und fruchtbar gewirkt; das Unendliche ist aber auch wie kein anderer Begriff so der Aufklärung bedürftig.1 D. Hilbert [Hil25] Con este apartado queremos conformar un pequeño homenaje a Georg Cantor, fundador de la teoría de conjuntos, y describir brevemente la historia de la teoría, al menos en lo que a este libro concierne. 1. Introducción Más de 100 años han transcurrido desde que apareció la sexta y última parte del trabajo monumental de Cantor en el Matematische Annalen, Über unendliche lineare Punktmanichfaltigkeiten. Con este trabajo nació la teoría de conjuntos y con ella se generó una nueva concepción del infinito en las matemáticas, concepción que toma forma en la teoría de números transfinitos de Cantor. Esta teoría fue catalogada por Hilbert como el fruto más maravilloso del pensamiento matemático y, de hecho, uno de los más grandes logros de la actividad intelectual humana. En un principio la teoría de conjuntos fue despreciada e incluso rechazada, pero al final del siglo xix comenzó a tener algún reconocimiento y uso. Al conocerse las paradojas de nuevo sufrió rechazo y se puso en duda, pero a pesar de los obstáculos logró imponerse, y en su forma axiomática actual es uno de los fundamentos de las matemáticas. La supervivencia de la teoría se debió en gran medida a la perseverancia de Cantor y a su titánico trabajo. Los conjuntos sobre los que versa la teoría tienen, en los casos interesantes, una cantidad infinita de elementos. El concepto de infinito era, sin embargo, fuente de suspicacias desde la antigüedad. Se conocen las paradojas de Zenón de Elea (Aquiles y la tortuga). La construcción del continuo a partir de los puntos que contiene causaba gran desconfianza. El mismo Aristóteles se manifestó en contra del infinito “real”, pues se consideraba que sólo Dios era apto para tales ejercicios mentales. Para Galileo y sus contemporáneos era demasiado 1 El infinito ha motivado de manera tan profunda la voluntad de los hombres como ninguna otra pregunta hasta ahora; el infinito ha influido tanto y tan fructíferamente en el intelecto como casi ninguna otra idea; pero el infinito también requiere más esclarecimiento que ninguna otra noción. 2 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 3 ✐ ✐ Conjuntos y modelos. Curso avanzado peligroso elucubrar sobre tales nociones. No obstante, demostró en 1638 que hay tantos cuadrados perfectos como números naturales. A pesar de lo anterior, para las matemáticas era inevitable enfrentarse al infinito. Conceptos tan naturales como series infinitas conducían a contradicciones sin la noción de infinito. Era necesario introducir números demasiado grandes para tener límites de cada serie, pero el infinito se contemplaba como una noción potencial y no real; la distinción clara entre convergencia y divergencia y la formalización del Análisis sin recurrir a magnitudes infinitamente grandes o pequeñas es un resultado del siglo xix. Para lograrlo se requerían los conceptos de número y de conjunto de números. B. Bolzano trató en 1851 con conjuntos infinitos, pero sin distinguirlos con claridad de otras nociones como número, espacio, tiempo, resultados de operaciones con cantidades infinitas de factores, etc. Su trabajo introdujo varios resultados aún ahora necesarios, como que un conjunto infinito es equipotente a uno de sus subconjuntos propios. No obstante, no podemos hablar de una teoría del infinito de Bolzano, ni siquiera de una teoría precursora de la teoría de conjuntos de Cantor. Fue éste quien introdujo las ideas necesarias para elaborar la teoría que hacía falta. 2. La vida de Cantor Georg Cantor nace el 3 de marzo de 1845 en San Petersburgo, Rusia. Su padre, George Woldemar Cantor (nacido en Kopenhagen, Dinamarca), un acaudalado negociante, tenía en esa ciudad un comercio que dirigía desde 1838. La madre de Georg, Marie Böhm, pertenecía a una familia muy conocida de artistas, directores de orquesta, pianistas y violinistas. Por cierto que mucha de esta información se conoce por una situación muy especial. El gobierno de Hitler ordenó una investigación sobre los antecesores de Cantor, pues se tenía la sospecha de que era de origen judío. La investigación no encontró ningún antepasado de tal religión, y de hecho Cantor fue protestante ([PurIl87]). G. Cantor asistió a la escuela elemental en San Petersburgo y en el año de 1856 la familia se traslada a Alemania, específicamente a Frankfurt am Main. En Wiesbaden y Frankfurt, Cantor asiste a la escuela secundaria y preparatoria. En esta última manifiesta por primera vez su intención de estudiar matemáticas, lo que es desaprobado en forma tajante por su padre, quien suponía que la ingeniería era una profesión económicamente más segura. Durante algún tiempo Cantor asiste en Darmstadt a la escuela superior de ingeniería, pero logra convencer a su padre de que su verdadera vocación son las matemáticas y en 3 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 4 ✐ ✐ 1. Breve reseña histórica 1862 comienza sus estudios en la materia en la Universidad de Zürich. Sin embargo, pocos matemáticos estaban activos en ese centro educativo. En 1863, Cantor interrumpe sus estudios en Zürich, por la muerte de su padre, y no regresa más allí. Decide proseguir en Berlín, la capital de Prusia, que era además un importante centro de actividad económica y cultural. Destacados profesores pertenecían al cuerpo docente: Weierstraß, Kumer, Kronecker, Fuch, Arndt y Hoppe. K. Weierstrass impartía cursos sobre los nuevos resultados en matemáticas, en las áreas de geometría analítica, funciones elípticas, funciones de Abel y cálculo de variaciones. Kronecker tenía cátedras sobre teoría de números, teoría de determinantes e integración. En la época estudiantil de Cantor, Weierstraß y Kronecker tenían todavía una gran amistad, misma que se deterioró en forma considerable años después. En 1867 Cantor escribe sus tesis doctoral De aequatonibus secundi gradus indeterminantis. El trabajo está dedicado a las investigaciones de Lagrange, Gauß y Legendre sobre ecuaciones diofantinas. Después de obtener el grado de doctor, permanece algún tiempo en Berlín dada la gran actividad matemática de la metrópoli. En 1869, recibe la oportunidad de habilitarse en Halle; al menos en esa época, obtener la habilitación obligaba al gobierno a otorgar una plaza definitiva al habilitado. Ante esta situación y la dificultad de conseguir colocación en Berlín, Cantor decide aceptar la propuesta. En Halle entra en contacto con Heine, quien estaba dedicado a la teoría de series trigonométricas y motiva a Georg a iniciar una investigaciónen esa dirección. Cantor inició sus investigaciones con preguntas sobre la unicidad de la representación de una función mediante series trigonométricas, y poco a poco se enfrentó a preguntas sobre la totalidad de los números o de los puntos. El desarrollo de este trabajo motivó la aparición de la teoría de conjuntos de Cantor. Cantor desarrolló esta teoría en una serie de publicaciones entre 1879 y 1894. Se nota claramente que la teoría de conjuntos estaba en sus primeros pasos y que su presentación distaba mucho de ser sistemática. Muchos temas se repiten, la terminología es oscura y contiene muchas reflexiones filosóficas. Cantor sostuvo un intenso intercambio de ideas con R. Dedekind, que había introducido o al menos formulado muchos principios de la teoría de conjuntos, sin haber conformado la teoría. También G. Peano estudió colecciones de objetos cuando trato de formalizar, mediante la lógica, algunos aspectos de las matemáticas. Algunos símbolos de la lógica y de la teoría de conjuntos se deben a él, por ejemplo el de la pertenencia ∈. Pero aparte de estas dos excepciones, 4 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 5 ✐ ✐ Conjuntos y modelos. Curso avanzado Figura 1. G. Cantor en 1870. la teoría de Cantor no provocaba mucho entusiasmo. La demostración de la existencia de números trascendentes por simple comparación de cardinalidades, fue recibida con gran recelo y vista como absolutamente artificial. Lejos de desilusionarse por esta situación, Cantor trató de extender su teoría a la totalidad de los objetos físicos. También dedicó mucho tiempo a concepciones teológicas de la noción de infinito, y trató de que sus resultados no estuvieran en contradicción con los preceptos de la iglesia católica, no obstante que él era protestante. A pesar de ello, la teoría no contó con muchas simpatías. Un antiguo amigo de Cantor, Hermann Schwarz, escribió en una carta a Weierstraß: “¿Qué tiene que ver el reino de Dios con los números irracionales?”, y expresó serias dudas sobre la salud mental de Cantor. L. Kronecker, profesor de Cantor, opinaba que la teoría de conjuntos no era realmente matemática y utilizó toda su influencia para impedir su avance. De paso obstaculizó en lo posible la obtención por parte de Cantor de una posición en la Universidad de Berlín, una vez que éste se había habilitado en Halle. En esta situación, y después de muchos fracasos al tratar de demostrar la hipótesis del continuo (HC ), Cantor cae enfermo de los nervios y entra en una gran depresión. Su primera decaída ocurre en 1884, de la cual se recupera para ingresar de nuevo a una clínica en otras ocasiones. De hecho, fallece en una clínica en Halle en 1918. 5 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 6 ✐ ✐ 1. Breve reseña histórica Figura 2. Cantor a fines del siglo xix Los primeros días de la teoría. La teoría de conjuntos como una teoría bien definida es muy joven. Pocas veces en las matemáticas se puede decir que una teoría haya sido casi totalmente originada por un solo hombre, pero éste es el caso en teoría de conjuntos. Cantor consiguió desarrollar la teoría de conjuntos como una teoría del infinito. Muchos autores marcan el 7 de diciembre de 1873 como el día en que nació la teoría de conjuntos. En esta fecha, Cantor envió una carta a Dedekind con la demostración de que hay “más” números reales que números naturales. Por primera vez, en esta carta se da una definición precisa de qué significa “más” entre números de elementos, cuando hay cantidades infinitas de ellos. Como ya vimos, Cantor estaba dedicado a problemas sobre la unicidad de la representación de funciones en términos de series trigonométricas. El punto de partida fue un teorema de E. Heine, que afirma que una función continua f (x) se puede representar en forma única en el intervalo (−π, π) mediante una serie trigonométrica uniformemente convergente: f (x) = X 1 a0 + (an sen nx + bn cos nx). 2 El problema es: dada una función arbitraria representada mediante una serie trigonométrica, ¿es única esta representación? Heine [Hei70] demostró el siguiente resultado en 1870: 6 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 7 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema. Una función f (x) continua en general pero no necesariamente finita se puede representar en una sola forma mediante una serie trigonométrica como la siguiente: X 1 a0 + (an sen nx + bn cos nx), (1) 2 si la serie se sujeta a la condición de ser uniformemente convergente. La serie representa a la función en [−π, π]. Posteriormente se debilitaron las hipótesis y se exigía solamente convergencia uniforme y continuidad con una cantidad finita de excepciones. Este debilitamineto invitaba a la generalización. Mentes tan brillantes como Dirichlet, Lipschitz y Riemann no pudieron lograrlo, pero G. Cantor aceptó el reto e introdujo una serie de nociones necesarias para obtener formulaciones más generales. Cantor notó que el problema de unicidad no se podía resolver, como se había supuesto, multiplicando cada término de la serie 1 por cos n(x − t)dx para después integrar término a término de −π a π. Este proceder requiere no sólo de la integrabilidad de f (x) sino también de la convergencia uniforme de la serie para la integración término a término como sigue: si hacemos f (x) = f (x) = A0 + A1 + · · · + An + Rn , (2) para cualquier número ε deberá existir un entero m tal que para n ≥ m el valor absoluto de Rn sea menor que ε para todos los valores de x que se estén considerando [Can85]. Sea m(x, ε) el valor m para el que se establece la convergencia uniforme. Cantor resume las dificultades de los intentos realizados: no se sabe, para ε dada, si la función m(x, ε) está entre límites finitos para todos los valores de x. Es fácil ver que si f (x) es discontinua para x = x1 , la función m(x, ε) para ε constante toma valores que exceden cualquier límite dado cuando x tiende a x1 . Con esto quedaba claro qué se podía esperar de la unicidad de la representación mediante series trigonométricas en esta forma. En lugar de persistir en las ideas de Riemann, Cantor mostró cómo una prueba dada por Schwarz se podría usar para debilitar la convergencia uniforme de los términos del residuo de una serie especial. Este resultado permitió a Cantor demostrar que si una función admite una representación en series trigonométricas, entonces la representación será única: supongamos que hay dos representaciones para la misma función f (x) que 7 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 8 ✐ ✐ 1. Breve reseña histórica convergen al mismo valor para cada x; Cantor restó ambas series para obtener una representación del 0 también convergente para cada x: 0 = c0 + c1 + c2 + · · · + cn + · · · , (3) donde c0 = 21 , y c0 = cn sen nx + cos nx. Un mes antes Cantor había publicado un resultado preliminar ([Can72a]): Teorema. [Cantor-Lebesgue] Si dos sucesiones infinitas a1 , a2 , . . . , ai , . . . y b1 , b2 , . . . , bn ,. . . se comportan de tal manera que el límite de an sen nx + bn cos nx es igual a cero para n creciente y todo valor de x en un intervalo dado (b < x < a), entonces an y bn convergen a 0 conforme n crece. En consecuencia, Cantor podía concluir que la representación de 0 involucra una serie trigonométrica cuyos coeficientes cn y dn , con índice creciente, se vuelve arbitrariamente pequeña. El teorema de unicidad quedaría probado si Cantor demostraba que los coeficientes cn y dn eran idénticamente cero para cada índice. De acuerdo con Riemann, Cantor construyó la función cn x·x − c1 − · · · − − ··· (4) F (x) = c0 2 n·n La función de Riemann F (x) no sólo es continua en la vecindad de cada x; también su segunda derivada F (x + α) + F (x − α) − 2F (x) Lím α− →0 α·α tiende a cero cuando α disminuye. Cantor observó que el teorema de unicidad se deducía fácilmente sólo si el corroboraba que F (x) es lineal. De hecho, el 17 de febrero de 1870 escribe a Schwarz preguntándole si tenía alguna forma de deducir que la función de Riemann debía tener la forma F (x) = cx+c′ . Schwarz confirma esta suposición ([Schw90], pp. 341-343). Cantor reformula 4 mediante la definición F (x) = cx + c0 para obtener x·x c2 cn c0 − cx − c′ = c1 + 2 + · · · + 2 + · · · (5) 2 2 n Se reescribe este resultado como X x·x − cx − c′ = (an sen nx + bn cos nx)/n2 . c0 2 Es claro que para que (an sen nx + bn cos nx)/n2 tenga periodo π, el lado izquierdo de la ecuación debe ser periódico. Esto sólo ocurre si c0 = 0 y c = 0. P 8 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 9 ✐ ✐ Conjuntos y modelos. Curso avanzado Cantor redujo 5 a cn c2 + · · · + 2 + Rn , (6) 2 2 n una ecuación para la cual, dada ε > 0, se podría encontrar un número n tal que para toda n ≥ m, el valor absoluto de Rn es menor que ε para todo valor de x. Como la convergencia de Rn es entonces uniforme, se puede utilizar la conclusión de Weierstraß y multiplicar cada término en 3 por cos n(x − t)dx para después integrar término a término de −π a π y obtener −c′ = c1 + cn sen nx + dn cos nx = 0 (7) y, en consecuencia, cn = 0 = dn . Con ello se establece que la representación mediante una serie trigonométrica converge para toda x sólo si todos los coeficientes cn y dn de 3 son cero. Teorema[Can70]. Si una función f (x) de variable real representada mediante una serie trigonométrica converge para toda x, no existe otra serie de la misma forma que también converja para cada x. Un año después Cantor publica un addendum a este trabajo, en el que demuestra que el teorema de unicidad sigue siendo válido si se permite un conjunto finito de excepciones para la convergencia de la serie a un valor distinto de cero. Una idea importante de Cantor fue plantear la pregunta de si se podría permitir un conjunto infinito de excepciones, y de ser así, de qué tipo de conjunto se trataba. En 1872 se publicó un resultado relativo. ([Can72]). Primero averiguó que la teoría de los números reales no tenía todavía la plenitud requerida. Cantor escribe en la introducción: Al final me vi obligado, aunque mayormente sólo como indicaciones, a promover discusiones que servirían para discernir el comportamiento de magnitudes numéricas que se presentan como finitas o infintas. A continuación siguen cuatro páginas sobre la teoría de los números reales que tan sólo por ellas, Cantor se habría asegurado un lugar destacado en la historia. Cantor presentó este tema en una cátedra sobre cálculo diferencial durante el verano de 1870. Puesto que no se conocía nada sobre esto, debemos suponer que ninguno de los oyentes reconoció el extraordinario proceso que presenciaban. 9 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 10 ✐ ✐ 1. Breve reseña histórica En la teoría Cantor construye los números reales, define >, =, < y describe el encaje de los números racionales en los reales. Simultáneamente a la teoría de los números reales, Cantor desarrolló uno de los conceptos de la topología de conjuntos: la noción de conjunto derivado. Si P es un conjunto de números reales, P ′ es el conjunto de puntos de acumulación de P. Recursivamente se define P (n) = (P (n−1) )′ ; Cantor llamó a un conjunto de n-ésimo tipo si P (n+1) = ∅. Regresando al teorema de unicidad para representaciones mediante series trigonométricas, Cantor dedujo que el teorema de unicidad sigue siendo válido cuando el conjunto de excepciones es un conjunto de n-ésimo tipo (n un natural arbitrario). El proceso de formar conjuntos derivados sucesivos condujo a Cantor (y es relamente el origen de la teoría de conjuntos) a la idea de número ordinal transfinito. Si formamos los conjuntos derivados P ′ , P ′′ , P ′′′ , . . . de un conjunto P, se cumple P ′ ⊇ P ′′ ⊇ P ′′′ ⊇ · · · y el conjunto de aquellos puntos que pertenecen a todos los P (n) se denota P (∞) , es decir, P (∞) = \ P (n) . n El símbolo ∞ representa al primer número ordinal transfinito que Cantor posteriormente denotó mediante ω. Pero P (∞) también se puede derivar para obtener P (∞+1) , P (∞+2) , etc. Este razonamiento no se presenta en la publicación de Cantor de 1872, pero se sabe que él ya tenía esta idea desde 1870. Los años 1878 a 1884 marcan el punto más alto en la obra de Cantor. En este periodo se origina su trabajo (en seis partes) Über unendliche linearen Punktmanigfaltigkeiten. Esta obra contiene los fundamentos de la teoría general de conjuntos y una serie de importantes resultados sobre la topología general. No tiene la forma de un trabajo concluido; más bien es una sucesión de teoremas en los que las ideas se retoman, se desarrollan y se aclaran cada vez más. Zermelo caracteriza estos trabajos como la quintaescencia de la obra de Cantor. En la primera parte se clasifican conjuntos lineales de puntos. Se advierte, sin embargo, que los resultados son válidos también para subconjuntos de Rn . La transición a espacios más generales se logra hasta el siglo XX con el trabajo de Felix Hausdorff. 10 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 11 ✐ ✐ Conjuntos y modelos. Curso avanzado Un primer criterio de clasificación se obtiene del comportamiento de la derivación sucesiva: si P (n) es vacío para algún n, P se llama de primer género, y en otro caso de segundo género. Cantor entonces define la noción de conjunto denso y muestra que los conjuntos de primer género no pueden ser densos en un intervalo. Otro principio clasificatorio es el de cardinalidad. Cantor establece que todos los conjuntos de primer género y ciertos del segundo (como los números racionales o los algebraicos) pertenecen a la clase de conjuntos numerables, mientras que el continuo (0, 1) no pertenece a esta clase. En la segunda parte Cantor introduce los conceptos de igualdad entre conjuntos, subconjunto, conjuntos ajenos, unión e intersección. Su notación no perduró, pues el denotaba con M(P1 , P2 , P3 , . . . ) la unión y con D(P1 , P2 , . . . ) la intersección de los conjuntos P1 , P2 , P3 , . . . . La idea principal de esta segunda parte es originar los números ordinales de la segunda clase (ordinales límite) a partir del concepto de conjunto derivado P (ω) = ∞ \ P (n) . n=1 P (ω) , P (ω+1) , P (ω+2) , Después siguen . . . , luego la ω-derivación de P (ω) , es T∞ (ω+n) (ω·2) , que se denota P . Si proseguimos esta construcción decir, n=1 P (ωn +n ) 0 1 se obtiene P para n0 , n1 números naturales. Después de todas las derivaciones ωn0 + n sigue ω2 : 2 P (ω ) = ∞ \ n P (ω ) . n=1 n ω )ω , ωω+1 , ωω+n , ωω , ωω , etc. Así se obtienen los números (ωn Cantor demostró que los números recién descritos tienen sentido. Como ejemplo, construye una partición de un intervalo I en subintervalos Iv cuya longitud tiende a 0 y cuyo extremo derecho converge a un punto x0 . En el ν-ésimo intervalo Iν se da un conjunto Pν deSprimer género y ν-tipo 1, es decir, P (ν+1) = ∅, P (ν) 6= ∅. (ω) = {x }. Entonces P = ∞ 0 ν=1 Pν es el conjunto requerido: P En la tercera parte Cantor traslada la noción de conjunto derivado a especies de dimensión n. Después estudia los conjuntos numerables: la unión numerable de conjuntos numerables es numerable; toda familia de conjuntos cerrados de Rn sin puntos interiores en común es a lo sumo numerable. Un fenómeno que Cantor caracterizó como notable es el siguiente: sea G un abierto de Rn y M un conjunto denso numerable en G. Entonces, para n ≥ 2 y dos 11 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 12 ✐ ✐ 1. Breve reseña histórica puntos distintos x, y ∈ G − M existe una curva continua que permanece en G − M y une a x con y. La cuarta parte presenta una serie de resultados de la topología de conjuntos. Cantor llama a un subconjunto P ⊆ Rn aislado cuando no contiene ninguno de sus puntos de acumulación, es decir, P ∩ P ′ = ∅. Un ejemplo es P = { n1 : n ∈ N}. Todo conjunto P se puede descomponer en un conjunto aislado Q y un conjunto R ⊆ P ′ , P = Q ∪ R, Q = P − P ∩ P ′ , R = P ∩ P ′ . (8) P ′ = (P ′ − P ′′ ) ∪ (P ′′ − P ′′′ ) ∪ · · · ∪ (P (n−1) − P (n) ) ∪ P (n) ; (9) Puesto que P (n+1) ⊆ P (n) , para n ≥ 1 la diferencia P (n) − P (n+1) es un conjunto aislado. Se obtienen las siguientes descomposiciones: ′ ′ ′′ ′′ ′′′ P = (P − P ) ∪ (P − P ) ∪ · · · ∪, P (ω) . (10) Se logran asimismo los siguientes resultados: • Si P ′ es numerable, también P lo es. • Todo conjunto de la primera especie (género) es numerable. • Un conjunto P de la segunda especie para el que P (ω) es numerable, también es numerable. Al generalizar este último resultado a números arbitrarios de la segunda clase (Cantor los llamaba aun símbolos infinitos), se utilizó por primera vez inducción transfinita sin mencionarlo. El enunciado general es el siguiente: Teorema 2.1. Si α es un símbolo infinito, entonces todo conjunto P de la segunda especie para el que P (α) es numerable, también es numerable. Como último resultado de esta parte se presenta un conjunto P ⊆ (a, b) cuyo conjunto derivado es numerable y tiene medida de Jordan nula. En muchos sentidos el trabajo más importante de Cantor es la quinta parte. La obra transcurre entre las concepciones fundamentales de la teoría de los números ordinales y cardinales y observaciones sobre la noción de continuo, una nueva presentación de su teoría de los números reales, y consideraciones históricas y filosóficas. Se introducen dos principios relevantes: el primero de ellos es la adición de 1 a un ordinal dado α, es decir, el paso de α a α + 1. Para comprender cabalmente el segundo principio se requiere el concepto de conjunto bien ordenado, que en palabras de Cantor es: Por un conjunto bien 12 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 13 ✐ ✐ Conjuntos y modelos. Curso avanzado ordenado se entiende un conjunto bien definido en el que los elementos estén relacionados mediante una sucesión determinada, de acuerdo con la cual hay un primer elemento del conjunto y a cada elemento (cuando no es el último de la sucesión) le sigue otro, así como a cada conjunto finito o infinito le pertenece un elemento especial, el sucesor en la sucesión de todos los elementos (a menos que no haya ninguno más en la sucesión) ([Can84] p. 168). De acuerdo con Cantor, el segundo principio consiste en lo siguiente: Si tenemos alguna sucesión determinada de números reales enteros para la que no existe uno más grande, con base en este segundo principio se consigue un número que se puede considerar como la cota de cada uno de los números, es decir, el menor número más grande que todos esos números ([Can84], p. 196). En resumen, el primer principio corresponde aTla formación de P (α+1) a partir de P (α) y el segundo a la formación de P = i I P (αi ) si {αi : i ∈ I} es una sucesión de ordinales (I es un conjunto arbitrario de índices). A continuación, Cantor clasifica los números ordinales y establece una relación entre los ordinales y los cardinales. La primera clase es la de los números naturales. Su cardinalidad la denotó Cantor (posteriormente) como ℵ0 . A continuación aparecen ℵ1 , ℵ2 , . . . . La segunda clase la conforman los ordinales numerables y la tercera los no numerables. Fue una gran tragedia para Cantor el no poder demostrar dos problemas fundamentales en su teoría: la hipótesis del continuo, es decir, la hipótesis que afirma que 2ℵ0 = ℵ1 , y el principio del buen orden, mediante el cual asociamos una cardinalidad a cada conjunto. Cantor estaba absolutamente persuadido de la validez de este último principio: El concepto de conjunto bien ordenado se muestra como fundamental para toda la teoría de variedades. Que siempre es posible transformar un conjunto bien definido en un conjunto bien ordenado lo mostraré en trabajos futuros, pues me parece fundamental y de múltiples consecuencias por su validez universal. ([Can32] p. 169). Cantor no pudo cumplir esta promesa. Una demostración del principio del buen orden la consiguió Zermelo en 1904. En la quinta parte Cantor retoma el problema de la HC. Primero trata de caracterizar aquellos conjuntos que según su opinión representan continuos, es decir, define la noción de continuo dentro de la teoría de conjuntos. La sexta y última parte sobre variedades lineales de puntos se concentra en la investigación de conjuntos de puntos. La meta era sin duda la demostración 13 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 14 ✐ ✐ 1. Breve reseña histórica de la HC. Para ello Cantor demuestra 7 resultados fundamentales de la topología de conjuntos: 1. Un conjunto perfecto no es numerable. 2. Si α es un número de la primera o segunda clase y P (α) = ∅, entonces P y P ′ son a lo más numerables. 3. Si P ′ es numerable, existe un número α de la primera o segunda clase tal que P (α) = ∅. 4. Si Ω es el número inicial de la tercera clase, entonces P (Ω) es perfecto si P ′ no es numerable. 5. Si P ′ no es numerable, entonces P ′ se puede descomponer en un conjunto perfecto y un conjunto numerable disjuntos; es válido escribir P ′ = R ∪ S, donde R es numerable y S = P (Ω) es perfecto. 6. Si P ′ no es numerable, existe un número ordinal α más pequeño de la primera o segunda clase tal que P (α) = P (α+1) , es decir P (α) = P (Ω) . 7. Si R es el conjunto de 5, existe un número α de la primera o segunda clase tal que R ∩ R(α) = ∅. (En los teoremas 4–7 P ′ se supone infinito). Ahora se sabe que Cantor tenía pensada una séptima parte, pero su enfermedad le impidió desarrollarla. 2.1. Las paradojas. Antes de continuar, vale la pena profundizar un poco en las paradojas. La primera paradoja la publicó Burali-Forti en 1897. Burali-Forti demuestra que para dos números ordinales arbitrarios a, b se cumple exactamente una de las relaciones a = b, a < b o b < a. Denota con Ω la colección de todos los números ordinales así ordenados, que consideró un conjunto, y observó simplemente que de lo anterior se deduce Ω + 1 > Ω, Ω + 1 ≤ Ω. Cantor no reaccionó a este trabajo. Ni en sus publicaciones ni en sus cartas se menciona algo al respecto. La siguiente paradoja la publicó Russell (The principles of mathematics I) en 1903. Russell llega a una contradicción al considerar la prueba de Cantor de que no existe un número cardinal más grande. Considera la colección de todos los cardinales como un conjunto y aplica la demostración de Cantor a este “conjunto”. 14 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 15 ✐ ✐ Conjuntos y modelos. Curso avanzado Ambas paradojas se originan al considerar colecciones demasiado “grandes” como conjuntos. El problema es entonces, ¿qué colecciones son conjuntos y cuáles no lo son? Este problema se resuelve al axiomatizar la teoría, de tal forma que se introducen colecciones como conjuntos (el vacío y un conjunto infinito) y operaciones para formar nuevos conjuntos. Pero, retornando a las paradojas, en forma equívoca se consideró y atribuyó como definición de conjunto la conocida frase de Cantor: Por un conjunto entenderemos cualquier colección M de objetos m (llamados elementos de M) de nuestra percepción o pensamiento, distintos entre sí y bien definidos. Tanto Frege como Dedekind, dos de los principales defensores de las ideas de Cantor, se mostraron extraordinariamente sorprendidos y tornaron a la inseguridad cuando conocieron las paradojas. Por el contrario, Cantor no se sorprendió ni dudó de su teoría. La razón fue que Cantor ya conocía estas “paradojas” muchos años antes de que las publicaran Burali-Forti y Russell. En una carta a Hilbert, fechada el 26 de septiembre de 1897, escribe: La totalidad de todos los álef es una colección que no se puede considerar como un conjunto bien definido. Si éste fuera el caso, estaríamos en posibilidad de asociarle un álef que pertenecería y no a esta colección, lo que es una contradicción. Las colecciones (totalidades) que no se pueden considerar conjuntos (como la totalidad de álef) las he llamado desde hace años absolutamente infinitas y se distinguen en forma radical de los conjuntos... Cantor abunda en estas materias en una carta a Dedekind escrita en el verano de 1899: Si partimos de la noción de una determinada totalidad (un sistema, un conjunto) de cosas, surge la necesidad de distinguir entre dos totalidades (pienso siempre en totalidades determinadas). Se puede construir una totalidad de tal manera que la colección de todos sus elementos conduzca a una contradicción, de tal suerte que es imposible pensar en la totalidad como una unidad, como una cosa acabada. Tales totalidades las llamo absolutamente infinitas o inconsistentes. Como es fácil ver, un ejemplo se logra con el conjunto de todo lo imaginable. Si, por el contrario, la colección de los elementos de una totalidad se puede obtener sin conducir a una contradicción, es decir, si se puede conformar “una cosa” bien definida, entonces la llamo totalidad consistente o conjunto. Otros ejemplos de totalidades inconsistentes señalados por Cantor son el sistema de los números ordinales y el sistema de todas las clases imaginables de conjuntos no equivalentes. 15 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 16 ✐ ✐ 1. Breve reseña histórica Figura 3. La casa de Cantor en Halle. Todo lo anterior condujo con mayor energía a la necesidad de una axiomatización de la teoría de conjuntos. Tal axiomatización fue obtenida por E. Zermelo en 1908, basándose en trabajos propios y de otros autores. Posteriormente, A. Fraenkel y Th. Skolem añaden el axioma del reemplazo. Estos axiomas se presentan en la presente obra. El lector encontrará, en la formulación de algunos de los axiomas, quién los sugirió. Pero es muy claro que la teoría fue concebida y desarrollada en gran medida por el maestro G. Cantor. A pesar de sus detractores, la teoría de conjuntos terminó por imponerse y Cantor es reconocido como uno de los grandes matemáticos de todos los tiempos. Los últimos años de Cantor. Con el paulatino reconocimiento de la teoría de conjuntos, Cantor recibió también numerosas distinciones. En 1901 es nombrado miembro distinguido de la London Mathematical Society y en 1902 doctor honoris causa de la Universidad de Oslo. En 1904 obtiene la más alta distinción otorgada por la Royal Society en el área de matemáticas, la medalla Sylvester. En 1912, la universidad escocesa de St. Andrews le otorga el doctorado honoris causa, y el Instituto Veneto de Scienze, Lettere ed Arti lo nombra miembro correspondiente. En 1913 recibe la real orden de la corona 16 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 17 ✐ ✐ Conjuntos y modelos. Curso avanzado de tercera clase por parte del gobierno alemán. Sin embargo, en vida nunca fue elegido para la academia berlinesa, debido a la animosidad de Poincaré. Cantor comenta la elección de Poincaré para la academia berlinesa en una carta a Lemoine fechada el 17 de marzo de 1896, en donde toma un pasaje de la obra Fausto de Goethe: Es tut mir lang schon weh, Daß ich Dich in der Gesellschaft seh.2 Como académico, Cantor permaneció activo hasta 1911. Durante varios periodos entre 1900 y 1911, tuvo que pedir licencias por su enfermedad nerviosa. Su última clase (1910-1911) tuvo como tema la mecánica analítica. Del verano de 1911 al invierno de 1912-13, Cantor tuvo licencia y en el verano de 1913 fue nombrado profesor emérito. Para su cumpleaños 70, en 1915 se programó una gran celebración internacional. En julio de 1914 un comité conformado por F. Bernstein, A. Gutzmer, D. Hilbert y W. Lorey emitió la convocatoria para, entre otras cosas, edificar el busto de Cantor en mármol; la convocatoria estaba en 4 idiomas y se envió a todo el mundo. La primera guerra mundial impidió la celebración internacional y ésta se redujo a una festividad en Alemania, que tuvo lugar en Halle, en la casa de Cantor. El busto en mármol fue develado y la Sociedad Matemática Alemana envió la siguiente felicitación: A su miembro fundador y primer dirigente doctor Georg Cantor: Profesor ordinario de matemáticas de la Universidad de Halle en el Saale, creador de la teoría de conjuntos, quien le dio un sentido claro a la noción de infinito y con originales y profundos razonamientos influyó en todas las áreas de las matemáticas, lo felicitamos por su cumpleaños 70 con agradecimiento y respeto. Sociedad Matemática Alemana. En el verano de 1917 Cantor enferma otra vez y se interna en la clínica de la universidad. Allí muere el 6 de enero de 1918. La consternación de toda la comunidad matemática la expresa E. Landau en una carta a la esposa de Cantor: Con gran dolor me entero que su esposo ha muerto. Su pena la comparte todo el mundo matemático. Él pertenece a los más grandes y geniales matemáticos de todos los países y de todos los tiempos. El trabajo de Cantor fue, hasta cierto punto, reconocido en su tiempo. Su trabajo sobre conjuntos de puntos fue considerado por numerosos autores, 2 Me duele mucho verte en la sociedad. 17 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 18 ✐ ✐ 1. Breve reseña histórica Figura 4. G. Cantor pocos meses antes de su muerte. Figura 5. Cantor con sus esposa en la década de los ochenta del siglo xix. citado, y en alguna medida continuado, sobre todo su trabajo sobre la noción de función. También la distinción entre conjuntos numerables e inumerables fue propicia para muchos de sus contemporáneos. No fue pequeño el uso que dio Weierstraß ya en 1874 al concepto de conjunto numerable. Él mismo siguió de cerca y utilizó trabajos posteriores de Cantor y motivó a éste a usar el principio de condensación de singularidades de Hankel. No obstante, Weierstraß nunca se manifestó abiertamente por la teoría de conjuntos, posiblemente porque él mismo tuvo problemas con Kronecker debido a sus razonamientos en análisis (p. ej., su teorema sobre la existencia de cotas superiores de un conjunto acotado de números reales). 18 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 19 ✐ ✐ Conjuntos y modelos. Curso avanzado En los años setenta (del siglo xix) dos jóvenes italianos, Dini y Ascoli, retoman el concepto de conjunto derivado y lo utilizan en la teoría de funciones reales. En 1878 aparecen trabajos de Thomae, Lüroth, Jürgens y Netto, en los que se pretende demostrar la invariancia de la dimensión respecto a funciones continuas. En 1883 se publican trabajos de Bendixson y Phragmen sobre conjuntos de puntos. También se presentan trabajos relacionados de Harnack y Hölder utilizando nociones introducidas por Cantor. 3. Desarrollo de la teoría de conjuntos por otros matemáticos Consideremos ahora las contribuciones de otros destacados matemáticos a la teoría de conjuntos. En 1896 Ernst Schröder demostró que el orden entre cardinalidades es un orden parcial, pero la demostración no estaba completa. F. Bernstein, alumno de Cantor, al parecer el único que tuvo, encontró una demostración completa en 1896-97. E. Zermelo descubrió posteriormente que Dedekind había demostrado el teorema en 1887, pero éste nunca publicó su demostración. Cantor comunicó la demostración de Bernstein a Borel, quien la publicó en el libro [Bor98]. En 1904, en Heidelberg, tiene lugar el tercer congreso internacional de matemáticas, en el que Julius König presentó una demostración de que R no se podía bien ordenar. Cantor había considerado siempre que todo conjunto se podía bien ordenar y pensaba que era cuestión de tiempo encontrar una demostración de este hecho. Esto provocó gran expectación, pues todos esperaban una reacción de Cantor, quien estaba presente. La situación era tan extraordinaria que el asunto apareció en los periódicos y el gran Duque de Baden pidió a Klein que lo mantuviera informado al respecto. La demostración de König fue inmediatamente desacreditada por Zermelo, quien le encontró una inexactitud. König utilizó una generalización inexacta de un resultado de Bernstein. Por cierto que esta inexactitud fue provocada por la existencia de cardinales singulares. En septiembre de 1904, Zermelo desarrolló una demostración, durante una discusión con Erhard Schmidt, de que todo conjunto se puede bien ordenar, para lo que introdujo el axioma de elección. Comunicó su demostración por carta a Hilbert, quien de inmediato la publicó ([Zer04]). 19 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 20 ✐ ✐ 1. Breve reseña histórica La solución, sin embargo, no conducía a resolver completamente el problema; por el contrario, propició una acre discusión sobre la aceptabilidad del axioma de elección. La teoría de números cardinales y ordinales continuó desarrollándose. G. Hessenberg [Hess06] y P. Jourdain [Jour08] demostraron que el cuadrado de un cardinal infinito es él mismo. F. Hausdorff se involucró en un estudio sistemático de conjuntos ordenados [Haus08]. En mucho se basó en los cardinales regulares límite (es decir, cardinales débilmente inaccesibles). P. Mahlo [Mah11] trabajó con cardinales aun más grandes. O. Veblen [Ve08] inició el estudio de las funciones ordinales o funciones normales. E. Jacobsthal [Jac06] definió recursivamente las operaciones aritméticas entre números ordinales. F. Hausdorff generaliza en [Haus08] la hipótesis del continuo de Cantor a la hipótesis general de los álef, que establece que para cada número cardinal (de un conjunto infinito bien ordenado) el conjunto potencia tiene la siguiente cardinalidad. A. Lindenbaum y A. Tarski [LinTar26] formularon la hipótesis generalizada del continuo (HGC ): para ningún conjunto infinito existe un conjunto cuya cardinalidad esté entre la cardinalidad del conjunto y la de su conjunto potencia. En presencia del axioma de elección (que Hausdorff tenía por válido), ambas formulaciones son equivalentes. Lindenbaum y Tarski pensaron que de su formulación se deducía el axioma de elección. Una demostración de ello fue elaborada por W. Sierpinski [Sier47]. Muchas preguntas sobre los fundamentos del análisis, en particular del concepto de integral, condujeron a la teoría de funciones reales y a la teoría de la medida, cuyo desarrollo hubiese sido imposible sin la teoría de conjuntos. En estrecha relación con la teoría de la medida se encuentra la teoría de conjuntos descriptiva (en la que se obtiene cierta clasificación de conjuntos de números reales), disciplina que se originó con Borel [Bor98] y [Bor05], quien introdujo familias de conjuntos que se obtienen de conjuntos abiertos y cerrados mediante complementos, uniones e intersecciones infinitas, conjuntos que ahora conocemos como conjuntos de Borel. Si además se considera la cerradura respecto a la formación de complementos e imágenes continuas, se obtienen los conjuntos proyectivos [Lus25] y [Sier25]. Hausdorff publica en 1914 su famoso libro [Haus14] que representó el origen de la topología de conjuntos. En estas condiciones, la teoría de conjuntos de puntos se separa de la teoría de conjuntos y se convierte en una disciplina aparte. La teoría de conjuntos y la topología propician un nuevo contexto para 20 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 21 ✐ ✐ Conjuntos y modelos. Curso avanzado la geometría diferencial y la teoría de variedades que, debido a la teoría de la relatividad, eran de gran actualidad. Hermann Weyl [We13] utilizó nociones de la topología de conjuntos para dar una definición precisa de superficie de Riemann. El libro de Hilbert [Hil99] marca el inicio de los métodos axiomáticos modernos, donde se permiten modelos arbitrarios de un sistema axiomático dado y el concepto de modelo tiene una estructura de conjunto precisa. En el álgebra se introduce esta concepción mediante el trabajo de Steinitz [Stein10], continuado por E. Noether utilizando ideas de R. Dedekind. Con el fin de evitar las paradojas y con gran confianza en la teoría de Cantor, E. Zermelo propuso en 1908 una axiomatización. Cuando se utiliza la teoría de conjuntos sin introducir axiomas, se trata de la teoría elemental de conjuntos. Zermelo propuso que en lugar de las operaciones arbitrarias que se realizaban sobre conjuntos, sólo se llevaran a cabo ciertas operaciones dadas axiomáticamente. De inicio se propone la existencia de dos conjuntos: un conjunto infinito y un conjunto vacío. El axioma de extensionalidad establece que un conjunto está determinado por sus elementos. Los conjuntos con los mismos elementos son iguales. El axioma de par dice que dados dos conjuntos, existe un tercer conjunto que los contiene como elementos. Mediante el axioma de unión podemos obtener un conjunto que consiste en los elementos de cada conjunto de un conjunto. El axioma de potencia permite obtener el conjunto de subconjuntos de un conjunto dado. Con el axioma de comprensión podemos extraer subconjuntos de un conjunto dado. Además, se introducen los axiomas de infinito y de existencia que establecen la existencia de un conjunto infinito y un conjunto vacío. Finalmente, se considera el axioma de elección, una de cuyas variantes implica que el producto cartesiano de conjuntos no vacíos es no vacío. Con esta axiomatización es imposible hablar del conjunto de todos los conjuntos, del conjunto de todos los ordinales o del conjunto de todos los cardinales. La axiomatización de Zermelo no ha permitido hasta el momento el desarrollo de una contradicción. Tampoco se ha encontrado una inconsistencia a partir de los axiomas que se añadieron posteriormente (el axioma de reemplazo y el axioma de fundación). Por supuesto, por el segundo teorema de incompletud de Gödel, no podemos demostrar que la teoría de conjuntos es consistente sin apoyarnos en una teoría más fuerte, de la que tampoco sabríamos si es consistente. 21 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 22 ✐ ✐ 1. Breve reseña histórica El principio del buen orden y la hipótesis del continuo fueron los resultados que Cantor más deseó demostrar. Si todo conjunto se puede bien ordenar, a cada conjunto le podemos asociar un número cardinal y éstos se pueden comparar entre sí. Para demostrar el principio del buen orden, Zermelo introdujo el axioma de elección formulándolo de tal forma que se puede asegurar que para todo conjunto no vacío de conjuntos mutuamente ajenos, existe un conjunto que contiene exactamente un elemento de cada conjunto. Este axioma es de una naturaleza muy distinta a la del resto de los axiomas. Los otros axiomas describen conjuntos o postulan conjuntos muy específicos, mientras que el axioma de elección postula la existencia de un conjunto que, en la mayoría de los casos, no se puede describir. Si se renuncia al axioma de elección, tampoco se puede utilizar el principio del buen orden, pues ambos son equivalentes. Las discusiones sobre el axioma de elección y las paradojas condujeron a que se desarrollara una corriente, el constructivismo, fundamentalmente debida a L. Brouwer, contra la teoría de conjuntos. Esto provocó una confrontación entre Brouwer y Hilbert. D. Hilbert formuló su famoso programa de la teoría de la demostración y pretendió demostrar la consistencia de la lógica y la teoría de conjuntos. Entonces acuñó su famosa frase: Del paraíso que Cantor logró para nosotros, nadie podrá expulsarnos. Una importante adición al sistema axiomático de Zermelo fue propiciada por A. Fraenkel mediante el axioma de reemplazo, que postula que la imagen de un conjunto respecto a una función es un conjunto. En la formulación original de los axiomas, encontramos la noción imprecisa de propiedad matemática; por ejemplo, para extraer un subconjunto de un conjunto dado, se decía que el subconjunto contiene precisamente aquellos elementos del conjunto que satisfacen cierta propiedad matemática. En este sentido, Zermelo y Fraenkel siempre expresaron que su sistema no era formal en el sentido de la lógica. Esta falta de formalidad generó otra paradoja, debida a Russell: el conjunto de palabras del español que se pueden describir con menos de 19 palabras. Sólo se tiene un número finito de ellas, así que existe un número natural, el más pequeño posible, que no se puede describir mediante 19 palabras. Pero nosotros lo acabamos de describir con menos de 19 palabras. Esta paradoja se formuló originalmente en inglés. Esta situación condujo a Thoralf Skolem a precisar el concepto de propiedad matemática que se logra mediante un lenguaje de primer orden con una variable 22 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 23 ✐ ✐ Conjuntos y modelos. Curso avanzado libre. Una propiedad matemática es aceptable si se puede describir en el lenguaje de primer orden. Obtenemos subconjuntos separando los elementos que al ser sustituidos en la variable libre de la fórmula la hacen cierta. También a Skolem se debe el primer resultado de la teoría de modelos para conjuntos. Extendió un resultado de Leopold Löwenheim a conjuntos de fórmulas infinitos y lo utilizó para demostrar, en 1922, que la teoría de conjuntos, en caso de ser consistente, tiene un modelo numerable. Esto propicia una “aparente paradoja”, pues en el modelo se puede demostrar que existe un cardinal no numerable. Sin embargo, no hay tal paradoja, pues para el modelo existe un cardinal no numerable porque no tiene suficientes elementos para demostrar lo contrario, pero en realidad (en el universo de conjuntos) el cardinal es numerable. Esto conduce a que el concepto de numerabilidad no sea absoluto, es decir, puede variar de un modelo a otro. En forma independiente de Fraenkel, Skolem formuló el axioma de reemplazo. Rápidamente se reconoció que con la axiomática de Zermelo se podrían tener conjuntos que no satisfacen la forma de construcción de un conjunto sencillo. Los conjuntos inusuales se conforman, en cierta medida, a partir de sí mismos, es decir, se tienen a sí mismos como elementos, o como un elemento de uno de sus elementos, etc. Esto se conoció debido a un trabajo de D. Mirimanoff [Mir17], pero en esa época la tendencia era a excluir tales conjuntos. Incluso Fraenkel, en 1922, propone lo mismo en [Fran22]: un axioma debería restringir el universo de conjuntos a un dominio, en que los conjuntos “inusuales” y objetos que no fuesen conjuntos estuviesen excluidos. Además, menciona explícitamente que en la axiomatización de Hilbert de la geometría ocurre un axioma de completud, que es un meta-axioma; Fraenkel fuerza cierta categoricidad (todos los modelos son isomorfos). J. von Neumann [Neum25] introduce una axiomatización que promueve un axioma restrictivo, que después en [Neum29] mejora (sin suponer a los números naturales) en su formulación. Esta descripción se encuentra también en [Zer30]; se trata del axioma de fundación (también conocido como axioma de regularidad). El axioma de fundación no es necesario para otras áreas de la matemática. No produce nuevos conjuntos; por el contrario, excluye objetos de ser conjuntos. Por ejemplo, no permite un conjunto x con x ∈ x; tampoco permite la construcción de sucesiones ∈-decrecientes, es decir, de la forma · · · ∈ x3 ∈ x2 ∈ x1 ∈ x0 . Los objetos matemáticos “normales” no se incomodan por el axioma de fundación. 23 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 24 ✐ ✐ 1. Breve reseña histórica Por tanto, podemos circunscribirnos a la teoría de conjuntos pura, conjuntos formados de conjuntos. Esto excluye los llamados “urelementos”, objetos (sin elementos) que no son conjuntos, pero que podrían aparecer como elementos de un conjunto. Con el axioma de extensionalidad, estos objetos se vuelven intrascendentes. No obstante, gran parte de la teoría de conjuntos moderna se puede desarrollar en sistemas diferentes de ZFE . Al eliminar ciertos axiomas puede volverse importante considerar conjuntos con urelementos. Para más información sobre este particular, el lector puede consultar [Bar75]. La teoría de conjuntos pura de Zermelo-Fraenkel, junto con el axioma de elección, es lo que conocemos hoy como teoría ZFE o ZF si se excluye el axioma de elección. Von Neumann aportó entre 1923 y 1929 una axiomatización de la teoría de conjuntos, con ideas completamente nuevas, axiomatización que influyó de manera considerable en la teoría de conjuntos moderna. Una contribución relevante es su obra sobre los números ordinales [Neum23]. Por primera vez los ordinales no se introducen mediante abstracción elemental, sino que se identifican con ciertos conjuntos. Un número ordinal es entonces un conjunto bien ordenado por ∈ y en el que cada elemento es igual al segmento inicial que determina. Von Neumann introdujo [Neum28] la definición actual de número cardinal como número ordinal inicial (que no es equipotente a un número ordinal menor). También formalizó la definición por recursión [Neum28]. En la axiomatización de von Neumann se utilizan funciones como noción elemental, propuesta que no fructificó pues sus obras son difíciles de leer. No obstante, motivó los trabajos posteriores de P. Bernays y K. Gödel, quienes propusieron otra axiomatización de la teoría de conjuntos, conocida actualmente como teoría NBG (von Neumann-Bernays-Gödel). En cualquier caso, la formalización adquirida por la teoría de conjuntos la convirtió en una parte de la lógica matemática. Von Neumann también utilizó la jerarquía de conjuntos, ahora conocida como jerarquía de von Neumann [Neum29]. Ésta es una clasificación de los conjuntos bien fundados que sigue las reglas admisibles para construir conjuntos. El rango, definido como el primer estrato en el que aparece el conjunto dado, es un número ordinal. Para pasar de un estrato a otro se recurre a la operación potencia de un conjunto en el caso de un ordinal sucesor, y es la unión de los estratos precedentes en el caso de un ordinal límite. 24 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 25 ✐ ✐ Conjuntos y modelos. Curso avanzado Zermelo desarrolló otra jerarquía [Zer30] (sobre un conjunto de “urelementos”). Introdujo dominios de conjuntos caracterizados por dos números: el ancho (es decir, el número de “urelementos”) y la altura (que es un “punto límite”, es decir, un cardinal inaccesible). El dominio de conjuntos está dividido en estratos (que se indizan mediante ordinales). El paso de un estrato al siguiente se realiza mediante subconjuntos del estrato previo y, en la etapa límite, mediante la unión de los estratos precedentes. Los conceptos modernos de rango, recursión e inducción (no sólo para números ordinales, sino en general para relaciones bien fundadas) los formularon R. Montague [Mon55] y A. Tarski [Tar55], [Tar55b]. Mientras que la formalización de la teoría de conjuntos continuó desarrollándose, durante mucho tiempo no se obtuvo nada nuevo sobre la hipótesis (generalizada) del continuo y otros problemas clásicos. Por lo tanto, el resultado de Gödel (1938) de que la HGC no se puede refutar en ZFE, fue una sensación. Las primeras publicaciones al respecto fueron [Göd38] y [Göd38b]. Una presentación más detallada se encuentra en [Göd40]. Gödel renuncia al axioma de elección y muestra que ZF es relativamente consistente con AE (el axioma de elección) y con la HGC (hipótesis generalizada del continuo); esto lo consigue mediante la construcción de un modelo. Definió (usando los axiomas de ZF ) una clase L de conjuntos, la jerarquía constructiva, y demostró que los axiomas de ZF son ciertos en L lo mismo que el AE . Gödel introdujo una jerarquía de conjuntos, enumerada mediante ordinales, cuya unión es L. A primera vista la jerarquía de Gödel es muy similar a la de von Neumann, pero en Gödel el paso de un estrato al siguiente no contempla la potencia del estrato, sino sólo aquellos conjuntos que se pueden definir (mediante una fórmula de la lógica de primer orden) en el estrato. Con esto, la cardinalidad no crece de un estrato a otro, y ésta es la razón de la validez de la HGC . Para el AE simplemente se define un buen orden en cada estrato de L, y se utiliza el hecho de que cada estrato es transitivo. Por supuesto, quedaba sin responder la pregunta de si se podía demostrar AE o HGC a partir de ZF. Para AE , Fraenkel demostró que no se podía probar en ZF usando “urelementos” [Fran27]. A. Lindenbaum y A. Mostowski retomaron el método [LinMos37] y A. Mostowski lo estudió con detalle en [Mos39] verificando su validez. Pero de este resultado no se excluye que podamos probar el AE en ausencia de “urelementos”. E. Mendelson [Men56] 25 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 26 ✐ ✐ 1. Breve reseña histórica muestra cómo evitar los “urelementos” en la demostración de la independencia del AE , usando el hecho de que no son bien fundados. Paul Cohen cambia radicalmente la situación en 1963, ([Coh63] y [Coh63b]), cuando demuestra que el axioma de elección no se puede probar a partir de ZF. De paso también prueba la independencia de la HC de ZF y que la negación de AE o de HC es relativamente consistente con ZF . Por lo tanto, estos axiomas son independientes de los otros, es decir, en ZF no podemos demostrar ni refutar AE o la HC (si ZF es consistente). Existen modelos de ZF con AE y HGC (Gödel), pero también modelos de ZF con ¬AE y ¬HGC . La combinación ¬AE y HGC no puede ocurrir, pues el AE se deduce de la HGC . El modelo construido por Cohen no podía ser, como el de Gödel, un modelo interno. Se requería entonces un proceso de extensión que le añadiera algo. El nuevo modelo se define mediante condiciones auxiliares, que lo fuerzan a cumplir con ciertas propiedades. El modelo así obtenido se conoce como extensión genérica. El trabajo de Cohen resuelve varios problemas abiertos e inyecta energía a la investigación en teoría de conjuntos. El método de forcing es muy flexible y se incorpora de inmediato a numerosas investigaciones (J. Shoenfield ofrece una presentación sencilla del método en [Sho67b]). También renueva el interés en el modelo interno de Gödel. R. Jensen inicia la generalización del modelo L. Con esta revolución, las nuevas investigaciones sobre teoría de conjuntos se desarrollan en términos de teoría de modelos. En este devenir se hace notorio que la teoría de Zermelo-Fraenkel tenía muchas carencias, lo cual es comprensible si consideramos que la axiomatización se hizo en los inicios de la teoría de conjuntos y en ese momento eran pocos los aspectos que se debían capturar en los axiomas. Mediante los métodos de Skolem, se generaron numerosos modelos para demostrar principios combinatorios y también para demostrar que algunos resultados de principios del siglo xx eran los mejores posibles en ZFE . Pero esta nueva corriente de investigaciones también generó nuevos axiomas. El axioma de constructibilidad de Gödel, V = L, que postula que todo conjunto es construible, pareció contar con mucha aceptación inicial. Poco tiempo después se hizo evidente que es un axioma muy restrictivo y que no permite una descripción intuitiva de los conjuntos. Pero su importancia radica en que ha servido para demostrar numerosos resultados de consistencia relativa, 26 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 27 ✐ ✐ Conjuntos y modelos. Curso avanzado y la jerarquía constructiva se ha generalizado a los llamados modelos núcleo, que han propiciado otro renacimiento de la teoría de conjuntos. Otro axioma muy importante es la existencia de cardinales medibles (que no es compatible con V = L). El axioma de Martin (AM) también ha tenido gran repercusión en otras áreas, como la topología y la teoría de la medida. Se han estudiado otros axiomas que debilitan o incluso contradicen el AE como el axioma de determinancia, el cual postula que ciertas clases de juegos están determinados. No obstante, ninguno de estos axiomas ha logrado la categoría de los axiomas de Zermelo- Fraenkel. Hemos presentado el desarrollo de la teoría de conjuntos hasta donde abarca el presente volumen. En el siguiente se considerarán las nuevas aportaciones. 27 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 28 ✐ ✐ 1. Breve reseña histórica 28 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 29 ✐ ✐ CAPÍTULO 2 Teoría elemental de conjuntos 29 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 30 ✐ ✐ 2. Teoría elemental de conjuntos Unter eine Menge verstehen wir jede Zussamenfassung M von bestimmten, wohlunterschiedenen Objekten m unserer Anschauung oder unseres Denkens (welche die “Elemente” von M gennant werden) zu einem Ganzen.1 G. Cantor [Can95] Eine Vielheit (eines Inbegriffs) kann nämlich so beschaffen sein, daß die Annahme eines Zusammenseins aller ihrer Elemente auf einen Widerspruch führt, so daß es unmöglich ist, die Vielheit als eine Einheit, als ein fertiges Ding aufzufassen. Solche Vielheiten nenne ich absolut unendliche oder inkonsistente Vielheiten. Wie man sich liecht überzeugt, ist z. B. der Inbegriff alles Denkbaren eine solche Vielheit;... Wenn hingegen die Gesamtheit der Elemente einer Vielheit ohne Widerspruch als zusammenseiend gedacht werden kann, so daß ihre Zusammengefaßtwerden zu einem Ding möglich ist, nenne ich sie konsistente Vielheit oder eine Menge.2 G. Cantor [Can32], p. 443 1. Introducción En este capítulo presentamos el desarrollo de la teoría básica de conjuntos, con el objeto de que sirva como referencia para el resto del libro. Se presenta la demostración de todos los resultados, pero las pruebas seran breves, aunque absolutamente suficientes para un lector interesado. Sin embargo, no todo el capítulo contiene resultados elementales. De hecho, la presentación de la teoría se realiza axiomáticamente, para lo que se introduce el lenguaje de la teoría de conjuntos (LTC). 1 Por un conjunto entenderemos cualquier colección M de objetos m (llamados elementos de M) de nuestra percepción o pensamiento, distintos entre sí y bien definidos. 2 Una multiplicidad (una colección) se puede constituir de tal forma que una reunión de todos sus elementos conduce a una contradicción, con lo que es imposible considerar esta multiplicidad como una cosa hecha. Tales multiplicidades las llamo absolutamente infinitas o inconsistentes. Como se concluye fácilmente, por ejemplo, la colección de todo lo imaginable es una tal multiplicidad;... Si, por el contrario, la totalidad de los elementos de una multiplicidad se puede pensar reunida sin contradicción, de tal forma que su reunión en una cosa es posible, la llamo multiplicidad consistente o conjunto. 30 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 31 ✐ ✐ Conjuntos y modelos. Curso avanzado En algunas secciones ocurren conceptos que quizá el lector encontrará por primera vez: relaciones bien fundadas, cerradura transitiva, la jerarquía de von Neumann, etc. Entre los temas que aparecen en este capítulo se encuentran el lenguaje de la teoría de conjuntos que es un ejemplo de un lenguaje formal, los que se estudiarán con más detalle en el capítulo 4. La jerarquía de von Neumann es un ejemplo de un modelo para la teoría ZFE , por supuesto suponiendo que ésta es consistente. En vista de lo anterior, es recomendable que el lector estudie con atención este capítulo, al menos aquellas secciones que introducen conceptos nuevos para él. Varias ideas mencionadas en este capítulo no encontrarán aplicaciones sino hasta los capítulos finales, por lo que el lector poco experimentado podrá pensar que son superfluas. No obstante, hemos pensado que es conveniente introducir gradualmente estas nociones nuevas. 2. Los axiomas Para construir de manera formal la teoría de conjuntos se deben establecer los axiomas en que se basa la teoría. Para hacerlo no podemos utilizar el lenguaje cotidiano, el cual produce inexactitudes inadmisibles en nuestra teoría. En consecuencia, la primera tarea es definir un nuevo lenguaje poderoso y expresivo para describir los axiomas. Este lenguaje es un caso particular de la teoría de lenguajes formales que se desarrollará más ampliamente en el capítulo 4. Nuestro lenguaje básico será el lenguaje de la teoría de conjuntos LTC, que consta de lo siguiente: (i) Relaciones: = (igualdad) y ∈ (pertenencia). (ii) Conectivos lógicos: ∧ (y) , ∨ (o), ¬ (no), ∃ (existe), ∀ (para todo), ⇒ (implica) y ⇔ (si y sólo si). (iii) Variables: v0 , v1 , v2 , . . . , vn , . . . (un conjunto numerable3 de símbolos para variables) (iv) Paréntesis derecho e izquierdo: (,) y coma “,”. Usaremos un lenguaje con igualdad, en el que implícitamente se incluyen los axiomas para la igualdad (es decir, para la 2-relación “=”): 1. ∀ x(x = x) (reflexividad). 2. ∀ x∀ y∀ z(x = y ∧ y = z ⇒ x = z) (transitividad). 3 Es decir, para cada número natural n existe una variable vn y toda variable v es alguna vn . 31 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 32 ✐ ✐ 2. Teoría elemental de conjuntos 3. ∀ x∀ y(x = y ⇒ y = x) (simetría). Una vez que tenemos un lenguaje disponible podemos construir palabras, es decir, cadenas de símbolos que llamaremos fórmulas. Las fórmulas de LTC se construyen a partir de las fórmulas atómicas o primitivas: (v) Las fórmulas atómicas son cadenas de la forma (vn = vm ), (vn ∈ vm ). (vi) Las fórmulas de LTC se generan a partir de las fórmulas atómicas, por medio de los siguientes esquemas: si Φ y Ψ son fórmulas, también lo son las cadenas ¬Φ, Φ ∨ Ψ, Φ ∧ Ψ, Φ ⇒ Ψ, Φ ⇔ Ψ, (∃vn Ψ) y (∀vn Ψ).4 Una fórmula es una LTC-fórmula si y sólo si se obtiene de (v) y (vi). Como ejemplos de fórmulas considere las siguientes: (1) (vn = vm ) ∧ ∀ vj ∃ vi (vj ∈ vi ). (2) ∀ vn [(vn = vm ) ∨ (vn ∈ vm ) ∨ (vm ∈ vn )]. (3) ∃ vn [(vm = vj ) ∧ ∀ vj (vj ∈ vi )]. Una subfórmula de una fórmula Φ es una sucesión de símbolos consecutivos de Φ que forman por sí mismos una fórmula; por ejemplo, en (2) (vn ∈ vm ), (vm ∈ vm ) son subfórmulas. Tenemos más ejemplos de fórmulas de LTC: (4) (∀ v0 ((v0 ∈ v1 ) ⇒ (v0 ∈ v2 )) que expresa la relación (v1 ⊆ v2 ). (5) (∀ v0 ((v0 ∈ v1 ) ⇔ (∃ v3 ((v0 ∈ vS 3 )∧(v3 ∈ v2 ))))) que indica que el conjunto v1 es precisamente el conjunto v2 . (6) (∀ v2 ((v2 ∈ v1 ) ⇔ (v2 = v0 ))) manifiesta la relación v1 = {v0 }. (7) (∀ v3 ((v3 ∈ v2 ) ⇔ ((v3 = v0 ) ∨ (v3 = v1 )))), que describe la igualdad v2 = {v0 , v1 }. (8) (∀ v3 ((v3 ∈ v2 ) ⇔ ((v3 = {v0 }) ∨ (v3 = {v0 , v1 })))), que es la definición de v2 = (v0 , v1 ). Una variable vn está acotada en una fórmula Φ de LTC, si está dentro del alcance de un cuantificador existencial o universal cuya variable es vn , donde el alcance de un cuantificador es la subfórmula inmediata al cuantificador. Si en alguna subfórmula de Φ, vn no está acotada, decimos que vn es libre en Φ. En consecuencia, vn puede aparecer acotada y libre simultáneamente en una 4 El lector notará, en cuanto conozca el teorema de recursión, que ésta es una definición recursiva. 32 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 33 ✐ ✐ Conjuntos y modelos. Curso avanzado fórmula Φ. En los ejemplos anteriores, en (1) vn y vm son libres, mientras que vj y vi están acotadas. En (3) vj tiene una aparición acotada y otra libre. De manera intuitiva una fórmula expresa una propiedad de sus variables libres, mientras que las variables acotadas se utilizan para realizar afirmaciones existenciales o universales, que se pueden efectuar igualmente con otras variables acotadas. Por ejemplo, y ∃ v0 (v0 ∈ v1 )) ∧ ∃ v1 (v2 ∈ v1 ), ∃ v4 (v4 ∈ v1 )) ∧ ∃ v4 (v2 ∈ v4 ) significan lo mismo. Con Φ(v1 , . . . , vn ) queremos mencionar que las posibles variables libres de Φ están entre v1 , . . . , vn . Si éste es el caso, Φ(y1 , . . . , yn ) denota la fórmula que resulta al sustituir yi en cada aparición libre de vi . Tal sustitución es legítima si ninguna ocurrencia libre de xi está en el alcance de un cuantificador ∃ yi o ∀ yi . La idea es que Φ(y1 , . . . , yn ) diga lo mismo sobre y1 , . . . , yn que lo expresado por Φ(x1 , . . . , xn ) sobre x1 , . . . , xn ; esto no se cumpliría si la sustitución acotara algunas de las yi . Por ejemplo, si Φ(v1 , v3 ) es la fórmula ∃ v0 (v0 ∈ v1 ) ∧ (∃ v1 (v2 ∈ v1 )), entonces Φ(v2 , v8 ) es y Φ(v0 , v8 ) es ∃ v0 (v0 ∈ v2 ) ∧ (∃ v1 (v2 ∈ v1 )), ∃ v0 (v0 ∈ v0 ) ∧ (∃ v1 (v2 ∈ v1 ). La última sustitución no es legítima pues cambia el significado de Φ. La afirmación en Φ(v1 , v3 ) “v1 tiene elementos” se transforma en “algún conjunto es un elemento de sí mismo” en Φ(v0 , v8 ). En ocasiones hablaremos de la veracidad de una fórmula Φ(~v) o, por ejemplo, de que la sustitución de y por x en Φ(x) resulta cierta. Será hasta el capítulo 4 donde se defina de manera formal el concepto de veracidad de una fórmula en una estructura. Por el momento, el lector debe interpretar la veracidad de una fórmula Φ(y) en el universo de conjuntos, como el hecho de que la fórmula Φ expresa una propiedad que resulta cierta para y. En general usaremos todos los símbolos lógicos mencionados en (ii) para facilitar la lectura; sin embargo, cuando se trate de efectuar pruebas por inducción en la construcción de fórmulas, consideraremos ciertos símbolos como primitivos, definiendo los demás símbolos con base en éstos. Así, ϕ ⇒ ψ 33 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 34 ✐ ✐ 2. Teoría elemental de conjuntos es equivalente a ψ ∨ ¬ϕ; ϕ ⇔ ψ es equivalente a ϕ ⇒ ψ ∧ ψ ⇒ ϕ, mientras que ∀ xϕ es equivalente a ¬∃ x¬ϕ. 2.1. La teoría ZFE . Usaremos la siguiente notación para una fórmula Φ de LTC; escribimos Φ{vj /vi } para denotar la fórmula que se obtiene a partir de Φ sustituyendo legítimamente en ésta toda aparición libre de vj por vi . Otras notaciones usuales son: {a} para {x : x = a}. {a1 , a2 , . . . , an } para {x : x = a1 ∨ · · · ∨ x = an }. (a, b) para {{a}, {a, b}}, el par ordenado. ∅ para {x : x 6= x}, el conjunto vacío. Pot(a) para {x : x ⊆ a} S a para {x : ∃ y(x ∈ y ∧ y ∈ a)}. T a para {x : ∀ y(y ∈ a ⇒ x ∈ y)}. a × b para {(x, y) : x ∈ A ∧ y ∈ b}. La teoría de Zermelo-Fraenkel-axioma de elección (ZFE ) consista de los siguientes axiomas (el nombre se debe a E. Zermelo y A. Fraenkel, quienes introdujeron la mayoría de los axiomas): Ex ∃v0 ∀v1 ¬(v1 ∈ v0 ). Existe un conjunto que no tiene elementos. Mediante el axioma Ext a continuación, se puede demostrar que el conjunto vacío es el único conjunto que no tiene elementos; este conjunto se denota como ∅. Ext [Frege, 1893] ∀v0 ∀v1 (∀v2 (v2 ∈ v0 ⇔ v2 ∈ v1 ) ⇒ v0 = v1 ). Dos conjuntos son iguales cuando contienen los mismos elementos. Par ∀v0 ∀v1 ∃v2 ∀v3 (v3 ∈ v2 ⇔ (v3 = v0 ∨v3 = v1 )). Para cada dos conjuntos existe un tercero, que tiene exactamente a los dos conjuntos originales como elementos. Unión [Cantor, 1899; Zermelo, 1908] ∀v0 ∃v1 ∀v2 (v2 ∈ v1 ⇔ ∃v3 (v3 ∈ v0 ∧ v2 ∈ v3 )). La unión de un conjunto es otra vez un conjunto. Si sólo consideramos estos cuatro axiomas, generamos la teoría elemental de conjuntos TEC. Comp [Frege, 1893] Para cada fórmula5 Φ(v0 , v1 , ..., vn ) de LTC es cierta la afirmación 5 Recuerde que la notación Φ(v0 , v1 , ..., vn ) significa que todas las variables libres de Φ aparecen entre v0 , ..., vn . 34 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 35 ✐ ✐ Conjuntos y modelos. Curso avanzado ∀v0 · · · ∀vn ∀vn+1 ∃vn+2 ∀vn+3 (vn+3 ∈ vn+2 ⇔ (vn+3 ∈ vn+1 ∧ Φ(vn+3 , v1 , . . . , vn ))). Para cada conjunto a y para cada fórmula de LTC Φ, existe un conjunto b que contiene exactamente aquellos elementos de a que satisfacen Φ. Este axioma nos permite extraer subconjuntos de un conjunto mediante una fórmula de LTC. Pot [Zermelo, 1908] ∀v0 ∃v1 ∀v2 (v2 ∈ v1 ⇔ ∀ v3 (v3 ∈ v2 ⇒ v3 ∈ v0 )). Para cada conjunto a existe un conjunto b, cuyos elementos son precisamente los subconjuntos de a. Inf [Zermelo, 1908] ∃ v0 (∃ v1 (v1 ∈ v0 ∧ ∀ v2 ¬(v2 ∈ v1 )) ∧ ∀ v1 ∃ v2 (v1 ∈ v0 ⇒ (v2 ∈ v0 ∧ ∀ v3 (v3 ∈ v2 ⇔ (v3 ∈ v1 ∨ v3 = v1 )))). Existe un conjunto que contiene al conjunto vacío y es cerrado respecto a la operación sucesor: x 7→ x ∪ {x}. Puesto que se asegura la existencia de un conjunto con tales propiedades, el lector notará que, de hecho, se establece la existencia de un conjunto infinito. Para enunciar el siguiente axioma requerimos una nueva noción (con ~v denotamos a las variables v1 , . . . , vn ): una fórmula Φ se comporta de manera funcional si de la veracidad de Φ(~v, x) y de Φ(~v, y) se deduce que x = y. Reemp [Skolem, 1923; Fraenkel, 1922; con idea original de Cantor, 1899] Para cada fórmula Φ(v0 , v1 , v2 , . . . , vn+1 ) de LTC en la que no figuren las variables vn+2 y vn+3 , la siguiente afirmación es cierta: ∀ v2 . . . ∀ vn+1 (∀ v0 ∀ vn+2 ∀ vn+3 ((Φ{v1 /vn+2 } ∧ Φ{v1 /vn+3 }) ⇒ vn+2 = vn+3 ) ⇒ ∀ vn+2 ∃ vn+3 ∀ v1 (v1 ∈ vn+3 ⇔ ∃ vn+4 (vn+4 ∈ vn+2 ∧ Φ(vn+4 , v1 , . . . , vn+1 ))). Si se sustituye cada elemento de un conjunto a por su imagen respecto a una relación funcional (dada por Φ) se obtiene un conjunto. Fund [Skolem, 1923; von Neumann, 1925] Para cada fórmula Φ(v0 , v1 , . . . , vn ) de LTC, en la que no figure la variable 35 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 36 ✐ ✐ 2. Teoría elemental de conjuntos vn+1 , la siguiente afirmación es cierta ∀ v1 . . . ∀ vn (∃ vn+1 Φ(v0 , v1 , . . . , vn ) ⇒ ∃ vn+1 (Φ(vn+1 , v1 , . . . , vn ) ∧ ∀ vn+2 (vn+2 ∈ vn+1 ⇒ ¬Φ{vn+1 /vn+2 }))). Si una propiedad es cierta para al menos un conjunto, entonces la propiedad es cierta para algún conjunto y no es cierta para los elementos de este conjunto (es decir, hay un testigo más pequeño para la propiedad). En particular, si Φ(x, y) es la fórmula x ∈ y, el axioma asegura que todo conjunto tiene un elemento ∈-mínimo. El sistema descrito por los axiomas anteriores (de Ex a Fund) se conoce como teoría ZF. A la teoría ZF sin el axioma Pot la denotaremos como ZF − . AE [Beppo Levi, 1902; Schmidt, 1904] ∀ v0 ∃ v1 ((∀ v2 (v2 ∈ v0 ⇒ ∃ v3 v3 ∈ v2 ) ∧ ∀ v4 ∀ v5 ((v4 ∈ v0 ∧ v5 ∈ v0 ∧ ¬v4 = v5 ) ⇒ ¬∃ v3 (v3 ∈ v4 ∧ v3 ∈ v5 ))) ∧ ∀ v2 (v2 ∈ v0 ⇒ ∃ v3 (v3 ∈ v2 ∧ v3 ∈ v1 ∧ ∀ v4 ((v4 ∈ v2 ∧ v4 ∈ v1 ) ⇒ v4 = v3 )))). Para cada conjunto no vacío a formado de conjuntos ajenos entre sí, existe un conjunto b que interseca cada elemento de a en exactamente un elemento. Note que los axiomas Comp, Reemp y Fund son en realidad esquemas (infinitos) de axiomas, pues para cada fórmula Φ de LTC obtenemos una instancia del axioma. Más adelante (teorema 8.7.10) demostraremos que la teoría ZF y, en consecuencia, ZFE , no se pueden presentar mediante un número finito de axiomas. Para la teoría de ZFE , los conjuntos son entidades completas. Los axiomas describen cómo construir y manipular esas entidades. Sabemos que un conjunto es una colección de objetos, objetos que son a su vez conjuntos. La pregunta es: ¿toda colección de objetos es un conjunto? Por objeto entendemos un conjunto, pero ¿qué es una colección? ¿podremos decir que toda fórmula de nuestro lenguaje determina un conjunto? La respuesta es no. Por ejemplo, la colección V de todos los conjuntos no es un conjunto, lo que demostraremos en breve. Sin embargo, la colección se 36 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 37 ✐ ✐ Conjuntos y modelos. Curso avanzado puede describir mediante una fórmula de nuestro lenguaje, a saber: Def V = {x : x = x}, donde Φ(v0 ) = v0 = v0 es la fórmula en cuestión. Por lo tanto, existen colecciones (clases) que se pueden describir mediante una fórmula, pero que no son conjuntos. La teoría ZFE no explica cómo trabajar con tales colecciones. Para formalizar el uso de clases en ZFE (aunque esta teoría no las reconozca), se puede incluir nuestra teoría dentro de otra más amplia que admita la presencia de clases y que considere a ZFE como una subteoría. Los objetos en esta teoría más amplia (llamada teoría de clases) se conocen como clases. Todos los conjuntos son clases. También existen colecciones de conjuntos, por ejemplo V , que no son conjuntos y que se conocen como clases propias. La teoría más conocida para trabajar con clases es la teoría de von NeumannBernays-Gödel (NBG). No obstante, nosotros vamos a tratar con clases dentro de ZFE ; aunque no permite, de hecho no reconoce, la existencia de objetos que no sean conjuntos, podemos incorporar clases como una forma de abreviar expresiones que serían demasiado largas sin su uso. En este sentido extendemos nuestro contexto para incorporar clases, pero de tal forma que toda afirmación que contenga clases se puede reemplazar por otra expresión, posiblemente más larga, que no contenga ninguna referencia a ellas. Dada cualquier fórmula Φ(vn ) de nuestro lenguaje, cuyos miembros se refieren a conjuntos, la colección {x : Φ(x)} de todas las x que satisfacen Φ la llamaremos término clase. Todos los conjuntos resultan ser términos clase: si a es un conjunto, entonces a = {x : x ∈ a}. Pero no todas las clases son conjuntos, como ya se mencionó. Como las clases propias no son conjuntos, no podemos trabajar con ellas de modo tan sencillo como lo hacemos con los conjuntos. Por ejemplo, no podemos preguntarnos si una clase propia es miembro de otra, pero podemos reducir esta pregunta a conjuntos. Las clases son colecciones que presentan muchas propiedades similares a los conjuntos y si trabajamos con cierto cuidado, se pueden manipular clases como lo hacemos con conjuntos. No requerimos extender nuestra teoría pues sólo utilizaremos las clases como abreviaciones. 37 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 38 ✐ ✐ 2. Teoría elemental de conjuntos Sea A el término clase A = {x : Φ(x)}. Al utilizar el término clase A sólo evitamos mencionar en forma explícita la fórmula Φ(v). Por ejemplo, si escribimos a ∈ A, significa simplemente Φ(a); así, a hace cierta la fórmula Φ. Otro ejemplo: si A = {x : Φ(x)} en lugar de escribir B = {x : Ψ(x)}, ∀ x(Φ(x) ⇔ Ψ(x)), podemos poner A = B. En el mismo sentido escribimos A ⊆ B, para ∀ x(Φ(x) ⇒ Ψ(x)). Necesitamos las siguientes definiciones: • Rel(R) significa que R es una 2-relación o relación binaria, es decir, un conjunto de parejas ordenadas. Formalmente R ⊆ V × V y si A es un término clase con R ⊆ A × A, decimos que R es una relación en A. Escribimos uRv para significar que u está en relación con v, según R, es decir, (u, v) ∈ R; • dom(R) para {x : ∃ y(xRy)}, el dominio de R; • ran(R) para {y : ∃ x(xRy)}, el rango de R; • R ↾ A para {u ∈ R : ∃ x, y(u = (x, y)∧x ∈ A)}, R con dominio restringido a A; • Fun(f ) para Rel(f ) ∧ ∀ x, y, z((x, y) ∈ f ∧ (x, z) ∈ f ⇒ y = z), f es una función; • f: A− → B para Fun(f ) ∧ Dom(f ) = A ∧ Ran(f ) ⊆ B, f es una función de A en B; • AB para {f : f : A − → B}, la colección de todas las funciones de A en B. • F [z] = {f (x) : x ∈ z}. Ahora desarrollemos algunas equivalencias para ciertos axiomas de ZFE , caracterizaciones que nos serán de gran utilidad más adelante. El siguiente lema es fácil de probar y su demostración se deja al lector. ~ representa las variables w1 , w2 , . . . , wn . Recuerde que w Lema 2.1. Los siguientes esquemas son equivalentes: 38 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 39 ✐ ✐ Conjuntos y modelos. Curso avanzado 1. Comp. ~ ), la afirmación ∀ w ~ ∀ a{x : x ∈ a ∧ 2. Para cada LTC-fórmula Φ(x, w ~ )} ∈ V es cierta. Φ(x, w ~ )}, la afirmación A ∩ a ∈ V es 3. Para cada término clase A = {x : Φ(x, w cierta. Ahora podemos probar que V no es un conjunto. Teorema 2.2 (TEC + Comp). 6 No existe el conjunto de todos los conjuntos. Demostración. No podemos usar fundación. Mostraremos que para todo conjunto a existe un conjunto x que no pertenece a a. Dado el conjunto a, definimos x = {y : y ∈ a, y ∈ / y} que resulta un conjunto por Comp. Se cumple x ∈ / x: si no, x satisfacería la condición para pertenecer a x, en particular x∈ / x. Así que x ∈ / x. Entonces x no satisface la condición para pertenecer a x, por lo que x ∈ / a ∨ x ∈ x. Por lo anterior, x ∈ / a. El axioma de reemplazo Reemp implica que la imagen de un conjunto respecto a una fórmula que se comporta funcionalmente es un conjunto. Esto se manifiesta en el siguiente lema, cuya demostración se deja al lector. Lema 2.3. Las siguientes afirmaciones son equivalentes para una LTCfórmula Φ que se comporta funcionalmente: 1. Reemp. ~ ), la afirmación 2. Para cada fórmula Φ(x, y, w ~ (∀ x∀ y1 ∀ y2 (Φ(x, y1 , w ~ ) ∧ Φ(x, y2 , w ~ ) ⇒ y1 = y2 ) ⇒ ∀w ~ ))} ∈ V ) ∀ a{y : ∃ x(x ∈ a ∧ Φ(x, y, w es cierta. Podemos pensar que existen “funciones” entre clases propias, las cuales expresamos mediante LTC-fórmulas. A continuación estudiamos cómo se comportan estas “funciones”. Para nuestro próximo lema necesitamos la siguiente notación: Definición 2.4. Sea F un término clase y x una variable. Definimos el término clase F (x) como: F (x) ≡ {z : ∀ y0 (((x0 , y0 ) ∈ F ∧ ∀ y1 ((x, y1 ) ∈ F ⇒ y0 = y1 )) ⇒ z ∈ y0 )}. 6 Esto indica que se están suponiendo los axiomas de TEC y Comp. Este tipo de notación se usará con gran frecuencia. 39 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 40 ✐ ✐ 2. Teoría elemental de conjuntos F (x) es exactamente lo que se espera, es decir, se comporta como función. Proposición 2.5. Sean F y A términos clase y F : A − → V . Entonces ∀ x ∈ A∀ y((x, y) ∈ F ⇔ y = F (x)). Por lo anterior tenemos derecho a llamar a F (x) el valor de la “función” F en el punto x. Demostración. “ ⇒ ”. Sea (x, y) ∈ F ; debemos probar y = F (x). ⊆) Sea z ∈ y. Entonces ((x, y) ∈ F ∧∀ y1 ((x, y1 ) ∈ F ⇒ y = y1 )) ⇒ z ∈ y. Para y0 6= y ocurre en todo caso ((x, y0 ) ∈ F ∧ ∀ y1 ((x, y1 ) ∈ F ⇒ y0 = y1 )) ⇒ z ∈ y0 , pues la premisa (a saber (x, y0 ) ∈ F ) es falsa. Así que z satisface la condición que define a F (x). ⊇) Sea z ∈ F (x). Entonces z satisface la condición que define a F (x). En particular ((x, y) ∈ F ∧ ∀ y1 ((x, y1 ) ∈ F ⇒ y = y1 )) ⇒ z ∈ y. Dado que F es una función y (x, y) ∈ F , la premisa es verdadera; por lo tanto, z ∈ y. “⇐”. Dado que F : A − → V y x ∈ A, existe exactamente una ȳ con (x, ȳ) ∈ F . Por lo ya demostrado, ȳ = F (x). Por hipótesis tenemos también y = F (x), de donde se desprende y = ȳ, y así (x, y) ∈ F . Observe que si F no está unívocamente determinada en la posición x, es decir, si existen y1 y y2 con y1 6= y2 , y tanto (x, y1 ) ∈ F como (x, y2 ) ∈ F , entonces F (x) = V . Aquí V quiere decir valor indeterminado: en este caso, para cada y0 la afirmación ∀ y1 ((x, y1 ) ∈ F ⇒ y0 = y1 ) es falsa, así que ∀ y0 (((x, y0 ) ∈ F ∧ ∀ y1 ((x, y1 ) ∈ F ⇒ y0 = y1 )) ⇒ z ∈ y0 ) es verdadera pues la premisa es falsa. Por tanto, cada z ∈ V satisface la condición que define a F (x), es decir, F (x) = V . El siguiente resultado expresa que la imagen de un conjunto respecto a una función, es un conjunto. Lema 2.6 (TEC ). Los siguientes esquemas son equivalentes: (1) Reemp. ~ )}, la afirmación (2) Para cada término clase F = {z : ψ(z, w ~ ∀ a(Fun(F ) ⇒ F [a] ∈ V ) ∀w es cierta. 40 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 41 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Supongamos TEC . ~ de F (1) ⇒ (2). Sea F como en (2). Hacemos explícitas las variables libres w ~ ) como la fórmula (y = Fw~ (x)). Suponga escribiendo Fw~ . Definimos Φ(x, y, w ~ y a y que Fw~ es función. Aplicamos Reemp a Φ que se tienen los conjuntos w ~ y a. Ya que F es “funcional” se satisface la premisa de la con los parámetros w ~ ))} ∈ afirmación correspondiente en Reemp, así que {y : ∃ x(x ∈ a ∧ Φ(x, y, w ~ ))} = F [a], todo queda demostrado. V . Como {y : ∃ x(x ∈ a ∧ Φ(x, y, w ~ ) una fórmula de LTC. Dados los conjuntos w ~ y a, (2) ⇒ (1). Sea Φ(x, y, w ocurre ~ ) ∧ Φ(x, y2 , w ~ ) ⇒ y1 = y2 ). ∀ x, y1 , y2 (Φ(x, y1 , w (11) Definimos la clase F como Def ~ ))}. F = {z : ∃ x∃ y(z = (x, y) ∧ Φ(x, y, w De (11) se sigue que F es función. Además, por hipótesis F [a] ∈ V y es fácil ~ ))} = F [a]. Queda entonces demostrado el ver que {y : ∃ x(x ∈ a ∧ Φ(x, y, w lema. También para el axioma Fund podemos encontrar una caracterización en términos de clases, cuya sencilla demostración se deja al lector. Lema 2.7 (TEC ). Las siguientes afirmaciones son equivalentes: 1. Fund. ~ )}, la afirmación 2. Para cada término clase A ≡ {x : Φ(x, w ~ (A 6= ∅ ⇒ ∃ x(x ∈ A ∧ A ∩ x = ∅)). ∀w En cuanto al axioma de elección, tenemos la siguiente caracterización inmediata, cuya demostración también queda al lector: Lema 2.8 (TEC ). Las siguientes condiciones son equivalentes: 1. AE . 2. ∀ a∃ b((∅ ∈ / a ∧ ∀ x1 ∀ x2 ((x1 ∈ a ∧ x2 ∈ a ∧ x1 6= x2 ) ⇒ x1 ∩ x2 = ∅)) ⇒ ∀ x(x ∈ a ⇒ ∃ y (b ∩ x = {y}))). 41 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 42 ✐ ✐ 2. Teoría elemental de conjuntos 2.2. Funciones. Una n-función en un conjunto x es una (n + 1)-relación R en x, tal que para toda n-ada (a1 , . . . , an ) ∈ dom R existe exactamente una b ∈ ran R tal que (a1 , . . . , an , b) ∈ R. Como es usual, si R es una n-función en x y a1 , . . . , an , b ∈ x son tales que (a1 , . . . , an , b) ∈ R, escribimos R(a1 , . . . , an ) = b. Note que si f : x − → y, entonces f ⊆ x × y. Si f : x − →yyg:y− → z, definimos g ◦ f : x − → z mediante g ◦ f (a) = g(f (a)) para toda a ∈ x. Sea f : x − → y. Si u ⊆ x, definimos la imagen de u respecto a f como el conjunto f [u] = {f (a) : a ∈ u}; si v ⊆ y, definimos la imagen inversa o preimagen de v respecto a f como el conjunto f −1 [v] = {a ∈ x : f (a) ∈ v}. (Observe la diferencia entre el uso de corchetes y paréntesis en funciones). Si f : x − → y, definimos la restricción de f a u por f ↾ u = {(a, f (a)) : a ∈ u}. Note que f ↾ u es una función con dominio u. Sea f : x − → y. Decimos que f es inyectiva (o uno a uno) si ∀a, b ∈ x(a 6= b ⇒ f (a) 6= f (b)). Decimos que f es sobre o suprayectiva si f [x] = y. Decimos que f es biyectiva si es inyectiva y sobre. Note que si f : x − → y y v ⊆ y, el conjunto f −1 [v] está definido, no importa si f es biyectiva o no. Una vez que contamos con la definición de función, podemos dar una versión general del producto cartesiano arbitrario. 42 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 43 ✐ ✐ Conjuntos y modelos. Curso avanzado Sea {xi : i ∈ I} una familia de conjuntos. El producto cartesiano de esta familia de conjuntos se define como Y i∈I xi = {f : (f : I − → [ i∈I xi ), (∀ i ∈ I)(f (i) ∈ xi )}. Si x = xi , para toda i ∈ I escribimos xI en lugar de 3. Órdenes Q i∈I xi . Las relaciones binarias son especialmente importantes en teoría de conjuntos y, por supuesto, en toda la matemática. Hay varias propiedades que son significativas para las relaciones binarias. Sea R una relación binaria en un conjunto x. Decimos que • R es reflexiva si (∀ a ∈ x)(aRa); • R es simétrica si (∀ a, b ∈ x)(aRb ⇒ bRa); • R es antisimétrica si (∀ a, b ∈ x)([aRb ∧ a 6= b) ⇒ ¬(bRa)]; • R es total si (∀ a, b ∈ x)[(a 6= b) ⇒ (aRb ∨ bRa)]. • R es transitiva si (∀ a, b, c ∈ x)[(aRb ∧ bRc) ⇒ (aRc)]. Una relación binaria en un conjunto es una relación de equivalencia cuando es reflexiva, simétrica y transitiva. Si R es una relación de equivalencia en un conjunto x, la clase de equivalencia de un elemento a de x respecto a R se define como [a]R = {b ∈ x : aRb}. Prescindimos del subíndice R en [a]R cuando es claro de qué relación R se trata. En esta sección, relación significa relación binaria, es decir, una relación en un conjunto x, un subconjunto de x2 . Una relación < en un conjunto x es un orden parcial en x si: (i) < es antirreflexiva, es decir, ∀p ∈ x¬(p < p). (ii) < es transitiva. (x, <) o simplemente x es un conjunto parcialmente ordenado si < es un orden parcial en x. Un orden parcial < es un orden lineal o total si < es total. Si < es un orden parcial, escribimos a ≤ b si a = b ∨ a < b. En lo sucesivo, ≤ denotará un orden parcial. Si (p, <) es un conjunto parcialmente ordenado, x un subconjunto de p y a ∈ p, entonces 43 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 44 ✐ ✐ 2. Teoría elemental de conjuntos • • • • • • • • a es un elemento máximo de x si a ∈ x ∧ (∀ y ∈ x)(a ≮ y); a es un elemento mínimo de x si a ∈ x ∧ (∀ y ∈ x)(y ≮ a); a es el mayor elemento de x si a ∈ x ∧ (∀ y ∈ x)(y ≤ a); a es el menor elemento de x si a ∈ x ∧ (∀ y ∈ x)(a ≤ y); a es una cota superior de x si (∀ y ∈ x)(y ≤ a); a es una cota inferior de x si (∀ y ∈ x)(a ≤ y); a es el supremo de x si a es la menor cota superior de x; a es el ínfimo de x si a es la mayor cota inferior de x. El supremo (ínfimo) de x (si existe) se denota por sup x (ínf x). Note que si x está linealmente ordenado por <, entonces un elemento máximo de x es su mayor elemento (en forma similar para el elemento mínimo). Un conjunto parcialmente ordenado (x, ≤) está bien fundado si todo subconjunto no vacío de x tiene un elemento mínimo. En ocasiones diremos que la relación ≤ está bien fundada. Lema 3.1. Sea (x, ≤) un conjunto parcialmente ordenado. (x, ≤) está bien fundado si y sólo si no existe una sucesión {an : n = 1, 2, . . .} de elementos de x tales que an+1 < an para toda n, es decir, no existe una sucesión {an : n = 1, 2, . . .} con a0 > a1 > a2 > · · · . Demostración. Suponga que (x, ≤) no está bien fundado. Sea y ⊆ x un subconjunto sin elemento mínimo. Sea a0 ∈ y. Como a0 no es elemento mínimo, debe existir a1 ∈ y con a0 > a1 . Repetimos el razonamiento, esta vez con a1 , para encontrar a2 ∈ y con a1 > a2 y así sucesivamente. Procediendo en forma recursiva encontramos una sucesión decreciente a0 > a1 > a2 > . . . Hemos utilizado el teorema de recursión sobre los naturales (teorema 6.10), que se prueba más adelante en este capítulo. Ahora suponga que existe una sucesión a0 > a1 > a2 > . . . y sea y el conjunto {a0 , a1 , a2 , . . .}. Resulta claro que y no tiene elemento mínimo. Definición 3.2. Sean (x, ≤) y (y, ⋖) conjuntos parcialmente ordenados. Decimos que x es isomorfo a y (en símbolos x ∼ = y) si existe una biyección f : x − → y tal que a ≤ b ⇔ f (a) ⋖ f (b) para todo a, b ∈ x. La relación ⊆ en cualquier colección de conjuntos es un orden parcial en esa colección. De hecho, esta relación es el único orden parcial posible (salvo isomorfismos), como se demuestra a continuación: 44 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 45 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 3.3 (Representación de conjuntos parcialmente ordenados). Sea (x, ≤) un conjunto parcialmente ordenado. Entonces existe un conjunto y de subconjuntos de x tal que (x, ≤) ∼ = (y, ⊆). Demostración. Para cada a ∈ x, sean za = {b ∈ x : b ≤ a} y y = {za : a ∈ x}. Definimos una función π de x a y mediante π(a) = za . Es claro que π es una biyección. Más aún, a1 ≤ a2 ⇔ za1 ⊆ za2 , así que π es un isomorfismo entre (x, ≤) y (y, ⊆). Definición 3.4. Un buen orden en un conjunto x es un orden bien fundado y lineal en x. Un conjunto bien ordenado es una pareja (x, ≤) tal que ≤ es un buen orden en x. La noción de conjunto bien ordenado debe ser familiar para el lector, pero este concepto se generaliza a clases propias, lo cual da origen la siguiente sección. 4. Buen orden En la sección 3 definimos relaciones en conjuntos que los convierten en conjuntos bien ordenados. En esta sección consideramos relaciones que generalizan un buen orden a términos clase. Por supuesto, debemos ser muy cuidadosos pues un término clase puede no ser un conjunto. Utilizamos la noción de relación reflexiva, transitiva, etc., en una clase A, como una generalización obvia de las nociones respectivas definidas para conjuntos. Definición 4.1. Sean A y R términos clase. 1. R es un orden lineal estricto sobre A, que se denota (OLE(R, A)), si R es una relación en A reflexiva, transitiva y, para cada par de puntos x, y de A, se cumple que xRy o yRx o x = y. 2. R es un buen orden sobre A, que se denota BO(R, A), si se satisfacen las siguientes condiciones: (a) R es un orden lineal estricto sobre A. (b) Para cada término clase B, la siguiente afirmación es cierta: B 6= ∅ ∧ B ⊆ A ⇒ ∃ x(x ∈ B ∧ ∀ y(yRx ⇒ y ∈ / B)), es decir, cada subclase no vacía de A tiene un elemento R-mínimo. En este caso decimos que R bien ordena A. 45 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 46 ✐ ✐ 2. Teoría elemental de conjuntos 3. R es un buen orden fuerte sobre A, que se denota BOF (R, A), cuando BO(R, A) y además ∀ x(x ∈ A ⇒ {y : y ∈ A ∧ yRx} ∈ V ), es decir, los R-predecesores de un elemento forman un conjunto. Si sucede lo último también se dice que R es limitada por la izquierda. Como es natural, cuando A es un conjunto, la definición anterior se simplifica y se reduce a la definición que ya habíamos dado: Lema 4.2. Sea a un conjunto. Las siguientes condiciones son equivalentes: 1. BO(R, a). 2. OLE(R, a) ∧ ∀ b((b ⊆ a ∧ b 6= ∅) ⇒ ∃ x(x ∈ b ∧ ∀ y(yRx ⇒ y ∈ / b))). 3. BOF (R, a). Demostración. (1) ⇒ (2). Esto es inmediato, pues b coincide con el término clase B ≡ {x : x ∈ b}. (2) ⇒ (3). Del axioma Comp cada término clase B ⊆ a es un conjunto, así que se obtiene de inmediato la existencia de un elemento R-mínimo en cada subclase B de a no vacía. De Comp se obtiene, además, {y : y ∈ a ∧ yRx} ∈ V para cada x ∈ a. (3) ⇒ (1). Es claro. Este último lema muestra que, para conjuntos, las nociones de buen orden y buen orden fuerte coinciden. En este caso la propiedad de ser buen orden puede definirse por medio de la fórmula (2) del lema, que es la definición dada en la sección 3 y es una fórmula de LTC. En lo sucesivo utilizamos como definición de buen orden, en el caso de conjuntos, la fórmula del inciso (2) del lema. La siguiente proposición demuestra que podemos definir la noción de buen orden fuerte por medio de una fórmula de LTC aun en el caso de clases. Proposición 4.3. Sean A y R términos clase. Entonces son equivalentes: 1. R es un buen orden fuerte en A. 2. OLE(R, A) ∧ ∀ b((b ⊆ A ∧ b 6= ∅) ⇒ ∃ x(x ∈ b ∧ ∀ y(yRx ⇒ y ∈ / b))) ∧ ∀ x(x ∈ A ⇒ {y : yRx} ∈ V ). (Note que en 2, b es un conjunto). Demostración. (1) ⇒ (2). Es inmediato. 46 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 47 ✐ ✐ Conjuntos y modelos. Curso avanzado (2) ⇒ (1). Sea B un término clase no vacío contenido en A. Fijemos x ∈ B. Por hipótesis {y : y ∈ A ∧ yRx} = {y : yRx} ∈ V, así que de Comp, aplicado al término clase {y : y ∈ A ∧ yRx} ∩ B = b, obtenemos el conjunto b. Distinguimos dos casos: Caso 1. b = ∅. Aquí x es un elemento R-mínimo de B, pues de yRx y y ∈ B se sigue y ∈ b. Caso 2. b 6= ∅. Existe, por hipótesis, un elemento R-mínimo x′ ∈ b; entonces x′ ∈ B y {y : y ∈ A ∧ yRx′ } ∩ B es un conjunto b′ , que satisface la condición del caso 1. Por lo tanto, x′ es un elemento R-mínimo de B. 5. Cortaduras En esta sección presentamos un método de completación de conjuntos linealmente ordenados. Utilizamos cortaduras de Dedekind para efectuar este proceso. Definición 5.1. Sea (P, <) un conjunto linealmente ordenado. Un hueco es una pareja (A, B) de conjuntos tales que: (a) A y B son subconjuntos de P ajenos entre sí y A ∪ B = P. (b) Si a ∈ A y b ∈ B entonces a < b. (c) A no tiene un elemento más grande y B no tiene un elemento más pequeño. Por ejemplo, sean B = {x ∈ Q : x > 0, x2 > 2} y B = Q − B. Se verifica fácilmente que (A, B) es un hueco en Q. Un subconjunto de un conjunto linealmente ordenado P está acotado si tiene cotas inferior y superior. Un conjunto está acotado por arriba (por abajo) si tiene una cota superior (inferior). Sea (A, B) un hueco en un conjunto linealmente ordenado. El conjunto A está acotado por arriba pues cualquier b ∈ B es cota superior de A. Afirmamos que A no tiene supremo: si c = sup A, entonces c sería el elemento más grande de A o el más pequeño de B. Por otra parte, sean S un conjunto no vacío acotado por arriba y A = {x : ∃ s ∈ S(x ≤ s)}, B = {x : ∃ s ∈ S(x > s)}. 47 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 48 ✐ ✐ 2. Teoría elemental de conjuntos El lector puede verificar sin dificultad que la pareja (A, B) satisface las propiedades (a) y (b) de la definición de hueco. Ahora suponga que S no tiene supremo. Entonces (A, B) es un hueco, pues el elemento más grande de A o el más pequeño de B serían el supremo de S. Definición 5.2. Sea (P, <) un conjunto linealmente ordenado. P es completo si todo subconjunto S no vacío de P acotado por arriba tiene supremo. Note que (P, <) es completo si y sólo si no tiene huecos. Los racionales son un ejemplo de que un conjunto linealmente ordenado denso no es necesariamente completo. No obstante, todo conjunto linealmente ordenado se puede completar llenando sus huecos y el resultado es esencialemnte único: Teorema 5.3. Sea (P, <) un conjunto linealmente ordenado denso sin extremos. Entonces existe un conjunto linealmente ordenado completo (C, ≺) tal que: (a) P ⊆ C. (b) Si p, q ∈ P entonces p < q si y sólo si p ≺ q (≺ coincide con < en P). (c) P es denso en C, es decir, para cualesquier p, q ∈ P tales que p < q existe c ∈ C con p ≺ c ≺ q. (d) C no tiene extremos. Más aún, (C, ≺) es único (salvo isomorfismos). En otras palabras, si (C∗ , ≺∗ ) es un conjunto linealmente ordenado denso que satisface (a)–(d), entonces existe un isomorfismo h entre (C, ≺) y (C∗ , ≺∗ ) tal que h(x) = x para cada x ∈ P. El conjunto (C, ≺) es la completación de (P, <). Demostración [Unicidad] Sean (C, ≺) y (C∗ , ≺∗ ) dos conjuntos linealmente ordenos que satisfacen (a)–(d). Mostraremos que existe un isomorfismo h de C sobre C∗ tal que h(x) = x para cada x ∈ P. Si c ∈ C, sea Sc = {p ∈ P : p  c}. De manera similar, sea Sc∗ = {p ∈ P : p ∗ c∗ } para c∗ ∈ C∗ . Si S es un subconjunto no vacío de P acotado por arriba, sea sup S el supremo de S en (C, ≺) y sup∗ S el supremo de S en (C∗ , ≺∗ ). Note que sup Sc = c, sup∗ Sc∗ = c∗ . Definimos la función h como: h(c) = sup∗ Sc . Es claro que h es una función de C en C∗ ; debemos constatar que h es sobre y que (a) Si c ≺ d entonces h(c) ≺∗ h(d); (b) h(x) = x para toda x ∈ P. 48 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 49 ✐ ✐ Conjuntos y modelos. Curso avanzado Para establecer que h es sobre, sea c∗ ∈ C∗ arbitraria. Entonces c∗ = sup Sc∗ , y si hacemos c = sup Sc∗ entonces Sc = Sc∗ y c∗ = h(c). Si c ≺ d, entonces (teniendo en cuenta que P es denso en C) existe p ∈ P tal que c ≺ p ≺ d. Se verifica fácilmente que sup∗ Sc ≺∗ sup∗ Sp ≺∗ sup∗ Sd y por lo tanto h(c) ≺∗ h(d). De aquí concluimos que h es un isomorfismo. Finalmente, si x ∈ P, entonces x = sup Sx = sup∗ Sx y por consiguiente h(x) = x. ◭ Para probar la existencia de la completación introducimos las cortaduras de Dedekind. Definición 5.4. Una cortadura es una pareja (A, B) de conjuntos tales que (a) A y B son ajenos entre sí, no vacíos y A ∪ B ⊆ P. (b) Si a ∈ A y b ∈ B entonces a < b. Note que un hueco es una cortadura y que, como P es denso, no es posible que A tenga un elemento más grande y simultáneamente B tenga un menor elemento. En cualquier caso el supremo de A existe: en el primer caso el supremo es el mayor elemento de B, y en el otro caso el supremo es el mayor elemento de A. Por lo tanto, consideramos sólo el primer caso y descartamos las cortaduras en las que A tiene un elemento más grande. Definición 5.5. Una cortadura (A, B) es de Dedekind si A no tiene un elemento más grande. Existen dos tipos de cortaduras de Dedekind (A, B): (a) Aquellas en las que B = {x ∈ P : x ≥ p} para alguna p ∈ P; la denotamos (A, B) = [p]. (b) Huecos. Consideremos el conjunto C de todas las cortaduras de Dedekind (A, B) de (P, <) y ordenemos C como se describe a continuación: (A, B)  (A′ , B′ ) si y sólo si A ⊆ A′ . Se constata de inmediato que (C, ) es un conjunto linealmente ordenado. Si p, q ∈ P son tales que p < q, entonces [p] ≺ [q], así que el conjunto linealmente ordenado (P ′ , ≺), donde P ′ = {[p] : p ∈ P} es isomorfo a (P, <). Queremos probar que (C, ≺) es una completación de (P ′ , ≺). Como (P, <) y (P ′ , ≺) son isomorfos, se sigue que (P, <) tiene una completación. Es suficiente mostrar que: (c’) P ′ es denso en (C, ≺). 49 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 50 ✐ ✐ 2. Teoría elemental de conjuntos (d’) C no tiene extremos. (e) (C, ≺) es completo. Para verificar que P ′ es denso en C, sean c, d ∈ C tales que c ≺ d, es decir, c = (A, B), d = (A′ , B′ ) y A ⊆ A′ . Sea p ∈ P con la propiedad de que p ∈ A′ yp∈ / A. Más aún, podemos suponer que p no es el menor elemento de B. Entonces (A, B) ≺ [p] ≺ (A′ , B′ ) y, por consiguiente, P ′ es denso en C. Esto también demuestra que (C, ≺) es un conjunto ordenado denso. En forma similar, si (A, B) ∈ C, entonces existe p ∈ B que no es el menor elemento de B y se cumple (A, B) ≺ [p]. Por lo tanto, C no tiene un mayor elemento. Por razones análogas, C no tiene menor elemento. Para mostrar que C es completo, sea S un subconjunto no vacío de C acotado por arriba. En consecuencia, existe (A0 , B0 ) ∈ C tal que A ⊆ A0 siempre que (A, B) ∈ S. Para encontrar el supremo de S, sean AS = y [ {A : (A, B) ∈ S}, B S = P − AS = \ {B : (A, B) ∈ S}. Es fácil corroborar que (AS , BS ) es una cortadura de Dedekind: As no tiene un elemento mayor pues ninguno de los As lo tiene. Como AS ⊇ A para cada (A, B) ∈ S, (AS , BS ) es una cota superior de S; corroboramos que (AS , BS ) es la menor cota superior de S. Si (A, B) es una S cota superior de S, entonces A ⊆ A para toda (A, B) ∈ S, y así AS = {A : (A, B) ∈ S} ⊆ A. Por lo tanto, (AS , BS )  (A, B). En consecuencia, (AS , BS ) es el supremo de S. 6. Los números naturales Zermelo definió los números naturales como sigue: 0 = ∅, 1 = {∅}, 2 = {{∅}}, 3 = {{{∅}}} y así sucesivamente. Una desventaja de esta definición es que no se puede generalizar a números ordinales, los cuales introducimos después, y existía la necesidad de generalizar el proceso y continuar a cantidades transfinitas. Por lo tanto, J. von Neumann propuso representar el número n mediante un conjunto de exactamente n elementos, a saber: Def n = {0, 1, . . . , n − 1}. 50 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 51 ✐ ✐ Conjuntos y modelos. Curso avanzado Con esto obtenemos 0=∅ n + 1 = {0, 1, . . . , n} = {0, 1, . . . , n − 1} ∪ {n}. En consecuencia definimos: Definición 6.1. 0 = ∅, x + 1 = x ∪ {x}. En particular, 1 = 0 + 1, 2 = 1 + 1, 3 = 2 + 1. La clase de los números así construidos debe ser un conjunto, lo que se verifica por el axioma de infinito. Definición 6.2. El término clase A es inductivo si ∅ ∈ A ∧ ∀ y(y ∈ A ⇒ y ∪ {y} ∈ A). Es claro que la intersección de una familia de conjuntos inductivos es inductiva. Así que el axioma de infinito dice que existe un conjunto inductivo. Definición 6.3. ω = números naturales. T {x : x es inductivo}. Donde ω es el conjunto de los Con gran frecuencia denotaremos a los números naturales también con N. Observe que ω es efectivamente un conjunto, 0 ∈ ω, y que si y ∈ ω, entonces y + 1 ∈ ω. Con n, m denotaremos en lo sucesivo números naturales. En particular, ∀ nΦ(n) significa ∀ x(x ∈ ω ⇒ Φ(x)); del mismo modo, ∃ nΦ(n) significa ∃ x(x ∈ ω ∧ Φ(x)) y {n : Φ(n)} quiere decir {x : x ∈ ω ∧ Φ(x)}, donde Φ es una fórmula de LTC. Nuestro primer teorema importante es el teorema de inducción en ω que proporciona un método para demostrar propiedades inherentes a los números naturales. Teorema 6.4 (Inducción en ω). (a) Supongamos que x ⊆ ω, 0 ∈ x y ∀ n(n ∈ x ⇒ n + 1 ∈ x); entonces x = ω. Es decir, si un subconjunto de ω que contiene al 0, y siempre que contiene a n también n + 1 le pertenece, el conjunto en cuestión es ω. (b) Para cada fórmula Φ(x) de LTC, es cierto que Φ(0) ∧ ∀ n(Φ(n) ⇒ Φ(n + 1)) ⇒ ∀ nΦ(n). 51 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 52 ✐ ✐ 2. Teoría elemental de conjuntos Demostración. (a) x es inductivo, así que ω ⊆ x. (b) Sea A = {n : Φ(n)}. Entonces A ⊆ ω (por lo que A es un conjunto), además se tiene: 0∈A n ∈ A ⇒ n + 1 ∈ A. De (a) se sigue que A = ω. El siguiente lema describe las principales propiedades de los números naturales. Definición 6.5. Un conjunto a es transitivo si para todo x ∈ a se cumple x ⊆ a. Lema 6.6. (a) (b) (c) (d) (e) (f) (g) (h) (i) n es transitivo. ω es transitivo. n∈ / n. n ⊆ m + 1 ⇔ n ⊆ m ∨ n = m + 1. n ⊆ m ⇔ n ∈ m ∨ n = m. n ⊆ m ∨ m ⊆ n. n ∈ m ∨ n = m ∨ m ∈ n. n + 1 6= ∅. n + 1 = m + 1 ⇒ n = m. Demostración. Ejercicio. También se puede proceder con otros tipos de inducción; el primero asegura que si tenemos un subconjunto de naturales para el cual es cierto que si todos los números menores que un cierto natural le pertenecen, ello implica que el natural pertenece al conjunto, entonces nuestro conjunto inicial son todos los naturales. El segundo tipo de inducción expresa lo mismo, pero para cierta propiedad válida para números naturales. Teorema 6.7 (Principio de inducción fuerte). (a) Supongamos que x ⊆ ω; ∀ n[∀ m(m ∈ n ⇒ m ∈ x) ⇒ n ∈ x] ⇒ x = ω. 52 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 53 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) Si Φ es una fórmula de LTC, ∀ n[∀ m(m ∈ n ⇒ Φ(m)) ⇒ Φ(n)] ⇒ ∀ nΦ(n). Demostración. (b) Suponga cierto ∀ n[∀ m(m ∈ n ⇒ Φ(m)) ⇒ Φ(n)]; en este caso se dice que Φ(n) es progresiva. Se demostrará que ∀ m(m ∈ n ⇒ Φ(m)) por inducción sobre n. Para n = 0 es evidente. Supongamos que es cierto para n y lo demostramos para n + 1: por hipótesis de inducción sabemos que ∀ m(m ∈ n ⇒ Φ(m)). Sea m ∈ n + 1. Entonces m ∈ n ∨ m = n. En el caso m ∈ n, se deduce Φ(m) de la hipótesis de inducción y, en el caso m = n, se desprende Φ(n) porque Φ es progresiva y por la hipótesis de inducción. Finalmente, de la primera suposición y con lo recién demostrado se concluye que ∀nΦ(n). Def (a) Se desprende de (b) con Φ(y) = y ∈ x. El siguiente teorema enuncia el axioma Fund para los naturales. Sin embargo, damos una demostración a partir de la definición de ω. Teorema 6.8 (Principio del menor elemento para ω). (a) Supongamos que ∅ 6= x ⊆ ω, entonces ∃ n(n ∈ x ∧ n ∩ x = ∅). Es decir, todo subconjunto de ω tiene un elemento menor. (b) ∃ nΦ(n) ⇒ ∃ n[Φ(n) ∧ ¬∃ m(m ∈ n ∧ Φ(m))]. Demostración. (b) Se cumple por el teorema 6.7 (b) que ∀ n[∀ m(m ∈ n ⇒ ¬Φ(m)) ⇒ ¬Φ(n)] ⇒ ∀ n¬Φ(n). Por contrapositiva: ∃ nΦ(n) ⇒ ∃ n[Φ(n) ∧ ∀ m(m ∈ n ⇒ ¬Φ(m))] ∃ nΦ(n) ⇒ ∃ n[Φ(n) ∧ ¬∃ m(m ∈ n ∧ Φ(m))]. Def (a) Se sigue de (b) con Φ(y) = y ∈ x. 53 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 54 ✐ ✐ 2. Teoría elemental de conjuntos Como es natural, la relación de pertenencia es bien fundada al restringirse a los naturales: Lema 6.9. La relación ∈ ∩(ω × ω) es una relación transitiva y bien fundada en ω. Demostración. Sea ∅ 6= a ⊆ ω. Debemos mostrar que ∃ n(n ∈ a ∧ n ∩ a = ∅). Éste es el principio del elemento más pequeño. Lo demás es obvio, pues n es transitivo. Ahora procedemos a probar el teorema de recursión sobre los números naturales. Teorema 6.10 (Recursión sobre ω). Sea F : V − → V . Para todo c ∈ V existe exactamente una función f : ω − → V , tal que f (0) = c ∀ i ∈ ω [f (i + 1) = F (f (i))]. (*) Demostración. (a) Unicidad. Suponga que f0 , f1 son funciones de ω en V que satisfacen (*). Por inducción se demuestra que f0 (i) = f1 (i) para toda i ∈ ω; en consecuencia, f0 = f1 . (b) Existencia. De modo intuitivo obtenemos f mediante aproximaciones f ↾ 1 = {(0, c)}, f ↾ 2 = {(0, c), (1, F (c))}, . . . Formalmente, g es una aproximación si existe j ∈ ω con la siguiente propiedad: dom g = j + 1 ran g ⊆ V g(0) = c ∀ i ∈ ω(i < j ⇒ g(i + 1) = F (g(i))). (**) ∀ g, h(g, h aproximaciones ⇒ g ⊆ h ∨ h ⊆ g). (1) ∀ j∃ g(g es una aproximación ∧ dom g = j + 1). (2) Es fácil verificar que dos aproximaciones coinciden en la intersección de sus dominios. Por lo tanto, Mediante inducción sobre j se obtiene 54 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 55 ✐ ✐ Conjuntos y modelos. Curso avanzado Para j = 0, tomamos g = {(0, c)} y si g es una aproximación con dom g = j +1, entonces g ∪{(j +1, F (g(j))} es una aproximación con dominio igual a j + 1. Definimos H(x) =    g(x),   ∅, donde g es una aproximación con x ∈ dom g, si x ∈ ω. en otro caso. Por (1) y (2) H es una función. Se verifica que f = H ↾ ω satisface los requerimientos del teorema. Con ayuda del teorema de recursión 6.10 es posible definir las operaciones usuales en los números naturales. Definimos las funciones sm para toda m ∈ ω, mediante: Definición 6.11. sm (0) = m, sm (n + 1) = sm (n) + 1. Observe que para cada m, existe una función con estas propiedades y es única. Def Definición 6.12. m + n = sm (n). Note que como sm (1) = sm (0 + 1) = sm (0) + 1 = m + 1, nuestra definición coincide para n = 1 con nuestra terminología. Además, m + 0 = m y m + (n + 1) = (m + n) + 1. Lema 6.13. (a) m + n ∈ ω. (b) (m + n) + p = m + (n + p). (c) m + n = n + m. Demostración. Ejercicio. Para definir la multiplicación requerimos funciones similares a las sm . Definición 6.14. Para cada m ∈ ω, definimos las funciones pm mediante pm (0) = 0, pm (n + 1) = pm (n) + m. 55 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 56 ✐ ✐ 2. Teoría elemental de conjuntos Observe que por el teorema de recursión existe, otra vez para cada m, una función como la de la definición. Para ello necesitamos definir: F :V − → V, F (x) = ( x + m, ∅, si x ∈ ω; en otro caso. Def Definición 6.15. m · n = pm (n). Observe que m · 0 = 0, m · (n + 1) = m · n + m. El siguiente lema resume las propiedades bien conocidas de la multiplicación de números naturales. Lema 6.16. (a) (b) (c) (d) (e) m · n ∈ ω. m · (n + p) = m · n + m · p. (n + p) · m = n · m + p · m. (m · n) · p = m · (n · p). 0 · n = 0, 1 · n = n, m · n = n · m. Demostración. Ejercicio. 7. Ordinales Recuerde que un buen orden en un conjunto x es un orden lineal en x que está bien fundado. De acuerdo con nuestra definición, un orden parcial de un conjunto x está bien fundado si y sólo si todo subconjunto no vacío y de x tiene un elemento mínimo (es decir, un elemento de y que no tiene predecesores en y respecto al orden parcial). Pero en el caso de órdenes lineales, un elemento de un subconjunto y de x será mínimo si y sólo si es el menor elemento de y. Esto nos permite probar: Teorema 7.1 (Inducción sobre buenos órdenes). Sea (X, ≤) un conjunto bien ordenado. Sea E un subconjunto de X tal que (i) el elemento más pequeño de X es miembro de E; (ii) para cualquier x ∈ X, si ∀ y[y < x ⇒ y ∈ E], entonces x ∈ E. Entonces E = X. 56 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 57 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Suponga que E 6= X. Sea x el menor elemento del conjunto no vacío X − E. Por (i), x no es el menor elemento de X. Pero por la elección de x, se cumple que y < x ⇒ y ∈ E. Por lo tanto, de (ii) se sigue que x ∈ E, lo cual es una contradicción. El teorema 7.1 nos permite probar resultados por inducción en un conjunto bien fundado. A continuación aislaremos lo que tienen en común todos los conjuntos bien ordenados, empezando por comparar conjuntos bien ordenados. Teorema 7.2. Sean (X, ≤) un conjunto bien ordenado y Y ⊆ X. Si f : X − → Y es un isomorfismo, entonces para toda x ∈ X, x ≤ f (x). Demostración. Sea E = {x ∈ X : f (x) < x}. Debemos probar que E = ∅. Suponga lo contrario. Entonces E tiene un elemento menor x0 . Como x0 ∈ E, se sigue que f (x0 ) < x0 . Sea x1 = f (x0 ). Como x1 < x0 , aplicamos f para concluir f (x1 ) < f (x0 ). Así que f (x1 ) < x1 . Por lo tanto, x1 ∈ E. Pero x1 < x0 , lo que contradice la elección de x0 como el menor miembro de E. Teorema 7.3. Sean (X, ≤), (X′ , ) conjuntos bien ordenados. Si (X, ≤) ∼ = (X′ , ), entonces existe exactamente un isomorfismo f : X − → X′ . Demostración. Sean f : X − → X′ , g : X − → X′ isomorfismos. −1 Definimos h = f ◦ g. Es fácil ver que h es un isomorfismo de X a X. Así, por el teorema 7.2, x ≤ h(x) para toda x ∈ X. Si ahora aplicamos f , obtenemos que para toda x ∈ X, f (x)  f (h(x)) = g(x). En forma similar, g(x)  f (x) para toda x ∈ X. En consecuencia f = g, y la prueba está completa. Se debe notar que el resultado anterior no es siempre válido para dos conjuntos linealmente ordenados el buen orden es imprescindible. Por ejemplo, sean Z el conjunto de todos los enteros y ≤ el orden usual en Z. Para cualquier entero m, la función fm : Z − → Z, definida por fm (n) = n + m, es un ′ isomorfismo, y m 6= m implica fm 6= fm′ . Observe que si m < 0, entonces fm (n) < n, así que este ejemplo muestra que el teorema 7.2 también requiere buen orden. Sean (X, ≤) un conjunto bien ordenado y a ∈ X. El segmento inicial Xa de X, determinado por a, es el conjunto Xa = {x ∈ X : x < a}. 57 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 58 ✐ ✐ 2. Teoría elemental de conjuntos En ocasiones usaremos la notación X(a) en lugar de Xa , cuando esta última resulte incómoda por el contexto. Teorema 7.4. Sea (X, ≤) un conjunto bien ordenado. No existe un isomorfismo de X sobre un segmento inicial suyo. Demostración. Suponga que f es un isomorfismo entre X y Xa , para alguna a ∈ X. Por el teorema 7.2, x ≤ f (x) para toda x ∈ X; en particular, a ≤ f (a). Pero ran(f ) = Xa , así que f (a) ∈ Xa , lo que implica f (a) < a, una contradicción. Ahora llegamos a uno de los teoremas más importantes de la teoría de conjuntos bien ordenados. Teorema 7.5. Si W1 y W2 son conjuntos bien ordenados, entonces ocurre exactamente uno de los siguientes casos: (a) W1 es isomorfo a W2 ; (b) W1 es isomorfo a un segmento inicial de W2 ; (c) W2 es isomorfo a un segmento inicial de W1 . Demostración. Para u ∈ Wi (i = 1, 2), usamos esta vez Wi (u) para denotar el segmento inicial de Wi determinado por u. Sea f = {(x, y) ∈ W1 × W2 : W1 (x) es isomorfo a W2 (y)}. Es fácil ver que f es una función inyectiva. Si h es un isomorfismo entre W1 (x) y W2 (y) y x′ < x, entonces W1 (x′ ) y W2 (h(x′ )) son isomorfos. Se sigue que f preserva el orden. Si dom(f ) = W1 y ran(f ) = W2 , entonces (a) ocurre. Si y1 < y2 y y2 ∈ ran(f ), entonces y1 ∈ ran(f ). Así que si ran(f ) 6= W2 y y0 es el menor elemento de W2 − ran(f ), se cumple que ran(f ) = W2 (y0 ). Necesariamente dom(f ) = W1 , pues en otro caso tendríamos (x0 , y0 ) ∈ f , donde x0 es el menor elemento de W1 − dom(f ). Así que el caso (b) es cierto. En forma análoga, si dom(f ) 6= W1 , entonces (c) ocurre. En vista del teorema 7.4, los tres casos son mutuamente exclusivos y la prueba está terminada. Ahora introducimos la importante noción de número ordinal. Recuerde que una clase A es transitiva si para toda x ∈ A, x ⊆ A. 58 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 59 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 7.6. A es una clase ordinal si A es transitiva y ∈ ∩(A × A) es un buen orden fuerte en A. Las clases ordinales que son conjuntos se llaman números ordinales. Así que un número ordinal es un conjunto transitivo bien ordenado por ∈. Definimos Def OR = {x : x es un número ordinal}. Requerimos una caracterización más adecuada de las clases ordinales. Lema 7.7. A es una clase ordinal si y sólo si (A, ∈ ∩(A × A)) es transitiva, total y bien fundada. Demostración. Ejercicio. El siguiente resultado es de gran trascendencia en la teoría de conjuntos y, en cierta medida, es la culminación de la teoría de los conjuntos bien ordenados. Teorema 7.8 (Teorema de enumeración). Todo conjunto bien ordenado es isomorfo a un único ordinal. Este ordinal se conoce como el tipo ordinal del conjunto. Demostración. La unicidad se desprende del teorema 7.4. Dado un conjunto bien ordenado W, encontramos un ordinal y un isomorfismo como sigue: sea F (x) = α si α es isomorfo al segmento inicial de W determinado por x. Si tal α existe, es único. Por Reemp F [W] es un conjunto. Para cada x ∈ W, tal α existe (en otro caso, considere el menor x para el cual α no existe para llegar a una contradicción). Si γ es el menor ordinal tal que γ ∈ / F [W], entonces F [W] = γ y tenemos un isomorfismo de W sobre γ. Podemos definir la suma de dos conjuntos bien ordenados y obtener el ordinal asociado a la suma. Supongamos que (W1 , <1 ) y (W2 , <2 ) son conjuntos bien ordenados disjuntos; definimos la suma W1 + W2 como el conjunto bien ordenado (W, <), donde W = W1 ∪W2 y <=<1 en W1 , <=<2 en W2 y w1 < w2 para cualesquier w1 ∈ W1 , w2 ∈ W2 . 59 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 60 ✐ ✐ 2. Teoría elemental de conjuntos Teorema 7.9. Sean (W1 , <1 ) y (W2 , <2 ) conjuntos bien ordenados isomorfos a los ordinales α1 , α2 respectivamente, y (W; <) su suma. Entonces (W, <) es isomorfo al ordinal α1 + α2 .7 Demostración. Probamos el teorema por inducción en α2 . Si α2 = 0, entonces W2 = ∅, W = W1 y α1 + α2 = α. Si α2 = β + 1, entonces W2 tiene un mayor elemento a y W(a) es isomorfo a α1 + β; el isomorfismo se extiende a un isomorfismo entre W y α1 + α2 = (α1 + β) + 1. Sea α un ordinal límite. Para cada β < α2 existe un isomorfismo fβ de α1 + β sobre W(aβ ), donde aβ ∈ W2 ; más aún, fβ es único,Saβ es el β-ésimo elemento deSW2 , y si β < γ entonces fβ ⊆ fγ . Sea f = β<α1 fβ . Como α1 + α2 = β<α2 (α1 + β), se deduce que f es un isomorfismo de α1 + α2 sobre W. En lo sucesivo, Ord(A) significa que A es una clase ordinal. Las clases ordinales presentan muchas propiedades similares a las de los números naturales: para clases ordinales, la relación ∈ tiene las propiedades de < y la relación ⊆ las propiedades de ≤. Lema 7.10. (a) Si A y B son clases ordinales, también lo es A ∩ B. (b) Si Ord(A) y x ∈ A, Ord(x), es decir, todo conjunto que sea elemento de una clase ordinal, es un número ordinal. (c) Si Ord(A) y Ord(B), entonces (A ⊆ B ⇔ A ∈ B ∨ A = B). (d) Si Ord(A) y Ord(B), entonces (A ∈ B ∨ A = B ∨ B ∈ A). Demostración. (a) Ejercicio. (b) Ejercicio. (c) La dirección “⇐” es obvia pues B es transitiva. “⇒)”. Sea A ⊆ B. Sin pérdida de generalidad, podemos suponer que A ⊆ B. Escogemos x ∈ B \ A tal que x ∩ (B \ A) = ∅ (pues B es bien fundada). Basta probar que x = A. x ⊆ A) Si y ∈ x, entonces y ∈ x ∈ B, de donde se sigue que y ∈ A, pues x ∩ (B \ A) = ∅. 7 Véase definición 14.1 60 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 61 ✐ ✐ Conjuntos y modelos. Curso avanzado A ⊆ x) Si y ∈ A, entonces también y ∈ B. Se sigue que x ∈ y ∨x = y ∨y ∈ x. Los primeros dos casos son impensables pues obtendríamos x ∈ A. (d) Si Ord(A) y Ord(B), deducimos Ord(A ∩ B) por el inciso (a). De (c) se deduce [(A ∩ B ∈ A) ∨ (A ∩ B = A)] ∧ [(A ∩ B ∈ B) ∨ (A ∩ B = B)]. Después de distribuir, recibimos: (A ∩ B ∈ A ∩ B) ∨ (A ∈ B) ∨ (B ∈ A) ∨ (A = B). El primer caso A ∩ B ∈ A ∩ B no puede ocurrir pues A ∩ B está bien fundada. Note que el inciso (d), aplicado a conjuntos, implica que la relación ∈ es un orden lineal. A pesar de que las clases ordinales se comportan como conjunto, OR no es un conjunto: Lema 7.11. (a) Ord(OR). (b) OR no es un conjunto. (c) OR es la única clase ordinal propia. Demostración. (a) OR es transitiva por el lema 7.10 (b). Mostremos que OR está bien fundada. Sea a ⊆ OR, a 6= ∅. Escogemos x ∈ a. Sin pérdida de generalidad podemos suponer que x ∩ a 6= ∅. Ya que x está bien fundado, existe y ∈ x ∩ a con y ∩ x ∩ a = ∅. Se sigue que y ∈ a y y ∩ a = ∅; lo último se debe a que y ⊆ x, pues y ∈ x y x es transitivo. (b) Supongamos que OR es un conjunto. De (a) se sigue que OR ∈ OR, lo que contradice el axioma de fundación. (c) Supongamos que Ord(A) y que A no es un conjunto. Por el lema 7.10 (d) se sigue que A ∈ OR ∨ A = OR ∨ OR ∈ A. El primer y tercer caso se excluyen, pues A, respectivamente OR, serían conjuntos. 61 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 62 ✐ ✐ 2. Teoría elemental de conjuntos Lema 7.12. (a) OR es inductiva. (b) n, ω ∈ OR. (c) Si x, y son ordinales, entonces x + 1 = y + 1 ⇒ x = y. Demostración. (a) 0 ∈ OR es claro. Sea x ∈ OR. Debemos mostrar que x + 1 ∈ OR, es decir, x ∪ {x} ∈ OR, pero es inmediato mostrar que x ∪ {x} es transitivo y bien ordenado por ∈. (b) Es inmediato de las definiciones de n y ω. (c) x+1=y+1 x∈y+1∧y ∈x+1 (x ∈ y ∧ y ∈ x) ∨ x = y. Lema 7.13. A ⊆ OR ⇒ S A ∈ OR ∨ S A = OR. S S Demostración. Basta probar que Ord( A). Primero probemos que A S es transitiva: sea x ∈ y ∈ A, así que x ∈ y ∈ z ∈ A para algún z. Entonces S se sigue x S∈ z ∈ A, dado que A ⊆ OR. Por lo tanto, x ∈ A. Veamos S ahoraSque A está bien ordenada: para esto basta notar que A ⊆ OR. Sea x ∈ A; en este caso x ∈ y ∈ A, para alguna y. Entonces x ∈ y y y ∈ OR, así que x ∈ OR. S Recuerde que se supone A ⊆ OR, por lo que A es la cota superior más pequeña de ASrespecto al buen orden ∈ ∩(OR × OR) de OR, pues por la definición de A es cierto que x ∈ A ⇒ x ⊆ ∪A, (∀ x ∈ A)(x ⊆ y) ⇒ ∪ A ⊆ y. S Por lo tanto, escribimos también sup A = A. Como ejemplos de ordinales tenemos 0, 1 = 0+1, 2 = 1+1, . . . , ω (que es Def S un conjunto por el axioma de infinito, ω+1, ω+2, . . . , w·2 = {ω+n : n ∈ ω} (que se define por recursión sobre ω y es un conjunto por el axioma Reemp). Def S Después siguen ω·2+1, ω·2+2, . . . , ω·3 = {ω·2+n : n ∈ ω},. . . , ω·4, . . . 62 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 63 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Def Aun continuamos con ω · ω = ω2 = {ω · n : n ∈ ω}, . . . En lo sucesivo α, β y γ representan números ordinales. α es un ordinal sucesor si ∃ β(α = β + 1). α es ordinal límite si α no es cero ni tampoco sucesor. Escribimos S Lím(α) ⇔ α 6= 0 ∧ ¬∃ β(α = β + 1). Evidentemente, para todo ordinal α se cumple que α = 0, o α es límite o α es sucesor. Lema 7.14. (a) Lím(α) ⇔ α 6= 0 ∧ ∀ β(β ∈ α ⇒ β + 1 ∈ α). (b) Lím(ω). (c) Lím(α) ⇒ ω ⊆ α. Demostración. (a) ⇒ ) Sea β ∈ α. Entonces β + 1 ∈ α ∨ β + 1 = α ∨ α ∈ β + 1. El segundo caso β + 1 = α está excluido por hipótesis. En el tercer caso se sigue α ∈ β ∨ α = β; ambos son imposibles pues β ∈ α. Por lo tanto, β + 1 ∈ α. ⇐) Sea α 6= 0 y suponga que ∀ β(β ∈ α ⇒ β + 1 ∈ α). Si α no es límite, entonces α = β + 1. Deducimos que β ∈ α y con ello α ∈ α, lo que no puede ocurrir. (b) Se sigue de (a), pues ω es inductivo. (c) Supongamos que Lím(α). Mostraremos que n ∈ α mediante inducción sobre n. Se cumple 0 ∈ α ∨ 0 = α ∨ α ∈ 0, donde los casos segundo o tercero son impensables. Por hipótesis de inducción n ∈ α, así que n + 1 ∈ α por el inciso (a). Lema 7.15. S (a) α = β∈α (β + 1). S (b) Si Lím(α), entonces α = β∈α β. Demostración. (a) ⊆) Sea β ∈ α. La afirmación se sigue de β ∈ β + 1. ⊇) Si γ ∈ β +1 con β ∈ α, entonces γ ∈ β o γ = β, por lo que concluimos γ ∈ α. 63 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 64 ✐ ✐ 2. Teoría elemental de conjuntos (b) ⊆) Sea γ ∈ α. Entonces se deduce γ ∈ γ + 1 ∈ α. ⊇) Sea γ ∈ β ∈ α. Se desprende que γ ∈ α. Teorema 7.16 (Inducción transfinita sobre OR). ∀ α(α ⊆ B ⇒ α ∈ B) ⇒ OR ⊆ B. Demostración. Suponga que OR 6⊆ B. Sea α el menor ordinal que no pertenece a B; entonces α ⊆ B, lo que implica por hipótesis que α ∈ B, una contradicción. Corolario 7.17 (Variantes de inducción sobre OR). Sea Φ una fórmula de LTC. Primera variante: Φ(0) ∧ ∀ α(Φ(α) ⇒ Φ(α + 1)) ∧ ∀ α(Lím(α) ∧ ∀ β(β ∈ α ⇒ Φ(β)) ⇒ Φ(α)) ⇒ ∀ αΦ(α). Es decir, si tenemos una propiedad para números ordinales que es cierta para el 0, de su validez en un ordinal se deduce su validez en el sucesor; y de su veracidad en β para todo ordinal β < α se concluye su veracidad en α (α límite), entonces podemos decir que es cierta en todo ordinal. Segunda variante: ∀ α[∀ β(β ∈ α ⇒ Φ(β)) ⇒ Φ(α)] ⇒ ∀ αΦ(α). Tercera variante (Principio del menor elemento para OR): ∃ αΦ(α) ⇒ ∃ α[Φ(α) ∧ ¬∃ β(β ∈ α ∧ Φ(β))], que es el axioma Fund para números ordinales. Demostración. La tercera forma se obtiene de la segunda por contrapositiva. Además, la primera se obtiene con facilidad de la segunda forma, y ésta Def se deduce del teorema 7.16 con B = {α : Φ(α)}. Teorema 7.18 (Esquema de recursión para ordinales). Sean H : OR × V − → V un término clase y λ un ordinal. Entonces existe una única función f :λ− → V tal que para toda α ∈ λ, f (α) = H(α, f ↾ α). 64 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 65 ✐ ✐ Conjuntos y modelos. Curso avanzado Notemos que en el enunciado del teorema, implícitamente estamos cuantificando sobre todas las funciones H que conforman una clase. Esto no es posible en ZFE . Sin embargo, si consideramos una función arbitraria pero fija, H, podemos evadir la dificultad. Sea Φ(v0 , v1 , v2 ) la fórmula de LTC que define a H. Esto es, para α ∈ OR y x, y ∈ V , H(α, x) = y ⇔ Φ(α, x, y). Lo que dice el teorema es que si tenemos la fórmula Φ, podemos probar en ZF que existe una única función f : λ − → V tal que para toda α ∈ λ, Φ(α, f ↾ α, f (α)). Así que nuestro teorema es propiamente un esquema de teoremas, uno para cada H. Demostración. Unicidad. Supongamos que µ ≤ λ y fi : µ − → V, i = 1, 2, son tales que para toda α < µ, fi (α) = H(α, fi ↾ α). Por inducción sobre µ. Para µ = 0, el resultado es trivial. Sea µ > 0 y supongamos que el resultado es cierto para todo µ′ < µ, lo que significa que para µ′ < µ, f1 ↾ µ′ = f2 ↾ µ′ . Si µ es un ordinal límite, se deduce que f1 = f2 . En otro caso, µ = ν + 1. Entonces tenemos, por la hipótesis de inducción, f1 ↾ ν = f2 ↾ ν. Por lo tanto, f1 (ν) = H(ν, f1 ↾ ν) = H(ν, f2 ↾ ν) = f2 (ν); así, f1 = (f1 ↾ ν) ∪ {(ν, f1 (ν))} = (f2 ↾ ν) ∪ {(ν, f2 (ν))} = f2 . Ahora debemos probar la existencia. Sea M la clase M = {f : (∃ µ ≤ λ)[(f : µ − → ν) ∧ (∀ α ∈ µ)(f (α) = H(α, f ↾ α))]}. Para probar nuestro teorema, basta exhibir una función f ∈ M tal que dom(f ) = λ. Afirmación 1. Sean f, g ∈ M, µ = dom(f ) y ν = dom(g), y suponga que µ < ν. Entonces f = g ↾ µ. Demostración de la afirmación 1. Para toda α ∈ µ, tenemos f (α) = H(α, f ↾ α) g(α) = H(α, g ↾ α). 65 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 66 ✐ ✐ 2. Teoría elemental de conjuntos En consecuencia, f = g ↾ µ por la primera parte de la demostración. ◭ Definimos A = {µ : (∃ f ∈ M)(dom(f ) = µ)}. Mostraremos que λ ∈ A. Supongamos lo contrario, y entonces λ ∈ (λ + 1) \ A. Sea µ el menor elemento de (λ + 1) \ A. Así µ ≤ λ y para cada ν < µ, existe f ∈ M con dom(f ) = ν. Por la afirmación, para cada ν < µ, sea F (ν) la única F ∈ M tal que dom(F ) = ν. Por Reemp F [µ] es un conjunto. Sea f0 = [ F [µ]. Es fácil probar, con ayuda de la afirmación, que f0 es función. Más aún, para cada ν < µ, f0 ↾ ν = F (ν), así que para toda ν < µ, tenemos (∀ α < ν)(f0 (α) = H(α, f0 ↾ α)). Si µ es límite, esto implica que f0 ∈ M y dom(f0 ) = µ, contrario a la elección de µ. Así que µ debe ser sucesor, µ = ν + 1. Ahora hacemos f0′ = f0 ∪ {(ν, H(ν, f0 ))}. Entonces f0 ∈ M y dom(f0′ ) = µ, una contradicción y terminamos la demostración. Una vez que hemos demostrado el teorema 7.18, el lector notará que hay una gran similitud en las demostraciones de los teoremas de recursión que hemos presentado. El propósito de la siguiente sección es presentar un teorema de recursión más general, identificando lo que tienen en común los teoremas anteriores de recursión. 8. Relaciones bien fundadas En este apartado desarrollamos una generalización de los teoremas de recursión e inducción en los números naturales. En tales teoremas se utiliza el hecho de que la pertenencia es un buen orden fuerte. Sin embargo, esta propiedad la exhiben otras relaciones y podemos demostrar el teorema de recursión para ellas. Aquí suponemos ciertos los axiomas de ZFE sin el axioma Pot, es decir, la teoría ZF − . La siguiente definición generaliza la noción de buen orden fuerte a relaciones. Definición 8.1. Sean R y A términos clase. R es bien fundada en A, cuando se satisfacen las siguientes condiciones: 66 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 67 ✐ ✐ Conjuntos y modelos. Curso avanzado (RBF1) R ⊆ A × A. (RBF2) ∀ u(u 6= ∅ ⇒ ∃ x(x ∈ u ∧ ∀ u(y ∈ u ⇒ ¬yRx))). Es decir, cada conjunto no vacío tiene un elemento R-mínimo. (RBF3) ∀ x∃ y(x ∈ y ∧ ∀ z0 ∀ z1 (z0 Rz1 ∧ z1 ∈ y ⇒ z0 ∈ y)). Cada conjunto x es elemento de un conjunto que contiene a todos sus R-predecesores. Con RBF (R, A) denotamos la conjunción de las condiciones (RBF1) a (RBF3). Primero analicemos con detalle esta definición, encontrando formulaciones equivalentes. Lema 8.2 (ZFE − ). La condición (RBF3) es equivalente a (RBF3’) ∀ x{z : zRx} ∈ V . Demostración. ⇒ ) Dada x, escogemos y con x ∈ y, que es cerrado respecto a sus Rpredecesores de acuerdo con (RBF3). Entonces {z : zRx} ⊆ y, así que {z : zRx} ∈ V por el axioma Comp. ⇐ ) Definimos por recursión ordinaria sobre ω una función f : ω − →V con f (0) = {z : zRx} ∪ {x} y f (n + 1) = f (n) ∪ [ {{z0 : z0 Rz1 } : z1 ∈ f (n)}. Observe que los términos de la derecha son conjuntos por hipótesis, Reemp S y Unión. Por Reemp sabemos ahora que f [ω] ∈ V , así que y ≡ f [ω] ∈ V por el axioma de unión. El conjunto y es el requerido por (RBF3’): como x ∈ f (0), entonces se cumple x ∈ y; si z1 ∈ y y z0 Rz1 , entonces z1 ∈ f (n) para alguna n < ω y con ello z0 ∈ f (n + 1), así que z0 ∈ y. Si aceptamos el axioma de elección, podemos mostrar que la condición (RBF2) es equivalente a la afirmación de que no hay R-cadenas decrecientes infinitas. Formalmente: Lema 8.3 (ZFE − ). La condición (RBF2) de la definición 8.1 es equivalente a (RBF2’) ¬∃ f (f : ω − → V ∧ ∀ n < ω[f (n + 1)Rf (n))]. 67 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 68 ✐ ✐ 2. Teoría elemental de conjuntos Demostración. ⇒ ) Suponga que existe una función f : ω − → V con la propiedad f (n + 1)Rf (n) para toda n < ω. Sea u ≡ f [ω], que por Reemp es un conjunto y no es vacío. De la condición (RBF2) de 8.1, u tiene un elemento R-mínimo x. Elija n < ω con x = f (n). Entonces f (n + 1)Rx, en oposición a la minimalidad de x. Por lo tanto, no puede existir tal función f . ⇐ ) Suponga que existe un conjunto u 6= ∅ que no contiene un elemento R-mínimo, es decir, (*) ∀ x ∈ u∃ y ∈ u(yRx). Defina, usando recursión ordinaria, una función f : ω − → V con f (0) ∈ u arbitrario y f (n + 1) ∈ {y : y ∈ u ∧ yRf (n)}. La elección de los valores es posible por AE como a continuación se detalla: en el caso n = 0 use AE con a = {u}; encuentre b tal que b ∩ u contenga exactamente un elemento, y escoja f (0) = ∪(b∩u) (observe que ∪{z} = z). En Def los casos siguientes proceda de forma análoga con a = {{y : y ∈ u∧yRf (n)}} (observe que por (*), {y : y ∈ u ∧ yRf (n)} = 6 ∅). De la definición de f se sigue que f (n + 1)Rf (n) para todo n < ω. Este último teorema no es casualidad. Se desprende de un hecho general: Lema 8.4. Sean A y R términos clase. Entonces (BOF (R, A) ⇔ OLE(R, A) ∧ RBF (R, A)). En particular, si R es un buen orden fuerte en A, entonces R está bien fundada en A. Demostración. “ ⇒ ” Claramente se cumple (RBF1). Para probar (RBF2), tomamos u 6= ∅, b = u ∩ A. Si b = ∅, entonces cada elemento x de u es como se pide en (RBF2); si b 6= ∅, entonces por la propiedad de buen orden existe un elemento R-mínimo como el que pide (RBF2). La validez de (RBF3’) se sigue de {z : zRx} = ( ∅, {z : z ∈ A ∧ zRx}, cuando x ∈ / A; cuando x ∈ A. Ya que R es un buen orden fuerte, la clase inferior es un conjunto. “⇐”. Es evidente, pues las condiciones para ser un buen orden fuerte se deducen de OLE(R, A), así como de (RBF2) y (RBF3’). 68 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 69 ✐ ✐ Conjuntos y modelos. Curso avanzado Note que por definición y en vista de la condición equivalente (RBF3’), la pertenencia ∈ es una relación bien fundada, formalmente R∈ ≡ {(x, y) : x ∈ y}. Lo mismo ocurre con <: R< ≡ {(x, y) : x ∈ OR ∧ y ∈ OR ∧ x ∈ y} es bien fundada en OR. Probaremos estos hechos sin utilizar recursión ordinaria, en su lugar usamos un teorema más general de recursión cuya existencia nos permitirá demostrar algunos resultados necesarios. ~ ) una fórmula de LTC. Teorema 8.5 (Esquema inductivo para ∈). Sea Φ(x, w Entonces, la siguiente afirmación es válida: ~ )) ⇒ Φ(x, w ~ )) ⇒ ∀ xΦ(x, w ~ ). ∀ x(∀ y ∈ x(Φ(y, w Si para cualquier conjunto x la validez de la propiedad Φ en x se sigue de su validez en todos los elementos de x, entonces Φ es válida para todo conjunto. ~ ∈ V arbitrarias. Si Φ no fuese cierta para todo Demostración. Sean w ~ ). De acuerdo con Fund, conjunto, existe algún conjunto x para el cual ¬Φ(x, w ~ ). Pero entonces Φ es válida para existe un elemento ∈-mínimo x con ¬Φ(x, w ~ ), lo que contradice toda y ∈ x. Por hipótesis, Φ es válida para x, es decir, Φ(x, w nuestra suposición sobre x. Si se utiliza el método presentado en este teorema, se dice que hacemos una ∈-inducción. Recuerde que un conjunto x es transitivo si para todo y ∈ x se cumple que y ⊆ x. El que un conjunto x sea transitivo lo denotamos por Trans(x). Con el principio inductivo recién demostrado podemos construir un supraconjunto transitivo (el más pequeño posible) para cada conjunto. Teorema 8.6. Sea x ∈ V . Entonces definimos el conjunto CT (x) ≡ ∩{z : x ⊆ z ∧ Trans(z)}. CT (x) es el conjunto transitivo más pequeño que contiene a x y es la clausura transitiva de x. Demostración. Es fácil demostrar que la intersección de conjuntos transitivos es transitiva. De la definición de CT (x) se obtiene que dicho conjunto es mínimo, así que sólo debemos probar que CT (x) ∈ V . Esto lo realizamos por ∈-inducción. Suponga que es cierto CT (y) ∈ V para toda y ∈ x. Ahora, la intersección de una clase no vacía de conjuntos es un conjunto (esto se deduce fácilmente pues la intersección está presente en cualquiera de los elementos de la clase). En consecuencia, basta demostrar que existe al menos un conjunto 69 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 70 ✐ ✐ 2. Teoría elemental de conjuntos S transitivo z con x ⊆ z. Definimos z ≡ {CT (y) : y ∈ x} ∪ {x}. Se sigue de inmediato que z ∈ V . Además, z es transitivo: sea u ∈ v ∈ z. Si v ∈ x, entonces u ∈ v ⊆ CT (v) ⊆ z, así que u ∈ z. Si v ∈ CT (y) para alguna y ∈ x, se sigue u ∈ CT (y) ⊆ z de la transitividad de CT (y) (por hipótesis de inducción). Por consiguiente, para este caso u ∈ z. Ahora demostraremos las propiedades anunciadas de ∈ y <. Teorema 8.7. (a) ∈ es bien fundada en V . (b) < es bien fundada en OR. Aquí hemos identificado ∈ con {(x, y) : x ∈ y} y < con {(x, y) : x ∈ OR ∧ y ∈ OR ∧ x ∈ y}. Demostración. (a) La existencia de un elemento ∈-mínimo en u 6= ∅ se sigue inmediatamente de Fund con la fórmula de LTC Φ ≡ x ∈ u. Sea x ∈ V arbitrario y hagamos y = CT ({x}); entonces x ∈ y y cuando z0 es un ∈-predecesor de z1 , donde z1 ∈ y, ocurre que z0 ∈ y por la transitividad de y. Con esto demostramos (a). (b) Si u 6= ∅, entonces en el caso u ∩ OR = ∅ cada elemento de u es <-mínimo en u. En el caso u ∩ OR 6= ∅ el elemento <-mínimo de u es mín(u ∩ OR) = ∩(u ∩ OR). Si x ∈ V , entonces, por lo visto con anterioridad, y = CT ({x}) es cerrado respecto a ∈-predecesores y, por consiguiente, respecto a <-predecesores. Con ello queda demostrado (b). Hemos presentado dos ejemplos importantes de relaciones bien fundadas. Ahora nos dedicaremos a la teoría general de las relaciones bien fundadas. Primero presentamos una extensión de Fund a dichas relaciones. ~ ) una fórmula de LTC. Teorema 8.8. Sean A y R términos clase y Φ(x, w Suponga que R es bien fundada en A. Entonces ~ )) ⇒ ∃ x(x ∈ A ∧ Φ(x, w ~ ) ∧ ∀ y(yRx ⇒ ¬Φ(y, w ~ ))). ∃ x0 (x0 ∈ A ∧ Φ(x0 , w Si la propiedad Φ es cierta para algún elemento de A, entonces existe un testigo R-mínimo de Φ en A. 70 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 71 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Transformamos el problema de encontrar un elemento R-mínimo en una clase, en el problema de encontrar un elemento R-mínimo en un conjunto no vacío u. ~ ∈ V arbitrarias. Elegimos un x0 ∈ A con Φ(x0 , w ~ ). Por (RBF3) Sean w escogemos y ∈ V , con x0 ∈ y, tal que y contiene todos sus R-predecesores. ~ )} es un conjunto no vacío (x0 ∈ u), y Entonces u = y ∩ {x : x ∈ A ∧ Φ(x, w por (RBF2) tiene un elemento R-mínimo x. Ya que cada R-predecesor x′ de x ~ ) fuera cierta está en A, pues R ⊆ A × A, y como x pertenece a y, que Φ(x′ , w ′ conduciría a x ∈ u, lo que contradice la minimalidad de x. En consecuencia, x es el elemento R-mínimo que buscamos. Ahora deducimos un principio de inducción para relaciones bien fundadas. ~ ) una fórmula de LTC tales Teorema 8.9. Sean A y R términos clase y Φ(x, w que R es bien fundada en A. Entonces ~ )) ⇒ Φ(x, w ~ )) ⇒ ∀ x ∈ AΦ(x, w ~ ). ∀ x ∈ A(∀ y(yRx ⇒ Φ(y, w Si del hecho de que una propiedad matemática sea válida para todos los elementos R-predecesores de un conjunto, se desprende la validez de la propiedad en ese conjunto, entonces la propiedad es cierta para todo conjunto de A. ~ ∈ V . Si la afirmación del teorema fuera falsa, Demostración. Sean w ~ ). Para habría, por el teorema 8.8, un testigo R-mínimo x ∈ A de ¬Φ(x, w ~ ). De aquí se sigue, por hipótesis, cada R-predecesor y de x debe ocurrir Φ(y, w ~ ) en oposición a ¬Φ(x, w ~ ). Por lo tanto, la afirmación debe ser cierta. Φ(x, w Ahora vamos a formular y demostrar la generalización del esquema de recursión para números naturales y ordinales. Teorema 8.10 (ZF − ). Sean A, R y G términos clase. Entonces existe un término clase F tal que ocurre lo siguiente: (a) Cuando R es bien fundada en A y G : A × V − → V , entonces F : A − → V, y es válida la ecuación de recursión ∀ x ∈ A F (x) = G(x, {F (z) : zRx}). (b) (Unicidad). Con las hipótesis de (a) se cumple que si F ′ es un término clase tal que F ′ : A − → V , y F ′ satisface la ecuación de recursión ′ ∀ x ∈ A F (x) = G(x, {F ′ (z) : zRx}), entonces F = F ′ . 71 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 72 ✐ ✐ 2. Teoría elemental de conjuntos F es el término canónico obtenido mediante G por R-recursión sobre A. Demostración. (a) Note que tanto A como G no son necesariamente conjuntos, por lo que debemos proceder mediante “aproximaciones” que sí sean funciones. Consideremos (A, R, G)-aproximaciones f del término F que queremos construir. Estas aproximaciones son funciones f : u − → V , donde u ⊆ A y f satisface la ecuación recursiva en u, es decir, ∀ x ∈ u f (x) = G(x, {f (z) : zRx}) (aquí debemos suponer que u contiene todos sus R-predecesores; en otro caso podría no estar definido {f (z) : zRx} para x ∈ u). Mostramos que dos aproximaciones cualesquiera son compatibles (coinciden en la intersección de sus dominios) y verificamos que se puede cubrir todo A con aproximaciones, es decir, que si x ∈ A, entonces x está en el dominio de una aproximación. En consecuencia, F será la unión de todas las aproximaciones. Definimos Apr(f, G) ≡ ∃ u(u ⊆ A ∧ ∀ x ∈ u∀ y(yRx ⇒ y ∈ u) ∧ f :u− → V ∧ ∀ x ∈ u[f (x) = G(x, {f (y) : yRx})]), y llamemos a la función f de Apr(f, G) una (A, R, G)-aproximación. DefiS nimos un término clase F como F ≡ {f : Apr(f, G)}. Con ello sabemos quién es F . Suponga ahora que R está bien fundada en A y que G : A × V − → V. Afirmación 1. Dos aproximaciones cualesquiera son compatibles. Demostración de la afirmación 1. Sean f : u − → V, g : u − → V tales que Apr(f, G) y Apr(g, G). Sea w ≡ u ∩ v. Si f ↾ w 6= g ↾ w, entonces existe, por el esquema 8.8, un elemento R-mínimo x ∈ w con f (x) 6= g(x), de manera que para cada zRx ocurre f (z) = g(z). Dado que G se comporta como función, se sigue que G(x, {f (z) : zRx}) = G(x, {g(z) : zRx}), y como f , g son aproximaciones, tenemos f (x) = g(x). Esto contradice la elección de x.◭ Afirmación 2. ∀ x ∈ A∃ f (Apr(f, G) ∧ x ∈ dom(f )). Demostración de la afirmación 2. Efectuamos una R-inducción. Sea x ∈ A y supongamos que cada elemento z con zRx está en el dominio de alguna aproximación. Construyamos f con Apr(f, G) y x ∈ dom(f ). Para zRx definimos una aproximación (por la afirmación 1 y la hipótesis T de inducción) fz = {f : Apr(f, G) ∧ z ∈ dom(f )} (recuerde que no contamos con el axioma de elección). Además, z ∈ dom(fz ). Ahora, sea S f = {fz : zRx} ∪ {(x, G(x, {fz (x) : zRx}))}. Entonces f ∈ V por los 72 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 73 ✐ ✐ Conjuntos y modelos. Curso avanzado axiomas de unión y Reemp (con la asociación z 7→ fz ). Usamos la afirmación 1 para obtener fácilmente que f es una aproximación y x ∈ dom(f ). ◭ Con ayuda de las dos afirmaciones se obtiene que F es como se requiere. (b) Esta parte se prueba en forma totalmente similar a la afirmación 1. Observe que el término clase canónico F en el esquema de recursión está asociado en forma única a G. Podriamos definir F aún en el caso de que G no se comporte como función, pero no se podría asegurar mucho sobre F . El esquema de recursión para ordinales se deduce del teorema 8.10. (Véase el ejercicio 82.) Proposición 8.11. (Esquema de recursión para ordinales [segunda versión]) Sean G : V − → V, H : V − → V y a un conjunto. Existe una única función F : OR − → V tal que F (0) = a, F (α + 1) = G(F (α)), F (α) = H(F ↾ α), para Lím(α). S Demostración. Primero recordemos que (α + 1) = α. Nuestro objetivo es, para a, G y H dadas, encontrar G′ tal que G′ (0) = a, G′ (F ↾ α + 1) = G(F (α)), G′ (F ↾ α) = H(F ↾ α), para Lím(α). Definimos una función G′ : V − → V mediante ′ G (x) =  S   G((x( dom(x))), H(x),   a, cuando ∃ β(dom(x) = β + 1); cuando Lím(dom(x)); en otro caso. Por el teorema 7.18 existe una única F : OR − → V tal que para toda α: F (α) = G′ (F ↾ α). Claramente, esta propiedad de F es equivalente a lo que requerimos. 73 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 74 ✐ ✐ 2. Teoría elemental de conjuntos 9. La jerarquía de Von Neumann Con ayuda de los esquemas de recursión, específicamente el esquema de recursión sobre ordinales que hemos derivado en el teorema 7.18, construiremos la jerarquía de von Neumann que, como se verá, es una sucesión creciente de conjuntos que “atrapa” a todos los conjuntos. En esta sección trabajaremos en el sistema ZF . Definición 9.1. Definimos la jerarquía de von Neumann hVα : α ∈ ORi por <-recursión en OR como sigue: (i) V0 = ∅. (ii) Vα+1 = Pot(Vα ). S (iii) Vδ = α<δ Vα para δ un ordinal límite. Probemos las primeras propiedades de la jerarquía de von-Neumann. Teorema 9.2. (a) Vα es transitivo. (b) β < α ⇒ Vβ ∈ Vα . (c) β ≤ α ⇒ Vβ ⊆ Vα . (d) Vα ∩ OR = α. En particular, α ∈ Vα+1 . Demostración. (a) Llevamos a cabo una inducción sobre α: Para α = 0, V0 = ∅ es transitivo. Para α = β + 1, sea x ∈ y ∈ Vα . Por definición de Vα tenemos Vα = Pot(Vβ ). Entonces y ∈ Vα implica y ⊆ Vβ y, por lo tanto, x ∈ Vβ . Por hipótesis de inducción Vβ es transitivo, así que x ⊆ Vβ ; en consecuencia, x ∈ Vβ+1 . Para α límite, el conjunto Vα es transitivo por ser la unión de conjuntos transitivos. (b) Por inducción sobre α se verifica con facilidad que ∀ β < α (Vβ ∈ Vα ). (c) Se sigue inmediatamente de (a) y (b). (d) Efectuamos inducción sobre α. Para α = 0, V0 ∩ OR = ∅ es claro pues V0 = ∅. Para α = β +1, por hipótesis de inducción Vβ ∩OR = β. Debemos probar Vβ+1 ∩ OR = β + 1. 74 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 75 ✐ ✐ Conjuntos y modelos. Curso avanzado ⊆) Si γ ∈ Vβ+1 , entonces γ ⊆ Vβ por definición de Vβ+1 . Usando la hipótesis de inducción, deducimos γ ⊆ β, es decir, γ ∈ β + 1. ⊇) Sea γ < β + 1. Si γ < β, se sigue de la hipótesis de inducción que γ ∈ Vβ , así que γ ∈ Vβ+1 . Como la hipótesis de inducción y la definición de Vβ+1 implican que β ∈ Vβ+1 , se deduce que γ ∈ Vβ+1 también en el caso γ = β. Para α límite, si γ ∈ Vα , por definición de Vα , tenemos γ ∈ Vβ para algún β < α; por hipótesis de inducción obtenemos entonces γ < β, así que γ < α. Por otro lado, tomemos γ < α, así que por hipótesis de inducción, γ ∈ Vγ+1 . Sabemos que Vγ+1 ⊆ Vα , de donde γ ∈ Vα . Con esto terminamos el caso límite y el inciso (d). Con este último teorema hemos demostrado que los conjuntos Vα (α ∈ OR) forman una sucesión creciente en el sentido de la inclusión, y que Vα “determina” la clase OR hasta el número ordinal α (se dice que Vα tiene altura ordinal α). El siguiente teorema muestra que cada conjunto aparece en la sucesión de los Vα . En este sentido, la jerarquía de von Neumann estratifica el universo de conjuntos. Siguiendo este orden de ideas podemos decirSque los Vα determinan segmentos iniciales del universo de conjuntos. Sea V = α∈OR Vα . Teorema 9.3. V = V. Demostración. Supongamos V 6= V. Entonces existe x ∈ V \ V. Por Fund existe un elemento ∈-mínimo x con esta propiedad. Por la minimalidad de x tenemos x ⊆ V; así que podemos definir una función f : x − → OR mediante y 7−→ mín{α : y ∈ Vα } S Por Reemp tenemos f [x] ∈ OR; con ello obtenemos α = f [x] ∈ OR. De la definición de f se sigue x ⊆ Vα . Entonces tenemos x ∈ Vα+1 , lo que contradice la elección de x. Si usamos los Vα podemos determinar cuándo una clase es realmente una clase propia, es decir, no es un conjunto: Teorema 9.4. Sea A un término clase. Entonces: (a) A ∈ / V ⇔ ∀ α∃ β(β > α ∧ A ∩ (Vβ \ Vα ) 6= ∅). (b) A ∈ V ⇔ ∃ αA ⊆ Vα . 75 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 76 ✐ ✐ 2. Teoría elemental de conjuntos Las clases propias alcanzan la “cota superior” del universo, su altura no está acotada, en cambio los conjuntos son parte de un segmento inicial de V . Demostración. Ya que V se obtiene de la sucesión creciente de los Vα , (a) se sigue fácilmente de (b). Sea A ∈ V tal que A ∈ Vα para algún α ∈ OR. Por la transitividad de Vα se sigue A ⊆ Vα . De manera reciproca, si A ⊆ Vα tenemos A ∈ Vα+1 ⊆ V . 10. El rango Definición 10.1. Definimos por ∈-recursión una función rg : V − → OR mediante rg(x) = sup{rg(y) : y ∈ x}; rg(x) es el rango de x. La definición de rango contiene una pequeña inexactitud en su formulación: usando el teorema de recursión obtenemos una función cuyo contradominio no está especificado con exactitud. En la definición hemos introducido como contradominio OR y hemos utilizado el término sup en la determinación de rg(x), que sólo tiene sentido si sabemos de antemano que los valores rg(y) están en OR, para y ∈ x. La forma correcta de proceder es la siguiente: S Definimos rg : V − → V por ∈-recursión, mediante rg(x) ≡ {rg(y) ∪ {rg(y)} : y ∈ x}, y mostramos por ∈-inducción que rg(x) ∈ OR para todo x ∈ V . Entonces rg(y) ∪ {rg(y)} = rg(y) + 1, y para A ⊆ OR ocurre que S sup(A) = {α + 1 : α ∈ A}. Hemos encontrado la función requerida en la definición 10.1. Teorema 10.2. Las siguientes afirmaciones son ciertas. (a) x ∈ y ⇒ rg(x) < rg(y). (b) x ⊆ y ⇒ rg(x) ≤ rg(y). (c) ∀ α ∈ OR(rg(α) = α). (d) ∀ α ∈ OR(rg(Vα ) = α). Demostración. (a) Se sigue inmediatamente de la definición. (b) Se sigue de (a). (c) Se verifica fácilmente por inducción sobre α. 76 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 77 ✐ ✐ Conjuntos y modelos. Curso avanzado (d) Observe que la desigualdad “≥” se deduce de inmediato de α ⊆ Vα . La desigualdad “≤” se obtiene por inducción sobre α. Ahora podemos probar la relación entre la función rango y la jerarquía de von Neumann. Teorema 10.3 (ZF ). Se cumple Vα = {x : rg(x) < α}. Demostración. Elaboramos una inducción sobre α ∈ OR. Para α = 0. El caso es claro. Para α = β + 1. Si x ∈ Vα , tenemos x ⊆ Vβ , así que rg(x) ≤ rg(Vβ ) = β < α. Por otra parte, si rg(x) < α, entonces rg(y) < rg(x) ≤ β para y ∈ x. De la hipótesis de inducción se sigue x ⊆ Vβ , es decir, x ∈ Vα . Para α límite. De x ∈ Vα se sigue x ∈ Vβ para alguna β < α. Por lo tanto, de la hipótesis de inducción, rg(x) < α cuando x ∈ Vα . Si recíprocamente Def β = rg(x) < α, entonces, por hipótesis de inducción, x ∈ Vβ+1 ⊆ Vα . Corolario 10.4 (ZF ). rg(x) = mín{α : x ∈ Vα+1 } = mín{α : x ⊆ Vα }. Corolario 10.5 (ZF ). Sea A un término clase. A es una clase propia si y sólo si rg(A) = OR, es decir, ∀ α∃ x(x ∈ A ∧ rg(x) > α). 11. Números cardinales En esta sección estudiamos los números cardinales, de gran trascendencia en la teoría de conjuntos. La idea es asignar un “tamaño” a cada conjunto. Este tamaño es la “cantidad” de elementos del conjunto. Esto es sencillo para conjuntos finitos y se obtiene una generalización para conjuntos infinitos. De paso podemos distinguir entre diversos “infinitos”. Primero definimos cómo comparar dos conjuntos por tamaño. Definición 11.1. Sean a y b conjuntos. |a| ≤ |b| ⇔ ∃ f (f : a − → b ∧ f inyectiva), |a| = |b| ⇔ ∃ f (f : a − → b ∧ f biyectiva), |a| < |b| ⇔ |a| ≤ |b| ∧ |a| = 6 |b|, b Def Def a = ab = {f : f : b − → a}. 77 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 78 ✐ ✐ 2. Teoría elemental de conjuntos a. Dos conjuntos a y b son equipotentes si |a| = |b|. |a| es la cardinalidad de Lema 11.2. (a) (b) (c) (d) |a × b| = |b × a|. |a (b c)| = |a×b c|. |Pot(a)| = |a {0, 1}|. (Cantor) |a| < |Pot(a)|. Demostración. (a)–(c) se dejan como ejercicio. Para (d), sea f : a − → Pot(a) tal que f (x) = {x}, que es inyectiva. Suponga que tenemos una biyección g : a − → Pot(a). Considere Def b = {x : x ∈ a ∧ x ∈ / g(x)}. Entonces b ⊆ a, así que b = g(x0 ) para alguna x0 ∈ a. Se sigue que x0 ∈ g(x0 ) ⇔ x0 ∈ / g(x0 ), lo cual es una contradicción. El inciso (d) es uno de los grandes teoremas de la teoría de conjuntos. En su demostración se utiliza el método ahora conocido como el primer argumento diagonal de Cantor. El siguiente teorema nos permite demostrar que ≤ es un orden parcial entre cardinalidades. Teorema 11.3 (Cantor-Schröder-Bernstein). Si a ⊆ b ⊆ c y |a| = |c|, entonces |b| = |c|. Demostración. Sea f : c − → a una biyección y r = c \ b. Definimos recursivamente g : ω − → V mediante g(0) = r, g(n + 1) = f [g(n)]. Además, definimos Def r= [ g(n), n ei:c− → b por Def i(x) = ( f (x), cuando x ∈ r, x, cuando x ∈ / r. 78 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 79 ✐ ✐ Conjuntos y modelos. Curso avanzado Es suficiente mostrar que (1) ran(i) = b y (2) i es inyectiva. Para (1) sea x ∈ b. Debemos mostrar que x ∈ ran(i). Sin pérdida de generalidad, sea x ∈ r. Puesto que x ∈ b, entonces x ∈ / g(0). Así que existe n con x ∈ g(n + 1) = f [g(n)], por lo que x = f (y) = i(y) para alguna y ∈ r. Para (2) sea x 6= y. Sin pérdida de generalidad x ∈ r, y ∈ / r. Pero entonces i(x) ∈ r, i(y) ∈ / r y, por consiguiente, i(x) 6= i(y). Corolario 11.4. Sean a y b conjuntos. Entonces |a| ≤ |b| ∧ |b| ≤ |a| ⇒ |a| = |b|. Demostración. Sean f : a − → byg : b − → a inyectivas. Entonces (g ◦ f )[a] ⊆ g[b] ⊆ a y |(g ◦ f )[a]| = |a|. Del teorema 11.3 se sigue |b| = |g[b]| = |a|. Por un número cardinal entenderemos un número ordinal que no es equipotente a ningún ordinal menor que él. Definición 11.5. El ordinal α es un número cardinal si es cierto que (∀ β < α)(|β| = 6 |α|). En vista del lema 7.10 escribimos α < β para α ∈ β, y α ≤ β para α ⊆ β. Lema 11.6. Si n, m son números naturales, entonces de |n| = |m| se deduce que n = m. Demostración. Ejercicio. Corolario 11.7. n es un número cardinal. Demostración. Inmediato del lema 11.6. De ahora en adelante, con CAR denotamos la clase de los cardinales infinitos, y con CARD la clase de todos los cardinales. Lema 11.8. Para todo número natural n, |n| = 6 |ω|. Demostración. Supongamos que |n| = |ω| para algún n ⊆ n + 1 ⊆ ω. Por el teorema de Cantor–Schröder–Bernstein concluimos |n| = |n+1|, lo cual es absurdo. Corolario 11.9. ω es un número cardinal. Se acostumbra escribir |ω| = ℵ0 . 79 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 80 ✐ ✐ 2. Teoría elemental de conjuntos Lema 11.10. ω ≤ α ⇒ |α + 1| = |α|. Demostración. Definimos f : α − → α + 1 mediante f (x) =    α, n,   x, cuando x = 0; cuando x = n + 1; en otro caso. Entonces f es una biyección entre α y α + 1. Corolario 11.11. Si ω ≤ α y α es un número cardinal, entonces α es un ordinal límite. Demostración. Supongamos que α es sucesor, es decir, tiene la forma α = β + 1. Entonces ω ≤ β < α, por ello, |β| = |β + 1|, lo que contradice la suposición de que α es un cardinal. Lema 11.12. Si a es un conjunto de cardinales, entonces Def sup(a) = es un cardinal. [ a Demostración. Si no fuese cierta la conclusión del lema, existiría un S α < sup(a) con |α| = | sup(a)|. Por lo que α ∈ a y entonces α ∈ β ∈ a para algún cardinal β. Por el teorema de Cantor-Schröder-Bernstein concluimos de S S α ⊆ β ⊆ a y |α| = |β| que |α| = | a|. Puesto que α < β y β es un cardinal, esto no es posible. Nuestra intención en este momento es probar que para cada ordinal existe un cardinal más grande. De hecho ocurre algo más fuerte: Teorema 11.13. Para todo conjunto a existe un único ordinal α tal que (∀ β < α)(|β| ≤ |a|) ∧ |α|  |a|. El ordinal α se llama número de Hartog de a, que denotaremos como H(a). Es decir, el número de Hartog es el menor ordinal que no es equipotente a ningún subconjunto de A. 80 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 81 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. La unicidad es evidente. Para la existencia, sean Def w = {(b, r) : b ⊆ a y r es un buen orden en b} y γ(b, r) el único ordinal asociado isomorfo a (b, r). Entonces {γ(b, r) : (b, r) ∈ w} es un subconjunto propio y transitivo de OR (teniendo en cuenta el teorema 7.5) y, por lo tanto, es un ordinal α. Debemos probar que (a) β < α ⇒ |β| ≤ |α|, (b) |α|  |a|. Para (a). Sea β < α. Entonces β es isomorfo a algún γ(b, r) con (b, r) ∈ w, así que existe una biyección f : β − → b. Para (b). Supongamos que f : α − → a es inyectiva. Entonces α = γ(b, r) Def para algún b ⊆ a (b = ran(f )); por ello α ∈ α, lo que no puede ocurrir. Observe que el número de Hartog de a es un cardinal. Porque si α es el número de Hartog de a y β < α, en caso de que |β| = |α| ocurriría |α| = |β| ≤ |a|, lo cual no puede ser. También note que H(β) es el menor cardinal α mayor que β. Vamos a definir ahora la importante función álef ( que en realidad es un término clase que se comporta como función). Definición 11.14. Definimos recursivamente la “función” álef ℵ : OR − →V mediante ℵ0 = ω0 = ω, ℵα+1 = ωα+1 = H(ℵα ), ℵα = ωα = sup{ℵβ : β < α} para α límite. Se acostumbra usar ωα para operaciones entre ordinales y ℵα cuando se trata con cardinales. Lema 11.15. (a) ℵα es un cardinal. (b) α < β ⇒ ℵα < ℵβ . (c) ∀ β(β cardinal ∧ ω ≤ β ⇒ ∃ α(β = ℵα )). Es decir, todo cardinal infinito es un álef. (d) Para todo ordinal α, |α| ≤ ℵα . 81 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 82 ✐ ✐ 2. Teoría elemental de conjuntos Demostración. (a) Se prueba fácilmente por inducción sobre α. (b) Por inducción sobre β: el caso β = 0 es evidente. Para β + 1, α<β+1 ⇒ α<β∨α =β ⇒ ℵα < ℵβ ∨ ℵα = ℵβ ⇒ ℵα < ℵβ+1 . Para β límite α < γ, α<β ⇒ para algún γ < β ⇒ ℵα < ℵγ ≤ ℵβ . (c) Sea α el menor ordinal con la propiedad β ≤ ℵα . Tal α existe, pues en otro caso ℵ : OR − → β sería inyectiva. Mostraremos ℵα ≤ β mediante los posibles casos de α. El caso α = 0 es claro. Si α = α′ + 1, por la elección de α se cumple ℵα′ < β. Si α es límite, por la elección de α obtenemos ℵγ < β, para todo γ < α, de donde se sigue que ℵα = sup{ℵγ : γ < α} ≤ β. (d) Ejercicio. Observe que por el inciso (a) del lema anterior, en realidad tenemos ℵ : OR − → CAR. Asociar un cardinal a cada conjunto es una tarea que no hemos completado. Esto lo podemos lograr con conjuntos bien ordenados, de acuerdo con el teorema 7.5, pero aún no lo conseguimos para conjuntos arbitrarios. Todo se resuelve si cualquier conjunto se puede bien ordenar. Para lograrlo, requerimos el axioma de elección. De hecho necesitamos una formulación equivalente del axioma de elección. Éste es el propósito de la siguiente sección. 12. Equivalentes del axioma de elección Interrumpimos nuestro estudio de números cardinales para obtener afirmaciones equivalentes al axioma de elección, una de las cuales nos permitirá asociar un cardinal a cada conjunto. Teorema 12.1. Las siguientes afirmaciones son equivalentes: 82 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 83 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) El axioma de elección AE , expresado en la forma (véase el ejercicio 91): ∀ x[∅ ∈ / x ⇒ ∃ f (f : x − → ∪x ∧ (∀ y ∈ x)(f (y) ∈ y))]. (b) El principio del buen orden (PBO): ∀ a∃ r(r es un buen orden en a). (c) El lema de Zorn (LZ): en cada conjunto parcialmente ordenado (P, <) con la propiedad de que cada subconjunto suyo <-linealmente ordenado (una cadena) tiene una cota superior, existe un elemento máximo. Demostración. LZ ⇒ PBO. Dado a, sea P = {f : ∃ α ∈ OR(f : α − → a inyectiva )} ⊆ Pot(H(a) × a). Ordenamos parcialmente P con $. SSea L ⊆ P un subconjunto linealmente S ordenado. Entonces L ∈ P. Así que L es una cota superior de L. Mediante LZ obtenemos un elemento máximo f0 ∈ P. Es evidente que f0 es entonces una biyección entre un ordinal α0 y a. Esta función f0 induce un buen orden en a. PBO ⇒ AE . Supongamos que ∅ ∈ / x. Por el PBO existe un buen orden S < en x. Para cada y ∈ x, nuestra relación < induce un buen orden en y. Definamos f :x − → [ x, y 7→ mín{y}. Es claro que f (y) ∈ y. AE ⇒ LZ. Sea < un orden parcial en P 6= ∅. Suponemos que ∀ L(L ⊆ P ∧ L <-linealmente ordenado ⇒ L tiene una cota superior en P). Por AE existe una función de elección f en Pot(P) \ {∅}, es decir, una función f : Pot(P) \ {∅} − → Pot(P) tal que f (A) ∈ A para toda A ⊆ P, A 6= ∅. Sea z∈ / P. Definimos F : OR − → V mediante F (α) = ( f ({y : y ∈ P, y es cota superior de F [α] ∧ y ∈ / F [α]}), z, si {. . .} = 6 ∅; en otro caso. Se afirma que ∃ ρ(F (ρ) = z): en otro caso, F : OR − → P es inyectiva, lo Def que contradice que P es un conjunto. Definamos ρ0 = mín{ρ : F (ρ) = z}. F [ρ0 ] es linealmente ordenado y F [ρ0 ] ⊆ P. Por hipótesis existe una cota 83 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 84 ✐ ✐ 2. Teoría elemental de conjuntos superior y0 ∈ P de F [ρ0 ]. Ahora mostraremos que y0 es un elemento maximal en P. Supongamos que y0 < y para algún y ∈ P. Entonces y es cota superior de F [ρ0 ] y y ∈ / F [ρ0 ]. Esto contradice la definición de ρ0 . 13. Aritmética cardinal Ya que tenemos disponible el principio del buen orden, podemos asociar un cardinal a cada conjunto: Teorema 13.1 (ZFE ). A cada conjunto le corresponde exactamente un número cardinal. Demostración. La unicidad es clara. Para la existencia, sea < un buen orden en a (por el PBO); entonces existe un ordinal γ isomorfo a a (por el teorema de enumeración 7.8). Por lo tanto, el conjunto {τ : |τ| = |a|} no es vacío y en consecuencia mín{τ : |τ| = |a|} es un cardinal, el cardinal asociado a a. El cardinal asociado al conjunto es la cardinalidad del conjunto. Dado un conjunto a, de acuerdo con la demostración del teorema 13.1 existen un número cardinal β y una función biyectiva f : β − → a. En consecuencia, β, el cardinal asociado al conjunto a, es su cardinalidad pues si |a| = |b|, entonces β también es el cardinal asociado a b. Por consiguiente, |a| = |b| si y sólo si la cardinalidad de a es igual a la cardinalidad de b, y |a| ≤ |b| si y sólo si la cardinalidad de a es menor o igual que la cardinalidad de b. Por lo tanto, podemos tomar |a| como una representación de la cardinalidad de a. Definición 13.2. El conjunto a es finito si existe una biyección entre a y un número natural n; en otro caso es infinito. Por AE se deduce que a es finito si y sólo si |a| < ω. Una vez que hemos probado que todo cardinal es un álef y que todo álef es un cardinal (lema 11.15), podemos definir operaciones entre cardinales. En esta sección se definen las operaciones usuales entre números cardinales y se estudian algunas de sus propiedades principales. Comenzamos con la suma de cardinales: 84 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 85 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 13.3. Sea hκα : α < βi una sucesión de cardinales. La suma cardinal X κα α<β se define como [ α<β (κα × {α}) donde los cardinales se consideran como conjuntos. Usando biyecciones es fácil probar que (¡el lector debe hacerlo!) X κα = [ Aα , α<β α<β donde {Aα : α < β} es cualquier conjunto de conjuntos mutuamente ajenos, con |Aα | = κα para toda α < β. P Escribimos κ0 + κ1 en lugar de α<2 κα . Entonces: κ + λ = |(κ × {0}) ∪ (λ × {1})|. Los dos siguientes lemas son inmediatos de la definición, y la demostración se deja al lector. La suma es asociativa y conmutativa: Lema 13.4. Sean κ, λ, µ cardinales. Entonces: (i) κ + (λ + µ) = (κ + λ) + µ; (ii) κ + λ = λ + κ. Demostración. Ejercicio. Podemos reordenar una sucesión de cardinales y su suma no varía: Lema 13.5. Sean hκα : α < βi una sucesión de cardinales y hλγ : γ < δi una reordenación de esta sucesión. Entonces X κα = α<β X λγ . γ<δ Demostración. Ejercicio. Ahora nos ocuparemos de definir el producto de cardinales: 85 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 86 ✐ ✐ 2. Teoría elemental de conjuntos Definición 13.6. Si hκα : α < βi es una sucesión de cardinales, el producto cardinal se define como Y κα = α<β Y Aα , α<β donde hAα : α < βi es una sucesión de conjuntos con |Aα | = κα , para toda α < β. Mediante biyecciones se demuestra fácilmente que el producto no depende de la elección de la sucesión hAα : α < βi. Q Q Escribimos κ0 · κ1 en lugar de α<2 κα . Dado que α<2 Aα es isomorfo al producto cartesiano “usual”: se cumple que A0 × A1 = {(a0 , a1 ) : a0 ∈ A0 ∧ a1 ∈ A1 }, κ · λ = |κ × λ|. Los siguientes lemas se siguen con facilidad de las definiciones: La multiplicación cardinal es asociativa y conmutativa. Formalmente: Lema 13.7. Sean κ, λ, µ cardinales. Entonces: (i) κ · (λ · µ) = (κ · λ) · µ; (ii) κ · λ = λ · κ. Demostración. Ejercicio. Si reordenamos una sucesión de cardinales, su producto no cambia: Lema 13.8. Si hκα : α < βi es cualquier sucesión de cardinales y si hλγ : γ < δi es una reordenación de esta sucesión, entonces Y κα = α<β Y λγ . γ<δ Demostración. Ejercicio. Para la suma y el producto de cardinales se cumple la propiedad distributiva: Lema 13.9. Sean κ, λ, µ cardinales. Entonces: κ · (λ + µ) = κ · λ + κ · µ. Demostración. Ejercicio. 86 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 87 ✐ ✐ Conjuntos y modelos. Curso avanzado También es fácil ver que κ + κ = 2 · κ. Otra operación fundamental es la exponenciación de cardinales. Definición 13.10. Si κ, λ son cardinales, la potencia cardinal κλ se define como Y κ. α<λ Se sigue inmediatamente que κλ = |{f : f : λ − → κ}|. En ocasiones se escribe λ κ para denotar al conjunto {f : f : λ − → κ}. Con esta notación, tenemos κλ = |λ κ|. Algunas propiedades de la exponenciación cardinal se resumen en el siguiente lema: Lema 13.11. Sean κ, λ, µ cardinales. Entonces: (i) κλ · κµ = κ(λ+µ) ; (ii) κλ · µλ = (κ · µ)λ ; (iii) (κλ )µ = κ(λ·µ) . Demostración. Ejercicio. Como el lector notará, no sólo la suma y multiplicación de cardinales se comportan como en el caso finito, sino que también la potencia cardinal. 87 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 88 ✐ ✐ 2. Teoría elemental de conjuntos 14. Aritmética de ordinales y más sobre cardinales En esta sección definimos las principales operaciones aritméticas para números ordinales, no necesariamente cardinales. Como se verá, estas operaciones entre ordinales no se comportan tan bien como entre cardinales. Recuerde que el sucesor S(x) del conjunto x es x ∪ {x} y, para ordinales α, se denota por α + 1. Ahora podemos definir la suma de ordinales: Definición 14.1. Sean α, β y γ números ordinales. Def α + 0 = α, Def α + (β + 1) = (α + β) + 1, Def α + β = sup{α + γ : γ < β} cuando β es límite. Formalmente definimos s : OR − → V mediante Def sα (0) = α, Def sα (β + 1) = sα (β) + 1, Def sα (β) = Def y α + β = sα (β). [ ran(sβ ↾ β) cuando β es límite, Las principales propiedades de la suma se presentan en el siguiente teorema, cuya demostración se deja al lector: Lema 14.2. Sean α, β y γ ordinales. (a) α + β ∈ Or. (b) 0 + β = β. (c) ∃ α, β(α + β 6= β + α). (d) β < γ ⇒ α + β < α + γ. (e) Existen α, β, γ con α < β, pero α + γ ≮ β + γ. (f) α ≤ β ⇒ α + γ ≤ β + γ. (g) Si α ≤ β, entonces existe exactamente un γ con α + γ = β. (h) Si β es límite, también lo es α + β. (i) (α + β) + γ = α + (β + γ). Demostración. Ejercicio. 88 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 89 ✐ ✐ Conjuntos y modelos. Curso avanzado Ahora toca el turno a la multiplicación de ordinales. Definición 14.3. Sean α, β, γ ordinales. Def α · 0 = 0, Def α · (β + 1) = (α · β) + α Def α · β = sup{α · γ : γ < β} cuando β es límite. Escribimos αβ en lugar de α · β. Las propiedades de la multiplicación ordinal se resumen en el siguiente lema, cuya demostración se deja al lector: Lema 14.4. (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) αβ ∈ OR. 0β = 0, 1β = β. ∃ α, β(αβ 6= βα). 0 < α ∧ β < γ ⇒ αβ < αγ. Existen α, β, γ con 0 < γ y α < β, pero αγ ≮ βγ. α ≤ β ⇒ αγ ≤ βγ. Si 0 < α y β es límite, también αβ es límite. α(β + γ) = αβ + αγ. Existen α, β, γ con (α + β)γ 6= αγ + βγ. αβ = 0 ⇒ α = 0 ∨ β = 0. (αβ)γ = α(βγ). Si 0 < β, existen ordinales únicos γ, ρ tales que α = βγ + ρ y ρ < β. Demostración. Ejercicio. Corolario 14.5. Todo número ordinal α se puede representar en la forma α = ωγ + n, donde n es un número natural y n = 0 si y sólo si α = 0 o α es límite. Demostración. Sólo debemos probar que para cada γ se cumple ωγ = 0 o ωγ es límite. En el caso γ = 0 esto es obvio. Para γ + 1 se tiene que ω(γ + 1) = ωγ + ω es límite de acuerdo con el lema 14.4(h). Para γ límite se cumple que ωγ es límite por el mismo lema, inciso (g). También podemos definir la exponenciación ordinal: 89 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 90 ✐ ✐ 2. Teoría elemental de conjuntos Definición 14.6. Sean α, β, γ ordinales. 0 Def α = ( 0, 1, cuando α = 0; en otro caso, Def αβ+1 = αβ α, Def αβ = sup{αγ : γ < β} cuando β es límite. En el siguiente lema el lector encontrará las principales propiedades de la exponenciación ordinal: Lema 14.7. (a) αβ ∈ OR. (b) 0β = 0, 1β = β. (c) 1 < α ∧ β < γ ⇒ αβ < αγ . (d) Existen ordinales α, β y γ con 1 < γ y 1 < α < β, pero αγ 6< βγ . (e) α ≤ β ⇒ αγ ≤ βγ . (f) Si 1 < α y β es límite, también lo es αβ . (g) αβ+γ = αβ αγ . (h) αβγ = (αβ )γ . (i) 1 < α ⇒ β ≤ αβ . Demostración. Ejercicio. Lema 14.8. (a) Si α1 , α2 y β son ordinales, entonces α1 < α2 si y sólo si β + α1 < β + α2 . (b) Para cualesquier ordinales α1 , α2 y β, β+α1 = β+α2 si y sólo si α1 = α2 . (c) (α + β) + γ = α + (β + γ) para cualesquier ordinales α, β y γ. Demostración. (a) Primero usamos inducción transfinita sobre α2 para mostrar que α1 < α2 implica β + α1 < β + α2 . Supongamos que α2 es un ordinal mayor que α1 y que α1 < δ implica β + α1 < β + δ para toda δ < α2 . Si α2 es un ordinal sucesor, entonces α2 = δ + 1, donde δ ≥ α1 . Por hipótesis de inducción en el caso δ > α1 , y trivialmente en el caso δ ≥ α1 , obtenemos β + α1 ≤ β + δ < (β + δ) + 1 = β + (δ + 1) = β + α2 . Si α2 es un ordinal límite, entonces α1 + 1 < α2 y tenemos β + α1 < (β + α1 ) + 1 = β + (α1 + 1) ≤ sup{β + δ : δ < α2 } = β + α2 . Para probar el recíproco, supongamos que α + α1 < β + α2 . Si α2 < α1 , la implicación ya demostrada probaría que β + α2 < β + α1 . Como α1 = α2 es 90 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 91 ✐ ✐ Conjuntos y modelos. Curso avanzado imposible pues implicaría β + α2 = β + α1 , concluimos que α1 < α2 porque < es lineal. (b) Se sigue de (a): si α1 6= α2 , entonces α1 < α2 o α2 < α1 y, en consecuencia, β + α1 < β + α2 o β + α2 < β + α1 . Si α1 = α2 , trivialmente α1 + β = α2 + β. (c) Procedemos por inducción sobre γ. Si γ = 0, entonces (α + β) + 0 = α+β = α+(β+0). Supongamos que la igualdad ocurre para γ y la probaremos para γ + 1: (α + β) + (γ + 1) = [(α + β + γ] + 1 = [α + (β + γ] + 1 = α + [(β + γ) + 1] = α + [β + (γ + 1)]. (Hemos usado la hipótesis de inducción en el segundo paso y la definición de supremo en las restantes). Finalmente, sea γ un ordinal γ distinto de cero. Entonces (α + β) + γ = sup{(α + β) + δ : δ < γ} = sup{α + (β + δ) : δ < γ}. Observe que sup{β + δ : δ < γ} = β + γ y que β + γ es un ordinal límite (si ξ < β + γ, entonces ξ ≤ β + δ para algún δ < γ y entonces ξ + 1 ≤ (β + δ) + 1 = β + (δ + 1) < β + γ pues γ es límite). Falta probar que sup{α + (β + δ) : δ < γ} = sup{α + ξ : ξ < β + γ} pues β + γ = sup{β + δ : δ < γ}, y tenemos (α + β) + γ = sup{α + ξ : ξ < β + γ} = α + (β + γ), otra vez por la definición de suma. Lema 14.9. Si α ≤ β, entonces existe un único ordinal ξ tal que α + ξ = β. Demostración. Como α es un segmento inicial del conjunto bien ordenado β (o α = β), el teorema 7.9 implica que β = α + ξ, donde ξ es el tipo ordinal del conjunto β − α = {ν : α ≤ ν < β}. Por el lema 14.8(b), el ordinal ξ es único. Primero debemos notar que las funciones ordinales α + β, α · β y αβ son continuas en la segunda variable. Si γ es límite y β = supν<γ βν , entonces α + β = sup(α + βν ), ν<γ α · β = sup(α · βν ), ν<γ αβ = sup αβν . (12) ν<γ Esto se sigue de las definiciones correspondientes. 91 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 92 ✐ ✐ 2. Teoría elemental de conjuntos Lema 14.10. (a) Si 0 < α ≤ γ entonces existe un ordinal más grande β tal que α · β ≤ γ. (b) Si 1 < α ≤ γ, existe un ordinal más grande β tal que αβ ≤ γ. Demostración. Como α · (γ + 1) ≥ γ + 1 > γ, existe un δ con αδ > γ. La menor δ tal que α · δ > γ ( o que αδ > γ) debe ser un ordinal sucesor en vista de la ecuación 12, digamos δ = β + 1. Entonces β es el mayor con la propiedad de que α · β ≤ γ (respectivamente, αβ ≤ γ). El siguiente lema es el análogo para ordinales de la dvisión de enteros: Lema 14.11. Si γ es un ordinal arbitrario y si α 6= 0, entonces existe un único ordinal β y un único ρ < α tal que γ = α · β + ρ. Demostración. Sea β el mayor ordinal tal que α · β + ρ = γ (por el lema 14.10). El ordinal ρ es menor que α pues en otro caso tendríamos α · (β + 1) = α · β + α ≤ α · β + ρ = γ, lo que contradice que β sea máximo. Para probar la unicidad, sea γ = α · β1 + ρ1 = α · β2 + ρ2 con ρ1 , ρ2 < α. Supongamos que β1 < β2 . Entonces β1 + 1 ≤ β2 y tenemos α · β1 + (α + ρ2 ) = α · (β1 + 1) + ρ2 ≤ α · β2 + ρ2 = α · β1 + ρ1 y por el lema 14.8(a), ρ1 ≥ α + ρ2 ≥ α, una contradicción. Así, β1 = β2 y ρ1 = ρ2 se sigue del lema 14.9. La forma normal de Cantor es el análogo a la expansión decimal de enteros. Teorema 14.12 (Forma normal de Cantor). Todo ordinal α > 0 se puede expresar en forma única como α = ωβ1 k1 + ωβ2 k2 + · · · + ωβn kn , donde β1 > β2 > · · · > βn , y k1 > 0, k2 > 0, . . . kn > 0 son finitos. Note que es posible tener α = ωα . Demostración. Primero probamos la existencia de la forma normal por inducción sobre α. El ordinal α = 1 se puede expresar como 1 = ω0 1. Sea α > 0 arbitrario. Por el lema 14.10(b) existe un β, el más grande posible, tal que ωβ ≤ α (si α < ω entonces β = 0). De acuerdo con el lema 14.11 existen un único δ y un ρ tales que ρ < ωβ y α = ωβ δ + ρ. Como ωβ ≤ α, tenemos δ > 0 y ρ < α. Afirmamos que δ es finito. Si δ fuera infinito, α ≥ ωβ δ ≥ ωβ ω = ωβ+1 , lo que contradice el que β sea máximo. Sea entonces β1 = β y k1 = δ. 92 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 93 ✐ ✐ Conjuntos y modelos. Curso avanzado Si ρ = 0, entonces α = ωβ1 k1 está en forma normal. Si ρ > 0 entonces, por hipótesis de inducción, ρ = ωβ2 k2 + · · · + ωβn kn , para ciertos β2 > · · · > βn y k2 , . . . , kn > 0 finitos. Como ρ < ωβ1 , tenemos ωβ2 ≤ ρ < ωβ1 y por consiguiente β1 > β2 . Se sigue que α = ωβ1 k1 + · · · + ωβn kn están en forma normal y γ > β1 ; entonces α < ωγ . Para probar la unicidad, primero observamos que si β < γ entonces ωβ k < ωγ para toda k finita: esto se debe a que ωβ k < ωβ ω = ωβ+1 ≤ ωγ . De esto se sigue fácilmente que si α = ωβ1 k1 + · · · + ωβn kn está en forma normal y γ > β1 , entonces α < ωγ . Para demostrar la unicidad de la forma normal usamos inducción sobre α. Para α = 1 la expansión 1 = ω0 1 es claramente única. Sea α = ωβ1 k1 + · · · + ωβn kn = ωγ1 l1 + · · · + ωγm lm . La observación previa implica que β1 = γ1 . Si tenemos α = δk1 +ρ = δl1 +σ, como ρ < δ y σ < δ, el lema 14.11 implica que k1 = l1 y ρ = σ. Por hipótesis de inducción, la función normal para ρ es única, así que m = n, β2 = γ2 , . . . , βn = γn , k2 = l2 , . . . , kn = ln , con lo que deducimos que la forma normal es única. Note que las nociones de suma, producto y exponenciación de cardinales y ordinales se reducen a las nociones usuales cuando los cardinales y ordinales son finitos. Por lo tanto, en el caso finito la aritmética cardinal coincide con la ordinal. Pero esto no es cierto en general, pues la suma y el producto de cardinales son conmutativos, lo que no ocurre con los ordinales. Las operaciones aritméticas definidas entre cardinales tienen todas las propiedades algebraicas de sus correpondientes casos finitos. Sin embargo, el caso infinito presenta características totalmente inesperadas. De hecho, la aritmética cardinal es en cierto sentido trivial: Teorema 14.13 (Hessenberg). Sea κ ≥ ℵ0 . Entonces κ · κ = κ2 = κ. Demostración. Suponga que no se da la igualdad. Sea κ el cardinal infinito más pequeño tal que κ · κ 6= κ. Por lo tanto, para todos los cardinales λ < κ se cumple λ · λ = λ < κ. Sea P = κ × κ. Entonces |P| = κ · κ > κ. Para cada ξ < κ, sea Pξ = {(α, β) ∈ P : α + β = ξ}. Claramente, ξ 6= ζ implica Pξ ∩ Pζ = ∅. 93 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 94 ✐ ✐ 2. Teoría elemental de conjuntos Más aún, P= [ Pξ . ξ<κ Para probar esto, suponga que (α, β) ∈ Pξ , donde ξ < κ. Así que α+β = ξ, lo que implica α, β < κ, y por consiguiente (α, β) ∈ P. Recíprocamente, sea α, β < κ. Así que los conjuntos Pξ , ξ < κ forman una partición de P. Para cada ξ < κ definimos un buen orden <ξ de Pξ mediante (α, β) <ξ (α′ , β′ ) ⇔ [máx{α, β} < máx{α′ , β′ }] ∨ [máx{α, β} = máx{α′ , β′ }] ∧ (α < α′ ) ∨ [máx{α, β} < máx{α′ , β′ } ∧ (α = α′ )] ∧ (α = α′ ∧ β < β′ )]. Después definimos un buen orden <∗ de P mediante: (α, β) <∗ (α′ , β′ ) ⇔ [(α, β) ∈ Pξ ∧ (α′ , β′ ) ∈ Pη ∧ ξ < η] ∨ ∨ [(α, β), (α′ , β′ ) ∈ Pξ ∧ (α, β) <ξ (α′ , β′ )]. Sea θ el tipo ordinal de (P, <∗ ). Como |P| > κ, tenemos θ > κ. Se sigue entonces que existe un punto (α0 , β0 ) en P tal que el tipo ordinal de (Q, <∗ ) es κ, donde Q = {(α, β) ∈ P : (α, β) <∗ (α0 , β0 )}. Elegimos ξ0 < κ con (α0 , β0 ) ∈ Pξ0 . Entonces α0 + β0 = ξ0 . En consecuencia, si (α, β) ∈ Q, se cumple (α, β) <∗ (α0 , β0 ), es decir, α, β ≤ ξ0 . Por consiguiente, Q ⊆ (ξ0 + 1) × (ξ0 + 1). Pero ξ0 + 1 < κ, así que |ξ0 + 1| < κ, y obtenemos |Q| ≤ |ξ0 + 1| · |ξ0 + 1| < κ, contrario a que el tipo ordinal de (Q, <∗ ) es κ. La prueba está completa. Hemos demostrado que el producto de cardinales es trivial; ahora toca el turno a la suma, que también se simplifica enormemente: Corolario 14.14. Sean κ, λ cardinales, κ ≤ λ, λ ≥ ℵ0 . Entonces κ + λ = κ · λ = λ. 94 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 95 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Tenemos que λ≤κ+λ≤λ+λ=2·λ≤λ·λ=λ y λ ≤ κ · λ ≤ λ · λ = λ. El resultado se sigue de inmediato. Denotamos por κ+ el menor cardinal mayor que κ, el sucesor (como cardinal) de κ. Corolario 14.15. Sea κ ≥ ℵ0 . Entonces κ+ = |{α : κ ≤ α < κ+ }|, es decir, el conjunto de ordinales de cardinalidad κ tiene cardinalidad κ+ . Demostración. Tenemos las siguientes igualdades: κ+ = |{α : α < κ+ }| = |{α : α < κ} ∪ {α : κ ≤ α < κ+ }| = |{α : α < κ}| + |{α : κ ≤ α < κ+ }| = κ + |{α : κ ≤ α < κ+ }|. Por el corolario 14.14, debemos tener κ+ = |{α : κ ≤ α < κ+ }|, como se requiere. Corolario 14.16. Sea κ un cardinal infinito. La unión de a lo sumo κ conjuntos de cardinalidad a lo sumo κ, tiene cardinalidad a lo sumo κ. En particular, la unión de una familia a lo sumo numerable de conjuntos numerables es numerable. Demostración. Si |Aα | ≤ κ, para cada α < λ, donde λ ≤ κ, entonces | como se pide. [ α<λ Aα | ≤ κ · λ ≤ κ · κ = κ, Corolario 14.17. Para cualesquier α, β, ℵα + ℵβ = ℵα · ℵβ = ℵmáx(α,β) . Demostración. Ejercicio muy simple. 95 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 96 ✐ ✐ 2. Teoría elemental de conjuntos 15. Conjuntos numerables e innumerables Recuerde que un conjunto a es numerable si existe una biyección f : N − → a. En esta sección se presentan resultados que indican que ciertos conjuntos usuales son numerables. También se presentan ejemplos de subconjuntos de R innumerables. Teorema 15.1. Si a y b son conjuntos numerables, entonces a × b es numerable. Demostración. Es suficiente probar que |N×N| = |N|, es decir, construir una biyección de N × N sobre N. Considere la función f (k, n) = 2k · (2n + 1) − 1. Se deja al lector corroborar que f es una biyección. Por inducción se demuestra el siguiente corolario: Corolario 15.2. Si a1 , a2 , . . . , an son conjuntos numerables, lo mismo se puede decir de a1 × a2 × . . . × an . Los resultados anteriores nos permiten demostrar la numerabilidad de los conjuntos de números enteros y racionales. Mostraremos además que el conjunto de números reales no es numerable. Teorema 15.3. (a) El conjunto de los números enteros Z es numerable. (b) El conjunto de los números racionales Q es numerable. (c) El conjunto R de los números reales es innumerable. Demostración. (a) Para mostrar que Z es numerable, basta considerar la siguiente biyección: f :N− → Z definida mediante f (0) = 0, f (2n + 1) = −n, f (2n) = n. 96 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 97 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) Para probar la numerabilidad de Q, note que todo número racional tiene la forma p/q con p, q ∈ Z y p, q primos relativos. Esta representación es única, con lo que logramos encajar Q en Z × Z, es decir, considerar a Q como subconjunto de Z × Z. Puesto que este último conjunto es numerable de acuerdo con teorema 15.1, Q es numerable. (c) Si mostramos que (0, 1] ⊆ R no es numerable, R mismo no será numerable. Probemos que para cada sucesión a1 , a2 , . . . de números reales distintos, con 0 < an ≤ 1, existe un número real d, 0 < d ≤ 1 que no aparece en la sucesión de los ai . Esto se consigue mediante el segundo argumento diagonal de Cantor. Todo número real 0 < x ≤ 1 se puede representar como una fracción decimal infinita 0.x1 x2 x3 . . . (por ejemplo, 21 = 0.49999 . . . , 1 = 0.999 . . . ) y de hecho en forma única. La sucesión a1 , a2 , a3 , . . . la podemos enumerar como 0.a11 a12 a13 . . . 0.a21 a22 a23 . . . 0.a31 a32 a33 . . . ......... Mediante los elementos de la diagonal (a11 , a22 , a33 , . . . ) formamos una nueva fracción decimal d ′ = 0.a11 a22 a33 . . . que pertenece a (0, 1]. A partir de d ′ construimos un número d ∈ (0, 1], haciendo que cada cifra se sustituya por un número natural bn arbitrario distinto de an y 0. El número d = 0.b1 b2 b3 . . . es diferente de cada an , pues difiere de éste en la n-ésima cifra. Ciertos conjuntos de números reales son innumerables como lo mostramos a continuación: Teorema 15.4. (a) |R| = 2ℵ0 . (b) El conjunto de los números irracionales tienen cardinalidad 2ℵ0 . (c) El conjunto de todos los conjuntos infinitos de números naturales tiene cardinalidad 2ℵ0 . (d) El conjunto de todas las funciones inyectivas de N sobre N tiene cardinalidad 2ℵ0 . 97 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 98 ✐ ✐ 2. Teoría elemental de conjuntos Demostración. (a) Recuerde que si x ∈ R, entonces x = ± . . . y3 y2 y1 .z1 z2 z3 . . . con zi , yi ∈ N, así que cada x ∈ R se puede asociar a una sucesión de naturales < y1 , y2 , y3 , . . . , z1 , z2 , z3 , . . . >. En consecuencia, R ⊆ NN . Pero |NN | = ℵℵ0 0 = 2ℵ0 (de acuerdo con el Teorema 16.10). Por lo tanto, |R| ≤ 2ℵ0 . Por otro lado, ya vimos que todo número real x, 0 ≤ x ≤ 1 tiene una representación decimal consistente en números naturales. Sea S el conjunto de todos los números reales en (0, 1], cuya expansión decimal consiste sólo de ceros y unos. El conjunto S está en correspondencia biunívoca con {0, 1}N que tiene cardinalidad 2ℵ0 . Por consiguiente, |R| ≥ 2ℵ0 . (b) Sea P el conjunto de los números irracionales. Observe que R = Q ∪ P y que Q ∩ P = ∅, por lo que |R| = |Q| + |P|, es decir 2ℵ0 = ℵ0 + |P|, de donde se deduce que |P| = 2ℵ0 , de acuerdo con el corolario 14.14. (c) Primero debemos probar que el conjunto de subconjuntos finitos de N es numerable. Pero este conjunto no es otra cosa que el conjunto de todas las sucesiones finitas en N, suc(N). Además suc(N) = [ Nn , n<ω de donde se desprende que |suc(N)| = ℵ0 . Para probar la afirmación en (c), note que Pot(N) tiene cardinalidad 2ℵ0 (Lema 16.9) y que consiste en todos los subconjuntos finitos de N y de todos los subconjuntos infinitos de N. Por lo ya demostrado, resulta claro que el conjunto de subconjuntos infinitos de N debe tener cardinalidad 2ℵ0 . (d) Sea P el conjunto de todas las funciones inyectivas de N sobre N. Como P ⊆ NN , es evidente que |P| ≤ 2ℵ0 . Sean A y B conjuntos de todos los números pares e impares, respectivamente. Si X ⊆ E es infinito, definimos una función fX : N − → N como sigue: fX (2k) = el k-ésimo elemento de X fX (2k + 1) = el k-ésimo elemento de N \ X (k ∈ N) (k ∈ N). Note que B ⊆ N \ X es infinito, así que fX es una biyección de N sobre N. Más aún, es fácil probar que si X1 6= X2 , entonces fX1 = fX2 . Entonces, tenemos una correspondencia biunívoca entre los subconjuntos infinitos de A y ciertos elementos de P. Como hay 2ℵ0 subconjuntos infinitos de A, |P| ≥ 2ℵ0 , como se requiere. 98 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 99 ✐ ✐ Conjuntos y modelos. Curso avanzado 16. Cardinales regulares y singulares Un cardinal de la forma κ+ es un cardinal sucesor. Por ejemplo, 1, 2, 3, . . . son cardinales sucesores. También lo son ℵ1 , ℵ2 y ℵ3 . De hecho, un cardinal infinito es un cardinal sucesor si y sólo si es de la forma ℵα+1 para algún ordinal α; o lo que es lo mismo, un cardinal infinito ℵγ es un cardinal sucesor si y sólo si el índice γ es un ordinal sucesor. Un cardinal que no es sucesor se llama cardinal límite. Ejemplos de cardinales límite son 0, ℵ0 , ℵω , ℵω+ω , ℵω·ω , ℵω1 . Cualquier cardinal no numerable ℵγ es un cardinal límite si y sólo si el índice γ es un ordinal límite o es cero. La noción de cofinalidad es de extraordinaria importancia en la exponenciación cardinal y en otras nociones de la teoría de conjuntos. Definición 16.1. (a) (b) (c) (d) Un conjunto x ⊆ κ es cofinal en κ si sup(x) = κ. Def cf (κ) = mín{|x| : x ⊆ κ ∧ x es cofinal en κ} es la cofinalidad de κ. κ es regular si cf (κ) = κ. κ es singular si cf (κ) < κ. Ahora clasifiquemos los álef en términos de regularidad y singularidad, para lo que requerimos antes un resultado técnico: Teorema 16.2. Sean λ un cardinal infinito, κα (α < λ) números cardinales distintos de cero y κ = sup{κα : α < λ}. Entonces X α<λ κα = λ · κ = λ · sup{κα : α < λ}. Demostración. Por una parte, κα ≤ κ para cada α < λ, así que P κ ≤ κ · λ. κ ≤ α α<λ α<λ P P Por otra parte, notemos que λ = α<λ 1 ≤ α<λ κα . También tenemos P supremo de los κα , todo ordinal γ menor que κ ≤ α<λ κα ; puesto que κ es el P P κ es menor que algún κα y κα ≤P α<λ κα ; por lo tanto, κ ≤ α<λ κα . Como κ y λ son menores o iguales que α<λ κα , se deduce que κ · λ no es mayor que P α<λ κα . Del teorema de Cantor-Schröder-Bernstein obtenemos la afirmación del teorema. P Una consecuencia inmediata es: 99 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 100 ✐ ✐ 2. Teoría elemental de conjuntos Corolario 16.3. Si κi (i ∈ I) son números cardinales, y si |I| ≤ sup{κi : i ∈ I}, entonces X κi = sup κi . i∈I i∈I Teorema 16.4. (a) ω = ℵ0 es regular. (b) ℵα+1 es regular. (c) Si β es límite y β < ℵβ , entonces ℵβ es singular. Demostración. (a) Si ω es singular, cf (ω) < ω. Entonces existiría un conjunto x ⊆ ω con |x| = n y sup(x) = ω. Pero esto no es posible. (b) Supongamos que ℵα+1 es singular. Entonces cf (ℵα+1 ) ≤ ℵα . Por lo tanto, existe x ⊆ ℵα+1 con |x| ≤ ℵα y sup(x) = ℵα+1 . Pero en tal caso, ℵα+1 = [ x ≤ máx{|x|, sup{|y| : y ∈ x}} ≤ ℵα , lo que no puede ocurrir. (c) Sea β un ordinal límite con β < ℵβ . Entonces ℵβ = sup{ℵγ : γ < β} y tenemos que |{ℵγ : γ < β}| = |β| < ℵβ . Así que ℵβ es singular. Por definición, para cada cardinal infinito κ podemos encontrar un subconjunto x ⊆ κ, cuya cardinalidad es igual a cf (κ); es decir, se puede establecer una biyección entre x y cf (κ). Ahora mostraremos que incluso podemos tomar una biyección que sea un isomorfismo. Lema 16.5. Sea κ un cardinal infinito. Entonces existe un subconjunto x ⊆ κ cofinal en κ e isomorfo a cf (κ). Demostración. Sean y ⊆ κ, sup(y) = κ, |y| = cf (κ) y g : cf (κ) − →y una biyección. Por recursión transfinita definimos: F : OR − → V, F (α) = sup(F [α] ∪ g[α]) + 1. 100 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 101 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Sea f = F ↾ cf (κ). Se observa fácilmente que: 1. α < β < cf (κ) ⇒ f (α) < f (β) ∧ g(α) < f (β). 2. ran(f ) ⊆ κ. 3. ran(f ) es cofinal en κ. Entonces ran(f ) es el conjunto x deseado. Lema 16.6. Un cardinal infinito κ es singular si y sólo si existe un cardinal λ < κ y un conjuntoS {sξ : ξ < λ} de subconjuntos de κ tales que |sξ | < κ para cada ξ < λ, y κ = ξ<λ sξ . (De hecho, el menor cardinal λ que satisface la condición es igual a cf (κ).) Demostración. Si κ es singular, entonces existe una sucesión creciente {αξ : ξ < cf (κ)}, cuyo supremo es κ. Sean λ = cf (κ) y sξ = αξ para todo ξ < λ. Si la condición es cierta, sea λ <Sκ el menor cardinal para el cual existe una familia {sξ : ξ < λ} tal que κ = ξ<λ sξ y |sξ | < κ para cada ξ < λ. Para S todo ξ < λ, sea βξ el tipo ordinal de ν<ξ sν . La sucesión hβξ : ξ < λi es no decreciente y, por la minimalidad de λ, βξ < κ para todo ξ < λ. Mostraremos que el supremo de los βξ es κ, con lo que habremos demostrado cfS (κ) ≤ λ. Sea β = supξ<λ βξ . Existe una función inyectiva f de κ = ξ<λ sξ en λ × β: si α ∈ κ, sea f (α) = (ξ, γ), donde ξ es el menor ξ con α ∈ sξ y γ es el tipo ordinal de sξ ∩ α. Como λ < α y |λ × β| = λ · |β|, se desprende que β = κ. Corolario 16.7. Si κ es un cardinal infinito, cf (κ) es un cardinal regular. Demostración. cf (cf (κ)) ≤ cf (κ) es evidente. Debemos mostrar que cf (κ) ≤ cf (cf (κ)). Por el lema 16.5 existen x, f con x ⊆ κ, sup(x) = κ y f : cf (κ) − → x un isomorfismo. Además, existe y ⊆ cf (κ) con sup(y) = cf (κ) y |y| = cf (cf (κ)). Se deduce fácilmente que {f (α) : α ∈ y} es cofinal en κ. De aquí que cf (κ) ≤ |{f (α) : α ∈ y}| = |y| = cf (cf (κ)). Teorema 16.8 (König). Sea κ un cardinal infinito. Entonces κ < |κcf (κ) |. 101 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 102 ✐ ✐ 2. Teoría elemental de conjuntos Demostración. κ = |κ1 | ≤ |κcf (κ) | es obvia. Derivamos una contradicción de la suposición de que existe una biyección f : κ − → κcf (κ) . De acuerdo con el lema 16.5, existen x ⊆ κ tal que sup(x) = κ y un isomorfismo g : cf (κ) − → x. Para cada α < cf (κ) se cumple g(α) < κ; por consiguiente, |{f (γ)(α) : γ < g(α)}| ≤ |g(α)| < κ, así que {f (γ)(α) : γ < g(α)} $ κ. Definamos h : cf (κ) − → κ, Def h(α) = mín(κ \ {f (γ)(α) : γ < g(α)}). Obtenemos una contradicción si mostramos que para toda γ < κ es cierto f (γ) 6= h. Sea entonces γ < κ. Escogemos una α < cf (κ) con γ < g(α), y entonces h(α) 6= f (γ)(α) por la construcción de h. Lema 16.9. Para cualquier cardinal κ, 2κ = |Pot(κ)|. Demostración. Por definición, 2κ = |{f : f : κ − → 2}|. Pero existe una correspondencia inyectiva entre los conjuntos {f : f : κ − → 2} y Pot(κ), asociando cada conjunto X ⊆ κ con su función característica χκ : κ − → 2, definida por χX (ξ) = 1 ⇔ ξ ∈ X. La afirmación se sigue entonces inmediatamente. Teorema 16.10. Sean κ, λ cardinales, λ infinito, κ ≤ λ. Entonces κλ = 2λ . Demostración. Es evidente que 2λ ≤ κλ . Probaremos que κλ ≤ 2λ . Como λ es infinito y κ ≤ λ, κ · λ = λ. Sea j : λ × κ − → λ una biyección. Para cada función h : λ − → κ tenemos formalmente h ⊆ λ × κ, así que podemos definir G(h) = j[h]. Por lo tanto, G(h) ⊆ λ. Es claro que G : κλ − → Pot(λ) es inyectiva. Obtenemos y la prueba termina. κλ = |λ κ| ≤ |Pot(λ)| = 2λ , 102 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 103 ✐ ✐ Conjuntos y modelos. Curso avanzado Por el teorema 16.10, si λ es infinito, el comportamiento de κλ es conocido cuando κ varía hasta λ. Para κ > λ, la situación es impredecible salvo en raras ocasiones como la siguiente: Teorema 16.11. Sea κ un cardinal infinito. Entonces (κ+ )κ = 2κ . Demostración. Claramente κ+ · 2κ ≤ (κ+ )κ · 2κ = (κ+ )κ , por lo que 2κ ≤ (κ+ )κ . Por otro lado: (κ+ )κ ≤ (2κ )κ = 2κ·κ (pues κ+ ≤ 2κ ) = 2κ . Acerca de la exponenciación cardinal sólo se puede decir muy poco. Por ejemplo, aunque sabemos que 2ℵ0 es un cardinal, no sabemos cuál es, es decir, no sabemos qué ordinal α hace cierta la ecuación 2ℵ0 = ℵα . Los axiomas de ZFE no son suficientes para determinar tal α. Cantor estaba persuadido de que la respuesta es α = 1 y durante muchos años trató de demostrar su hipótesis, ahora conocida como hipótesis del continuo: 2 ℵ 0 = ℵ1 . Hipótesis del continuo (HC ) Def Como |R| = 2ℵ0 = c, la hipótesis del continuo responde a la pregunta de cuántos números reales existen. Se demuestra que HC es independiente de ZFE ; es decir, tanto HC como su negación son imposibles de demostrar en ZFE . Esta demostración se efectúa en dos partes: la primera en este volumen, en el capítulo de constructibilidad; y la segunda en el volumen II, mediante el método de Forcing. El siguiente teorema de König es uno de los pocos resultados que establece una relación entre productos y sumas cardinales mediante una desigualdad estricta. 103 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 104 ✐ ✐ 2. Teoría elemental de conjuntos Teorema 16.12 (König). Sean β un ordinal y κα , λα cardinales tales que κα < λα , para toda α < β. Entonces X κα < Y λα . α<β α<β Demostración. La demostración se hace en dos etapas: en la primera establecemos la desigualdad ≤. En la segunda probamos la desigualdad estricta. Definimos Y [  κα × {α} − → λα , f : α<β α<β Q tomando como f (ξ, γ) al elemento de α<β λα que toma como valor ξ ∈ λα en la posición γ, y cero en otra parte. Es decir, f (ξ, γ)(ν) = ( si ν = γ, en otro caso. ξ, 0, Es obvio que f es inyectiva. Por lo tanto, X α<β κα ≤ Y λα . (*) α<β Ahora suponga que se presenta la igualdad en (*). Sea φ la biyección asociada, es decir, Y [  κα × {α} − → φ: λα . α<β α<β Para α < β, sea φα la proyección de φ sobre λα , es decir, φα (ξ, γ) = φ(ξ, γ)(α). Entonces φα ↾ (κα × {α}) : κα × {α} − → λα . Como κα < λα y |κα × {α}| = κα , la función φα ↾ (κα × {α}) no puede ser sobre. Por lo tanto, existe δα ∈ λα \ φα [κα × {α}]. Sea Q σ = hδα : α < βi. En consecuencia, σ ∈ α<β λα , así que para ciertos ξ, α se debe cumplir σ = φ(ξ, α). En particular, δα = φ(ξ, α)(α) = φα (ξ, α) ∈ φα [κα × {α}], lo que es absurdo. 104 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 105 ✐ ✐ Conjuntos y modelos. Curso avanzado Una consecuencia del teorema 16.12 es que podemos obtener cierta información sobre 2ℵ0 , para lo que requerimos: Corolario 16.13. Para todo cardinal infinito κ, κcf (κ) > κ. Demostración. Sea λ = cf (κ). Podemos encontrar cardinales κα < κ, P para toda α < λ, tales que κ = α<β κα . Como κα < κ para toda α < β, por el teorema 16.12 logramos κ= X κα < α<β Y κ = κλ , α<β como se requiere. Teorema 16.14. Para cualquier cardinal infinito κ, cf (2κ ) > κ, y en particular, cf (2ℵ0 ) > ℵ0 . Note que entonces 2ℵ0 6= ℵω , 2ℵ0 6= ℵω+ω , etc. Demostración. Suponga que cf (2κ ) ≤ κ. Entonces definimos λ = 2κ para obtener κ λcf (λ) = λcf (2 ) ≤ λκ = (2κ )κ = 2κ·κ = 2κ = λ, contrario al corolario 16.13. Lema 16.15. Si κ es un cardinal límite y λ ≥ cf (κ), entonces λ κ = [ α α<κ λ !cf (κ) . 105 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 106 ✐ ✐ 2. Teoría elemental de conjuntos P i<cf (κ) κi , Demostración. Sea κ = En consecuencia,  κλ ≤  Y λ κi  = i<cf (κ) ≤ Y ( donde κi < κ para toda i < cf (κ). [ αλ ) Y κλi i<cf (κ) i<cf (κ) α<κ =( [ αλ )cf (κ) α<κ λ cf (κ) ≤ (κ ) = κλ . Podemos generalizar la hipótesis del continuo: Definición 16.16 (Hipótesis generalizada del continuo (HGC )). La hipótesis generalizada del continuo (HGC) es la afirmación: Para todo ordinal α, se cumple 2ℵα = ℵα+1 . También la hipótesis generalizada del continuo resulta ser independiente de los axiomas ZFE , y esta independencia se probará en los dos volúmenes del presente libro. Suponiendo HGC podemos demostrar algunos resultados sobre la exponenciación cardinal, pero antes requerimos el siguiente resultado: Teorema 16.17. ℵ (a) Si ℵβ ≤ ℵα , entonces ℵα ≤ ℵαβ ≤ |Pot(ℵα )| = 2ℵα . ℵ (b) Si cf (ℵα ) ≤ ℵβ ≤ ℵα , entonces ℵα < ℵαβ ≤ |Pot(ℵα )| = 2ℵα . Demostración. (a) ℵ ℵα ≤ |ℵαβ | ≤ |ℵβ ({0, 1})ℵα | = |{0, 1}ℵβ ·ℵα | = |{0, 1}ℵα | = |Pot(ℵα )|. pues ℵβ ≤ ℵα 106 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 107 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) (ℵα ) | ℵα < |ℵcf α ≤ (c) teorema de König ℵ |ℵαβ | ≤ |Pot(ℵα )| como en (a). |Pot(ℵβ )| = |{0, 1}ℵβ | ℵ ≤ |ℵαβ | ≤ |{0, 1}ℵβ ·ℵα | = |{0, 1}ℵβ | = |Pot(ℵβ )|. Teorema 16.18 (HGC ). ℵ (a) ℵβ < cf (ℵα ) ⇒ ℵα = ℵαβ ℵ (b) cf (ℵα ) ≤ ℵβ ≤ ℵα ⇒ ℵαβ = ℵα+1 . ℵ (c) ℵα ≤ ℵβ ⇒ ℵαβ = ℵβ+1 . Demostración. (b) se sigue del teorema 16.17 usando HGC . (a) Sea ℵβ < cf (ℵα ). Considere primero ℵ ℵα β = [ {ℵβ γ : γ < ℵα }. Esto se ve fácilmente: la contención “⊇” es obvia. Para la contención “⊆” sea f : ℵβ − → ℵα . Ya que |f [ℵβ ]| ≤ ℵβ < cf (ℵα ), concluimos que sup(f [ℵβ ]) < γ < ℵα para algún γ, así que f : ℵβ − → γ. Se obtiene entonces ℵ ℵα ≤ ℵαβ =| [ por el teorema 16.17 {γ ℵβ : γ < ℵα }| ≤ máx{|ℵα |, sup |γ ℵβ |}, γ<ℵα 107 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 108 ✐ ✐ 2. Teoría elemental de conjuntos así que es suficiente demostrar que |ℵβ γ| ≤ ℵα para γ < α. Sea entonces γ < α. |ℵβ γ| ≤ |{0, 1}ℵ·γ | ≤ |{0, 1}ℵβ ·ℵδ | ≤ = para alguna δ con |γ| ≤ ℵδ < ℵα ( ( |Pot(ℵδ )|, |Pot(ℵβ )|, ℵδ+1 , ℵβ+1 , ≤ ℵα . cuando β < δ cuando δ ≤ β cuando β ≤ δ cuando δ ≤ β 17. Sucesiones de ordinales Sean λ un ordinal límite y hαξ : ξ < λi una sucesión de ordinales. Decimos que α = Lím αξ ξ<λ si y sólo si (∀ β < α)(∃ ξ < λ)(∀ ζ)(ξ < ζ < λ ⇒ β < αζ ≤ α). Si tal α existe, claramente es único y lo llamamos el límite de la sucesión hαξ : ξ < λi. El próximo lema muestra que muchas sucesiones realmente tienen límite. Lema 17.1. Sea λ un ordinal límite y sea hαξ : ξ < λi una sucesión creciente de ordinales. Esta sucesión tiene un límite (único); el límite es Lím αξ = ξ<λ [ αξ . ξ<λ S Demostración. Si α = ξ<λ αξ . Debemos probar que este α satisface α = SLímξ<λ αξ . Para ello, sea β < α. Como la sucesión es creciente y α = ξ<α αξ , entonces β ∈ αξ0 para algún ξ0 < λ y β ∈ αξ para todo ξ > ξ0 , así que para todo ζ con ξ0 < ζ < λ se cumple que β < αζ ≤ α, es decir, se cumple la definición de Límξ<λ αξ = α. 108 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 109 ✐ ✐ Conjuntos y modelos. Curso avanzado Los siguientes resultados establecen propiedades que se desprenden directamente de la definición de límite, por lo que su demostración se deja como ejercicio. Lema 17.2. Sean λ, µ ordinales límite y f : µ − → λ una función que preserva el orden y tal que Límξ<µ f (ξ) = λ. Sea {αξ : ξ < λ} una sucesión creciente. Entonces Lím αξ = Lím αf (ξ) . ξ<λ ξ<µ Demostración. Ejercicio. Lema 17.3. Sean λ un ordinal límite y hαξ : ξ < λi, hβζ : ζ < λi sucesiones crecientes tales que (a) (∀ ξ < λ)(∃ ζ < λ)(βζ > αξ ), (b) ((∀ ζ < λ)(∃ ξ < λ)(αξ > βζ ). Entonces Lím αξ = Lím βζ . ξ<λ ζ<λ Demostración. Ejercicio. Lema 17.4. Sean λ un ordinal límite y hαξ : ξ < λi una sucesión de ordinales. Para cada µ < λ, sea X σµ = αξ . ξ<µ Entonces X ξ<λ αξ = Lím σµ . µ<λ Demostración. Ejercicio. Sea f : λ − → λ y α ∈ λ un ordinal límite. Decimos que f es continua en α si y sólo si f (α) = Lím f (ξ). ξ<α Por ejemplo, la función identidad en λ es continua en todo ordinal límite menor que λ. Una función f : λ − → λ es normal si preserva el orden y es continua en todo ordinal límite menor que λ. Para funciones normales podemos demostrar un resultado análogo al de las funciones reales: 109 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 110 ✐ ✐ 2. Teoría elemental de conjuntos Lema 17.5. Sean f : µ − → µ una función normal y λ ∈ µ un ordinal límite. Si hαξ : ξ < λi es una sucesión creciente de ordinales en µ y Límξ<λ hαξ : ξ < λi < µ, entonces f (Lím αξ ) = Lím f (αξ ). ξ<λ ξ<λ Demostración. Si κ = Límξ<λ αξ y η = Límξ<λ f (αξ ), entonces S S mostrar que f (κ) = λ. α y η = ξ<λ f (αξ ). Debemos ξ<λ ξ S Por hipótesis, f (Límξ<λ αξ ) = f ( ξ<λ αξ ) = f (κ) con κ < µ y S Límξ<λ f (αξ ) = ξ<λ f (αξ ). Como hαξ : ξ < λi es creciente y λ es límite, κ debe ser límite, por lo que κ= f (κ) = f ( [ αξ ) ξ<λ = Lím f (ξ) = Lím f (αξ ) = λ. ξ<λ ξ<λ Sea f : λ − → λ, decimos que α ∈ λ es un punto fijo de f si f (α) = α. Lema 17.6. Sea F : OR − → OR un término clase normal. Para toda α existe un punto fijo γ de F tal que γ > α. Demostración. Sea α un ordinal arbitrario. Si F (α) = α, no hay nada que demostrar. Supongamos que F (α) 6= α. Claramente F (α) > α. Por recursión definimos una función g : ω − → OR tal que g(0) = α g(n + 1) = F (g(n)). Mediante inducción sobre ω se prueba fácilmente que g preserva el orden. Entonces γ = Lím g(n). n<ω Note que γ > g(0) = α. Terminaremos si probamos que F (γ) = γ. Como F es normal, F (γ) = F (Lím g(n)) = Lím F (g(n)) = Lím g(n + 1) = γ, n<ω n<ω n<ω como se requiere. 110 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 111 ✐ ✐ Conjuntos y modelos. Curso avanzado El teorema 17.6 no es válido, en general, si f : λ − → λ. Por ejemplo, la función f : ω − → ω definida por f (n) = n + 1 no tiene puntos fijos. Para finalizar la sección presentamos un buen orden fuerte en el término clase OR × OR de parejas ordenadas. Con este orden, α × α es un segmento inicial de OR × OR para cada ordinal α. Más aún, con este orden OR × OR es isomorfo a OR y tenemos una “función” inyectiva Ξ de OR × OR sobre OR. Como resultado, el tipo ordinal de α × α es precisamente α para muchos ordinales α. Si α, β, γ y δ son ordinales, definimos (α, β) < (γ, δ) ⇔ máx{α, β} < máx{γ, δ} ∨ (máx{α, β} = máx{γ, δ} ∧ α < γ) (13) ∨ (máx{α, β} = máx{γ, δ} ∧ α = γ ∧ β < δ). Es fácil verificar (Ejer. 86) que < es un buen orden fuerte. Para cada α, α × α es el segmento inicial determinado por α. Definimos Ξ(α, β) = tipo ordinal{(ξ, η) : (ξ, η) < (α, β)}. En esta situación, Ξ es una función inyectiva de OR × OR sobre OR y (α, β) < (γ, δ) ⇔ Ξ(α, β) < Ξ(γ, δ). Note que Ξ[ω] = ω y como Ξ(α) = Ξ[α × α] es una función creciente de α, se cumple Ξ(α) ≥ α para todo ordinal α. Sin embargo, Ξ[α × α] = α para ordinales α arbitrariamente grandes (Ejer. 87). 18. Ejercicios 1. Demuestre que para todo conjunto x, existe un único conjunto y tal que z ∈ y si y sólo si z ∈ x, y Φ(x), donde Φ es una fórmula de LTC con una variable libre x. 2. Muestre que Pot(x) ⊆ x es falso para todo conjunto x. En particular, Pot(x) 6= x. Esto demuestra que no existe el conjunto de todos los conjuntos. [Sugerencia: Considere z = {y ∈ x : y ∈ / y}.] 3. Sean s 6= ∅ y a conjuntos. (a) Defina T1 = {y ∈ Pot(a) : y = a ∩ x para algún x ∈ s}, y pruebe que a ∩ (∪s) = [ T1 . 111 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 112 ✐ ✐ 2. Teoría elemental de conjuntos (b) Defina T2 = {y ∈ Pot(a) : y = a \ x para algún x ∈ s}, y pruebe que a \ ∪s = a \ ∩s = \ [ T2 , T2 . 4. Demuestre que el axioma Fund implica las siguientes afirmaciones. ¿Qué otros axiomas requiere para probarlas? (a) ∀ x(x 6= ∅ ⇒ ∃ y ∈ x∀ z ∈ x(z ∈ / y)). [Sugerencia: suponga lo contrario y considere {x}.] (b) ∀ x(x ∈ / x). (c) No existe una sucesión finita hx0 , x1 , . . . , xn i tal que x0 ∈ x1 ∈ · · · ∈ xn ∈ x0 . (d) No existe una sucesión infinita hxn : n ∈ ωi tal que xn+1 ∈ xn para todo n ∈ ω. 5. Demuestre el lema 2.1. 6. Demuestre el lema 2.3. 7. Demuestre el lema 2.6. 8. En TEC +Comp, demuestre que si X es un término clase no vacío, entonces ∩X ∈ V . En particular, si x, y ∈ V , x∩y ∈ V y si x 6= ∅, entonces ∩x ∈ V . S 9. Pruebe que (a, b) ∈ Pot(Pot({a, b})) y que a, b ∈ (a, b). De manera más general, si a, b ∈ x, entonces (a, b) ∈ Pot(Pot(x)). 10. Pruebe que (a, b), (a, b, c) y (a, b, c, d) existen para cualesquier conjuntos a, b, c y d. 11. Para dar una definición alternativa de pareja ordenada, elija dos conjuntos diferentes ✷ y △ (p. ej. ✷ = ∅, △= {∅}) y defina (a, b) = {{a, ✷}, {b, △ }}. Demuestre que (a, b) = (a′ , b′ ) si y sólo si a = a′ y b = b′ . Defina ternas ordenadas. 12. S SeaSR una relación binaria; muestre que dom R ⊆ ( R). Concluya que dom R y ran R existen. 13. Sean R, S relaciones. (a) Muestre que R−1 y S ◦ R existen. (b) Sean a, b conjuntos. Muestre que a × b existe. S S ( R), ran R ⊆ 14. Sea R una relación binaria y a, b conjuntos. Pruebe: 112 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 113 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) (b) (c) (d) R[a ∪ b] = R[a] ∪ R[b]. R[a ∩ B] ⊆ R[a] ∩ R[b]. R[a \ b] ⊇ R[a] \ R[b]. Dé un ejemplo que muestre que no se da la igualdad en los incisos (b) y (c). (e) Pruebe los incisos (a)–(d) con R−1 en lugar de R. (f) R−1 [R[a]] ⊇ a y R[R−1 [b]] ⊇ B; encuentre ejemplos que demuestren la imposibilidad de la igualdad. 15. Pruebe que a × b = ∅ si y sólo si a = ∅ o b = ∅. 16. Sean f una función y Fa un conjunto para cada a ∈ x, y demuestre: (a) f f f −1 −1 " " " [ a∈x # Fa = # Fa = \ Fa = a∈x f [Fa ], [ f −1 \ f −1 [Fa ]. a∈x [ a∈x [ [Fa ], a∈x # f " \ a∈x # Fa ⊆ \ f [Fa ], a∈x a∈x (b) Pruebe la siguiente forma de la ley distributiva: \ a∈x   [ b∈y  Fa,b  = [ f ∈yx \ a∈x ! Fa,f (a) . 17. Sea P = {(r, γ) ∈ R × R : r > 0}, donde R son los números reales. Consideramos a los elementos de P como las coordenadas polares de puntos en el plano, y definimos una relación en P mediante: (r, γ) ∼ (r ′ , γ ′ ) si y sólo si γ −γ ′ es un múltiplo entero de 2π. Muestre que ∼ es una relación de equivalencia en P (dos elementos de P son ∼-equivalentes precisamente en el caso en que son las coordenadas polares del mismo punto). Muestre que cada clase de equivalencia contiene una única pareja (r, γ) con 0 ≤ γ < 2π. El conjunto de tales parejas es, por tanto, un conjunto de representantes para ∼. 18. (a) Sea R un orden parcial en x. Pruebe que R−1 es un orden parcial en x, y para y ⊆ x a es el menor elemento de y respecto a R−1 si y sólo si a es el mayor elemento de y respecto a R. 113 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 114 ✐ ✐ 2. Teoría elemental de conjuntos (b) De igual manera para supremo e ínfimo. 19. Sea a = Pot(x), x 6= ∅. Pruebe: S (a) Cualquier s ⊆ a tiene un supremo en el orden ⊆a , a T saber sup s = s. (b) Cualquier s ⊆ a tiene un ínfimo en ⊆a ; ínf s = s si s 6= ∅; ínf ∅ = x. 20. Sea Fn(X, Y ) el conjunto de funciones entre un subconjunto de X y Y , es S decir, Fn(X, Y ) = Z⊆X Y Z . Defina una relación ≤ en Fn(X, Y ) por f ≤g si y sólo si f ⊆ g. (a) Pruebe que ≤ es un orden parcial en Fn(X, Y ). (b) Sea F ⊆ Fn(X, Y ). Muestre que sup F existe si y sólo si F es un S sistema compatible y sup F = F , donde: dos funciones f, g son compatibles si f (x) = g(x), para toda x ∈ dom f ∩ dom g. 21. Muestre que si (P, <) y (Q, ⋖) son conjuntos parcialmente ordenados isomorfos y < es un orden lineal, entonces también ⋖ es un orden lineal. 22. Demuestre la siguiente variante del teorema de recursión 6.10: sea S un conjunto. Recuerde que suc(S) es el conjunto de sucesiones finitas en S. Dada cualquier función g : suc(S) − → S existe una única sucesión f : N − → S tal que f (n) = g(f ↾ n), ∀ n ∈ N. [Sugerencia: Use el teorema de recursión para definir la sucesión hFn : n ∈ ωi = hf ↾ n : n ∈ ωi. Defina entonces F0 = hi Fn+1 = Fn ∪ {hn, g(Fn )i∀ n ∈ ω}.] 23. Pruebe que no existe una función f : ω − → ω tal que f (n) > f (n + 1) para toda n ∈ ω. 24. Sea s una sucesión infinita de elementos de a, donde a está linealmente ordenado por ⋖. Suponga que sn ⋖ sn+1 para toda n ∈ ω. Pruebe que n < m implica sn ⋖ sm para cualesquier n, m ∈ ω. 25. Sean (a, ⋖) un conjunto linealmente ordenado y p, q ∈ a. Decimos que q es sucesor de p, si p ⋖ q y no existe r ∈ a tal que p ⋖ r ⋖ q. Note que cada p ∈ a tiene a lo sumo un sucesor. Suponga que (a, ⋖) no es vacío y tiene las siguientes propiedades: 114 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 115 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) Todo p ∈ a tiene un sucesor. (b) Todo subconjunto no vacío de a tiene un ⋖-menor elemento. (c) Si p ∈ a no es el ⋖-menor elemento de a, entonces p es el sucesor de algún q ∈ a. Pruebe que (a, ⋖) es isomorfo a (ω, <). Muestre que la conclusión no es necesariamente cierta si omitimos alguna de estas condiciones. 26. Sean (a, ⋖) un conjunto linealmente ordenado y suc(a) el conjunto de todos las sucesiones finitas en a. Defina ≺ en suc(a) mediante ha0 , . . . , am−1 i ≺ hb0 , . . . , bn−1 i 27. 28. 29. 30. 31. 32. 33. 34. si y sólo si existe k < m tal que ai = bi para toda i < k, y ak ⋖ bk o bk no está definida (es decir, k = n < m). Pruebe que ≺ es un orden lineal. Si |a| ≥ 2, ≺ no es un buen orden. Si a = N, ≺ es el orden de Kleene-Brouwer de suc(a); es un orden lineal denso sin elemento menor y como elemento mayor la sucesión vacía. Un conjunto x es Dedekind-infinito si existe una función inyectiva de x sobre uno de sus subconjuntos propios. Un conjunto es Dedekind-finito si no es Dedekind-infinito. (a) Todo conjunto numerable no finito es Dedekind-infinito. (b) Si x contiene un subconjunto infinito numerable, x es Dedekindinfinito. (c) Si x es Dedekind-infinito, contiene un subconjunto numerable. Si un conjunto linealmente ordenado p tiene un subconjunto denso numerable, entonces |p| ≤ 2ℵ0 . Demuestre el lema 13.7. Demuestre el lema 13.8. Demuestre el lema 13.9. El conjunto de todas las funciones discontinuas de R a R tiene cardinalidad ℵ 22 0 . Demuéstrelo. Encuentre una biyección entre R × R y R. Sea Fn el conjunto de todas las funciones de un subconjunto de R en R. Se define la operación lím en Fn como sigue: lím(hfi : i ∈ Ni) = f , donde f (x) = lími− →∞ fi (x) siempre que el límite a la derecha de la igualdad exista, y está indefinida en otro caso. Los elementos de la cerradura del conjunto de todas las funciones continuas respecto a la operación lím se 115 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 116 ✐ ✐ 2. Teoría elemental de conjuntos conocen como funciones de Baire. Muestre que las funciones de Baire no son necesariamente continuas. En particular, muestre que las funciones características de los enteros y racionales son funciones de Baire. 35. Muestre que existen 2ℵ0 relaciones que son buenos órdenes en los números naturales. 36. Muestre que un conjunto x es transitivo si ySsólo si x ⊆ Pot(x), y también que un conjunto x es transitivo si y sólo si x ⊆ x. 37. Pruebe que un ordinal α es un número natural si y sólo si todo subconjunto no vacío de α tiene un elemento máximo. 38. Demuestre que si un conjunto X de ordinales no tiene un elemento más grande, entonces sup X es un ordinal límite. 39. (a) (b) (c) (d) Muestre que todo elemento x ∈ Vω es finito. Si x, y ∈ Vω , entonces {x, y} ∈ Vω . Si x es un subconjunto finito de Vω , entonces x ∈ Vω . Si a ∈ Vω y f es una función en a tal que f (x) ∈ Vω , para todo x ∈ a, entonces f [x] ∈ Vω . 40. Simplifique: (a) (ω + 1) + ω. (b) ω + ω2 . (c) (ω + 1) · ω2 . 41. Sean α, β, ξ ∈ OR, α ≤ β. La ecuación α + ξ = β tiene una única solución. La ecuación ξ + α = β puede tener 0, 1 o una cantidad infinita de soluciones. 42. Encuentre el menor α > ω tal que ξ + α = α, para toda ξ < α. 43. Si α1 , α2 , β ∈ OR y β 6= 0, entonces α1 < α2 si y sólo si β · α1 < β · α2 . Además, β · α1 = β · α2 si y sólo si α1 = α2 . 44. Si (α, <) con α ∈ OR es isomorfo a un conjunto x ⊆ R (con el orden usual heredado de R), entonces α es a lo sumo numerable. 45. Encuentre el menor ordinal ξ tal que: (a) ω + ξ = ξ. (b) ω · ξ = ξ, ξ 6= 0. (c) ωξ = ξ. [Sugerencia: sea ξ0 = 0, ξn+1 = ωξn , ξ = sup{ξn : n ∈ ω}.] 116 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 117 ✐ ✐ Conjuntos y modelos. Curso avanzado 46. Sean α, β ∈ OR. Para f : β − → α, sea s(f ) = {ξ < β : f (ξ) 6= 0}. Sea S(β, α) = {f : f : β − → α ∧ s(f ) es finito}. Defina ⋖ en S(β, α) como sigue: f ⋖g si y sólo si existe ξ0 < β, tales que f (ξ0 ) < g(ξ0 ) y f (ξ) = g(ξ) para toda ξ > ξ0 . Muestre que (S(β, α), ⋖) es isomorfo a (αβ , <). 47. Si x es infinito y bien ordenable, entonces x tiene buenos órdenes no isomorfos. 48. Demuestre que |a| < |a| + H(a) para todo conjunto A. 49. Demuestre el lema 6.6. 50. Demuestre el lema 6.13. 51. Demuestre el lema 6.16. 52. Demuestre el lema 7.7. 53. Demuestre el lema 7.10. 54. Demuestre las siguientes propiedades: (a) |(a × b) × c| = |a × (b × c)|. (b) Si s ⊆ t, entonces |s a| ≤ |t a|; en particular |n a| ≤ |m a| si n ≤ m. [Sugerencia: Considere las funciones que tienen un valor constante fijo en t \ s.] (c) |t| ≤ |t s| si |s| ≥ 2. [Sugerencia: tome u, v ∈ s y para cada r ∈ t, considere fr : t − → s tal que fr (r) = u y fr (x) = v en otro caso.] 55. En este ejercicio se obtiene una prueba alternativa del teorema de CantorBernstein-Schröder 11.3. Sean a un conjunto y F una función de Pot(a) en Pot(a). Un conjunto x ⊆ a es un punto fijo de F si F (a) = a. La función F es monótona si x ⊆ y implica F (x) ⊆ F (y). (a) Sea F : Pot(a) − → Pot(a) monótona. Entonces F tiene un punto fijo. [Sugerencia: Sea T = {x ⊆ a : F (x) ⊆ x}. Pruebe que T 6= ∅. Sea x = ∩T . Demuestre que x ∈ T, F (x) ∈ T . Concluya que F (x) ⊆ x es imposible.] (b) Dé una prueba del teorema 11.3. [Sugerencia: Sea F : Pot(c) − → Pot(c) definida como F (x) = (c − b) ∪ f [x], donde f es una biyección entre a y c. Muestre que F es monótona. Sea C un punto fijo de F , es decir, C = (c − b) ∪ f [C], y sea D = c − C. Defina g como 117 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 118 ✐ ✐ 2. Teoría elemental de conjuntos g(x) = 56. 57. 58. 59. 60. 61. ( f (x), x, si x ∈ C, si x ∈ D. Muestre que g es una biyección entre c y b.] (c) Pruebe que x es el menor punto fijo de F ; es decir, si F (x) = x para alguna x ⊆ a, entonces x ⊆ x. Sin usar AE pruebe que si un conjunto a puede ser linealmente ordenado, entonces toda familia de subconjuntos finitos de a tiene una función de elección. Sin usar AE muestre que si un conjunto a se puede bien ordenar, entonces Pot(a) se puede ordenar linealmente. Una familia de conjuntos a tiene carácter finito si: x ∈ a si y sólo si todo subconjunto finito de x pertenece a a. Pruebe que el lema de Zorn es equivalente al siguiente principio (lema de Tukey): toda familia de conjuntos de carácter finito tiene un elemento ⊆-maximal. Muestre que si todo conjunto es equipotente a un ordinal, entonces es cierto el axioma de elección. Pruebe que si para cualesquier conjuntos a, b se cumple |a| ≤ |b| o |b| ≤ |a|, entonces es cierto el axioma de elección. Recuerde que una fórmula Φ del LTC es bien fundada si: ∀ x[∃ v(x 6= ∅ ⇒ v ∈ x ∧ ∀ z ∈ x¬Φ(z, v)) ∧ ∃ u(x ⊆ u ∧ ∀ w, y(y ∈ u ∧ Φ(w, y) ⇒ w ∈ u))]. Suponga que Φ(x, y) es una fórmula de LTC bien fundada. Muestre que se puede definir una función rango general ρ Φ que satisface: ρ Φ (x) = y [ {ρ Φ (y) + 1 : Φ(x, y)}, (i) ρ Φ (x) es un ordinal para cada x. (ii) Φ(x, y) ⇒ ρ Φ (x) < ρ Φ (y). Muestre que si existe una función ρ Φ que satisface (i) y (ii), entonces se cumple ∀ x[∃ v(x 6= ∅ ⇒ v ∈ x ∧ ∀ z ∈ x¬Φ(z, v))]. 62. Recuerde que una relación R es asimétrica en un conjunto x si para cualesquier conjuntos u, v ∈ x, ¬(uRv ∧ vRu). 118 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 119 ✐ ✐ Conjuntos y modelos. Curso avanzado Sea ZF1 la teoría que consiste en los axiomas Ext, Fund, Sub, Ex, Par, Pot, Unión; mientras que ZF2 es ZF1 junto con Reemp. Muestre que usando los axiomas de ZF1 podemos probar que si R bien ordena x, entonces R es transitiva y asimétrica en x. 63. Con la notación del ejercicio 62, defina Def E(x) = {(y, z) : y, z, ∈ x ∧ y ∈ z}. Muestre que en ZF1 podemos probar que si x es un ordinal, entonces E(x) bien ordena x y que si R está bien fundada en z, entonces la fórmula (x, y ∈ z ∧ xRy) está bien fundada. 64. Sea F (x, y) una fórmula. Muestre que existe un Vβ , para β arbitrariamente grande, que es cerrado respecto a F (vista como función); es decir, en ZF podemos probar que ∀ α∃ β[β ≥ α ∧ ∀ x ∈ Vβ (F [x] ∈ Vβ )]. (*) Use (*) para mostrar en ZF que para cualquier fórmula χ(x, z), ∀ x ∈ y∃ zχ(x, z) ⇔ ∃ u∀ x ∈ y∃ z ∈ uχ(x, z). 65. Pruebe el principio del buen orden sin usar Reemp, es decir, dentro de la teoría ZF1 con el AE . [Sugerencia: Suponga que z es el conjunto dado y f una función de elección para Pot(z). Defina el conjunto Γ de todos los buenos órdenes (x, R) tales que: (i) x ⊆ Z, R ⊆ (x × x) y R bien ordena x. (ii) Para toda w ∈ x, w = f (z \ xw ), donde xw es el segmento inicial en w respecto al orden R. Muestre que para cualesquier dos miembros de Γ, uno es un segmento inicial del otro (o son iguales). (Primero muestre, sin usar Reemp, que para cualesquier dos buenos órdenes, uno es isomorfo a un segmento inicial del otro o a la totalidad del otro). Γ ⊆ (Pot(z) × Pot(z × z)), por lo que Γ es un conjunto sin usar Reemp. Ahora, sea (Y, s) la unión de Γ, es decir, Y= [ {x : ∃ R((x, R) ∈ Γ}, s= [ {R : ∃ x((x, R) ∈ Γ)}. Muestre que s bien ordena Y y que (Y, s) ∈ Γ; obtenga una contradicción de la suposición Y 6= x.] 119 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 120 ✐ ✐ 2. Teoría elemental de conjuntos 66. Demuestre el lema de Zorn en ZF1 + AE . [Sugerencia: Use la idea del ejercicio 65, con Γp0 como los buenos órdenes (X, R), tales que (i) X ⊆ P, R bien ordena X y R es < ∩(X × X) (donde (P, <) es el conjunto parcialmente ordenado). (ii) p0 es el primer elemento de X respecto a R, y para p ∈ X, si p 6= p0 , entonces p = f (U(Xp )), donde Xp es el segmento inicial respecto a R, U(Y ) = {p ∈ P : ∀ y ∈ Y (y < p)} es el conjunto de todas las cotas superiores estrictas de Y para Y ⊆ P, y f es una función de elección en Pot(P).] 67. Use el AE para probar que todo orden parcial se puede extender a un orden lineal; es decir, si R es un orden parcial en P, muestre que existe un S ⊆ (P × P) tal que R ⊆ S y S es un orden lineal en P. [Sugerencia: Use alguna forma de principio máximo, por ejemplo el lema de Zorn, para encontrar un orden parcial máximo en P que extienda R.] 68. Use el axioma de elección para mostrar que todo orden lineal (x, <) tiene un subconjunto cofinal y que está bien ordenado por <. 69. El axioma de elecciones dependientes es ∀ x∃ y(xRy) ⇒ ∀ x∃ f [Fun(f ) ∧ dom(f ) = ω ∧ f (0) = x ∧ ∀ n < ω(f (n)Rf (n + 1))], es decir, si la relación R no tiene elementos máximos, entonces comenzando con cualquier elemento existe una sucesión infinita con sus miembros en la relación R. Pruebe este axioma partiendo del AE . 70. Demuestre el lema 11.6. [Sugerencia: Use inducción sobre n.] 71. Demuestre el lema 13.5. 72. Demuestre el lema 13.11. 73. Demuestre el corolario 14.17. 74. Demuestre el lema 14.2. [Sugerencias: (a) y (b), por inducción sobre β. Para (c) considere 1 + ω y ω + 1; (d) por inducción sobre γ; para (e), 0 < 1, pero 0 + ω = ω = 1 + ω; (f) primero pruebe que no existe β con α < β < α + 1. A continuación muestre que siempre ocurre α ≤ β ⇒ α + 1 ≤ β + 1. 120 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 121 ✐ ✐ Conjuntos y modelos. Curso avanzado Concluya el resultado por inducción sobre γ. (g) la unicidad se sigue de (d); para la existencia considere el menor γ con β ≤ α + γ. (h) Use la caracterización dada en 7.14(a); (i) inducción sobre γ.] 75. Demuestre el lema 14.4. [Sugerencia: (a) y (b) por inducción sobre β; (c) observe primero que para todo n ∈ ω, es cierto que nω = sup{nm : m < ω} = ω. Muestre que 2ω = ω, pero que ω2 = ω(1 + 1) = ω1 + ω = ω + ω > ω. (d) Por inducción sobre γ; (e) observe que 0 < ω y 1 < 2, pero 1ω = ω = 2ω. (f) Por inducción sobre γ. (g) Utilice la caracterización de ordinales límite dada en el lema 7.14(a). (h) Inducción sobre γ; (i) (1 + 1)ω = 2ω = ω, pero 1ω + 1ω = ω + ω. (j) Si 0 < α, β, entonces 1 ≤ α, β, por lo que se deduce 0 < 1·1 ≤ αβ; (k) inducción sobre γ. (l) Existencia: sea γ el menor ordinal tal que α ≤ βγ. Unicidad, suponga βγ1 + ρ1 = βγ2 + ρ2 con ρ1 , ρ2 < β. Sin pérdida de generalidad γ1 < γ2 , entonces de βγ1 < βγ1 + β deduzca βγ1 + ρ1 < βγ2 + ρ2 .] 76. Demuestre el lema 14.7. [Sugerencias: (a) y (b) por inducción sobre β; (c) sea 1 < α y muestre que β < γ ⇒ αβ < αγ por inducción sobre γ. (d) Pruebe que para 1 < n es cierto que nω = sup{nm : m < ω} = ω y, por lo tanto, 2ω = ω = 3ω . (e) Demuestre que α ≤ β ⇒ αγ ≤ βγ por inducción sobre γ. (f) Utilice la caracterización dada en el lema 7.14. (g) Por inducción sobre γ; (h) por inducción sobre γ; (i) por inducción sobre β.] 77. Demuestre el lema 17.1. 78. Demuestre el lema 17.2. 79. Demuestre el lema 17.3. 80. Demuestre el lema 17.5. 81. Sea (X, <) un conjunto linealmente ordenado. La topología del orden en X es la topología que se genera al considerar como sub-base todos los conjuntos de la forma {x ∈ X : x < a} y {x ∈ X :> a}, para a en X. (a) Demuestre que la topología del orden en X es la topología más pequeña con la propiedad de que para cualesquier a, b ∈ X, si a < b, existen 121 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 122 ✐ ✐ 2. Teoría elemental de conjuntos (b) (c) (d) (e) vecindades U de a y V de b tales que U < V ; es decir, x < y siempre que x ∈ U, y ∈ V . Pruebe que si X es conexo respecto a la topología del orden, entonces X es completo como conjunto linealmente ordenado; es decir, todo subconjunto no vacío con cota superior tiene supremo. En el conjunto linealmente ordenado ω1 , sea α ∈ ω1 . Demuestre que {α} es aislado si y sólo si α es sucesor. Pruebe que ω y ω1 son espacios Hausdorff. Sea λ un cardinal con la topología del orden. Muestre que una función f :λ− → λ es continua en α, en el sentido de la definición de la página 109, si y sólo si es continua respecto a la topología del orden. 82. Demuestre que el esquema de recursión para ordinales se deduce del teorema 8.10. 83. Demuestre que si ℵα es un cardinal límite no numerable, entonces cf (ωα ) = cf (α) y ωα es el supremo de una sucesión cofinal hωξ : ξ < cf (αi de cardinales. 84. Demuestre que toda relación bien fundada R en un término clase A es transitiva. 85. Demuestre la siguiente variante del teorema de recursión para relaciones bien fundadas. Sea R una relación bien fundada sobre el término clase A y G : V − → V . Entonces existe una única función F : A − → V tal que ∀ x ∈ A(F (x) = G(F ↾ {z : zRx})). 86. Verifique que la relación 13 es un buen orden fuerte en OR × OR. 87. Demuestre que para cada ordinal β existe un ordinal α mayor que β tal que Ξ[α × α] = α (función definida en la página 111). También demuestre que Ξ es una función normal. 88. Mediante el teorema de inducción en ω, defina una función que “cuente” el número de paréntesis en una fórmula ϕ de LTC, por inducción sobre la construcción de ϕ. Note que el número de paréntesis en la fórmula (ϕ1 ⊙ϕ2 ) es 2, más el número de paréntesis en ϕ1 , más el número de paréntesis en ϕ2 . 122 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 123 ✐ ✐ Conjuntos y modelos. Curso avanzado 89. ¿Qué hace la función f , donde f tiene las siguientes propiedades? (ϕ, ϕ1 , ϕ2 son LTC-fórmulas) f (ϕ1 ⊙ ϕ2 ) = f (ϕ1 ) + f (γ) para ⊙ ∈ {∧, ∨, ⇒ , ⇔, ¬}. f (¬ϕ) = f (ϕ) f (vn ) = 1 para n ∈ ω. 90. ¿Cuál es el significado de las siguientes dos funciones (F, G)? (ϕ1 , ϕ2 , ϕ son LTC-fórmulas y ⊙ ∈ {∧, ∨, ⇒ , ⇔, ¬}) (a) F (vn ) = 0 F ((ϕ1 ⊙ ϕ2 )) = F (ϕ1 ) + F (ϕ2 ) + 1 F ((¬ϕ)) = F (ϕ) + 1. (b) G(vn ) = 1 G((¬ϕ)) = G(ϕ) + 3 G((ϕ1 ⊙ ϕ2 )) = G(ϕ1 ) + G(ϕ2 ) + 3. 91. Demuestre que el enunciado del axioma de elección que se presenta en la página 36 es equivalente al enunciado del axioma de elección en el teorema 12.1. 92. Muestre que (A, B), donde A = {x ∈ Q : x ≤ 0 ∨ (x > 0 ∧ x2 < 2)}, B = {x ∈ Q : x > 0 ∧ x2 > 0}, es un hueco en (Q, <). 93. Sea 0.a1 a2 a3 · · · infinita pero no periódica. Sea A = {x ∈ Q : x ≤ 0.a1 a2 a3 · · · ak para alguna k ∈ N+ }, y B = {x ∈ Q : x ≥ 0.a1 a2 a3 · · · ak para toda k ∈ N+ }. Muestre que (A, B) es un hueco en (Q, <). 94. Muestre que un conjunto linealmente ordenado denso (P, <) es completo si y sólo si todo subconjunto S ⊆ P acotado por abajo tiene ínfimo. 123 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 124 ✐ ✐ 2. Teoría elemental de conjuntos 95. Sea F el conjunto de todos los números racionales que tienen expansión decimal con sólo una cantidad finita de dígitos distintos de cero. Muestre que F es denso en Q. 96. Sea D el conjunto de todos los números m/2n (los racionales diádicos) con m ∈ Z y n ∈ N. Muestre que D es denso en Q. 124 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 125 ✐ ✐ CAPÍTULO 3 Cardinales 125 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 126 ✐ ✐ 3. Cardinales En este capítulo presentamos resultados y construcciones que dependen en gran medida del concepto de cardinal y que se utilizarán en numerosas ocasiones a lo largo de este libro. Se estudian nociones sobre cardinales y otras propiedades combinatorias de conjuntos. Debe tenerse en cuenta que son resultados muy técnicos y que requieren gran habilidad por parte del lector en el manejo de conceptos como cofinalidad, exponenciación cardinal, hipótesis del continuo, etc. Al final del capítulo aparecen algunos resultados sobre aritmética cardinal obtenidos recientemente mediante una nueva técnica llamada pcf (posibles cofinalidades). Esto es ilustrativo de que la aritmética cardinal, lejos de ser un campo cerrado y gris, ha generado nuevas ideas y abierto varias líneas de investigación. El origen y desarrollo de los resultados de este capítulo se remontan a los orígenes de la teoría de conjuntos; muchos de ellos son de principios del siglo xx y se deben en gran medida a G. Cantor, A. Tarski, F. Hausdorff y F. Bernstein. Iniciamos con un estudio más cuidadoso de los álef, para continuar con el concepto de suma débil. Después aparecen los números beth y los cardinales inaccesibles, para terminar con propiedades de cubierta de conjuntos. 1. Los álef En esta sección estudiamos varias propiedades de los álef (sumas, exponenciación, fórmulas recursivas, etc.). Comencemos con sumas de álef. Teorema 1.1. Para todo ordinal α se cumple X ξ≤α ℵ ξ = ℵα . (14) Demostración. Puesto que para ξ ≤ α, ℵξ ≤ ℵα y entonces |α| ≤ ℵα , X ξ≤α ℵξ ≤ ℵα · ℵα = ℵα , lo que implica el teorema, pues se verifica fácilmente que ℵα ≤ X ξ≤α ℵξ . 126 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 127 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 1.2. Si el ordinal α es sucesor, digamos α = β + 1, entonces X ξ<α ℵ ξ = ℵβ . (15) Por otra parte, si α es límite mayor que cero, X ξ<α ℵ ξ = ℵα . (16) Demostración. Sea α = β + 1. Entonces X ξ<α ℵξ = X ξ≤β ℵξ = ℵβ . Suponga que α es límite; entonces ℵα = | sup{ℵξ : ξ < α}| = | [ ξ<α ℵξ | ≤ X ξ<α ℵξ , lo que implica 16, pues por 14 X ξ<α ℵξ ≤ ℵα . En forma similar se demuestra el siguiente teorema: Teorema 1.3. Sean α límite, ϕ : α − → OR una función creciente y λ = ϕ(ξ). Entonces ξ<α S X ξ<α ℵϕ(ξ) = ℵλ . Demostración. Ejercicio. A continuación presentamos una serie de fórmulas de recursión para el cálculo de potencias de álef. Teorema 1.4 (Fórmula de recursión de Hausdorff). ℵ ℵ β ℵα+1 = ℵαβ · ℵα+1 . (17) 127 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 128 ✐ ✐ 3. Cardinales Demostración. Tenemos 2 casos. Caso 1. α + 1 ≤ β. Entonces ℵ ℵ β ℵα+1 = 2 ℵ β = ℵα β . Por otro lado, como (18) ℵα+1 ≤ ℵβ < 2ℵβ , también tenemos ℵ ℵαβ · ℵα+1 = 2ℵβ · ℵα+1 ≤ 2ℵβ · 2ℵβ = 2ℵβ +ℵβ = 2ℵβ . (19) De 18 y 19 deducimos que ℵ ℵ ℵ ℵ β β , ℵα+1 = 2ℵβ = ℵαβ ≤ ℵαβ · ℵα+1 ≤ 2ℵβ = ℵα+1 lo que implica 17. Caso 2. β < α + 1. En esta situación, ℵ ℵ ℵ β β ℵαβ ≤ ℵα+1 y ℵα+1 ≤ ℵα+1 , ℵ (20) ℵ β de donde ℵαβ · ℵα+1 ≤ ℵα+1 . Falta demostrar la desigualdad inversa. Para este fin considere el conjunto ωβ . Mostraremos que ωα+1 ω β ωα+1 ⊆ [ ξ ωβ . (21) ξ<ωα+1 Esto sucede porque si ϕ es una función de ωβ < ωα+1 en ωα+1 , su rango no es cofinal en ωα+1 pues ωα+1 es regular. Así que existe un ordinal ξ < ωα+1 que contiene todos los elementos del rango de ϕ; por lo tanto, ϕ ∈ ξ ωβ . ℵ Como |ξ| ≤ ℵα para ξ < ωα+1 , se sigue que |ξ ωβ | ≤ ℵαβ . Por consiguiente, de 21 ℵ ω β β ℵα+1 = |ωα+1 |≤ [ ξ<ωα+1 ξ ωβ ≤ X ξ<ωα+1 ℵ |ξ ωβ | ≤ ℵαβ · ℵα+1 . La siguiente fórmula permite expresar la potencia de un cardinal en términos de sumas. 128 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 129 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 1.5 (Fórmula de recursión de Tarski). Sean α y β cardinales con α límite, β > 0 y ξ un ordinal límite tal que β < cf (ξ). Sea {αη : η < ξ} un P conjunto de cardinales tales que η<ξ αη = α y para ζ < η < ξ, αζ < αη αη < α para η < ξ. Entonces αβ = X αηβ . η<ξ Demostración. Note que sup{αη : η < ξ} = α, ya que si hubiese un γ < α con αη < γ para η < ξ, entonces ξ ≤ γ y X η<ξ αη ≤ γ · |ξ| < α. Sea f ∈ αβ , entonces f (ζ) < α pues ζ < β; existen ordinales η(ζ) < ξ tales que f (ζ) < αη(ζ) para ζ < β. Hagamos η = supζ<β η(ζ). Entonces η < ξ porque β < cf (ξ), y de aquí f ∈ αηβ . P S Se sigue que αβ ⊆ η<ξ αηβ , así que αβ ≤ η<ξ αηβ . Para la desigualdad recíproca note que ξ ≤ α. Por lo tanto, X η<ξ αηβ ≤ αβ · |ξ| = αβ . Corolario 1.6. Si ϕ es una función creciente de α en OR, λ = β < cf (α); entonces X ℵβ ℵ ℵλ β = ℵϕ(ξ) . S ξ<α ϕ(ξ) y ξ<α Demostración. Ejercicio. Una simple generalización de la fórmula de recursión de Hausdorff (uno de cuyos casos particulares es la fórmula de Bernstein) es la siguiente. Teorema 1.7 (Fórmula generalizada de Hausdorff). Para toda n < ω es cierta la siguiente igualdad: ℵ ℵ β = ℵαβ · ℵα+n . ℵα+n (22) 129 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 130 ✐ ✐ 3. Cardinales Demostración. Para n = 1, la ecuación 22 es la fórmula de recursión de Hausdorff. Ahora suponga que 22 es válida para un cierto n. Reemplazamos α por α + n en 17, para obtener ℵ ℵ β β · ℵα+n+1 . ℵα+n+1 = ℵα+n Así que por la hipótesis de inducción, ℵ ℵ ℵ β ℵα+n+1 = ℵαβ · ℵα+n · ℵα+n+1 = ℵαβ · ℵα+n+1 . Si hacemos α = 0 en 22, obtenemos la fórmula de Bernstein: Corolario 1.8 (Fórmula de Bernstein). Para n < ω se cumple ℵ ℵn β = 2ℵβ · ℵn . (23) Teorema 1.9. Si α ≥ β la siguiente fórmula es válida X ℵ β = ℵα+1 µ<ωα+1 |µ|ℵβ α ≥ β. Demostración. Para cada sucesión {ση : η < ωβ } de ordinales menores que ωα+1 , existe un ordinal µ < ωα+1 tal que ση < µ para toda η < ωβ , así que [ ωβ ωα+1 = µωβ . µ<ωα+1 Por lo tanto, ℵ β ℵα+1 ≤ Además, X µ<ωα+1 X β<ωα+1 |µ|ℵβ . ℵ +1 ℵ ℵ β β β |µ|ℵβ ≤ ℵα+1 · ℵα+1 = ℵα+1 = ℵα+1 . La siguiente fórmula extiende en cierta medida la fórmula de recursión de Hausdorff: Teorema 1.10. Si |γ| ≤ ℵβ , entonces ℵ ℵ |γ| β ℵα+γ = ℵαβ · ℵα+γ . (24) 130 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 131 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Procedemos por inducción sobre γ: para γ = 0, ℵ0α = 1 y 24 es válida. Supongamos que 24 es válida para |γ| ≤ ℵβ ; entonces, con ayuda del teorema 1.4, obtenemos ℵ ℵ ℵ |γ| β β ℵα+γ+1 = ℵα+γ · ℵα+γ+1 = ℵαβ · ℵα+γ · ℵα+γ+1 ℵ ℵ |γ+1| |γ+1| = ℵαβ · ℵα+γ · ℵα+γ+1 = ℵαβ · ℵα+γ+1 . (25) Así que 24 es válida para γ + 1. Si λ es límite y 24 es válida para todo γ < λ, entonces |λ| ≤ ℵβ ; por lo tanto, X Y ℵα+λ = ℵα+γ < ℵα+γ ; γ<λ γ<λ entonces ℵβ ℵα+λ  ≤ Y γ<λ Y = γ<λ ℵ β ℵα+γ   ℵβ |λ| Y  = ℵα ≤  ℵ β ℵα+γ = · γ<λ Y γ<λ ℵ |γ| ℵαβ · ℵα+γ  |γ| ℵα+γ ℵ ·λ |λ|·λ ℵαβ ℵα+λ ℵ |λ| = ℵαβ · ℵα+λ . Por otro lado, ℵ ℵ |λ| ℵ ℵ β β β = ℵα+λ . · ℵα+λ ℵαβ · ℵα+λ ≤ ℵα+λ Lo que termina la demostración. Corolario 1.11. Si |α| ≤ ℵβ , ℵ ℵαβ = 2ℵβ · ℵ|α| α . Demostración. En 24 sustituimos γ por α y α por 0, para obtener ℵ ℵ ℵβ · ℵ|α| ℵαβ = ℵ0 β · ℵ|α| α . α =2 131 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 132 ✐ ✐ 3. Cardinales Corolario 1.12. Si ω ≤ α < ω1 y β es arbitrario, ℵ ℵαβ = 2ℵβ · ℵℵα0 . Demostración. Inmediata del teorema de Bernstein 1.8 y del hecho de que |α| = ℵ0 , |α| ≤ ℵβ . ℵ Sabemos que ℵαβ es una cardinal para cualesquier ordinales α, β. Lo que pocas veces podemos contestar es si ℵα es una potencia de ℵβ . Los siguientes resultados ofrecen respuestas parciales a este problema. Teorema 1.13. Si γ < β < α y ℵα no es una potencia de ℵβ , entonces ℵα no es una potencia de ℵγ . Demostración. Si ℵα = ℵηγ , para η como un cardinal, se cumpliría ℵηγ ≤ ℵηβ ≤ ℵηα = (ℵηγ )η = ℵηγ . Por lo tanto, ℵηβ = ℵηγ = ℵα . Esto contradice la hipótesis. Teorema 1.14. Si σ ≥ cf (α), entonces ℵα 6= µℵσ para todo cardinal µ. Demostración. Si α es sucesor > 0, entonces cf (α) = α, así que 2ℵσ > ℵσ ≥ ℵα , por lo que µℵσ > ℵα , pues µ ≥ 2. Si α es límite, existe una sucesión creciente {αξ : ξ < ωcf (α) } con α límite, y ℵα = X ξ<ωcf (α) por lo que, |ω | ℵαξ , ℵ ℵα < ℵα cf (α) = ℵαcf (α) ≤ ℵℵασ . Si ocurriese ℵα = µℵσ , se cumpliría 2 ℵℵασ = µℵσ = µℵσ = ℵα , lo que es una contradicción. Corolario 1.15. Si σ ≥ cf (α), entonces ℵℵασ > ℵα . Demostración. Ejercicio. 132 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 133 ✐ ✐ Conjuntos y modelos. Curso avanzado Del teorema 1.14 se sigue, en particular, que para ningún cardinal µ y para ningún ordinal β ocurren las igualdades ℵω = µ ℵ β , ℵωω = µℵβ , ℵα = µ ℵ β . También se sigue del teorema que si ℵωn = µℵβ , entonces β sólo puede ser 0, 1, . . . , n − 1. De hecho, cf (ωn ) = ωn y entonces para β ≥ n la ecuación ℵωn = µℵβ no tiene lugar. Teorema 1.16. Para que se cumpla 2ℵα = ℵβ es necesario y suficiente que β α sea el menor ordinal ξ con la propiedad ℵℵξ α < ℵℵξ+1 . Demostración. Supongamos que 2ℵα = ℵβ ; entonces α ; ℵℵβα = (2ℵα )ℵα = 2ℵα = ℵβ < ℵβ+1 ≤ ℵℵβ+1 si γ < β, se cumple que α 2ℵα ≤ ℵℵγ α ≤ ℵℵγ+1 ≤ ℵℵβα = 2ℵα , y α ℵℵγ α = ℵℵγ+1 . 2 ℵα α , así que Ahora supongamos que β es el menor ordinal ξ con ℵξ < ℵℵξ+1 ℵ α ≮ ℵβ pues en otro caso se tendría 2 = ℵγ para algún γ < β, por lo que α , ℵℵγ α = (2ℵα )ℵα = 2ℵα = ℵγ < ℵℵγ+1 una contradicción. Por lo tanto, si 2 < ℵβ ≤ 2ℵα , obtenemos y por lo que 2ℵα = ℵβ . α , (2ℵα )ℵα = 2ℵα ≤ ℵℵβα < ℵℵβ+1 ℵβ+1 > 2ℵα Teorema 1.17. Para que se cumpla 2ℵα = ℵβ es necesario y suficiente que β sea el menor ordinal ξ con ℵℵξ α = ℵξ . 133 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 134 ✐ ✐ 3. Cardinales Demostración. Si 2ℵα = ℵβ , ℵℵβα = (2ℵα )ℵα = 2ℵα = ℵβ . Si γ < β, entonces ℵγ < 2ℵα ≤ ℵℵγ α . Por otra parte, si β es el menor ordinal ξ con ℵℵξ α = ℵξ , no ocurre 2ℵα < ℵβ , pues si así fuera tendríamos 2ℵα = ℵγ , γ < β y ℵℵγ α = ℵγ (por el teorema 1.16), una contradicción. Entonces, si 2 < ℵβ ≤ 2ℵα , 2ℵα ≤ ℵℵβα = ℵβ ≤ (2ℵα )ℵα = 2ℵα . Por consiguiente, ℵβ = 2ℵα . ℵ Teorema 1.18. Sea α un ordinal límite. Si β < cf (α), ℵαβ = P ξ<α ℵ ℵξ β . Demostración. Sea Eξ el conjunto de todas las ωβ -sucesiones en ωξ . Entonces ℵ (1) Eξ , (2) |Eξ | = ℵξ β . Claramente Eα ⊆ [ ξ<α y sea hση : η < ωβ i una sucesión en Eα . La condición β < cf (α) = cf (ωα ) implica que existe un ordinal ωξ que satisface ωξ < ωα , ση < ωξ para η < ωβ . Así que la sucesión hση : η < ωβ i pertenece a Eξ (ξ < α). De (1) y (2) concluimos ℵ ℵα β ≤ X ξ<α ℵ (3) ℵξ β . La desigualdad inversa es evidente: X ξ<α ℵ ℵ ℵ ℵ ℵξ β ≤ ℵαβ · |α| ≤ ℵαβ · ℵα = ℵαβ . (4) 134 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 135 ✐ ✐ Conjuntos y modelos. Curso avanzado De (3) y (4) ℵ ℵα β = X ℵ ℵξ β . ξ<α 2. Sumas débiles En lo sucesivo utilizaremos las letras ρ, κ, λ, µ, η, β y σ para representar cardinales. Definición 2.1. Si µ, η y ρ son cardinales, definimos η Def µ⌣ = X µρ . ρ<η La suma se efectúa sólo sobre los cardinales ρ menores que η, no sobre todos los ordinales, así que el resultado es un cardinal. A continuación presentamos una serie de resultados que destacan las principales propiedades de las sumas débiles. Lema 2.2. µ η µ (a) Si µ ≤ η, κ⌣ ≤ κ⌣ = κ⌣ + λ λ (b) Si µ ≤ η, µ⌣ ≤ η⌣ . η P µ≤ξ<η κξ . (c) Si η ≥ 2, µ⌣ ≥ µ. λ (d) Si µ ≥ 2, µ⌣ ≥ λ. Demostración. (a), (b) y (c) son consecuencias obvias de la definición de suma débil. (d) El resultado es trivialmente cierto si λ ≤ ℵ0 , por lo que nos concentramos en el caso: λ = ℵβ , con β 6= 0. 135 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 136 ✐ ✐ 3. Cardinales De acuerdo con la definición (además β ≤ ℵβ ), ℵβ λ µ⌣ = µ ⌣ ≥ ≥ ≥ X 2 ℵξ X µ ℵξ ξ<β ξ<β X ξ<β ℵξ+1 = ℵβ . Teorema 2.3. 0 1 µ⌣ = 1. µ⌣ = 0, η Si η ≥ 2, entonces µ⌣ ≥ µ. Además, si µ ≥ ℵ0 y 2 ≤ η ≤ ℵ0 , entonces η µ⌣ = µ. Demostración. La primera parte es trivial. Probaremos la última afirmación: si η es finito, el resultado es inmediato pues µη = µ. Si η = ℵ0 , entonces η X µ⌣ = µn ≤ ℵ0 · µ = µ. n<ℵ0 Teorema 2.4. Supongamos que κ ≥ 2 y que λ ≥ ℵ0 . Entonces λ (a) κ⌣ ≥ λ. λ (b) κ⌣ = P ρ0 ≤ρ<λ κ ρ para toda ρ < λ. Demostración. λ λ (a) Para todo ρ < λ, se cumple κ⌣ ≥ κρ ≥ 2ρ > ρ, por lo que κ⌣ ≥ λ. (b) Sea ρ0 < λ. Entonces λ κ⌣ = X ρ<λ κρ = X ρ<ρ0 κρ + X κρ . ρ0 ≤ρ<λ Como κβ ≤ κρ0 , para toda β < ρ0 , X ρ<ρ0 κρ = ρ · sup{κρ : ρ < ρ0 } ≤ κρ0 . 136 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 137 ✐ ✐ Conjuntos y modelos. Curso avanzado Con esto logramos establecer que λ κ⌣ = X κρ + ρ<ρ0 X κρ = ρ0 ≤ρ<λ Con lo que termina la demostración. X κρ . ρ0 ≤ρ<λ η+ Teorema 2.5. Si µ ≥ 2, µ ⌣ = µη . Si además cf (η) < η, entonces η+ µ ⌣ = µη = µ. Demostración. Para ρ ≤ η, µρ ≤ µη implica que η+ µ ⌣ ≤ µη · η+ = µη . η Para probar la segunda afirmación note que como µ⌣ = µ, µρ = µ para todo ρ < η. Si µη > µ, η sería el menor ordinal con esta propiedad, por lo que, de acuerdo con la definición de la función ς (Definición 2.12 posterior) y con el lema 2.13(b), se tendría cf (η) = η, que es una contradicción. Entonces η η+ µη = µ = µ⌣ = µ ⌣ . λ Teorema 2.6. Si λ > cf (µ), entonces µ⌣ > µ. Demostración. Sabemos que λ > cf (µ) y que λ µ⌣ = X µρ . (26) ρ<λ Tenemos dos casos: Caso 1. λ > µ. Aquí aparece como sumando en 26 µµ = 2µ > µ. Caso 2. λS≤ µ. Existe una sucesión hβξ : ξ < cf (µ)i de cardinales con βξ < µ y ξ<cf (µ) βξ = µ. Entonces en 26 aparece como sumando µµ , pues sup{βξ : ξ < cf (µ), cf (µ) < λ} es µ. El siguiente resultado proporciona alguna información sobre las potencias de cardinales incluyendo una descomposición. Proposición 2.7. P (a) Si 0 < λ < cf (µ), entonces µλ = µ o µλ = κ<µ κλ . P (b) Si µ ≥ ℵ0 , entonces µλ = µ · κ<µ κλ para λ ≤ µ. Demostración. 137 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 138 ✐ ✐ 3. Cardinales (a) Si µλ 6= µ, entonces µλ > µ, además µλ ≥ κλ para toda κ < µ, por lo que X κ<µ κλ ≤ µ λ · µ = µ λ . P Ahora debemos probar la otra desigualdad: µλ ≤ κ<µ κλ . Necesitamos P → κ<µ κλ . Pero esto es muy sencillo: una función inyectiva f : µλ − simplemente note que si f es una función de λ en µ, entonces tenemos una función de λ en κ para alguna κ < µ, pues λ < cf (µ). El lector puede llenar los detalles sin dificultad. (b) µ· X κ<µ κλ ≤ µ · µ · sup{κλ : κ < µ} ≤ µ · µ · µλ = µλ . P Para la otra desigualdad µλ ≤ µ · κ<µ κλ , note que si f es una función de λ en µ, se puede ver como una función en un κ, con κ < µ, o bien sobre µ. Resta observar que µ · λ = µ. Definición 2.8. Un cardinal µ es límite fuerte si para todo λ < µ se cumple 2λ < µ. Teorema 2.9. Sea α un cardinal infinito. Entonces, α α (a) α = α⌣ si y sólo si α = 2⌣ y α es un cardinal regular. α α (b) α = 2⌣ si y sólo si α = α⌣ o α es un cardinal límite fuerte. Por lo tanto, existen cardinales α de cofinalidad arbitrariamente grande con α la propiedad α = 2⌣ . Demostración. α α α α (a) Sea α⌣ = α. Entonces α ≤ 2⌣ ≤ α⌣ = α, por lo que α = 2⌣ . Además, α ≤ cf (α) (pues recordemos que α < αcf (α) ), ya que α > cf (α) α implicaría α⌣ > α. En resumen, α es un cardinal regular. α Recíprocamente, si α = 2⌣ y α es regular, entonces α  α α α ⌣ ≤ 2⌣ ⌣ α = 2⌣ = α. 138 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 139 ✐ ✐ Conjuntos y modelos. Curso avanzado α (b) Si α = α⌣ o α es un cardinal regular límite fuerte, resulta claro que α α α α = 2⌣ . Recíprocamente, sea α = 2⌣ . Si α es regular, entonces α = α⌣ por el inciso (a). Supongamos que α es singular y probemos que α es un cardinal límite fuerte. Si no fuera éste el caso, existiría un cardinal β tal que cf (α) ≤ β < α y α ≤ 2β . Entonces 2β = α y  α < αcf (α) ≤ αβ = 2β β = 2β = α. Nuestro próximo resultado relaciona las sumas débiles con una propiedad de grandes cardinales (véase el Lema 7.9.10): Teorema 2.10. Si µ 6= 2, entonces las siguientes aseveraciones son equivalentes: µ (i) 2⌣ = µ. (ii) No existe λ para la que λ < µ < 2λ . Cada una de las condiciones (i) y (ii) tiene como consecuencia que: λ (iii) Las fórmulas λ > cf (µ) y µ⌣ > µ son equivalentes para cada λ. Demostración. Podemos suponer que µ ≥ ℵ0 , pues de otra forma la demostración sería trivial. La equivalencia de (i) y (ii) se deduce fácilmente de µ la definición de 2⌣ : ⇒ ) Supongamos que µ = P κ<µ 2κ . Si existiera λ con λ < µ < 2λ , µ µ > µ. 2⌣ P entonces 2λ aparecería como sumando en 2⌣ y tendríamos P λ λ ⇐ ) Si 2 ≤ µ para toda λ < µ, entonces λ<µ 2 ≤ λ<µ µ = λ µ · µ = µ. Para la otra desigualdad, como 2 > λ, para toda λ, entonces P λ ≥P 2 λ<µ λ = µ · µ = µ. λ<µ λ Ahora supongamos que (i) es cierto y probemos (iii). Note que µ⌣ ≤ µ para cada λ ≤ cf (µ). Esto se deduce de la proposición 2.7 para λ < cf (µ), y si λ = cf (µ), observe que si κ < cf (µ) ocurre que µκ ⊆ κ × η ⊆ µ × µ, para cierto η < µ; por lo tanto, µκ ≤ µ y como µ cf (µ) ⌣ = X µκ κ<cf (µ) 139 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 140 ✐ ✐ 3. Cardinales λ λ entonces µ⌣ ≤ µ, y por contrapositiva tenemos que si µ⌣ > µ, entonces λ > cf (µ). Al igual que obtuvimos la implicación inversa de 2.6, probemos que son λ equivalentes las fórmulas λ > cf (µ) y µ⌣ > µ, para cada λ. Queremos mostrar que en presencia de (i) (o de (ii)) se cumple λ > cf (µ) µ ⇔ λ µ⌣ > µ. Supongamos que 2⌣ = µ. El cardinal µ no puede ser finito, pues no se cumpliría (i). Entonces µ ≥ ℵ0 . Por el ejercicio 12, se tiene que µ µ λ (2⌣ )⌣ = 2⌣ = µ si λ ≤ cf (µ). En este caso µ µ λ λ µ⌣ ≤ (2⌣ )⌣ = 2⌣ = µ. λ Lo que hemos probado es que si λ ≤ cf (µ), entonces µ⌣ ≤ µ. λ Falta demostrar que si µ⌣ ≤ µ, entonces λ ≤ cf (µ). Pero notemos que si λ λ > cf (µ), siempre µ⌣ > µ, pues sabemos que µ < µcf (µ) y µ < µλ para todo λ ≥ cf (µ). Construimos la contrapositiva λ µ⌣ ≤ µ implica λ ≤ cf (µ), lo que se quería demostrar. Continuamos con las propiedades de las sumas débiles.  α cf (α) Lema 2.11. Si α ≥ ℵ0 y κ ≥ 2, entonces κ⌣ ⌣ α = κ⌣ . Demostración. Es suficiente probar que porque entonces,  α β κ⌣  α = κ⌣ , α cf (α) κ⌣ ⌣ = para β < cf (α), X  β<cf (α) = X β<cf (α) α α β κ⌣ α κ⌣ α = κ⌣ · cf (α) = κ⌣ , 140 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 141 ✐ ✐ Conjuntos y modelos. Curso avanzado α pues α ≤ κ⌣ . α β  Sean β < cf (α) y f ∈ κ⌣ . En consecuencia, α f (ζ) ∈ κ⌣ = X κγ γ<α para ζ < β, y de aquí que exista un γ(ζ) < α tal que f (ζ) ∈ κγ(ζ) para ζ < β. Sea γ = supζ<β γ(ζ). Entonces γ < α, ya que β < cf (α) y tenemos f (ζ) ∈ κγ(ζ) ⊆ κγ . Por lo tanto,  α β κ⌣ ≤ X κγ γ<α β = X α κγ = κ⌣ , γ<α como se requiere, pues la otra desigualdad es inmediata. Los argumentos usados en la demostración del lema 2.11 pueden ser de gran utilidad para los lectores que se encuentren resolviendo los problemas del fin de este capítulo. Del lema se sigue que si κ es un cardinal infinito regular, entonces κ  κ κ κ  κ κ κ 2⌣ ⌣ κ κ = 2 ⌣ = κ⌣ . pues κ⌣ ≤ 2⌣ ⌣ = 2⌣ ≤ κ⌣ . La siguiente definición introduce una función ordinal de utilidad más adelante. Definición 2.12. Sea ς(α) el más pequeño de los ordinales η tales que ℵα < ℵ ℵα η . Las principales propiedades de la función ς se describen a continuación: Lema 2.13. (a) ς(α) ≤ cf (α). (b) cf (ς(α)) = ς(α). (c) Las siguientes condiciones son equivalentes: (1) β < ς(α); ℵ (2) ℵα = ℵαβ ; (3) existe κ tal que ℵα = κℵβ . Demostración. 141 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 142 ✐ ✐ 3. Cardinales P (a) Recuerde el teorema de König y la igualdad ℵα = ξ<ωcf (α) µξ , para 0 < µξ < ℵα . Como µξ < ℵα , para cada ξ < ωcf (α) se cumple ℵα = X µξ < ξ<ωcf (α) Y ξ (b) Expresamos ℵς(α) como una suma: ℵς(α) = ω < ωcf (α) ℵα = ℵα cf (α) . X (1) µξ , ξ<ωcf (ς(α) donde 0 < µξ < ℵς(α) para ξ < ωcf (ς(α) . De (1) concluimos ℵ P ℵας(α) = ℵα ξ<cf (ς(α)) µξ = Y ξ<cf (ς(α)) µ µ ℵα ξ (2) Por la definición de ς(α) deducimos ℵα ξ = ℵα , para ξ < ωcf (ς(α)) , por lo que de (2) ℵ ℵ ℵας(α) = ℵαcf (ς(α)) . (3) El resultado en (3) nos dice algo importante: por la definición ς(α) podemos concluir ℵ (ς(α)) . ℵα < ℵας(α) = ℵcf α ℵ Entonces ℵα < ℵαcf (ς(α)) , así que cf (ς(α)) ≥ ς(α). La otra desigualdad ς(α) ≤ cf (ς(α)) siempre ocurre, por lo que cf (ς(α)) = ς(α). (c) Las condiciones (1) y (2) son equivalentes por definición de ς(α). La equivalencia de (2) y (3) se obtiene de la fórmula (κβ )β = κβ . 3. Los números beth Estrechamente relacionados con los cardinales límite fuerte están los números beth que definimos a continuación. Entre las varias aplicaciones de los números beth se encuentran el cálculo de la cardinalidad de algunos niveles de las jerarquías de von Neumann, Gödel y Jensen, así como el cálculo de ciertas cardinalidades de familias de conjuntos. Ambas aplicaciones se presentan en capítulos posteriores. Definición 3.1. Los números beth se definen recursivamente como sigue: 142 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 143 ✐ ✐ Conjuntos y modelos. Curso avanzado (i) i0 = ω = ℵ0 . (ii) Si ξ es un ordinal, entonces iξ+1 = 2iξ . (iii) Si ξ es un ordinal límite (mayor que cero), entonces iξ = X iη . η<ξ Ahora presentamos las primeras propiedades de los números beth. Note que todo número beth es un cardinal. Lema 3.2. (a) ξ ≤ iξ , para todo ordinal ξ. i (b) Si α ≤ β, entonces iα β = iβ+1 . iβ (c) Si α + 1 > β, iα+1 = iα+1 . Demostración. (a) Por inducción sobre ξ: 0 ≤ ω = i0 . Para ξ límite suponemos β ≤ iβ , para todo ordinal β < ξ; entonces iξ = X β<ξ iβ ≥ [ β = ξ. β<ξ Para ξ = α + 1, iξ = iα+1 = 2iα . Como por hipótesis de inducción α ≤ iα < 2iα , se concluye que α + 1 ≤ 2iα = iξ , lo que termina la demostración de (a). (b) i (c)  iβ+1 = 2iβ ≤ iα β ≤ 2iα iβ = 2iβ = iβ+1 . i β iα+1 = 2iα iβ = 2iα = 2iα+1 . Dada la definición de los números beth, es natural suponer que no son menores que los respectivos álef: Teorema 3.3. Para todo ordinal α se cumple ℵα ≤ iα . (1) 143 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 144 ✐ ✐ 3. Cardinales Demostración. Procedemos por inducción. Por definición, ℵ0 = i0 . Supongamos que (1) es válida para todo ordinal β < α. Si α = γ + 1, entonces ℵα = ℵγ+1 ≤ 2ℵγ ≤ 2iγ = iγ+1 = iα . Si α es límite, por definición de ℵα e hipótesis de inducción logramos la desigualdad deseada: ℵα = [ γ<α ℵγ ≤ X iγ = iα . γ<α Como los números beth son cardinales, para todo ordinal α existe un ordinal π(α) tal que iα = ℵπ(α) . Note que π : OR − → OR es un término clase. La siguiente propiedad es obvia: Lema 3.4. Si α < β entonces π(α) < π(β). Teorema 3.5. La función π es continua. En consecuencia es normal. Demostración. Sea α límite y λ = 1.3 ℵλ = Por lo tanto, λ = π(α). X ξ<α ℵπ(ξ) = S ξ<α X π(ξ). Entonces iξ = iα . ξ<α Corolario 3.6. Si el ordinal α no es límite, entonces cf (α) ≤ π(α). Demostración. Si cf (α) = δ y ϕ es una función creciente de ωδ en OR tal que [ ϕ(ξ), α= ξ<ωδ entonces π(α) = [ π(ϕ(ξ)) = [ ψ(ξ), ξ<ωδ ξ<ωδ donde ψ = π ◦ ϕ es creciente. Por consiguiente, π(α) ≥ ωδ ≥ δ. Teorema 3.7. Si π(γ + 1) no es un ordinal límite, π(γ + 1) > γ; si π(γ + 1) es límite, cf (π(γ + 1)) > γ. 144 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 145 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. La primera parte es obvia ya que π es creciente. Supongamos que π(γ + 1) es límite y que δ = cf (π(γ + 1)). Si fuera cierto que δ ≤ γ, entonces (por el Corolario 1.15) ℵ γ ℵπ(γ+1) < ℵπ(γ+1) sería también cierto, es decir, ℵ γ iγ+1 < iγ+1 = 2iγ ·ℵγ = 2iγ = iγ+1 , lo que es imposible, y en consecuencia δ > γ. El siguiente teorema (y su corolario) proporciona una estimación de la potencia de los números beth. Teorema 3.8. Si α > 0 es límite ℵ iαβ = ( iα , iα+1 , si β < cf (α) si cf (α) ≤ β ≤ π(α). (27) Demostración. Supongamos que β < cf (α). Claramente es suficiente ℵ mostrar que iαβ ≤ ℵα . Pero ℵ β ℵπ(α) = X ξ<α ℵ β ≤ ℵπ(ξ) X ξ<α ℵ β . ℵπ(ξ+1) La última suma se puede descomponer en dos partes, Σ′ y Σ′′ ; en la primera suma, ξ es tal que π(ξ + 1) ≤ β y, en la segunda, es tal que β < π(ξ + 1). ℵ Puesto que ℵαβ = 2ℵβ si α ≤ β, se sigue que la suma Σ′ es igual a 2ℵβ ; y como ℵβ ≤ iβ < icf (α) ≤ iα , tenemos Σ′ ≤ |β| · iα ≤ iβ · iα = iα ; ℵ β = 2iξ ·ℵβ ≤ 2iξ ·iξ+1 = iξ+2 , pues La segunda suma es igual a iξ+1 ℵβ < ℵπ(ξ+1) = iξ+1 . Así que Σ′′ ≤ X ξ<α iξ+2 ≤ iα |α| = iα . Se sigue que ℵ iαβ ≤ iα + iα = iα . 145 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 146 ✐ ✐ 3. Cardinales Ahora supongamos que ϕ es una función creciente de ωcf (α) = γ en OR, con α igual al supremo de los valores de ϕ y con cf (α) ≤ β ≤ π(α). Entonces 2 ℵ iαβ ≤ iℵαπ (α) = iiα α ≤ 2iα = iα+1 . Por otra parte, iα+1 = 2iα = 2ℵπ(α) = 2 y Y 2ℵπ(ϕ(ξ)) = ξ<γ Y ξ<γ P [ ξ<γ ℵπ(ϕ(ξ)) ] , iϕ(ξ+1) ≤ ℵ cf (α) ≤ i|γ| α = iα ℵ ≤ iαβ , lo que demuestra el teorema. Un resultado inmediato del teorema 3.8 es el siguiente corolario: Corolario 3.9. Si α es un ordinal límite, entonces i iα β =    iα , i , α+1   i , β+1 si π(β) < cf (α) si cf (α) ≤ π(β) ≤ π(α) si β ≤ α. (28) Note que si se conociera a la función π con mayor precisión, podríamos mejorar la estimación de las potencias de los números beth. Una conjetura natural es que cf (iξ ) = cf (ξ), como ocurre con los álef; esto es cierto para ξ límite: Teorema 3.10. Si ξ es límite, entonces cf (iξ ) = cf (ξ). 146 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 147 ✐ ✐ Conjuntos y modelos. Curso avanzado P Demostración. Como iξ = η<ξ iη , tenemos cf (iξ ) ≤ cf (ξ) (¿por qué?). Si β < cf (ξ) entonces, de la fórmula de recursión de Tarski 1.5: ℵ iξ β = X ℵ iη β = η<ξ = 2iη η<ξ X  ℵβ 2iη β≤η<ξ X = ℵ β iη+1 = η<ξ X = X = ℵβ = X 2iη = β≤η<ξ iη+1 . β≤η<ξ ℵ Por el teorema 3.8, iξ β = iξ lo que indica que β ≤ cf (iξ ) para toda β < cf (ξ); en consecuencia, cf (ξ) ≤ cf (iξ ). 4. HGC Si aceptamos la HGC , muchos de los resultados anteriores se simplifican de manera considerable. Por ejemplo, podemos estimar con exactitud el valor de la función π y, en consecuencia, describir con mayor precisión el comportamiento de ciertas potencias de los números beth. Teorema 4.1 (HGC ). (a) π(α) = α, para todo ordinal α. (b) Si α es límite, entonces i iα β = ( iα , iα+1 , para β < cf (α) para cf (α) ≤ β ≤ α. (29) Demostración. (a) Es evidente que π(0) = 0. Si π(α) = α, entonces ℵπ(α+1) = iα+1 por definición y iα+1 = 2iα = 2ℵπ(α) = 2ℵα . Por consiguiente (con la HGC ), ℵπ(α+1) = ℵα+1 , lo que implica que π(α + 1) = α + 1. Finalmente, si λ es límite y si π(α) = α para todo α < λ, entonces ℵπ(λ) = y así π(λ) = λ. X ξ<λ ℵπ(ξ) = X ξ<λ ℵξ = ℵλ , 147 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 148 ✐ ✐ 3. Cardinales (b) Es una consecuencia de (a) y del teorema 3.8. El siguiente teorema describe una operación similar a la de la suma débil, pero para números beth, así como sus principales propiedades. Teorema 4.2 (HGC ). Si Sα,β = X i iα ξ , ξ<β entonces, (i) (ii) (iii) (iv) (v) (vi) Sα,δ+1 = iiα δ . Sγ+1,β = iγ+1 si β < γ + 1 y β es límite. Sγ+1,β = iβ si β > γ + 1 y β es límite. Sα,β = iα si α y β son límites y β < cf (α). Sα,β = iα+1 si α y β son límites y cf (α) < β ≤ α. Sα,β = iβ si α y β son límites y β > α. Demostración. (i) Como |δ| ≤ iδ , tenemos que iiα δ ≤ X ξ<δ+1 i iα ξ ≤ iiα δ · |δ| = iiα δ . (ii) Por definición Sγ+1,β = X 2iγ ·iξ = ξ<β = X 2iγ ξ<β X iγ+1 ξ<β = |β| · iγ+1 = iγ+1 . (iii) De manera similar tenemos Sγ+1,β = iγ+1 + X iξ+1 = iβ . γ+1<ξ<β (iv) Sα,β = X ξ<β i iα ξ = X ξ<β iα = iα · |β| = iα . 148 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 149 ✐ ✐ Conjuntos y modelos. Curso avanzado (v) En forma análoga, X Sα,β = iα + i iα ξ cf (α)≤ξ<β = iα + |β − cf (α) · iα+1 | = iα+1 . (vi) De la fórmula elemental (recuerde que κµ = 2µ si κ ≤ µ), i iα ξ = iξ+1 ; para α < ξ, se sigue que Sα,β ≥ X i iα ξ = α≤ξ<β ξ<β i iα ξ ≤ iξ+1 = iβ . α≤ξ<β Por otra parte, es claro que X X X i iα ξ + ξ<α X i iα ξ α≤ξ<β ≤ |α| · iα+1 + |β| · ≤ iβ . X iξ+1 ξ<β La HGC sólo se utilizó en los incisos (iv) y (v). 5. Cardinales inaccesibles En esta sección estudiamos las primeras propiedades de grandes cardinales, es decir, propiedades que involucran a ciertos cardinales cuya existencia no se puede demostrar en ZFE . La demostración de este hecho se efectúa en un volumen posterior. Definición 5.1. (1) El cardinal µ es débilmente inaccesible si µ 6= 0 y si satisface: [B1] Si X es un conjunto arbitrario de cardinalidad < µ y cada elemento x ∈ X está asociado a un cardinal ηx < µ, entonces X ηx < µ. x∈X [B2] Si η < µ, existe un cardinal ρ tal que η < ρ < µ. Es decir, µ es un cardinal límite regular. 149 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 150 ✐ ✐ 3. Cardinales (2) El cardinal µ es (fuertemente) inaccesible si µ 6= 0 y si satisface [B1], así como la siguiente condición: [B3] Si η < µ y ρ < µ, entonces ηρ < µ. Note que para satisfacer [B3], µ no puede ser finito mayor que 2. Por lo tanto, un cardinal es inaccesible si es límite fuerte y regular. Ahora presentamos una serie de resultados que desarrollan las propiedades de los cardinales recién definidos. El primero de ellos es trivial: Lema 5.2. El cardinal µ satisface [B2] si y sólo si µ = 0 o µ es límite. Lema 5.3. Si el cardinal µ satisface la condición [B4] siguiente, también satisface [B2]. Si µ 6= 2, entonces [B3] y [B4] son equivalentes, donde: [B4] Si ρ < µ, entonces 2ρ < µ. Demostración. Es inmediato que si µ satisface [B4] también satisface [B2]. Probemos la segunda afirmación, para lo cual consideramos un cardinal µ 6= 2. Si µ satisface [B3] o [B4] entonces µ = 0, 1 o µ es infinito. Supongamos que µ satisface [B4] (o [B2]). Si µ = 0, satisface claramente [B3]. Si µ es infinito, deducimos [B3] de [B4] en la siguiente forma: sea η < µ y ρ < µ; como ηρ < µ, teniendo en cuenta [B4] concluimos que 2ηρ < µ; por otro lado, ηρ ≤ (2η )ρ = 2ηρ y se concluye ηρ < µ. Finalmente, [B4] es un caso particular de [B3]. Un resultado inmediato es: Teorema 5.4. Para que µ 6= 2 (respectivamente infinito) sea inaccesible, es necesario y suficiente que µ 6= 0 satisfaga [B1] y [B4]. Teorema 5.5. El cardinal µ es inaccesible si y sólo si µ 6= 0 y si satisface la siguiente condición: [B5] Si X es un conjunto de cardinalidad < µ y cada elemento x ∈ X está asociado a un cardinal ηx < µ, entonces Y ηx < µ. x∈X Demostración. Sea µ inaccesible. Supongamos que a cada elemento x de un conjunto X de cardinalidad |X| = ρ < µ se asocia un cardinal ηx < µ. Por [B1], X ηx < µ x∈X 150 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 151 ✐ ✐ Conjuntos y modelos. Curso avanzado y por [B3], X ηx x∈X Por otro lado, Q Y x∈X !ρ < µ. X ηx ≤ ηx x∈X !ρ , entonces concluimos que x∈X ηx < µ y µ satisface [B5]. Recíprocamente, supongamos que µ 6= 0 satisface [B5]. La condición [B3] es un caso particular de [B5] por la desigualdad de König, X ηx < x∈X Y ηx . x∈X (Excluyendo los casos en que ηx = 1 para toda x ∈ X, o ηx = 0 para alguna x ∈ X, que se resuelven en forma trivial.) Por lo tanto, µ 6= 0 y satisface [B1] y [B3]. Ahora caracterizamos a los cardinales inaccesibles, para lo que necesitamos dos resultados auxiliares. Lema 5.6. Si el cardinal infinito µ satisface [B1], entonces para todo ρ 6= 0 µρ = µ · X ηρ . η<µ Demostración. En general es válido que µ· de donde X ηρ ≤ µ · µρ · µ, µ· X η<µ η<µ ηρ ≤ µρ . (1) Para probar la desigualdad inversa: µρ ≤ µ · X ηρ , (2) η<µ debemos distinguir tres casos: ρ < ℵ0 , ℵ0 ≤ ρ < µ o ρ ≥ µ. Caso 1. Si ρ es finito, (2) es claramente cierto pues µρ = µ. Caso 2. Si ρ es infinito menor que µ, digamos µ = ℵα y ρ = ℵγ , entonces como µ es regular, γ < cf (α) = α. 151 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 152 ✐ ✐ 3. Cardinales Si α es límite: ℵ µ ρ = ℵα γ ≤ X ℵ ℵξ γ ≤ ξ<α X ηρ , ℵ0 ≤η<µ de donde se obtiene (2). Si α = β + 1, usamos la fórmula de recursión de Hausdorff para obtener: ℵ ℵ γ µρ = ℵβ+1 = ℵβγ · ℵβ+1 = µ · ℵρβ , de lo cual se obtiene (2). Caso 3. Si ρ ≥ µ, es bien conocido que µρ = 2ρ , de donde se sigue la desigualdad (2). De las desigualdades (1) y (2) obtenemos el resultado deseado. A continuación presentamos una caracterización de la regularidad. Lema 5.7. Todo cardinal µ que satisface: [B6] Si 0 < ρ < µ, entonces µρ = µ, también satisface [B1]. Demostración. Supongamos que µ satisface [B6]. Sea X un conjunto arbitrario de cardinalidad |X| = ρ < µ, y a cada elemento x ∈ X se asocia un cardinal ηx < µ. Hagamos µx = µ para x ∈ X. Ya que ηx < µx , se sigue que X x∈X y teniendo en cuenta [B6] Y ηx < µx = µρ x∈X X ηx < µ, x∈X por lo que µ satisface [B1]. Supongamos ahora HGC y consideremos un cardinal µ que satisfaga [B1]. Si µ es finito, entonces µ debe ser 0,1 o 2; cada uno de estos números satisface la condición [B6]. Supongamos entonces que µ es infinito y 0 < ρ < µ. Por el lema 5.6 ocurre que µρ = µ · X η<µ ηρ ≤ µ · X η<µ (2η )ρ = µ · X 2η·ρ . (1) η<µ 152 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 153 ✐ ✐ Conjuntos y modelos. Curso avanzado Si η < µ y ρ < µ, entonces ηρ < µ y de la HGC es fácil concluir que µρ ≤ µ · µ · µ ≤ µ. Puesto que µ ≤ µρ es obvio, concluimos que µρ = µ, es decir, se satisface [B6]. Por consiguiente, en presencia de HGC las condiciones [B1] y [B6] son equivalentes. Pero podemos probar que esto es equivalente a HGC . Deducimos HGC de la afirmación: (2) Todo cardinal que satisface [B1] debe satisfacer [B6]. Para este fin, consideremos un ordinal arbitrario α. Dado que ωα+1 es regular, µ = ℵα+1 satisface [B1]. Por la hipótesis (2), ℵα+1 satisface la condición [B6]; para ρ = ℵα obtenemos α ℵℵα+1 = ℵα+1 . Sabemos (Teorema 2.16.11) que esta fórmula es equivalente a 2ℵα = ℵα+1 , lo que demuestra la HGC . Teorema 5.8. El cardinal µ es inaccesible si y sólo si µ 6= 0 y satisface las condiciones [B3] y [B6]. Demostración. Si el cardinal µ es inaccesible, satisface las condiciones [B1] y [B3] por definición. Entonces µ es igual a 2 o infinito. El cardinal µ = 2 satisface la condición [B6]. Si µ es infinito, se obtiene, del lema 5.6, la fórmula: X ηρ . µρ = µ · η<µ Para cada ρ > 0, si ρ < µ, llegamos, con ayuda de [B3], a µρ ≤ µ · µ · µ = µ, y además µρ = µ. El cardinal satisface otra vez [B6]. Si µ 6= 0 satisface [B3] y [B6], obtenemos directamente del lema 5.7 que µ es inaccesible. Introducimos otra condición para inaccesibilidad. Teorema 5.9. Para que el cardinal µ 6= 2 (respectivamente infinito) sea inaccesible, es necesario y suficiente que µ 6= 0 y que satisfaga tanto [B4] como [B6]. Se puede sustituir [B4] por la siguiente afirmación: [B7]: No existe cardinal ρ para el que 2ρ = µ. 153 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 154 ✐ ✐ 3. Cardinales Demostración. Todo cardinal inaccesible 6= 2 satisface [B4] y [B6]. De [B4] se desprende de inmediato [B7] (por la desigualdad ρ < 2ρ ). Ahora supongamos que el cardinal µ 6= 0 satisface [B6] y [B7]. Del lema 5.7, µ satisface también la condición [B1]. De [B7] se obtiene inmediatamente que µ > 2. Si ρ < µ, entonces 2ρ ≤ µρ y, por lo tanto, 2ρ ≤ µ de acuerdo con [B6]. Por [B7] 2ρ 6= µ, entonces 2ρ < µρ y, en consecuencia, 2ρ < µ por [B6] y µ es inaccesible. Enunciamos una condición más para la inaccesibilidad. Teorema 5.10. Para que un cardinal µ 6= 2 (respectivamente infinito) sea inaccesible es necesario y suficiente que µ 6= 0 y que satisfaga la condición [B4] y la siguiente condición: [B8] Si ρ 6= 0, entonces µρ = µ · 2ρ . Demostración. Según el teorema 5.9, todo cardinal inaccesible µ satisface [B4] y [B6]. Si 0 < ρ < µ, obtenemos 2ρ < µ = µρ y, por lo tanto, (1) µρ = µ · 2ρ . Pero si ρ ≥ µ, es conocido que µ ≤ µρ = 2ρ , de donde se obtiene otra vez (1). Así que la fórmula (1) es cierta para todo ρ 6= 0; µ satisface entonces la condición [B8]. Supongamos la afirmación recíproca, el cardinal µ 6= 0 satisface [B4] y [B8]. Para cada número cardinal ρ, 0 < ρ < µ, tenemos 2ρ < µ y ocurre (1); es claro que µ es infinito, así que µρ = µ. Por consiguiente, µ satisface la condición [B6]. En vista del teorema 5.9, µ resulta ser inaccesible. Para finalizar esta sección, queremos hacer notar que un cardinal ℵα regular y límite debe satisfacer [ ℵα = ℵαβ = ℵα . β<α Como ℵα es regular α ≥ ℵα y siempre ocurre α ≤ ℵα . 6. Cubiertas de conjuntos En esta sección estudiamos varias propiedades combinatorias de conjuntos y subconjuntos asociadas con la posibilidad de cubrir un conjunto mediante subconjuntos de menor cardinalidad. Necesitamos algunos resultados combinatorios: 154 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 155 ✐ ✐ Conjuntos y modelos. Curso avanzado Con mucha frecuencia usaremos la siguiente notación: si A es un conjunto y κ un cardinal, [A]κ = {X ⊆ A : |X| = κ} [A]≤κ = {X ⊆ A : |X| ≤ κ} [A]<κ = {X ⊆ A : |X| < κ}. Lema 6.1. Sean λ y κ cardinales: (a) Si ℵ0 + κ ≤ λ, entonces |[λ]κ | = λκ . κ (b) Si ℵ0 + κ ≤ λ+ , entonces |[λ]<κ | = λ⌣ . (c) Si ℵ0 + κ ≤ λ, entonces |{f ∈ λA : A ∈ [λ]κ , f es inyectiva }| = λκ . (d) Si ℵ0 + κ ≤ λ+ , entonces κ |{f ∈ λA : A ∈ [λ]<κ , f es inyectiva}| = λ⌣ . (e) Si 2 ≤ λ, entonces P ξ<κ λ κ |ξ| κ = λ⌣ . (f) 2 ≤ λ, entonces κ ≤ λ⌣ . Demostración. (a) Si A ∈ [λ]κ , existe una biyección fA : κ − → A. Definimos φ : [λ]κ − → λκ mediante la fórmula φ(A) = fA . Claramente φ es inyectiva y, por lo tanto, |[λ]κ | ≤ λκ . Recuerde que una función es un conjunto de parejas ordenadas, es decir, así que λκ ⊆ [κ × λ]κ , λκ ≤ |[κ × λ]κ | = |[λ]κ |. (b) El conjunto [λ]κ es la unión de la familia {[λ]β : β < κ}. Por lo tanto, |[λ]<κ | = por el inciso (a). X β λβ = λ⌣ , β<κ 155 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 156 ✐ ✐ 3. Cardinales (c) Sea E = {f ∈ λA : |A| = κ y f es inyectiva }. Para A ∈ [λ]κ sean EA = {f ∈ λA : f es inyectiva} y eA : A − → λ la inclusión. Entonces para A ∈ [λ]κ y E = S X |E| ≤ |EA | ≤ λκ , {EA : A ∈ [λ]κ }; de aquí que {|EA | : A ∈ [λ]κ } ≤ λκ · λκ = λκ , por la parte (a). Ahora sea φ : [λ]κ − → E, φ(A) = eA . Entonces φ es inyectiva y con el inciso (a) deducimos: |E| ≥ |[λ]κ | = λκ . (d) Se sigue de la parte (c). (e) Para cardinales β obtenemos 1 ≤ |β+ \ β| ≤ β+ ≤ 2β y |ξ| = β, para ξ ∈ β+ \ β. Así X X λ|ξ| = ξ∈β+ \β ξ∈β+ \β λβ = λβ · |β+ \ β| = λβ , por lo que X ξ<κ λ |ξ| = X β<κ (f) De la parte (e) tenemos   κ≤ X λ ξ∈β+ \β X ξ<κ  |ξ|  κ = X κ λβ = λ⌣ . β<κ κ 2|ξ| = 2⌣ ≤ λ⌣ . Nuestro primer resultado proporciona condiciones para la cerradura de ciertas familias de subconjuntos. Usamos las condiciones [B1]–[B7] de la sección 5. Lema 6.2. Sea M un conjunto arbitrario de cardinalidad µ. Para que el cardinal µ 6= 2 satisfaga [B6], es necesario y suficiente que M satisfaga la condición: [C1] M tiene la misma cardinalidad que el conjunto [M]<|M| . 156 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 157 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. El caso trivial µ < ℵ0 no vale la pena considerarlo, pues es obvio que el cardinal finito µ > 2 no satisface [B6] o [C1]. Sea µ ≥ ℵ0 . Es fácil probar que el conjunto [M]<|M| tiene cardinalidad X µρ , ρ<µ por lo que la condición [C1] es equivalente a µ= X µρ . (1) ρ<µ Esta fórmula se deduce directamente de [B6], µ≤ X ρ<µ µρ ≤ µ · µ = µ. También es sencillo obtener la implicación inversa, de manera que las condiciones [B6] y (1) (respectivamente [C1]) son equivalentes. Teorema 6.3. Sea M un conjunto arbitrario de cardinalidad µ. El cardinal µ 6= 2 (respectivamente infinito) es inaccesible si M no es vacío y si satisface [C1] y la siguiente condición: [C2] No existe un conjunto P tal que M tenga la misma cardinalidad que Pot(P). Demostración. El resultado se sigue del teorema 5.9 y del lema 6.2 (en realidad la condición [C2] expresa lo mismo que [B7]). Lema 6.4. Sean α un ordinal y N un conjunto arbitrario de cardinalidad menor que ℵα ; a cada ordinal ξ < ωα está asociado un conjunto Nξ tal que (i) N0 = Pot(N). S (ii) Nξ = {X : X ⊆ η<ξ Nη , |X| < ℵα }, para cada ξ tal que 0 < ξ < ωα . Si además tenemos S (iii) M = ξ<ωα Nξ , entonces ocurre lo siguiente: (I) M satisface la condición [D1] Si X ∈ M y X ⊆ Y , entonces Y ∈ M. (II) Si µ = ℵα satisface [B4], entonces M satisface: [D2] Si X ∈ M, Pot(X) ∈ M. (III) Si µ = ℵα satisface [B6], entonces |M| = ℵα y se satisface: [D3] Si X ⊆ M y |X| < |M|, X ∈ M. 157 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 158 ✐ ✐ 3. Cardinales (IV) Si N = ∅ y ℵα satisface [B6], entonces M satisface: [D4] M = {X : X ⊆ M ∧ |X| < |M|}. Demostración. (I) De (i) y (ii) se obtiene inmediatamente: (1) Si ξ < ωα , X ∈ Nξ y Y ⊆ X, entonces Y ∈ Nξ . Teniendo en cuenta (iii) deducimos que: (2) Si X ∈ M y Y ⊆ X, entonces Y ∈ M; en otras palabras, M satisface [D1]. (II) Se desprende de (i)–(iii) que (3) |X| < ℵα para cada X ∈ Nξ , ξ < ωα , y en general para todo X ∈ M. Supongamos que ℵα satisface [B4]. Si el conjunto X tiene cardinalidad ρ < ℵα , el conjunto potencia de X tiene cardinalidad 2ρ < ℵα . Considerando esto último, obtenemos de (1), (3) y (ii) que: (4) Si ℵα satisface [B4] y ξ < ωα , así como X ∈ Nξ , entonces Pot(X) ⊆ Nξ ⊆ [ Nη , η<ξ+1 |Pot(X)| < ℵα y Pot(X) ∈ Nξ+1 . De (4) y (iii) se obtiene de inmediato: (5) Si ℵα satisface [B4] y X ∈ M, entonces Pot(X) ∈ M. Por lo tanto, el conjunto M satisface [D2]. (III) Primero mostremos que (6) |M| ≥ ℵα . Basándonos en (iii), (6) es cierta si existe un ξ < ωα para el que [ η<ξ Nη ≥ ℵα . Si no existe tal ξ, concluimos de (ii) que Nξ = {X : X ⊆ [ η<ξ Nη }, 158 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 159 ✐ ✐ Conjuntos y modelos. Curso avanzado para cada ξ, 0 < ξ < ωα ; de aquí se obtiene inmediatamente que cada familia Nξ tiene cardinalidad mayor que la de la unión de las familias precedentes, S por lo que se cumple: (7) Nξ \ η<ξ Nη 6= ∅ para cada ξ, 0 < ξ < ωα . Por otra parte, de (iii) seobtiene la fórmula:  S S (8) M = N0 ∪ 0<ξ<ωα Nξ \ η<ξ Nη . Teniendo en cuenta (7) se determina, mediante (8), la descomposición de M en ℵα subfamilias no vacías; por consiguiente, M satisface (6). De (3) y (6) logramos: (9) Si X ∈ M, entonces |X| < |M|. Ahora supongamos que ℵα satisface [B6]. Mediante recursión transfinita mostraremos que: (10) |Nξ | ≤ ℵα , para cada ξ < ωα . Si ξ = 0 y hacemos |N| = ρ, se obtiene de (i) que Nξ tiene cardinalidad 2ρ ; pero como ρ < ℵα , de [B6] llegamos a: |N| = 2ρ ≤ ℵρα ≤ ℵα . Supongamos que 0 < ξ < ωα y que todas las familias Nη , con η < ξ,tiene n cardinalidad ≤ ℵα , entonces [ η<ξ Nη = ν ≤ ℵα · |ξ| ≤ ℵα · ℵα = ℵα . Si ν < ℵα , concluimos de (ii) que Nξ = {X : X ⊆ [ η<ξ Nη } y, por consiguiente, |Nξ | = 2ν , de donde deducimos (como en el caso ξ = 0) la fórmula (10). Pero si ν = ℵα , usamos el lema 6.2 con S µ = ℵα , M = η<ξ Nη , con lo que logramos (otra vez por (ii) y [B6]) que |Nξ | = ℵα . Con esto hemos demostrado (10) para todo ξ < ωα . De (iii) se sigue que |M| ≤ ℵα · ℵα = ℵα ; junto con (6) obtenemos (11) |M| = ℵα . Ahora consideremos una familia arbitraria X ⊆ M de cardinalidad menor que la cardinalidad de |M|. De acuerdo con (iii) y (11) concluimos que S (12) X ⊆ ξ<ωα Nξ y |X| < ℵα . 159 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 160 ✐ ✐ 3. Cardinales Ahora usamos el lema 5.7 para deducir que ℵα satisface [B6]; ωα debe ser regular, es decir, (13) ℵα = ℵcf (α) . De (11) y (12) deducimos que existe un ξ, 0 < ξ < ωα , para el que X⊆ [ Nη ; η<ξ en vista de (1), (ii) y (iii), concluimos que X ∈ Nξ y X ∈ M. (IV) Para probar [D4], consideremos la implicación: (15) Si X ∈ Nξ , X ⊆ M. Si 0 < ξ < ωα , (15) se obtiene directamente de (ii) y (iii). Para ξ = 0 en general (15) no es válido. Pero si N = ∅, de (i) se sabe que N0 contiene al vacío como único elemento; con esta hipótesis, (15) es válido también para ξ = 0 y, por consiguiente, para cada ξ < ωα . Con base en (iii) obtenemos: (16) Si X ∈ M, X ⊆ M. Supongamos que N = ∅ y que ℵα satisface [B6]. Entonces ocurren las afirmaciones (9), (16) y [D3]; estas tres condiciones se pueden reducir a una sola fórmula: M = {X ⊆ M : |X| < |M|}. Por lo tanto, (17) Si N = ∅ y ℵα satisface [B6], entonces M satisface la fórmula [D4]: M = {X ⊆ M : |X| < |M|}. Toca el turno a la búsqueda de relaciones entre las condiciones [D] y [B]. Lema 6.5. Para que el cardinal µ 6= 2 satisfaga [B6], es necesario y suficiente que exista una familia M de cardinalidad µ que satisfaga [D3]. En tal caso, se puede sustituir [D3] por [D4]. Demostración. El caso µ < ℵ0 es sencillo: sólo hay dos cardinales µ 6= 2 que satisfacen [B6], a saber, µ = 0 y µ = 1; existen sólo dos familias finitas que satisfacen [D3] (respectivamente [D4]): el conjunto vacío y la familia que contiene como único elemento al conjunto vacío. Sea µ ≥ ℵ0 y µ = ℵα . Hacemos N = ∅ y definimos por recursión la familia Nξ , para ξ < ωα mediante las fórmulas (i) y (ii) del lema 6.4. Según la 160 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 161 ✐ ✐ Conjuntos y modelos. Curso avanzado fórmula (iii) se determina la familia M. Supongamos que µ satisface [B6]. De la afirmación del lema 6.4 sabemos que el sistema M tiene cardinalidad µ, con lo que se satisface la fórmula [D4] y con mayor razón la condición [D3], que es una consecuencia de [D4]. Recíprocamente, supongamos que M tiene cardinalidad µ = ℵα y que satisface [D3]. De [D3] se sigue que la familia N = [X]|M| es una subfamilia de M. Por otro lado, M es equipotente con una subfamilia de N: P = [M]1 . Mediante el lema 6.2 concluimos que µ = |M| satisface [B6]. En relación con el lema 6.5, se debe observar que la condición [B6] para µ = ℵα+1 se reduce a α ℵℵα+1 = ℵα+1 (respectivamente 2ℵα = ℵα+1 ). (Véase la demostración del lema 5.7.) En particular, si hacemos µ = ℵ1 , resulta que la HC es equivalente a: existe un conjunto M de cardinalidad ℵ1 que satisface [D3] (respectivamente [D4]). Teorema 6.6. Sean µ 6= 2 un cardinal y N un conjunto de cardinalidad η. El cardinal µ es infinito, inaccesible y mayor que η si y sólo si existe una familia M de cardinalidad µ que satisface [D1], [D2], [D3] y tiene como elemento a N. Demostración. Supongamos que el cardinal µ 6= 2 es infinito, inaccesible y mayor que η. A partir del conjunto N construimos la familia M en la forma descrita en el lema 6.4. Puesto que µ satisface [B4] y [B6] (Teorema 5.9), entonces M tiene cardinalidad µ y satisface [D1], [D2] y [D3]; de las fórmulas (i) y (ii) (Lema 6.4) concluimos que N ∈ M. Recíprocamente, sea M una familia de cardinalidad µ que satisface [D1], [D2], [D3] y tiene como elemento a N. Ya que M 6= ∅, entonces µ 6= 0. Consideremos un cardinal ρ < µ. Existe una familia X ⊆ M de cardinalidad |X| = ρ; según [D3], X ∈ M. Hacemos U = Pot(X) y W = Pot(U). Por [D2] U ∈ M; de [D1] se sigue que W ⊆ M; por consiguiente, (1) |W| ≤ |M| = µ. Por otro lado, tenemos 161 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 162 ✐ ✐ 3. Cardinales ρ (2) |W| = 2ρ < |W| = 22 . Las desigualdades (1) y (2) propician 2ρ < µ. El cardinal µ satisface entonces [B4]. Con base en el lema 6.5 se concluye de [D3] que µ también satisface [B6]. En este punto podemos usar el teorema 5.9 para afirmar que µ es infinito inaccesible. Ya que N ∈ M, por [D2] ocurre que Pot(N) ⊆ M y, por lo tanto, µ = |M| > η = |N|. En consecuencia, µ tiene todas las propiedades deseadas. Ahora usamos los resultados anteriores para caracterizar a los cardinales inaccesibles. Teorema 6.7. El cardinal µ 6= 2 (respectivamente infinito) es inaccesible si y sólo si existe una familia no vacía M de cardinalidad µ que satisface [D1], [D2] y [D3]. Las condiciones [D1] y [D3] se pueden sustituir por [D4]. Demostración. Para mostrar la primera parte, basta hacer η = 0 en el teorema 6.6; si, por el contrario, se quiere mostrar que se pueden sustituir [D1] y [D3] por [D4], se utiliza el lema 6.4 con N = ∅: la afirmación de ese lema implica que la familia M no sólo satisface [D1], [D2] y [D3] sino también [D4]. Por otro lado, [D1] y [D3] son obvias consecuencias de [D4]; así que si M satisface [D2] y [D4], entonces µ debe ser distinto de 2 (por la primera parte del teorema) e inaccesible. 7. Teoría PCF En esta parte presentamos una muy breve recopilación de algunos resultados obtenidos mediante la técnica pcf (posibles cofinalidades), desarrollada por Shelah y algunos de sus estudiantes y colaboradores durante los últimos años. Una cuestión importante acerca de esta técnica es que se elaboró para demostrar resultados de la aritmética cardinal en ZFE . La presentación que aquí hacemos es sólo ilustrativa y no contiene ningún detalle o demostración. Se trata simplemente de llamar la atención del lector hacia una nueva técnica que abre numerosas líneas de investigación. Para el lector interesado recomendamos las siguientes obras: [BuMa91], [Je92], [Sh94] y [Je95]. Teorema 7.1 (Shelah, 1989). Si 2ℵn < ℵω para todo número natural n, entonces 2 ℵ ω < ℵℵ 4 . 162 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 163 ✐ ✐ Conjuntos y modelos. Curso avanzado Note la extraña aparición del subíndice 4. Teorema 7.2 (Shelah, 1994). Suponga que λ es el primer cardinal que satisface λcf (λ) > λ+ + 2cf (λ) . Entonces λ > 2ℵ0 , cf (λ) = ℵ0 y (∀ µ < λ)[µℵ0 ≤ µ+ + 2ℵ0 ]. Tenemos resultados aun más extraños: Teorema 7.3 (Shelah, 1994). (1) ℵℵω0 < ℵω4 + (2ℵ0 )+ . (2) ℵℵω11 < ℵω5 + (2ℵ1 )+ . Éstos son algunos ejemplos de los resultados que se pueden obtener con la teoría pcf. El lector debe notar que la exponenciación cardinal dista mucho de ser una teoría acabada. Por el contrario, tanto la nueva teoría pcf como las técnicas ya conocidas de forcing (Vol. II) y de modelos internos (este volumen y el segundo), proporcionan poderosas herramientas para profundizar en esta área. 8. Ejercicios 1. Demuestre el lema 5.2. λ ⌣ 2. Pruebe que si λ ≥ ℵ0 , entonces 2λ ≤ 22 . 3. Demuestre, suponiendo HGC , que el cardinal λ es débilmente inaccesible si y sólo si es inaccesible. 4. Demuestre el teorema 1.3. 5. Demuestre el corolario 1.6. 6. Demuestre el teorema 2.3. 7. Demuestre el teorema 2.6. 8. Demuestre la proposición 2.7. 9. Demuestre que las condiciones (i), (ii) y (iii) del teorema 2.10 son equivalentes si µ ≥ ℵ0 es un cardinal sucesor. De lo anterior deduzca que es cierto (i) ( (ii) o (iii) ) para todo cardinal µ ≥ ℵ0 . 163 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 164 ✐ ✐ 3. Cardinales 10. (**) Sin la HGC demuestre que existe un cardinal límite µ que satisface las condiciones (i), (ii) y (iii) del teorema 2.10; el menor cardinal que lo satisface es ℵ0 . Muestre que el siguiente es ℵ0 + 2 ℵ 0 + 2 2 ℵ0 11. Demuestre el corolario 1.15. 12. Demuestre las siguientes igualdades: + ··· . µ µ (a) Si µ ≥ ℵ0 , (2⌣ )λ = 2⌣ para 1 ≤ λ ≤ cf (µ). µ µ λ (b) (2⌣ )⌣ = 2⌣ para 2 ≤ λ ≤ cf (µ). 13. Demuestre las siguientes afirmaciones: (a) ℵς(α) ≥ β ≥ 2, implica ℵβα = ℵα . (b) Si γ ≥ 2, κ ℵβ+1 ⌣ = κℵβ . ℵcf (β) ℵβ (c) Si κ ≥ 2, κ ⌣ ≥ ℵβ ⌣ . [Sugerencia: (c) Considere los casos β = 0, β límite y β sucesor. Para el caso β límite ℵ ℵβ ξ = X η<β ℵ ℵη ξ = X η≤ξ ℵ ℵη ξ + X ξ<ηβ ℵ Si η ≤ ξ, ℵη ξ = 2ℵξ , lo cual implica 2 ℵ ξ ℵξ = 2 ℵ ξ . ℵ ℵ Si ξ < η se obtiene ℵη ξ ≤ ℵη η = 2ℵη . Justifique que ℵ ℵβ ξ ≤ 2 ℵ ξ + Además X ξ<η<β 2 ℵη ≤ ℵβ 2⌣ ≥ y ℵ Por otra parte, X η<β X ℵ ℵη ξ ∀ ξ < cf (β). P η≤ξ ℵ ℵη ξ ≤ 2ℵξ · |ξ + 1| ≤ 2ℵη ∀ ξ < cf (β). 2 ℵη , η<β ℵβ ℵβξ ≤ 2 ⌣ , para ξ < cf (β). ℵβ ℵnβ = ℵβ = 2 ⌣ si 0 < n < ℵ0 . 164 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 165 ✐ ✐ Conjuntos y modelos. Curso avanzado ℵβ Así que ℵκβ ≤ 2 ⌣ si κ < ℵcf (β) . Deduzca que ℵcf (β) ℵβ ⌣ = X κ<ℵcf (β) ℵβ ≤ 2 ℵβ ·ℵcf (β) ⌣ ℵcf (β) ℵβ ℵβ ℵβ , ya que ℵcf (β) ≤ ℵβ ≤ 2 ⌣ y 2 ⌣ · ℵcf (β) = 2 ⌣ . Además, ℵβ ⌣ ℵcf (β) ℵβ ℵβ ℵβ ℵβ ≤ 2⌣. Por hipótesis κ ≥ 2, entonces κ ⌣ ≥ 2 ⌣ y κ ⌣ ≥ ℵβ ⌣ .] 14. Demuestre las siguientes igualdades: ℵβ ℵβ (a) Si κ ≥ 2 y γ < cf (β), entonces (κ ⌣ )ℵγ = κ ⌣ . ℵβ (b) Si κ ≥ 2 y cf (β) ≤ γ ≤ β, entonces (κ ⌣ )ℵγ = κℵβ . ℵβ ℵγ (c) Si κ ≥ 2 y β ≤ γ, entonces (κ ⌣ )ℵγ = κ ⌣ . ℵβ ℵβ (d) Si κ ≥ 2 y γ ≤ cf (β), entonces (κ ⌣ )ℵγ = κ ⌣ . ℵβ ℵγ (e) Si κ ≥ 2 y cf (β) < γ ≤ β + 1, entonces (κ ⌣ ) ⌣ = κ ℵβ ℵγ ℵβ+1 ⌣ = κℵβ . ℵγ (f) Si κ ≥ 2 y β < γ, entonces (κ ⌣ ) ⌣ = κ ⌣ . [Sugerencia: (a) Primero demuestre ℵβ ℵ1 X κ ⌣ = κ⌣ + κℵ ξ = κℵ 0 + 1≤ξ<β X κℵξ , 1≤ξ<β de donde se sigue ℵβ κ⌣ = X κℵξ . (i) ξ<β Para simplificar, defina ℵ(ξ,η) = ℵξ . De (i) concluya que ℵβ  (κ ⌣ )ℵγ =  X ξ<β ℵγ κℵ ξ  = Y X κℵ(ξ,η) . (ii) n<ωγ ξ<β Sea S la colección de todas las ωγ -sucesiones de ordinales α que satisfacen la condición αη < β, para η < ωγ . 165 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 166 ✐ ✐ 3. Cardinales Concluya que κ ℵβ ⌣ !ℵγ = κ⌣ !ℵγ = κℵ(αη ,η) (iii) α∈S η<ωγ y, por lo tanto, ℵβ X Y X Y κ ℵ αη = α∈S η<ωγ X [ κ α∈S P η<ωγ ℵ αη ] . (iv) Por hipótesis ℵP γ < ℵcf (β) ; además, ℵαη < ℵβ si η < ωγ y α ∈ S. Concluya que η<ωγ ℵαη < ℵβ y por (i) [ κ P η<ωγ ℵ αη ] para α ∈ S. ℵ Note |S| = (β)ℵγ ≤ ℵβγ . ℵβ ≤ κ⌣, ℵcf (β) Por otro lado, ℵγ < ℵcf (β) , lo que implica |S| ≤ ℵβ ⌣ . Además, κ ℵβ ℵβ ⌣ ! ≤κ ℵβ ⌣ ℵcf (β) · ℵβ ⌣ . ℵcf (β) Muestre que κ ⌣ ≥ ℵβ ⌣ ; deduzca que ℵβ κ⌣ !ℵγ ℵβ ≤ κ⌣, y concluya la igualdad.] 15. Demuestre que y que ℵℵ1 0 = 2ℵ0 · ℵ1 ℵℵ0 1 = 2ℵ1 . 16. Demuestre que ℵℵγ 0 = X ξ<γ ℵℵξ 0 . 166 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 167 ✐ ✐ Conjuntos y modelos. Curso avanzado 17. Demuestre que iα = |Vω+α |. 18. La HGC se puede escribir en la forma: para η infinito, η ≤ µ ≤ 2η implica η = µ o µ = 2η . Muestre que en ZF el AE se sigue de HGC. [Sugerencia: Demuestre que todo cardinal se puede bien ordenar. Defina ℵ(η) para |H(x)| y |x| = η. 2µ Primero muestre que ℵ(µ) ≤ 22 para todo cardinal µ. Tome x con |x| = µ y sea y el conjunto de todos los subconjuntos de Pot(x) que están bien ordenados por ⊆; sea Y el conjunto de las clases de equivalencia de y, obtenidas mediante la relación de isomorfismo entre estos conjuntos bien ordenados. Muestre que Y ⊆ Pot(Pot(Pot(x))) y que ℵ(x) es equipotente a Y. Ahora note que si ℵ0 ≤ µ, entonces 1 + µ = µ y, por lo tanto, 2µ + µ = 2µ ; µ µ 22 + 2µ = 22 ; 22 2µ µ 2µ + 22 = 22 . Entonces use HGC en µ 22 ≤ ℵ(µ) + 22 ≤ 22 = 22 2µ + 22 µ µ 2µ y muestre que si µ 2µ 2µ ℵ(µ) + 22 = 22 , entonces ℵ(µ) = 22 , usando σ + σ = σ ⇒ (2σ = σ + ρ ⇒ 2δ = ρ). (*) Como ℵ(µ) está bien ordenado, esto implica que µ se puede bien ordenar µ 2µ ya que µ < 2µ < 22 < 22 . Sin embargo, si µ µ µ ℵ(µ) + 22 = 22 , entonces ℵ(µ) ≤ 22 , y repita el argumento en µ 2µ ≤ ℵ(µ) + 2µ ≤ 22 . 167 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 168 ✐ ✐ 3. Cardinales Otra vez, si ℵ(µ) + 2µ = 2µ , repita el argumento en µ ≤ ℵ(µ) + µ ≤ 2µ ; esta vez sabemos que µ < ℵ(µ) + µ. Para considerar el caso de un cardinal η para el cual no se sabe si ℵ0 ≤ η, ponga µ = ℵ0 + η. El argumento anterior muestra que µ se puede bien ordenar y, por lo tanto, η. Para probar (*), note que como σ + σ = σ, tenemos 2σ · 2σ = 2σ+σ = 2σ . Así que si ρ + σ = 2σ , entonces sea f : P ∪ Q − → Pot(Q) × Pot(Q) una biyección, donde P, Q tienen cardinalidad ρ, σ respectivamente, y son ajenos. Entonces, como por el teorema de Cantor la proyección de f [Q] sobre la primera coordenada no es Pot(Q), se cumple que el tipo ordinal de Pot(Q) es menor o igual que el de P. Ahora, si η no es tal que η + η = η, tomamos µ = ℵ0 · η y note que η ≤ µ y µ + µ = µ. (En realidad, se puede suponer sin el AE que si σ + 1 = σ, entonces ρ + σ = 2σ implica ρ = 2σ ).] 19. Evalúe la cardinalidad de ℵ Q 0<α<ω1 α. 20. Si 2ℵβ ≥ ℵα , entonces ℵαβ = 2ℵβ . 21. Sean α límite y cf (ℵβ ) < ℵα . Muestre que si ℵξ ≤ ℵα , para toda ξ < α, ℵ entonces ℵαβ = ℵα . 22. Si n < ω, entonces 23. Pruebe que 24. Pruebe que Q n<ω Q n<ω ℵn = 2 ℵ β . ℵn = ℵℵω0 . 25. Demuestre Q (a) 0<n<ω n = 2ℵ0 . Q (b) n<ω ℵn = ℵℵω0 . Q 0 . (c) α<ω+ω ℵα = ℵℵω+ω ℵℵω1 = ℵℵω0 · 2ℵ1 . 26. (*) Demuestre que si κ es un ordinal límite, entonces κ 2κ = (2⌣ )cf (κ) . 168 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 169 ✐ ✐ Conjuntos y modelos. Curso avanzado 27. Definimos la siguiente variante de suma débil: κλ = ` X ηλ , η<κ donde la suma se toma sólo sobre cardinales menores que κ. En este ejercicio se demuestran las principales propiedades de esta operación. Demuestre las siguientes afirmaciones: (a) Si µ ≤ µ1 y 0 < η ≤ η1 , entonces µη ≤ µ1 η1 . ` (b) µη ≥ η (µ ≥ 3). ` ` (c) µη ≤ µη . ` ℵ (d) ℵα+1 ℵβ = ℵαβ . ` (e) ℵα ℵβ = ` ( ℵ ℵα β 2 ℵβ si β < cf (α) si β ≥ α. (f) Sea α un ordinal límite y cf (α) ≤ β < α, entonces ℵ ℵα ≤ ℵα ℵβ ≤ ℵαβ . ` (g) µℵβ ≥ ν si y sólo si 3 ≤ µ ≤ ℵ0 o µ = ℵα con α límite o µ = ℵα+1 ` con β ≥ ς(α). 28. Muestre que la HGC es equivalente a cada una de las siguientes afirmaciones: α α < ℵℵα+2 . (1) Para todo α ∈ OR, ℵℵα+1 ℵ (2) Para todo α ∈ OR, ℵα+1 = ℵα+1 . (3) Para todo α ∈ OR, todo conjunto M con |M| = ℵα+1 es equipotente al conjunto de todos los subconjuntos X ⊆ M con |X| < |M| (es decir, ℵα+1 (4) (5) (6) (7) ⌣ = ℵα+1 ). ℵα+1 ℵα Para toda α ∈ OR, 2 ⌣ = ℵα . Para todo α ∈ OR, ς(α) = cf (α). ℵ Para todo ordinal α, ℵαcf (α) = ℵα+1 . P |µ| Para todo ordinal α, ℵα = µ<ωcf (α) ℵα . 169 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 170 ✐ ✐ 3. Cardinales 29. Suponga la HGC para demostrar que: (a)   si β < cf (α)  ℵα , ℵβ ℵα+1 = ℵα+1 , si cf (α) ≤ β ≤ α   ` ℵ si β ≥ α. β+1 , (b) ( ℵα , si α es límite y β < α ℵβ ℵα = ℵβ+1 , si α es límite y β ≥ α. ` 170 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 171 ✐ ✐ CAPÍTULO 4 Lógica 171 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 172 ✐ ✐ 4. Lógica 1. Introducción Cuando hojeamos cualquier libro moderno de lógica, incluyendo este capítulo, se observa la naturaleza puramente matemática y técnica del material. Para algunos lectores esto puede ser inesperado si consideran a la lógica como una disciplina filosófica. Aun más extraño puede resultar que el estudio de la lógica requiere de gran madurez matemática y del conocimiento de numerosas nociones de la teoría de conjuntos. Pero esto obedece al desarrollo formal de la disciplina, que sirve como base para todas las matemáticas. Las matemáticas son exactas en el sentido de que todos sus términos, definiciones, reglas, pruebas, etc. tienen un significado preciso. Esto es especialmente válido cuando detrás de esta teoría se encuentra la lógica matemática y la teoría de conjuntos, como se acostumbra hacer en la matemática contemporánea. Este aspecto de las matemáticas es, quizá, lo que más las distingue de otras disciplinas científicas. Otra característica distintiva es que su esencia es mucho más abstracta que el lenguaje ordinario: números, líneas, planos, conjuntos, no son nociones concretas como computadora, persona, escuela, etc. En matemáticas, los conceptos implican de antemano un cierto grado de abstracción y conforme son más refinados, su abstracción aumenta. Los resultados matemáticos son absolutos, no se pueden cuestionar por evidencia empírica como en cualquier otra ciencia. Por supuesto, se puede discutir la aplicabilidad de una cierta teoría matemática, pero no la teoría misma. En este aspecto sí influye el razonamiento y la evidencia con que se cuente. El uso de notación simbólica es una característica importante de las matemáticas, y está muy relacionado con su naturaleza exacta, libre de ambigüedades, pero más aún con el desarrollo de las matemáticas como un lenguaje formal. Por todo lo anterior, es natural presentar a la lógica matemática como lo hacemos en este capítulo y como se hace en muchos libros modernos. Como nuestro objeto de estudio es un lenguaje formal, trabajamos en dos niveles de lenguaje: el metalenguaje informal, en el que se desarrolla la totalidad de la discusión, y el lenguaje objeto que es el sujeto de estudio. Este último está definido como parte del universo de conjuntos. Es importante tener clara la diferencia entre lenguaje y metalenguaje. Pero también se debe tener en cuenta que muchas veces tomamos los argumentos del metalenguaje ordinario y los trasladamos al lenguaje formal. La discusión se desarrolla en la lógica de primer orden. En la primera sección introducimos la noción de signatura y continuamos con estructuras 172 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 173 ✐ ✐ Conjuntos y modelos. Curso avanzado matemáticas y el estudio de funciones entre estructuras (homomorfismos, encajes, etc.). En las secciones siguientes se desarrollan los conceptos de modelo, satisfacción y consecuencia. Más adelante, abandonamos momentáneamente la parte semántica para pasar al desarrollo de un cálculo de secuencias. Nuestro objetivo principal son los teoremas de completud de Gödel y de compacidad. A continuación enunciamos sin demostración el teorema de incompletud de Gödel. Proseguimos con la construcción de la forma normal prenexa, con la eskolemización y con el teorema de Herbrand. 2. Signaturas Consideremos algunos ejemplos. Podemos pensar en el conjunto de los números enteros Z como un grupo aditivo, como un semigrupo multiplicativo o como un anillo. Podemos pasar de una a otra interpretación si especificamos los elementos neutros y ciertas operaciones. En nuestros tres ejemplos pensamos en los números enteros como (0; +), (1; ·) y (0, 1; +, ·) respectivamente. También podemos considerar la operación de resta “−” y una relación de orden “<”. De estas operaciones y elementos distinguidos depende el tipo de estructura de que estemos hablando en Z. La elección de los símbolos de operaciones y de los elementos (constantes) se realiza mediante una signatura. Definición 2.1. Una signatura1 σ es un cuarteto (R, F, K, τ) que consiste de un conjunto R de símbolos de relación, un conjunto F de símbolos de función, un conjunto K de símbolos de constante y una función signatura τ : R ∪ F − → N. Los conjuntos K, F y R siempre se considerarán ajenos entre sí. Los elementos de K ∪ R ∪ F se conocen como símbolos no lógicos. Con frecuencia identificamos una signatura con el conjunto de símbolos no lógicos. Por lo tanto, |R ∪ F ∪ K| es la cardinalidad de σ, |σ|. Los símbolos de relación unaria son predicados. Recuerde que una n-relación en un conjunto A es un subconjunto de An . En la definición de signatura se habla de funciones, relaciones y constantes, sin especificar ningún conjunto; sólo se habla de los símbolos. La función signatura asocia un número natural n a cada símbolo de relación o función. Este número n es la aridad del símbolo, es decir, si τ(f ) = n, 1 La palabra signatura, en una de sus acepciones, se refiere a los símbolos utilizados en la clasificación bibliotecaria; en nuestro caso la signatura representa el “alfabeto no lógico”, como se verá posteriormente. Por esta lejana similitud decidimos utilizar dicha palabra. 173 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 174 ✐ ✐ 4. Lógica decimos que se trata de una n-función. Podemos considerar a los símbolos de constante como 0-funciones, y extender la función signatura definiendo τ ′ (c) = 0 para toda c ∈ K. En general para presentar una signatura se escriben explícitamente los símbolos no lógicos. Por ejemplo: σ = (0, 1; +, ·; <) con τ(+) = τ(·) = τ(<) = 2, que define una signatura con símbolos de constante 0 y 1, símbolos de 2-función +, ·, y una 2-relación <. Prescindimos de la función signatura siempre que sea superflua. Ahora supongamos que tenemos una signatura σ. En cada conjunto M podemos describir un “significado” de σ en M, si escogemos elementos de M para cada símbolo de constante y también asociamos funciones y relaciones en M, para cada símbolo de función y relación. Cada “significado” como el descrito determina una estructura de la signatura dada. Esto es el motivo de la siguiente sección. 3. Estructuras matemáticas Si consideramos al conjunto de los números reales con la multiplicación y el orden allí definidos, enfrentamos un ejemplo de estructura matemática. De hecho, podemos distinguir dos elementos especiales, dos constantes, a saber, el 1 y el 0, que tienen propiedades muy particulares. También otros objetos matemáticos se pueden representar en la forma un conjunto no vacío + relaciones + funciones + constantes, por ejemplo, grupos, anillos, módulos o un espacio topológico (interpretando conjuntos abiertos (subconjuntos del espacio) como una sucesión de 1relaciones). Primero determinamos la signatura en cuestión y entonces damos una interpretación adecuada. Esto motiva la siguiente definición: Definición 3.1. Dada una signatura σ = (K, F, R, τ), una estructura (matemática) es un cuarteto A = hA, (RA : R ∈ R), (f A : f ∈ F), (cA : c ∈ K)i, donde: 1. A es un conjunto no vacío, llamado universo de A. 2. Para cada R ∈ R, RA ⊆ Aτ(R) es una τ(R)-relación en A. 3. Para cada f ∈ F, f A : Aτ(f ) − → A, es una τ(f )-función en A. 4. Para cada c ∈ K, cA ∈ A. cA es un elemento de A. 174 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 175 ✐ ✐ Conjuntos y modelos. Curso avanzado La signatura σ también se conoce como el lenguaje de A o el tipo de A y Def se denota L(A). |A| = |A| es la cardinalidad de A. En lo sucesivo, cuando hablemos de estructuras A, B, C, sus universos serán A, B y C respectivamente. Ejemplo 3.2. La estructura de los números reales se puede describir como A A A A hR, RA < , f+ , f· , c0 , c1 i, donde la signatura consta de R = {R< }, F = {f+ , f· } K = {c0 , c1 } y la función signatura es τ(R< ) = τ(f+ ) = τ(f· ) = 2. El lenguaje de esta estructura es entonces ({R< }, {f+ , f· }, {c0 , c1 }, {(R< , 2), (f+ , 2), (f· , 2)}). Ahora estudiemos las relaciones entre dos estructuras: Def A = hA, (RA : R ∈ R), (f A : f ∈ F), (cA : c ∈ K), i Def A A A A′ = hA′ , (R′ : R′ ∈ R′ ), (f ′ : f ′ ∈ F′ ), (c′ : c ∈ K′ )i. Def Def Para abreviar definimos L = L(A) y L′ = L(A′ ). τ es la función signatura de L, y τ ′ es la función signatura de L′ . Definición 3.3. Decimos que A es un L-reducto de A′ , denotado A = A′ ↾ L, o que A′ es una L-expansión de A, si ocurre lo siguiente: (i) A = A′ ; (ii) R ⊆ R′ , F ⊆ F′ , K ⊆ K′ ; (iii) τ ⊆ τ ′ (es decir, τ = τ ′ ↾ R ∪ F); (iv) (∀ R ∈ R)(RA = R′ A ), (∀ f ∈ F)(f A = f ′ A ), (∀ c ∈ K)(cA = c′ A ). Si conocemos A′ , entonces A está bien determinada por (i)–(iv). Si son ciertos los incisos (ii) y (iii) de la definición 3.3, llamamos a L un reducto de L′ y a L′ una expansión de L, y escribimos L ⊆ L′ . Con mucha frecuencia expandiremos una estructura A añadiéndole nuevas constantes. Para este fin introducimos una abreviación conveniente: Definición 3.4. Sean A una L-estructura, C = {ai : i ∈ I} ⊆ A y L′ = L ∪ {ci : i ∈ I}, donde para cada i ∈ I, ci ∈ / L. Definimos hA, Ci ′ ′ o hA, (c : c ∈ C)i como la expansión A de A tal que para toda i ∈ I, ciA = ai . 175 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 176 ✐ ✐ 4. Lógica Una vez definidas las estructuras, podemos hablar de subestructuras o superestructuras: Definición 3.5. Decimos que A es una subestructura de A′ (en símbolos A ⊆ A′ ) y que A′ es una superestructura de A, (A′ ⊇ A) si ocurre lo siguiente: (i) (ii) (iii) (iv) (v) L = L′ ; A ⊆ A′ ; ′ (∀ R ∈ R)(RA = RA ∩ Aτ(R) ); ′ (∀ f ∈ F)(f A = f A ↾ Aτ(f ) ); ′ (∀ c ∈ K)(cA = cA ). Note que las nociones de reducto y subestructura son distintas. Es posible obtener un reducto eliminando relaciones, funciones y constantes de la signatura original, pero conservando intacto el universo. En tal situación un reducto tiene signatura diferente al de la signatura original. En cambio, una subestructura tiene la misma signatura que la estructura correspondiente. El universo de esta estructura es un subconjunto (posiblemente propio) del universo de la estructura original; sus relaciones y funciones son restricciones al universo de la subestructura de las originales en la estructura. En particular, el universo de la subestructura es cerrado respecto a las funciones de la estructura origi′ nal: f A [Aτ(f ) ] ⊆ A, para toda f ∈ F. Las constantes de la estructura y subestructura son idénticas: el universo de la subestructura contiene todas las constantes de la estructura. La igualdad de objetos en el universo de una L-estructura es una propiedad tan básica que debiera ser posible expresarla en cualquier lógica. Sin embargo, hasta ahora esto no es posible. Para remediarlo introducimos el símbolo = en los lenguajes L de primer orden; de esta forma, cada lenguaje contiene una 2-relación que se interpreta en una L-estructura A como {(a, a) : a ∈ A}. Tratamos a “=” como una 2-relación y le damos el significado que pretendemos mediante axiomas. Los siguientes L-enunciados son los axiomas que definen a “=” 1. 2. 3. 4. ∀ x(x = x) (reflexividad). ∀ x∀ y(x = y ⇒ y = x) (simetría). ∀ x∀ y∀ z(x = y ∧ y = z ⇒ x = z) (transitividad). ∀ x1 · · · ∀ xn ∀ y1 · · · ∀ yn (x1 = y1 ∧ · · · ∧ xn = yn ⇒ fx1 · · · xn = fy1 · · · yn ), para todo símbolo de n-función f de la signatura de L. 176 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 177 ✐ ✐ Conjuntos y modelos. Curso avanzado 5. ∀ x1 · · · ∀ xn ∀ y1 · · · ∀ yn (x1 = y1 ∧ · · · ∧ xn = yn ⇒ Px1 · · · xn ⇒ Py1 · · · yn ), para todo símbolo de n-predicado de la signatura de L. 4. Homomorfismos Toca el turno al estudio de funciones entre estructuras, lo que nos dará un criterio para discriminar cuándo dos estructuras son “iguales” (isomorfas). Para ello presentamos una serie de definiciones sobre funciones entre estructuras; conforme se pide más a estas funciones, se obtiene una mayor semejanza entre las estructuras en cuestión. Considere una función h : A − → A′ entre los universos de dos estructuras que tienen el mismo tipo. Definición 4.1. Si 1 ≤ n < ω y ~x ∈ An , definimos h(~x) por recursión sobre n como sigue: Def n = 1. h((x)) = (h(x)). n = m + 1. Cada ~x ∈ Am+1 es de la forma ~x = (y, z) con y ∈ Am y z ∈ A. Def Definimos h(~x) = (h(y), h(z)). La definición anterior simplemente formaliza cómo calcular el valor de una función en una n-ada de elementos del dominio: h(x0 , . . . , xn−1 ) = (h(x0 ), . . . , h(xn−1 )); así se justifica el abuso de notación al escribir h(x0 , . . . , xn−1 ). Definición 4.2. Sean A, A′ dos L-estructuras. La función h es un homomorfismo de A en A′ si ocurre lo siguiente: (i) h : A − → A′ ; ′ (ii) (∀ R ∈ R)(∀ ~x ∈ Aτ(R) )(RA~x ⇒ RA h(~x)); ′ (iii) (∀ f ∈ F)(∀ ~x ∈ Aτ(f ) )(h(f A (~x)) = f A (h(~x))); ′ (iv) (∀ c ∈ K)(h(cA ) = cA ). En este caso escribimos h : A − → A′ . Note que en la definición de homomorfismo se pide que si ocurre la relación en el dominio, también debe acontecer en el rango. Pero no necesariamente el recíproco. Si también pedimos el recíproco y que la función sea inyectiva, tenemos un encaje: Definición 4.3. h es un encaje de A en A′ cuando ocurre lo siguiente: (i) h : A − → A′ ; 177 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 178 ✐ ✐ 4. Lógica (ii) h es inyectiva; ′ (iii) (∀ R ∈ R)(∀ ~x ∈ Aτ(R) )(RA~x ⇔ RA h(~x)). En este caso escribimos h : A ֒→ A′ y decimos que A se encaja en A′ . Si además de todo lo anterior pedimos que la función sea sobre obtenemos un isomorfismo: Definición 4.4. h es un isomorfismo de A sobre A′ si (i) h : A ֒→ A′ ; (ii) h es biyectiva. En este caso escribimos h : A ∼ = A′ y decimos que A es isomorfa a A′ . Si ′ ∼ anotamos A = A , entendemos que existe un isomorfismo entre A y A′ . El lector debe notar que la presencia de un isomorfismo entre dos estructuras las hace indistinguibles como tales. Si podemos encajar una estructura A en una estructura A′ , entonces podemos considerar a A como subestructura de A′ . Formalmente: Def Teorema 4.5. Si h : A ֒→ A′ , entonces A′′ = ran(h) es el universo de una subestructura A′′ de A′ tal que A ∼ = A′′ . Demostración. h es el isomorfismo requerido si definimos A′′ de la ′ ′′ Def siguiente manera. Para R ∈ R, sea RA = RA ∩ A′′ τ(R) . Sea f ∈ F. Para ~y = ′ ′ h(~x) ∈ A′′ τ(f ) (con ~x ∈ Aτ(f ) ) se tiene f A (~y) = f A (h(~x)) = h(f A (~x)) ∈ A′′ , ′′ Def ′ así que f A = f A ↾ A′′ τ(f ) define una función de A′′ τ(f ) en A′′ . Como además ′ ′′ ′ cA = h(cA ) ∈ A′′ , para c ∈ K, definimos cA = cA y podemos construir la estructura mencionada: ′′ ′′ ′′ A′′ = hA′′ , (RA : R ∈ R), (f A : f ∈ F), (cA : c ∈ K)i. De esta definición se sigue de inmediato que A′′ es una subestructura de A′ y que h : A ∼ = A′′ . 5. Lenguajes formales En esta sección definimos de manera general los lenguajes formales. Si bien ya conocemos el lenguaje de una estructura, que es un caso particular de lenguaje formal, aquí damos la definición general que se usa tanto en lógica como en teoría de autómatas. Para expresar e investigar propiedades internas de las estructuras debemos definir un lenguaje formal, el cual expresará solamente 178 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 179 ✐ ✐ Conjuntos y modelos. Curso avanzado enunciados sobre los elementos del universo y no sobre subconjuntos arbitrarios de éste (característica que define los lenguajes como lenguajes de primer orden): el lenguaje objeto mencionado en la introducción. Como ejemplo de lenguaje formal ya conocemos el lenguaje LTC construido en el capítulo 2. Definición 5.1. Un alfabeto A es un conjunto no vacío. Cada x ∈ A se llama símbolo o letra de A. Sea Def Def A∗ = <ω A = [ n<ω A∗ n Def A = {f : ∃ n < ω f : n − → A}. es la estrella de Kleene de A. Una cadena w ∈ A∗ se llama cadena o palabra Def Def sobre A, |w| = dom(w) es la longitud de w. ✷ = ∅ denota la palabra vacía. En lo sucesivo identificamos el símbolo a ∈ A con la palabra ha : i < 1i ∈ A∗ . Así que podemos suponer A ⊆ A∗ . Una cadena f = hf (i) : i < ni ∈ A∗ se escribe en ocasiones en la forma f (0)f (1) · · · f (n − 1). Podemos definir operaciones y relaciones entre palabras: Definición 5.2. Sean v, w ∈ A∗ . (a) Definimos la concatenación de v y w mediante Def Def vaw = vw = v ∪ {(|v| + i, w(i)) : i < |w|}. Definimos la adición de un símbolo a ∈ A a v mediante Def Def vaa = va = va{(|v| + 1, a)}. (b) Decimos que v es un segmento inicial de w, denotado v ⊑ w, si ∃ m ≤ dom(w) (v = w ↾ m). Lema 5.3. Sea A un alfabeto. Entonces |A∗ | = |A| + ℵ0 . Demostración. Sea a ∈ A. Dado que ha : i < ni ∈ A∗ , para cada n < ω y A ⊆ A∗ se cumple máx{|A|, ℵ0 } ≤ |A∗ |. Por otro lado, |A∗ | ≤ X n<ω |n A| = X n<ω |A|n ≤ ℵ0 · (|A| + ℵ0 ) = máx{|A|, ℵ0 }. |{z} ≤|A|+ℵ0 Con lo que queda demostrado el lema. 179 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 180 ✐ ✐ 4. Lógica Ya habíamos definido lo que es el lenguaje de una estructura. Sin embargo, podemos definir el concepto de lenguaje independientemente del concepto de estructura. Definición 5.4. Un lenguaje formal es un cuarteto (R, F, K, τ) donde R, F y K son conjuntos mutuamente ajenos y τ es una función: τ : R ∪ F − → ω. Observe que el lenguaje L(A) de una estructura A es un lenguaje formal. Pasemos ahora a describir la cardinalidad de un lenguaje. Definición 5.5. Sea L = (R, F, K, τ) un lenguaje. Entonces |L| = |R ∪ F ∪ K| + ℵ0 es la cardinalidad del lenguaje L. Note que hemos sumado ℵ0 pues queremos que las variables (una cantidad infinita, pero numerable) se consideren dentro del lenguaje. 6. Términos y fórmulas Fijemos un lenguaje L = (R, F, K, τ). Definimos un alfabeto AL adecuado para este lenguaje tal que mediante reglas prescritas las palabras formadas con este alfabeto, que llamamos fórmulas y términos, expresen las propiedades internas de cada estructura A con L(A) = L. Definición 6.1. El alfabeto AL de L es el conjunto que contiene exactamente los siguientes elementos: • Símbolos lógicos: – Conectivos: ∧ (y, conjunción). ¬, (negación), ∨ (o, disyunción), ⇒ (implicación), ⇔ (equivalencia). – Cuantificadores: ∀ (universal), ∃ (existencial). – Igualdad: = ˙ (hemos puesto un punto sobre el símbolo =, para evitar confusión entre la igualdad en el lenguaje y el metalenguaje). – Variables: para cada n < ω el elemento vn . – Símbolos auxiliares: paréntesis ( ) y coma ,. • Símbolos no lógicos: son los símbolos de L. El símbolo de igualdad es prescindible. Si se incluye, como en este caso, se dice que tenemos un lenguaje con igualdad. Ahora establecemos qué es un término del lenguaje L (los términos identifican elementos del universo). Para ello necesitamos una generalización de la función concatenación a: 180 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 181 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 6.2. Sean A un alfabeto, n < ω y s : n − → A∗ . (a) Mediante recursión sobre i ≤ n, definimos el elemento s(0)a . . . as(i − 1) de A∗ como sigue: Def en el caso i = 0, sea s(0)a . . . as(0 − 1) = ✷; Def en el caso i = j +1, sea s(0)a . . . as(i−1) = (s(0)a . . . as(j −1))as((j + 1) − 1). Def (b) Si i ≤ j ≤ n, sea s(i)a . . . as(j) = si,j (0)a . . . asi,j ((j − i + 1) − 1), Def donde si,j : (j − i + 1) − → A∗ está definida mediante si,j (k) = s(i + k) para 0 ≤ k ≤ (j − i). Se puede mostrar fácilmente que para s : n − → A∗ y j ≤ i ≤ n ocurre: s(0)a . . . as(i − 1) = (s(0)a . . . as(j − 1))a(s(j)a . . . as(i − 1)). Como ejemplo de esta extraña función considere: s : 5 − → A∗ , con s(0) = (, s(1) = vn , s(2) = =, ˙ s(3) = vm y s(4) = ), que da lugar a la expresión: (vn =v ˙ m ). Acordemos el siguiente método simplificado de escritura: en lugar de fs(0)a . . . a s(τ(f ) − 1), escribimos solamente fs(0) . . . s(τ(f ) − 1); en lugar de Ras(0)a . . . as(τ(R) − 1), escribimos Rs(0) . . . s(τ(R) − 1). Definición 6.3. El conjunto Tm(L) de los L-términos es el ⊆-menor subconjunto de A∗L que cumple con: (T1) Para toda n < ω, vn ∈ Tm(L), es decir, toda variable es un término; (T2) Para toda c ∈ K, c ∈ Tm(L), es decir, toda constante es un término; (T3) Para cualesquier f ∈ F y s : τ(f ) − → Tm(L), fs(0) . . . s(τ(j)−1) ∈ Tm(L), es decir, si t0 , . . . , tn−1 son términos y f es un símbolo de n-función, entonces ft0 · · · tn−1 es un término. T Observe que Tm(L) = {B ⊆ A∗L : B satisface (T1), (T2) y (T3)}. Como ejemplos de términos tenemos: v1 , c5 , fv1 v2 v3 . Las fórmulas más simples son aquellas en las que no aparecen conectivos o cuantificadores. Se llaman fórmulas primitivas o atómicas: 181 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 182 ✐ ✐ 4. Lógica Definición 6.4. El conjunto de las fórmulas atómicas o primitivas en L, At(L), se define como Def At(L) = {s1 =s ˙ 2 : s1 ∈ Tm(L) ∧ s2 ∈ Tm(L)} ∪ ∪ {Rs(0)a · · · as(τ(i) − 1) : R ∈ R ∧ s : τ(i) − → Tm(L)}. (30) Así que las fórmulas atómicas son de la forma, por ejemplo, s=r ˙ o Rs1 s2 s3 , donde s, s1 , s2 , s3 son términos. Las fórmulas de nuestro lenguaje se construyen con base en las fórmulas atómicas usando conectivos y cuantificadores: Definición 6.5. El conjunto Fml(L) de las L-fórmulas es el ⊆-menor subconjunto de A∗L para el que se cumple lo siguiente: (F1) At(L) ⊆ Fml(L); (F2) Para cualesquier ϕ, ψ ∈ Fml(L), (ϕ∧ψ) ∈ Fml(L). (F3) Para toda ϕ ∈ Fml(L), ¬ϕ ∈ Fml(L). (F4) Para cualesquier n < ω y ϕ ∈ Fml(L), ∀ vn ϕ ∈ Fml(L). Como ejemplos de fórmulas tenemos: (v1 =v ˙ 2 )∧ ∀ v2 (Rv2 v1 ), ∀ v1 (v1 = v2 ) ∨ (Rv1 v2 ). Se ha descrito el lenguaje Lωω . Los subíndices ω indican que las fórmulas tienen un número finito de conectivos y un número finito de cuantificadores. Existen otros lenguajes, como L∞ω , en los que podemos usar una cantidad numerable de conectores y un número finito de cuantificadores; estos lenguajes se conocen como infinitarios. Ahora es claro lo que significa Lκκ , para todo cardinal κ. En particular, Lκ0 es un lenguaje en el que las fórmulas no involucran cuantificadores. Lema 6.6. Sea L un lenguaje. Entonces |L| = |Fml(L)|. Demostración. Dado que Fml(L) ⊆ A∗L , se deduce que |Fml(L)| ≤ |A∗L | = |A∗L | + ℵ0 = |L|. Por otro lado, puesto que para cada R ∈ R, f ∈ F, c ∈ K y n < ω, es cierto Rv0 · · · v0 ∈ Fml(L), fv0 . . . v0 =fv ˙ 0 . . . v0 ∈ Fml(L), c=c ˙ ∈ Fml(L), así como vn =v ˙ n ∈ Fml(L), y se obtiene |L| ≤ |Fml(L)|. Por último introducimos relaciones entre conectivos y cuantificadores. Definición 6.7. Sean ϕ, ψ ∈ Fml(L). Def (a) Disyunción: (ϕ∨ψ) = ¬(¬ϕ∧¬ψ). Def (b) Implicación: (ϕ ⇒ ψ) = (¬ϕ∨ψ). 182 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 183 ✐ ✐ Conjuntos y modelos. Curso avanzado Def (c) Equivalencia: (ϕ⇔ψ) = ((ϕ ⇒ ψ)∧(ψ ⇒ ϕ)). Def (d) Cuantificación existencial: ∃ vn ϕ = ¬∀ vn ¬ϕ. Las siguientes abreviaturas son de gran utilidad: Definición 6.8. (a) Sean n < ω, x1 , . . . , xn ∈ {vi : i < ω}, Q1 , . . . , Qn ∈ {∀ , ∃ } y ϕ ∈ Fml(L). Definimos recursivamente Qn xn . . . Q1 x1 ϕ ∈ Fml(L), Def Def mediante Q0 x0 . . . Q1 x1 ϕ = ϕ y Qn+1 xn+1 . . . Q1 x1 ϕ = Qn+1 xn+1 Qn xn . . . Q1 x1 ϕ. (b) Sea n < ω y, para i < n, sea ϕi ∈ Fml(L). Definimos por recursión W V ϕ (respectivamente, i<n ϕi ) mediante i<n i ^ i<0 ^ Def ϕi = ∀ v0 (v0 =v0 ), Def ϕi = i<1 ^ _ Def _ i<0 Def ϕi = ¬∀ v0 (v0 =v0 ), ϕi = ϕ0 , i<1 Def ϕi = ( i<n+1 ^ i<n ϕi ∧ϕn+1 ), (respectivamente cuando n ≥ 1. _ Def ϕi = ( i<n+1 _ i<n ϕi ∨ϕn+1 )), Las definiciones se eligieron de tal forma que para toda n < ω (incluido el caso n = 0) es válido |= ^ ϕi ⇔ ( _ ϕi ⇔ ( i<n+1 ^ ϕi ∧ϕn+1 ) _ ϕi ∨ϕn+1 ), i<n así como |= i<n+1 i<n donde |= se define en la sección 8. Ahora analicemos la construcción de términos y fórmulas, comenzando con los términos: Lema 6.9. Sea s ∈ Term(L). (a) s es una variable o un símbolo de constante, o existen una f ∈ F y una r : τ(f ) − → Tm(L) tales que s = f r(0)a . . . ar(τ(f ) − 1). (b) s 6= ✷, es decir, la palabra vacía no es un término. 183 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 184 ✐ ✐ 4. Lógica (c) Para todo s′ ∈ Tm(L), si s′ 6= s entonces no es cierto que s′ ⊑ s ni s ⊑ s′ . Es decir, si tenemos dos términos distintos ninguno de ellos es segmento inicial del otro. (d) Para cualesquier m, n < ω, si tenemos dos funciones r : m − → Tm(L), ′ ′ r:n− → Tm(L) tales que r(0)a . . . ar(m − 1) = r (0)a . . . ar ′ (n − 1)), entonces m = n y para toda i < m se tiene r(i) = r ′ (i). Es decir, la función que define un término es única. Demostración. Ejercicio. Teorema 6.10 (Unicidad en la lectura de términos). Los términos se descomponen de manera única en subtérminos. Es decir, si s ∈ Tm(L), entonces ocurre exactamente una de las siguientes afirmaciones: (i) Existe exactamente una n < ω tal que s = vn ; (ii) Existe exactamente una c ∈ K tal que s = c; (iii) Existen exactamente una f ∈ F y una r : τ(f ) − → Tm(L) tal que s = fr(0) . . . r(τ(f ) − 1). Demostración. Es inmediato del inciso (a) del lema 6.9. A continuación probamos que las fórmulas se pueden descomponer en forma única. Comencemos con las fórmulas atómicas: Lema 6.11. (a) Tm(L) ∩ At(L) = ∅. Es decir, ningún término puede ser una fórmula atómica ni viceversa. (b) Para cualesquier s1 , s2 , s1′ , s2′ ∈ Tm(L), si s1 =s ˙ 2 ⊑ s1′ =s ˙ 2′ entonces s1 = s2′ ′ y s2 = s2 . (c) Para cualesquier R, R′ ∈ R, s : τ(R) − → Tm(L) y s′ : τ(R′ ) − → Tm(L), si ′ ′ ′ Rs(0) . . . s(τ(R) − 1) ⊑ R s (0) . . . s (t(R′ ) − 1) entonces R = R′ y para toda n < τ(R)) se cumple s(n) = s′ (n). (b) y (c) expresan que la función que describe una fórmula es única. Demostración. Ejercicio. Lema 6.12. (a) Tm(L) ∩ Fml(L) = ∅. Es decir, ningún término es fórmula ni viceversa. (b) Sea ϕ ∈ Fml(L). Entonces ϕ ∈ At(L) o ϕ = (ψ∧ξ) para algunas ψ, ξ ∈ Fml(L) o ϕ = ¬ψ con ψ ∈ Fml(L), o existe n < ω con ϕ = ∀ vn ψ tal que ψ ∈ Fml(L). 184 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 185 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Sean ϕ, ψ ∈ Fml(L). Si ψ ⊑ ϕ, entonces ψ = ϕ. Demostración. Si eliminamos de Fml(L) el conjunto Tm(L), así como todos los elementos que no son de la forma especificada por (b), el conjunto F resultante satisface (F1) a (F4) de 6.5; por lo tanto, debido a la ⊆-minimalidad de Fml(L), F coincide con Fml(L). Así que en realidad no se puede eliminar ningún elemento de Fml(L). Por consiguiente, (a) y (b) son válidas. Para demostrar (c), denotemos con nϕ el número de conectivos y cuanDef tificadores en ϕ ∈ Fml(L). Es decir, nϕ = |{i < |ϕ| : ϕ(i) ∈ {¬, ∧, ∀ }}|. Primero demostramos la siguiente afirmación, de donde se deduce inmediatamente (c): Para cualesquier n < ω, ϕ, ψ ∈ Fml(L), si n = nϕ y ψ ⊑ ϕ, entonces ψ = ϕ. (31) Demostración de la afirmación 31: por inducción sobre n < ω. Caso n = 0. Sea nϕ = 0 y ψ ⊑ ϕ. Así, tanto ϕ como ψ son fórmulas atómicas, pues no contienen conectivos o cuantificadores. Entonces son posibles dos subcasos: Def Caso ϕ = s1 =s ˙ 2 con s1 , s2 ∈ Tm(L). Dado que ψ ⊑ ϕ, ψ no comienza con un símbolo de relación y debe tener la forma Def ψ = s1′ =s ˙ 2′ , con s1′ , s2′ ∈ Tm(L). Por el lema 6.11(b) se cumple entonces que s1′ = s1 y s2′ = s2 , de donde se sigue ϕ = ψ. Def Caso ϕ = Rs(0) . . . s(τ(R) − 1), con R ∈ R y s : τ(R) − → tm(L). Def En este caso se debe tener ψ = Rs′ (0) . . . s′ (τ(R) − 1), con s′ : τ(R) − → Tm(L). Por el lema 5.3(c) logramos s(n) = s′ (n) para toda n < τ(R), de donde se sigue ψ = ϕ. Hipótesis de inducción. Suponga que la afirmación se ha demostrado para toda m < n y sean ψ, ϕ ∈ Fml(L), con nϕ = n y ψ ⊑ ϕ (naturalmente nψ ≤ n). Por (b) son posibles tres casos: Def Caso ϕ = (ϕ1 ∧ϕ2 ) con ϕ1 , ϕ2 ∈ Fml(L). Ya que ψ ⊑ ϕ, ψ debe comenzar también con “(”. Por (b), ψ es de la forma ψ = (ψ1 ∧ψ2 ) con ψ1 , ψ2 ∈ Fml(L). Entonces ψ1 ⊑ ϕ1 o ϕ1 ⊑ ψ1 . Dado que nϕ1 < nϕ = n, respectivamente, nψ1 ≤ nψ ≤ n. Por la hipótesis de inducción se tiene ψ1 = ϕ1 , y esto implica ψ = ϕ. 185 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 186 ✐ ✐ 4. Lógica Def Caso ϕ = ¬ϕ1 , con ϕ1 ∈ Fml(L). Como ψ ⊑ ϕ, entonces ψ también comienza con ¬, es decir, ψ = ¬ψ1 para alguna ψ1 ∈ Fml(L). En tal caso ψ1 ⊑ ϕ1 y nϕ1 < nϕ = n, así que por hipótesis de inducción concluimos que ψ1 = ϕ1 , de donde ψ = ϕ. Def Caso ϕ = ∀ vl ϕ1 , con l < ω y ϕ1 ∈ Fml(L). Este caso se trata en forma análoga al caso previo. Con esto queda demostrada la afirmación (1). ◭ El lema queda demostrado. El siguiente lema establece que la descomposición de fórmulas en subfórmulas es única. Teorema 6.13 (Unicidad en la lectura de fórmulas). Toda fórmula se puede descomponer de manera única en subfórmulas. Es decir, si ϕ ∈ Fml(L), entonces es cierta exactamente una de las siguientes afirmaciones: (i) Existen exactamente dos s1 , s2 ∈ Tm(L), tales que ϕ = s1 =s ˙ 2. (ii) Existe exactamente una R ∈ R y una s : τ(R) − → Tm(L) tales que ϕ = Rs(0) . . . s(t(R) − 1). (iii) Existen exactamente dos ψ, ξ ∈ Fml(L), tales que ϕ = (ψ∧ξ). (iv) Existe exactamente una ψ ∈ Fml(L) tal que ϕ = ¬ψ. (v) Existen exactamente una n < ω y una ψ ∈ Fml(L) tales que ϕ = ∀ vn ψ. Demostración. Ejercicio. 7. Inducción y recursión sobre la construcción de términos y fórmulas La construcción tan especial de los términos y fórmulas permite incorporar demostraciones por inducción y definiciones por recursión. Teorema 7.1 (Inducción sobre la construcción de términos). Sea Φ una propiedad acerca de términos expresable como una LTC-fórmula. Suponga que: (i) Para toda n < ω, vn cumple con Φ y para toda c ∈ K, c valida Φ ; (ii) Para toda f ∈ F y toda función s : τ(f ) − → Tm(L); si para cada i < τ(f ), s(i) cumple con Φ, entonces Φ se cumple para fs(0) . . . s(τ(f ) − 1). Entonces Φ es cierta para todo s ∈ Tm(L). 186 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 187 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Demostración. T = {s ∈ Tm(L) : Φ(s)} satisface (T1), (T2) y (T3). Por la ⊆-minimalidad de Tm(L), se cumple T = Tm(L). Note que usamos como símbolos primitivos ∧ , ¬ , ⇒ , los otros símbolos son derivados. Así lo haremos en lo sucesivo, a menos que se describa otro acuerdo. El teorema establece que una propiedad matemática Φ es cierta para todo Ltérmino, si es cierta para toda variable y todo símbolo de constante y si, para cada f ∈ F, de la validez de Φ para los términos s(0), . . . , s(τ(f ) − 1) se sigue la validez de Φ para fs(0) . . . s(τ(f ) − 1). Tenemos un resultado análogo para las fórmulas. Teorema 7.2 (Inducción sobre la construcción de fórmulas). Sea Φ una propiedad acerca de fórmulas expresable como una LTC-fórmula. Suponga que: (i) Toda fórmula atómica de L cumple Φ; (ii) Para cualesquier L-fórmulas ψ y ϕ que cumple Φ, se cumple que ψ ∧ ϕ y ¬ϕ validan Φ. (iii) Si ψ es una L-fórmula que cumple con Φ, entonces para toda n < ω la L-fórmula ∀ vn ψ cumple Φ. Entonces toda L-fórmula tiene Φ. Es decir, una propiedad matemática se cumple para todas las fórmulas: si se cumple para todas las fórmulas atómicas; si de la validez de esta propiedad para alguna fórmula, se sigue su veracidad para la negación de la fórmula y para cada cuantificación de la misma; y si de la veracidad de esta propiedad para cada dos fórmulas, se sigue su validez para la conjunción de ellas. Demostración. Se demuestra en forma análoga al teorema de inducción sobre términos. De igual modo podemos probar un teorema de recursión para términos y fórmulas. Teorema 7.3 (Recursión sobre la construcción de términos). Sean Gvar , Gconst , Gfun : V − → V . Entonces existe una única función H : Fml(L) − → V con: (i) Para toda n < ω, H(vn ) = Gvar (vn ); (ii) Para toda c ∈ K, H(c) = Gconst (c); 187 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 188 ✐ ✐ 4. Lógica (iii) Para toda f ∈ F y toda s : τ(f ) − → Tm(L), se cumple que H(fs(0) . . . s(τ(f ) − 1)) = Gfun (f, s, (H(s(i)) : i < τ(f )). Demostración. Definimos Def T0 = {vn : n < ω} ∪ K, Def → Tn }, Tn+1 = Tn ∪ {fs(0) . . . s(τ(f ) − 1) : f ∈ F ∧ s : τ(f ) − Def S entonces Tm(L) = n<ω Tn . Puesto que los términos se descomponen de forma única, se puede definir H ↾ Tn fácilmente, por recursión sobre ω, de manera que sean válidos (i), (ii) y (iii). Con ello se asegura la existencia de H. Tenemos un teorema similar para fórmulas: Teorema 7.4 (Recursión sobre la construcción de fórmulas). Sean Gat , G∧ , G¬ , G∀ : V − → V . Entonces existe exactamente una función H : Fml(L) − →V con: (i) Para toda L-fórmula atómica ϕ, H(ϕ) = Gat (ϕ); (ii) Para cualesquier L-fórmulas ϕ, ψ, H((ϕ∧ψ)) = G∧ (ϕ, ψ, H(ϕ), H(ψ)); (iii) Para toda L-fórmula ϕ, H(¬ϕ) = G¬ (ϕ, H(f )); (iv) Para cualquier L-fórmula ψ y n < ω, H(∀vn ψ) = G∀ (n, ψ, H(ψ)). Demostración. Se demuestra en forma análoga al teorema de recursión sobre la construcción de términos. Ejemplos de aplicación de los teoremas de recursión los proporcionan las siguientes definiciones. Intuitivamente resulta claro cómo determinar las variables que aparecen en un término. Para formalizar esta idea procedemos como a continuación: Definición 7.5. Para t ∈ Tm(L) definimos recursivamente el conjunto de variables de t, var(t), como sigue: var(vn ) = {vn }, var(c) = ∅, var(fs(0) . . . s(τ(f ) − 1)) = [ var(s(i)). i<τ(f ) 188 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 189 ✐ ✐ Conjuntos y modelos. Curso avanzado Observe que para realizar de modo formal esta recursión, debemos definir Def Gvar = {(x, {x}) : x ∈ V }, Def Gconst = {(x, ∅) : x ∈ V }, y Def Gfun = {((j, f, g), [ ran(g)) : j, f, g ∈ V }. En forma similar podemos definir los conjuntos de variables y variables libres de una fórmula. Definición 7.6. Sean ϕ ∈ Fml(L) y n < ω. En la expresión ∀ xϕ decimos que ϕ es el alcance del cuantificador ∀ . Decimos que vn está acotada en ϕ si ∀ vn aparece en ϕ, es decir, existe i < |ϕ| − 1 con ϕ(i) = ∀ y ϕ(i + 1) = vn y ϕ está en el alcance del cuantificador. Recuerde que ϕ es una palabra (una sucesión de símbolos). Una variable que no está acotada es libre. En este orden de ideas, una variable es libre en una fórmula si tiene una presencia libre. Una variable es acotada en una fórmula si tiene una presencia acotada. Observe que una variable puede aparecer libre en ϕ y también acotada. Considere, por ejemplo, v0 en Def ϕ = (v0 =v ˙ 2 )∧(∀ v0 (v1 =v ˙ 0 )). Definición 7.7. Para ϕ ∈ Fml(L) definimos recursivamente el conjunto de variables de ϕ, var(ϕ), y el conjunto de variables libres de ϕ, lib(ϕ), como sigue: Def Def (i) var(s1 =s ˙ 2 ) = lib(s1 =s ˙ 2 ) = var(s1 ) ∪ var(s2 ); Def (ii) var(Rs(0) . . . s(τ(R) − 1)) = lib(Rs(0) . . . s(τ(R) − 1)) S Def = j<τ(R) var(s(j)); Def Def (iii) var((ϕ∧ψ)) = var(ϕ) ∪ var(ψ); lib((ϕ∧ψ)) = lib(ϕ) ∪ lib(ψ); Def (iv) var(¬ϕ) = var(ϕ); lib(¬ϕ) = lib(ϕ); Def Def (v) var(∀ vn ϕ) = var(ϕ) ∪ {vn }; lib(∀ vn ϕ) = lib(ϕ) \ {vn }. Def Si Φ ⊆ Fml(L), entonces lib(Φ) = variables libres de Φ. S {lib(ϕ) : ϕ ∈ Φ} es el conjunto de las 189 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 190 ✐ ✐ 4. Lógica Observe que lib(ϕ) consta de las variables de ϕ que, en al menos una posición, no aparecen dentro del alcance de un cuantificador, como se había definido. En ocasiones es conveniente restringirse a ciertas variables libres. Definimos, por lo tanto: Definición 7.8. Para n < ω, sea Def Fmln (L) = {ϕ ∈ Fml(L) : lib(ϕ) ⊆ {vn : i < n}}. Entonces Fml0 (L) es el conjunto de todas las fórmulas que no tienen variables libres, y se llama conjunto de L-enunciados. Ocasionalmente, en lugar de las variables vn usamos las letras x, y, z, . . . (muchas veces con subíndices). La notación ϕ(x1 , . . . , xn ) significa que ϕ ∈ Fml(ϕ) y lib(ϕ) ⊆ {x1 , . . . , xn }. 8. Modelos Toca el turno a la semántica. Hasta este punto hemos considerado sólo propiedades sintácticas. Introdujimos lenguajes formales para expresar propiedades internas de las estructuras, es decir, propiedades de las relaciones, funciones y constantes de A dentro de A. Ahora debemos interpretar los términos y fórmulas del lenguaje L como enunciados sobre ciertas relaciones, funciones y constantes de A. Las variables se deben asociar con elementos de A. En este libro presentamos dos métodos para interpretar fórmulas en estructuras. El primero utiliza valuaciones y es el más usual en lógica. El segundo método consiste en la expansión del lenguaje, al cual se añaden nuevas constantes y es propio de teoría de modelos. Más adelante presentamos la demostración de la equivalencia de ambos procedimientos. El método de valuaciones es el siguiente: Definición 8.1. La función β es una valuación en A, si β : {vn : n < ω} − → A. Fijemos una valuación arbitraria β en A. Definición 8.2. Sea t ∈ Tm(L) un término arbitrario. Definimos recursivamente la interpretación de s en A respecto a la valuación β, denotada t A [β] como sigue: Def (i) vnA [β] = β(vn ); 190 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 191 ✐ ✐ Conjuntos y modelos. Curso avanzado Def (ii) cA [β] = cA ; Def (iii) (fs(0) . . . s(τ(f ) − 1))A [β] = f A (s(0)A [β], . . . , s(τ(j) − 1)A [β]). Así que un término se interpreta en A, de tal forma que cada símbolo de función (de constante) se sustituye por la función (la constante) correspondiente de A, y cada variable se sustituye por el elemento determinado por β en A. Para definir la interpretación de una fórmula en una estructura A, debemos modificar las valuaciones. Definición 8.3. Sea β una valuación en A, a ∈ A y n < ω. Entonces definimos la valuación β(vn /a) en A mediante: Def β(vn /a) = ( β(vm ), a, cuando m 6= n cuando m = n. En consecuencia, β(vn /a) se distingue de β solamente en que la variable vn se evalúa como a. Con nuestra nueva definición de valuación podemos definir la relación de satisfacción |=, de gran trascendencia en el resto del libro. Definición 8.4. (Definición de satisfacción, Tarski, 1936). Sea ϕ ∈ Fml(L) una L-fórmula arbitraria. Definimos recursivamente la relación A |= ϕ[β] como sigue: (i) A |= (s1 =s ˙ 2 [β]) si y sólo si s1A [β] = s2A [β]; (ii) A |= Rs(0) . . . s(τ(R)−1)[β] si y sólo si RA (s(0)A [β], . . . , s(τ(i)−1)A [β]); (iii) A |= (ϕ1 ∧ϕ2 )[β] si y sólo si A |= ϕ1 [β] y A |= ϕ2 [β]; (iv) A |= ¬ϕ[β] si y sólo si A 6|= ϕ[β]; (v) A |= ∀ vn ϕ[β] si y sólo si, para toda a ∈ A , A |= ϕ[β(vn /a)]. Decimos que A satisface ϕ respecto a β o también que ϕ es cierta en A respecto a β, cuando A |= ϕ[β]. Para formalizar la definición de A |= ϕ[β] en el ámbito del teorema de recursión, se puede proceder como sigue. Definimos una función BA : Fml(L) − → V para fórmulas, con ayuda del teorema de recursión como: (i) BA (s1 =s ˙ 2 ) = {β : s1A [β] = s2A [β]}; Def (ii) BA (Rs(0) . . . s(τ(R) − 1)) = {β : RA (s(0)A [β], . . . , s(τ(R) − 1)A [β])}; Def (iii) BA ((ϕ1 ∧ϕ2 )) = BA (ϕ1 ) ∩ BA (ϕ2 ); Def (iv) BA (¬ϕ) = {β : β ∈ / BA (ϕ)}; 191 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 192 ✐ ✐ 4. Lógica Def (v) BA (∀ vn ) = {β : ∀ a ∈ A(β(vn /a) ∈ BA (ϕ))}. Definimos entonces A |= ϕ[β] si y sólo si β ∈ BA (ϕ). Según nuestra construcción A |= ϕ[β] es una LTC-fórmula con parámetros A, ϕ y β. Ejemplo 8.5. Considere la signatura σ = (∅, {f+ }, {c0 }, {(+, 2)}), la σestructura A = hR, +, 0i Def y la fórmula ϕ = ∀ v0 (f+ v0 v1 =v0 ). La fórmula ϕ es cierta en A para una valuación β si y sólo si se cumple que para toda a ∈ R , a + β(v1 ) = a. (Éste es exactamente el caso cuando β(v1 ) = 0). Generalizamos la relación de satisfacción a conjuntos de fórmulas. Definición 8.6. Sean Φ ⊆ Fml(L) y β una valuación en A. A satisface Φ mediante β si A satisface cada fórmula de Φ mediante β. En símbolos: A |= Φ[β] si para toda ϕ ∈ Φ , A |= ϕ[β]. La validez de la relación A |= ϕ[β] depende del valor de la valuación en una cantidad finita de variables vn , donde las vn son las variables libres de ϕ. Más aún, la validez de la relación A |= ϕ[β] en A depende solamente de un número finito de relaciones RA , funciones f A y constantes cA correspondientes a los símbolos R, f, c que figuran en ϕ. Lema 8.7 (Lema de coincidencia). Sea A una L-estructura. Supongamos que la L0 -estructura A0 y la L1 estructura A1 son expansiones de A. Además, sea β0 una valuación en A0 y β1 una valuación en A1 . Las siguientes afirmaciones son ciertas: (a) Para todo s ∈ Tm(L), si β0 ↾ var(s) = β1 ↾ var(s) entonces sA0 [β0 ] = sA1 [β1 ]. (b) Para toda ϕ ∈ Fml(L), si β0 ↾ lib(ϕ) = β1 ↾ lib(ϕ) entonces A0 |= ϕ[β0 ] si y sólo si A1 |= ϕ[β1 ]. Demostración. Ejercicio. Corolario 8.8. (a) La validez de A |= ϕ[β] depende solamente de los valores (un número finito) de β ↾ lib(ϕ), de un número finito de relaciones {RA : R ∈ ran(ϕ)}, de un número finito de funciones {f A : f ∈ ran(ϕ)} y de un número finito de constantes {cA : c ∈ ran(ϕ)}. 192 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 193 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) Si ϕ es un L-enunciado entonces la validez de A |= ϕ[β] no depende de β. Demostración. Def Def Def Def (a) Sean R′ = R∩ran(ϕ), F′ = F ∩ran(ϕ), K′ = K∩ran(ϕ), τ ′ = τ ↾ R′ ∪F′ Def y L′ = (R′ , F′ , K′ , τ ′ ). Además, sea β′ una valuación arbitraria en A′ con β′ ↾ lib(ϕ) = β ↾ lib(ϕ). Sea A′ el L′ -reducto de A. Del lema de coincidencia 8.7 (con A′ en lugar de A y A0 ; A en lugar de A1 ), deducimos que A |= ϕ[β] si y sólo si A′ |= ϕ[β]). De aquí se sigue inmediatamente la afirmación. (b) Se sigue de (a) pues lib(ϕ) = ∅. En vista del lema 8.7 podemos convenir lo siguiente: (a) Sea s ∈ Tm(L) y var(s) ⊆ {v0 , . . . , vn−1 }. Si ai = β(vi ) para i < n, escribimos sA [a0 , . . . , an−1 ] en lugar de sA [β], con lo que indicamos que sólo importa cómo se evalúan las variables v0 , . . . , vn−1 y de hecho sus valores son a0 , . . . , an−1 , que son elementos de A. (b) Sea ϕ ∈ Fmln (L) (respectivamente, Φ ⊆ Fmln (L)). Si ai = β(vi ) para i < n, escribimos A |= ϕ[a0 , . . . , an−1 ] en lugar de A |= ϕ[β] (respectivamente, A |= Φ[a0 , . . . , an−1 ] en lugar de A |= Φ[β]). La siguiente definición es de gran importancia. Definición 8.9. Si ϕ es un enunciado, tal que existe una valuación β con A |= ϕ[β], decimos que A es modelo de ϕ o que ϕ es verdadero en A y escribimos A |= ϕ. En forma análoga, definimos A |= Φ para un conjunto de enunciados Φ. Observe que la propiedad “tener modelo” es exclusiva de enunciados, no de fórmulas en general. En este punto es importante precisar qué se entiende por sustitución de un término en las variables (variables libres) de un cierto término (fórmula). Para ello fijemos un lenguaje L = (R, F, K, τ). Como abreviación usamos Var = {vn : n < ω}. Definición 8.10. Sean x ∈ Var y s, t ∈ Tm(L). 193 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 194 ✐ ✐ 4. Lógica (a) Definimos recursivamente la sustitución t{x/s} mediante Def y{x/s} = ( y, s, si y 6= x si y = x; Def c{x/s} = c; Def (ft0 . . . tτ(f )−1 ){x/s} = ft0 {x/s} . . . tτ(f )−1 {x/s}. (b) Para ϕ ∈ Fml(L) definimos recursivamente la sustitución ϕ{x/s} mediante Def (t1 =t ˙ 2 ){x/s} = t1 {x/s}=t ˙ 2 {x/s} Def (Rt0 . . . tτ(R)−1 ){x/s} = Rt0 {x/s} . . . tτ(R)−1 {x/s} Def (ψ ∧ ϕ){x/s} = ψ{x/s} ∧ ϕ{x/s} Def (¬ψ){x/s} = ¬(ψ{x/s}) Def (∀yψ){x/s} = ( ∀yψ, si y = x ∀y(ψ{x/s}), si y 6= x. Según esto, t{x/s} es el término que se obtiene sustituyendo en t cada presencia de x por s, y ϕ{x/s} es la fórmula que se obtiene sustituyendo en ϕ cada presencia libre de x por s. Ejemplo 8.11. Considere el lenguaje de la teoría de grupos, donde 0 representa Def al elemento neutro y + la operación del grupo. Sea ϕ = (∃ u(u + z=0)∧∃ ˙ z(u + z=0)). ˙ Entonces ϕ{z/x + y} = (∃ u(u + (x + y)=0)∧∃ ˙ z(u + z=0)). ˙ Al realizar una sustitución puede ocurrir que una variable de un término que se está sustituyendo aparezca en el alcance de un cuantificador y sea la variable a cuantificar, lo que no es conveniente. Según nuestra intuición ϕ{x/s} debe ser un caso especial de ϕ; si ϕ es válida en un modelo A para cada valuación β, entonces ϕ{x/s} debe ser válida en ese modelo para cada valuación. Consideremos, por ejemplo, en el contexto de la teoría de grupos, la fórmula ϕ = ∃ x(x+z=0), ˙ entonces es válido Z |= ∃ x(x+z=0)[β] ˙ para cada valuación β. Sin embargo, Z 6|= ϕ{z/x + y}[β], 194 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 195 ✐ ✐ Conjuntos y modelos. Curso avanzado (donde ϕ{z/x + y} = ∃ x(x + (x + y)=0)) ˙ si β(y) = 1. En tal situación, pretendemos considerar solamente sustituciones que no den lugar a tales patologías. Esto se consigue con la siguiente definición. Definición 8.12. Sean ϕ ∈ Fml(L) y s ∈ Tm(L). ϕ, s son compatibles si ninguna variable acotada de ϕ aparece en s. En cierto sentido, el siguiente teorema establece que ϕ{x/s} es un caso particular de ϕ cuando ϕ y s son compatibles. Teorema 8.13 (Sustitución). Sean A una L-estructura, β una valuación en A, x ∈ Var y s ∈ Tm(L). (a) Si t ∈ Tm(L), entonces t{x/s}A [β] = t A [β(x/sA [β])]. (b) Si ϕ ∈ Fml(L) tal que ϕ y s son compatibles, entonces A |= ϕ{x/s}[β] si y sólo si A |= ϕ[β(x/sA [β])]. Demostración. (a) Por inducción sobre la construcción de términos. t = c. Puesto que cA [γ] = c, para cada valuación γ, este caso es evidente. t = y. Si y = x, entonces (x{x/s})A [β] = sA [β] = β(x/sA [β])(x) = xA [β(x/sA [β])]. Si y 6= x, entonces (y{x/s})A [β] = yA [β] = β(y) = β(x/sA [β])(y) = yA [β(x/sA [β])]. t = ft0 . . . tτ(f )−1 . En este caso (ft0 . . . tτ(f )−1 ){x/s})A [β] = (ft0 {x/s}, . . . , tτ(f )−1 {x/s})A [β] = f A t0 {x/s}A [β] . . . tτ(f )−1 {x/s}A [β] A A = f A t0A [β(x/sA [β])] . . . tτ(f )−1 [β(x/s [β])] HI = (ft0 . . . tτ(f )−1 )A [β(x/sA [β])]. Con esto queda demostrado (a). 195 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 196 ✐ ✐ 4. Lógica (b) Por inducción sobre la construcción de fórmulas. Def ϕ = t1 =t ˙ 2. A |= (t1 =t ˙ 2 ){x/s}[β] si y sólo si A |= (t1 {x/s})[β]=(t ˙ 2 {x/s})[β] si y sólo si (t1 {x/s})A [β] = (t2 {x/s})A [β] si y sólo si (por (a)) t1A [β(x/sA [β])] = t2A [β(x/sA [β])] si y sólo si A |= t1 =t ˙ 2 [β(x/sA [β])]. Def ϕ = Rt0 . . . tτ(R)−1 . A |= (Rt0 . . . tτ(R)−1 ){x/s}[β] si y sólo si RA (t0 {x/s}A [β] . . . tτ(R)−1 {x/s}A [β]) A si y sólo si (por (a)) RA (t0A [β(x/sA [β])] . . . tτ(R)−1 [β(x/sA [β])]) si y sólo si A |= Rt0 . . . tτ(R)−1 [β(x/sA [β])]. Def ϕ = (ψ1 ∧ψ2 ). A |= (ψ1 ∧ψ2 ){x/s}[β] si y sólo si A |= (ψ{x/s}∧ψ2 {x/s})[β] si y sólo si A |= ψ1 {x/s}[β] y A |= ψ2 {x/s}[β] h si y sólo si (por H. I.) A |= ψ1 β(x/sA [β]) h y A |= ψ2 β(x/sA [β]) i h i i si y sólo si A |= (ψ1 ∧ψ2 ) β(x/sA [β]) . Def ϕ = ¬ψ. Este caso se trata en forma similar al caso anterior. ϕ = ∀ yψ. Aquí distinguimos dos subcasos. Subcaso 1. y = x. Tenemos lo siguiente: A |= (∀ yψ){x/s}[β] si y sólo si A |= ∀ yψ[β] si y sólo si (pues x = y ∈ / lib(∀ yψ)) h i A |= ∀ yψ β(x/sA [β]) . Subcaso 2. y 6= x. Primero mostramos que (1) si a ∈ A y β es una valuación en A, entonces   β(y/a)(x/sA β(y/a) ) = β(x/sA [β])(y/a). 196 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 197 ✐ ✐ Conjuntos y modelos. Curso avanzado Prueba de (1). Es claro que ambas valuaciones coinciden en las variables z tales que z ∈ Var \ {x}. Ya que ϕ y s son compatibles, y ∈ / var(s). Entonces    β(y/a)(x/sA β(y/a) )(x) = sA β(y/a) x6=y =   y∈var(s) / A = s [β]  β(x/sA [β]) (y/a)(x). Con lo que todos los casos quedan demostrados. ◭ Ya que cada variable acotada en ψ también lo está en ϕ, tanto ϕ, s como ψ, s son compatibles. Se deduce entonces que A |= (∀ yψ){x/s}[β] si y sólo si A |= ∀ y(ψ{x/s})[β]  si y sólo si para toda a ∈ A, A |= ψ{x/s} β(y/a) si y sólo si (por H. I.) para toda a ∈ A, h  i  A |= ψ (β(y/a))(x/sA β(y/a) ) si y sólo si (por (1)) para toda a ∈ A, h A |= ψ β(x/sA [β])(y/a) h i i si y sólo si A |= ∀ yψ β(x/sA [β]) . Toca el turno a la presentación de otro procedimiento para asignar valores de verdad a fórmulas del L-lenguaje. Recuerde el lector la definición 3.4 sobre la adición de nuevos símbolos de constante a una estructura. Sean A una L-estructura y M ⊆ A un subconjunto. Para cada a ∈ M ◦ escogemos un nuevo símbolo de constante, que denotamos a y definimos ◦ ◦ ◦ M = {a : a ∈ M}. Entonces L(M) es la expansión de L mediante nuevas constantes de M. Para una L-estructura arbitraria B y una función f : M ◦ − → B, denotamos con (B, f [M]) la L(M)-estructura en la que todo símbolo de ◦ ◦ ◦ constante a ∈ M se interpreta como f (a). La L(M)-estructura que se genera de A, en el caso f = idM para M ⊆ A, se denota por (A, M). Definición 8.14. Un término cerrado es un término que no tiene variables. 197 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 198 ✐ ✐ 4. Lógica ◦ Recuerde que A es el universo de A. Procedamos a definir el valor de un L(A)-término cerrado en (A, A): ◦ Definición 8.15. Si A es una L-estructura y t un término cerrado en L(A), ∗ Def definimos el valor de t en A∗ = (A, A), en símbolos t A , como sigue: ∗ (i) Si t es el símbolo de constante c ∈ K, t A = cA . ◦ ∗ (ii) Si t es la constante a para a ∈ A, t A = a. ◦ (iii) Si t es el término ft0 . . . tn−1 para n ∈ N, f ∈ F, τ(f ) = n y L(A)-términos cerrados t0 , . . . , tn−1 , entonces ∗ ∗ ∗ A t A = f A (t0A , . . . , tn−1 ). ◦ Esta evaluación es una función del conjunto de los L(A)-términos cerrados ◦ a A. La valuación de los L(A)-enunciados en A∗ es, en cambio, una función ◦ de Fml0 (L(A)) al conjunto {verdadero, falso}. La veracidad de un enunciado la definimos en seguida: ◦ Definición 8.16. Si A es una L-estructura, la veracidad del L(A)-enunciado ϕ Def en A∗ = (A, A), en símbolos A∗ |= ϕ, se define recursivamente a continuación (si A∗ |= ϕ, decimos que ϕ es verdadera en A∗ o que ϕ es válida en A∗ ): ◦ ◦ Sean R ∈ R, τ(R) = n, t0 , . . . , tn−1 L(A)-términos cerrados, ψ, ψ1 , ψ2 ◦ L(A)-enunciados y ϑ una L(A)-fórmula con a lo sumo una variable libre. ∗ ∗ (i) A∗ |= (t1 =t ˙ 2 ) si t1A = t2A . ∗ A∗ ). (ii) A∗ |= R(t0 , . . . , tn−1 ), si RA (t0A , . . . , tn−1 (iii) A∗ |= ¬ψ, si A∗ 6|= ψ, es decir, si no es cierto que A∗ |= ψ. (iv) A∗ |= ψ1 ∧ ψ2 , si A∗ |= ψ1 y A∗ |= ψ2 . ◦ ◦ (v) A∗ |= ∀ xϑ si para toda a ∈ A, A∗ |= ϑ{x/a}, donde ϑ{x/a} es la fórmula ◦ que se obtiene al sustituir en ϑ toda presencia libre de x por a. Sean A una L-estructura y ~a = (a0 , . . . , an−1 ) ∈ An (n bien puede ser 0 o incluso ~a ser vacía). Si t = t(x0 , . . . , xn−1 ) es un L-término, entonces el valor de t respecto a ~a ◦ ◦ en A, denotado t A (~a), es el elemento t{~x/~a} donde A∗ = (A, A) y t{~x/~a} es el ◦ ◦ ◦ L(A)-término cerrado t{x0 /a0 , . . . , xn−1 /an−1 }. 198 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 199 ✐ ✐ Conjuntos y modelos. Curso avanzado Si ϕ = ϕ(x0 , . . . , xn−1 ) es una L-fórmula, decimos que la n-ada ~a = (a0 , . . . , an−1 ) satisface la fórmula ϕ en A, en símbolos A |= ϕ(a0 , . . . , an−1 ), ◦ si A∗ |= ϕ{~x/~a}. Extendemos la notación de la definición a conjuntos arbitrarios de fórmulas Φ(~x) = {ϕi (~x) : i ∈ I} con las mismas variables libres ~x: A |= Φ(~a) si A |= ϕi (~a) para toda i ∈ I. Una L-fórmula ϕ es satisfacible en A si existe una n-ada de elementos de A que satisface a ϕ en A. La fórmula ϕ es válida (o cierta) en A, A |= ϕ si toda n-ada de elementos de A satisface a ϕ en A. En general, una fórmula ϕ es satisfacible si existe una L-estructura A que la satisface, y ϕ es universalmente válida, |= ϕ, si es cierta en toda L-estructura. Una fórmula no satisfacible se conoce como contradictoria. El siguiente lema establece una relación entre modelos y expansiones de lenguaje. Lema 8.17 (Coincidencia en la extensión de lenguajes). Sean L ⊆ L′ lenguajes y B una L′ -estructura. Para toda L-fórmula ϕ(~x) y toda n-ada ~a de B, se cumple que B |= ϕ(~a) si y sólo si A |= ϕ(~a), donde A = B ↾ L es un reducto de B. Demostración. Sea L = (K, F, R, τ). Primero se demuestra para L-términos t = t(~x) que t B (~a) = t A (~a), (*) por inducción en la construcción del término. Como ejemplo, sean t0 , . . . , tn−1 L-términos para los que (*) es cierto (hipótesis de inducción) y sea f ∈ F un símbolo de n-función. Debemos mostrar que (*) es cierta para t = ft0 . . . tn−1 . Se cumple tiB (~a) = tiA (~a) para i < n por hipótesis de inducción, pero en estas condiciones f B = f A (definición de reducto); por consiguiente, t B (~a) = t A (~a). Después se demuestra la afirmación del lema por inducción sobre la construcción de fórmulas. Otra vez consideramos un caso como ejemplo; los demás son sencillos. Sea ϑ una L-fórmula para la cual la afirmación es cierta (hipótesis de inducción). Debemos mostrar que la afirmación también es cierta para ϕ(~x) = ∃ y ϑ(~x, y). Por definición, B |= ϕ(~a) si y sólo si B |= ϑ(~a, b) para alguna 199 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 200 ✐ ✐ 4. Lógica b ∈ B. Esto último es equivalente a A |= ϑ(~a, b) para alguna b ∈ B, si y sólo si (por H.I.) A |= ϕ(~a). 9. La relación de consecuencia lógica Ya que disponemos de la relación de satisfacción, podemos definir otra importante relación: la de consecuencia lógica. Puede ocurrir que un conjunto de fórmulas no se satisfaga en toda estructura. Pero si siempre que se satisface en una estructura, también es cierta una fórmula ϕ (en la misma estructura), diremos que el conjunto de fórmulas implica lógicamente a ϕ, o que ϕ se deduce del conjunto de fórmulas. Definición 9.1. Sean Φ ⊆ Fml(L) y ϕ ∈ Fml(L). Φ |= ϕ significa que para toda L-estructura A y para toda valuación β, si A |= Φ[β] entonces A |= ϕ[β]. Si Φ |= ϕ, decimos que Φ implica lógicamente a ϕ o también que ϕ es consecuencia lógica de Φ. Note el uso del símbolo |= en la noción de consecuencia. No se contradice con el significado que antes le habíamos asignado. Cuando a la izquierda está una estructura, nos referimos al concepto de modelo o satisfacción. En el caso de implicación lógica, a la izquierda siempre está un conjunto de fórmulas. Si ϕ, ϕ1 , . . . , ϕn ∈ Fml(L), entonces escribimos ϕ1 , . . . , ϕn |= ϕ en lugar de {ϕ1 , . . . , ϕn } |= ϕ. Definición 9.2. Sea ϕ ∈ Fml(L). La fórmula ϕ es universalmente válida si es verdadera en toda estructura o, lo que es lo mismo, si es consecuencia lógica del conjunto vacío de fórmulas, lo que denotamos por |= ϕ. Un conjunto Φ de fórmulas es satisfacible si tiene un modelo: Definición 9.3. Sea Φ ⊆ Fml(L). Φ es satisfacible, en símbolos Sat(Φ), si existe una L-estructura A y una valuación β tales que A |= Φ[β]. Sea ϕ ∈ Fml(L). La fórmula ϕ es satisfacible si {ϕ} es satisfacible. Lema 9.4. Es cierto que Φ |= ϕ si y solamente si no se cumple Sat(Φ∪{¬ϕ}). En particular, |= ϕ si y sólo si no se cumple Sat(¬ϕ). 200 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 201 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. ⇒ ) Supongamos la validez de Φ |= ϕ y que Φ ∪ {¬ϕ} es satisfacible en A respecto a la valuación β. Entonces A |= ¬ϕ[β], así que A 6|= ϕ[β]. Por otra parte, es cierto que A |= Φ[β], lo cual conduce a A |= ϕ[β] puesto que Φ |= ϕ, con lo que obtenemos una contradicción. ⇐ ) Supongamos ahora que Φ 6|= ϕ. Entonces existe una L-estructura A y una valuación β en A tal que A |= Φ[β] y A 6|= ϕ[β] son válidas. Lo último es equivalente a A |= ¬ϕ[β]. En resumen tenemos A |= Φ ∪ {¬ϕ}[β], es decir, Sat(Φ ∪ {¬ϕ}). Con esto queda demostrado el lema. Nuestra siguiente tarea será describir el comportamiento de términos y fórmulas respecto a homomorfismos. Lema 9.5. Sean A y B L-estructuras y h : A − → B. (a) Si h es un homomorfismo, entonces, para todo término t(~x) de L y toda n-ada ~a de A, h(t A [~a]) = t B [h(~a)]. (b) h es un homomorfismo si y sólo si para toda fórmula atómica ϕ(~x) de L y toda n-ada de elementos de A, A |= ϕ[~a] implica que B |= ϕ[h(~a)]. (*) A |= ϕ[~a] si y sólo si B |= ϕ[h(~a)]. (**) (c) h es un encaje si y sólo si para toda fórmula atómica ϕ(~x) de L y toda n-ada de elementos de A, Demostración. (a) Se prueba fácilmente por inducción en la construcción de t, usando la definición de la valuación de términos. (b) Suponga primero que h es un homomorfismo. Como ejemplo típico suponga además que ϕ(~x) = Rst, donde s(~x) y t(~x) son términos. Suponga que A |= ϕ[~a]. Entonces RA (sA [~a], t A [~a]). Por (a) y el hecho de que h es un homomorfismo: (sB [h(~a)], t B [h(~a)]) = (h(sA [~a]), h(t A [~a])) ∈ RB . En consecuencia, B |= ϕ[h(~a)] por la definición de satisfacción. En esencia, la misma prueba funciona para cualquier fórmula atómica ϕ. Para el recíproco, otra vez tomamos un ejemplo. Suponga que (*) es válido 201 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 202 ✐ ✐ 4. Lógica para toda fórmula atómica ϕ y toda n-ada ~a. Suponga que RA (a0 , a1 ). Escribimos ~a en lugar de (a0 , a1 ). Con ello A |= Rx0 x1 [~a]. Entonces (*) implica B |= Rx0 x1 [h(~a)], lo que, por definición de satisfacción, conduce a RB (h(a0 ), h(a1 )) como se requiere. Por lo tanto, h es un homomorfismo. (c) Se prueba de manera similar. Definición 9.6. Una literal es una fórmula atómica o la negación de una fórmula atómica; si la literal no tiene variables la llamamos literal cerrada. Corolario 9.7. Sea A y B L-estructuras y f : A − → B. Entonces f es un encaje si y sólo si, para toda literal ϕ(~x) de L y toda n-ada ~a de An , se cumple: A |= ϕ[~a] implica que B |= ϕ[f (~a)]. Demostración. Es inmediata del lema 9.5(c). Lema 9.8. Sea B una L-estructura y X ⊆ B. Entonces las siguientes afirmaciones son equivalentes: (a) X = A para alguna subestructura A ⊆ B, donde A = |A|. (b) Para toda constante c de L, cB ∈ X; para toda n > 0, todo símbolo f de n-función y toda n-ada de elementos de X, f B (~a) ∈ X. Si (a) y (b) son ciertas, A es única. Demostración. Supongamos que (a) es cierta. Entonces para todo símbolo de constante c de L, cB = cA ; pero cA ∈ A = X, así que cB ∈ X. De modo similar, para cada símbolo de n-función f de L y cada n-ada de elementos ~a de X, ~a es una n-ada en A y f B (~a) = f A (~a) ∈ A = X. Esto prueba (b). Recíprocamente, si (b) es cierta, podemos definir A haciendo A = X, A c = cB para cada constante c de L, f A = f B ↾ Xn para cada símbolo de n-función f de L, y RA = RB ∩ Xn para cada símbolo de n-relación R de L. Entonces A ⊆ B; más aún, ésta es la única definición posible de A, puesto que requerimos que A ⊆ B y A = X. Sea B una L-estructura y Y un conjunto de elementos de B. Se sigue fácilmente del lema 9.8 que existe una única subestructura (la más pequeña posible) A de B, cuyo dominio contiene a Y ; A se conoce como la subestructura de B generada por Y , o la envolvente de Y en B, en símbolos A = hY iB . Y es 202 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 203 ✐ ✐ Conjuntos y modelos. Curso avanzado un conjunto de generadores para A. Una estructura B es finitamente generada si B es de la forma hY iB para algún conjunto finito Y . Podemos estimar la cardinalidad de una estructura hY iB , en términos de la cardinalidad de Y y de L. Teorema 9.9. Sea B una L-estructura y Y un conjunto de elementos de B. Entonces |hY iB | ≤ |Y | + |L|. Demostración. Construiremos hY iB de manera explícita, con lo que se probarán la unicidad y la existencia al mismo tiempo. Definimos un conjunto Ym ⊆ B, para cada m < ω, por inducción: Y0 = Y ∪ {cB : c es una constante de L}, Ym+1 = Ym ∪ {f B (~a) : para alguna n > 0, f es un símbolo de n-función y ~a es una n-ada de elementos de Ym .} S Finalmente hacemos X = m<ω Ym . Resulta claro que X satisface la condición (b) del lema 9.8, así que existe una única subestructura A de B con X = A. Si A′ es una subestructura de B con Y ⊆ A′ , entonces por inducción sobre m se prueba que Ym está contenido en A′ (por la implicación (a) ⇒ (b) en el lema 9.8), con lo que X ⊆ A′ . Por consiguiente, A es la subestructura más pequeña de B cuyo dominio contiene a Y , es decir, A = hY iB . Para estimar la cardinalidad de A, hacemos κ = |Y | + |L|. Claramente |Y0 | ≤ κ. Para cada n fija, si Z es un subconjunto de B de cardinalidad ≤ κ, entonces el conjunto {f B (~a) : f es un símbolo de n-función de L y ~a ∈ Zn } tiene cardinalidad no mayor que κ · κn = κ, pues κ es infinito. Por lo tanto, si |Ym | ≤ κ, entonces |Ym+1 | ≤ κ + κ = κ. Por inducción sobre m, cada |Ym | ≤ κ y |X| ≤ ω · κ = κ. Como |hY iB | = |X| por definición, esto prueba el teorema. Nuestro interés original fue definir la veracidad de L-enunciados en Lestructuras. Ocupémonos entonces de hacerlo: Hemos definido dos formas de interpretar fórmulas en L-estructuras: la primera mediante valuaciones y la segunda extendiendo el lenguaje L. Para probar la equivalencia de ambas requerimos la siguiente convención: si una 203 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 204 ✐ ✐ 4. Lógica L-fórmula ϕ es cierta en la L-estructura A respecto a la primera forma, escribiremos A |=I ϕ, y respecto a la segunda como A |=II ϕ. Definición 9.10. Una L-fórmula es II-satisfacible en la L-estructura A si existe una n-ada de elementos de A (de longitud n adecuada al número de variables libres de ϕ) que II-satisface ϕ en A. La fórmula ϕ es válida (o cierta) en A y escribimos A |=II ϕ, cuando toda n-ada (n el número de variables libres de ϕ) satisface a ϕ en A. En general, una L-fórmula ϕ es universalmente válida (o lógicamente válida), en símbolos |=II ϕ, cuando es cierta en cada L-estructura no vacía. Toca el turno a la demostración de la equivalencia de ambas estructuras. Teorema 9.11. Sean ϕ una L-fórmula y A una L-estructura. Si ϕ es Isatisfacible en A, entonces ϕ es II-satisfacible en A. Demostración. Como ϕ es I-satisfacible, existe una valuación β tal que A |=I ϕ[β] con β(vi ) = ai . Entonces obviamente la n-ada (a0 , . . . , an−1 ) II-satisface a ϕ en A, es decir, y, por lo tanto, A |=II ϕ(~a). ~◦ A∗ |= ϕ{~x/a} Teorema 9.12. Sean ϕ(~x) una L-fórmula y A una L-estructura. Si existe una n-ada de elementos de A tal que A |=II ϕ(~a), entonces existe una valuación β tal que A |=I ϕ[β]. n. Demostración. Basta definir la valuación con β(xi ) = ai , para 0 ≤ i < El siguiente corolario es una consecuencia inmediata de los teoremas 9.12 y 9.11: Corolario 9.13. Una L-fórmula ϕ es I-satisfacible si y sólo si es II-satisfacible. Si ϕ es un L-enunciado, entonces |=I ϕ si y sólo si |=II ϕ. Con este corolario hemos establecido la equivalencia de ambas definiciones de interpretación. En lo sucesivo escogeremos libremente alguna de las dos, de acuerdo con nuestra conveniencia; cuando no se establezca cuál se está usando, el lector puede elegir la más adecuada al contexto. 204 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 205 ✐ ✐ Conjuntos y modelos. Curso avanzado 10. Modelos y sistemas axiomáticos En muchas áreas de las matemáticas se investigan estructuras con ciertas propiedades comunes. Por ejemplo, se estudian órdenes lineales, grupos, campos, etc. Ahora investiguemos los modelos (que en general conforman clases propias) de cierta teoría. Definición 10.1. (a) Sea Φ ⊆ Fml0 (L). Def ModL (Φ) = {A : A es una L-estructura y A |= Φ} es la clase de L-modelos de Φ. (b) Sea K una clase de L-estructuras. K es axiomatizable cuando existe un conjunto Φ ⊆ Fml0 (L) con K = ModL (Φ); Φ es entonces un sistema de axiomas para K. Ahora definimos algunas clases de modelos: 10.1. La clase de modelos de los conjuntos infinitos. Considere L∅ = (∅, ∅, ∅, ∅), el lenguaje vacío. Fml0 (∅) consiste (esencialmente) en afirmaciones sobre variables: para 1 ≤ n < ω, sea Def ϕ≥n = ∃ v0 . . . ∃ vn−1 ^ i<j<n ¬(vi =v ˙ j ). Def A |= ϕ≥n es cierta si y sólo si |A| ≥ n. La fórmula ϕ=n = (ϕ≥n ∧¬ϕ≥n+1 ) formaliza la afirmación de que el universo de una estructura tiene exactamente n elementos. Una estructura A es modelo de todas las afirmaciones ϕ≥n si y sólo si el universo de A es infinito. Esto valida la siguiente definición: Def Definición 10.2. Φ∞ = {ϕ≥n : 1 ≤ n < ω} axiomatiza la clase de modelos de las estructuras infinitas, es decir, los conjuntos infinitos. 10.2. La clase de modelos de las relaciones de equivalencia. Def Sea LEq = ({R}, ∅, ∅, {(R, 2)}). Sea Def ΦEq = {∀ v0 Rv0 v0 , ∀ v0 ∀ v1 (Rv0 v1 ⇒ Rv1 v0 ), ∀ v0 ∀ v1 ∀ v2 ((Rv0 v1 ∧Rv1 v2 ) ⇒ Rv0 v2 )}. ΦEq axiomatiza la clase de modelos de las relaciones de equivalencia (cuyo campo, es decir, la unión de su dominio y su rango, es un conjunto). 205 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 206 ✐ ✐ 4. Lógica 10.3. La clase de modelos de los grupos. Sea Def LGr = (∅, {f }, {e}, {(f, 2)}). El conjunto ΦGr consta de los siguientes LGr -enunciados: (i) ∀ v0 ∀ v1 ∀ v2 ffv0 v1 v2 =fv ˙ 0 fv1 v2 (asociatividad). (ii) ∀ v0 (fev0 =v ˙ 0 ∧fv0 e=v ˙ 0 ) (propiedad del elemento neutro). (iii) ∀ v0 ∃ v1 fv0 v1 =e ˙ (existencia del elemento inverso por la derecha). ΦGr axiomatiza la clase de modelos de grupos. 10.4. La clase de modelos de los grupos abelianos. Definimos ΦAGr mediante Def ˙ 1 v0 }. ΦAGr = ΦGr ∪ {∀ v0 v1 fv0 v1 =fv ΦAGr axiomatiza la clase de modelos de los grupos abelianos y se llama teoría de los grupos abelianos. 10.5. La clase de modelos de la aritmética de Peano. Def Sea LAr = (∅, {f+ , f· }, {c0 , c1 }, {(f+ , 2), (f· , 2)}) el lenguaje de la aritmética. El conjunto ΦPA consiste en los siguientes LAr -teoremas: (i) ∀ v0 ¬(f+ v0 c1 =c ˙ 0 ); (ii) ∀ v0 f+ v0 c0 =v ˙ 0; (iii) ∀ v0 f· v0 c0 =c ˙ 0; (iv) ∀ v0 ∀ v1 (f+ v0 c1 =f ˙ + v1 c1 ⇒ v0 =v ˙ 1 ); (v) ∀ v0 ∀ v1 f+ v0 f+ v1 c1 =f ˙ + f+ v0 v1 c1 ; (vi) ∀ v0 ∀ v1 f· v0 f+ v1 c1 =f ˙ + f· v0 v1 v0 ; (vii) Esquema de inducción: Para cada n < ω y cada ϕ ∈ Fmln+1 (LAr ), se tiene el enunciado ∀ v0 . . . ∀ vn−1 ((ϕ{vn /c0 }∧∀ vn (ϕ ⇒ ϕ{vn /f+ vn c1 } ⇒ ∀ vn ϕ). Si una propiedad que se puede expresar mediante una fórmula del lenguaje LAr de la aritmética, es cierta para el elemento neutro 0, y de la validez de esta propiedad para algún elemento x se deduce su validez para el elemento x + 1, entonces la propiedad es cierta para todo elemento. El esquema de inducción (vii) sustituye al axioma Fund de la teoría de conjuntos. ΦAP se llama aritmética de Peano y formaliza la clase de modelos de la aritmética de Peano; también suele denotarse como AP. Un modelo de ΦAP lo constituyen los números naturales con las operaciones y constantes usuales. 206 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 207 ✐ ✐ Conjuntos y modelos. Curso avanzado 10.6. La clase de modelos de los órdenes lineales densos sin extremos. Sea Def LOLD = ({R}, ∅, ∅, {(R, 2)}). ΦOLD contiene exactamente los siguientes enunciados: (i) ∀ v0 ¬ Rv0 v0 (antirreflexividad); (ii) ∀ v0 ∀ v1 (¬ v0 =v ˙ 1 ⇒ (Rv0 v1 ∨ Rv1 v0 )) (tricotomía); (iii) ∀ v0 ∀ v1 ∀ v2 ((Rv0 v1 ∧ Rv1 v2 ) ⇒ Rv0 v2 ) (transitividad); (iv) ∀ v0 ∀ v1 ∃ v2 (Rv0 v1 ⇒ (Rv0 v2 ∧ Rv2 v1 )) (densidad); (v) ∀ v0 ∃ v1 ∃ v2 (Rv1 v0 ∧ Rv0 v2 ) (ausencia de extremos). ΦOLD axiomatiza la clase de modelos de los órdenes lineales densos sin extremos. 11. Un cálculo lógico Por un momento dejamos la parte semántica de nuestro estudio para retornar a los asuntos sintácticos; en realidad, pretendemos establecer una relación entre ambas partes. La forma en que un matemático procede para desarrollar una teoría matemática principia al obtener un panorama general de la teoría; se trata de averiguar qué proposiciones se deducen de sus axiomas. Para mostrar que una proposición se sigue de los axiomas, se debe encontrar una prueba. Hasta ahora sólo hemos definido lo que significa que una fórmula ϕ sea consecuencia lógica de un conjunto de fórmulas Φ. Sin embargo, ¿qué relación existe entre encontrar una prueba de ϕ a partir de Φ y el hecho de que Φ |= ϕ? Más aún, no hemos definido formalmente lo que entendemos por una prueba. Rara vez un matemático aprende, desde sus estudios iniciales, qué es una demostración, al menos en su definición formal; sin embargo, los métodos que utiliza coinciden con esta última. En esta sección nuestro principal objetivo es presentar formalmente qué entendemos por demostración matemática, y en particular qué significa probar que una fórmula ϕ se deduce lógicamente de un conjunto de fórmulas Φ. Nuestra forma de proceder será descubrir lo que se conoce como deducción natural. En una prueba matemática se pasa de un enunciado al siguiente y así sucesivamente hasta alcanzar la afirmación del teorema. Los enunciados con los que se cuenta dependen de las hipótesis. Éstas pueden ser hipótesis del teorema o hipótesis adicionales temporales. Por ejemplo, si se quiere 207 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 208 ✐ ✐ 4. Lógica probar una afirmación ϕ por contradicción, se añade ¬ϕ a las hipótesis y, si se obtiene una contradicción, entonces ϕ se ha probado, y se elimina la suposición adicional ¬ϕ. Esta observación nos permite describir una etapa en una prueba: se listan las hipótesis y la afirmación correspondiente. Si llamamos a la lista (sucesión) de fórmulas una secuencia, entonces podemos usar secuencias para caracterizar “las etapas de una prueba”. Por ejemplo, “la etapa” con suposición ϕ1 , . . . , ϕn y afirmación ϕ se traduce en la secuencia ϕ1 · · · ϕn ϕ. La secuencia ϕ1 · · · ϕn es el antecedente y ϕ es el consecuente de la secuencia ϕ1 · · · ϕn ϕ. A grandes rasgos, ésta es la idea de la definición de prueba que queremos introducir. Ahora pasamos a definir formalmente todas las nociones involucradas. Reglas de un cálculo de secuencias. Iniciamos la descripción de nuestro cálculo de secuencias. Vamos a proponer una serie de reglas que nos permiten pasar de una etapa a la siguiente en una demostración, mediante la deducción de una fórmula a partir de fórmulas previas. Para presentar las reglas, utilizamos con frecuencia la siguiente definición: Definición 11.1. Sean ψ, ϕ1 , . . . , ϕn y ϕ L-fórmulas dadas. Entonces ϕ1 · · · ϕn Def (ψ) = ((ϕ1 ∧ · · · ∧ ϕn ∧ ψ) ⇒ ϕ). ϕ Es decir, de las premisas ϕ1 , . . . , ϕn se puede deducir la conclusión ϕ en presencia de la condición adicional ψ. Puesto que el cálculo lógico debe corresponder sintácticamente a la relación semántica de consecuencia, tiene sentido aislar propiedades adecuadas de la relación de consecuencia para construir el cálculo lógico. El siguiente teorema recopila estas propiedades. Decimos que una regla es válida si recupera la relación de consecuencia: siempre que las premisas sean ciertas también lo es la conclusión (al interpretarse en un modelo). Usamos la siguiente notación para describir las reglas: por ejemplo, la tercera regla de conjunción es Φ |= ϕ1 Φ |= ϕ2 . Φ |= (ϕ1 ∧ ϕ2 ) Esto significa que las premisas se encuentran encima de la raya y la conclusión debajo y que de las premisas Φ |= ϕ1 y Φ |= ϕ2 se deduce la conclusión 208 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 209 ✐ ✐ Conjuntos y modelos. Curso avanzado Φ |= (ϕ1 ∧ ϕ2 ). Al lado de la raya se ponen condiciones adicionales que se deben satisfacer para establecer la conclusión. Teorema 11.2. Las siguientes reglas son válidas: Regla de inicio (RI): Si ϕ ∈ Φ o existe s ∈ Tm(L) tal que ϕ = s=s, ˙ entonces se tiene la siguiente regla: . Φ |= ϕ Primera regla de conjunción (∧1): Φ |= (ϕ1 ∧ϕ2 ) . Φ |= ϕ1 Segunda regla de conjunción (∧2): Φ |= (ϕ1 ∧ϕ2 ) . Φ |= ϕ2 Tercera regla de conjunción (∧3): Φ |= ϕ1 Φ |= ϕ2 . Φ |= (ϕ1 ∧ϕ2 ) Regla de contradicción (¬1): Φ |= ϕ Φ |= ¬ϕ . Φ |= ψ Regla de casos (¬2): Φ ∪ {ψ} |= ϕ Φ ∪ {¬ψ} |= ϕ . Φ |= ϕ Regla de instanciación (∀1): Si ϕ, s son compatibles, entonces Φ |= ∀ xϕ . Φ |= ϕ{x/s} Regla universal (∀2): Si y ∈ / lib(Φ) ∪ var(ϕ), entonces Φ |= ϕ{x/y} . Φ |= ∀ xϕ Regla de igualdad ((=)): Si ϕ ∈ At(L), entonces Φ |= r =s ˙ Φ |= ϕ{x/r} . Φ |= ϕ{x/s} 209 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 210 ✐ ✐ 4. Lógica Regla de monotonía (⊆): Si Φ ⊆ Φ′ , entonces Φ |= ϕ . Φ′ |= ϕ Las reglas anteriores se conocen como reglas del cálculo de secuencias. Demostración. La validez de las reglas RI, ∧1, ∧2 e ∧3 se comprueba fácilmente. Regla de contradicción. Si Φ |= ϕ y Φ |= ¬ϕ, entonces Φ no es satisfacible. Por lo anterior y de la definición de |=, se obtiene Φ |= ψ para cada ψ ∈ Fml(L). Regla de casos. Sea A |= Φ. Entonces se cumple A |= ψ o A 6|= ψ, es decir, A |= ¬ψ. Así que A |= Φ ∪ {ψ} o A |= Φ ∪ {¬ψ}. Como Φ ∪ {ψ} |= ϕ (respectivamente, Φ ∪ {¬ψ} |= ϕ) se sigue en ambos casos A |= ϕ, lo que se quería probar. Regla de instanciación. Supongamos Φ |= ∀ xϕ y sean ϕ, s compatibles. Sea β tal que A |= Φ[β]. Entonces A |= ∀ xϕ[β], es decir, para toda a ∈ A,hA |= ϕ[β(x/a)]. Puesto que sA [β] ∈ A se tiene, en particular, i A |= ϕ β(x/sA [β]) . Ya que ϕ, s son compatibles, esto implica (por 8.13) que A |= ϕ{x/s}[β]. Regla universal. Supongamos Φ |= ϕ{x/y}, donde y ∈ / lib(Φ) ∪ var(ϕ). Supongamos que A |= Φ[β]; se tiene que demostrar que A |= ∀ xϕ[β], es decir, para toda a ∈ A, A |= ϕ[β(x/a)]. Sea entonces a ∈ A. Dado que A |= Φ[β] y y ∈ / lib(Φ), se deduce que A |= Φ[β(y/a)]. En vista de que Φ |= ϕ{x/y}, esto implica que A |= ϕ{x/y}[β(y/a)]. Pero y h∈ / var(ϕ), así que ϕ, y son A |= i compatibles; por lo tanto, se sigue que  A A ϕ β(y/a)(x/y [β(y/a)]) . Teniendo en cuenta que y β(y/a) = a, deducimos que A |= ϕ[β(y/a)(x/a)]. Finalmente, como y ∈ / var(ϕ),  concluimos A |= ϕ β(x/a) . Regla de igualdad. Sea ϕ ∈ At(L) y supongamos Φ |= r =s, ˙ así como Φ |= ϕ{x/r}. Si A |= Φ[β], entonces es cierto que r A [β] = sA [β] y A |= ϕ{x/r}[β]. Ya que ϕ esh atómica, ϕ iy r son compatibles. A |= ϕ{x/r}[β] es equivalente a A |= ϕ β(x/r A [β]) y como r A [β] = sA [β], tenemos que 210 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 211 ✐ ✐ Conjuntos y modelos. Curso avanzado h i A |= ϕ β(x/sA [β]) . De lo anterior se concluye, en vista de que ϕ, s son compatibles, que A |= ϕ{x/s}. La validez de la regla de monotonía es evidente. Definición 11.3. Sea U ⊆ Pot(Fml(L)) × Fml(L). U satisface las reglas del cálculo de secuencias si son válidas las reglas del teorema 11.2, teniendo en cuenta que cada LTC-fórmula del tipo Φ |= ϕ se sustituye por (Φ, ϕ) ∈ U. Lo que significa esta definición es que, por ejemplo, si (Φ, ϕ1 ), (Φ, ϕ2 ) ∈ U, entonces también (Φ, ϕ1 ∧ ϕ2 ) ∈ U. Otro ejemplo: si (Φ, ∀ xϕ) ∈ U, entonces (Φ, ϕ{x/s}) ∈ U, para todo término s compatible con ϕ. Para L fijo identificamos |=L en forma canónica con un subconjunto de Pot(Fml(L)) × Fml(L): Definición 11.4. Def |=L = {(Φ, ϕ) : Φ ⊆ Fml(L) ∧ ϕ ∈ Fml(L) ∧ Φ |= ϕ}. De acuerdo con el teorema 11.2 podemos concluir: Lema 11.5. |=L satisface las reglas del cálculo de sucesiones. Si tenemos una familia de conjuntos que satisfacen las reglas del cálculo de secuencias, su intersección claramente satisface también estas reglas. En este orden de ideas, es pertinente la siguiente definición: Definición 11.6. (a) ⊢L es el subconjunto más pequeño de Pot(Fml(L)) × Fml(L) que satisface las reglas del cálculo de secuencias. En lugar de (Φ, ϕ) ∈⊢L , simplemente escribimos Φ ⊢L ϕ o también Φ ⊢ ϕ si no hay ambigüedad. (b) La fórmula ϕ se deduce o es demostrable a partir de Φ si Φ ⊢L ϕ. Del lema 11.5 se recupera el siguiente resultado, el cual establece que el cálculo de secuencias es correcto, es decir, si existe una prueba de ϕ a partir de Φ, entonces Φ implica lógicamente ϕ. 211 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 212 ✐ ✐ 4. Lógica Teorema 11.7 (Teorema de correctud). ⊢L ⊆|=L . 11.1. La relación de derivación. La validez de las reglas del cálculo de secuencias significa que cada fórmula ϕ, que se puede deducir de Φ mediante estas reglas, también es consecuencia lógica de Φ. El concepto de “validez” se interpreta como: en principio se pueden elegir para el cálculo de sucesiones reglas totalmente arbitrarias; sin embargo, estas reglas tienen sentido cuando son en cierta medida “demostrables” en la “realidad”. Un cálculo de sucesiones es inútil si se pueden derivar resultados, es decir fórmulas, que en el plano del modelo no son ciertas, es decir, cuando la deducibilidad no implica la consecuencia. En forma positiva: un cálculo es correcto si de Φ sólo se pueden derivar propiedades que siempre son ciertas en presencia de Φ. Considere la siguiente condición Υ: Existen n < ω y una sucesión h(Φi , ϕi ) : i ≤ ni tales que Φn ⊆ Φ, ϕn = ϕ y, para toda i ≤ n, Φi ⊆ Fml(L), ϕi ∈ Fml(L) y |Φi | < ℵ0 ; y para toda i ≤ n, (Φi , ϕi ) se obtuvo de etapas anteriores, (Φj , ϕj ) para j < i por medio de alguna de las reglas RI, ∧1, ∧2, ∧3, ¬1, ¬2, ∀ 1, ∀ 2, = o ⊆. Debe quedar claro qué significa la frase “se obtuvo de etapas anteriores”, por ejemplo, (Φi , ϕi ) se obtuvo de la regla ¬2 si existen j1 , j2 < i y ψ ∈ Fml(L) tales que Φj1 = Φi ∪ {ψ}, Φj2 = Φi ∪ {¬ψ}, ϕj1 = ϕi y ϕj2 = ϕi . De modo similar con las otras reglas. Una sucesión h(Φi , ϕi ) : i ≤ ni con las propiedades recién mencionadas se llama derivación, deducción o también prueba formal de ϕ a partir de Φ. Es importante que el lector reconozca lo que establece la condición Υ. A partir de un conjunto de fórmulas Φ, derivamos la fórmula ϕ usando las reglas del cálculo de secuencias. Para pasar de una etapa a otra utilizamos las hipótesis, o las fórmulas hasta ese punto deducidas, y alguna de las reglas. La última etapa debe dar lugar a la fórmula por demostrar ϕ. El siguiente teorema nos dice que con ayuda del cálculo de secuencias, en un número finito de etapas y considerando Φ, podemos averiguar si de un conjunto Φ se puede deducir una fórmula ϕ. Teorema 11.8. Φ ⊢L ϕ si y sólo si se cumple la condición Υ. 212 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 213 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sea Def U = {(Φ, ϕ) ∈ Pot(Fml(L)) × Fml(L) : existe una derivación de ϕ a partir de Φ}. Debemos mostrar U =⊢L . Para (⊆). Sea U ′ ⊆ Pot(Fml(L)) × Fml(L) un conjunto que satisface las reglas del cálculo de sucesiones. Demostramos por inducción sobre n que: (*) Si ϕ tiene una derivación a partir de Φ de longitud n + 1, entonces (Φ, ϕ) ∈ U ′ . De (*) se concluye que U ⊆ U ′ . Demostración de (*). Sea ((Φi , ϕi ) : i ≤ n) una derivación de ϕ a partir de Φ. Ya que esta deducción está formada, especialmente en la posición i = n, de acuerdo con la condición Υ, (Φn , ϕn ) se obtuvo de anteriores por medio de alguna de las reglas (RI), . . . , (⊆) en 11.2. Además, ϕn = ϕ y Φn ⊆ Φ. Ahora distinguimos qué regla se utilizó para obtener (Φn , ϕn ). Si se usó (RI), entonces ϕ = ϕn ∈ Φn ⊆ Φ o ϕ = s=s, ˙ para alguna s ∈ Tm(L). Ya que U ′ satisface la regla de inicio del cálculo de secuencias, se concluye que (Φ, ϕ) ∈ U ′ . Respecto de las otras reglas consideremos, por ejemplo, el caso en que (Φn , ϕn ) se obtuvo mediante (∧3). En este caso existen j1 , j2 < n con Φj1 = Φn , Φj2 = Φn , así como ϕ = ϕn = (ϕj1 ∧ϕj2 ). Entonces h(Φi , ϕi ) : i ≤ j1 i es una derivación de ϕj1 a partir de Φn , y h(Φi , ϕi ) : i ≤ j2 i es una derivación de ϕj2 a partir de Φn . Por hipótesis de inducción es cierto, por lo tanto, que (Φn , ϕj1 ) ∈ U ′ y (Φn , ϕj2 ) ∈ U ′ . Puesto que U ′ satisface la regla (∧3), se concluye que (Φn , (ϕj1 ∧ϕj2 )) ∈ U ′ . | {z =ϕ } Finalmente, dado que U ′ satisface la monotonía y que Φn ⊆ Φ, deducimos que (Φ, ϕ) ∈ U ′ . ◭ Para (⊇). Debemos mostrar que U satisface las reglas del cálculo de secuencias. Dado que para ϕ ∈ Φ∪{s=s : s ∈ Tm(L)}, se tiene una derivación h(Φ ∪ {ϕ}, ϕ) : i < 1i de ϕ a partir de Φ, U satisface la regla (RI). Para las otras reglas demostramos, por ejemplo, que U satisface la regla de casos; las demás se tratan en forma similar. Supongamos cierto (Φ ∪ {ψ}, ϕ) ∈ U y (Φ ∪ {¬ψ}, ϕ) ∈ U. Sean h(Φi , ϕi ) : i ≤ ni una derivación de ϕ a partir de Φ ∪ {ψ} y h(Ψi , ψi ) : i ≤ mi una derivación de ϕ a partir de Φ ∪ {¬ψ}. En 213 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 214 ✐ ✐ 4. Lógica vista de la regla (⊆) podemos suponer que Φn = Φ′ ∪ {ψ} y Ψm = Φ′ ∪ {¬ψ}, para un conjunto finito Φ′ ⊆ Φ. Note que por la definición del concepto “derivación”, Φn ⊆ Φ ∪ {ψ} y Ψm ⊆ Φ ∪ {¬ψ} son conjuntos finitos. Definimos h(Θi , θi ) : i ≤ m + n + 2i mediante:    (Φi , ϕi ), cuando i ≤ n (Θi , θi ) = (Ψi−(n+1) , ψi−(n+1) ), cuando n + 1 ≤ i ≤ (n + 1) + m   (Φ′ , ϕ), cuando i = n + m + 2. Def ((Θi , θi ) : i ≤ m + n + 2) es una derivación de ϕ a partir de Φ: que las propiedades correspondientes para hΘi , θi i se satisfacen, se sigue inmediatamente de que h(Φi , ϕi ) : i ≤ ni (respectivamente, h(Ψi , ψi ) : i ≤ ji) son derivaciones; puesto que Θn = Φn = Φ′ ∪ {ψ} = Θn+m+2 ∪ {ψ}, Θn+m+1 = Ψm = Φ′ ∪ {¬ψ} = Θn+m+2 ∪ {¬ψ}, así como θn = ϕn = ϕ = θn+m+2 y θn+m+1 = ψm = ϕ = θn+m+2 , la sucesión conforme a (¬2), en la posición i = n + m + 2, está bien formada. Por lo tanto, U satisface (¬2). Corolario 11.9. (a) Sea h(Φi , ϕi ) : i ≤ ni una prueba formal. Entonces h(Φi , ϕi ) : i ≤ ji es una prueba formal de ϕj a partir de Φj para cada j ≤ n. En particular, es cierto que Φj ⊢ ϕj . (b) Φ ⊢L ϕ si y sólo si existe Φ′ ⊆ Φ tal que |Φ′ | < ℵ0 y Φ′ ⊢L ϕ. Demostración. (a) Se sigue de inmediato de la condición Υ y del teorema 11.8. (b) ⇒ ) Sea h(Φi , ϕi ) : i ≤ ni una deducción de ϕ a partir de Φ. Entonces, Def Φ′ = Φn es un subconjunto finito de Φ y ϕn = ϕ. De (a) ocurre además ′ Φ ⊢L ϕ. ⇐ ) Se sigue directamente de la regla de monotonía. Si tenemos en cuenta la parte (a) del corolario 11.9, escribimos una prueba formal h(Φi , ϕi ) : i ≤ ni también de la siguiente manera: 1. Φ0 ⊢ ϕ0 .. . n + 1. Φn ⊢ ϕn . 214 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 215 ✐ ✐ Conjuntos y modelos. Curso avanzado Para justificar una etapa, escribimos en el renglón correspondiente, entre paréntesis, la regla utilizada. En lugar de Φ ∪ {ϕ}, escribimos frecuentemente Φ, ϕ. Lema 11.10. Φ, ϕ ⊢ ¬¬ϕ y Φ, ¬¬ϕ ⊢ ϕ. Demostración. 1. 2. 3. 4. 5. Φ, ϕ, ¬ϕ ⊢ ϕ Φ, ϕ, ¬ϕ ⊢ ¬ϕ Φ, ϕ, ¬ϕ ⊢ ¬¬ϕ Φ, ϕ, ¬¬ϕ ⊢ ¬¬ϕ Φ, ϕ ⊢ ¬¬ϕ 1. Φ, ¬¬ϕ, ¬ϕ ⊢ ¬ϕ 2. Φ, ¬¬ϕ, ¬ϕ ⊢ ¬¬ϕ 3. Φ, ¬¬ϕ, ¬ϕ ⊢ ϕ 4. Φ, ¬¬ϕ, ϕ ⊢ ϕ 5. Φ, ¬¬ϕ ⊢ ϕ Con lo que queda demostrado el lema. (RI) (RI) ((¬1) en 1 y 2) (RI) ((¬2) en 3 y 4). (RI) (RI) ((¬1) en 1 y 2) (RI) ((¬2) en 3 y 4). 11.2. Reglas derivadas. Tenemos a nuestra disposición las reglas del teorema 11.2, que son suficientes para nuestros propósitos. Sin embargo, para facilitar las demostraciones y no repetir de manera inecesaria ciertos razonamientos, introducimos algunas reglas derivadas que involucran deducciones previamente hechas y que se utilizan con frecuencia en las demostraciones. Pueden pensarse como abreviaciones de razonamientos. Las reglas derivadas son aquellas que se deducen de las reglas fundamentales. Se pueden utilizar en demostraciones para abreviar las mismas. Para demostrar que las reglas derivadas son correctas, debemos mostrar que de las premisas se obtiene la conclusión uilizando sólo reglas previamente demostradas. Lema 11.11. Φ ⊢ t =s ˙ Φ ⊢ t =r ˙ . (a) Φ ⊢ s=r ˙ Φ ⊢ r =s ˙ (b) (simetría de =). ˙ Φ ⊢ s=r ˙ 215 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 216 ✐ ✐ 4. Lógica (c) Φ ⊢ r =s ˙ Φ ⊢ s=t ˙ (transitividad de =). ˙ Φ ⊢ r =t ˙ Demostración. (a) Sea x ∈ Var \ var(r). Entonces t =r ˙ = (x=r){x/t} ˙ y s=r ˙ = (x=r){x/s}. ˙ Obtenemos: 1. Φ ⊢ t =s ˙ (premisa) (premisa) 2. Φ ⊢ (x=r) ˙ xt 3. Φ ⊢ (x=r) ˙ xs (= ˙ en 1 y 2). (b) 1. Φ ⊢ r =s ˙ (premisa) 2. Φ ⊢ r =r ˙ (RI) 3. Φ ⊢ s=r ˙ ((a) en 1 y 2). (c) 1. Φ ⊢ r =s ˙ (premisa) 2. Φ ⊢ s=t ˙ (premisa) 3. Φ ⊢ s=r ˙ ((b) en 1) 4. Φ ⊢ r =t ˙ ((a) en 3 y 2). Teorema 11.12. Φ ⊢ ϕ0 Φ ∪ {ϕ0 } ⊢ ϕ1 (modus ponens). (a) Φ ⊢ ϕ1 (b) (c) Φ ∪ {ϕ0 } ⊢ ϕ1 (contrapositiva). Φ ∪ {¬ϕ1 } ⊢ ¬ϕ0 Φ ∪ {¬ϕ} ⊢ ψ Φ ∪ {¬ϕ} ⊢ ¬ψ Φ ∪ {ϕ} ⊢ ψ Φ ∪ {ϕ} ⊢ ¬ψ ; Φ⊢ϕ Φ ⊢ ¬ϕ (principio de prueba por contradicción). Demostración. 1. 2. 3. (a) 4. 5. 6. Φ ⊢ ϕ0 (premisa) Φ, ϕ0 ⊢ ϕ1 (premisa) Φ, ¬ϕ0 ⊢ ϕ0 ((⊆) en 1) Φ, ¬ϕ0 ⊢ ¬ϕ0 (RI) Φ, ¬ϕ0 ⊢ ϕ1 ((¬1) en 3 y 4) Φ ⊢ ϕ1 ((¬2) en 2 y 5). 216 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 217 ✐ ✐ Conjuntos y modelos. Curso avanzado 1. Φ, ϕ0 ⊢ ϕ1 (premisa) 2. Φ, ¬ϕ1 , ϕ0 ⊢ ϕ1 ((⊆) en 1) 3. Φ, ¬ϕ1 , ϕ0 ⊢ ¬ϕ1 (RI) (b) 4. Φ, ¬ϕ1 , ϕ0 ⊢ ¬ϕ0 ((¬1) en 2 y 3) 5. Φ, ¬ϕ1 , ¬ϕ0 ⊢ ¬ϕ0 (RI) 6. Φ, ¬ϕ1 ⊢ ¬ϕ0 ((¬2) en 4 y 5). (c) Probamos la primera regla, y la segunda se prueba de modo similar. 1. Φ, ¬ϕ ⊢ ψ (premisa) 2. Φ, ¬ϕ ⊢ ¬ψ (premisa) 3. Φ, ¬ϕ ⊢ ϕ ((¬1) en 1 y 2) 4. Φ, ϕ ⊢ ϕ (RI) 5. Φ ⊢ ϕ ((¬2) en 3 y 4). Lema 11.13. Si para todo conjunto de fórmulas Φ se tiene para todo conjunto de fórmulas Φ se cumple Φ, ϕ ⊢ ψ. Φ⊢ϕ , entonces Φ⊢ψ Demostración. 1. Φ, ϕ ⊢ ϕ (RI) 2. Φ, ϕ ⊢ ψ (hipótesis en 1). Con frecuencia usaremos el lema 11.13 sin mencionarlo. Teorema 11.14 (Leyes de De Morgan). (a) Φ ⊢ ¬(ϕ∧ψ) Φ ⊢ (¬ϕ∨¬ψ) , . Φ ⊢ (¬ϕ∨¬ψ) Φ ⊢ ¬(ϕ∧ψ) (b) Φ ⊢ ¬(ϕ∨ψ) Φ ⊢ (¬ϕ∧¬ψ) , . Φ ⊢ (¬ϕ∧¬ψ) Φ ⊢ ¬(ϕ∨ψ) Demostración. Ejercicio. Corolario 11.15. Φ ∪ {ϕ} ⊢ ψ . Φ ⊢ (ϕ ⇒ ψ) Demostración. Ejercicio. 217 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 218 ✐ ✐ 4. Lógica 12. El teorema de completud de Gödel En esta sección consideramos un lenguaje fijo L = (R, F, K, τ). En la última sección hemos demostrado que el cálculo de secuencias es correcto: las fórmulas que podemos derivar de un conjunto de fórmulas Φ son también consecuencia lógica de Φ (⊢L ⊆|=L ). El objetivo de esta sección es demostrar la completud del cálculo de sucesiones: las reglas del cálculo de sucesiones son suficientes para al menos poder probar todo enunciado que es consecuencia lógica de un conjunto de fórmulas Φ (|=L ⊆⊢L ). Estas dos afirmaciones juntas dicen que el concepto semántico de consecuencia lógica y el sintáctico de derivabilidad son equivalentes: |=L =⊢L . Definición 12.1. (a) El conjunto de fórmulas Φ es L-consistente, en símbolos ConL (Φ), si existe ϕ ∈ Fml(L) tal que Φ 0L ϕ. (b) Φ es L-inconsistente si, para toda ϕ ∈ Fml(L), se cumple Φ ⊢L ϕ. Para analizar el concepto de (in-)consistencia es útil introducir el enunciado “contradictorio”: Def Definición 12.2. ⊥ = ¬ ∀ x(x=x) ˙ se llama falso. Un conjunto de fórmulas es inconsistente si y sólo si de él se puede derivar una contradicción (es decir, dos enunciados contradictorios entre sí) respectivamente, si se puede derivar a partir de él el enunciado contradictorio: Teorema 12.3. Las siguientes condiciones son equivalentes: (i) (ii) (iii) (iv) Φ es L-inconsistente; No es cierto que ConL (Φ); Existe ϕ ∈ Fml(L), tal que Φ ⊢L ϕ y Φ ⊢L ¬ ϕ); Φ ⊢L ⊥. Demostración. Las equivalencias de (i) y (ii), y de (i) y (iii) son evidentes. (iii) implica (iv). Sea ϕ como en (iii). Entonces 1. Φ ⊢ ϕ (hipótesis) 2. Φ ⊢ ¬ ϕ (hipótesis) 3. Φ ⊢ ⊥ ((¬1) en 1 y 2), es una derivación de ⊥ a partir de Φ. 218 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 219 ✐ ✐ Conjuntos y modelos. Curso avanzado (iv) implica (i). Suponga Φ ⊢ ⊥ y ϕ ∈ Fml(L). Por 11.9 existe un subconjunto finito Φ′ ⊆ Φ con Φ′ ⊢ ⊥. Sea y ∈ Var \ (lib(Φ′ ) ∪ {x}). (Se tiene Var \ (lib(Φ′ ) ∪ {x}) 6= ∅ porque lib(Φ′ ) ∪ {x} es un conjunto finito.) Entonces tenemos la siguiente derivación de ϕ a partir de Φ: 1. Φ′ ⊢ ¬ ∀ x=x ˙ (elección de Φ′ ) 2. Φ′ ⊢ (x=x){x/y} ˙ (RI) 3. Φ′ ⊢ ∀ x(x=x) ˙ ((∀ 2) en 2) 4. Φ′ ⊢ ϕ ((¬1) en 1 y 3) 5. Φ ⊢ ϕ ((⊆) en 4), con lo que queda demostrado el teorema. Corolario 12.4. El conjunto de fórmulas Φ es inconsistente si y sólo si existe Φ′ ⊆ Φ tal que |Φ′ | < ℵ0 y Φ′ es inconsistente. Demostración. Φ es L-inconsistente si y sólo si Φ ⊢L ⊥, si y sólo si (por 11.9) existe Φ′ ⊆ Φ tal que |Φ| < ℵ0 y Φ′ ⊢L ⊥ si y sólo si existe Φ′ ⊆ Φ tal que |Φ′ | < ℵ0 y Φ′ es L-inconsistente. Dada su importancia, asociamos otra vez 12.4 y 11.9, la consistencia y la derivabilidad tienen “carácter finito”: Teorema 12.5 (Compacidad). (a) Φ ⊢L ϕ si y sólo si existe Φ′ ⊆ Φ tal que |Φ| < ℵ0 y Φ′ ⊢L ϕ. (b) ConL (Φ) si y sólo si para todo Φ′ ⊆ Φ si |Φ| < ℵ0 entonces ConL (Φ′ ). Corolario 12.6. Sea {Φi : i ∈ I} un S conjunto linealmente ordenado por ⊆ de conjuntos L-consistentes. Entonces i∈I Φi es L-consistente. Demostración. Si la unión no fuera consistente, existiría un conjunto S finito Φ′ ⊆ i∈I Φi , que es L-inconsistente. Ya que {Φi : i ∈ I} es un conjunto linealmente ordenado por ⊆, se cumple Φ′ ⊆ Φi para alguna i ∈ I. Así que Φi sería L-inconsistente, lo que se opone a la hipótesis. Ahora proporcionamos una caracterización para inconsistencia. Teorema 12.7. (a) Φ ⊢L ϕ si y sólo si Φ ∪ {¬ ϕ} es L-inconsistente. (b) Φ ⊢L ¬ ϕ si y sólo si Φ ∪ {ϕ} es L-inconsistente. 219 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 220 ✐ ✐ 4. Lógica Demostración. (a) ⇒ ) damos una prueba para Φ, ¬ ϕ ⊢L ⊥: 1. Φ ⊢ ϕ (hipótesis) 2. Φ, ∀ x(x=x) ˙ ⊢ϕ ((⊆) en 1) 3. Φ, ¬ ϕ ⊢ ⊥ (contrapositiva en 2) ⇐) 1. Φ, ¬ ϕ ⊢ ⊥ (hipótesis) 2. Φ, ¬ ϕ ⊢ ¬ ⊥ (puesto que Φ ∪ {¬ ϕ} es inconsistente, se puede derivar cualquier fórmula). 3. Φ ⊢ ϕ (principio de prueba por contradicción en 1 y 2). (b) En vista de (a) es suficiente probar que Φ ∪ {¬ ¬ ϕ} es L-inconsistente si y sólo si Φ ∪ {ϕ} es L-inconsistente. ⇒) 1. Φ, ϕ ⊢ ¬ ¬ ϕ (Lema 11.10) 2. Φ, ¬ ¬ ϕ ⊢ ⊥ (hipótesis) 3. Φ, ϕ, ¬ ¬ ϕ ⊢ ⊥ ((⊆) en 2) 4. Φ, ϕ ⊢ ⊥ (modus ponens en 1 y 3). ⇐ ) Intercambiamos, en la demostración precedente, los papeles de ϕ y ¬ ¬ ϕ. Una pregunta natural es ¿qué relación subsiste entre los conceptos “consistente” y “satisfacible”? Ahora respondemos la pregunta: Teorema 12.8. Sea Φ ⊆ Fml(L). Si Sat(Φ), entonces ConL (Φ). Demostración. Supongamos que A |= Φ. Si Φ fuera L-inconsistente, tendríamos Φ ⊢L ⊥ pues ⊢L ⊆|=L , así que Φ |= ⊥ y en particular A |= ⊥. Lo último significa que existe un a ∈ A tal que a 6= a, lo cual es absurdo. 12.1. El teorema de existencia de modelos. En esta sección mostramos que el recíproco del teorema 12.8 también es válido: todo conjunto consistente tiene un modelo. Nuestra idea es construir un modelo para cada conjunto consistente en fórmulas. 220 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 221 ✐ ✐ Conjuntos y modelos. Curso avanzado 12.1.1. Conjuntos de Henkin. Primero investigamos conjuntos de fórmulas Ψ que tienen propiedades especiales y con cuya ayuda es posible, en forma muy sencilla, construir un modelo de Ψ. Estos conjuntos se llaman conjuntos de Henkin. Mostraremos que todo conjunto consistente se puede agrandar a un conjunto de Henkin. Lo que hacemos es probar que para cada conjunto L-consistente Φ, existe un lenguaje L∗ ⊃ L y un conjunto de Henkin Ψ ⊆ Fml(L∗ ) tal que Φ ⊆ Ψ. El L-reducto de un modelo de Ψ es un modelo de Φ. Definición 12.9. Sea L = (R, F, K, τ) un lenguaje y Ψ ⊆ Fml(L). Ψ es un conjunto de Henkin si se satisfacen las siguientes condiciones: (H0) Para toda ϕ ∈ Fml(L), Ψ ⊢L ϕ si y sólo si ϕ ∈ Ψ; (H1) Para toda ϕ ∈ Fml(L), ¬ ϕ ∈ Ψ si y sólo si ϕ ∈ / Ψ; (H2) Para cualesquier ϕ ∈ Fml(L) y n < ω, ∀vn ϕ ∈ Ψ si y sólo si para toda c ∈ K, ϕ{vn /c} ∈ Ψ; (H3) Para toda t ∈ Tm(L) existe c ∈ K tal que t =c ˙ ∈ Ψ. Encontramos una caracterización equivalente. Proposición 12.10. (H0)∧(H1) es equivalente con el enunciado Ψ es maximal L-consistente, es decir, Ψ es ⊆-máximo en el conjunto {Λ : Λ ⊆ Fml(L) ∧ ConL (Λ)}. Demostración. ⇒ ) Si son ciertas (H0) y (H1), entonces ConL (Ψ): si existiera ϕ ∈ Fml(L) con Ψ ⊢L ϕ y Ψ ⊢L ¬ ϕ, entonces por (H0) ϕ, ¬ ϕ ∈ Ψ, que contradice (H1). Por otro lado, por (H1) Ψ contiene una de las fórmulas ϕ o ¬ ϕ para cada fórmula ϕ ∈ Fml(L), así que Ψ es ⊆-máxima respecto a los subconjuntos L-consistentes de Fml(L). ⇐ ) Sea Ψ maximal L-consistente. (1) (H0) es cierta. Demostración de (1). Sea ϕ ∈ Fml(L). Debemos mostrar Ψ ⊢L ϕ si y sólo si ϕ ∈ Ψ. Supongamos Ψ ⊢L ϕ. Para verificar que ϕ ∈ Ψ, basta probar, por la maximalidad de Ψ, que Ψ ∪ {ϕ} es consistente. Si no fuese consistente, tendríamos la siguiente derivación de ⊥ a partir de Ψ: 1. Ψ, ϕ ⊢ ⊥ (inconsistencia supuesta de Ψ ∪ {ϕ}) 2. Ψ ⊢ ϕ (hipótesis) 3. Ψ ⊢ ⊥ (modus ponens) 221 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 222 ✐ ✐ 4. Lógica Por lo tanto, Ψ es inconsistente, una contradicción. La dirección (⇐) es inmediata de (RI).◭ Para probar (H1) fijemos ϕ ∈ Fml(L). Ya que Ψ es maximal L-consistente, ϕ∈ / Ψ es equivalente a la L-inconsistencia de Ψ∪{ϕ}. Lo último es equivalente (por 12.7) a Ψ ⊢L ¬ ϕ, y esto es equivalente por (H0) a ¬ ϕ ∈ Ψ, con lo que queda demostrado (H1). 12.1.2. Un modelo para los conjuntos de Henkin. Nuestra meta es construir un modelo para cada conjunto de Henkin. Sea Ψ un conjunto de Henkin. Construiremos un modelo de Ψ. Nuestra idea es tomar como universo del modelo el conjunto Tm(L) de todos los términos. Las relaciones, funciones y constantes se deben interpretar en la forma canónica; por ejemplo, si s, t son términos y f es un símbolo de 2función, fst es un término. En el modelo debemos definir una función f A que interpreta a f . Para definir sus valores en el dominio del modelo, hacemos f A (s, t) = fst Aquí aparece un problema: puede ocurrir que dos términos s, t sean diferentes como sucesiones de símbolos (así s 6= t), pero iguales vistos desde Ψ, o sea, Ψ ⊢L s=t; ˙ es decir, son sintácticamente distintos, pero semánticamente iguales. En tal caso se tiene s 6= t, pero s=t ˙ ∈ Ψ. Para evadir esta dificultad identificamos en Tm(L) todos los elementos que son iguales respecto a Ψ. Esto se lleva a cabo formalmente mediante una relación de equivalencia ∽ en Tm(L) y el paso de Tm(L) a Tm(L)/ ∽. Definición 12.11. Para s, t ∈ Tm(L) definimos s ∽ t si y solamente si s=t ˙ ∈ Ψ. Lema 12.12. ∽ es una relación de equivalencia en Tm(L). La clase de equivalencia de s ∈ Tm(L) se denota con s. Demostración. Ya que por (RI) ocurre Ψ ⊢L s=s, ˙ entonces ∽ es reflexiva. Además, por el lema 11.11 ∽ es simétrica y transitiva. Def Tomamos A = Tm(L)/ ∽ como universo del modelo buscado. Definimos las interpretaciones de los símbolos de relación, función y constante de la 222 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 223 ✐ ✐ Conjuntos y modelos. Curso avanzado siguiente forma: RA t0 . . . tτ(R)−1 si y sólo si Rt0 . . . tτ(R)−1 ∈ Ψ; Def f A (t0 , . . . , tτ(f )−1 ) = f (t0 , . . . , tτ(f )−1 ); Def cA = c. Para probar que todo está bien definido, debemos mostrar que las definiciones sólo dependen de la clase de equivalencia y no de los representantes. Esto se sigue inmediatamente de: Lema 12.13. (a) Si para toda j < τ(R), tj ∽ sj , entonces Rt0 . . . tτ(R)−1 ∈ Ψ si y sólo si ΨRs0 . . . sτ(R)−1 . (b) Si para toda j < τ(f ), tj ∽ sj , entonces ft0 . . . tτ(f )−1 ∽ fs0 . . . sτ(f )−1 . Demostración. (a) Por razones de simetría, basta probar la dirección ( ⇒ ). Supongamos entonces que Rt0 . . . tτ(R)−1 ∈ Ψ, es decir, Ψ ⊢ Rt0 . . . tτ(R)−1 . Probamos por inducción sobre j ≤ τ(R) que Ψ ⊢ Rs0 . . . sj−1 tj . . . tτ(R)−1 . (Así, para j = τ(R) se obtiene Ψ ⊢ Rs0 . . . sτ(R)−1 ) j = 0. Esto ocurre por hipótesis. (Observe que t0 . . . t0−1 = ✷). j > 0. De Ψ ⊢ tj−1 =s ˙ j−1 y Ψ ⊢ Rs0 . . . sj−2 tj−1 . . . tτ(R)−1 se sigue por la regla (=) del cálculo de sucesiones: así que Ψ ⊢ Rs0 . . . sj−2 sj−1 tj . . . tτ(R)−1 , Ψ ⊢ Rs0 . . . sj−1 tj . . . tτ(R)−1 . Con esto queda demostrado (a). (b) Probamos por inducción sobre i ≤ τ(f ): Ψ ⊢ ft0 . . . tτ(f )−1 =fs ˙ 0 . . . si−1 ti . . . tτ(f )−1 ; Para i = τ(f ) se obtiene la afirmación deseada. 223 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 224 ✐ ✐ 4. Lógica i = 0. En este caso la afirmación se deduce de la regla (RI). i > 0. En este caso se procede en forma similar a la demostración de (a). En vista del lema 12.13, las definiciones de relaciones, funciones y constantes son correctas y obtenemos una L-estructura A. Definimos una Def valuación β en A mediante β(vn ) = vn ; verificamos que A |= Ψ[β]. Teorema 12.14. Para t ∈ Tm(L) se cumple t A [β] = t. Demostración. Por inducción sobre la construcción de términos. Def t = vn . Se cumple vnA [β] = β(vn ) = vn . t = c. Se tiene cA [β] = cA = c. t = ft0 . . . tτ(f )−1 . En este caso ocurre A (ft0 . . . tτ(f )−1 )A [β] = f A (t0A [β] . . . tτ(f )−1 [β]) HI = f A (t0 , . . . , tτ(f )−1 ) Def = ft0 . . . tτ(f )−1 , lo que queríamos demostrar. Finalmente probamos que nuestra L-estructura A es modelo de Ψ para la valuación β. Teorema 12.15. A |= Ψ[β]. Def Demostración. Para ϕ ∈ Fml(L), sea nϕ = |{i < |ϕ| : ϕ(i) ∈ {∧ , ¬ , ∀ }}| el número de conectivos y cuantificadores en ϕ (recuerde que ϕ es formalmente una función ϕ : n − → AL ). Demostramos por inducción sobre nϕ < ω que A |= ϕ[β] si y sólo si ϕ ∈ Ψ. (1) De aquí se sigue inmediatamente la afirmación. Sea entonces n < ω y suponga que la afirmación (1) se ha probado para toda ψ ∈ Fml(L) con nψ < n. Sea ϕ ∈ Fml(L) con nϕ = n. Distinguimos los cinco casos posibles: 224 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 225 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Caso ϕ = s=r. ˙ Tenemos A |= ϕ[β] si y sólo si sA [β] = r A [β] si y sólo si s = r si y sólo si s ∽ r si y sólo si s=r ˙ ∈Ψ si y sólo si ϕ ∈ Ψ. Def Caso ϕ = Rt0 . . . tτ(R)−1 . Entonces se obtiene A [β]) A |= ϕ[β] si y sólo si RA t0A [β] . . . tτ(R)−1 si y sólo si RA (t0 . . . tτ(R)−1 ) si y sólo si Rt0 . . . tτ(R)−1 ∈ Ψ si y sólo si ϕ ∈ Ψ. Def Caso ϕ = (ϕ1 ∧ ϕ2 ). Se cumple A |= ϕ[β] si y sólo si (A |= ϕ1 [β] y A |= ϕ2 [β]) si y sólo si (por H. I.)(ϕ1 ∈ Ψ y ϕ2 ∈ Ψ) si y sólo si (por H0)(Ψ ⊢ ϕ1 y Ψ ⊢ ϕ2 ) si y sólo si (por regla ∧3) Ψ ⊢ (ϕ1 ∧ ϕ2 ) si y sólo si (por H0) ϕ ∈ Ψ. Def Caso ϕ = ¬ ψ. Se deduce A |= ϕ[β] si y sólo si A 6|= ψ[β] si y sólo si (por H. I.) ψ ∈ /Ψ si y sólo si (por H1) ¬ ψ ∈ Ψ si y sólo si ϕ ∈ Ψ. Def Caso ϕ = ∀ vn ψ. Ya que A = {t : t ∈ Tm(L)} y por (H3) cada término es ∽-equivalente a un símbolo de constante, A consiste en las clases 225 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 226 ✐ ✐ 4. Lógica de equivalencia de los símbolos de constante: Con ello obtenemos A = {c : c ∈ K}.  A |= ϕ[β] si y sólo si para toda a ∈ A, A |= ψ β(vn /a)  si y sólo si para toda c ∈ K, A |= ψ β(vn /c) h   si y sólo si para toda c ∈ K, A |= ψ β(vn /cA [β]) si y sólo si para toda c ∈ K, A |= ψ{vn /c}[β] recuerde: ck , ψ son compatibles i si y sólo si (por H. I.) para toda c ∈ K, ψ{vn /c} ∈ Ψ si y sólo si (por H2) ∀ vn ψ ∈ Ψ si y sólo si ϕ ∈ Ψ. Con esto hemos investigado todos los casos posibles y el teorema queda demostrado. En vista de lo anterior concluimos fácilmente: Corolario 12.16. Si Ψ es un conjunto de Henkin, entonces Ψ y cada subconjunto de Ψ son satisfacibles. La siguiente etapa es extender cada conjunto Φ consistente a un conjunto de Henkin. Para ello fijamos un lenguaje L = (R, F, K, τ). Para poder satisfacer (H3), debemos agregar constantes a L. Definimos nuestros nuevos símbolos de constante. Simplemente recordemos la definición: Definición 12.17. Sea L = (R, F, K, τ) un lenguaje y C un conjunto con Def C ∩ (R ∪ F ∪ K) = ∅. Sea L(C) = (R, F, K ∪ C, τ). En el caso especial |C| = 1, escribimos L(c) en lugar de L(C) y denotamos al nuevo símbolo de constante con c. Def Def Definición 12.18. Sea CL = {cx,ϕ : x ∈ Var ∧ ϕ ∈ Fml(L)} y L′ = L(CL ). L′ contiene entonces un nuevo símbolo de constante para cada variable x y cada L-fórmula ϕ. Para ϕ ∈ Fml(L) y x ∈ Var, sea Def ϕx = (∃ xϕ ⇒ ϕ{x/cx,ϕ }). 226 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 227 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Además, sea ΓL = {ϕx : x ∈ Var ∧ ϕ ∈ Fml(L)}. Para Φ ⊆ Fml(L) sea Def Φ′ = Φ ∪ ΓL . Queremos mostrar que Φ′ es L′ -consistente si Φ es L-consistente. Para ello requerimos transformar una derivación de ⊥ a partir de Φ′ en L′ , en una derivación de ⊥ a partir de Φ en L; en cierto sentido, debemos eliminar las nuevas constantes. Para ello debemos sustituir los símbolos de constante adicionales por variables. Definición 12.19. Sean z ∈ Var y c un símbolo de constante de L(C). (a) Para r ∈ Tm(L(C)) definimos recursivamente la sustitución r{c/z} mediante Def y{c/z} = y ′ Def c {c/z} = ( c′ , z, si c′ 6= c si c′ = c; Def (ft0 . . . tτ(f )−1 ){c/z} = ft0 {c/z} . . . tτ(f )−1 {c/z}. (b) Para ϕ ∈ Fml(L(C)) definimos recursivamente la sustitución ϕ{c/z} mediante Def (t1 =t ˙ 2 ){c/z} = t1 {c/z}=t ˙ 2 {c/z}; Def (Rt0 . . . tτ(R)−1 ){c/z} = Rt0 {c/z} . . . tτ(R)−1 {c/z}; Def (ψ1 ∧ ψ2 ){c/z} = (ψ1 {c/z}∧ ψ2 {c/z}); Def (¬ ψ){c/z} = ¬ (ψ{c/z}); Def (∀ yψ){c/z} = ∀ y(ψ{c/z}). Def (c) Para Φ ⊆ Fml(L(C)), sea Φ{c/z} = {ϕ{c/z} : ϕ ∈ Φ}. La primera etapa para transformar derivaciones en L′ en derivaciones en L es eliminar las nuevas constantes. Lema 12.20 (Eliminación de constantes). Sean L un lenguaje y c un nuevo símbolo de constante. Además, sea Φ ⊆ Fml(L(c)) y ϕ ∈ Fml(L(c)). Si Φ ⊢L(c) ϕ, entonces Φ{c/z} ⊢L ϕ{c/z} para todas las z ∈ Var con excepción de un número finito de ellas. 227 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 228 ✐ ✐ 4. Lógica Def Demostración. Sea ∆ = h(Φi , ϕi ) : i ≤ ni una derivación de Def Φ ⊢L(c) ϕ. S Sea Z = {var(Φi ∪ {ϕi }) : i ≤ n}. Entonces Z es finito. Mostramos que para z ∈ Var \ Z obtenemos una derivación de Φ{c/z} ⊢L ϕ{c/z} mediante Def ∆′ = h(Φi {c/z}, ϕ{c/z}) : i ≤ ni. Puesto que Φn ⊆ Φ, ϕn = ϕ, Φi ⊆ Fml(L(c)) es finito y ϕi ∈ Fml(L(c)) para i ≤ n, es claro que Φn {c/z} ⊆ Φ{c/z}, ϕn {c/z} = ϕ{c/z}, Φi {c/z} ⊆ Fml(L) es finito y ϕi {c/z} ∈ Fml(L) para i ≤ n. Falta verificar que la secuencia está bien formada en cada posición i ≤ n. Sea i ≤ n arbitraria. Entonces, en la posición i de la sucesión ∆ tenemos uno de los siguientes casos: Caso 1. (RI), es decir, ϕi ∈ Φi o existe s ∈ Tm(L(c)) tal que ϕi = s=s. ˙ Entonces ϕi {c/z} ∈ Φi {c/z} o ϕi {c/z} = s{c/z}=s{c/z} ˙ con s{c/z} ∈ Tm(L). En consecuencia, (RI) aparece en la posición i de ∆′ . Caso 2. (∧1), es decir, existen j < i y ψ ∈ Fml(L(c)) tales que (Φj = Φi y ϕj = (ϕi ∧ ψ)). Entonces (Φj {c/z} = Φi {c/z} y ϕj {c/z} = (ϕi {c/z}∧ ψ{c/z})), donde ψ{c/z} ∈ Fml(L). Así que (∧1) aparece en la posición i de ∆′ . Caso 3. Ocurre (∧2), (∧3), (¬1) o (¬2). Para estas alternativas se procede como en el caso 2. Caso 4. (∀ 1), es decir, existen j < i, ϕ ∈ Fml(L(c)) y s ∈ Tm(L(c)) tales que Φj = Φi , ϕj = ∀ xϕ, (ϕ, s son compatibles) y ϕi = ϕ{x/s}. Def Def Sea ϕ′ = ϕ{c/z} y s′ = s{c/z}. Entonces ϕ′ ∈ Fml(L), s′ ∈ Tm(L) Def así como ϕj {c/z} = ∀ xϕ′ . Dado que var(ϕ) ⊆ var(ϕj ) ⊆ Z, z ∈ / Z y que ϕ, s son compatibles, también ϕ′ , s′ son compatibles. Ya que z ∈ / var(ϕj ) y z 6= x, se sigue que ϕi {c/z} = (ϕ{x/s}){c/z} = (ϕ{c/z}){x/s′ } = ϕ′ {x/s′ }. Con lo que (∀ 1) aparece en la posición i de ∆′ . Caso 5. (∀ 2), es decir, existen j < i, ϕ ∈ Fml(L(c)) y y ∈ Var tales que (Φj = Φi , ϕj = ϕ{x/y}, y ∈ / lib(Φi ) ∪ var(ϕ) y ϕi = ∀ xϕ). En este caso podemos suponer, sin pérdida de generalidad, que y 6= z: esto se debe a que var(ϕj ) ⊆ Z y z ∈ / Z, lo que es cierto cuando y ∈ var(ϕj ); si y ∈ / var(ϕj ) (entonces ϕj = ϕ y x ∈ / lib(ϕ)), sustituimos 228 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 229 ✐ ✐ Conjuntos y modelos. Curso avanzado y por y′ ∈ Var \ (Z ∪ {z}): tenemos ϕj = ϕ = ϕ{x/y′ } dado que x ∈ / lib(ϕ), y y′ ∈ / lib(Φi ) ∪ var(ϕ) pues éste es un subconjunto de Z. (Note que var(ϕ) ⊆ var(ϕi ) ⊆ Z). Supongamos entonces y 6= z. Def Sea ϕ′ = ϕ{c/z}. Entonces ϕ′ ∈ Fml(L) y ϕi {c/z} = ∀ xϕ′ . Ya que y∈ / lib(Φi ) ∪ var(ϕ) ∪ {z} se tiene y ∈ / lib(Φi {c/z}) ∪ var(ϕ′ ). En vista de que z 6= x, al pertenecer x a Z se sigue que ϕj {c/z} = (ϕ{x/y}){c/z} = ϕ′ {x/y}. Por lo tanto, (∀ 2) ocurre en la posición i de ∆′ . Caso 6. (=), es decir, existen j1 , j2 < i, ϕ ∈ At(L(c)) y r, s ∈ Tm(L) tales ˙ ϕj2 = ϕ{x/r} y ϕi = ϕ{x/s}). que (Φj1 = Φi , Φj2 = Φi , ϕj1 = r =s, Podemos suponer, sin pérdida de generalidad, que x 6= z: escogemos Def una variable x′ ∈ / var(ϕ) ∪ {x, z} y consideramos ϕ̃ = ϕ{x/x′ }. Entonces ϕ̃ ∈ At(L(c)). Puesto que para t ∈ Tm(L(c)), ϕ{x/x′ }{x′ /t} = ϕ{x/t}, como se puede probar fácilmente por inducción sobre la construcción de las fórmulas atómicas, podemos trabajar con ϕ̃ en lugar de ϕ y con x′ en lugar de x, así que de hecho podemos considerar que x 6= z. Def Def Def Sea ϕ′ = ϕ{c/z}, r ′ = r{c/z} y s′ = s{c/z}. Entonces ϕ′ ∈ At(L) y r ′ , s′ ∈ Tm(L). Además, ϕj1 {c/z} = r ′ =s ˙ ′ . Dado que x 6= z, se deduce que ϕj2 {c/z} = (ϕ{x/r}){c/z} = (ϕ{c/z}){x/r ′ } = ϕ′ {x/r ′ }, así como ϕi {c/z} = (ϕ{x/s}){c/z} = (ϕ{c/z}){x/s′ } = ϕ′ {x/s′ }. Por lo que (=) aparece en la posición i de ∆′ . Caso 7. Ocurre (⊆), es decir, existe j < i tal que (Φj ⊆ Φi y ϕj = ϕi ). En este caso (Φj {c/z} ⊆ Φi {c/z} y ϕj {c/z} = ϕi {c/z}), lo que indica que (⊆) ocurre en la posición i de ∆′ . Con esto queda demostrado que ∆′ es una prueba de Φ{c/z} ⊢L ϕ{c/z}. El lema anterior nos sirve para eliminar una sola constante de una derivación. Como en general necesitamos eliminar más constantes, requerimos el siguiente resultado: 229 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 230 ✐ ✐ 4. Lógica Corolario 12.21. Sea Φ ⊆ Fml(L(C)) y ϕ ∈ Fml(L(C)). Si C′ ⊆ C, de tal forma que Φ ⊆ Fml(L(C′ )) y ϕ ∈ Fml(L(C′ )), entonces Φ ⊢L(C) ϕ implica que Φ ⊢L(C′ ) ϕ. En particular, ConL(C′ ) (Φ) conduce a ConL(C) (Φ), para cada C′ ⊆ C, con Φ ⊆ Fml(L(C′ )). Demostración. Sea h(Φi , ϕi ) : i ≤ ni una prueba de Φ ⊢L(C) ϕ. Ya que Φi ∪ {ϕi } es un subconjunto finito de Fml(L(C)), existe un subconjunto S Def finito Ci de C con Φi ∪ {ϕ} ⊆ Fml(L(Ci )). Sea C′′ = C′ ∪ i≤n Ci . Entonces C′′ \ C′ es finito y Φi ∪ {ϕi } ⊆ Fml(L(C′′ )). Con esto hemos probado que Φ ⊢L(C′′ ) ϕ. Ahora, si c ∈ C′′ \ C′ , entonces Φ{c/z} = Φ y ϕ{c/z} = ϕ. Mediante el uso sucesivo del lema sobre eliminación de constantes (un número finito de veces), podemos quitar de C′′ los elementos que no pertenecen a C′ y, por lo tanto, lograr una derivación de ϕ a partir de Φ también respecto al lenguaje reducido. De Φ ⊢L(C′′ ) ϕ llegamos, después de un número finito de etapas, a Φ ⊢L(C′′ ∩C′ ) ϕ, por lo que Φ ⊢L(C′ ) ϕ pues C′ = C′′ ∩ C′ . Sobre la afirmación de la consistencia: si Φ ⊆ Fml(L(C′ )), entonces Φ ∪ {⊥} ⊆ Fml(L(C′ )), de tal forma que por lo recién demostrado, Φ ⊢L(C) ⊥ implica Φ ⊢L(C′ ) ⊥. Esto significa precisamente que ConL(C′ ) (Φ) implica ConL(C) (Φ). Hemos hecho la última reflexión para poder mostrar que la formación de conjuntos de fórmulas L-consistentes en la definición 12.18 conduce a conjuntos de fórmulas L′ -consistentes. Teorema 12.22. ConL (Φ) implica ConL′ (Φ′ ). Demostración. Supongamos que ConL (Φ) y que Φ′ es L′ -inconsistente. Entonces Φ′ ⊢L′ ⊥. Por el teorema de finitud para ⊢ (12.5), existe un subconjunto finito Φ′0 ⊆ Φ′ con Φ′0 ⊢L′ ⊥. Se afirma que Φ′0 * Φ. (1) Demostración de (1). Si Φ′0 ⊆ Φ tendríamos Φ ⊢L′ ⊥. Por el corolario 12.21 se desprende que Φ ⊢L ⊥, pues Φ ∪ {⊥} ⊆ Fml(L(∅)) y L(∅) = L. En tal situación Φ sería L-inconsistente, lo que contradice nuestra hipótesis.◭ En vista de (1) Φ′0 = Φ0 ∪ {ϕixi : i ≤ n}, donde Φ0 ⊆ Φ, n < ω y, para i ≤ n, ϕi ∈ Fml(L), así como xi ∈ Var. Podemos suponer que Φ′0 se elige de 230 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 231 ✐ ✐ Conjuntos y modelos. Curso avanzado tal forma que n es la menor posible. Entonces Def Ψ = Φ0 ∪ {ϕxi : i < n} Def es L′ -consistente. Def (2) Def Con ϕ = ϕn , x = xn logramos Ψ, ϕx ⊢L′ ⊥. Mediante L′0 = L({cxi ,ϕi : i ≤ n}), por el corolario 12.21, se obtiene Ψ, ϕx ⊢L′0 ⊥. Por el lema sobre eliminación de constantes se consigue la existencia de una variable z con z ∈ / Def Def ′ x lib(Ψ)∪var(ϕ) y Ψ, ϕ {c/z} ⊢L′1 ⊥, donde c = cx,ϕ y L1 = L({cxi ,ϕi : i < n}). A causa de ϕx {c/z} = (∃ xϕ ⇒ ϕ{x/c}){c/z} = (∃ xϕ ⇒ ϕ{x/z}) = (¬ ¬ ∀ x¬ ϕ ∨ ϕ{x/z}) = ¬ (¬ ¬ ¬ ∀ x¬ ϕ∧ ¬ ϕ{x/z}) concluimos que Ψ ∪ {¬ (¬ ¬ ¬ ∀ x¬ ϕ∧ ¬ ϕ{x/z})} es L′1 -inconsistente. Por definición esto es equivalente a Ψ ⊢L′1 (¬ ¬ ¬ ∀ x¬ ϕ∧ ¬ ϕ{x/z}). Con lo anterior obtenemos la siguiente derivación: 1. Ψ ⊢L′1 (¬ ¬ ¬ ∀ x¬ ϕ∧ ¬ ϕ{x/z}) (por lo recién demostrado) ((∧1) en 1) 2. Ψ ⊢L′1 ¬ ¬ ¬ ∀ x¬ ϕ (Lema 11.10) 3. Ψ, ¬ ¬ ¬ ∀ x¬ ϕ ⊢L′1 ¬ ∀ x¬ ϕ (modus ponens 2 y 3) 4. Ψ ⊢L′1 ¬ ∀ x¬ ϕ ((∧2) en 1) 5. ΨL′1 ¬ ϕ{x/z} ′ ((∀ 2) en 5, 6. Ψ ⊢L1 ∀ x¬ ϕ note que z ∈ / lib(Ψ) ∪ var(¬ϕ)). ′ De 4 y 6 se obtiene que Ψ es L1 -inconsistente. Así que Ψ ⊢L′1 ⊥, de donde, en vista de que L′ ⊇ L′1 , se cumple Ψ ⊢L′1 ⊥. Por ello Ψ es L′ -inconsistente, lo que contradice (2). Por lo tanto, la suposición de que Φ′ es L′ -inconsistente conduce a una contradicción, lo que demuestra el teorema. Una vez concluidos los preparativos podemos demostrar el siguiente lema, que nos permite extender todo conjunto consistente de fórmulas a un conjunto de Henkin. 231 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 232 ✐ ✐ 4. Lógica Teorema 12.23. Sean L = (R, F, K, τ) un lenguaje y Φ ⊆ Fml(L) un conjunto de fórmulas consistente. Entonces existe un lenguaje L∗ ⊇ L y un conjunto de Henkin Ψ ⊆ Fml(L∗ ) que extiende Φ, es decir, Φ ⊆ Ψ. Demostración. Definimos recursivamente una ⊆-cadena (Ln : n ≤ ω) de lenguajes y una ⊆-cadena (Φn : n ≤ ω) de conjuntos consistentes, mediante Def Def L0 = L, Φ0 = Φ Def Def Ln+1 = (Ln )′ , Def Lω = [ Φn+1 = (Φn )′ , cuando n < ω, Ln , Def Φω = n<ω [ Φn . n<ω De la definición de la operación ′ (véase 12.18) se sigue de manera directa que, para n < m ≤ ω, L ⊆ Ln ⊆ Lm así como Φ ⊆ Φn ⊆ Φm . Para n ≤ ω, es cierto que Φn ⊆ Fml(Ln ) y Φn es Ln -consistente: para n < ω, esto se sigue inductivamente de 12.22; para n = ω, note que para cada m < ω existe un conjunto Cm tal que Lω = Lm (Cm ). De ConLm (Φm ) se deduce (de 12.21) ConLω (Φm ), pues Φm ⊆ Fml(Lm ). La sucesión (Φm : m < ω) es entonces una cadena de conjuntos de fórmulas Lω -consistentes, cuya unión es Lω -consistente (por 12.6). Además, x ∈ Var y ϕ ∈ Fml(Lω ) implica ϕx ∈ Φω . (1) Ψ es un conjunto de Henkin. (2) Demostración de (1). Ya que en ϕ sólo aparecen un número finito de símbolos de constantes, entonces ϕ ∈ Fml(Ln ) para n < ω y, por tanto, ϕx ∈ Φn+1 . ◭ Def Considere ahora Z = {Ψ ⊆ Fml(Lω ) : Ψ ⊇ Φω y ConLω (Ψ)}. Z es un conjunto no vacío que ordenamos inductivamente por ⊆ (la unión de una ⊆-cadena en Z es un elemento ⊆-maximal de esta cadena en Z). Por el lema de Zorn, existe un elemento ⊆-maximal Ψ de Z. Entonces Φ ⊆ Φω ⊆ Ψ. El teorema queda demostrado si probamos lo siguiente: Demostración de (2). Ya que Ψ es claramente maximal Lω -consistente y esta propiedad es equivalente a (H0) ∧ (H1), (H0) y (H1) son válidas para Ψ. Para (H2): Sea ϕ ∈ Fml(Lω ), x ∈ Var. Debemos probar que ∀ xϕ ∈ Ψ si y sólo si para cada símbolo de constante c de Lω es cierto que ϕ{x/c} ∈ Ψ. ( ⇒ ) Supongamos ∀ xϕ ∈ Ψ y sea c un símbolo de constante de Lω . Entonces, 232 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 233 ✐ ✐ Conjuntos y modelos. Curso avanzado 1. Ψ ⊢Lω ∀ xϕ (RI) 2. Ψ ⊢Lω ϕ{x/c} (∀ 1). En vista de (H0), concluimos ϕ{x/c} ∈ Ψ de (2). (⇐) Sea ϕ{x/c} ∈ Ψ para cada símbolo de constante c de Lω . Sea Def c = cx,¬ ϕ . Entonces ϕ{x/c} ∈ Ψ, y de la derivación 1. Ψ ⊢Lω ϕ{x/c} (RI) 2. Ψ, ϕ{x/c} ⊢Lω ¬ ¬ ϕ{x/c} (Lema 11.10) 3. Ψ ⊢Lω ¬ ¬ ϕ{x/c} (modus ponens) se sigue que ¬ ¬ ϕ{x/c} ∈ Ψ por (H0). Como ϕ ∈ Fml(Lω ) y x ∈ Var, entonces ϕx ∈ Φω ⊆ Ψ (por (1)). Así, (¬ϕ)x ∈ / Ψ (por (H1)). Pero Def (¬ϕ)x = ¬¬¬∀ x¬¬ϕ ∧ ¬¬ϕ{x/c}. Puesto que ¬¬ϕ{x/c} ∈ Ψ, se debe cumplir (por ∧3) que ¬¬¬∀ x¬¬ϕ ∈ / Ψ, que por (H1) significa ¬ ¬ ¬ ¬ ∀ x¬ ¬ ϕ ∈ Ψ. Entonces obtenemos la siguiente derivación: 1. Ψ ⊢Lω ¬ ¬ ¬ ¬ ∀ x¬ ¬ ϕ 2. Ψ, ¬ ¬ ¬ ¬ ∀ x¬ ¬ ϕ ⊢Lω ¬ ¬ ∀ x¬ ¬ ϕ (11.10) 3. Ψ ⊢Lω ¬ ¬ ∀ x¬ ¬ ϕ (modus ponens) 4. Ψ ⊢Lω ∀ x¬ ¬ ϕ (similar a 1–3). Así que tenemos ∀ x¬ ¬ ϕ ∈ Ψ. De la derivación (RI) 1. ∀ x¬ ¬ ϕ ⊢Lω ∀ x¬ ¬ ϕ 2. ∀ x¬ ¬ ϕ ⊢Lω ¬ ¬ ϕ{x/z} ((∀ 1) en 1; z ∈ Var \ var(ϕ)) 3. ∀ x¬ ¬ ϕ, ¬ ¬ ϕ{x/z} ⊢Lω ϕ{x/z} (Lema 11.10) 4. ∀ x¬ ¬ ϕ ⊢Lω ϕ{x/z} (modus ponens en 2 y 3) 5. ∀ x¬ ¬ ϕ ⊢Lω ∀ xϕ ((∀ 2) en 4) 6. Ψ ⊢Lω ∀ xϕ ((⊆) en 5), obtenemos (por (H0)) ∀ xϕ ∈ Ψ, lo que se quería mostrar. Para (H3). Sea s ∈ Tm(Lω ). Pretendemos demostrar la existencia de un símbolo de constante c de Lω , con s=c ˙ ∈ Ψ. Sea x ∈ Var \ var(s). De la derivación 1. ∀ x ¬ x=s ˙ ⊢Lω ∀ x¬ x=s ˙ (RI) 2. ∀ x¬ x=s ˙ ⊢Lω ¬ s=s ˙ ((∀ 1) en 1) 3. ∀ x¬ x=s ˙ ⊢Lω s=s ˙ (RI) 4. ∅ ⊢Lω ¬ ∀ x¬ x=s ˙ (prueba por contrad. 2 y 3) 5. Ψ ⊢Lω ¬ ∀ x¬ x=s ˙ ((⊆) en 4), 233 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 234 ✐ ✐ 4. Lógica se sigue que ¬ ∀ x¬ x=s ˙ ∈ Ψ por (H0), de tal forma que (H1) implica ∀ x¬ x=s ˙ ∈ / Ψ. Por (H2) existe un símbolo de constante c de Lω tal que ¬ (x=s){x/c} ˙ ∈ / Ψ. Así ¬ c=s ˙ ∈ / Ψ, es decir, ¬ ¬ c=s ˙ ∈ Ψ por (H1). Entonces se puede probar que c=s ˙ ∈ Ψ, lo que se quería demostrar. ◭ Concluimos la demostración del teorema. En la construcción del teorema del conjunto de Henkin, que extiende el conjunto consistente de fórmulas, se utilizó el axioma de elección en la forma del lema de Zorn. Se puede renunciar al uso del axioma de elección, si se da un buen orden para Fml(Lω ): en este caso Fml(Lω ) = {ϕα : α < γ}, donde γ es el tipo ordinal de Fml(Lω ) y α 7→ ϕα es el inverso del isomorfismo de Mostowski (Lema 8.6.13). Definimos recursivamente una sucesión hΨα : α ≤ γi mediante Def Ψ0 = Ψω ; Def Ψα+1 = Def Ψδ = ( Ψα ∪ {ϕα }, cuando ConLω (Ψα ∪ {ϕα }) Ψα , en otro caso [ Ψα , cuando δ es límite. α<δ Def Entonces Ψ = Ψγ es un elemento ⊆-maximal de Z = {Ψ ⊆ Fml(Lω ) : Ψ ⊇ Φω y ConLω (Ψ)}: la Lω -consistencia se sigue directamente de la definición; la maximalidad se obtiene así: sea Ψ′ ∈ Z con Ψ ⊆ Ψ′ . Para ϕ ∈ Ψ′ , digamos ϕ = ϕα , se tiene Ψα ∪ {ϕα } ⊆ Ψ′ , y entonces es consistente. Con ello, ϕα ∈ Ψα+1 ⊆ Ψ. Se sigue que Ψ′ ⊆ Ψ, por lo cual Ψ = Ψ′ . Podemos originar un buen orden en Fml(Lω ) (sin el axioma de elección); por ejemplo, si L (y con ello, tanto Lω como Fml(Lω )) es numerable: una biyección f de un conjunto numerable a sobre ω induce un buen orden mediante Def x < y = f (x) < f (y). En este punto podemos establecer la relación entre la consistencia y satisfacibilidad de un conjunto de fórmulas. Recuerde que si un conjunto de fórmulas es satisfacible, también es consistente. Teorema 12.24 (Existencia de modelos). Sea L un lenguaje y Φ ⊆ Fml(L). Entonces ConL (Φ) ⇒ Sat(Φ). 234 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 235 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sea Ψ ⊇ Φ un conjunto de Henkin. Por 12.16, Ψ es satisfacible. Supongamos que A′ |= Ψ[β] y sea A el L-reducto de A′ . Ya que por el lema de coincidencia 8.7, la relación de satisfacción sólo depende de la interpretación de los símbolos de funciones, constantes y relaciones que aparecen en el conjunto de fórmulas, así como de la valuación de las variables libres, deducimos A |= Φ[β]. De 12.8 obtenemos: Corolario 12.25. Sea L un lenguaje y Φ ⊆ Fml(L). Entonces ConL (Φ) si y sólo si Sat(Φ). Un análisis del modelo de Henkin permitirá al lector concluir que: Corolario 12.26 (Löwenheim-Skolem decreciente). Si Φ es satisfacible, entonces Φ tiene un modelo de cardinalidad no mayor que |L|. Demostración. Sea A como en la demostración del teorema 12.24. Entonces |A| = |{s̄ : s ∈ Tm(Lω )}| ≤ |Tm(Lω )| ≤ |Lω | = |L|. 12.2. El teorema de completud de Gödel y sus consecuencias. Ahora probemos uno de los principales resultados de la lógica de predicados. El teorema se debe a Gödel [Göd30], pero la demostración que presentamos aquí se debe a Henkin [Hen49]. Teorema 12.27 (Teorema de completud de Gödel). |=L ⊆⊢L . Demostración. Sea Φ ⊆ Fml(L) , ϕ ∈ Fml(L) y supongamos Φ 0L ϕ. Por el teorema 12.7 Φ ∪ {¬ ϕ} es L-consistente. En vista del teorema 12.24 se cumple que Φ ∪ {¬ ϕ} es satisfacible. Digamos que A |= (Φ ∪ {¬ ϕ})[β]. Entonces A |= Φ[β] y A 6|= ϕ[β], así que Φ 6|= ϕ, lo que se quería demostrar. El teorema de completud de Gödel junto con el teorema 11.7 implican la completud del cálculo de secuencias: 235 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 236 ✐ ✐ 4. Lógica Corolario 12.28. |=L =⊢L . |=: Del teorema de finitud para ⊢ 12.5 obtenemos el teorema de finitud para Teorema 12.29 (Teorema de finitud, teorema de compacidad). (a) Φ |=L ϕ si y sólo si existe un conjunto Φ′ ⊆ Φ tal que |Φ′ | < ℵ0 y Φ′ |=L ϕ. (b) Sat(Φ) si y sólo si para todo conjunto Φ′ ⊆ Φ, si |Φ′ | < ℵ0 entonces Sat(Φ′ ). Demostración. Se sigue directamente del teorema de finitud para ⊢, pues ⊢ y |= así como Sat(·) y Con(·) coinciden, de acuerdo con 12.25 y 12.28. Con frecuencia llamaremos finitamente satisfacible a un conjunto de fórmulas cuyos subconjuntos finitos son satisfacibles. La parte (b) del teorema 12.29 dice que un conjunto de fórmulas es satisfacible si y sólo si es finitamente satisfacible. El teorema de completud de Gödel es el resultado principal de este capítulo y se utilizará implícitamente en numerosas ocasiones futuras. 13. Conjuntos y relaciones definibles Recordemos la expansión de un lenguaje mediante la adición de constantes. Suponga que en una L-estructura~a es una n-ada de elementos de A. Escogemos una sucesión ~c de símbolos de constantes nuevos. Formamos una nueva signatura σ ′ añadiendo las constantes ~c a K, es decir, formamos un nuevo conjunto K′ = K ∪ {c0 , . . . , cn−1 }. Con esta nueva signatura construimos un nuevo lenguaje que denotamos como L(~c). Si A es una L-estructura, con el nuevo lenguaje formamos la L(~c)-estructura hA,~ai interpretando los nuevos hA,~ai Def = ai . De la misma forma, si B símbolos de constante en la forma canónica ci es otra L-estructura y ~b es una n-ada de elementos de B de la misma longitud que ~c, formamos una nueva L(~c)-estructura hB, ~bi. Cuando se añaden constantes a la signatura, las nuevas constantes y los elementos que las interpretan se conocen como parámetros. De la definición, el lector podrá probar sin dificultad el siguiente lema: 236 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 237 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 13.1. Sean A, B L-estructuras y suponga que hA,~ai, hB, ~bi son L(~c)estructuras. Entonces un homomorfismo f : hA,~ai − → hB, ~bi es lo mismo que ~ un homomorfismo f : A − → B, tal que f (~a) = b. De la misma forma, un ~ encaje f : hA,~ai ֒→ hB, bi es lo mismo que un encaje f : A ֒→ B tal que f (~a) = ~b. Si ~a es una sucesión de elementos de A, decimos que ~a genera A, en símbolos A = h~aiA , si A está generada por los elementos de ~a (véase la página 202). Suponga que A es una L-estructura, que hA,~ai es una L(~c)-estructura y que ~a genera A. Entonces todo elemento de A es de la forma t hA,~ai (véase la demostración del Teorema 9.9 ) para algún término cerrado t de L(~c). Recuerde que una literal es una fórmula atómica o la negación de una de tales fórmulas. El conjunto de todas las literales cerradas de L(~c) que son ciertas en hA,~ai se llama diagrama de Robinson de A, en símbolos diag(A). El conjunto de todos los enunciados atómicos o primitivos de L(~c) que son ciertos en hA,~ai es el diagrama positivo de A, en símbolos diag+ (A). Lema 13.2 (Lema del diagrama). Sean A, B L-estructuras, ~c una sucesión de símbolos de constante, hA,~ai y hB, ~bi L(~c)-estructuras. Entonces las siguientes aseveraciones son equivalentes: (a) Para todo enunciado atómico ϕ de L(~c), si hA,~ai |= ϕ entonces hB, ~bi |= ϕ. (b) Existe un homomorfismo f : h~aiA − → B tal que f (~a) = ~b. El homomorfismo f en (b) es único (si existe); f es un encaje si y sólo si: (c) Para todo enunciado primitivo ϕ de L(~c), hA,~ai |= ϕ si y sólo si hB, ~bi |= ϕ. Demostración. Supongamos (a). Como la función inclusión encaja h~aiA en A, podemos reemplazar A por h~aiA . Así que sin pérdida de generalidad podemos suponer que A = h~aiA . Por el lema 13.1, para probar (b) es suficiente encontrar un homomorfismo f : hA,~ai − → hB, ~bi. Definimos f como sigue: ya que ~a genera A, cada elemento de A es de la forma t hA,~ai para algún término cerrado t de L(~c). Definamos ~ f (t hA,~ai ) = t hB,bi . (32) 237 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 238 ✐ ✐ 4. Lógica ~ La definición es correcta, pues shA,~ai = t hB,bi implica hA,~ai |= s=t, ˙ así ~bi ~bi hB, hB, ~ ˙ por (a). En consecuencia, s =t . Entonces f es que hB, bi |= s=t un homomorfismo por (a) y el lema 9.5, lo que demuestra (b). Como todo homomorfismo f de hA,~ai a hB, ~bi debe satisfacer 32, f es único en (b). El recíproco (b) ⇒ (a) se sigue directamente del lema 9.5. El argumento para encajes y (c) es similar, usando el lema 9.5. El lema 13.2 no menciona de manera explícita el diagrama de Robinson, así que hagámoslo ahora: suponga que ~a genera A. Por la implicación (a) ⇒ (b) el lema nos dice que A se puede transformar homomórficamente en un reducto B, siempre que B |= diag+ (A). De modo similar, la última parte del lema dice que si B = diag(A), A se puede encajar en un reducto de B. 13.1. Conjuntos definibles. Cada L-fórmula con n variables define una n-relación en cada L-estructura. En la teoría de modelos es más importante la relación definida por una fórmula, que la fórmula en sí. Por lo tanto, la construcción sintáctica de una fórmula tiene interés en tanto tenga alguna influencia en la relación que ella define. Así que dos fórmulas que definan la misma relación en toda estructura son iguales, desde el punto de vista de la teoría de modelos. Recuerde que Fmln (L) denota la colección de todas las L-fórmulas con a lo sumo n variables libres. Sea A una L-estructura. Para ψ ∈ Fmln (L) (n > 0) denotamos con ψ(A) el conjunto definido en A por ψ, es decir, el conjunto {~a ∈ An : A |= ψ(~a)}. En ocasiones, este conjunto se llama conjunto solución de ψ en A. Definición 13.3. Un conjunto B ⊆ An es definible (en A) si está definido por una fórmula ϕ ∈ Fmln (L). Una n-relación en A es definible (en A) si, vista como subconjunto de An , es definible en A. Si ψ(~x, ~y) ∈ Fmln+l (L) (donde ~x es una n-ada y ~y una l-ada de variables), y si ~c es una l-ada de elementos de A, llamamos a ψ(~x, ~c) una valuación de ψ(~x, ~y). Mediante ψ(A, ~c) se denota el conjunto {~a ∈ An : A |= ψ(~a, ~c)} definido por la valuación ψ(~x, ~c). En esta situación ~c son los parámetros del conjunto definido. Un subconjunto B ⊆ An es definible con parámetros (en A) si existe una L-fórmula ψ y una l-ada ~c de elementos de A tales que ψ(~x, ~c) define el conjunto B en A. Decimos que dos fórmulas ϕ(x0 , . . . , xn−1 ) y ψ(x0 , . . . , xn−1 ) son equivalentes en la L-estructura A si A |= ∀ ~x(ϕ(~x) ⇔ ψ(~x)). Otra forma de decirlo es 238 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 239 ✐ ✐ Conjuntos y modelos. Curso avanzado que dos fórmulas son equivalentes en A si y sólo si definen la misma relación en A. En este sentido, dos conjuntos finitos de fórmulas Φ(~x) y Ψ(~x) son V V equivalentes en A si Φ(~x) y Ψ(~x) definen la misma relación en A. Ejemplo 13.4. (a) Sea N = hω, +N , ·N i una (∅, {+, ·}, ∅, {(+, 2), (·, 2)})-estructura. Los siguientes conjuntos son definibles: (i) {1} = {x : (∀ y)(y · x = y)}. (ii) {5} = {x : (∃ y)(∀ zy · z = z ∧ y + y + y + y + y = x)}. (iii) {p : p es primo } ∪ {1} = {x : (∀ y)(∀ z)(y · z = x ⇒ y = x ∨ z = x)}. (iv) {p : p es primo }, usando (i) y (iii). (b) Sea A = hR, {+R , ·R }, 0i una LAr -estructura, donde R es el conjunto de los números reales y la suma y el producto se consideran en ese conjunto. Entonces los siguientes conjuntos son definibles: (i) R∗ = {x : (∃ y)(y · y = x)}. (ii) {x}, para cualquier número algebraico x (¿por qué?). Lema 13.5. Sean A una L-estructura, X un conjunto de elementos de A y Y una relación en A. Suponga que Y es definible por alguna L-fórmula con parámetros en X. Para todo automorfismo f de A, si f deja fijo X (es decir, f (x) = x, para toda x ∈ X), entonces para todo elemento a ∈ A, a ∈ Y si y sólo si f (a) ∈ Y . Demostración. Ejercicio. Teorema 13.6. Sean σ una signatura para la cual K = F = R = ∅, y A una L-estructura (de hecho, A es simplemente un conjunto). Sea X ⊆ A y Y un subconjunto de A definible en A por una L-fórmula con parámetros en X. Entonces Y es un subconjunto de A o el complemento en A de un subconjunto de X. Demostración. La demostración se obtiene de inmediato del lema 13.5. Note que en este teorema, todos los subconjuntos finitos de X y sus complementos en A se pueden definir mediante L-fórmulas con parámetros en X. El conjunto {a0 , . . . , an−1 } está definido por la fórmula x = a0 ∨ · · · ∨ x = 239 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 240 ✐ ✐ 4. Lógica an−1 (que es ⊥ si el conjunto es vacío); la negación de esta fórmula proporciona una definición para su complemento. La situación en el teorema 13.6 es mucho más común de lo que se esperaría. Decimos que una estructura A es minimal si A es infinita, pero los únicos subconjuntos de A que son definibles mediante una L-fórmula con parámetros son los finitos o los complementos de conjuntos finitos. En general, un conjunto X ⊆ A que es definible mediante una fórmula de primer orden con parámetros es minimal si X es infinito y para todo conjunto Z primer orden definible en A con parámetros, X ∩ Z o X − Z es finito. Lema 13.7. Sean A una L-estructura y f un automorfismo de A. Si Y ⊆ An es definible, entonces Y es invariante respecto a f , es decir, {(f (a1 ), . . . , f (an )) : (a1 , . . . , an ) ∈ Y } = Y. Demostración. Suponga que (a1 , . . . , an ) ∈ An , y que Y está definido por la L-fórmula ψ(x1 , . . . , xn ). Entonces (a1 , . . . , an ) ∈ Y si y sólo si A |= ψ(a1 , . . . , an ) si y sólo si A |= ψ(f (a1 ), . . . , f (an )) si y sólo si (f (a1 ), . . . , f (an )) ∈ Y, pues f es un isomorfismo. Ejemplo 13.8. Mostramos que la relación Q = {(m1 , m2 , m3 ) : m1 + m2 = m3 } no es definible en hN, ·N i. El teorema fundamental de la aritmética asegura que cada número se puede escribir en forma única como el producto de potencias de números primos. En este sentido, si n es un número natural, sea n = pk11 · · · pkl l . Definimos el automorfismo f : N − → N que cambia el 3 por el 5 en la representación de n. Por ejemplo, f (3) = 5 f (3 · 5) = 5 · 3 = 15 f (55 ) = 35 f (22 ) = 22 . Si Q fuera definible, Q = {(f (a1 ), . . . , f (an )) : (a1 , . . . , an ) ∈ Q}, 240 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 241 ✐ ✐ Conjuntos y modelos. Curso avanzado de acuerdo con el lema 13.7. Considere (3, 2, 5) ∈ Q. Entonces (f (3), f (2), f (5)) = (5, 2, 3) ∈ Q, lo cual es una contradicción. Para ilustrar la utilidad de las ideas recién introducidas considere una función f : A − → B. La imagen f (A) de A respecto a f se puede definir mediante la equivalencia y ∈ f (A) si y sólo si ∃ x[f (x) = y] (33) Sea Γ la gráfica de f , un subconjunto de A × B definido por la condición f (x) = y. La equivalencia 33 exhibe el hecho de que f (A) es la proyección de Γ respecto a la proyección π de la segunda coordenada. Algunas equivalencias lógicas simples capturan los hechos matemáticos que parecen complicados si no se usa la notación lógica. Por ejemplo, la equivalencia ∀ yϕ(x, y) si y sólo si ¬∃ y¬ϕ(x, y) muestra que el conjunto definido por ∀ yϕ(x, y) se puede obtener del conjunto Φ = {(x, y) ∈ A × B : ϕ(x, y)} tomando primero el complemento en A × B, después proyectándolo en la primera coordenada y finalmente tomando el complemento de ese conjunto en A. Esta técnica es especialmente útil cuando tratamos con nociones lógicas complicadas tales como continuidad o diferenciablidad expresadas en la forma usual mediante ε y δ. Una fórmula ϕ(x, y) que define un subconjunto de A × B en ocasiones se puede ver como una fórmula sobre tríos (x, y, z), donde z varía en un conjunto C; en este caso ϕ(x, y) define un subconjunto de A × B × C. En tales situaciones escribimos ϕ(x, y, z). Esto es similar a lo que ocurre en álgebra, donde se piensa que un polinomio p(x, y) depende de 3 variables, x, y, z, en el que todos los monomios en los que aparece z tienen coeficiente 0. También es útil considerar fórmulas que se obtienen mediante sustitución. Sea f : A − → B una función y Γ la gráfica de f . La condición ϕ(x, f (x)) define un subconjunto S de A. Esta condición es equivalente a ∃ y[f (x) = y ∧ ϕ(x, y)]. Por lo tanto, S se puede obtener al aplicar la proyección π a Γ ∩ Φ, donde π(x, y) = x es la proyección de A × B sobre la primera coordenada. Definición 13.9. Sea X un conjunto no vacío. Un sistema definidor en X es una sucesión S = hSm : m ∈ Ni tal que para cada m ≥ 0: 241 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 242 ✐ ✐ 4. Lógica 1. Sm es un álgebra booleana de subconjuntos de Xm que contiene los conjuntos ∅ y Xm como elementos; 2. Si A ∈ Sm , entonces X × A y A × X pertenecen a Sm+1 ; 3. {(a1 , . . . , am ) ∈ Xm : a1 = am } ∈ Sm ; 4. Si A ∈ Sm+1 , entonces π(A) ∈ Sm , donde π : Xm+1 − → Xm es la función proyección sobre las primeras m coordenadas; Si A ⊆ Xm , decimos que A pertenece a S si A ∈ Sm . Si A ⊆ Xm , B ⊆ Xn yf :A− → B es una función, decimos que f pertenece a S si la gráfica de f pertenece a S. Sean A una L-estructura y S un subconjunto de A. Escribimos D(A, S) para el sistema hSm : m ∈ Ni, donde para cada m ≥ 0, Sm es la colección de todos los subconjuntos de Am que son S-definibles en M. Proposición 13.10. Sea A una L-estructura y S un subconjunto de A. Entonces D(A, S) es un sistema definidor en A. Demostración. Ejercicio. El proximo resultado es el recíproco a la proposición 13.10 y afirma que cada sistema definidor es cerrado respecto a definibilidad. Si X es un conjunto no vacío y A ⊆ Xk , entonces para cada m ≥ 0 consideramos a Am como un subconjunto de Xkm . Teorema 13.11. Sea X un conjunto no vacío y S un sistema definidor en X. Sea A una L- estructura y S un subconjunto de A. Supongamos que los siguientes conjuntos pertenecen a S: (i) A; (ii) {cA } para cada símbolo de constante; (iii) {s} para toda s ∈ S; (iv) RA para cada símbolo de relación R; (v) La gráfica de f A para cada símbolo de función f . Entonces todo conjunto S-definible en A pertenece a S. Antes de probar el teorema 13.11 presentamos algunos hechos básicos que nos serán de utilidad. Para los siguientes lemas fijemos un conjunto X no vacío y un sistema definidor S en X. Lema 13.12. Si A y B pertenecen a S, entonces A × B pertenecen a S. 242 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 243 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Supongamos que A ⊆ Xm y B ⊆ Xn . Entonces A × B = (A × Xn ) ∩ (Xm × B). La condición (2) de la definición 13.9 (utilizada repetidamente) seguida de la condición (1) implican que el conjunto pertenece a S. Lema 13.13. Para cualesquier 1 ≤ i < j ≤ m el conjunto diagonal pertenece a S. ∆m (i, j) = {(a1 , . . . , an ) ∈ Xm : a1 = aj } Demostración. Sea k = j − i + 1. La condición (3) en la definición 13.9 propicia que el conjunto diagonal ∆k (1, j − i + 1) pertenezca a S, y ∆m (i, j) = Xi−1 × ∆k (1, j − i + 1) × Xm−j . Este conjunto pertenece a S por la condición (2) de la mencionada definición. (Véase también el lema 13.12). Lema 13.14. Sean B ∈ Sn e i(1), . . . , i(n) ∈ {1, . . . , m}. Entonces el conjunto A ⊆ Xm definido por pertenece a S. A = {(a1 , . . . , am ) ∈ Xm : (ai(1) , . . . , ai(n) ) ∈ B} Demostración. Note que para cualesquier a1 , . . . , am ∈ X, (a1 , . . . , am ) ∈ A si y sólo si ∃ y1 · · · yn (xi (1) = y1 ∧ · · · ∧ xi(n) = yn ∧ (y1 , . . . , yn ) ∈ B. Sean ∆j el conjunto diagonal ∆m+n (i(j), m + j) y πj : Xm+j − → Xm+j−1 la función proyección sobre las primeras coordenadas para cada j = 1, . . . , n. Las condiciones implican que A = π1 (· · · πn (D1 ∩ · · · Dn ∩ (Xm × B)) · · · ). De la definición13.9 y el lema 13.13 se obtiene A ∈ S. Lema 13.15. Supongamos que A ⊆ Xm , B ⊆ Xn y C ⊆ Xp son miembros de S. Sean f : A − → Byg : B − → C funciones que pertenecen a S. La composición g ◦ f : A − → C pertenece a S. 243 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 244 ✐ ✐ 4. Lógica Demostración. Sean ~x variables que varían sobre Xm , ~y sobre Xn y ~z sobre Xn . Se usan el lema 13.14 y la equivalencia (~x, ~z) ∈ Γ(g ◦ f ) ⇔ ∃ y((x, y) ∈ Γ(f ) ∧ (y, z) ∈ Γ(g)). Lema 13.16. Supongamos que A ⊆ Xm pertenece a S. Sea f = (f1 , . . . , fn ) : A − → Xn una función con funciones coordenadas fj : A − → X. La función f pertenece a S si y sólo si todas las funciones coordenadas fj pertenecen a S. Demostración. ⇒) Fijemos j (1 ≤ j ≤ n) y sea πj : Xn − → X la función proyección definida por πj (x1 , . . . , xn ) = xj . Usamos el lema 13.13 para probar que πj pertenece a S ya que su gráfica es un conjunto diagonal. Notemos además que fj = πj ◦ f , por lo que el lema 13.15 completa la prueba de esta dirección. ⇐) Supongamos que x varía en Xm y y = (y1 , . . . , yn ) varía en Xn . La gráfica de f está definida por la equivalencia (x, y) ∈ Γ(f ) ⇔ ((X, y) ∈ Γ(f1 ) ∧ · · · ∧ (x, yn ) ∈ Γ(fn )). Si las funciones f1 , . . . , fn perteneces a S, la equivalencia junto con el lema 13.14 y la condición (1) de la multicitada definición 13.9 muestran que f pertenece a S. Ahora podemos demostrar el teorema: Demostración del teorema 13.11. Sin pérdida de generalidad podemos suponer que el conjunto de parámetros S ⊆ A es vacío. Para reducir el caso general a éste sólo requerimos añadir nuevos símbolos de constante {cs : s ∈ S} a la signatura de L y expandir A a (A, S). Sean A como en el enunciado y S cualquier sistema definidor al que pertenecen todos los conjuntos listados en el teorema. Debemos probar que todo conjunto ∅-definible en A pertenece a S. Sea k tal que A ⊆ Xk . Como se observó antes, consideramos Am como subconjunto de Xkm para cada m ≥ 0. Primero probamos el enunciado por inducción en la construcción del Ltérmino t: Sean x1 , . . . , xn una sucesión de variables distintas que incluyen todas las variables de t; la función t A : Am − → A definida por la interpretación de t en A pertenece al sistema definidor S. 244 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 245 ✐ ✐ Conjuntos y modelos. Curso avanzado En la etapa básica de esta inducción, t es un símbolo de constante o una variable xi . En el primer caso la gráfica de la función t A es Am × {cA }; en el segundo caso la intersección de Am+1 con k conjuntos diagonales. En cualquier evento, esto muestra que la gráfica pertenece a S. Para la etapa inductiva, consideremos la situación en la que t tiene la forma f (t1 , . . . , tm ) donde f es un símbolo de n-función y t1 . . . , tn son Ltérminos para los que el enunciado es cierto. Sea G : Am − → An la función, A cuyas funciones coordenadas son tj , j = 1, . . . , n. El lema 13.15 indica que t A = f A ◦ G pertenece a S. Esto completa la etapa inductiva de la afirmación sobre los L-términos. Ahora demostraremos la siguiente afirmación sobre fórmulas ϕ de donde se deduce inmediatamente el teorema 13.11; la prueba es por inducción en la construcción de fórmulas. Sea x1 , . . . , xn una sucesión de variables distintas que incluyen a todas las variables libres de ϕ. El conjunto ϕ(A) = {(a1 , . . . , an ) ∈ Am : A |= ϕ[a1 , . . . , an ]} pertenece al sistema definidor S. En la etapa base de la inducción ϕ es una fórmula atómica de la forma Rt1 · · · tn , donde R es un símbolo de n-relación y t1 , . . . , tn son L-términos (R puede ser la igualdad). Sea G : Am − → An la función definida usando los términos t1 , . . . , tn . Como se mostró, G pertenece a S. Observemos que ϕ(A) está definido por la equivalencia (a1 , . . ., an ) ∈ ϕ(A) ⇔ ∃ y1 · · · yn ((a1 , . . . , am , y1 , . . . , yn ) ∈ Γ(G) ∧ (y1 , . . . , yn ) ∈ RA ). (Estrictamente hablando, note que cada ∃ yj es una sucesión de k cuantificadores existenciales sobre X). Esto muestra que ϕ(A) es el resultado de aplicar kn proyecciones al conjunto Γ(G) ∩ (M m × RA ), lo que muestra que éste pertenece a S. Ahora consideremos los casos en los que ϕ se constituye de fórmulas ψ1 , ψ2 usando conectivos lógicos. Tenemos una lista x1 , . . . , xm de variables distintas que incluyen a todas las variables libres de ψ1 , ψ2 . Usamos la hipótesis de 245 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 246 ✐ ✐ 4. Lógica inducción en ψ1 y ψ2 para concluir que los conjuntos ψ1 (A) y ψ2 (A), ambos subconjuntos de Am , pertenecen a S. Se sigue inmediatamente de (1) de la definición 13.9 que ϕ(A) también pertenece a S. Def El otro caso en la forma de ϕ es ϕ = ∃ yψ. Podemos suponer que y no está entre las variables x1 , . . . , xm . Aplicamos la hipótesis de inducción a la fórmula ψ y a las variables x1 , . . . , xm , y. Evidentemente ϕ(A) = π(ψ(A)), donde π : Am+1 − → Am es la proyección de las primeras m coordenadas. La condición (4) de la definición 13.9 promueve la pertenencia de ϕ(A) a S. Una consecuencia del teorema 13.11 es que todo sistema definidor S es de la forma D(A, ∅) para alguna estructura A. Por ejemplo, podemos tomar los conjuntos pertenecientes a S como relaciones básicas en una estructura A. El teorema 13.11 asegura que los conjuntos ∅-definibles (1)–(4) en la definición 13.9 caracterizan completamente a los sistemas de conjuntos ∅- definibles en estructuras A. Para caracterizar los sistemas definidores de la forma D(A, A), donde A es una L-estructura, es suficiente añadir la condición (5) Si A ∈ Sm+n y (a1 , . . . , am ) ∈ Xm , entonces A(a1 , . . . , am ) pertenecen a Sn , donde A(a1 , . . . , am ) = {(x1 , . . . , xm ) ∈ Xm : (a1 , . . . , am , x1 , . . . , xn ) ∈ A}. En forma equivalente, podemos añadir la condición: (5′ ) Para cada s ∈ X, {s} ∈ S. Sea X un conjunto no vacío. Dados dos sistemas definidores S(1) y S(2) en X, decimos que S(2) contiene a S(1), S(1) ⊆ S(2), si S(1)m ⊆ S(2)m para toda m ≥ 0. Esto define un orden parcial en la colección de todos los sistemas definidores en X. Cualquier familia {S(i) : i ∈ I} de sistemas definidores en X tiene una cota inferior S más grande que cualquier otra en la colección de todos los sistemas definidores en X, a saber, Sm = \ {S(i)m : i ∈ I} para cada m. Suponga que F = hFm : m ∈ Ni, donde Fm es una familia de subconjuntos de Xm para cada m ≥ 0. Obviamente existe al menos un sistema definidor S en X que contiene a F: sea S la menor cota superior (intersección) de todos los sistemas definidores en X que contienen a F. Llamamos a éste el sistema definidor en X generado por F. 246 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 247 ✐ ✐ Conjuntos y modelos. Curso avanzado Corolario 13.17. Sea A una L-estructura y S ⊆ A. Entonces D(A, S) es el sistema definidor en A generado por los conjuntos (ii)–(v) del teorema 13.11. Demostración. Ejercicio. 13.2. Un poco de aritmética. Los subconjuntos definibles de los números naturales han sido estudiados con detalle por su importancia en la teoría de recursión. Ejemplo 13.18. Como el conjunto recursivo de los números naturales, usamos la estructura N = hω, <, +, ·, 0, 1i. Tomemos N como modelo de la aritmética de Peano (pág. 206); sea L el lenguaje asociado. Escribimos (∀ x < y)ϕ, (∃ x < y)ϕ como abreviaciones de ∀ x(x < y ⇒ ϕ) y ∃ x(x < y ∧ ϕ) respectivamente. Los cuantificadores (∀ x < y) y (∃ x < y) se llaman cuantificadores acotados. Esto se estudiará con mucho más detalle en el capítulo 8. Definimos una jerarquía de L-fórmulas como sigue: (a) Una L-fórmula de L es Π00 o, lo que es lo mismo, es Σ00 si todos sus cuantificadores son acotados. (b) Una fórmula es Π0k+1 si es de la forma ∀ ~xψ, para alguna Σ0k -fórmula ψ. (La n-ada ~x puede ser vacía). (c) Una fórmula es Σ0k+1 si es de la forma ∃ ~xψ, para alguna Π0k -fórmula ψ. (La n-ada ~x puede ser vacía). Por ejemplo, una Σ03 -fórmula consiste en tres bloques de cuantificadores, ∃ ~x∀ ~y∃ ~z, seguidos de una fórmula que contiene sólo cuantificadores acotados. Dado que los bloques pueden ser vacíos, toda Π0k -fórmula también es una Σ0k+1 fórmula y una Π0k+1 -fórmula. Sea ~x = (x0 , . . . , xn−1 ). Un conjunto N de n-adas de números naturales es una Π0k -relación (respectivamente, una Σ0k -relación) si es definible mediante una Π0k -fórmula ϕ (respectivamente, una Σ0k -fórmula). Decimos que N es una ∆0k -relación si es tanto una Π0k -relación como una Σ0k -relación. Una relación es aritmética si es Σ0k para alguna k. Por lo tanto, las relaciones aritméticas son las definibles mediante fórmulas de primer orden. Un teorema fundamental de Kleene dice que las ∆10 relaciones son precisamente las relaciones recursivas, y las Σ01 -relaciones son las relaciones recursivamente enumerables. Otro teorema de Kleene dice que para cada k < ω existe una relación R que es Σ0k+1 , pero no es Σ0k ni Π0k , lo que implica que la jerarquía se mantiene creciendo. 247 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 248 ✐ ✐ 4. Lógica 14. Los teoremas de incompletud de Gödel En esta sección presentamos versiones de los teoremas de incompletud de Gödel únicamente con fines ilustrativos, pues los utilizaremos con frecuencia. La demostración de los mismos se pospone hasta el volumen II, en donde se incorporan junto con un estudio detallado de la teoría de recursión. Sea LAr el lenguaje de la aritmética de Peano. Consideremos N como una LAr -estructura. Decimos que si N |= ϕ, entonces ϕ es cierta respecto a la aritmética. Es obvio, entonces, el significado de la frase ϕ es falsa respecto a la aritmética. Sea Teo(N) el conjunto de fórmulas ϕ que son ciertas en N. Teorema 14.1 (Primer teorema de incompletud de Gödel). Sea T un conjunto de LAr -enunciados. Supongamos que T es axiomatizable y que T ⊆ Teo(N). Entonces existe un enunciado ϕ tal que T 0 ϕ y T 0 ¬ϕ, es decir, T es incompleta. Este teorema implica que es imposible descubrir todos los enunciados verdaderos de la aritmética en una forma puramente “mecánica”. En otras palabras, si elaboramos una lista Σ de LAr -enunciados, al menos ocurre una de las tres siguientes opciones: (a) Σ no contiene todos los enunciados ciertos de la aritmética. (b) No existe un procedimiento mecánico que nos permita verificar qué enunciados pertenecen a Σ. (c) Σ contiene un enunciado aritmético falso. Una variante del primer teorema de incompletud de Gödel es la siguiente: Teorema 14.2. (Primer teorema de incompletud de Gödel, segunda versión). Sea T un conjunto de LAr -enunciados consistente y axiomatizable, tal que AP ⊆ T . Entonces T no es completo. Esta versión proporciona un poco más de información, ya que Teo(N) es una de las muchas extensiones consistentes de AP. Ahora es tiempo de enunciar el segundo teorema de incompletud: Teorema 14.3. (Segundo teorema de incompletud de Gödel) Sea T un conjunto de LAr -enunciados axiomatizable y tal que T es al menos tan fuerte como AP. Entonces existe un LAr -enunciado Con(T ) que asegura la consistencia de T y tal que, a menos que T sea inconsistente, Con(T ) no es demostrable en T . 248 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 249 ✐ ✐ Conjuntos y modelos. Curso avanzado No vale la pena tratar de formalizar aquí qué significa “al menos tan fuerte como AP”. Para nuestro propósito inmediato es suficiente saber que este concepto realmente tiene una definición precisa, y que ZFE y toda extensión axiomatizable de AP o ZFE son al menos tan fuertes como AP. Esto también es cierto para ZF . Corolario 14.4. ZF no puede probar su propia consistencia, es decir, ZF 0 Con(ZF ). Por lo tanto, dado que trabajamos en ZF (o en ZFE ) no podemos asegurar que nuestra teoría (ZF ) sea consistente. Es por ello que se presentan pruebas de consistencia relativa (véase Cap. 8, Sec. 6), esto es, probamos que si ZF es consistente, la adición de ciertos LTC-enunciados a ZF no destruye la consistencia, en símbolos: Con(ZF ) ⇒ Con(ZF + φ), donde φ es un LTC-enunciado. Como ejemplos de tales LTC-enunciados, podemos señalar el axioma de elección AE , la hipótesis del continuo HC , la hipótesis generalizada del continuo HGC o el axioma de constructibilidad V=L, que se estudiará más adelante. Para probar tales consistencias relativas, siempre se supone que ZF es consistente. 15. Formas normales prenexa y de Skolem En esta sección asociamos a cada L-fórmula otra L-fórmula en forma normal. Ambas resultan ser equivalentes. Sea Φ un conjunto de L-fórmulas y [Φ] la cerradura de Φ respecto a la negación y disyunción de fórmulas en Φ. Por supuesto, Φ ⊆ [Φ]. Lema 15.1. Sean Φ(x0 , . . . , xn−1 ) un conjunto de L-fórmulas, A, B Lestructuras y a0 , . . . , ar−1 ∈ A, b0 , . . . , br−1 ∈ B. Si A |= φ[a0 , . . . , an−1 ] si y sólo si B |= φ[b0 , . . . , bn−1 ] (34) es válido para todo φ ∈ Φ, entonces 34 es válida para toda φ ∈ [Φ]. Demostración. Inmediata de la definición de [Φ]. 249 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 250 ✐ ✐ 4. Lógica Lema 15.2. Sea Φ = {φ0 , . . . , φn } un conjunto de fórmulas. Entonces toda fórmula en [Φ] satisfacible es lógicamente equivalente a una fórmula de la forma (ψ0,0 ∧ · · · ∧ ψ0,n ) ∨ · · · ∨ (ψk,0 ∧ · · · ∧ ψk,n ), (35) donde k < 2n+1 y para i ≤ k, j ≤ n se cumple ψi,j = φj o ψi,j = ¬φj . En particular, hay solamente una cantidad finita de L- fórmulas en [Φ] que no son lógicamente equivalentes entre sí. Así que toda fórmula en [Φ] es lógicamente equivalente a una disyunción de conjunciones de fórmulas de {φ0 , . . . , φn , ¬φ0 , . . . , ¬φn }. Demostración. Escogemos r tal que Φ ⊆ Fmlr (L). estructura A y ~a = (a0 , . . . , ar−1 ) ∈ Ar , sea donde ψA,~a = ψ0 ∧ · · · ∧ ψn , ψi = ( φi , ¬φi , Entonces Para una L(36) si A |= φi [~a]; si A |= ¬φi [~a]. A |= ψ(A,~a) [~a] (37) B |= ψ(A,~a)[~b], (38) y ψ(A,~a) es un conjunto de la forma 35. Más aún, para cualesquier B y b0 , . . . , br−1 ∈ B si y sólo si para i = 0, . . . , n A |= φi [~a] si y sólo si B |= φi [~b], A |= φ[~a] si y sólo si B |= φ[~b]. si y sólo si para toda φ ∈ [Φ]: De la ecuación 36 se sigue que {ψ(A,~a) : A es una L-estructura y ~a ∈ Ar } tiene a lo sumo 2n+1 elementos. 250 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 251 ✐ ✐ Conjuntos y modelos. Curso avanzado La prueba estará completa si mostramos que toda φ ∈ [Φ] satisfacible es lógicamente equivalente a la disyunción χ de una cantidad finita de fórmulas del conjunto: {ψ(A,~a) : A es una L-estructura,~a ∈ Ar , A |= φ[~a]}. Escribimos χ= _ {ψ(A,~a) : A es una L-estructura,~a ∈ Ar , A |= φ[~a]}, donde es claro que se trata de una disyunción finita. Para verificar la equivalencia entre φ y χ supongamos, primero, que B |= φ[~b]. Entonces ψ(B,~b) es un miembro de la disyunción χ. Como B |= ψ ~ [~b], se deduce que B |= χ[~b]. (B,b) Recíprocamente, si B |= χ[~b], por definición de χ existen una L- estructura A y ~a ∈ Ar tales que A |= φ[~a] y B |= ψ[~b]. Entonces, por 38, ~b satisface las mismas fórmulas de [Φ] en B que ~a satisface en A. En particular, B |= φ[~b]. Una fórmula que es disyunción de conjunciones de literales está en forma normal disyuntiva. Como corolario al lema 15.2 obtenemos el siguiente resultado: Teorema 15.3 (Forma normal disyuntiva). Si φ es una L-fórmula sin cuantificadores, entonces φ es lógicamente equivalente a una fórmula en forma normal disyuntiva. Demostración. Sea φ como en la hipótesis. Si φ no es satisfacible, entonces φ es lógicamente equivalente a ¬(v0 =v ˙ 0 ). Si φ es satisfacible y ψ0 , . . . , ψn son sus subfórmulas atómicas, entonces φ ∈ [{ψ0 , . . . , ψn }]. Por consiguiente, el teorema se desprende del lema 15.2. Ahora queremos considerar fórmulas que pueden involucrar cuantificadores, para ello las escribimos en forma normal prenexa, es decir, en la forma C0 x0 · · · Cm−1 xm−1 ψ0 , donde Ci ∈ {∀ , ∃ } para i < m y ψ0 no tiene cuantificadores. C0 x0 · · · Cm−1 xm−1 es el prefijo y ψ0 es la matriz. La pregunta es si realmente podemos escribir cualquier fórmula en forma normal prenexa. Afortunadamente es el caso: 251 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 252 ✐ ✐ 4. Lógica Teorema 15.4 (Forma normal prenexa). Toda L-fórmula φ es lógicamente equivalente a una fórmula ψ en forma normal prenexa con lib(φ) = lib(ψ). Demostración. Primero consideremos algunas propiedades elementales de la equivalencia lógica. Mediante φ ∼ ψ expresamos que φ y ψ son lógicamente equivalentes. 1. Si φ ∼ ψ, entonces ¬φ ∼ ¬ψ. 2. Si φ0 ∼ ψ0 y φ1 ∼ ψ1 , entonces (φ0 ∨ φ1 ) ∼ (ψ0 ∨ ψ1 ). 3. Si φ ∼ ψ y C ∈ {∀ , ∃ }, entonces Cxφ ∼ Cxψ. 4. ¬∃ xφ ∼ ∀ x¬φ, ¬∀ xφ ∼ ¬∃ x¬φ. 5. Si x ∈ / lib(ψ), entonces (∃ xφ ∨ ψ) ∼ ∃ x(φ ∨ ψ), (∀ xφ ∨ ψ) ∼ ∀ x(φ ∨ ψ), (ψ ∨ ∃ xφ) ∼ ∃ x(ψ ∨ φ) y (ψ ∨ ∀ xφ) ∼ ∀ x(ψ ∨ φ). Después, damos un método para transformar una fórmula dada a la Def forma normal prenexa utilizando 1-5. Por ejemplo, si ϕ = ¬∃ xPx ∨ ∀ xRx. Procedemos de la siguiente manera: ¬∃ xPx ∨ ∀ xRx ∼ ∀ x¬Px ∨ ∀ xRxpor 2 y 4 ∼ ∀ x¬Px ∨ ∀ yRy ya que ∀ xRx ∼ ∀ yRy por 2 ∼ ∀ x(¬Px ∨ ∀ yRy)por 5 ∼ ∀ x∀ y(¬Px ∨ Ry) por 3 y 5. En el caso general procedemos como a continuación se detalla. Para φ ∈ Fml(L), sea nc(φ) la cantidad de cuantificadores de φ. Por inducción en n probamos que: (∗)n para cada φ con nc(φ) ≤ n existe una L-fórmula ψ en forma normal prenexa tal que φ ∼ ψ, lib(φ) = lib(ψ) y nc(φ) = nc(ψ). Queda al lector probar la afirmación lib(φ) = lib(ψ). n = 0: si nc(φ) = 0, φ no tiene cuantificadores y hacemos φ = ψ. n > 0: Mostraremos (∗)n por inducción en la construcción de φ. Supongamos que nc(φ) ≤ n. Los casos sin cuantificadores son evidentes. Si φ = ¬φ′ y nc(φ) > 0, entonces nc(φ′ ) = nc(φ) > 0 y por hipótesis de inducción una fórmula, para φ′ , de la forma Cxχ en forma normal prenexa (con nc(Cxχ) = nc(φ) y χ puede contener cuantificadores). Por 1 y 4, φ ∼ C−1 x¬χ (donde ∀ −1 = ∃ y ∃ −1 = ∀ ). Como nc(¬χ) = nc((Cxχ) − 1 = nc(φ) − 1 ≤ n − 1, existe una fórmula ψ lógicamente equivalente a ¬χ que está en forma normal prenexa tal que nc(ψ) = nc(¬χ). Por 3, C−1 xψ es una fórmula lógicamente equivalente φ con las propiedades requeridas. 252 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 253 ✐ ✐ Conjuntos y modelos. Curso avanzado Def Sea ϕ = (φ′ ∨ φ′′ ) y nc(φ) > 0, por ejemplo, nc(φ′ ) > 0. Por hipótesis de inducción existe una fórmula Cxχ en forma normal prenexa para φ′ . Sea y una variable que no aparece en Cxχ o en φ′′ . Se puede mostrar con facilidad que Cxχ ∼ Cyχ{y/x}, y por 2 y 5 obtenemos φ = (φ′ ∨ φ′′ ) ∼ (Cxχ{y/x} ∨ φ′′ ) ∼ Cy(χ{y/x} ∨ φ′′ ). Como nc(χ{y/x} ∨ φ′′ ) = nc(φ) − 1 ≤ n − 1, podemos encontrar una fórmula ψ en forma normal prenexa que es lógicamente equivalente a (χ{y/x} ∨ φ′′ ). Cyψ tiene la propiedad requerida. Def Sea φ = ∃ xφ′ . Como nc(φ′ ) ≤ n − 1, existe una fórmula ψ ′ en forma normal prenexa que es lógicamente equivalente a φ′ . En tal caso ∃ xψ ′ es una fórmula en forma normal prenexa que por 3 es lógicamente equivalente a φ y tiene la misma cantidad de cuantificadores que φ. Si φ y ψ son fórmulas tales que φ es satisfacible si y sólo si ψ lo es, decimos que φ y ψ son equivalentes respecto a satisfacción (ers). Si en el teorema 15.4 la condición de equivalencia lógica se debilita a ψ |= φ y a ers, la fórmula ψ se puede escoger, adicionalmente, universal, es decir, de tal forma que su prefijo contenga sólo cuantificadores universales. Consideremos el siguiente ejemplo: sea φ la L-fórmula ∀ x∃ yRxy. Def Añadimos un símbolo de 1-función f a L, y sea ψ = ∀ xRxf (x). Entonces ψ es universal y ψ |= ϕ. Por otra parte, sea A un L-modelo de ∀ x∃ yRxy. Como para cada a ∈ A tenemos un elemento b ∈ A con RA (a, b), podemos elegir una interpretación f A de f de tal suerte que RA (a, f A (a)) para toda a ∈ A, es decir, A′ |= ∀ xRxf (x), donde A′ es una L′ -estructura, donde L′ = L ∪ {f }. Por lo tanto, ∀ xRxf (x) también tiene un modelo. Teorema 15.5 (Forma normal de Skolem). A cada L-fórmula φ le podemos asociar una fórmula universal ψ en forma normal prenexa con ψ |= φ y lib(φ) = lib(ψ), tal que φ y ψ son equivalentes respecto a satisfacción. Además de los símbolos de φ, la fórmula ψ puede involucrar símbolos adicionales de función o de constante. 253 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 254 ✐ ✐ 4. Lógica Demostración. Describimos como construir ψ a partir de φ. La fórmula ψ se conoce como forma normal de Skolem de φ. Sea φ una L-fórmula. De acuerdo con el teorema 15.4, podemos suponer que φ está en forma normal prenexa, digamos φ = C1 x1 · · · Cm xm φ0 , donde φ0 no tiene cuantificadores. Procedemos por inducción en la cantidad de cuantificadores existenciales en el prefijo de φ. Si no hay cuantificadores existenciales hacemos ψ = φ. Para la etapa inductiva, sea φ de la forma φ = ∀ x1 · · · xk ∃ xk+1 Ck+2 xk+2 · · · Cm xm φ0 . Podemos suponer que las variables x1 , . . . , xk son distintas. Sea φ1 = Ck+2 xk+2 · · · Cm xm φ0 y sea f un nuevo símbolo de k-función si k 6= 0 y un símbolo de constante si k = 0. Mostramos que con ψ ′ = ∀ x1 · · · ∀ xk φ1 {fx1 · · · xk /xk+1 } se cumple: 1. Si φ es satisfacible, también ψ ′ lo es. 2. ψ ′ |= φ. Con esto terminamos: puesto que el prefijo de ψ ′ contiene menos cuantificadores existenciales que el prefijo de φ, la hipótesis de inducción proporciona una fórmula ψ en forma normal de Skolem, tal que 3. ψ ′ y ψ son ers y lib(ψ ′ ) = lib(ψ). 4. ψ |= ψ ′ . Como lib(ψ ′ ) = lib(φ), 1-4 dan lugar a que ψ sea una fórmula con las propiedades requeridas. Para probar 1, sea A una L-estructura modelo de φ. Entonces para cualesquier a1 , . . . , ak ∈ A se cumple A |= ∃ xk+1 φ1 {a1 , . . . , ak /x1 , . . . , xk }, por lo que podemos escoger un símbolo de función f con interpretación f A , tal que para cualesquier a1 , . . . , ak ∈ A: A′ |= φ1 {a1 , . . . , ak , fx1 · · · xk /x1 , . . . , xk+1 }, 254 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 255 ✐ ✐ Conjuntos y modelos. Curso avanzado con A′ una L′ -estructura y L′ = L ∪ f . En consecuencia, A′ es un modelo de ∀ x1 · · · ∀ xk φ1 {fx1 · · · xk /xk+1 } y ′ ψ es satisfacible. Para probar 2, sea A′ un modelo de ψ ′ . Para cualesquier a1 , . . . , ak ∈ A y por ello A′ |= φ1 {a1 , . . . , ak , fx1 · · · xk /x1 , . . . , xk+1 }, A |= ∃ xk+1 φ1 {a1 , . . . , ak /x1 , . . . , xk } lo que implica que el reducto de A′ es un modelo de φ. 16. El teorema de Herbrand Para demostrar el teorema de completud en la sección 12 construimos un modelo muy especial cuyos elementos son formalmente las expresiones sintácticas que aparecen en un cierto conjunto de fórmulas. Así, a cada conjunto Φ de fórmulas le asignamos una interpretación AΦ con valuación βΦ . Con este fin introdujimos una relación de equivalencia ∼ en el conjunto Tm(L): t ∼ t ′ si y sólo si t =t ˙ ′ ∈ Φ. Como los conjuntos de fórmulas considerados en esa ocasión son conjuntos de Henkin, de Φ ⊢ t =t ˙ ′ se deduce t =t ˙ ′ ∈ Φ. Ahora estamos en una situación más general, por lo que definimos t ∼ t′ si y sólo si Φ ⊢ t =t ˙ ′. (39) En resumen, tenemos como universo el conjunto Tm(L)/ ∼ y definimos β como β(vi ) = vi (i ∈ N); para interpretar, por ejemplo, un símbolo de 1-función hacemos f A (t) = ft, y un símbolo de 1-relación R RA = {t ∈ A : Φ ⊢ Rt}. El lector no tendrá dificultad en probar el siguiente lema: Lema 16.1. (a) La relación ∼ es de equivalencia en Tm(L). (b) La relación ∼ es compatible con los símbolos en L en el siguiente sentido: Si t1 ∼ t1′ , . . . , tn ∼ tn′ entonces para todo símbolo de n-función f se cumple ft1 · · · tn ∼ ft1′ · · · tn′ ; 255 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 256 ✐ ✐ 4. Lógica y para cualquier símbolo de n-relación R es cierto que Φ ⊢ Rt1 · · · tn si y sólo si Φ ⊢ Rt1′ · · · tn′ . Sean t la clase de equivalencia de t respecto a ∼ y A(Φ) = {t : t ∈ Tm(L)}, el universo de la estructura A(Φ), donde para todo símbolo de n-relación R, RA(Φ) t 1 · · · t n para todo símbolo de n-función f si y sólo si Φ ⊢ Rt1 · · · tn , Def f A(Φ) (t 1 , . . . , t n ) = ft1 · · · tn , para todo símbolo de constante c cA(Φ) = c; y finalmente βΦ (x) = x. La siguiente proposición es inmediata. Proposición 16.2. (a) Para todo L-término t, t A(Φ) [βΦ ] = t. (b) Para toda fórmula atómica ϕ: A(Φ) |= ϕ[βΦ ] si y sólo si Φ ⊢ ϕ. (c) Para toda fórmula ϕ y cualesquier variables distintas x1 , . . . , xn : (i) A(Φ) |= ∃ x1 · · · xn ϕ[βΦ ] si y sólo si existen L-términos t1 , . . . , tn tales ,... ,xn que A(Φ) |= ϕ[β( xt11 ,... ,tn )]. (ii) A(Φ) |= ∀ x1 · · · xn ϕ[β] si y sólo si para cualesquier L- términos ,... ,xn t1 , . . . , tn , A |= ϕ[β( xt11 ,... ,tn )]. Para fórmulas de la forma ∃ x1 · · · xn ϕ o de la forma ∀ x1 · · · xn ϕ, supondremos que las variables x1 , . . . , xn son distintas. Definimos el conjunto Tmk (L) = {t ∈ Tm(L) : var(t) ⊆ {v1 , . . . , vk−1 }}. Consideremos la subestructura de A(Φ) con universo Tmk (Φ) = {t : t ∈ Tmk (L)}. Para asegurar la existencia de tal conjunto en el caso k = 0, supondremos en lo sucesivo que si k = 0, entonces la signatura de L contiene al menos 256 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 257 ✐ ✐ Conjuntos y modelos. Curso avanzado un símbolo de constante. Tmk (Φ) es el universo de una subestructura de A(Φ) pues es cerrado respecto a funciones y contiene todos los símbolos de constante: si c es un símbolo de constante, entonces c ∈ Tmk (L) y por lo tanto c ∈ Tmk (Φ). Si f es un símbolo de n-función y a1 , . . . , an ∈ Tmk (Φ), digamos a1 = t 1 , . . . , an = t n para ciertos términos pertenecientes a t1 . . . , tk ∈ Tmk (L), entonces f A(Φ) (a1 , . . . , an ) = f A(φ) (t 1 , . . . , t n ) ⇔ ft1 · · · tn ∈ Tmk (Φ). Sean Tmk (Φ) la subestructura de A(Φ) con universo Tmk (Φ) y βkΦ una valuación en Tmk (Φ) tal que βkΦ (vi ) = βΦ (vi )(= vi ) para i < k y para i ≥ k βkΦ (vi ) = ( v0 , c, (40) si n 6= 0; si k = 0, donde, en el caso k = 0, c es un símbolo de constante. Finalmente, sea Ak (Φ) = Tmk (Φ) con la valuación βkΦ . En virtud de 40, lo siguiente es cierto para t ∈ Tmk (L) y ϕ ∈ Fmlk (L): t A(Φ) [βkΦ ] = t A(Φ) [βΦ ] = t A(Φ) |= ϕ[βkΦ ] si y sólo si A(Φ) |= ϕ[βΦ ]. Puesto que Ak (Φ) ⊆ A(Φ), concluimos que Lema 16.3. (a) t Ak (Φ) = t para t ∈ Tmk (L) y por lo tanto t A0 (Φ) = t para t ∈ Tm0 (L). (b) Para fórmulas sin cuantificadores ψ ∈ Fmlk (L): A(Φ) |= ψ si y sólo si Ak (Φ) |= ψ. (c) Para fórmulas universales ψ ∈ Fmlk (L) si A(Φ) |= ψ, entonces Ak (Φ) |= ψ; en particular, para k = 0, si A(Φ) |= ψ, entonces A0 (Φ) |= ψ. El siguiente lema es clave para la demostración del teorema de Herbrand: 257 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 258 ✐ ✐ 4. Lógica Lema 16.4. Para un conjunto Φ ⊆ Fmlk (L) de fórmulas universales en forma normal prenexa las siguientes afirmaciones son equivalentes: (a) Φ es satisfacible. Def (b) El conjunto Φ0 = {ϕ{x1 , . . . , xn /t1 , . . . , tn } : ∀ x1 · · · xm ϕ ∈ Φ, ϕ sin cuantificadores, t1 , . . . , tm ∈ Tmk (L)} es satisfacible. Demostración. De (a) se obtiene (b) pues siempre es cierto que ∀ x1 , · · · xm ϕ |= ϕ{x1 , . . . , xm /t1 , . . . , tm } para t1 , . . . , tm ∈ Tmk (L). Para probar (b) ⇒ (a) observemos que el teorema de compacidad implica que es suficiente considerar L finito. Sea S finito y Φ0 satisfacible y por lo tanto consistente. Como Φ0 ⊆ Fmlk (L), lib(Φ) es finito. Por consiguiente existe Θ con Φ0 ⊆ Θ ⊆ Fml(L), que es un conjunto de Henkin. De acuerdo con el teorema 12.15, Θ tiene un modelo A′ (Θ) con A(Θ) su L-reducto, y entonces A(Θ) |= Φ0 . Como Φ0 consiste en fórmulas sin cuantificadores, Ak (Θ) es modelo de Φ0 (de acuerdo con el lema 16.1[b]). Por lo tanto, todas las fórmulas ∀ x1 · · · xn ϕ ∈ Φ con ϕ sin cuantificadores cumple con: para cualesquier t1 , . . . , tm ∈ Tmk (L), Ak (Θ) |= ϕ{x1 , . . . , xm /t1 , . . . , tm }; así que tiAk (Θ) = t i y concluimos que para cualesquier t1 , . . . , tm ∈ Tmk (L), AΘ k |= ϕ[β(t 1 , . . . , t m /x1 , . . . , xm )]. Como Ak (Θ) = {t : t ∈ Tmk (L)}, obtenemos Ak (Θ) |= ∀ x1 · · · xm ϕ. En síntesis, Ak (Θ) es modelo de Φ. Teorema 16.5 (Herbrand). Sea k ∈ N y supongamos que L contiene al menos un símbolo de constante en el caso k = 0. Para fórmulas ∀ x1 · · · xm ϕ y ∃ y1 · · · yn ψ de Fmlk (L) con ϕ, ψ sin cuantificadores y variables distintas x1 , . . . , xm , y1 , . . . yn , las siguientes afirmaciones son equivalentes: (a) ∀ x1 · · · xm ϕ ⊢ ∃ y1 · · · yn ψ. (b) Existen j ≥ 1 y términos ti1 , . . . , tin , . . . , tj1 , . . . , tjn ∈ Tmk (L) tales que ∀ x1 · · · xm ϕ ⊢ ψ{y1 , . . . , yn /t11 , . . . , t1n } ∨ · · · ∨ ψ{y1 , . . . , yn /tj1 , . . . , tjn }. 258 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 259 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Existen i, j ≥ 1 y términos s11 , . . . , s1m , . . . , si1 , . . . , sim , t11 , . . . , t1n , . . . , tj1 , . . . , tjn ∈ Tmk (L) con ϕ{x1 , . . . , xm /s11 , . . . , s1m } ∧ · · · ∧ ϕ{x1 , . . . , xm /si1 , . . . sim } ⊢ ψ{y1 , . . . , yn /t11 , . . . , t1n } ∨ · · · ∨ ψ{y1 , . . . , yn /tj1 , . . . , tjn }. Demostración. Como ∀ x1 · · · xm ϕ ⊢ ϕ{x1 , . . . , xm /s11 , . . . , s1m } y ψ{y1 , . . . , yn /t11 , . . . , t1n } ⊢ ∃ y1 · · · yn ψ, obtenemos fácilmente (b) a partir de (c) y (a) a partir de (b). En consecuencia, resta probar que (a) implica (c). Supongamos que ∀ x1 , · · · , xm ϕ ⊢ ∃ y1 · · · yn ψ. Así que el conjunto {∀ x1 · · · xm ϕ, ¬∃ y1 · · · yn ψ} no es satisfacible, y tampoco lo es el conjunto {∀ x1 , · · · , xm ϕ, ∀ y1 , · · · , yn ¬ψ}. En vista del lema 16.4 podemos concluir que {ϕ{x1 , . . . , xm /s11 , . . . , s1m } : s11 , . . . , s1m ∈ Tmk (L)} ∪ ∪ {¬ψ{y1 , . . . , yn /t11 , . . . , t1n }, . . . , ¬ψ{y1 , . . . , yn /tj1 , . . . , tjn }} no es satisfacible. Por consiguiente, ϕ{x1 , . . . , xm /s11 , . . . , s1m } ∧ · · · ∧ ϕ{x1 , . . . , xm /si1 , . . . , sim } |= |= ψ{y1 , . . . , yn /t11 , . . . , t1n } ∨ · · · ∨ ψ{y1 , . . . , yn /tj1 , . . . , tjn }, por lo que (c) es cierto. Como caso particular del lema 16.4 y del teorema de Herbrand, tenemos el siguiente corolario: Corolario 16.6. Sea ∀ x1 · · · xn ϕ ∈ Fmlk (L) con ϕ sin cuantificadores. (a) Las siguientes afirmaciones son equivalentes: (i) Sat(∀ x1 · · · xn ϕ). (ii) Sat({ϕ{x1 , . . . , xn /t1 , . . . , tn } : t1 , . . . , tn ∈ Tmk (L)}. (b) Las siguientes afirmaciones son equivalentes: 1. ⊢ ∃ x1 · · · xn ϕ. 2. Existen j ≥ 1 y términos t11 , . . . , t1n , . . . , tj1 , . . . , tjn ∈ Tmk (L) tales que ⊢ ϕ{x1 , . . . , xn /t11 , . . . , t1n } ∨ · · · ∨ ϕ{x1 , . . . , xn /tj1 , . . . , tjn }. 259 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 260 ✐ ✐ 4. Lógica 17. Ejercicios 1. Sea A 6= ∅ un conjunto. Dé ejemplos de estructuras cuyo universo sea el conjunto potencia de A. 2. Sea V un espacio vectorial sobre el campo K. Represente a V mediante una estructura. Es más fácil tomar como universo el conjunto de vectores V y encontrar una manera adecuada para representar la multiplicación por escalares. 3. Para cada uno de los siguientes conjuntos, dé una estructura cuyo universo sea el conjunto dado y que tenga al menos una relación, una función y una constante. (a) Q[x]. El anillo de polinomios con coeficientes en Q. (b) RR . El conjunto de funciones f : R −→ R. (c) Suc = {hxn in∈N | xn ∈ R}, el conjunto de sucesiones de números reales. 4. Sea P un conjunto de sı́mbolos de proposición. Construya una estructura que represente a la lógica proposicional, cuyas proposiciones atómicas son los elementos de P. 5. Sean A = hQ, +, ·, hA , 1, 21 i y B = hZ, ·, +, hA , −1, 3i, donde f A = + = gB , gA = · = f B , aA = 1, aB = −1, bA = 21 , bB = 3, hA cumple hA ( pq ) = pq , hA (0) = 0 y hB cumple hB (m) = −m. Sean β : Var −→ Q tal que β(x) = 13 , β(y) = 2, β(z) = 41 y β′ : Var −→ Z tal que β′ (x) = −2, β′ (y) = −4, β′ (z) = 5. Evalúe los siguientes términos en A, según β, y en B, según β′ . (a) f (b, h(b)). (b) g(h(a), g(b, x)). (c) h(f (x, y)). (d) f (h(z), g(z, b)). (e) h(g(a, x)). 6. Considere las siguientes interpretaciones. A = hZ, |, QA , +, ·, −, −1, 0i donde P A =| (la relación de divisibilidad), QA es la relación “ser primo”, f A = +, gA = ·, hA = −, aA = −1, bA = 0. B = hQ, >, QA , +, ·, /, 13 , 25 i donde P B = >, QB es la relación “tener denominador primo”, f B = ·, gB = /, hB = +, aB = 13 , bB = 25 . 260 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 261 ✐ ✐ Conjuntos y modelos. Curso avanzado C = hR, P A , QA , +, ·, /, π, 4i donde P A (x, y) si y sólo si x + y ∈ Q, QA (x) si y sólo si x es irracional, f A = /, gA = +, hA = ·, aA = π, bA = 4. Conteste con cierto o falso, demostrando o dando un contraejemplo. (a) A |= ∀x∀y(Pxy ⇒ Pyx)[β] para cualquier β. (b) A |= ∀y(P(f (a, a), y) ⇒ ∃z(h(b, y) = f (z, z)))[β] para cualquier β. (c) A |= ∀x∀y∀z(Qx∧P(x, g(y, z)) ⇒ P(x, y)∨P(x, z))[β] para cualquier β. (d) A |= (Q(x) ∧ P(x, u))[β] para β(x) = 3, β(u) = 17. (e) A |= (Q(h(a, y)) ∨ P(a, h(x, y)))[β] para β(x) = 16, β(y) = 3. (f) B |= ∀x∀z(Q(x) ∧ z = g(f (a, f (a, a)), x) ⇒ Q(z)))[β] para cualquier β. (g) B |= ∃yP(f (b, b), y)[β] para cualquier β. (h) B |= Q(h(a, f (a, b)))[β] para cualquier β. (i) B |= (Q(x) ⇒ Q(h(x, h(a, h(a, a)))))[β] para β(x) = 97 . (j) B |= ∃y∃x(Q(x) ∧ Q(y) ∧ ¬Q(g(x, y)))[β] para cualquier β. (k) C |= ∃y∃z¬P(y, h(z, z))[β] para cualquier β. (l) C |= ∃x∀yP(x, y)[β] para cualquier β. √ (m) C |= (P(a, b) ∨ Q(f (b, z)))[β] para β(x) = 2. (n) C |= ∃xP(a, x)[s] para cualquier β. (o) C |= ∃y(Q(y) ∧ ¬P(y, g(x, x)))[β] para β(x) = e. 7. Demuestre que las siguientes condiciones son equivalentes: (a) A |= (ϕ ⇒ ψ)[β]. (b) Si A |= ϕ[β], entonces A |= ψ[β]. 8. Demuestre que las siguientes condiciones son equivalentes: (a) A |= (ϕ ⇔ ψ)[β]. (b) A |= ϕ[β] si y sólo si A |= ψ[β]. 9. Pruebe que A 6|= ¬ϕ[β] si y sólo si A |= ϕ[β]. 10. Pruebe que ϕ(x1 , . . . , xn ) es satisfacible si y sólo si ∃x1 . . . ∃xn ϕ es satisfacible. 11. Para cada uno de los siguientes enunciados L-fórmulas, encuentre una Lestructura en la que la L-fórmula sea cierta y otra L-estructura en la cual sea falsa. (a) ∀ x(Px ∧ Qx ⇒ Rx). (b) ∃ x(Px ∧ ¬Qx ∧ ¬Rx). 261 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 262 ✐ ✐ 4. Lógica 12. 13. 14. 15. (c) ∀ x(Px ⇒ Qxa) ⇒ (∃ y)(Py ∧ Ry ∧ ¬Qxy). (d) ∃ x∀ y(Px ∧ Ry ∧ Sxy ∧ ∃ z(Pz ∧ Rx ∧ ¬Qxaz)). (e) ∀ xRxf (x) ∧ ∀ x∀ y(Rxy ⇒ Ryx) ∧ ∀ x∀ y∀ z(Rxy ∧ Ryz ⇒ Rxz). Para cada uno de los siguientes conjuntos de L-fórmulas, encuentre una L-estructura en la que la última fórmula es falsa, pero las otras son ciertas. (a) {∀ x∀ y(Px ∧ Py ⇒ Rxy), ∃ xPx, ∃ xPf (x), ∃ xRf (x)x}. (b) {∀ x∀ y(Px ∧ Py ⇒ Pf (x, y)), ∃ x(Px ∧ ¬Qx), ∀ x(Px ⇒ ∃ y(Py ∧ ¬Qf (x, y))}. (c) {∀ x[Ax ∧ Bx ⇒ ∀ y(By ∧ Cy ⇔ Dxy)], ∃ x[Ax ∧ Bx ∧ ∀ y(By ∧ Ey ⇔ ¬Dxy)], ∃ x(Ax ∧ Bx ∧ ¬Ex)}. En cada uno de los siguientes incisos, a partir del conjunto de premisas dé una prueba (usando las reglas válidas del cálculo de secuencias) de la conclusión. Las letras a, b, c, . . . representan símbolos de constante; x, y, z son variables; f, g, . . . símbolos de función; P, Q, R, . . . símbolos de relación. (a) Premisas: ∀ x(Ax ⇒ Bx ∨ Cx), ∀ x(Bx ⇒ Cx) Conclusión: ∀ x(Ax ⇒ Cx). (b) Premisas: ∀ x∀ y∀ z(Rxz ∧ Ryz ⇒ Rxy), ∀ xRxf (x). Conclusión: Rab ∧ Rbc ⇒ Rac. (c) Premisas: ∀ x∀ y(Rxy ∧ Ryx ⇒ Sxy) Conclusión: ∀ x∀ y[∀ z(Rxz ∧ Ryz) ⇒ Sxy]. Muestre que cada uno de los siguientes conjuntos de fórmulas son inconsistentes, dando una prueba de una contradicción. (a) {∀ x(Px ⇒ Qx), ∀ x(Px ⇒ ¬Qx), Pa}. (b) {∀ x∀ y(Px ∧ Qy ⇒ Rxy), ∀ x(Qx ⇒ ¬Rxa), Pa ∧ Qa}. (c) {∀ x[Px ⇒ ∀ y(Qy ⇒ Rxy)], ∀ x(Tx ⇒ Qx), ∀ x∀ y∀ z(Rxy ∧ Ryz ⇒ Rxz), Pa ∧ Sb ∧ Tc ∧ ¬Rab, ∀ x(Sx ⇒ Rcx)}. (d) {∀ x∀ y(Qx ∨ Txy ⇒ Py), ∀ x[Rx ⇒ ∀ y(Py ⇒ Qa ∧ Sxya)], Rb ∧ Tbc, ∀ x(Pc ⇒ ¬Sbcx)}. A partir de las premisas, dé una demostración de la conclusión: (a) Premisas: ∃ x[Qx ∧ ∀ y(Py ⇒ Rxy)], ∀ x[Px ⇒ ∀ y(Qy ∧ Sy ⇒ ¬Ryx)]. Conclusión: ∃ xPx ⇒ ∃ x¬Sx. (b) Premisas: ∃ x[Px ∧ ∀ y(Py ∧ Rxy ⇒ Qya)], ∃ x(Px ∧ ¬Qxa), ∃ x(¬Px ∧ Qxa). Conclusión: ∃ x∃ y(Px ∧ Py ∧ ¬Rxy). 262 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 263 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Premisas: ∀ x∀ y(Dx ∧ Ey ⇒ Fxy), ∀ x∀ y(Dx ∧ Fxy ⇒ Gy). Conclusión: ∃ xDx ⇒ ∀ x(Ex ⇒ Gx). (d) Premisas: ∀ x∀ y(Px ⇔ Sxy), ∀ x∀ y(Rxy ⇒ Qy), ∀ x(Qx ⇒ Tx), ∃ xTx ⇒ ∀ y∀ zRyz. Conclusión: ∀ x[∃ y(Px ∧ Rxy) ⇔ ∃ z(Qz ∧ Sxz)]. 16. Un argumento con premisas Γ y conclusión ϕ es válido si y sólo si, para todo L-modelo A de Γ∪{ϕ} y toda n-ada~a de elementos de A, si~a satisface Γ, entonces ~a satisface ϕ. En otro caso el argumento es inválido. Para cada uno de los siguientes argumentos, si el argumento es válido, dé una prueba formal de la conclusión a partir de las premisas; si es inválido, encuentre un L-modelo contraejemplo. (a) Premisas: ∀ x(Ax ⇒ Cx), ∀ x(Bx ⇒ Dx), ∃ xAx, ∃ x¬Dx. Conclusión: ∃ x(Cx ∧ ¬Bx). (b) Premisas: ∃ x(Ax ∧ Bx ∧ ¬Cx), ∃ x(Bx ∧ ¬Cx ∧ Dx). Conclusión: ∃ x(Ax ∧ Dx). (c) Premisas: ∀ x∀ y∀ z(Rxy ∧ Ryz ⇒ Rxz), ∀ xRxx, ∀ x∀ y ∃ z(Rxz ∧ Ryz). Conclusión: ∀ x∀ y(Rxy ∨ Ryx). 17. Para los siguientes conjuntos de fórmulas, si son consistentes encuentre un L-modelo para cada uno de ellos; si son inconsistentes dé una prueba de una contradicción. (a) {∀ x(Ax ⇒ Cx), ∀ x(Bx ⇒ Cx), ∃ x(Ax ∧ ¬Bx)}. (b) {∀ x[Ux ∧ Vx ⇒ Wx], ∃ x(Ux ∧ Wx), ∀ x[Vx ⇒ (Ux ⇒ ¬Wx)], ∀ x(Ux ⇒ ¬Vx)}. (c) {∀ x∀ y(Rxy ⇒ Ryx), ∀ x∀ y∀ z(Rxy ∧ Ryz ⇒ Rxz), ∃ x¬Rxx}. 18. Suponga que el lenguaje L está asociado a una signatura σ que contiene los símbolos de relación R, R1 , R2 . Demuestre o contradiga lo siguiente: (a) (b) (c) (d) ∀ xRx |= Rt (t es un L-término arbitrario). Rx |= ∀ xRx. |= ∃ x(Rx ⇒ ∀ xRx). ∀ x(R1 x ∨ R2 x) |= (∀ xR1 x) ∨ (∀ xR2 x). 19. Sean c⊥ un símbolo de constante, f¬ un símbolo de 1-función, f∧ , f∨ , f ⇒ símbolos de 2-función. Suponga que L es el lenguaje asociado a la signatura que contiene exactamente esos símbolos y que A es la L-estructura 263 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 264 ✐ ✐ 4. Lógica con |A| = {0, 1}, cA = 0, f¬A (i) = 1 − i, f∧A (i, j) = mín{i, j}, f∨A (i, j) = máx{i, j}, f A⇒ (i, j) = máx{1 − i, j}. Demuestre que: (a) Cada función F : {0, 1}n − → {0, 1} es representable en el lenguaje L′ asociado a la signatura σ ′ = {f¬ , f∧ , f∨ }, es decir, existe un L′ término t tal que F (ξ(v1 ), . . . , ξ(vn )) = t A [ξ], para toda valuación ξ. (b) Demuestre (a) con σ ′ = {c⊥ , f ⇒ }. (c) Existe una función F : {0, 1} − → {0, 1} que no se puede representar mediante un L′′ -término, donde L′′ es el lenguaje asociado a la signatura σ ′′ = {f ⇒ , f∨ }. 20. Suponga que la signatura σ contiene un símbolo P de 1-relación y un símbolo f de 1-función. Si L es el lenguaje asociado a σ, demuestre que: (a) |= ∃ x(Pfx ⇒ Px). (b) No existe un L-término t tal que |= Pft ⇒ Pt. 21. Sea σ = {R, f } con R una 2-relación y f una 1-función. Demuestre que el conjunto de fórmulas: Σ = {∀ v1 Rv1 v1 , ∃ v1 ∀ v2 ¬Rv1 fv2 , ∀ v1 ∀ v2 (Rfv1 fv2 ⇒ Rv1 v2 )} tiene un modelo infinito, pero no tiene modelos finitos. 22. La signatura σ contiene un símbolo P de 1-relación y un símbolo f de 1-función. Si L es el lenguaje asociado a σ, demuestre: (a) Existen L-términos s, t tales que ⊢ (Pfs ⇒ Ps) ∨ (Pft ⇒ Pt). (b) ⊢ ∃ x(Pfx ⇒ Px). 23. Sean ǫ, δ, x, y, z variables distintas; f, h símbolos de 1-función y < un símbolo de 2-relación. Demuestre que {∀ ǫ∃ δ∀ x(x < δ ⇒ fx < ǫ), ∀ ǫ∃ z∀ y(z < y ⇒ hy < ǫ)} ⊢ ∀ ǫ∃ z∀ y(z < y ⇒ fhy < ǫ). 24. Sea H el conjunto que consta de todas las generalizaciones de fórmulas de la forma (∧1) ϕ ∧ ψ ⇒ ϕ. (∧2) ϕ ∧ ψ ⇒ ϕ. (∧3) ϕ ⇒ (ψ ⇒ ϕ ∧ ψ). ( ⇒ 1) ϕ ⇒ ϕ. ( ⇒ 2) ϕ ⇒ (ψ ⇒ ϕ). ( ⇒ 3) (ϕ ⇒ (ψ ⇒ ϑ)) ⇒ ((ϕ ⇒ ψ) ⇒ (ϕ ⇒ ϑ)). 264 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 265 ✐ ✐ Conjuntos y modelos. Curso avanzado ( ⇒ 4) ¬¬ϕ ⇒ ϕ. (∀ 1) ∀ xϕ ⇒ ϕ{x/t}, si ϕ, t son compatibles. (∀ 2) ∀ x(ϕ ⇒ ψ) ⇒ (∀ xϕ ⇒ ∀ xψ). (∀ 3) ϕ ⇒ ∀ xϕ, si x no es variable libre de ϕ. (ϕ es una generalización de ψ si ϕ tiene la forma ∀ x1 · · · ∀ xn ψ (n ≥ 0). Escribimos Γ ⊢H ϕ (ϕ es derivable en el cálculo de Hilbert a partir de Γ) si ϕ se puede derivar a partir de Γ∪H usando sólo modus ponens. Demuestre lo siguiente: (a) Γ ∪ {ϕ} ⊢H ϕ ⇒ ψ. (b) Si Γ ⊢H ϕ y x no es variable libre en Γ, entonces Γ ⊢H ∀ xϕ. (c) Γ ⊢H ϕ si y sólo si Γ ⊢ ϕ. 25. Demuestre el lema 6.9. [Sugerencia: Para el inciso (a) demuestre que Def T = {vn : n < ω} ∪ {ck : k ∈ K} ∪ ∪ {fj ar(0)a . . . ar(t(j) − 1) : j ∈ J ∧ r : t(j) − → Tm(L)} 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. satisface las condiciones (T1), (T2) y (T3) (con T en lugar de Tm(L)) y use la ⊆-minimalidad de Tm(L). Para (c) use inducción sobre |s| < ω.] Demuestre el teorema 6.10. Demuestre el lema 6.11. Demuestre el teorema 6.13. [Sugerencia: De acuerdo con el lema 6.12(b) son posibles cinco casos: ϕ = s1 =s ˙ 2 , ϕ = Rs(0) . . . s(τ(R) − 1), ϕ(0) = (, ϕ(0) = ¬ y ϕ(0) = ∀ . Investigue cada caso.] Demuestre el lema 8.7. [Sugerencia: Por inducción sobre la construcción de términos y fórmulas.] Demuestre el lema 11.11(c). Demuestre el lema 11.13. Demuestre el teorema 11.14. Demuestre el corolario 11.15. Sea σ una signatura finita con L como el lenguaje asociado y A como un conjunto finito. Muestre que hay solamente un número finito de Lestructuras con A como dominio. Sea σ = {+, ·, 0, 1, <} una signatura con +, · funciones binarias, 0, 1 constantes y < una 2-relación. Sean A = hN, +, ·, 0, 1, <i (el lector ya no 265 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 266 ✐ ✐ 4. Lógica debe tener problemas con el abuso notacional al denotar la interpretación de cada sı́mbolo como él mismo) y β(vn ) = 2n para n ≥ 0. ¿Cómo se interpretan las siguientes fórmulas? (a) ∃ v0 (v0 + v0 =v ˙ 1 ); (b) ∃ v0 (v0 · v0 =v ˙ 1 ); (c) ∃ v1 (v0 =v ˙ 1 ); (d) ∀ v0 ∃ v1 (v0 =v ˙ 1 ); (e) ∀ v0 ∀ v1 ∃ v2 (v0 < v2 ∧ v2 < v1 ). 36. Sea P un símbolo de 1-relación y f un símbolo de 2-función. Para cada una de las siguientes fórmulas: ∀ v1 (fv0 v1 =v ˙ 0 ), ∃ v0 ∀ v1 (fv0 v1 =v ˙ 1 ), ∃ v0 (Pv0 ∧ ∀ v1 (Pfv0 v1 )), encuentre una interpretación que las satisfaga y otra que no lo haga. 37. Una L-fórmula que no contiene ¬, ⇒ o ⇔ es positiva. Muestre que para toda L-fórmula positiva existe una interpretación que la satisface. 38. Para ϕ, χ, ψ ∈ Fml(L) muestre que: (a) (ϕ ∨ ψ) |= χ si y sólo si ϕ |= χ y ψ |= χ; (b) |= (ϕ ⇒ ψ) si y sólo si ϕ |= ψ. 39. Muestre que ∃ x∀ yϕ |= ∀ y∃ xϕ y ∀ y∃ xRxy 6|= ∃ x∀ yRxy. 40. Decimos que dos fórmulas ϕ, ψ son lógicamente equivalentes, en símbolos ϕ ≡ ψ, si ϕ |= ψ y ψ |= ϕ. Pruebe lo siguiente: (a) ∀ (ϕ∧ ψ) ≡ (∀ xϕ∧ ∀ xψ). (b) ∃ (δ ∨ ψ) ≡ (∃ xϕ ∨ ∃ xψ). (c) ∀ x(ϕ ∨ ψ) ≡ (ϕ ∨ ∀ xψ), x ∈ / lib(ϕ). (d) ∃ x(ϕ∧ ψ) ≡ (ϕ∧ ∃ xψ), x ∈ / lib(ϕ). (e) Muestre que (c) y (d) no se pueden demostrar sin la suposición x∈ / lib(ϕ). 41. Sea ϕ y ψ fórmulas tales que ϕ ≡ ψ. Sea χ ′ la fórmula que se obtiene de χ al reemplazar todas las subfórmulas de la forma ϕ por ψ. (a) Defina la función ′ por recursión sobre fórmulas. (b) Muestre que para toda χ, χ ≡ χ ′ . 266 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 267 ✐ ✐ Conjuntos y modelos. Curso avanzado 42. Un conjunto Φ de enunciados es independiente si no existe ϕ ∈ Φ tal que Φ\{ϕ} |= ϕ. Muestre que los axiomas de la teoría de grupos y los axiomas de la teoría de relaciones de equivalencia son independientes. 43. Sean A, B L-estructuras para una signatura σ dada. Sea A × B, el producto directo de A con B, es decir, la L-estructura con dominio A × B, determinada por las siguientes condiciones: Para toda n-relación R y (a1 , b1 ), . . . , (an , bn ) ∈ A × B, RA×B (a1 , b1 ) · · · (an , bn ) ⇔ RA a1 · · · an y RB b1 · · · bn ; para toda n-función f y (a1 , b1 ), . . . , (an , bn ) ∈ A × B, Def f A×B ((a1 , b1 ), . . . , (an , bn )) = (f A (a1 , . . . , an ), f B (b1 , . . . , bn )); y para c ∈ K, Def cA×B = (cA , cB ). Demuestre lo siguiente: (a) Si las L-estructuras A y B son modelos de la teoría de grupos, A × B también lo es. (b) Si las L-estructuras A y B son modelos de la teoría de relaciones de equivalencia, A × B también lo es. (c) Generalice la definición de producto de dos L-estructuras a una familia arbitraria de L-estructuras. 44. Demuestre que las siguientes reglas son derivables (a partir del cálculo de secuencias): Φ ⊢ ¬¬ϕ Φ⊢ϕ (b) (a) Φ ⊢ ¬¬ϕ Φ⊢ϕ Φ ⊢ ¬ϕ Φ ⊢ ψ Φ⊢ϕ (d) . (c) Φ ⊢ (ϕ ∨ ψ) Φ ⊢ (ϕ ⇒ ψ) 45. Decida si las siguientes reglas son válidas: Φ⊢ϕ Φ⊢ψ ⊢ϕ ⊢ψ (b) ⊢ ∃ xϕ ∃ xψ Φ ⊢ ∀ xϕ Φ ⊢ ∃ xψ Φ ⊢ ϕ{x/f (y)} (c) Φ ⊢ ∀ xϕ si f es 1-función, y f , y no aparecen en Φ o ∀ xϕ. (a) 267 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 268 ✐ ✐ 4. Lógica 46. Muestre que las siguientes reglas son derivables. Φ ⊢ ∀ xϕ Φ ⊢ ϕ{x/t} Φ ⊢ ∀ xϕ (c) Φ⊢ϕ Φ ⊢ ϕ{x/y} (e) y∈ / lib(Φ, ∀ xϕ) Φ ⊢ ∀ xϕ Φ⊢ϕ (f ) Φ ⊢ ∀ xϕ Φ ⊢ ¬ ∃ x¬ ϕ Φ ⊢ ϕ{x/t} Φ ⊢ ϕ{x/t} (d) Φ ⊢ ∀ xϕ (b) (a) (g) Φ⊢ϕ x∈ / lib(Φ). Φ ⊢ ∀ xϕ 47. Defina ` como la regla Φ ⊢ ∃ xϕ Φ ⊢ xϕ . Determine si ` es una regla derivable. 48. Sea σ = {R} con R como un símbolo de 1-relación, L como el lenguaje asociado, y sea Φ = {∃ xRx} ∪ {¬ Ry : y ∈ Var}. Muestre que: (a) Φ es satisfacible y, por lo tanto, consistente. (b) Para ningún término t ∈ Tm(L), Φ ⊢ Rt. (c) Si A es un modelo de Φ, entonces A \ {t A : t ∈ Tm(L)} no es vacío. 49. Sea σ = {R} con R un símbolo de 1-relación, x, y ∈ Var, x 6= y. Para Φ = {Rx ∨ Ry}, muestre que: Φ 0 Rx y Φ 0 ¬Rx. 50. Sea σ una signatura arbitraria. Decimos que un conjunto de fórmulas contiene testigos si para toda fórmula de la forma ∃ xϕ existe un Ltérmino t tal que Φ ⊢ (∃ xϕ ⇒ ϕ{x/t}). Sea Φ = {v0 =t ˙ : t ∈ Tm(L)} ∪ {∃ v0 ∃ v1 ¬ v0 =v ˙ 1 }. Muestre que Φ es consistente y que no existe un conjunto consistente en Fml(L) que contenga a Φ y tenga testigos. 51. Las fórmulas que son derivables mediante las siguientes reglas se conocen como fórmulas de Horn: si n ∈ N y ϕ1 , . . . , ϕn , ϕ son atómicas. (1) (¬ ϕ0 ∨ · · · ∨ ¬ ϕn ∨ ϕ) si n ∈ N y ϕ0 , . . . , ϕn son atómicas. (2) ¬ ϕ0 ∨ · · · ∨ ¬ ϕn (3) . ϕ, ψ |= (ϕ∧ ψ) . (4) ϕ |= ∀ xϕ 268 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 269 ✐ ✐ Conjuntos y modelos. Curso avanzado . ϕ |= ∃ xϕ Las fórmulas de Horn sin variables libres se conocen como enunciados de Horn. Demuestre que si ϕ es un enunciado de Horn y si cada Ai es modelo Q de ϕ, entonces i∈I Ai |= ϕ (véase Ejer. 43[d]). [Sugerencia: Enuncie y demuestre un resultado similar para fórmulas de Horn.] (5) 52. Sea σ una signatura finita y L el lenguaje asociado. Sea A una Lestructura finita. Muestre que existe una L-fórmula ϕA , cuyos modelos son precisamente las L-estructuras isomorfas a A. 53. Sea σ = {+, ·, 0}, donde +, · son 2-funciones, 0 una constante y L el lenguaje asociado. (a) Demuestre que la relación < (“menor que”) es elementalmente definible en la L-estructura hR, +, ·, 0i (con las interpretaciones usuales). Es decir, existe una fórmula ϕ ∈ Fml2 (L) tal que para toda a, b ∈ R, hR, +, ·, 0i |= ϕ[a, b] si y sólo si a < b. (b) La relación < no es elementalmente definible en hR, +, 0i. [Sugerencia: Trabaje con un automorfismo adecuado de hR, +, 0i.] 54. Sean ρ una 1-función en R y ∆ la 2-función distancia en R, es decir, ∆(r0 , r1 ) = |r0 − r1 | para r0 , r1 ∈ R. Si usamos los símbolos de función f (para ρ) y d (para ∆), podemos considerar hR, +, ·, 0, 1, <, ρ, ∆i como una estructura para la signatura {+, ·, 0, 1, <} ∪ {f, d}. Con estos símbolos, formalice los siguientes enunciados: (a) Todo número real positivo tiene raíz cuadrada positiva. (b) Si ρ es estrictamente creciente, ρ es inyectiva. (c) ρ es uniformemente continua en R. (d) Para toda x, si ρ es diferenciable en x, ρ es continua en x. 55. Sea σ = {R} donde R es una 2-relación. Formalice los siguientes enunciados: (a) R es una relación de equivalencia con al menos dos clases de equivalencia. (b) R es una relación de equivalencia con una clase de equivalencia que contiene más de un elemento. 56. Un conjunto M de números naturales es un espectro si existe una signatura σ (con lenguaje L) y un L-enunciado ϕ tal que M = {n ∈ N : ϕ tiene un modelo con exactamente n elementos}. 269 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 270 ✐ ✐ 4. Lógica Demuestre lo siguiente. (a) Todo subconjunto finito de N es un espectro. (b) Para toda m ≥ 1, el conjunto de números > 0 que son divisibles entre m es un espectro. (c) El conjunto de números no primos > 0 es un espectro. (d) El conjunto de números primos es un espectro. 57. Sea σ una signatura y K una clase de L-estructuras. Suponga que A, B ∈ K y, para toda estructura C ∈ K, existen homomorfismos f : A − →Cyg:B − → C. Muestre que existe un único homomorfismo de A a B. 58. Sean A, B L-estructuras, X un subconjunto de A, f : hXiA − → By g : hXiA − → B homomorfismos. Muestre que si f ↾ X = g ↾ X, entonces f = g. 59. Pruebe la siguiente afirmación, donde A, B, C estructuras son L-estructuras. (a) Todo homomorfismo f : A − → C se puede factorizar como f = hg, para un homomorfismo sobre g : A − → B y una extensión h : B − →C (la estructura B es una extensión). f A ✲C ❅ g❅ h ❅ ❘ ❅ ✠ B La L-estructura (única) B se conoce como la imagen de g, im g. Más generalmente decimos que una L-estructura B es una imagen homomórfica de A si existe un homomorfimo sobre g : A − → B. (b) Todo encaje f : A ֒→ C se puede factorizar como f = hg, donde g es una extensión y h es un isomorfismo. 60. Sean A y B L-estructuras con A ⊆ B. Una retracción de B a A es un homomorfismo f : B − → A tal que f (a) = a para todo elemento a ∈ A. Muestre que: (a) Si f : B − → A es una retracción, entonces f es idempotente, es decir, ff = f 2 = f . (b) Si B es una L-estructura y f un endomorfismo de B tal que f 2 = f , f es una retracción de B a una subestructura A de B. 270 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 271 ✐ ✐ Conjuntos y modelos. Curso avanzado 61. Sea σ una signatura finita sin símbolos de función, con L el lenguaje asociado. (a) Muestre que toda L-estructura finitamente generada es finita. (b) Muestre que para cada n < ω existe una cantidad finita (módulo isomorfismos) de L-estructuras con cardinalidad n. 62. (***) Dé un ejemplo de una estructura de cardinalidad ℵ2 que tiene una subestructura de cardinalidad ℵ0 , pero no una subestructura de cardinalidad ℵ1 . 63. Sea B una L-estructura y Y un conjunto de elementos de B. Muestre que el universo de hY iB consiste en aquellos elementos de B de la forma t B [~b], para algún término t(~x) de L y una n-ada de elementos de Y . 64. Sean A y B L-estructuras, ~a elementos que generan a A y f una función de A en B. Muestre que f es un homomorfismo si y sólo si, para toda fórmula atómica ϕ(~x) de L, A |= ϕ[~a] implica B |= ϕ[f (~a)]. 65. Sean A, B L-estructuras y â una sucesión de elementos de A. Sea g una función de los elementos de â a B tal que para todo enunciado primitivo ϕ de L(â), hA, âi |= ϕ implica hB, g(â)i |= ϕ. Muestre que g tiene una única extensión a un homomorfismo g′ : hâiA − → B. ~ 66. Sean hA,~ai y hB, bi L(~c)-estructuras que satisfacen exactamente los mismos enunciados de L(~c). Suponga también que las L-estructuras A y B se generan por ~a y ~b, respectivamente. Muestre que existe un isomorfismo f :A− → B tal que f (~a) = ~b. 67. Exhiba fórmulas adecuadas para probar que el conjunto de los números pares es un conjunto Σ00 en N. Demuestre lo mismo para el conjunto de números primos. 68. Una gráfica consiste en un conjunto V (los vértices) y un conjunto E (el conjunto de bordes), donde cada borde es un conjunto de dos vértices distintos. Un borde {v, w} une los vértices v y w. Una forma natural de convertir una gráfica G en una L-estructura es como sigue: los elementos de G (el universo) son los vértices. Existe una relación binaria RG tal que la pareja ordenada (v, w) está en RG si y sólo si existe un borde que une v a w. Sea G una gráfica cuyos vértices son todos los conjuntos {m, n} de exactamente dos números naturales. Si a, b son vértices, a está unido a b si a ∩ b 6= ∅ y a 6= b. Muestre que G no es minimal, pero tiene una cantidad infinita de subconjuntos minimales. 271 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 272 ✐ ✐ 4. Lógica 69. Una L-estructura A es O-minimal si L contiene un símbolo ≤ que ordena linealmente A, de tal forma que todo subconjunto de A que sea primer orden definible con parámetros es la unión de una cantidad finita de intervalos de la forma (a, b), {a}, (−∞, b), (a, ∞), donde a, b son elementos de A. Una teoría es O-minimal si todos sus modelos lo son. Sea A un modelo de orden lineal (la signatura tiene una 2-relación ≤) con el tipo ordinal de los números racionales. Muestre que A es O-minimal. 70. Sea A un espacio vectorial de dimensión infinita sobre un campo finito. Muestre que A es minimal y que los únicos conjuntos ∅-definibles en A son ∅, {0} y A. 71. Sean ~x una n-ada de variables y ϕi (~x, ~y) (i < n) fórmulas de L. Muestre ~ ) de L tal que para toda L-estructura A que existe una fórmula ψ(~x, ~y, w con al menos dos elementos, y todo conjunto ~a de elementos en A, el conjunto de todas las relaciones de la forma ψ(An ,~a, ~b) con ~b en A, es exactamente el conjunto de todas las relaciones de la forma ϕi (Ak ,~a) con ~ = (w0 , . . . , wn ) y defina ψ(Ak ,~a, c0 , . . . , cn ) i < n. [Sugerencia: Sea w como ϕi (Ak ,~a), cuando cn = ci y cn 6= cj (i 6= j).] 72. Sea L un lenguaje para la teoría de los grupos abelianos y p un número primo. Sea A la suma directa de una cantidad infinita de copias de Z(p2 ), el grupo cíclico de orden p2 . Muestre que: (a) El subgrupo de elementos de orden ≤ p es ∅-definible y minimal. (b) El conjunto de elementos de orden p2 es ∅-definible pero no minimal. 73. Sea A una L-estructura, X ⊆ A. Denotamos con Aut{X} A al conjunto {h ∈ Aut A : h[X] = X}. Demuestre que AutX A es un subgrupo normal del grupo Aut{X} A, donde AutX A es el conjunto de automorfismos que al restringirlos a X se convierten en la identidad. ¿Qué ocurre si en lugar de pedir h[X] = X se exige h[X] ⊆ X? 74. Encuentre una estructura con un homomorfismo biyectivo que no sea un automorfismo. 75. Si tenemos una familia {Ai : i ∈ I} de L-estructuras (véase el Ejer. 43[d]), Q podemos definir su producto cartesiano A = i∈I Ai . Si Ai = Aj , para cualesquier i, j ∈ I, el producto se denota AI . Q (a) Demuestre que A = i∈I Ai es no numerable, en tanto ninguna de las Ai sea vacía y para una infinidad de índices i ∈ I, Ai tiene al menos dos elementos. 272 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 273 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) Encuentre un encaje e : A ֒→ AI con pi e = idA para todo i ∈ I, donde pi : A − → Ai es la proyección canónica. 76. Sea L = (K, F, R, τ ′ ) un lenguaje. Para toda c ∈ K escoja un nuevo símbolo de 1-relación Pc , y para todo sı́mbolo de n-función f ∈ F escoja un nuevo símbolo de n + 1-relación Rf . Sea R∗ = R ∪ {Pc : c ∈ C} ∪ {Rf : f ∈ F} y L∗ el lenguaje con símbolos no lógicos R∗ . Para una L-estructura A, sea A◦ una L∗ -estructura con el mismo universo, para la cual: ◦ RA = RA para toda R ∈ R, A◦ |= Pc (d), si y sólo si cA = d para toda c ∈ K y A◦ |= Rf (~a, b), si y sólo si f A (~a) = b para toda f ∈ F. Demuestre que A y A◦ tiene los mismos conjuntos definibles. 77. Sea ϕ(v0 , . . . , vq ) una L-fórmula. Demuestre que existe otra L-fórmula ψ(v0 , . . . , vq ) tal que (i) ψ tiene exactamente las mismas presencias de variables libres y acotadas que ϕ. (ii) ψ puede contener ∧, ¬ y ∃ , pero ningún otro conectivo o cuantificador. (iii) |= ∀ v0 · · · vq (ϕ ⇔ ψ). [Sugerencia: Por inducción sobre la construcción de ϕ.] 78. Muestre que: (a) |= ∃ u(ϕ ∨ ψ) ⇔ ∃ uϕ ∨ ∃ uψ. (b) Suponga que u no es libre en ϕ. Muestre que |= ∃ u(ϕ ∧ψ) ⇔ ϕ ∧∃ uψ y |= ∀ u(ϕ ∨ ψ) ⇔ ϕ ∨ ∀ uψ. 79. En un lenguaje que tiene un símbolo de 1-relación, encuentre: (a) Fórmulas ϕ, ψ, para las cuales ∀ u(ϕ∨ψ) no es lógicamente equivalente a ∀ uϕ ∨ ∀ uψ. (b) Fórmulas ϕ, ψ para las cuales ∃ u(ϕ ∧ ψ) no es equivalente ∃ uϕ ∧ ∃ uψ. 80. Sea ϕ la siguiente fórmula: [∀ xP(x, x) ∧ ∀ x∀ y∀ z(P(x, y) ∧ P(y, z) ⇒ P(x, z)) ∧ ∀ x∀ y(P(x, y) ∨ P(y, x))] ⇒ [∃ x∀ yP(x, y)]. Pruebe que todo modelo finito es un modelo de ϕ, pero que existen modelos infinitos que no satisfacen ϕ. 81. Use el lenguaje de la teoría de grupos para encontrar: 273 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 274 ✐ ✐ 4. Lógica (a) Un enunciado ϕ tal que, para todo modelo A de nuestro lenguaje, A |= ϕ si y sólo si A es un grupo. (b) Muestre que si ϕ es un enunciado tal que todo grupo infinito es un modelo de ϕ, entonces existe un grupo finito que es modelo de ϕ. 82. Demuestre la proposición 13.10. 83. Demuestre el corolario 13.17. 84. Sean A, S y S como en el enunciado del teorema 13.11 y A ⊆ Am un conjunto S-definible en A. (a) Use el corolario 13.17 para probar que A se puede obtener de los conjuntos básicos (ii)–(v) del teorema 13.11 junto con los conjuntos diagonales {(a1 , . . . , am ) ∈ Am : a1 = am } mediante una sucesión finita de operaciones básicas; estas operaciones básicas son complementos, intersección, producto cartesiano con A y proyección, como se especifica en la definición 13.9. (b) Formule y demuestre una versión uniforme de este resultado de la forma: toda L- fórmula es lógicamente equivalente a una en la cual . . . 85. Sea S un sistema definidor en el conjunto X 6= ∅. (a) Encuentre un lenguaje L y una L-estructura A tal que S es el sistema definidor D(U, ∅) de todos los conjuntos ∅-definibles en A. (b) Sea I un conjunto finito y A ∈ Sm la unión de los conjuntos Ai ∈ Sm para toda i ∈ I. Muestre que una función f : A − → Xn pertenece a S si y sólo si todas sus restricciones f ↾ Ai pertenecen a S. (c) Sean A ⊆ Xm+n , x ∈ Xm y Ax = {y ∈ Xn : (x, y) ∈ A}. Muestre que si A ∈ S y k ∈ N, entonces {x ∈ Xm : |Ax | ≤ k} ∈ S. (d) Sean A, B, C conjuntos, f : A × B − → C miembros de S. Muestre {a ∈ A : f (a, ·) : B − → C es inyectiva } y {a ∈ A : f (a, ·) : B − → C es sobre} pertenecen a S. (e) Suponga que X = R y que la relación de orden {(x, y) ∈ R2 : x < y} pertenece a S. Suponga además que A ⊆ Rm pertenece a S. Muestre que la cerradura topológica A de A y el interior int(A) de A en Rm pertenecen a S. (f) Suponga que X = R y que la relación de orden {(x, y) ∈ R2 : x < y} pertenece a S. Supongamos que la función f : Rm+1 − → R pertenece a S. Muestre que el conjunto A = {a ∈ Rm : f (a, t) − → l(a) cuando t − → +∞} 274 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 275 ✐ ✐ Conjuntos y modelos. Curso avanzado 86. 87. 88. 89. pertenece a S, y la función límite l : A − → R así definida también pertenece a S. Demuestre el lema 14.1. Sean φ un enunciado y ψ un enunciado universal que se obtiene de la demostración del teorema 15.5. Además, sea ψ ∈ Fml0 (L′ ) con L ⊆ L′ . Muestre que para toda L-estructura A las siguientes afirmaciones son equivalentes. 1. A |= φ. 2. Existe una L′ -expansión A′ de A que es modelo de ψ. (Forma normal conjuntiva) Muestre que: si φ no tiene cuantificadores, entonces φ es lógicamente equivalente a una fórmula que es una conjunción de disyunciones de literales. Sean S un símbolo de relación de un lenguaje S y φ ∈ Fml0 (L) de la forma ∃ x0 · · · ∃ xn ∀ y0 · · · ∀ ym ψ, con ψ sin cuantificadores. Muestre que todo modelo de φ contiene una subestructura con a lo sumo n + 1 elementos que también es un modelo de φ. Concluya que el enunciado ∀ x∃ yRxy no puede ser lógicamente equivalente a un enunciado de la misma forma que φ. Def 90. Sea L = {R, c} con R un símbolo de 1-relación y ϕ = ∀ x(Rx ∨ ¬Rx). Muestre que: (a) ⊢ ∃ yϕ. (b) Sean j ≥ 1 y t1 , . . . , tj ∈ Tm(L) arbitrarios, 6⊢ ϕ{y/t1 }∨· · ·∨ϕ{y/tj }. 275 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 276 ✐ ✐ 4. Lógica 276 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 277 ✐ ✐ CAPÍTULO 5 Teoría de modelos 277 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 278 ✐ ✐ 5. Teoría de modelos En este capítulo tratamos con detalle una de las ramas más fructíferas de la lógica: la teoría de modelos. Esta teoría se encarga de clasificar estructuras matemáticas, funciones y conjuntos por medio de fórmulas lógicas. Las estructuras se pueden clasificar de acuerdo con los enunciados lógicos que son ciertos en ellas. El término modelo proviene de que una estructura A es modelo de un enunciado ϕ si ϕ es cierta en A, previa formalización de lo que entendemos por esta certeza. Los matemáticos dedicados a la teoría de modelos buscan formas de construir modelos de un enunciado dado; así que gran parte de la teoría se dedica al desarrollo de modelos y sólo una pequeña parte a la clasificación. En 1973 C. Chang y J. Keisler, en la primera edición de su famoso libro [CK90], caracterizaron a la teoría de modelos como álgebra universal + lógica. Esta afirmación no es absolutamente cierta , pero da una clara idea de cómo se trabaja en la teoría de modelos. Algunos de los más importantes éxitos de la teoría de modelos han sido teoremas acerca de la existencia de soluciones de ecuaciones sobre campos, tema que no trataremos en este libro. Otros temas de la teoría de modelos (estructuras matemáticas, funciones entre ellas, etc.) ya se trataron en el capítulo 4. Es conveniente que el lector revise esos resultados antes de iniciar la lectura de este capítulo. En él desarrollaremos una parte muy pequeña de la teoría, pero en buena medida se incluyen los temas que resultan fundamentales para la investigación moderna en teoría de modelos. Es importante aclarar que la teoría de modelos que se estudiará en este capítulo se refiere a modelos que son conjuntos. La mayoría de las pruebas de consistencia que trataremos en capítulos subsecuentes involucran “modelos” que en realidad son clases propias. Sin embargo, algunas técnicas de este capítulo se generalizan para incorporar también este tipo de modelos. 1. Modelos infinitos Nuestros primeros resultados establecen condiciones para la existencia de modelos infinitos o de una cardinalidad arbitrariamente grande. Fijemos un lenguaje L = (R, F, K, τ) y Φ ⊆ Fml(L). Definimos ModL (Φ) = {A : A |= Φ}. 278 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 279 ✐ ✐ Conjuntos y modelos. Curso avanzado Generalmente ModL (Φ) es una clase propia. Teorema 1.1. Si ModL (Φ) contiene un modelo de cardinalidad ≥ n para cada número natural n, entonces ModL (Φ) contiene un modelo infinito. Más aún, en estas condiciones ModL (Φ) contiene un modelo de cardinalidad ≥ κ para cada cardinal κ. Demostración. Sea κ un cardinal arbitrario. Para cada α < κ añadimos a Def L un nuevo símbolo de constante cα . Sea Φκ = Φ ∪ {¬(cα =c ˙ β ) : α < β < κ}. Mostraremos que si I ⊆ κ es finito, entonces Def Φκ (I) = Φ ∪ {¬cα =c ˙ β : α < β, α, β ∈ I} es satisfacible. (1) Def Demostración de (1). Sean n = |I| y A ∈ ModL (Φ) con |A| ≥ n. Entonces A |= Φ[γ] para una cierta valuación γ. Escogemos cα ∈ A para α ∈ I, de tal forma que cα 6= cβ para α 6= β. (Ya que |A| ≥ n = |I|, esto es posible). Def Def Sea A(I) = (A, (cα : α ∈ I)). Puesto que cαA(I) [γ] = cα , se sigue entonces que A(I) |= Φκ (I).◭ Ya que cada subconjunto finito de Φκ está contenido en un conjunto del tipo Φκ (I), donde I ⊆ κ es un conjunto finito, se sigue de (1) que Φκ es finitamente satisfacible. Por el teorema de compacidad, Φκ es satisfacible. Def Sean Aκ |= Φκ [γ], cα = cαAκ [γ] y A el L-reducto de Aκ . Entonces A |= Φ[γ]. Dado que Aκ |= ¬cα =c ˙ β para α < β < κ, los elementos cα son distintos entre sí en el universo de Aκ y, por ello, en el universo de A. En consecuencia, |A| ≥ κ. Teorema 1.2. Si ModL (Φ) contiene un modelo infinito, entonces contiene modelos arbitrariamente grandes. Def Demostración. Supongamos que A |= Φ[γ] y sea λ = |A| ≥ ℵ0 . Sea κ ≥ λ. Debemos mostrar que Φ tiene un modelo de cardinalidad ≥ κ. Para ello añadimos a L un nuevo símbolo de constante cα para cada α < κ y considere Def el conjunto de fórmulas Φκ = Φ ∪ {¬cα =c ˙ β : α < β < κ}. Si I ⊆ κ es finito, Def Φκ (I) = Φ ∪ {¬cα = cβ : α < β ∧ α, β ∈ I} es satisfacible en una expansión de A (puesto que |A| ≥ ℵ0 , podemos elegir elementos cα ∈ A distintos entre sí para α ∈ I, que interpretan a las cα para α ∈ I). De la satisfacibilidad de Φκ (I) se obtiene la satisfacibilidad finita de Φκ , de tal forma que Φκ es 279 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 280 ✐ ✐ 5. Teoría de modelos satisfacible por el teorema de compacidad. Exactamente como en la prueba del teorema 1.1, obtenemos del L-reducto de un modelo de Φκ un modelo de Φ, cuya cardinalidad no es menor que κ. Nuestro siguiente teorema es uno de los resultados fundamentales en la teoría de modelos; establece que si un conjunto de L-fórmulas tiene un modelo infinito, entonces tiene modelos de cualquier cardinalidad κ ≥ |L|. Note que en los teoremas previos no se asegura que se tengan modelos de una cierta cardinalidad. Teorema 1.3 (Teorema de Löwenheim-Skolem creciente). Si Φ ⊆ Fml(L) tiene un modelo infinito, entonces tiene modelos de cardinalidad κ para cada κ ≥ |L|. Demostración. Extendemos L con nuevos símbolos de constante cα (α < Def ˙ β: κ) a un lenguaje Lκ . Como en la demostración de 1.1, Φκ = Φ ∪ {¬ cα =c α < β < κ} es satisfacible. Del corolario 4.12.26 se sabe que Φκ tiene un modelo Aκ , de cardinalidad no mayor que |Lκ |. Se cálcula fácilmente que |Lκ | = |L| + κ = κ. Por la definición de Φκ , |Aκ | ≥ κ. En resumen, |Aκ | = κ. El L-reducto de Aκ propicia un modelo de Φ de cardinalidad κ. Corolario 1.4. Cada conjunto satisfacible de L-fórmulas que tenga un modelo infinito posee un modelo de cardinalidad |L|. En particular, cada conjunto de fórmulas satisfacible de un lenguaje numerable que tenga un modelo infinito posee un modelo con universo numerable. Una consecuencia importante del corolario 1.4 es que suponiendo la consistencia de ZF (o ZFE ), entonces estas teorías tienen modelos numerables. El teorema de Löwenheim-Skolem muestra una de las fronteras de la lógica de primer orden: un conjunto satisfacible de fórmulas de la lógica de primera clase no puede “fijar” una cardinalidad infinita. Con esto queremos decir que no podemos distinguir cardinalidades demostrando que ciertos conjuntos tienen un modelo de una cardinalidad dada y no de otra. Otra consecuencia es que cada teoría Φ que tiene un modelo infinito posee modelos que se distinguen entre sí, es decir, que no son isomorfos. Esto restringe la posibilidad de axiomatizar clases de modelos: si L es un lenguaje y A una L-estructura infinita, entonces Def K = {B : B es una L-estructura , B ∼ = A} no es axiomatizable, pues K sólo contiene modelos de cardinalidad |A|. 280 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 281 ✐ ✐ Conjuntos y modelos. Curso avanzado Mientras que la lógica de primer orden no puede fijar cardinalidades infinitas, sí las finitas: con ayuda de los L-enunciados ϕ≥n respectivamente ϕ=n (véase la pág. 205) se puede decir que todo modelo de un sistema de axiomas Φ tiene cardinalidad al menos n o que todos los modelos de Φ tienen cardinalidad n. Pero es imposible formalizar que un sistema de axiomas sólo puede tener modelos finitos: por el teorema 1.1 todo sistema de axiomas, con modelos de cardinalidad finita arbitraria, tiene un modelo infinito. Esto tiene como consecuencia que, por ejemplo, la clase de los grupos finitos no es axiomatizable en la lógica de primer orden. Ésta y otras restricciones han conducido a considerar lenguajes más generales que el de la lógica de primer orden. Sin embargo, ganar más expresibilidad tiene como consecuencia la pérdida de ciertas propiedades. Considere, por ejemplo, la lógica de segundo orden: en ella podemos cuantificar no sólo sobre los elementos del universo sino también sobre las relaciones. Es decir, se tienen dos clases de variables: vn para individuos y Vm para relaciones. En la lógica de segundo orden se puede dar un teorema ϕfin , cuyos modelos son precisamente las estructuras con universos finitos. Por otro lado, el teorema de compacidad no es válido para esta lógica. En resumen, los lenguajes de orden superior pueden mejorar las posibilidades del lenguaje de primer orden pero no comparten todas sus ventajas. En adelante, como generalización de la notación L(A) usamos, para una clase arbitraria de fórmulas ∆ y un conjunto A de constantes que no aparecen en ∆, la notación ∆(A) para la clase de todas las fórmulas de ∆ que se obtienen de sustituir variables por constantes de A. 2. Clases elementales y ∆0 -elementales En esta sección nos dedicaremos al problema de axiomatizar una clase de estructuras. Si tenemos dos clases de estructuras axiomatizables podemos tratar de distinguirlas o clasificarlas, de acuerdo a si se axiomatiza mediante un número finito de axiomas. En el caso finito, podemos decir que la clase se axiomatiza por un solo enunciado (la conjunción de los axiomas). Definición 2.1. Sea K una clase de L-estructuras. (a) K es elemental o finitamente axiomatizable si existe un L-enunciado ϕ tal que K = ModL (ϕ). 281 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 282 ✐ ✐ 5. Teoría de modelos (b) K es ∆-elemental o axiomatizable si existe un conjunto de enunciados Φ tal que K = ModL (Φ). Note que cada clase elemental es ∆-elemental. Toda clase ∆-elemental ModL (Φ) es la intersección de clases elementales: ModL (Φ) = \ ModL (ϕ); ϕ∈Φ también observe que una clase ∆-elemental, que no es elemental, es axiomatizable pero no finitamente axiomatizable. Como ejemplos de clases elementales el lector puede verificar que lo son las clases de las relaciones de equivalencia, de los grupos y de los grupos abelianos. Entre las clases ∆-elementales se encuentran la clase de los conjuntos infinitos y la aritmética de Peano. Para poder clasificar las clases ∆-elementales primero investigaremos con más detalle las propiedades de las clases elementales. Teorema 2.2. Sea K una clase de L-estructuras. (a) K es elemental si y sólo si tanto K como su clase complementaria: Def / K} K∗ = {A : A es una L-estructura, A ∈ son ∆-elementales. (b) Si K = ModL (Φ), entonces K es elemental si y sólo si existe un subconjunto finito Φ′ de Φ con K = ModL (Φ′ ). Demostración. (a) ⇒ ) Sea K elemental, digamos K = ModL (ϕ). Entonces K∗ = ModL (¬ ϕ). ⇐) Sean K y K∗ clases ∆-elementales, digamos K = ModL (Φ) y K∗ = ModL (Φ∗ ) con Φ, Φ∗ ⊆ Fml0 (L). Si K no fuera elemental, existiría para cada subconjunto finito Φ′ ⊆ Φ una L-estructura A con A |= Φ′ pero A 6|= Φ. Lo último significa que A ∈ / K, por lo que A ∈ K∗ y A |= Φ∗ . En consecuencia, ∗ Φ ∪ Φ es finitamente satisfacible y posee (por el teorema de compacidad 4.12.29) un modelo A. Puesto que K ∩ K∗ = ∅, esto no es posible. Por lo tanto, K debe ser elemental. (b) Sea K elemental, digamos K = ModL (ϕ). Ya que también K = ModL (Φ), se sigue que Φ |= ϕ. Del teorema de compacidad sabemos que existe un subconjunto finito Φ′ ⊆ Φ con Φ′ |= ϕ. Así que ModL (Φ′ ) ⊆ ModL (ϕ). Dado que Φ′ ⊆ Φ se cumple ModL (Φ) ⊆ ModL (Φ′ ). En resumen ModL (Φ′ ) = ModL (Φ) = K, como se afirmó. La otra dirección es obvia. 282 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 283 ✐ ✐ Conjuntos y modelos. Curso avanzado Ahora podemos clasificar clases de estructuras como no elementales o no Def ∆-elementales (es decir, no axiomatizables). Recuerde que Φ∞ = {ϕ≥n : i ≤ n < ω}. Lema 2.3. Si Φ es una L-teoría que tiene modelos de cardinalidad finita arbitrariamente grande, entonces ModL (Φ ∪ Φ∞ ), la clase de los modelos infinitos de Φ, no es elemental. La clase K de los modelos finitos de Φ no es ∆-elemental. Demostración. Por el teorema 1.1, Φ tiene un modelo infinito, así que Φ ∪ Φ∞ es satisfacible. Si ModL (Φ ∪ Φ∞ ) fuera elemental, existiría por 2.2(b) un subconjunto finito Φ′ de Φ ∪ Φ∞ que axiomatiza ModL (Φ ∪ Φ∞ ). Entonces existe un n0 < ω con ϕ≥n ∈ / Φ′ para todo n ≥ n0 . Escogemos un modelo finito A de Φ de cardinalidad ≥ n0 . Por lo tanto, A ∈ ModL (Φ′ ) \ ModL (Φ ∪ Φ∞ ), que contradice la suposición de que Φ axiomatiza ModL (Φ∪Φ∞ ). Finalmente, si tuviésemos K = ModL (Ψ), entonces Ψ tendría un modelo infinito por 1.1, es decir ModL (Ψ) \ K 6= ∅, una contradicción. Por lo tanto, K no es axiomatizable. Ejemplo 2.4. Un grupo G = h◦, ei (es decir, un modelo de ΦGr , véase la pág. 206) es libre de torsión si para cada 1 ≤ n < ω y cada g ∈ G, g 6= e, se cumple g ◦ · · · ◦ g 6= e. | {z n veces } Para mostrar que la clase de los grupos libres de torsión es ∆-elemental, definimos primero, recursivamente para 1 ≤ n < ω, el término v0n mediante Def v01 = v0 ; Def v0n+1 = fv0n v0 ; y definimos Def ϑn = ∀ v0 (¬v0 =e ˙ ⇒ ¬v0n =e). ˙ Entonces la clase de grupos libres de torsión se axiomatiza por Def Φ = ΦGr ∪ {ϑn : 1 ≤ n < ω}. Pero esta clase no es elemental: si lo fuera sería axiomatizable por un subconjunto finito Φ′ de Φ. Entonces existiría un n0 < ω tal que ϑn ∈ / Φ′ para 283 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 284 ✐ ✐ 5. Teoría de modelos toda n > n0 . Sea p un número primo, p > n0 . Entonces Z/pZ es un modelo de Φ′ . Pero este grupo no es libre de torsión. ◭ Existen una gran cantidad de estructuras finitamente axiomatizables, por ejemplo los grupos, los grupos abelianos, los dominios enteros, los campos, los campos de característica fija p 6= 0, los campos ordenados, retículos, etc. De hecho todas estas estructuras están definidas como la clase de modelos de ciertos sistemas finitos de axiomas. Sin embargo, existen colecciones de estructuras que no son elementales. Un ejemplo lo propicia el siguiente lema. Lema 2.5. Sea K la colección de estructuras isomorfas a una misma estructura infinita A. Entonces K no es elemental. Demostración. Supongamos que K = ModL (Σ) para algún conjunto Σ. Como A es infinito, obtenemos una extensión elemental A′ ≻ A tal que |A′ | > |A| de acuerdo con el teorema de Löwenheim-Skolem. A y A′ no pueden ser isomorfas, y en consecuencia A′ ∈ / K, A′ |= Teo(A, A) y Teo(A, A) ⊇ Teo(A) ⊃ Σ, lo cual demuestra que A′ |= Σ en oposición a nuestra suposición. De hecho, hemos probado un resultado mucho más fuerte que lo que el lema 2.5 promete. Lo que realmente hemos demostrado es: Teorema 2.6. Sea K una clase de estructuras de cardinalidad κ ≥ ℵ0 . Entonces K no es elemental Los resultados 2.5 y 2.6 exhiben algunas limitaciones en la caracterización de estructuras mediante sistemas axiomáticos de primer orden. Como consecuencia del lema 2.5 obtenemos: Teorema 2.7. Sea K una clase de estructuras finitas de cardinalidad arbitrariamente grande. Entonces K no es una clase elemental. Demostración. K = ModL (Σ) para algún conjunto Σ implica por 1.1 que hay estructuras infinitas en K. Esto contradice la hipótesis de que K contienen sólo estructuras finitas. Así que la clase de los grupos finitos y la de los campos finitos no son elementales. 284 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 285 ✐ ✐ Conjuntos y modelos. Curso avanzado 3. Un poco de topología y el teorema de compacidad Considere un lenguaje L y un conjunto Σ de L-enunciados. Las siguientes propiedades son inmediatas (en el resto de este apartado eliminamos el superíndice L de la clase Mod): • • • • • • Mod(∃ x¬(x=x)) ˙ =∅ Mod(∀ x(x=x)) ˙ = Mod (la clase de todas las L-estructuras) Mod(¬ϕ) = Mod − Mod(ϕ) Mod(ϕ ∧ ψ) = Mod(ϕ) ∩ Mod(ψ) Mod(ϕ ∨ ψ)T= Mod(ϕ) ∪ Mod(ψ) Mod(Σ) = ϑ∈Σ Mod(ϑ) La familia de las clases Mod(ϕ) con ϕ un enunciado es cerrado respecto a intersecciones finitas y puede servir como la base de una topología para Mod. En consecuencia, llamaremos a una subclase de Mod abierta si es la unión arbitraria de clases de la forma Mod(ϕ) con ϕ un L-enunciado, es decir, los conjuntos abiertos son de la forma [ Mod(ϕ), ϕ∈Φ donde Φ es una clase de L-enunciados. Las clases cerradas, como complementos de conjuntos abiertos, tienen la forma \ Mod(¬ϕ), ϕ∈Φ es decir, son también clases de modelos similares a las que acabamos de describir; simplemente defina Σ = {6= ϕ : ϕ ∈ Φ}. Observe que en el sentido de la teoría de conjuntos ModL es una clase propia. La introducción de una topología en ModL no es formalmente posible. Sin embargo, dejemos a un lado este pequeño obstáculo teniendo en cuenta que es posible proceder de tal manera que se elimine realmente la dificultad: por ejemplo, podemos considerar a ModL como aquellas L-estructuras contenidas en un conjunto M dado. Se escoge M lo suficientemente grande para que se puedan realizar en el todas las operaciones conjuntistas necesarias. Primero estableceremos que el espacio Mod con la topología recién descrita es Hausdorff. Escribimos A ≡ B cuando A ∈ Mod(σ) si y sólo si B ∈ Mod(σ) para todo L-enunciado σ. 285 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 286 ✐ ✐ 5. Teoría de modelos Si A ≡ B, entonces A y B pertenecen a cada conjunto abierto Mod(σ), por lo que A no se puede separar de B. Sin embargo, es fácil construir dos estructuras no isomorfas A, B para las cuales A ≡ B: sea A una L-estructura Def infinita y B tal que A = B pero de mayor cardinalidad. Teorema 3.1. Sea Σ un conjunto de L-enunciados. Entonces es válido el S teorema de Heine-Borel en ModL (Σ), es decir, si ϕ∈Φ Mod(ϕ) es una cubierta de ModL (Σ), entonces existen ϕ1 , . . . , ϕn ∈ Φ con ModL (Σ) ⊆ ModL (ϕ1 ) ∪ · · · ∪ ModL (ϕn ). S Aquí ϕ∈Φ Mod(ϕ) es una cubierta de ModL (Σ) en el sentido de que toda L-estructura en ModL (Σ) pertenece a ModL (ϕ) para alguna ϕ ∈ Φ. Demostración. Por hipótesis \ σ∈Σ se desprende que \ σ∈Σ Mod(σ) ⊆ Mod(σ) ∩ [ Mod(ϕ) ϕ∈Φ \ Mod(¬ϕ) = ∅, ϕ∈Φ es decir, el conjunto Σ ∪ {¬ϕ : ϕ ∈ Φ} no tiene L-modelos. Por el teorema de compacidad 12.5, debe existir un subconjunto finito de Σ ∪ {¬ϕ : ϕ ∈ Φ} que no tenga L-modelo. En particular existen ϕ1 , . . . , ϕn ∈ Φ tales que Mod(Σ) ∩ Mod(¬ϕ1 ) ∩ · · · ∩ Mod(6= ϕn ) = ∅. Pero esto significa precisamente que Mod(Σ) ⊆ Mod(ϕ1 ) ∪ · · · ∪ Mod(ϕn ). Del teorema 3.1 podemos derivar el siguiente lema de separación: Lema 3.2. Sean Σ1 , Σ2 , Γ conjuntos de L-enunciados tales que ModL (Σi ) 6= ∅ para i = 1, 2. Si para cada A ∈ ModL (Σ1 ) y para cada B ∈ ModL (Σ2 ) existe γ ∈ Γ con la propiedad de que A |= γ y B |= ¬γ, entonces existe γ ∗ tal que ModL (Σ1 ) ⊆ ModL (γ ∗ ) y ModL (Σ2 ) ⊆ ModL (¬γ ∗ ), donde γ ∗ es una disyunción finita de conjunciones finitas de elementos de Γ. 286 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 287 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Primero fijamos una L-estructura A ∈ Mod(Σ1 ) y escogemos para cada B ∈ ModL (Σ2 ) un γB tal que A ∈ Mod(γB ) y B ∈ Mod(¬γB ). Las clases Mod(¬γB ) forman una cubierta abierta de Mod(Σ2 ). En vista del teorema 3.1 podemos asegurar que existen B1 , . . . , Bm ∈ Mod(Σ2 ) tales que Mod(¬γB1 ) ∪ · · · ∪ Mod(¬γBm ) = Mod(¬(γB1 ∧ · · · ∧ γBm )) cubre a Mod(Σ2 ). Definimos γA = (γB1 ∧ · · · ∧ γBm ), por lo que A ∈ Mod(γA ), y Mod(Σ2 ) ⊆ Mod(¬γA ). Por otro lado, la clase Mod(Σ1 ) cubre la clase Mod(γA ) con esta propiedad. Otra vez obtenemos un subconjunto finito que cubre a Mod(Σ1 ), es decir, existen A1 , . . . , An ∈ Mod(Σ1 ) con Mod(Σ1 ) ⊆ Mod(γA1 ) ∪ · · · ∪ Mod(γAn ) = Mod(γA1 ∨ · · · ∨ γAn ). Pero también es cierto que Mod(Σ2 ) ⊆ Mod(¬γA1 ) ∩ · · · ∩ Mod(¬γAn ) = Mod(¬(γA1 ∨ · · · ∨ γAn )). Finalmente hacemos γ ∗ = (γA1 ∨ · · · ∨ γAn ), con lo que concluimos la demostración. Hemos demostrado que Mod es un espacio Hausdorff. 4. Cadenas de modelos Nuestro propósito en esta sección será construir modelos. Una de las primeras operaciones para formar nuevos modelos a partir de “viejos” es la unión de cadenas de modelos. Definición 4.1. Sea κ un cardinal dado. Para cada α < κ sea Aα una Lestructura tal que Aα ⊆ Aβ para α < β. Tal sucesión de modelos hAα : α < κi se llama cadena de L-estructuras. 287 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 288 ✐ ✐ 5. Teoría de modelos Definimos en S α<κ Aα una L-estructura como sigue: Def RA = [ RAα ; α<κ A Def f = [ f Aα ; α<κ A Def A0 c =c . De la relación Aα ⊆ AS β se sigue fácilmente que realmente tenemos definida una L-estructura sobre α<κ Aα . Esta estructura se denota con [ Aα α<κ y la llamamos unión de las Aα . De la construcción se sigue inmediatamente: Lema 4.2. Para α < κ se cumple Aα ⊆ S β<κ Aβ . Uno de los resultados más importantes sobre cadenas de modelos es que la unión de una cadena es modelo de un Π2 -enunciado si cada elemento de la cadena lo es. Teorema 4.3. Sea ϕ un Π2 -enunciado de L, es decir, un enunciado de la forma ϕ = ∀ x1 , . . . , xm ∃ y1 , . . . yn ψ(x1 , . . . , xm , y1 , . . . , yn ), donde ψ ∈ Fml(L) no tiene cuantificadores. Entonces, si Aα |= ϕ para toda S α < κ, es cierto que α<κ Aα |= ϕ. Def S S Demostración. Sean A = α<κ Aα el universo de α<κ Aα , y a1 , . . . , am ∈ A arbitrarios. Entonces existe una α < κ con a1 , . . . am ∈ Aα . Puesto que Aα |= ϕ, existen b1 , . . . , bn ∈ Aα con Ya que Aα ⊆ que S β<κ Aβ Aα |= ψ[a1 , . . . , am , b1 , . . . bn ]. [ β<κ S y dado que ψ está libre de cuantificadores, se deduce Aβ |= ψ[a1 , . . . , am , b1 , . . . , bn ], así que β<κ Aβ |= ∃ y1 . . . yn ψ(x1 , . . . , xm , y1 , . . . , yn )[a1 , . . . am ]. En vista de que los a1 , . . . , am se eligieron arbitrariamente, se sigue que [ β<κ Aβ |= ∀ x1 · · · xm ∃ y1 · · · yn ψ(x1 , . . . , xm , y1 , . . . , yn ), 288 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 289 ✐ ✐ Conjuntos y modelos. Curso avanzado lo que se quería demostrar. Una consecuencia inmediata del teorema 4.3 es: Corolario 4.4. Si K es una clase de L-estructuras axiomatizable mediante una teoría Φ que sólo consiste en Π2 -enunciados, entonces K es cerrada respecto a uniones de cadenas; es decir, si κ es un cardinal y hAα : α < κi es una cadena S de modelos en K, también α<κ Aα pertenece a K. De hecho, también el recíproco es cierto: si K es cerrada respecto a uniones de cadenas, K es axiomatizable mediante un conjunto que consta sólo de Π2 enunciados, resultado que probaremos más adelante. Ejemplo 4.5. Existe una cadena de modelos A0 ⊆ A1 ⊆ · · · cuyos elementos son modelos de un conjunto de enunciados (completo), pero cuya unión A no satisface estos enunciados. Para exhibir la cadena usamos una signatura con un símbolo de 2-relación <. Sea A0 = {0, 1, 2, . . .}, y en general sea Def An = {−n, . . . , −1, 0, 1, 2, . . .} con la interpretación usual de <. Entonces (1) Para toda n, An ∼ = A0 , usando el isomorfismo que transforma x en x + n. (2) En consecuencia, Teo(A0 ) = Teo(A1 ) = · · · S (3) A = n<ω An = {. . . , −2, −1, 0, 1, 2, . . .} es un modelo linealmente ordenado que satisface un conjunto de enunciados diferente al que satisface cada An . En particular, A |= ∀ x∃ yy < x. Aunque cada An tiene un elemento mínimo A no tiene un elemento mínimo ya qué los An no concuerdan en qué elemento es el mínimo. Como un ejemplo del uso de cadenas de modelos probaremos la existencia de la cerradura algebraica de todo campo (véase [PiVi99]). Para ello presentamos primero la teoría de campos. La teoría de campos La LAr -teoría (véase pág. 206) ΦCamp consiste en los siguientes enunciados: (i) ∀ v0 ∀ v1 f+ v0 v1 =f ˙ + v1 v0 (conmutatividad de la suma). (ii) ∀ v0 v1 v2 f+ v0 f+ v1 v2 =f ˙ + f+ v0 v1 v2 (asociatividad de la suma). (iii) ∀ v0 f+ v0 0=v ˙ 0 (0 es el elemento neutro para la suma). (iv) ∀ v0 ∃ v1 f+ v0 v1 =0 ˙ (existencia de un elemento inverso para la suma). (v) ∀ v0 ∀ v1 f· v0 v1 =f ˙ · v1 v0 (ley conmutativa de la multiplicación). 289 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 290 ✐ ✐ 5. Teoría de modelos (vi) (vii) (viii) (ix) (x) ∀ v0 ∀ v1 ∀ v2 f· v0 f· v1 v2 =f ˙ · f· v0 v1 v2 (asociatividad de la multiplicación). ∀ v0 f· v0 1=v ˙ 0 (1 es elemento neutro de la multiplicación). ∀ v0 (¬(v0 =0) ˙ ⇒ ∃ v1 (f· v0 v1 =1)) ˙ (existencia de un inverso multiplicativo). ∀ v0 ∀ v1 ∀ v2 f· v0 f+ v1 v2 =f ˙ + f· v0 v1 f· v0 v2 (distributividad). ¬(0=1). ˙ Φcamp axiomatiza la clase de los modelos de los campos y se llama la teoría de los campos. Teorema 4.6. Sea K un campo. Entonces existe una cerradura algebraica de K, es decir, un campo K que contiene a K tal que (a) K es algebraicamente cerrado, es decir, todo polinomio de grado n sobre K tiene un cero, para toda n ∈ N. (b) K es algebraico sobre K; es decir, cada elemento de K es algebraico sobre K, por tanto, es el cero de un polinomio no trivial con coeficientes en K.1 Se cumple además |K| = |K| + ℵ0 . Demostración. Remitimos al lector a [Hu74] para algunos detalles algebraicos. Primero nos convenceremos de que cada polinomio tiene ceros en un cierto supracampo algebraico del campo de sus coeficientes: (1) Si L es un campo y p ∈ L[x] es un polinomio no constante con coeficientes en L, existe un supracampo Lp de L que es algebraico sobre L y en el que p tiene un cero. Se cumple |Lp | ≤ |L| + ℵ0 . Demostración de (1). Obtenemos un supracampo de L si dividimos L[x] entre el ideal generado por un factor irreducible q de p. En este supracampo p tiene un cero a. El campo L(a), que consiste exactamente en los valores f (a) (f ∈ L[x]), es una extensión algebraica de L a un supracampo en el que p tiene un cero. Además |L(a)| ≤ |L| + ℵ0 . ◭ Ahora construimos un supracampo L′ para cada campo L, mediante cadenas de modelos, en el que cada polinomio no constante tiene al menos un cero: (2) Sea L un campo. Entonces existe un supracampo L′ de L tal que (a) todo polinomio no constante p ∈ L[x] tiene un cero en L′ ; (b) L′ es algebraico sobre L; (c) |L′ | ≤ |L| + ℵ0 . 1 También se acostumbra decir que la extensión K ⊆ K es algebraica. 290 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 291 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración de (2). Sea κ = |L[x]|(= |L| + ℵ0 ) y (pα : α < κ) una enumeración de todos los polinomios no constantes con coeficientes en L. Definimos una cadena hLα : α < κi de campos mediante Def L0 = L; Def Lα+1 = Lpαα ; Def Lδ = [ cuando δ es límite. Lα , α<δ Ya que Φcamp consta de sólo Π2 -teoremas, nuestra definición conduce, en cada etapa límite, a un campo de acuerdo al corolario 4.4. Si usamos el hecho de que para campos M1 ⊆ M2 ⊆ M3 , la extensión M1 ⊆ M3 es algebraica si y sólo si las extensiones M1 ⊆ M2 y M2 ⊆ M3 son algebraicas, podemos probar fácilmente por inducción sobre α que las extensiones L ⊆ Lα son algebraicas. Por inducción, se prueba que |Lα | ≤ |L| + ℵ0 . Definimos [ Def L′ = Lα α<κ y obtenemos un campo que satisface (a) y (b) (la prueba de (b) corresponde a la prueba de que la extensión L ⊆ Lα es algebraica, si δ es límite); (c) se deduce directamente de |L′ | ≤ ◭ X α<κ |Lα | ≤ κ · (|L| + ℵ0 ) = |L| + ℵ0 . {z | =κ } Si iteramos la construcción de (2) ℵ0 -veces encontramos el campo requerido: definimos Def K0 = K Def Kn+1 = K′n ; Def K= [ Kn . n<ω Se verifica, de manera similar a la demostración en (2), que la extensión K ⊆ K es algebraica. K es algebraicamente cerrado pues los coeficientes de un polinomio arbitrario no constante p ∈ K[x] están en algún Kn , y por 291 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 292 ✐ ✐ 5. Teoría de modelos construcción tiene un cero en Kn+1 = K′n (y por consiguiente en K). La cardinalidad de |K| se calcula como sigue: por un lado, en vista de (2)(c): |Kn | ≤ |K| + ℵ0 , de donde concluimos |K| ≤ ℵ0 · (|K| + ℵ0 ) = |K| + ℵ0 . Por otro lado, |K| ≤ |K| pues K ⊆ K. Además ℵ0 ≤ |K|, ya que un campo finito no puede ser algebraicamente cerrado. Por lo tanto, |K| = |K| + ℵ0 y concluimos la demostración del teorema. En este punto presentamos otra aplicación de las cadenas de modelos para probar que la clase de los campos algebraicamente cerrados no es finitamente axiomatizable. Primero probamos: Lema 4.7. Para cada n < ω existe un supracampo Qn de Q tal que (a) todo polinomio p ∈ Qn [x] de grado ≤ n tiene un cero en Qn ; (b) Qn no es algebraicamente cerrado. Demostración. Sea Q la cerradura algebraica de Q. Por 4.6 Q es numerable. Sea (ak : k < ω) una enumeración de Q. Para n < ω formamos Def una cadena hQni : i < ωi de subcampos de Q como sigue: sea Qn0 = Q. Supongamos que Qni ya está definido. Existe entonces un k tal que ak ∈ / Qni , n que es el cero de un polinomio de grado ≤ n de Qi [x]; escogemos la menor de Def Def tales k y definimos Qni+1 = Qni (ak ). Si no existe tal k, definimos Qni+1 = Qni . Def P S Hacemos entonces Qn = i<ω Qni . Si p(x) = j≤m bj xj es un polinomio de grado ≤ n con coeficientes en Qn , existe i < ω con b0 , . . . , bm ∈ Qni . Ya que Q es algebraicamente cerrado, existe j < ω tal que aj es un cero de p. De la construcción del campo se sigue fácilmente que aj+1 ∈ Qni+j . Así que p tiene un cero en Qn . Queda demostrado (a). Para probar (b) necesitamos los siguientes hechos algebraicos (demostraciones en [Hu74]): Si K ⊆ L son campos, entonces L es un espacio vectorial sobre K. La dimensión de este espacio vectorial se denota con [L : K] y se llama grado de la extensión del campo. Si L = K(a), donde a es algebraico sobre K, entonces 292 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 293 ✐ ✐ Conjuntos y modelos. Curso avanzado [L : K] es el menor grado posible de un polinomio no constante mónico2 con coeficientes en K, que tiene como cero a a. El polinomio de grado mínimo es único y se llama polinomio mínimo de a sobre K. En el caso K1 ⊆ K2 ⊆ K3 ocurre: [K3 : K1 ] = [K3 : K2 ][K2 : K1 ]. De aquí se sigue: si L = K(a1 , . . . , am ), donde a1 , . . . , am son algebraicos sobre K, entonces [L : K] es divisible entre el grado del polinomio mínimo de a1 , pues entonces [L : K] = [K(a1 , . . . , am ) : K(a1 , . . . , am−1 )] · · · [K(a1 ) : K]. Para demostrar (b), supongamos que Qn es cerrado algebraicamente. Entonces Qn = Q. Fijemos un número primo q arbitrario, q > n. Sea a un elemento arbitrario de Q cuyo polinomio mínimo sobre Q tiene grado q (p. ej., el cero del polinomio p(x) = xq − 2). Puesto que a ∈ Q = Qn , existe un i < ω con a ∈ Qni con i el menor con tal propiedad. Ya que para j < ω, Qnj+1 se obtiene de Qnj mediante la adición de un cero de un polinomio de grado ≤ n; deducimos que [Qnj+1 : Qnj ] ≤ n < q. En vista de que [Qni : Q] = [Qni : Qni−1 ] · · · [Qn1 : Qn0 ], se sigue que q no está entre los factores del lado derecho y, por lo tanto, no puede dividir el producto. Así que q ∤ [Qni : Q]. Dado que [Qni : Q] < ω y a ∈ Qni , existe un número finito b1 , . . . , bm que son algebraicos sobre Q, tales que Qni = Q(a, b1 , . . . , bm ). Acabamos de mostrar que en este caso [Qni : Q] es divisible entre el grado del polinomio mínimo de a, es decir, q|[Qni : Q]. Esta contradicción muestra que Qn no puede ser algebraicamente cerrado. Para nuestro siguiente teorema sobre campos algebraicamente cerrados necesitamos introducir la teoría de los campos algebraicamente cerrados. Primero definimos los siguientes LAr -términos: Definición 4.8. (a) Sea i < ω. Definimos por recursión sobre n < ω el LAr -término vin mediante vi0 = 1 y vin+1 = f· vin vi . 2 es decir, el coeficiente de la mayor potencia es 1. 293 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 294 ✐ ✐ 5. Teoría de modelos (b) Definimos por recursión sobre n < ω, n ≥ 1, los LAr -enunciados ψn mediante Def ψn = ∀ v0 · · · vn ∃ vn+1 (¬(vn =0) ˙ ⇒ X i =0). ˙ f· vi vn+1 i<n+1 (el enunciado ψn significa que todo polinomio de grado n tiene un cero). Def La LAr -teoría Φcac = Φcamp ∪ {ψn : 1 ≤ n ∧ n < ω} axiomatiza la clase de modelos de los campos algebraicamente cerrados y se llama teoría de los campos algebraicamente cerrados. Teorema 4.9. La clase de los campos algebraicamente cerrados no es elemental. Demostración. Supongamos que la clase de los campos algebraicamente cerrados es finitamente axiomatizable. Entonces por 2.2 existe un subconjunto finito Φ′ de Φcac que axiomatiza esta clase. Existe n < ω tal que ψm ∈ / Φ′ para n ′ toda m > n. De acuerdo con el teorema 4.6, Q es un modelo de Φ pero no es modelo de Φcac , lo que contradice la suposición de que Φ′ axiomatiza la clase de los campos algebraicamente cerrados. 5. Teorías y clases axiomatizables Recuerde que la notación Φ |= ϕ indica que ϕ es consecuencia lógica de Φ. Mediante Φ|= denotamos el conjunto de todas las posibles consecuencias lógicas de Φ, es decir Φ|= = {ϕ ∈ Fml0 (L) : Φ |= ϕ}. Este conjunto se conoce como la cerradura deductiva de Φ (en L). Un conjunto Φ de enunciados es deductivamente cerrado si Φ|= = Φ. Dos conjuntos de L-enunciados Φ0 y Φ1 son equivalentes módulo un conjunto de L-enunciados Φ (o Φ-equivalentes), si Φ ∪ Φ0 y Φ ∪ Φ1 tienen la misma cerradura deductiva en L. Las fórmulas ∅-equivalentes se conocen también como lógicamente equivalentes. Estas definiciones se deben a Tarski [Tar30] (véase Ejer. 22). Por supuesto, un conjunto de L-enunciados es consistente si y sólo si tiene un modelo. Una contradicción en L es un L-enunciado de la forma ϕ∧¬ϕ. Note que un conjunto de L-enunciados es consistente cuando no podemos deducir una contradicción de él. 294 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 295 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 5.1. Una L-teoría T es un conjunto de L-enunciados consistente y deductivamente cerrado. La cardinalidad |T| se define como la cardinalidad de L. Definición 5.2. Sea K una clase de L-estructuras; la L-teoría de K o la teoría de K es el conjunto Teo(K) (o también TeoL (K)) de todos los L-enunciados que son ciertos en todas las estructuras de K, es decir, Teo(K) = {ϕ ∈ Fml0 (L) : para toda L-estructura A ∈ K, A |= ϕ}. Escribimos Teo(A) en lugar de Teo({A}) y llamamos a este conjunto la L-teoría de A. Nuestro primer resultado sobre teorías proporciona un criterio para decidir cuándo un conjunto de enunciados es una teoría. Lema 5.3. Un conjunto de enunciados consistente T es una teoría si y sólo si T = Teo(Mod T). Demostración. Para cualquier conjunto de enunciados T se cumple T ⊆ Teo(Mod T). Supongamos ahora que T es deductivamente cerrado y ϕ ∈ Teo(Mod T). En tal caso ϕ será cierta en todo modelo de T, es decir, ϕ es consecuencia lógica de T y, por lo tanto, ϕ pertenece a T. Para una teoría T denotamos mediante T∞ a la teoría de la clase de todos los modelos infinitos de T. Observe que si ϕ ∈ Fml0 (L), se cumple que Teo(A) |= ϕ si y sólo si A |= ϕ. Con nuestra definición se presenta una patología: para K = ∅, Teo(K) = Fml0 (L); en ese caso, Teo(K) no es realmente una teoría en el sentido de nuestra definición. Sin embargo, en todos los demás casos se comprueba fácilmente que se trata de una teoría según nuestra definición y que, en particular, contiene todos los L-enunciados universalmente válidos. Definición 5.4. Si T es una teoría y ∆ una clase arbitraria de fórmulas, Def T∆ = (T ∩ ∆)|= es la ∆-sección de T. Escribimos Teo∆ (K) para Teo(K)∆ y la llamamos ∆-teoría de K. 295 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 296 ✐ ✐ 5. Teoría de modelos Ahora consideremos conjuntos de enunciados consistentes y máximos. Tales conjuntos son naturalmente deductivamente cerrados y por lo tanto, son teorías. Pero se trata de teorías muy especiales, de teorías máximas (es decir, teorías que no están contenidas propiamente en otra teoría). Esto propicia la siguiente definición: Definición 5.5. Una L-teoría T es completa si contiene todo L-enunciado o su negación, es decir, cuando ϕ ∈ T o ¬ϕ ∈ T para toda ϕ ∈ Fml0 (L). El siguiente lema describe las principales propiedades de las teorías completas. Lema 5.6. Las siguientes propiedades son equivalentes para toda L-teoría T. (i) (ii) (iii) (iv) (v) T es completa. T es una L-teoría máxima. T es un conjunto de L-enunciados consistente y máximo. T = Teo(A) para toda L-estructura que satisface A |= T. T = Teo(A) para alguna L-estructura A con la propiedad de que A |= T. Demostración. (i) ⇒ (ii). Si T es completa, todo L-enunciado ϕ, que unido con T forme un conjunto consistente, debe pertenecer a T. Así que T es una teoría máxima. La implicación (ii) ⇒ (iii) y su recíproco son claros. Si A es un modelo de T, entonces T ⊆ Teo(A). Si T es además máxima, debe ocurrir la igualdad, lo que demuestra la implicación (iii) ⇒ (iv). (iv) ⇒ (v) es obvio. Falta probar que (v) implica (i), para lo cual basta observar que para todo L-enunciado ϕ, ϕ o ¬ϕ pertenece a Teo(A). Puesto que todo conjunto consistente posee un modelo, se concluye el siguiente corolario: Corolario 5.7 (Lindenbaum). Todo conjunto de L-enunciados consistente está contenido en una L-teoría. Este resultado se debe a Lindenbaum, aunque él no lo publicó. Fue Tarski quien primero lo presentó en [Tar30]. Lindenbaum murió en Białistok, Polonia, en una prisión durante la ocupación alemana en los años 40 del siglo xx. Si una L-teoría T está contenida en una L-teoría T′ completa, T′ se conoce como la completación de T (en L). 296 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 297 ✐ ✐ Conjuntos y modelos. Curso avanzado No todas las teorías son completas. El conjunto de todos los L-enunciados universalmente válidos constituye una teoría, la teoría de la clase de todas las estructuras no vacías, lo que se verifica fácilmente. Existen L-estructuras de cardinalidad finita arbitraria pues en cada conjunto no vacío A se puede definir una L-estructura A, por ejemplo asignándole un mismo valor a todos los términos, y fijar la interpretación en A de todos los otros símbolos no lógicos arbitrariamente. Sea ϕn el enunciado que afirma la existencia de exactamente n elementos. El conjunto ∅|= ∪ {ϕn } es consistente para toda n > 0, y ya que ϕn ∧ ϕm es inconsistente para n 6= m, ninguno de los enunciados ϕn puede ser universalmente válido, es decir, no puede pertenecer a ∅|= , y tampoco su negación. En consecuencia, ∅|= es una teoría incompleta. 6. Diagramas A. I. Malcev desarrolló los métodos que a continuación presentamos, para generalizar propiedades de subgrupos finitamente generados a grupos más arbitrarios. El lector interesado puede consultar [Mal71] para obtener aplicaciones. Nosotros sólo desarrollaremos algunos resultados sobre diagramas que nos serán posteriormente de utilidad. Lema 6.1. Sean A y B L-estructuras. A ⊆ B si y sólo si: (i) A ⊆ B y A es cerrado respecto a las funciones; (ii) para toda L-fórmula atómica ϕ y para toda n-ada de elementos de A, es cierto que A |= ϕ(~a), si y sólo si B |= ϕ(~a). Demostración. Se obtiene del lema 4.9.5. Ahora introducimos algunos conceptos útiles en lo sucesivo. Definición 6.2. Sean A y B L-estructuras y ∆ una clase de fórmulas. Si para todo enunciado ϕ ∈ ∆ ∩ Fml0 (L) de A |= ϕ, se sigue que B |= ϕ, es decir si Teo∆ (A) ⊆ Teo∆ (B), escribimos A ⇛∆ B. La relación A ≡∆ B significa A ⇛∆ B y B ⇛∆ A. Si Fml0 (L) ⊆ ∆, eliminamos el subíndice ∆. ∆ f :A− → B significa f : A − → B y para toda ϕ ∈ ∆ ∩ Fml(L) y toda n-ada de elementos de A, de A |= ϕ(~a) se deduce que B |= ϕ(f [~a]). Si ∆ = {ϕ}, ∆ eliminamos las llaves. En este orden de ideas, f : A ֒→ B significa que f es ∆ un encaje y f : A − → B. 297 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 298 ✐ ✐ 5. Teoría de modelos El siguiente lema será de gran utilidad para “separar” modelos o conjuntos de enunciados; también para encontrar fórmulas equivalentes sin cuantificadores. Lema 6.3. Sean Σ∪Γ∪{ϕ} ⊆ Fml0 (L), γ0 un elemento de Γ que no es válido en ningún L-modelo de Σ, y γ1 un elemento de Γ que es válido en todos los modelos de Σ. Supongamos además que para cualesquier modelos A, B de Σ si A ⇛Γ B, entonces A ⇛ϕ B. En tal situación existe una disyunción finita γ ∗ de conjunciones de elementos de γ tal que Σ |= (ϕ ⇔ γ ∗ ). Demostración. En el lema 3.2 hacemos Σ1 = Σ ∪ {ϕ} y Σ2 = Σ ∪ {¬ϕ}. Si Mod(Σ1 ) = ∅, entonces es cierto Σ |= (ϕ ⇔ γ0 ); si Mod(Σ2 ) = ∅, también ocurre Σ |= (ϕ ⇔ γ1 ). Si A ∈ Mod(Σ1 ) y B ∈ Mod(Σ2 ), no puede ocurrir A ⇛ϕ B y tampoco A ⇛Γ B. Por consiguiente, existe γ ∈ Γ con A |= γ y B |= ¬γ. Por el lema 3.2 sabemos que existe una disyunción finita de elementos de Γ con Mod(Σ1 ) ⊆ Mod(γ ∗ ) y Mod(Σ2 ) ⊆ Mod(¬γ ∗ ). De aquí obtenemos, para A ∈ Mod(Σ), por un lado que A |= ϕ implica A |= γ ∗ A |= ¬ϕ implica A |= ¬γ ∗ . y por otro Así que para toda A ∈ Mod(Σ) se cumple A |= (ϕ ⇔ γ ∗ ). A continuación introducimos la importante noción de equivalencia elemental, una propiedad que aproxima la isomorfía. Definición 6.4. Dos L-estructuras A y B son elementalmente equivalentes, cuando A ≡ B, es decir, cuando Teo(A) = Teo(B). Sean A, B L-estructuras. Una función f : A − → B es elemental de A a B Fml(L) si f : A ֒→ B. En tal caso decimos que A es elementalmente encajable en Fml(L) B, en símbolos A ֒→ B. Fml(L) Note que de A ֒→ B se deduce A ≡ B (véase Ejer. 54). 298 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 299 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 6.5. Sea A una L-estuctura. El diagrama diag(A) de A es el conjunto de todos los L(A)-enunciados primitivos y sus negaciones que son ciertos en A, es decir diag(A) = {ϕ(~a) : A |= ϕ(~a), ϕ ∈ Fml(L) es atómica,~a ∈ An } ∪ ∪ {¬ϕ(~a) : A |= ¬ϕ(~a), ϕ ∈ Fml(L) es atómica,~a ∈ An }. El diagrama de A es el conjunto de todas las literales cerradas de L(A) que son ciertas en A. El resultado principal sobre el diagrama es el lema del diagrama, que ya presentamos en otro contexto (véase el Lema 4.13.2). Con sc denotamos el conjunto de L-fórmulas sin cuantificadores. Lema 6.6 (Lema del diagrama). Sean A y B L-estructuras y f : A − → B. sc (1) f : A − → B es un encaje si y sólo si f : A − → B, si y sólo si Fml(L) (B, f [A]) |= diag(A). En particular, de f : A − → B se desprende que f : A ֒→ B. (2) A se encaja en B si y sólo si existe una L(A)-expansión de B que es modelo de diag(A). Demostración. (1) Sea ∆ el conjunto de todas las fórmulas atómicas y negaciones de fórmulas atómicas. El lector puede verificar fácilmente que las siguientes equivalencias son ciertas: f : A − → B es un encaje si y sólo si sc ∆ f :A− → B, si y sólo si f : A − → B. Esto último es claramente equivalente con (B, f [A]) |= diag(A). (2) Se sigue de (1), puesto que si B′ es una L(A)-extensión de B con ′ ◦B B′ |= diag(A), definimos f (a) = a − → B es un encaje. para toda a ∈ A y obtenemos que f : A Como se mencionó, la equivalencia elemental es muy cercana a la isomorfía (aunque en general es más débil), como lo expresa el siguiente resultado. Fml(L) Teorema 6.7. Si f : A ∼ = B, entonces f : A ֒→ B, en particular A ≡ B. sc Demostración. Notemos primero que f : A − → B, así que para toda fórmula ϕ sin cuantificadores y para toda n-ada ~a de elementos de A, se cumple que A |= ϕ(~a) si y sólo si B |= ϕ(f [~a]). (*) 299 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 300 ✐ ✐ 5. Teoría de modelos Mostraremos, inductivamente sobre la construcción de ϕ, que (*) es cierta para toda ϕ ∈ Fml(L). El único caso que vale la pena considerar es cuando ϕ tiene la forma ∃ xψ(x,~a) para alguna ψ ∈ Fmln+1 (L) y ~a ∈ An . Debemos mostrar que de A |= ψ(b,~a) si y sólo si A |= ψ(f (b), f [~a]), para toda b ∈ A se deduce A |= ∃ xψ(x,~a) si y sólo si B |= ∃ xψ(x, f [~a]). Pero A |= ∃ xψ(x,~a) si y sólo si existe b ∈ A con A |= ψ(b,~a), y por hipótesis también B |= ψ(f (b), f [~a]). Puesto que f es sobre, lo último es equivalente a que exista un c ∈ B tal que B |= ψ(c, f [~a]), y por lo tanto, equivalente con B |= ∃ xψ(x, f [~a]). Con ello hemos demostrado Fml(L) f : A ֒→ B, y A ≡ B se obtiene como caso especial para enunciados. Del teorema 6.7 obtenemos la siguiente consecuencia: Para toda estructura A existe una estructura B, B |= Teo(A) y ajena a A. Simplemente construimos una biyección f de A sobre un conjunto ajeno arbitrario B y definimos sobre B una estructura B, mediante las correspondientes imágenes inversas; en tal situación se presenta f : A ∼ = B y, por consiguiente, B |= Teo(A) por el teorema 6.7. Consideremos una implicación del lema 6.6. Con Π1 denotamos la clase de todas las L-fórmulas en las que aparece como cuantificador solamente ∀ . ◦ ◦ Lema 6.8. Si f : A ֒→ B, B ⇛Π1 A, así como (B, f [A]) ⇛Π1 (A, A). Demostración. Si f : A − → B es un encaje, debemos probar que ◦ ◦ B ⇛Π1 A y que (B, f [A]) ⇛Π1 (A, A). Sea ψ ≡ ∀ ~yϕ(~x, ~y) con ϕ sin cuantificadores y supongamos que es cierta en B; debemos mostrar que es cierta en A, es decir, A |= ∀ ~yϕ(~x, ~y). Es suficiente exhibir que ◦ ◦ A |= ϕ(~x, ~b) para toda ~b ∈ An . Pero A |= ϕ(~x, ~b) si para toda ~a ∈ Am A |= ϕ[~a, ~b]. Sean ~a ∈ Am y ~b ∈ An . Como B |= ∀ ~yϕ(~x, ~y), deducimos que B |= ϕ[f (~a), f (~b)], por lo que no puede ocurrir A |= ¬ϕ[~a, ~b], pues por el lema 6.6(1) implicaría B |= ¬ϕ[f (~a), f (~b)], una contradicción. 300 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 301 ✐ ✐ Conjuntos y modelos. Curso avanzado ◦ ◦ Mediante un razonamiento similar se demuestra (B, f [A]) ⇛Π1 (A, A). Definición 6.9. Sea T una L-teoría. La clase ModL (T) es cerrada respecto a subestructuras si para cualesquier L-estructuras A, B con A ⊆ B, de B |= T se sigue que A |= T. En tal caso también se dice que T es cerrada respecto a subestructuras. Observe que si ModL (T) es cerrada respecto a subestructuras también lo es respecto a encajes, es decir, de A ֒→ B y B |= T se concluye que A |= T, pues existe B′ ⊆ B isomorfa a A y de B′ ⊆ T se deduce A |= T de acuerdo con el teorema 6.7. Por el lema 6.8 sabemos que las Π1 -teorías son cerradas respecto a subestructuras. Probaremos el recíproco, pero necesitamos el siguiente resultado. Lema 6.10. Sean Σ ⊆ Fml0 (L), ϕ ∈ Fmln (L) y ~c una n-ada de símbolos de constante que no pertenecen a L. Entonces ~◦ Σ |=L(~c) ϕ(c) implica Σ |=L ∀ ~xϕ(~x). Demostración. Sea A una L-estructura modelo de Σ. Debemos probar que A |= ϕ(~a) para toda n-ada ~a de A. Expandemos A a una L(~c)-estructura A∗ ∗ si hacemos ~cA = ~a, es decir, si A∗ = (A,~a). Ya que A |= Σ, también A∗ |= Σ ~◦ porque Σ consista de L-enunciados. Si A∗ |= ϕ(c), A |= ϕ[~a]. En el caso particular en el que ϕ(~x) tiene la forma ψ(~x) ⇒ ϑ, con ϑ un L-enunciado, obtenemos que Σ |=L(~c) ϕ(~c) implica Σ |=L (∃ ~xψ(~x) ⇒ ϑ) pues las L-fórmulas ∀ ~x(ψ(~x) ⇒ ϑ) y ∃ ~xψ(~x) ⇒ ϑ son lógicamente equivalentes. Lema 6.11. Suponga que T y T′ son L-teorías. Las siguientes afirmaciones son equivalentes: (i) Todo modelo de T se encaja en un modelo de T′ . (ii) T′Π1 = T′ ∩ Π1 ⊆ T. Demostración. Note que si T1 y T2 son L-teorías, T1 ⊆ T2 si y sólo si para toda L-estructura A T′Π1 . A |= T2 implica A |= T1 . Sea ϕ ∈ Entonces por definición ϕ pertenece a la cerradura deductiva ′ de T ∩ Π1 y como T′ ∩ Π1 |= ϕ, existen ψ1 , . . . , ψn ∈ T′ ∩ Π1 tales que 301 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 302 ✐ ✐ 5. Teoría de modelos ψ1 ∧ · · · ∧ ψn |= ϕ y podemos sustituir ϕ por ψ = ψ1 ∧ · · · ∧ ψn ∈ T′ ∩ Π1 , así que ϕ ∈ T′ ∩ Π1 . Obviamente, si ϕ ∈ T′ ∩ Π1 , entonces ϕ ∈ (T′ ∩ Π1 )|= . Ahora debemos probar TΠ1 ⊆ T. Sean A un modelo de T, ϕ ∈ T′Π1 y B |= T′ . En consecuencia, B |= ϕ. Por (i) existe un encaje f : A ֒→ B y de acuerdo con el lema 6.8, B ⇛Π1 A, por lo que A |= ϕ, lo que se quería demostrar. (ii) ⇒ (i). Supongamos que T′Π1 ⊆ T y A |= T. Corroboramos que existe una L-estructura B con B |= T′ y A ֒→ B. De acuerdo con el lema del diagrama, esto es equivalente a la consistencia de T′ ∪ diag(A). Si fuera inconsistente, existirían ϕ1 (~a1 ), . . . , ϕn (~an ) ∈ diag(A) tales que T′ ∪ {ϕ1 (~a1 ), . . . , ϕn (~an )} es inconsistente. Por consiguiente, T′ |= ¬(ϕ1 (~a1 ) ∧ · · · ∧ ϕn (~an )) = ¬ϕ1 (~a1 ) ∨ · · · ∨ ϕn (~an ). Sin pérdida de generalidad, sea ~a = ~a1 ∪ · · · ∪ ~an y suponemos que estos símbolos no pertenecen al lenguaje de T′ . Por el lema 6.10, T′ |= ∀ ~x(¬ϕ1 (~x) ∨ · · · ¬ϕ(~x)), por lo que ∀ ~x(¬ϕ1 (~x) ∨ · · · ∨ ¬ϕn (~x)) ∈ T′ . Puesto que ¬ϕ1 (~x) ∨ · · · ∨ ¬ϕn (~x) no tiene cuantificadores, ∀ ~x(¬ϕ1 (~x)∨· · ·∨¬ϕn (~x)) ∈ Π1 y en consecuencia ∀ ~x(¬ϕ1 (~x)∨· · ·∨¬ϕn (~x)) ∈ T′Π1 . Como A |= T y TΠ1 ⊆ T, entonces A |= ∀ ~x(¬ϕ1 (~x) ∨ · · · ∨ ¬ϕn (~x)), esto es, A |= ∀ ~x¬(ϕ1 (~x) ∧ · · · ∧ ϕn (~x)), pero cada ϕi ∈ diag(A), es decir, A |= ϕi (~x) (ϕi no puede ser la negación de una fórmula atómica), una contradicción. El caso T = T′Π1 demuestra que los modelos de la parte T′Π1 de una teoría T′ (módulo isomorfismos) son exactamente subestructuras de modelos de T′ . Teorema 6.12 (Łós, Tarski). Sea T una L-teoría, Φ(~x) ⊆ Fmln (L). Las siguientes afirmaciones son equivalentes. (i) Φ(~x) es T-equivalente a un conjunto de Π1 -fórmulas Ψ de L con las mismas variables libres ~x, es decir, para toda L-estructura A tal que A |= T se ◦ cumple que para toda n-ada ~a de elementos de A A |= Φ(~a) si y sólo si ◦ A |= Ψ(~a). (ii) Para cualesquier L-estructuras A y B de T y ~a ∈ An se cumple: si A ⊆ B ◦ ◦ y B |= Φ(~a), entonces A |= Φ(~a). Demostración. De acuerdo con ejercicio 56, basta demostrar que (ii) es cierto si y sólo si Φ(~c) es equivalente (módulo T) a un conjunto de Π1 enunciados de L(~c) (donde ~c son nuevos símbolos de constante). Un conjunto 302 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 303 ✐ ✐ Conjuntos y modelos. Curso avanzado de fórmulas Σ es equivalente a otro conjunto Σ′ módulo Ψ si para toda Lestructura A, con A |= Ψ se cumple A |= Σ si y sólo si A |= Σ′ . Sean A∗ , B∗ L(~c)-estructuras con A∗ ⊆ B∗ , sus L-reductos A y B cumplen con A ⊆ B y existe ~a ∈ An con A∗ = (A,~a) y B∗ = (B,~a). Por otro lado, de ~a ∈ An y A ⊆ B se sigue que (A,~a) ⊆ (B,~a) (vistas como L(~c)-estructuras). Por lo tanto, (ii) es equivalente a que el conjunto de L(~c)-enunciados Φ(~c) es cerrado respecto a subestructuras, cuyos L-reductos son modelos de T. Si Φ(~c) es equivalente (módulo T) a un conjunto de Π1 -enunciados, entonces (ii) se obtiene del lema 6.8 para L(~c). Para el recíproco note que T ∪ Φ(~c) es inconsistente, no tiene modelos y es equivalente a T ∪ Ψ(~c) (T ∪ Ψ(~c) no puede tener modelos, pues serían submodelos de modelos de (T ∪ Φ(~c)). Por lo tanto, sea Ψ(~c) la Π1 -parte de (T ∪ Φ(~c))|= (en L(~c)). Por la observación previa, los modelos de Ψ(~c) son L(~c)-subestructuras de modelos de T ∪ Φ(~c) (propiamente son subestructuras de modelos de (T ∪ Φ(~c))|= , pero todo modelo de esta cerradura deductiva es modelo de T ∪ Φ). Los modelos de T ∪ Ψ(~c) son, por hipótesis, modelos de T ∪ Φ(~c). Por consiguiente, T ∪ Φ(~c) y T ∪ Ψ(~c) son equivalentes, es decir, Φ(~c) y Ψ(~c) son T-equivalentes. Corolario 6.13. Una L-fórmula ϕ(~x) es equivalente a una Π1 -fórmula módulo una L-teoría si y sólo si para cualesquier L-estructuras A, con A |= T y B |= T, ◦ de A ⊆ B se concluye: para toda n-ada ~a de elementos de A, si B |= ϕ(~a), ◦ entonces A |= ϕ(~a). Demostración. De acuerdo con el teorema de compacidad, por el inciso (i) del teorema 6.12 obtenemos una cantidad finita de Π1 -fórmulas, de hecho, una sola Π1 -fórmula, cuando Φ = {ϕ}, pues la conjunción finita de Π1 fórmulas es una Π1 -fórmula. Corolario 6.14 (Principio de conservación de Łoś-Tarski). Una teoría es cerrada respecto a subestructuras si y sólo si es una Π1 -teoría. Demostración. Sea Φ la teoría en cuestión (n = 0) y tome T = ∅|= en el teorema 6.12. 303 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 304 ✐ ✐ 5. Teoría de modelos Ejemplo 6.15. En la signatura (·, e) no se puede Π1 -axiomatizar la teoría de grupos, ya que las subestructuras en esta signatura son subsemigrupos con unidad. Puesto que las Σ1 -fórmulas (fórmulas de la forma ∃ x1 · · · ∃ xn ϕ, con ϕ sin cuantificadores), son negaciones de Π1 -fórmulas (y recíprocamente), obtenemos por contrapositiva en el lema 6.8 que si f : A ֒→ B, entonces A ⇛Σ1 B; es decir, los Σ1 -enunciados se preservan en expansiones. 6.1. Funciones elementales. Antes de retomar nuestro estudio sobre funciones elementales, consideremos primero una relación simple entre estructuras de la misma signatura. La equivalencia elemental es más débil que la isomorfía. Sin embargo, toda función elemental es un encaje, por lo que se acostumbra llamar a las funciones elementales también encajes elementales. El recíproco no es cierto en general, es decir, no todo encaje es una función elemental. En forma análoga al lema del diagrama podemos describir funciones elementales mediante ciertas teorías completas. Lema 6.16 (Diagramas elementales). Sean A y B L-estructuras. (1) Una función f : A − → B es elemental si y sólo si (A, A) ≡ (B, f [A]), si y sólo si (B, f [A]) |= Teo(A, A). Fml(L) (2) A ֒→ B si y sólo si B tiene una expansión que es un modelo de Teo(A, A). Por esta analogía, Teo(A, A) se llama también diagrama elemental de A. Demostración. Fml(L) Fml(L) (1) f : A ֒→ B significa lo mismo que f : A − → B, y también lo mismo que (A, A) ≡ (B, f [A]). Por la completud de Teo(A, A), lo último es equivalente a (B, f [A]) |= Teo(A, A). (2) se sigue de (1) como en el lema del digrama. Es útil introducir los diagramas, bien conocidos en álgebra: El significado del diagrama en la figura 1 es el siguiente: A, B y C son estructuras de la misma signatura, f : A − → B, g : B − → C, h : A − → C. Si 304 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 305 ✐ ✐ Conjuntos y modelos. Curso avanzado A ❅ ❅ f ❅ ❘ ❅ h B g ❄✠ C Figura 1. Diagrama conmutativo. gf = h, es decir, g(f (a)) = h(a) para toda a ∈ A, se dice que el diagrama conmuta. Lema 6.17. En relación con el diagrama de la figura 1, se tienen las siguientes afirmaciones: (1) Si f y g son elementales, h también lo es. (2) Si g y h son elementales, también lo es f . (3) Si f y h son elementales, g no es necesariamente elemental. Demostración. f es elemental si y sólo si (A, A) ≡ (B, f [A]); también ocurre lo correspondiente para g. De la transitividad de la equivalencia elemental y de (C, g[f [A]]) ≡ (C, h[A]) se obtiene (1). (2) Ya que junto con (B, B) ≡ (C, g[B]) y X ⊆ B también es cierto que (B, X) ≡ (C, g[X]), entonces (A, A) ≡ (C, h[A]) ≡ (C, g[f [A]]) ≡ (B, f [A]). (3) Construimos un contrajemplo. Sea A una L-estructura infinita. La teoría Teo(A, A) tiene, por el teorema de Löwenheim-Skolem creciente (Teorema 1.3), un modelo B∗ de cardinalidad estrictamente más grande que la de A. Si B es Fml(L) el L-reducto de B∗ obtenemos, por el lema 6.16, f : A ֒→ B. Hacemos Fml(L) C = A y h = idA , y entonces también logramos h : A ֒→ C. Por cuestiones Fml(L) de cardinalidad no puede ocurrir B ֒→ C (pues las funciones elementales son inyectivas). Para probar (3) basta encontrar g : B − → C con gf = h. Para ello, sea L= el lenguaje con igualdad asociado a la signatura vacía. Entonces 305 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 306 ✐ ✐ 5. Teoría de modelos cada función es un homomorfismo y, por lo tanto, podemos definir g(b) = a, cuando f (a) = b, y g(b) = c para c ∈ A arbitraria en otro caso. Entonces el diagrama conmuta. En esta oportunidad consideramos el caso particular en el que la función identidad es elemental. Primero introducimos la noción de subestructura elemental. Definición 6.18 (Tarski [Tar57]). Sean A, B L-estructuras y ∆ una clase de fórmulas. A ≺ ∆ B significa que A ⊆ B y que para toda ϕ ∈ ∆ ∩ Fml(L) y las correspondientes n-adas (quiza vacías) de elementos de A se cumple que: ◦ ◦ si B |= ϕ(~a) entonces A |= ϕ(~a). Si ∆ contiene a Fml(L), escribimos A ≺ B y decimos que A es una subestructura elemental (o un submodelo elemental) de B o que B es una expansión elemental de A. Trivialmente, siempre ocurre A ≺ A, y A ≺ ∆ B es claramente equivalente con (B, A) ⇛∆(A) (A, A). Si Γ es la clase de todas las negaciones de fórmulas de ∆, entonces A ≺ ∆ B Γ es equivalente a A ⊆ B e idA : A − → B. Note que si A, B son L-estructuras y A ≺ B, entonces A ⊆ B: debemos verificar que A ⊆ B, lo cual ocurre por definición; para todo símbolo de relación R, RA = RB ∩ Aτ(R) ; para ello supongamos que τ(R) = n y que ~a es una n-ada de elementos de A: ◦ ~a ∈ RA , si y sólo si A |= R(~a), ◦ ◦ como ~a ∈ Aτ(R) y A ⊆ B, si B |6 = R(~a), por hipótesis A 6|= R(~a), esto es una contradicción. ◦ Recíprocamente, si B |= R(~a), para ~a ∈ Aτ(R) , por definición de ◦ subestructura elemental, A |= R(~a), así que ~a ∈ RA . En forma similar, probamos que para todo símbolo de función f se cumple f A (a) = f B ↾ Aτ(f ) . Para los símbolos de constante debemos probar que ∀ c ∈ K(cA = cB ). ◦ Considere la fórmula ϕ ≡ c=x. ˙ Si B |= ϕ(a), entonces cA = a, y por ◦ definición A |= ϕ(a), es decir, cA = a = cB , con lo cual hemos demostrado que A ≺ B implica A ⊆ B. 306 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 307 ✐ ✐ Conjuntos y modelos. Curso avanzado Fml(L) Observe que A ≺ B es equivalente con A ⊆ B e idA : A ֒→ B. Por ◦ ello, nuestra definición de A ≺ B se convierte ahora en A |= ϕ(~a) si y sólo si ◦ B |= ϕ(~a). Además, A ≺ B es equivalente con A ⊆ B y para toda n ∈ N y ϕ ∈ Fmln (L) ocurre ϕ(B) ∩ An = ϕ(A); es decir, los conjuntos definibles en A son la intersección de A con los definibles en B. Para conjuntos definibles paramétricamente se obtiene, en el caso en que los parámetros pertenezcan a A: para toda ϕ ∈ Fmln+m y ~c ∈ Am es cierto que ϕ(B, ~c) ∩ An = ϕ(A, ~c). Mediante el siguiente truco sencillo se puede reducir la relación entre encaje (elemental) e isomorfía a la existencia de una extensión (elemental) que por razones técnicas puede ser muy útil. Lema 6.19. Sean A y B L-estructuras. (1) Si A ֒→ B, existe una L-estructura B′ ∼ = B con A ⊆ B′ . Fml(L) (2) Si A ֒→ B, existe una L-estructura B′ ∼ = B con A ≺ B′ . Demostración. (1) Basta una modificación de la prueba para (2), lo que queda como ejercicio al lector. (2) Sin pérdida de generalidad, podemos suponer A ∩ B = ∅. Para la función Fml(L) f dada f : A ֒→ B construimos una función g : B ∼ = B′ . Para c ∈ B hacemos g(c) = c si c ∈ B \ f [A], y g(c) = f −1 (c) si c ∈ f [A]; g es una Def biyección de B sobre B′ = (B \ f [A]) ∪ A. Interpretamos los símbolos ′ no lógicos en B como la imagen respecto a g de los correspondientes en B y obtenemos con ello una L-estructura B′ con g : B ∼ = B′ . Entonces gf es la identidad en A, y del lema 6.17(1) sabemos que esta función es elemental, es decir, A ≺ B′ . El siguiente teorema de Abraham Robinson resolvió finalmente un viejo problema sobre infinitesimales en el cálculo. Teorema 6.20 (Principio de Leibniz). Existe un campo ordenado ∗ R llamado hiperreales, que contiene propiamente los números reales R y un número infinitesimal tal que toda afirmación sobre los números reales que es cierta en R también es cierta en ∗ R. 307 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 308 ✐ ✐ 5. Teoría de modelos Demostración. Sea A = hR, <, +, ·, 0, 1i. Para formalizar la afirmación del teorema probaremos que existe un modelo B, en el mismo lenguaje L de A con un universo llamado ∗ R, tal que A ≺ B y existe b ∈ ∗ R tal que 0 < b < a para toda a ∈ R positiva. Para cada número real a introducimos un nuevo símbolo de constante ca ; también añadimos otro nuevo símbolo de constante d. Sea Σ el conjunto de enunciados en el lenguaje expandido definido por Teo((A, R ∪ {d})) ∪ {0 < d < ca : a es un número real positivo}. Podemos obtener un modelo C |= Σ por el teorema de compacidad. Sea C ′ el L-reducto de C. Por el lema del diagrama 6.6, A se encaja elementalmente en C ′ , por lo que existe una L-estructura B tal que C ′ ∼ = B y A ≺ B. La idea de este resultado es extremadamente útil para comprender el cálculo. Un elemento x ∈ ∗ R es un infinitesimal si −r < x < r para cada r ∈ R positiva. 0 es infinitesimal. Dos elementos x, y ∈ R están infinitamente cerca, x ≈ y, si x − y es un infinitesimal. Note que x es un infinitesimal si y sólo si x ≈ 0. Un elemento x ∈ ∗ R es finito si −r < x < r para algún r ∈ R positivo. En otro caso es infinito. Cada elemento finito x ∈ ∗ R está infinitamente cerca de algún número real, llamado parte estándar de x, est(x). Para diferenciar f , para cada ∆x ∈ ∗ R generamos ∆y = f (x + ∆x) − f (x). Entonces f ′ (x) = est( ∆y ∆x ) siempre que exista y sea el mismo para cada infinitesimal ∆x 6= 0. El conocido lema de incrementos establece que si y = f (x) es diferenciable en x y ∆x ≈ 0, entonces ∆y = f ′ (x)∆x + ǫ∆x para algún infinitesimal ǫ. ◭ El siguiente teorema justifica que al demostrar inductivamente la propiedad de ser subestructura elemental, todas las etapas de inducción, excepto la del cuantificador existencial, son triviales. Además proporciona un criterio que se usa con frecuencia para determinar si una subestructura es elemental. En este libro lo utilizaremos en numerosas ocasiones. Teorema 6.21 (Prueba de Tarski-Vaught). Sean A y B L-estructuras. A ≺ B si y sólo si A ⊆ B y se satisface la siguiente condición: (TV) Para cualesquier n < ω, ϕ ∈ Fmln+1 (L) y n-ada ~a de elementos de ◦ A, si B |= ∃ xϕ(x, ~a), entonces existe una b ∈ A con B |= ϕ[b,~a]. 308 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 309 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Para la dirección no trivial mostramos inductivamente sobre la construcción de ψ ∈ Fml(L) que ◦ ◦ A |= ψ(~a) si y sólo si B |= ψ(~a). (*) para todo conjunto (correspondiente) ~a de elementos de A. Puesto que A ⊆ B, (*) es cierta para toda fórmula atómica ψ, de donde se obtiene (*) inductivamente para fórmulas ψ arbitrarias sin cuantificadores. ◦ Falta demostrar (*) para ψ(~a) de la forma ∃ xϕ(x, ~a). ◦ A |= ∃ xϕ(x, ~a) si y sólo si existe b ∈ A con A |= ϕ(b,~a), y por hipótesis de inducción, si y sólo si b ∈ A con B |= ϕ[b,~a] que por (TV), es equivalente ◦ con B |= ∃ xϕ(x, ~a). La prueba de Tarski-Vaught afirma que A ≺ B si y sólo si A ⊆ B y para toda n < ω, para cualquier fórmula ψ(x, ~x) ∈ Fmln+1 (L) y toda n-ada ~a de ◦ ◦ elementos de A, es cierto que: si ψ(B, ~a) 6= ∅, A ∩ ψ(B, ~a) 6= ∅. Corolario 6.22. Sean A, B dos L-estructuras y A ⊆ B de tal forma que se satisface la condición (TV). Entonces A es cerrado respecto a los símbolos no lógicos y la restricción A de B a A es una subestructura elemental de B. Demostración. Tan sólo necesitamos probar la cerradura. Considere para ◦ ello (TV) con las fórmulas x=c ˙ (c ∈ K) y x=f ˙ (~a) (f ∈ F y ~a ∈ An ). La siguiente condición suficiente (pero no necesaria) para que una subestructura sea elemental se desprende directamente de la prueba TV. Corolario 6.23. Sean A, B L-estructuras con A ⊆ B. Si para todo conjunto finito A′ ⊆ A y cada c ∈ B existe un automorfismo f ∈ AutA′ (B) = {f ∈ Aut(B) : f ↾ A′ = idA′ } con f (c) ∈ A, entonces A ≺ B. Demostración. Sean n < ω, ϕ ∈ Fmln+1 (L) y ~a una n-ada de elementos ◦ de A con B |= ∃ xϕ(x, ~a). Debemos mostrar que existe b ∈ A con B |= ϕ[b,~a]. ◦ De B |= ∃ xϕ(x, ~a) obtenemos un c ∈ B con B |= ϕ[c,~a]. Escogemos f ∈ Aut~a (B) con f (c) ∈ A. Ya que f es elemental, se deduce B |= ϕ[f (c), f [~a]] a partir de B |= ϕ[c,~a], es decir, B |= ϕ[f (c),~a]. 309 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 310 ✐ ✐ 5. Teoría de modelos Ejemplo 6.24. Sean R un anillo, X, Y conjuntos infinitos de indeterminadas sobre R con X ⊆ Y y R[X], R[Y ] los correspondientes anillos de polinomios sobre R, considerados en la signatura apropiada para anillos σ = {+, −, ·, 0, 1}. Entonces R[X] ≺ R[Y ]. De acuerdo con el corolario 6.23 es suficiente mostrar que para cualesquiera a1 , . . . , am ∈ R[X] y puntos b ∈ R[Y ] existe un automorfismo de R[Y ] que deja fijos a a1 , . . . , am y manda a b en R[X]. Sea {x1 , . . . , xn } el conjunto de todas las indeterminadas que aparecen en a1 , . . . , am junto con todos los miembros de X que aparecen en b; sea {Y1 , . . . , Ym } el conjunto de todas la indeterminadas de b que pertenecen a Y − X. Note que ambos conjuntos deben ser finitos, pues son indeterminadas de una cantidad finita de polinomios. Defina una biyección f′ : Y − → Y que fije X1 , . . . , Xn y que mande cada Yi a alguna indeterminada en X. Como X es infinito, tal biyección debe existir. La biyección f ′ tiene una extensión canónica f : R[Y ] − → R[Y ] que es un automorfismo de R[Y ]. Note que f fija a1 , . . . am y manda a b dentro de R[X]. Para mostrar la utilidad de los resultados anteriores, consideremos dos ejemplos: Teorema 6.25. (1) Todo subconjunto infinito A de un conjunto B es (visto como L= -estructura) una subestructura elemental. (2) Denotemos con η el orden de los números racionales y con λ el de los números reales (como L< -estructuras); entonces, η ≺ λ. Demostración. (1) Sean A y B conjuntos infinitos, A un subconjunto de B, A′ ⊆ A un subconjunto finito y c ∈ B. Buscamos un automorfismo de B (simplemente una biyección de B sobre sí mismo) que deje fijo A′ y transforme c en un d ∈ A. Sin pérdida de generalidad, c ∈ / A′ (sino hacemos d = c y f = idB ). Ya que A es infinito y A′ es finito, existe una d ∈ A \ A′ . Hacemos f ↾ B \ {c, d} = idB\{c,d} , f (d) = c y f (c) = d. Del corolario 6.23 se obtiene ahora la afirmación. (2) Sea A ⊆ Q un subconjunto finito y c ∈ R. Buscamos una d ∈ Q y un automorfismo que preserve el orden de λ, que mande c en d y deje fijo A. Como en (1), sin pérdida de generalidad, c ∈ / A. El conjunto 310 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 311 ✐ ✐ Conjuntos y modelos. Curso avanzado A∪{c} descompone R en un número finito de intervalos mutuamente ajenos semiabiertos por la izquierda. Consideremos aquellos intervalos vecinos que tienen a c como punto frontera, es decir, intervalos de la forma (a, c] y (c, b] para algunos a, b ∈ A. Sea d ∈ Q ∩ (a, b] elegido arbitrariamente. Entonces existe un automorfismo que respeta el orden de (a, b], que mande b−d c en d (p. ej. f (x) = a+(x−a) d−a c−a para x ∈ (a, c] y f (x) = b−(b−x) b−c para x ∈ (c, b]). La extensión de esta biyección mediante la identidad en R \ (a, b] arroja la biyección que requerimos, de donde (usando el corolario 6.23) se deduce la afirmación. Una vez que hemos visto cómo podemos discriminar si ciertas funciones son elementales, en la siguiente sección “construiremos” diversas funciones elementales. No obstante, antes trataremos propiedades generales de teorías y desarrollaremos algunos métodos para investigar la clase de sus modelos. Recuerde que A ≡ B quiere decir, para L-estructuras, que Teo(A) = Teo(B). Teorema 6.26. Para una L-estructura A las siguientes condiciones son equivalentes. (i) Para cualesquier L-estructuras A, B tales que B ≡ A, se cumple B∼ = A. (ii) A es finita. Demostración. La clase de las estructuras a las cuales una estructura dada es isomorfa está unívocamente determinada por su diagrama. Si A es una estructura finita con universo A = {a0 , . . . , an−1 } en el lenguaje de una signatura finita, entonces el diagrama de A es finito, y por ello es axiomatizable mediante un solo enunciado ϕ(~a). Entonces A es el único modelo (salvo isomorfismos) del enunciado ∃ ~xϕ(~a), y se obtiene (i). Si, por el contrario, la signatura de A es infinita, entonces el diagrama no puede ser finitamente axiomatizable (en el caso más simple podría haber una infinidad de símbolos de constante, en el que todas se interpretan como el mismo elemento en A). Formamos entonces la conjunción ϕ∆ (a0 , . . . , an−1 ), para cada subconjunto finito ∆ de diag(A), de todos los enunciados de ∆ y establecemos que A es el único modelo (salvo isomorfías) de {∃ ~xϕ∆ (~x) : ∆ ⊆ diag(A), |∆| < ℵ0 } y se sigue (i) también en este caso. 311 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 312 ✐ ✐ 5. Teoría de modelos Si ambas estructuras son infinitas, entonces sus teorías tienen modelos arbitrariamente grandes (por el teorema de Löwenheim-Skolem creciente), que por supuesto son elementalmente equivalentes. Al elegir estas estructuras de distinta cardinalidad impedimos que sean isomorfas. En relación con modelos finitos, existe una técnica relacionada con la teoría de juegos que permite decidir equivalencia elemental (véase [MiMa99]). Como veremos a continuación, existe una sólida relación entre completud y equivalencia elemental. Teorema 6.27. Una teoría T es completa si y sólo si todos sus modelos son equivalentes. Demostración. Claramente, de A |= T se deduce que T ⊆ Teo(A). Si T es completa, se presenta la igualdad T = Teo(A), y también Teo(A) = Teo(B), es decir, A ≡ B, para cualesquier A, B |= T. Si T no es completa, entonces T ⊆ Teo(A) para una estructura arbitraria A |= T y existe una ϕ ∈ Teo(A) \ T. Ya que entonces T 6|= ϕ, también T ∪ {¬ϕ} tiene un modelo B. A y B son, por tanto, dos modelos de T que no son elementalmente equivalentes. Una consecuencia inmediata del teorema 6.27 es que una teoría completa tiene a lo sumo un modelo finito. Corolario 6.28. Una teoría completa tiene modelos finitos si y sólo si tiene un solo modelo (salvo isomorfismos). Demostración. Si una teoría T tiene un modelo de cardinalidad n < ω, entonces la fórmula que asegura la existencia de exactamente n elementos pertenece a T, y con ello cualquier otro modelo tiene la misma cardinalidad. Puesto que T es completa, todos sus modelos son elementalmente equivalentes, y para estructuras finitas ≡ es equivalente a ∼ =. Recíprocamente, si T tiene un solo modelo, por el teorema de Löwenheim-Skolem T no puede tener modelos infinitos. Ahora presentamos una generalización de función elemental. 312 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 313 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 6.29. Sean A, B, L-estructuras y f una función de un subconjunto X de A a B. Decimos que f es elemental con respecto a A y B si para toda fórmula ϕ(x1 , . . . , xm ) de L y cualesquier a1 , . . . , an ∈ X se cumple que A |= ϕ[a1 , . . . , am ] si y sólo si B |= [f (a1 ), . . . , f (am )]. Note que la diferencia con la definición de función elemental es que los elementos ai los tomamos de un subconjunto (que puede ser propio) X de A. El lector puede verificar sin dificultad que si f es elemental en el sentido recién mencionado, debe ser necesariamente inyectiva. Teorema 6.30. Supongamos que X ⊆ A, f : X − → B y f es elemental respecto a las L- estructras A y B. Entonces existen expansiones elementales A′ ≻ A y B′ ≻ B y un isomorfismo f ′ : A′ − → B′ tal que f = g ↾ X. Demostración. Note que f −1 es una función elemental de f [X] ⊆ B en A. Por lo tanto y en vista del teorema 7.5, existen una extensión elemental B1 ≻ B y un encaje elemental f1 : A − → B tal que f1 ↾ X = f . Otra vez usamos el teorema 7.5 para obtener una extensión elemental A1 ≻ A y un enecaje elemental g1 : B1 − → A1 tal que g1 (f1 (a)) = a para toda a ∈ A. Usamos este procedimiento inductivamente para obtener encajes elementales: (Ai , X) ≺ (Ai+1 , X), fi : (Ai , X) − → (Bi+1 , f [X]) y gi :S (Bi , f [X]) − →S(Ai , X) (i ∈ N) con B0 = B y A0 = A. Sean A′ = n∈N An y B′ = n∈N Bn . Claramente, A ≺ A′ y B ≺ B′ . Definimos además las funciones f ′ : A′ − → B ′ y g′ : B ′ − → A′ mediante f ′ = ∪fn y ′ g = ∪gn . Ambas funciones resultan ser encajes y son inversas una de otra. Por lo tanto, f ′ es un isomorfismo cuya restricción a A coincide con f . 7. Existencia de subestructuras y extensiones elementales Primero construiremos subestructuras elementales. Note que por el teorema 6.26 las estructuras finitas sólo se tienen a sí mismas como subestructuras o expansiones elementales. Afortunadamente no ocurre lo mismo para las estructuras infinitas. Teorema 7.1 (Löwenheim-Skolem decreciente para ≺ ). Toda L-estructura infinita A posee subestructuras elementales de cardinalidad no mayor que |L|. 313 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 314 ✐ ✐ 5. Teoría de modelos Más aún, todo subconjunto A′ de A está contenido en una subestructura elemental de A con cardinalidad no mayor que |L| + |A′ | ( y con ello A posee subestructuras elementales de toda cardinalidad κ tal que |L| ≤ κ ≤ |A|. Demostración. La primera afirmación se sigue obviamente de la segunda para A′ = ∅. Además, ambas afirmaciones son redundantes para |A| ≤ |L|, pues A ≺ A. Sea entonces A′ ⊆ A y |A| > |L|, y hacemos κ = |L| + |A′ |. Para i < ω escogemos sucesivamente conjuntos Ai ⊆ A de cardinalidad κ tales que A′ ⊆ A0 ⊆ A1 ⊆ · · · ⊆ Ai ⊆ · · · y así sucesivamente, de tal forma que para toda i < ω es cierto que (*) Si ϕ ∈ Fml1 (Ai ) y A |= ∃ xϕ, existe una a ∈ Ai+1 con A |= ϕ(a). La elección de las Ai se logra como sigue: comenzamos con un subconjunto arbitrario A0 de A con cardinalidad κ, que contenga a A′ . Si ya tenemos Ai , añadimos a Ai para cada ϕ(x) de Fml(Ai ) tal que A |= ∃ xϕ(x), un bϕ ∈ A arbitrario que cumpla A |= ϕ(bϕ ), y llamamos Ai+1 al conjunto así definido. Ya que |Fml(Ai )| = |L| + |Ai | = κ, hemos añadido a lo sumo κ elementos bϕ , es decir, κ = |Ai | ≤ |Ai+1 | ≤ κ + |Ai | = κ. S Definimos B = i<ω Ai . Obviamente B tiene cardinalidad κ. De (*) se deduce que B es cerrado respecto a funciones y contiene todas las constantes de la signatura, es decir, podemos considerar canónicamente a B como una Lsubestructura B ⊆ A. Falta demostrar que B ≺ A. Esto se sigue del criterio TV. Sea n < ω, ϕ ∈ Fmln+1 (L) y ~a una n-ada de elementos de B tales que ◦ A |= ∃ xϕ(x, ~a). Buscamos un b ∈ B con A |= ϕ[b,~a]. Pero ~a está contenida ◦ S en algún Ak (k < ω), pues B = i<ω Ai . Ya que entonces ϕ(x, ~a) ∈ Fml1 (Ak ), por (*) existe un b ∈ Ak+1 ⊆ B con A |= ϕ[b,~a]. Ejemplo 7.2. Sea G un grupo infinito simple. Mostraremos que para todo cardinal infinito λ ≤ |G|, G tiene un subgrupo de cardinalidad λ simple. El lenguaje de la teoría de grupos es numerable, así que por el teorema de Löwenheim-Skolem decreciente, G tiene un submodelo elemental H de cardinalidad λ. Claramente H es un subgrupo de G. Debemos mostrar que H es simple, para ello basta probar que si a, b ∈ H y b 6= 1, entonces a está en el subgrupo normal generado por b. Como G es simple, esto es cierto en G. Supongamos, por ejemplo, que G |= ∃ y∃ z(a = y−1 byz−1 b−1 z). 314 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 315 ✐ ✐ Conjuntos y modelos. Curso avanzado Como H ≺ G, el mismo enunciado es cierto en H. Por lo tanto, existen c, d ∈ H tales que a = c−1 bcd −1 b−1 d como se requiere. El siguiente corolario se debe a L. Löwenheim [Lö15] y Th. Skolem [Sk20]. Corolario 7.3 (Löwenheim-Skolem). Toda L-teoría tiene un modelo de cardinalidad no mayor que |L|. Toda L-teoría que tenga un modelo infinito tiene un modelo de cada cardinalidad mayor o igual que |L|. Demostración. Sea A un modelo de la L-teoría T. Todo modelo finito de T tiene cardinalidad menor que |L|. Si T tiene un modelo infinito, por el teorema de Löwenheim-Skolem creciente T tiene un modelo A de cardinalidad ≥ κ para cada cardinal κ ≥ |L|. El teorema 7.1 proporciona una subestructura elemental de A de cardinalidad κ, que por supuesto es modelo de T. 7.1. Paradoja de Skolem. Sea L∈ un lenguaje en la signatura que sólo tiene el símbolo de 2-relación ∈. En este lenguaje se puede formalizar la teoría de conjuntos como lo hicimos en el capítulo 1. Si ZFE es consistente (lo que no podemos demostrar), tiene un modelo numerable. Por el teorema de Cantor, el conjunto potencia de un conjunto A tiene cardinalidad estrictamente mayor que |A|. Así que existen conjuntos no numerables en el modelo numerable. Esta aparente contradicción constituyó una motivación para Skolem en su intento por perfeccionar la axiomatización de la teoría de conjuntos. La solución de esta “paradoja” radica en que la no numerabilidad en nuestro modelo numerable no significa lo mismo que la no numerabilidad “en el mundo real”, es decir, en la metateoría. El que un conjunto no sea numerable significa que no existe una biyección entre el conjunto y ω. En nuestro modelo numerable no existen suficientes biyecciones, por lo que algunos conjuntos resultan no numerables desde el punto de vista de nuestro modelo ([Sk22]). Si utilizamos el teorema de Löwenheim-Skolem creciente en diagramas elementales, obtenemos extensiones elementales arbitrariamente grandes. Mediante la siguiente aplicación del teorema 7.1 podemos incluso describir exactamente la cardinalidad. Teorema 7.4 (Löwenheim-Skolem creciente para ≺ ). Sea A una L-estructura infinita y κ ≥ |L|+|A|. Entonces A tiene una expansión elemental de cardinalidad κ. 315 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 316 ✐ ✐ 5. Teoría de modelos Demostración. La L(A)-teoría Teo(A, A) tiene un modelo B∗ de cardinalidad κ de acuerdo con el corolario 7.3, pues |L(A)| ≤ |L| + |A| ≤ κ. Sea B Fml(L) el L-reducto de B∗ . Entonces se sigue (usando el Lema 6.16) que A ֒→ B. Ahora usamos el lema 6.19 para encontrar una B′ ∼ = B con A ≺ B′ . Todavía podemos mejorar este teorema. Teorema 7.5. Sea K un conjunto arbitrario de L-estructuras elementalmente equivalentes. Para cada cardinal κ ≥ |K| + |L| + sup (|A|) A∈K Fml(L) existe una L-estructura B de cardinalidad κ con A ֒→ B para toda A ∈ K. Para cada A0 ∈ K se puede escoger B de tal forma que A0 ≺ B. Demostración. El resultado se obtiene mediante el lema 6.19. Consideremos [ T = {Teo(A, A) : A ∈ K}, donde, sin pérdida de generalidad, para A, A′ ∈ K con A 6= A′ se escogen ◦ ◦′ los conjuntos de nuevas constantes {a : a ∈ A} y {a : a′ ∈ A′ } disjuntos. Como en la demostración del teorema 7.4, basta probar que T es consistente. Sea ∆ un subconjunto finito de T. Ya que los diagramas individuales son completos, en particular cerrados respecto a conjunciones finitas, podemos suponer que ∆ = {ϕi : i < n} con ϕi ∈ Teo(Ai , Ai ) para ciertas Ai ∈ K (i < n) tales que Ai 6= Aj para i < j < n. Entonces, para toda i < n existen un número mi < ω, una fórmula ϕi′ ∈ Fmlmi (L) y una mi -ada ~ai de Ai tales ◦ que ϕi tiene la forma ϕi′ (~a). Por la elección (ajena) de las constantes, los ~ai son mutuamente ajenos (como conjuntos), y por ello podemos considerar que los ~xi son ajenos entre sí. Por lo tanto, |= ∃ ~x0 · · · ~xn−1 ^ i<n ϕi′ (~xi ) ⇔ ^ i<n ∃ ~xi ϕi′ (~xi ), y por consiguiente cada modelo de la conjunción a la derecha es un modelo de ∆. Para toda i < n es cierto que ϕi ∈ Teo(Ai , Ai ), así que Ai |= ∃ ~xi ϕi′ (~xi ). Lo último es un L-enunciado, que en vista de A0 ≡ Ai también es cierto en A0 . Con ello A0 es un modelo de ∆ y, por lo tanto, T es consistente, lo que conduce a la afirmación que queríamos demostrar. 316 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 317 ✐ ✐ Conjuntos y modelos. Curso avanzado Finalmente y para concluir nuestros razonamientos obtenemos: Corolario 7.6. Para todo conjunto K de modelos de una teoría T existe un modelo de T en el que cada modelo de K se puede encajar elementalmente. En particular, para estructuras arbitrarias A0 , A1 , si A0 , A1 |= T, entonces existe B tal que B |= T con A0 lograr A0 ≺ B. Fml(L) ֒→ B y A1 Fml(L) ֒→ B, donde incluso se puede Demostración. Por el teorema 6.27 todos los modelos de una teoría completa son elementalmente equivalentes, así que podemos usar el teorema 7.5 pues si K es un conjunto de estructuras, entonces el supremo de {|A| : A ∈ K} existe y es un cardinal. 8. Extensiones conservativas y extensiones por definiciones Sea L un lenguaje de primer orden. Recuerde que una L-teoría es un conjunto consistente de L-enunciados deductivamente cerrado. Si bien los resultados de esta sección se refieren a L-teorías, en la mayoría de los casos el lector puede verificar sin dificultad que los resultados siguen siendo válidos si en lugar de teoría usamos simplemente un conjunto de L-enunciados. Definición 8.1. Si ϕ es una L-fórmula y T una teoría tal que T |= ϕ, entonces ϕ es demostrable en T, y también se dice que ϕ es un teorema de T. El lenguaje de una teoría es L(T) = {KT , FT , RT , τ}, donde KT , FT y RT son respectivamente los conjuntos de símbolos de constantes, funciones y relaciones que aparecen en los enunciados de T. Una estructura A que satisface todos los enunciados de T es un T-modelo. Un ejemplo es la teoría de grupos ΦGr . Dado que en todo grupo G se cumple G |= ∀ x(e · x=x), ˙ el enunciado ∀ x(e · x=x) ˙ es un teorema de ΦGr . Como hay grupos no conmutativos, el enunciado no es un teorema de ΦGr . ∀ x∀ y(x · y=y ˙ · x) Definición 8.2. Suponga que L ⊆ L′ son lenguajes de primer orden. 317 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 318 ✐ ✐ 5. Teoría de modelos (a) Una L′ -teoría T′ es una extensión de una L-teoría T si todo T-teorema es también un T′ -teorema, es decir, T |= ϕ implica T′ |= ϕ para todo L-enunciado ϕ. (b) Una extensión T′ de T es conservativa si para todo L-enunciado ϕ se cumple T′ |= ϕ implica T |= ϕ. Teorema 8.3. Suponga que T es una L-teoría y T′ es una L′ -teoría tales que todo T-modelo se extiende a un T′ -modelo. Entonces T′ es conservativa sobre T. Demostración. Sean L = L(T), L′ = L(T′ ) y ϕ un L-enunciado tal que T′ |= ϕ. Si A es un T-modelo, se extiende a un T′ -modelo A′ . Entonces A′ |= ϕ, A es el L-reducto de A′ y ϕ está en Fml(L). Así que, por el lema 4.8.17, A |= ϕ. Por lo tanto, T |= ϕ. En matemáticas es práctica común definir nuevas funciones y relaciones y probar teoremas usando esas definiciones. Por lo general, suponemos que no hay diferencia si usamos esas nuevas definiciones o no. Con la siguiente definición formalizamos este proceso y el teorema posterior justifica el procedimiento. Definición 8.4. Sea T una teoría con lenguaje L = L(T). Un lenguaje L′ = {K′ , F′ , R′ , τ ′ } es una extensión de L mediante definiciones si se satisfacen las siguientes condiciones: 1. L ⊆ L′ 2. Para toda c ∈ K′ \ K existe una fórmula ϕc tal que lib(ϕc ) = {x} y T |= ∃ x(ϕc ∧ (∀ y(ϕc (y) ⇒ y=x))), ˙ denotada por brevedad T |= ∃ !xϕc (x). 3. Para todo símbolo de n-función f ∈ F ′ \ F existe una L(T)-fórmula ϕf tal que lib(ϕf ) = {x1 , . . . , xn , y} y T |= ∀ x1 , . . . xn ∃ !yϕf . 4. Para todo símbolo de n-relación P ∈ R′ \ R existe una L(T)-fórmula ϕp tal que lib(ϕP ) = {x1 , . . . , xn }. 318 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 319 ✐ ✐ Conjuntos y modelos. Curso avanzado Si L′ es una extensión por definición de una teoría T, entonces T(L′ ) es la teoría que contiene exactamente lo siguiente: 1. Todos los enunciados en T, es decir, T ⊆ T(L′ ). 2. Todos los enunciados ϕc {x/c} para c ∈ K′ \ K. 3. Todos los enunciados ∀ x1 · · · xn ϕc (fx1 · · · xn ) para f ∈ F ′ \ F. 4. Todos los enunciados ∀ x1 · · · xn (Px1 · · · xn ⇔ ϕP ) para P ∈ R′ \ R. Naturalmente, la importancia de una extensión por definición es que la teoría resultante sea conservativa sobre la original. Teorema 8.5. Si L′ es una extensión de T por definiciones, entonces T(L′ ) es conservativa sobre T. Demostración. Sea A un T-modelo. Basta extender A a un T(L′ )-modelo Para obtener una L′ -estructura, primero debemos interpretar los símbolos en L′ que no pertenecen a L. 1. Si c ∈ A′ \A, entonces existe una fórmula ϕc tal que T |= ∃ !xϕc . Puesto que A |= T, también tenemos A |= ∃ !xϕc que significa que existe un único ′ elemento s ∈ A tal que A |= ϕc (s). Hacemos cA = s. Entonces, obviamente A′ . A′ |= ϕc (c). (41) A |= ∀ x1 · · · xn ∃ !yϕf . (42) 2. Sea f ∈ F ′ \ F un símbolo de n-función. Entonces existe una L(T)fórmula ϕf tal que Definimos ′ f A (s1 , . . . , sn ) = t si A |= ϕf (s1 , . . . , sn , t). Esto define una función, pues para s1 , . . . , sn ∈ S arbitrarios existe exactamente una t tal que A |= ϕf [s1 , . . . , sn , t] por la ecuación 42. Obviamente se cumple A′ |= ∀ x1 , . . . xn ϕf (fx1 · · · xn ). (43) 3. Para P ∈ R′ \ R una, n-relación, tenemos una L(T )-fórmula ϕP tal que lib(ϕP ) = {x1 , . . . , xn }. Definimos ′ para obtener P A = {(s1 , . . . , sn ) ∈ An : A |= ϕP (s1 , . . . , sn )} A′ |= ∀ x1 · · · xn (Px1 · · · xn ⇔ ϕP ). (44) 319 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 320 ✐ ✐ 5. Teoría de modelos De las ecuaciones 41, 43 y 44 deducimos que A′ es un T(L′ )-modelo. Por lo tanto, y en vista de 8.3, T(L′ ) es una extensión conservativa de T. Ahora podemos generalizar el teorema 8.5 de tal manera que, para toda fórmula de la extensión por definición T(L′ ) de una teoría T, tenemos una L(T)-fórmula equivalente. Es decir, los nuevos símbolos se pueden reemplazar los nuevos símbolos por sus definiciones. Teorema 8.6. Sea T(L′ ) una extensión de T por definiciones. Entonces, para cada L′ -fórmula ϕ existe una L(T)-fórmula ϕT tal que T(L′ ) |= ϕ ⇔ ϕT . Demostración. En la primera etapa probaremos que para cualquier L′ término t existe una L(T)-fórmula ψ t tal que T(L′ ) |= (t =x) ˙ ⇔ ψt para x ∈ / lib(t), (45) Def por inducción en la construcción de t. Si t es un L-término, hacemos ψ t = (t =x). ˙ Si t = c ∈ K′ \ K, entonces existe una L-fórmula ϕc tal que T |= ∃ !xϕc y Def T(L′ ) |= ϕc (c). Hacemos ψ c = ϕc . Entonces, si c = x obtenemos ψ c a partir de ϕc {x/c}. Por otra parte, si ψ c concluimos c = x a partir de T(L) |= ∃ !xψ c y T(L′ ) |= ψ c (c). De aquí que T(L′ ) |= (c=x) ˙ ⇔ ψc. Si t = fs1 · · · sn , entonces, por hipótesis de inducción, existen fórmulas ψ si tales que T(L′ ) |= (si =x) ˙ ⇔ ψ si (46) para i ∈ {1, . . . , n}. Si f ∈ / F, existe una L(T)-fórmula ϕf tal que f lib(ϕ ) = {x1 , . . . , xn , y}, T(L′ ) |= ∀ x1 , · · · xn ∃ !yϕf , y T(L′ ) |= ∀ x1 · · · xn ϕf (fx1 · · · xn ). (47) Definimos Def ψ t = ∃ x1 · · · xn (ψ s1 (x1 ) ∧ · · · ∧ ψ sn (xn ) ∧ ϕf (x)). 320 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 321 ✐ ✐ Conjuntos y modelos. Curso avanzado Así que T(L′ ) |= fs1 · · · sn =x ˙ ⇔ ψt . (48) T(L′ ) |= ∃ x1 · · · xn (ψ s1 (x1 ) ∧ · · · ∧ ψ sn (xn )). (49) T(L′ ) |= fs1 · · · sn =x ˙ ∧ x1 =s ˙ 1 ∧ · · · ∧ xn =s ˙ n ⇒ fx1 · · · xn =x. ˙ (50) Para demostrar la ecuación 48, observe que por la ecuación 46 tenemos Por otra parte, también es cierto De las ecuaciones 46, 47 y 50 concluimos que T(L′ ) |=(fs1 · · · sn =x ˙ ∧ ∃ x1 · · · xn (ψ s1 (x1 ) ∧ · · · ∧ ψ sn (xn )) ⇒ ∃ x1 · · · xn (ψ s1 (x1 ) ∧ · · · ∧ ψ sn (xn ) ∧ ϕf (x) ), que, junto con la ecuación 49, da lugar a T(L′ ) |= (fs1 · · · sn =x) ˙ ⇒ ψt . Para la dirección opuesta observe que por las ecuaciones 45 y 46 tenemos T(L′ ) |= ϕf (x) ⇒ fx1 · · · xn =x. ˙ Así que T(L′ ) |= ∃ x1 · · · xn (s1 =x ˙ 1 ∧ · · · ∧ sn =x ˙ n ∧ ϕf (x) ) ⇒ fs1 · · · sn =x ˙ que, junto con 50, implican Si f ∈ F, hacemos T(L′ ) |= ψ t ⇒ fs1 · · · sn =x. ˙ ˙ ψ t = ∃ x1 · · · xn (ψ s1 (x1 ) ∧ · · · ∧ ψ sn (xn ) ∧ fx1 · · · xn =x) y podemos demostrar, como antes, que T(L′ ) |= fs1 · · · sn =x ˙ ⇔ ψ t . Esto termina la prueba de la ecuación 45. Ahora probamos: para una fórmula atómica Pt1 · · · tn existe una L(T)fórmula ψ tal que T(L′ ) |= Pt1 · · · tn ⇔ ψ. (51) T(L′ ) |= ∀ x1 · · · xn (Px1 · · · xn ⇔ ϕP ). (52) Si P ∈ / R, existe una L(T )-fórmula ϕP (x1 , . . . , xn ) con lib(ϕP ) = {x1 , . . . xn } y 321 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 322 ✐ ✐ 5. Teoría de modelos Hacemos Def ψ = ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn ) ∧ ϕP ) y si P ∈ R, podemos simplemente definir ϕP = Px1 · · · xn , es decir, Def ψ = ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn ) ∧ Px1 · · · xn ), donde ψ ti son las fórmulas dadas por la ecuación 47. Por consiguiente, ya que y T(L′ ) |= Pt1 · · · tn ⇔ ψ, T(L′ ) |= ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn )) T(L′ ) |=Pt1 · · · tn ∧ ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn )) ⇒ ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn ) ∧ ϕP ). De acuerdo con las ecuaciones 46 y 52, es cierto que T(L′ ) |= Pt1 · · · tn ⇒ ψ, y la dirección opuesta también es válida pues T(L′ ) |= ∃ x1 · · · xn (ψ t1 (x1 ) ∧ · · · ∧ ψ tn (xn ) ∧ ϕP ) ⇒ Pt1 · · · tn por las ecuaciones 52 y 46. De la ecuación 51 obtenemos: para cualquier L′ -fórmula ϕ existe una L(T)-fórmula ϕT tal que T(L′ ) |= ϕ ⇔ ϕT (53) definiendo ϕT recursivamente mediante las cláusulas: 1. (Pt1 · · · tn )T = ψ, donde ψ está dada en la ecuación 51. 2. (ϕ ∧ ψ)T = ϕT ∧ ψ T . 3. (¬ϕ)T = ¬(ϕT ). 4. (∃ xϕ)T = ∃ x(ϕT ). Por un sencilla inducción sobre la construcción de ϕ, se puede demostrar la ecuación 53. Corolario 8.7. Sea T(L′ ) una extensión de T por definiciones. Para toda L′ -fórmula ϕ existe una L(T)-fórmula ϕT tal que T(L′ ) |= ϕ si y sólo si T |= ϕT . 322 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 323 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Tomemos ϕT como en el teorema 8.6. Entonces T(L′ ) |= ϕ si y sólo si ϕT . (54) Así que si T(L′ ) |= ϕ, entonces T(L′ ) |= ϕT que implica T |= ϕT por el teorema 8.5, pues ϕT es una L(T)-fórmula. Por otra parte, si T |= ϕT , entonces T(L′ ) |= ϕT , de donde se deduce que T(L′ ) |= ϕ por la ecuación 54. 9. Categoricidad Una teoría es categórica para un cardinal λ o λ-categórica si tiene exactamente un modelo de cardinalidad λ (salvo isomorfismos). Una L-teoría es categórica si es categórica en una cierta cardinalidad ≥ |L|. Una L-teoría es totalmente categórica si posee un modelo infinito y en cada cardinalidad tiene exactamente un modelo (salvo isomorfías). Una L-teoría es totalmente categórica (de acuerdo con el Corolario 7.3) si y sólo si es categórica en toda cardinalidad λ ≥ |L| y en toda cardinalidad λ < |L| en la que tenga modelo. En particular, una teoría totalmente categórica es categórica. El siguiente teorema se debe a Łoś [Loś54] y Vaught [Vau54]. Teorema 9.1 (Prueba de Łoś-Vaught). Una teoría categórica es completa si y sólo si tiene únicamente modelos infinitos. Demostración. Una teoría categórica completa no puede tener modelos finitos (Corolario 6.27), ya que por definición tiene modelos infinitos y éstos no pueden ser elementalmente equivalentes a modelos finitos (véase el Teorema 6.26). Para la otra dirección, sea T una L-teoría λ-categórica con λ ≥ |L| que sólo posee modelos infinitos, y supongamos que A, B |= T. Del teorema 6.27 sabemos que basta probar que A ≡ B. Por el teorema de Löwenheim-Skolem (Corolario 7.3) escogemos estructuras A′ ≡ A, B′ ≡ B con |A′ | = |B′ | = λ. Por la λ-categoricidad de T A′ y B′ son isomorfos, y en consecuencia A′ ≡ B′ . De aquí se sigue A ≡ B. Otra forma de enunciar el criterio de Tarski-Vaught es la siguiente: Una teoría T que no tiene modelos finitos y es κ-categórica para alguna κ ≥ |L| es completa. Presentamos la siguiente aplicación a la teoría de campos algebraicamente cerrados. 323 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 324 ✐ ✐ 5. Teoría de modelos Recuerde que la característica de un campo es el número primo p menor tal que 1| + ·{z · · + 1} = 0, p sumandos suponiendo que tal p existe; si no existe tal p, el campo tiene característica 0. Por ejemplo, Q, R y C tiene característica 0. Los campos de característica p incluyen a los campos Fp de tamaño p (los campos primos de Galois). Teorema 9.2. La teoría de los campos algebraicamente cerrados de característica cero es completa. De hecho, el teorema es cierto para la característica arbitraria p; véase por ejemplo [PiVi99]. Demostración. La demostración se obtiene inmediatamente del teorema 9.1 y del siguiente lema. Lema 9.3. Dos campos algebraicamente cerrados de característica cero y cardinalidad ℵ1 son isomorfos. Demostración. Sea A un campo con esas características que contiene los racionales Q = hQ, +, ·, 0, 1i, 3 como un subcampo primo. En forma similar a como se encuentra una base para un espacio vectorial, podemos encontrar una base trascendente para A, es decir, un conjunto {aα : α ∈ I} ⊆ A tal que A es la cerradura algebraica del subcampo A′ generado por {aα : α ∈ I}, pero ningún aβ está en la cerradura algebraica del subcampo generado por los restantes: {aα : α ∈ I ∧ α 6= β}. Ya que el subcampo generado por un subconjunto numerable es numerable y la cerradura algebraica de un subcampo numerable también es numerable, debemos tener que la base trascendente es no numerable. Puesto que |A| = ℵ1 , de hecho debemos tener que |I| = ℵ1 . Ahora sea B otro campo algebraicamente cerrado de característica 0 y de cardinalidad ℵ1 . Como antes, obtenemos una base trascendente {bβ : β ∈ J} 3 Sea Fp el campo que se genera de Zp mediante multiplicación de congruencias. Estos campo se llaman campos primos de característica p; Q es un campo primo de característica 0. Recuerde que todo campo de característica 0 contiene un subcampo isomorfo a Q. Todo campo de característica p (p un número primo) contiene un subcampo isomorfo a Fp . 324 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 325 ✐ ✐ Conjuntos y modelos. Curso avanzado con |J| = ℵ1 y su subcampo generado B′ . Como |I| = |J|, existe una biyección g:I− → J que podemos usar para construir un isomorfismo de A a B. Como B tiene característica 0, los racionales se encajan en B. Sea f : Q ֒→ B el encaje. Extendemos f como sigue: para cada α ∈ I, sea f (aα ) = bg(α) , que transforma la base trascendente de A en la base trascendente de B. Ahora extendemos f a una función de A′ sobre B′ : cada elemento de A′ está dado por p(aα1 , . . . , aαm ) , q(aα1 , . . . , aαm ) donde p y q son polinomios con coeficientes racionales y las a son miembros de la base trascendente. Supongamos que f transforma dicho elemento en p(ag(α1 ) , . . . , ag(αm ) ) q(ag(α1 ) , . . . , ag(αm ) donde p y q son polinomios cuyos coeficientes son las imágenes respecto a f de los coeficientes racionales de p y q. La extensión final de f a A y B se obtiene de la unicidad de las cerraduras algebraicas. Teorema 9.4. Sea Σ′ un conjunto de enunciados en el lenguaje de la teoría de campos que son ciertos en campos algebraicamente cerrados de característica arbitrariamente grande. Entonces Σ′ es cierto en algún campo algebraicamente cerrado de característica cero. Demostración. Es una consecuencia obvia del teorema 4.6. Ejemplo 9.5. Sea C el campo de los números complejos. Toda función polinomial inyectiva f : Cm − → Cm es sobre, donde una función polinomial es una función de la forma f (x1 , . . . , xm ) = (p1 (x1 , . . . , xm ), . . . , pm (x1 , . . . , xm )) y cada pi es un polinomio en las variables x1 , . . . , xm . El grado de f se define como grad(f ) = máx{grad(pi ) : 1 ≤ i ≤ m}. Sean L = LAr y Λm,n el L-enunciado que expresa que “cada función polinomial de m variables de grado < n e inyectiva es sobre”. Queremos probar que existen campos algebraicamente cerrados de característica arbitrariamente grande que satisfacen Σ = {Λm,n : m, n ∈ N} para aplicar los teoremas 9.2 y 9.4 y el hecho de que C es un campo algebraicamente cerrado. 325 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 326 ✐ ✐ 5. Teoría de modelos Sea p un número primo y Fp el campo primo de Galois de tamaño p. La cerradura algebraica Fp es la unión numerable de una cadena de campos finitos: Fp = A0 ⊆ A1 ⊆ A2 ⊆ · · · ⊆ Ak ⊆ Ak+a ⊆ · · · que se obtiene recursivamente añadiendo raíces de polinomios. Para cualquier función polinomial f : (Fp )m − → (Fp )m inyectiva y elementos b1 , . . . , bm ∈ Fp , existe algún Ak que contiene todos los b1 , . . . , bm así como m → Am es una todos los coeficientes de f . Como f es inyectiva, f ↾ Am k : Ak − k m función polinomial inyectiva, por lo que, en vista de que Am k es finito, f ↾ Ak es sobre y existen a1 , . . . , am ∈ Ak tales que f (a1 , . . . , am ) = (b1 , . . . , bm ). Así que para cada número primo p y cualesquier m, n ∈ N, Λm,n es verdadera en un campo de característica p, es decir, hF̃p , +, ·, 0, 1i satisface Σ. Ejemplo 9.6. (1) Si consideramos el lenguaje L= , es decir, el que sólo tiene la 2-relación = y la teoría asociada T= de todos los conjuntos (vistos como L= -estructuras), tendremos un ejemplo de una teoría totalmente categórica (y posee exactamente un modelo en cada cardinalidad finita distinta de 0 [salvo isomorfismos]). T∞ = también es totalmente categórica, y en consecuencia completa. (2) [Cantor] La teoría de los órdenes lineales densos sin extremos es ℵ0 categórica y por lo tanto completa, pues posee modelos infinitos: sean A y B modelos numerables de la teoría de los ordenes lineales densos (pág. 207). Para simplificar denotamos las relaciones de orden en ambas estructuras mediante <. Sean A = {an : n < ω} y B = {bn : n < ω}, donde, sin pérdida de generalidad, podemos suponer que am 6= an y bm 6= bn para → B, “viajando” entre m 6= n. Definimos recursivamente una función A − A y B: Etapa 1. “Ida”: n < ω es par. Hacemos Def An = {k < ω : h(ak ) ya está definido} y k(n) = mín(ω \ An ). Definimos h(ak ). Para esto distinguimos tres casos: (1a) ak(n) < ak para todo k ∈ An . Ya que B tiene un menor elemento, existe un menor l(n) < ω con bl(n) < h(ak ) para toda k ∈ An . Hacemos h(ak(n) ) = bl(n) . (1b) ak(n) > an para toda k ∈ An . Este caso se maneja en forma similar al caso (1a). 326 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 327 ✐ ✐ Conjuntos y modelos. Curso avanzado (1c) Existen k1 , k2 ∈ An con ak1 < ak(n) < ak2 . Escogemos k1 , k2 ∈ An de tal forma que ak1 < ak(n) < ak2 y no existe ningún elemento ak con k ∈ A − n entre ak1 y ak2 . Por la densidad del orden en B y puesto que h ↾ {ak : k ∈ An } respeta el orden por definición, existe un l < ω con Def h(ak1 ) < bl < h(ak2 ). Sea l(n) el menor de tales l; hacemos h(ak(n) ) = bl(n) . Con esto concluimos la etapa de “ida”. Etapa 2. “vuelta”: n < ω es impar. Hacemos Bn = {l < ω : bl ∈ Def {h(ak(m) : m < n}} y l(n) = mín(ω \ Bn ). Definimos h−1 (bl(n) ). Aquí distinguimos tres casos: Caso (2a): bl(n) < bl para todo l ∈ Bn . En forma dual existe un índice Def menor k(n) con ak(n) < h−1 (bl ) para todo l ∈ Bn ; hacemos h(ak(n) ) = bl(n) . Caso (2b) bl(n) > bl para todo l ∈ Bn . Este caso se trata como el caso (2a). Caso (2c) existen l1 , l2 ∈ Bn con bl1 < bl(n) < bl2 . Escogemos (dual al caso (1c)) l1 , l2 ∈ Bn con bl1 < bl(n) < bl2 y {bl : l ∈ B − n} ∩ {b ∈ B : bl1 < b < bl2 } = ∅ y encontramos un menor k(n) < ω con h−1 (bl1 ) < Def ak(n) < h−1 (bl2 ). Hacemos h(ak(n) ) = bl(n) . Con esto concluimos la etapa de “vuelta”. Se verifica fácilmente que h es una biyección entre A y B que respeta el orden. El lector debe observar que el razonamiento que acabamos de desarrollar no se puede generalizar a cardinalidades no numerables. Si κ > ℵ0 , ΦOLD tiene la mayor cantidad posible (2κ ) de modelos no isomorfos: para acotar el número de clases isomorfas de estructuras de un lenguaje L, basta determinar cuántas L-estructuras existen que tienen como universo a κ. Se cálcula fácilmente que la cantidad está acotada por 2κ cuando κ ≥ |L|. De hecho, lo anterior ocurre para cada teoría que contenga los axiomas de un orden lineal. Este resultado se desprende un teorema de Shelah [Sh71]. Łoś conjeturó (1954) que si una teoría en un lenguaje numerable es categórica en una cardinalidad no numerable, también es categórica en cualquier otra cardinalidad no numerable. Morley [Mor65] demostró que la conjetura de Łoś es cierta. Así que para teorías completas numerables sólo hay tres posibilidades en categoricidad: ℵ0 -categoricidad, pero no categoricidad no numerable; categoricidad no numerable (λ-categoricidad para toda λ > ℵ0 ), pero no categoricidad numerable; y categoricidad total (categoricidad en toda cardinalidad infinita). La demostración y una discusión más amplia se presentan en el segundo volumen. 327 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 328 ✐ ✐ 5. Teoría de modelos 10. La teoría ΦAP y la teoría Teo(N) Definición 10.1. (1) Sea A un modelo de la aritmética, es decir, de Teo(N). Los elementos finitos o estándar de A son los elementos de la forma a = nA , para algún número natural n; los elementos restantes se llaman no estándar o infinitos. (2) Para cualquier modelo A de Teo(N), sea Af = {a ∈ A : a es finito } = {nA : n ∈ N}. (3) Un modelo A de Teo(N) es estándar si carece de elementos no estándar. En otro caso es un modelo no estándar. Construiremos un modelo no estándar de la aritmética, es decir, una estructura elementalmente equivalente a la estructura hN, +, ·, 0, 1i de los número naturales, pero no isomorfa a ella. Para estudiar con mayor facilidad esta estructura, “expandemos” N con la 2-relación del orden natural <, y añadimos ◦ una constante n para cada natural n que, por supuesto, se interpretará como n. Obtenemos una estructura N′ : ◦ N′ = hN, <, +, ·, 0, 1, hn : n < ωii. Escogemos para cada n < ω un nuevo símbolo de constante cn , y entonces el conjunto ◦ Def Ψ = Teo(N′ ) ∪ {Rnc0 : n < ω} ∪ {Rcm cn : m < n < ω}, donde R se interpreta como < es finitamente satisfacible: todo subconjunto finito está contenido en un conjunto de la forma ◦ Def Ψ(N) = Teo(N′ ) ∪ {Rnc0 : n < N} ∪ {Rcm cn : m < n < N}, donde N < ω. Expandimos N′ a una estructura N′′ interpretando cn como N + n, para obtener un modelo de Ψ(N). Supongamos que A |= Ψ y que B es el LAr -reducto de A. Puesto que ΦAP ⊆ Teo(N) ⊆ Ψ, se cumple que B |= ΦAP y B es elementalmente equivalente a N. Hacemos Def ◦A X = {n : n < ω}, Def Y = {cnA : n < ω} y denotamos el orden en B otra vez con <. Con esto B tiene la siguiente forma 0| A < 1A < 2{zA < 3A < · · }· < · · · < c0A < c1A < c2A < c3A < · · · < · · · | {z } =X =Y 328 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 329 ✐ ✐ Conjuntos y modelos. Curso avanzado El conjunto X contiene al 0 y es cerrado respecto a sucesores, pero X 6= B. X no se puede definir mediante una fórmula de ΦAP , pues obtendríamos una contradicción con el esquema de inducción de ΦAP . A continuación constatamos que B es un modelo no estándar de la aritmética, y en consecuencia N y B no son isomorfos. Ya que una isomorfía es un encaje sobre, nuestra afirmación es una consecuencia inmediata de ◦A Si h : N ֒→ B, se cumple h(n) = n . En particular h no es sobre. (*) Demostración de (*). Por inducción sobre n: n = 0. Ya que 0 es un símbolo de constante de LAr , h(0) = h(0N ) = 0B = 0A . n = 1. En forma similar, se deduce que h(1) = 1A . ◦ ◦B ◦ ◦B n = m + 1. Puesto que n = f+ m1 ∈ Teo(N′ ), se cumple que n = m ⊕ 1B , donde ⊕ denota la suma en B. Puesto que h, que es un morfismo, conmuta con la suma en N y en B, se deduce que ◦A ◦A h(n) = h(m + 1) = h(m) ⊕ h(1) = m ⊕ 1A = n . con lo que queda demostrado (*).◭ En vista del teorema de Löwenheim-Skolem decreciente, podemos suponer que B es numerable, con lo que hemos demostrado: Teorema 10.2 (Teorema de Skolem). Existen modelos numerables no estándar de la aritmética. Una pregunta natural es ¿qué relación existe entre ΦAP y Teo(N)? Por supuesto, Teo(N) |= ΦAP . ¿Será cierto también ΦAP |= Teo(N)? Si éste fuera el caso tendríamos una axiomatización de Teo(N) (respectivamente, de la clase de modelos determinada por Teo(N)). Sin embargo, la pregunta se debe contestar con un no, e incluso se puede mostrar algo más: Teo(N) no tiene un sistema de axiomas Φ tal que para ϕ ∈ Fml0 (LAr ) mediante un algoritmo finito se puede decidir en un número finito de etapas si ϕ ∈ Φ o no. En particular no existe un algoritmo que decida si tal enunciado es cierto o no en N (es decir, si pertenece o no a Teo(N)). ΦAP no es completa y, por lo tanto, no es κ-categórica para κ ≥ ℵ0 . De ΦAP 6|= Teo(N) se desprende la existencia de un modelo A de ΦAP y un ϕ ∈ Teo(N) con A |= ΦAP ∪ {¬ϕ}. Por otro lado, ΦAP ∪ {ϕ} es consistente como subconjunto de Teo(N). Así que no puede ocurrir ΦAP ⊢ ϕ y tampoco ΦAP ⊢ ¬ϕ. Un ejemplo de un enunciado “matemático” ϕ, válido en N pero 329 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 330 ✐ ✐ 5. Teoría de modelos que no se puede derivar de ΦAP , resultó muy dificil de desarrollar. Fue logrado en los años 70 por J. Paris y L. Harrington [PaHa77]. Ellos desarrollaron una generalización del teorema de Ramsey, que es cierta en N pero que no se puede derivar de ΦAP . Teorema 10.3. (a) Para todo modelo estándar A de Teo(N) existe un único isomorfismo f : N − → A. (b) Ningún modelo no estándar es isomorfo a N. Demostración. (a) Sea A un modelo estándar de la aritmética. Puede haber a lo sumo un isomorfismo de N a A: si f : N − → A, debemos tener A A f (0) = 0 , f (1) = 1 , etc. Por lo tanto, definimos la función i de N a A por i(n) = nA , para todo número natural n. La función i es una biyección: como A es un modelo estándar, i es sobre. Si n y m son dos números naturales distintos, entonces n 6= m; en consecuencia, N |= n 6= m, por lo que nA 6= mA , así que i(n) 6= i(m). Por consiguiente, i es inyectiva La biyección i es un isomorfismo: mostraremos que i(n+m) = i(n)+A i(m), dejando la formulación y prueba de las afirmaciones correspondientes para ·, <, al lector. Sea k = n + m. Entonces N |= k = n + m y kA = nA +A mA , así que i(k) = i(m) +A i(n). Esto completa la prueba de (a). (b) Suponga que f : A − → N es un isomorfismo. Como A no es estándar, existe a ∈ A tal que para todo número natural n, a 6= nA . Sea f (a) = k. Entonces f (a) 6= kA , así que N |= (f (a) 6= k), o N |= k 6= k, lo cual es una contradicción. 10.0.1. Estructura de los modelos no estándar. En este apartado establecemos que hay muchos modelos no estándar de Teo(N). Sin embargo, todos ellos comparten una estructura básica. Para analizar A, debemos tener en cuenta que todo enunciado que es válido en N también es válido en A. Recíprocamente, si ϕ no es válida en N, entonces ¬ϕ es válida en N y por lo tanto en A, así que ϕ no es válida en A. En resumen, para todo enunciado ϕ, A |= ϕ si y sólo si N |= ϕ. 330 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 331 ✐ ✐ Conjuntos y modelos. Curso avanzado La diferencia entre A y N radica en el hecho de que algunas propiedades de N no son expresables en LAr . Por ejemplo, considere la 1-operación S y añádala a la signatura de LAr ; la fórmula ∀ x(x = 0 ∨ x = S(0) ∨ x = S(S(0)) ∨ · · · ) es válida en N si interpretamos S como el sucesor S(n) = n + 1, pero no lo es en Teo(N), pues S no está en LAr . Sabemos mucho acerca de los elementos estándar de A, porque ellos se representan mediante términos constantes, así que existen enunciados que se refieren a ellos. Por ejemplo, si a = (SS0)A , b = (SSSS(0))A , es cierto que a+A a = b. Pero conocemos muy poco sobre los elementos no estándar, porque no tenemos enunciados que los refieran, excepto mediante cuantificadores. Por ejemplo, para todo elemento (estándar o no) a se sabe que a ≥ 0A . Para el resto de este apartado, fijemos un modelo no estándar A, y sea N el modelo estándar. Defina i : N − → A por i(n) = (S n (0))A . De acuerdo con el ejercicio (50), i es un isomorfismo entre N y Af = hAf , +, ·, 0, Si (donde S realmente es la función S A restringida a Af ; lo mismo ocurre para las funciones restantes). Proposición 10.4. Si a ∈ Af , b ∈ A − Af , entonces a <A b. Demostración. Requerimos la siguiente notación: sea x una variable, para todo número natural n definimos una fórmula ψn con variable libre x. Sea Def ψ0 la fórmula x 6= 0. Si ψn ya está definida, sea ψn+1 = (ψn ∧ x 6= S n+1 0). Por ejemplo, ψ3 es la fórmula x 6= 0 ∧ x 6= S0 ∧ x 6= SS0 ∧ x 6= SSS0. En lugar de ψn escribimos (x 6= 0 ∧ · · · ∧ x 6= S n 0). Note que para cualquier número natural n N |= ∀ x((x 6= 0 ∧ · · · ∧ x 6= S n 0) ⇔ x > S n 0). La prueba de este hecho se efectúa por inducción sobre n; es muy sencilla y se deja al lector. Sea a = (S n 0)A , donde n ∈ N es un número natural. Tenemos entonces N |= ∀ x(x 6= 0 ∧ x 6= S0 ∧ · · · ∧ x 6= S n 0 ⇒ x > S n 0), 331 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 332 ✐ ✐ 5. Teoría de modelos por lo que A |= ∀ x(x 6= 0 ∧ x 6= S0 ∧ · · · ∧ x 6= S n 0 ⇒ x > S n 0); así, en particular A |= (b 6= 0 ∧ b 6= S0 ∧ · · · ∧ b 6= S n 0 ⇒ b > S n 0). Como A |= (b 6= 0 ∧ b 6= S0 ∧ · · · ∧ b 6= S n 0), deducimos que A |= (b > S n 0), es decir, A |= b > a. Sea LAra el lenguaje asociado a la signatura σ ′ , donde σ ′ es la signatura del lenguaje LAr junto con el símbolo de función S (la función sucesor). Proposición 10.5. Sea ϕ(x) una LAra -fórmula; entonces: (a) A |= ϕ[a] para toda a ∈ Af si y sólo si A |= ϕ[b] para toda b ∈ A. (b) A |= ϕ[b] para alguna b ∈ A−Af si y sólo si A |= ϕ[a] para una cantidad infinita de a ∈ Af . (c) A |= ϕ[b] para toda b ∈ A − Af si y sólo si A |= ϕ[a] para toda a ∈ Af excepto una cantidad finita. Demostración. (a) Se cumplen las siguientes equivalencias: A |= ϕ[a] para toda a ∈ Af ⇔ para toda n ∈ N, A |= ϕ(S n 0) ⇔ para toda n ∈ N, N |= ϕ(S n 0) ⇔ para toda n ∈ N, N |= ϕ(n) ⇔ N |= ∀ xϕ(x) ⇔ A |= ∀ xϕ(x). (b) Se sigue de (c). 332 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 333 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Se tienen las siguientes equivalencias: Para toda b ∈ A − Af , A |= ϕ(b) ⇒ para toda b ∈ A − Af , A |= (∀ x(x > b ⇒ ϕ(x))) ⇒ existe b ∈ A, A |= (∀ x(x > b ⇒ ϕ(x))) ⇒ A |= ∃ y∀ x(x > y ⇒ ϕ(x)) ⇒ N |= ∃ y∀ x(x > y ⇒ ϕ(x)) ⇒ existe k ∈ N tal que para toda n > k, n ∈ N, N |= ϕ(k). Recíprocamente, si para toda n > k, N |= ϕ(n), entonces N |= ∀ x(x > S k 0 ⇒ ϕ(x)) implica A |= ∀ x(x > S k 0 ⇒ ϕ(x)), así que para toda b ∈ A − Af es cierto que A |= ϕ[b]. Corolario 10.6. La expresión “x es finito” no se puede describir mediante una LAr -fórmula. Demostración. Suponga que ϕ(x) es una fórmula tal que para toda a ∈ A, A |= ϕ[a] si y sólo si a ∈ Af . Esto contradice la proposición 10.5(a). Definición 10.7. Sea s = S A : A − → A la función sucesor de A, y defina la función predecesor p : A − → A por p(a) = ( b, 0, si y sólo si A |= a > 0, y s(b) = a si a = 0A . Ésta es una definición correcta, pues por lo que N |= ∀ x(x 6= 0 ⇒ ∃ !ySy = x), A |= ∀ x(x 6= 0 ⇒ ∃ !ySy = x). Ya hemos definido una función predecesor en A, pero también podemos definir una sustracción: la fórmula ∀ x∀ y(x ≤ y ⇒ ∃ !zx + z = y) pertenece a Teo(N), así que es válida en A. Por lo tanto, para toda a ≤ b ∈ A, A |= ∃ !z(a + z = b), por lo que podemos hacer b − a = el único c ∈ A que satisface A |= a + c = b. 333 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 334 ✐ ✐ 5. Teoría de modelos En forma similar, podemos extender todas las demás funciones definibles de N a A. También relaciones que son definibles mediante fórmulas se pueden extender en forma natural de N a A. En A podemos definir las siguientes relaciones: Definición 10.8. x∼y ⇔ para algún número natural n, sn (x) = y, o sn (y) = x. Proposición 10.9. (1) ∼ es una relación de equivalencia. (2) 0 ∼ x si y sólo si x ∈ Af . Por consiguiente, la relación ∼ no es definible por ninguna fórmula en nuestro lenguaje. (3) Todas las clases de equivalencia son convexas, es decir, si a < b < c y a ∼ c, entonces a ∼ b. Demostración. (1) y (2) son inmediatos y se dejan como ejercicio al lector. Si hubiese una fórmula ϕ(x, y) tal que A |= ϕ[a, b] ⇔ (a ∼ b), entonces se cumpliría a ∈ Af ⇔ A |= a ∼ 0, lo que contradice el corolario 10.6. (3) Suponga que A |= S n a = c. (S n c = a es imposible, pues A |= S n c = a ⇒ c ≤ a). Puesto que N |= ∀ x∀ y∀ z[x < y < z ∧ S n x = se debe cumplir z ⇒ (y = Sx ∨ y = SSx ∨ · · · ∨ y = S n−1 x)], A |= a < b < c ∧ S n a = c ⇒ (b = Sa ∨ b = SSa ∨ · · · ∨ b = S n−1 a). (Note que la fórmula en la línea precedente se debe definir por inducción sobre n.) Definición 10.10. (1) Dado a ∈ A, sea a/ ∼ la clase de equivalncia de a: a/ ∼= {b ∈ A : a ∼ b}. (2) Sea A/ ∼ el conjunto de todas las clases de equivalencia: A/ ∼= {a/ ∼: a ∈ A}. 334 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 335 ✐ ✐ Conjuntos y modelos. Curso avanzado Como las clases de equivalencia son convexas, podemos definir un orden lineal en las clases de equivalencia. Definición 10.11. Sean A, B dos clases de equivalencia distintas. Decimos que A < B si para algún elemento a ∈ A y para algún elemento b ∈ B se cumple a < b. Para cualesquier dos clases de equivalencia A, B, escribimos A ≤ B si A < B o A = B. Proposición 10.12. Si A < B son dos clases de equivalencia como en la definición 10.11, se cumple que para toda a ∈ A y para toda b ∈ B: a < b. Así que podemos definir: a/ ∼< b/ ∼ si y sólo si a 6∼ b, y a < b. Demostración. Suponga que no se cumple la afirmación de la proposición; entonces b < a y a0 < b0 , donde a, a0 ∈ A, b, b0 ∈ B. Tenemos dos casos: b < a0 , entonces b < a0 < b0 , así que por la proposición 10.9(3) debe presentarse la situación a ∼ b y A = B, una contradicción. El otro caso es b > a0 ; entonces a0 < b < a y otra vez A = B. Proposición 10.13. (1) Si a pertenece a Af , entonces a/ ∼= Af ∼ = N. (2) Si a ∈ A − Af , ha/ ∼, <, si es isomorfo a hZ, <, σi, donde Z son los enteros, s es la restricción de S A a a/ ∼ y σ es la función sucesor en los enteros. Demostración. (1) Se deja como ejercicio al lector. (2) La clase a/ ∼ contiene exactamente los elementos . . . , p2 (a), p(a), a, s(a), s2 (a), . . . , y considere la función que transforma elementos positivos n ∈ Z en sn (a), los enteros negativos −n en pn (a) y cero en a. Esta función respeta la relación < y la función sucesor. Note, sin embargo, que este isomorfismo no es único, pues se puede elegir cualquier otro elemento b ∼ a como la imagen de 0. Además, Z tiene una estructura adicional que no se puede encontrar en a/ ∼. No existe un elemento distinguido en a/ ∼ que tome el papel del 0, y no existe operación que corresponda a la suma (o a la multiplicación) en Z. 335 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 336 ✐ ✐ 5. Teoría de modelos Teorema 10.14. (1) Para cualesquier a < b ∈ A, si a/ ∼< b/ ∼, entonces existe un elemento c ∈ A tal que a/ ∼< c/ ∼< b/ ∼. (2) A = hA/ ∼, <i tiene un primer elemento, pero no segundo elemento ni último elemento. Demostración. (1) Sea a < b. Como A |= ∀ x∀ y∃ z(z+z = x +y ∨z+ z = x + Sy), existe c ∈ A tal que A |= c + c = a + b o A |= c + c = a + Sb. Sin pérdida de generalidad podemos suponer que c + c = a + b (en otro caso, reemplazamos b por S A b en el resto de la demostración). Por lo tanto, c es la media aritmética de a y b. Mostraremos que a/ ∼< c/ ∼ (la prueba de c/ ∼< b/ ∼ es similar). Puesto que A |= ∀ x∀ y∀ z(x ≤ y ∧ z + z = x + y ⇒ x ≤ z), tenemos a ≤ c y, por consiguiente, a/ ∼≤ c/ ∼. Suponga, para llegar a una contradicción, que a/ ∼= c/ ∼. Entonces para algún número natural n, A |= S n a = c. Pero para toda n A |= ∀ x∀ y∀ z(x + y = z + z ∧ z = S n x ⇒ y = S 2n x), así que A |= b = S 2n a, a ∼ b, una contradicción. (2) Af es el primer elemento de A/ ∼, ya que A |= ∀ x¬(x < 0). No puede haber un segundo elemento porque para cualquier elemento infinito b ∈ A, por (1) existe c ∈ A tal que Af < c/ ∼< b/ ∼. Finalmente, dado a ∈ A−Af , a+a no puede estar en la misma clase que a, porque para todo número natural n, A |= ∀ x(x + x = S n x ⇒ x = S n 0). Como A |= a + a > a, no existe una clase de equivalencia que sea la menor de todas. Hemos demostrado que existen modelos no estándar y que cualesquier dos modelos estándar son isomorfos. ¿Será cierto también que cualesquier dos modelos no estándar son isomorfos? La respuesta es no. De hecho, hay “muchos” modelos numerables no isomorfos de Teo(N). Teorema 10.15. Existe una cantidad no numerable de modelos de Teo(N) no isomorfos entre sí. 336 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 337 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Dada una enumeración A0 , A1 , . . . de modelos de Teo(N), construiremos un modelo que no es isomorfo a ninguno de los que están en la lista. Para ello usaremos el hecho de que todo conjunto infinito tiene una cantidad no numerable de subconjuntos. Sea P ⊆ N el conjunto de los números primos. Para todo número natural n y cualquier a ∈ An sea An,a = {p ∈ P : An |= S p0 |a}, donde τ1 |τ2 es una abreviación de ∃ zτ1 · z = τ2 . Cada An,a es un subconjunto de P. An,a es el conjunto de aquellos primos que dividen a a en el modelo An . Note que An,a puede ser finito o infinito. Para cada n existe una cantidad numerable de conjuntos An,a y, como hay una cantidad numerable de naturales, el conjunto {An,a : a ∈ An , n ∈ N} es numerable. Pero sabemos que existe una cantidad no numerable de subconjuntos de P. De aquí que exista un conjunto B ⊆ P que es diferente de cualquiera de los An,a . Fijemos ese conjunto B. Entonces B⊆P y ∀ n ∈ N∀ a ∈ An B 6= An,a . Dado este conjunto B, construiremos un modelo de Teo(N) que no es isomorfo a ningún An . Sea L′ el lenguaje L expandido mediante un símbolo de constante c. Sea Γ = Teo(N) ∪ {S p 0|c : p ∈ B} ∪ {¬S p 0|c : p ∈ P − B}. Γ es consistente: por el teorema de compacidad es suficiente mostrar que todo subconjunto finito es consistente. Sea Γ0 ⊆ Γ finito. Mostraremos que Γ0 es consistente. Existe una cantidad finita de primos p ∈ B tales que la fórmula S p 0|c pertenece a Γ0 . Sea n el producto de esos primos. Definimos un L′ modelo A mediante A ↾ L = N y cA = n. Es claro que A |= Teo(N), por lo que para probar A |= Γ0 debemos mostrar A |= Γ0 ∩ ({S p |c : p ∈ B} ∪ {¬S p |c : p ∈ / B}). Para p ∈ / B, sabemos que p ∤ n, así que A |= (p ∤ n). Si p ∈ B, ∈ Γ0 , entonces por definición p|n, así que A |= p|n. Por lo tanto, Γ es consistente. (S p 0|c) 337 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 338 ✐ ✐ 5. Teoría de modelos Sean A un modelo de Γ y b = cA . Para finalizar la prueba del teorema, mostremos que A ↾ L no es isomorfo a ningún An . Suponga que f : A − → An es un isomorfismo. Sea a = f (b). Entonces para toda p ∈ P, p ∈ B ⇔ A |= (S p 0)|c ⇔ A |= (S p 0)|b ⇔ An |= (S p 0)|a ⇔ p ∈ An,a . En consecuencia, B = An,a , lo que contradice la elección de B. 11. Aplicaciones a la teoría de gráficas En esta sección usaremos los hechos que se presentaron en este capítulo para trabajar en el ámbito de la teoría de gráficas (véase el Ejer. 4.68). La signatura que usaremos para la teoría de gráficas tiene un símbolo de 2relación E. Sea L el lenguaje asociado a esta signatura. La L-teoría de gráficas contiene los siguientes axiomas, denotados con ∆: (1) ∀ x∀ yExy ⇔ Eyx (2) ∀ x¬Exx Una gráfica es, por supuesto, un modelo de la teoría de gráficas. Usaremos un famoso teorema de Appel y Haken que afirma que toda gráfica finita plana se puede 4-colorear. La teoría de modelos nos permitirá pasar a un contexto infinito. Recuerde que una gráfica plana es aquella que se puede encajar o dibujar en el plano euclideano, y que 4-colorear significa que a cada vértice de la gráfica se le puede asociar uno de 4 colores de tal forma que ningún borde tenga el mismo color en ambos extremos. Sea A una gráfica infinita plana. Introducimos 4 nuevos símbolos de 1relación R, G, B, Y para los cuatro colores. Queremos probar que existe una expansión A′ de A tal que A′ |= σ, donde σ es el siguiente enunciado en el lenguaje extendido: ∀ x[Rx ∨ Gx ∨ Bx ∨ Yx] ∧ ∀ x[Rx ⇒ ¬(Gx ∨ Bx ∨ Yx)] ∧ · · · ∧ ∀ x∀ y¬(Rx ∧ Ry ∧ Exy)) ∧ · · · que nos asegura que la interpretación de R, G, B, Y 4-coloree la gráfica. 338 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 339 ✐ ✐ Conjuntos y modelos. Curso avanzado Sea Σ = ∆ ∪ {σ}. Todo subconjunto finito de Σ tiene un modelo, basado en un subconjunto finito apropiado de A. Por el teorema de compacidad, obtenemos un modelo B con B |= Σ. Como B |= σ, las interpretaciones de R, G, B y Y 4-colorean B. Por el lema 6.16, A se encaja en el reducto C de B, y este isomorfismo proporciona la 4-coloración de A. Una gráfica con la propiedad de que toda pareja de vértices están conectados por un borde es completa. En el otro extremo, un gráfico sin bordes es discreto. Un teorema importante en combinatoria finita asegura que la mayoría de las gráficas contiene un ejemplo de una u otra subgráfica. Una subgráfica de una gráfica es un submodelo de la teoría de gráficas. Corolario 11.1 (Ramsey). Para cada n ∈ N existe un r ∈ N tal que si G es una gráfica con r vértices, entonces G contiene una subgráfica completa con n vértices o una subgráfica discreta con n vértices. Demostración. Afirmación 1. Cada gráfica infinita A contiene una subgráfica infinita completa o una subgráfica infinita discreta. Demostración de la afirmación 1. Es obvio que tenemos sólo dos posibilidades: (1) Existe un subconjunto infinito X ⊆ A tal que para todo x ∈ X existe un conjunto finito FX ⊆ X tal que Exy para toda y ∈ X − FX . (2) Para todo conjunto infinito X ⊆ A existe un x ∈ X y un conjunto infinito Y ⊆ X tal que ¬Exy para toda y ∈ Y . Si ocurre (1), escogemos recursivamente x1 ∈ X, x2 ∈ X − Fx1 , x3 ∈ A − (Fx1 ∪ Fx2 ), etc. para obtener una subgráfica infinita completa. Si ocurre (2), elegimos x0 ∈ A y Y0 ⊆ A con la propiedad, para que a continuación, mediante recursión, elijamos x1 ∈ Y0 y Y1 ⊆ Y0 , x2 ∈ Y1 y Y2 ⊆ Y1 , y así sucesivamente para obtener una subgráfica infinita discreta.◭ Ahora usamos la teoría de modelos para pasar del caso finito al infinito. Sea σ el enunciado de la teoría de gráficas que asegura que no existe una subgráfica completa de tamaño n. ∀ x1 · · · ∀ xn [¬Ex1 x2 ∨ ¬Ex1 x3 ∨ · · · ∨ ¬Exn−1 xn ]. Sea ψ el enunciado que asegura que no existen subgráficas discretas de tamaño n: ∀ x1 · · · ∀ xn [Ex1 x2 ∨ Ex2 x3 ∨ · · · ∨ Exn−1 xn ]. Sea Ψ el conjunto que consiste en σ, ψ y los axiomas de la teoría de gráficas. Si no existe una r como en el corolario de Ramsey, entonces Ψ tiene modelos 339 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 340 ✐ ✐ 5. Teoría de modelos finitos arbitrariamente grandes, por lo cual Ψ tiene un modelo infinito, lo que contradice la suposición. 12. Funciones de Skolem En esta sección presentamos un método de construir modelos mediante las llamadas funciones de Skolem. Dado un lenguaje L, lo expandemos a L∗ añadiendo nuevos símbolos de función. Sea F una función del conjunto de todas las fórmulas de la forma Def ψ = (∃ x)ϕ de L a un nuevo conjunto de símbolos de función Fψ . Supongamos que F es inyectiva y que si ψ tiene exactamente n variables libres, entonces Fψ es un símbolo de n-función (de Skolem). La expansión L ∪ {Fψ : ψ = (∃ x)ϕ, ϕ ∈ Fml(L)} es la expansión de Skolem de L, que se denotará en lo sucesivo por L∗ . Evidentemente, |L∗ | = |L|. La teoría de Skolem ΣL del lenguaje L en el lenguaje L∗ tiene los siguientes L∗ -enunciados como axiomas: sea ψ = (∃ x)ϕ una L-fórmula y suponga que lib(ψ) = {x1 , . . . , xn }. Sean y1 , . . . , yn variables que no aparecen en ψ. Entonces el enunciado ∀ y1 · · · ∀ yn (ψ(y1 , . . . , yn ) ⇒ ϕ(Fψ (y1 , . . . , yn ), y1 , . . . , yn )), es un axioma de ΣL . Sea A una L-estructura. Una expansión A∗ de A es una expansión de Skolem de A si A∗ |= ΣL . Si T es un conjunto de L-enunciados, entonces la expansión de Skolem de T, que denotaremos T∗ , es la teoría que tiene como axiomas T ∪ ΣL , es decir, T∗ = Teo(Mod(T ∪ ΣL )). Proposición 12.1. (i) Todo L-modelo A tiene una expansión de Skolem A∗ . (ii) Si T es un conjunto consistente de L-enunciados, su expansión de Skolem T∗ es L∗ -consistente. (iii) Sean A, B L-estructuras y A∗ , B∗ sus respectivas L∗ -expansiones de Skolem. Si A∗ ⊆ B∗ , entonces A ≺ B. Demostración. (i) Sean A una L-estructura y ψ = (∃ x)ϕ. Supongamos que lib(ψ) = {x1 , . . . , xn }. Definimos la interpretación FψA como sigue: primero bien ordenamos A; después, si A |= ψ[a1 , . . . , an ], entonces 340 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 341 ✐ ✐ Conjuntos y modelos. Curso avanzado FψA (a1 , . . . , an ) es el primer elemento de A tal que A |= ϕ[a, a1 , . . . , an ], y si A 6|= ψ[a1 , . . . , an ], entonces FψA (a1 , . . . , an ) se elige arbitrariamente. Es fácil verificar que con esta interpretación obtenemos una expansión de Skolem A∗ de A. (ii) Se sigue inmediatamente de (i). (iii) Se sigue de la prueba TV (Teorema 6.21). Sean A∗ una expansión de Skolem de A y X ⊆ A. La envolvente de Skolem de X en A∗ es el conjunto más pequeño Y tal que X ⊆ Y ⊆ A, Y contiene todas las constantes de L y es cerrado respecto a todas las funciones en A∗ . Sea H(X) la envolvente de Skolem de X y es el universo de H(X), la subestructura generada por H(X) en A. Proposición 12.2. Sean A∗ una expansión de Skolem de A, X ⊆ A. Entonces la envolvente de Skolem H(X) es un submodelo elemental de A. Además, |H(X)| ≤ |X| + |L|. Demostración. Sea H(X)∗ la estructura generada por H(X) en A∗ . Es evidente que H(X)∗ ⊆ A∗ . Puesto que H(X)∗ es una expansión de H(X) en L∗ , el resultado se sigue de la proposición 12.1(iii). Un conjunto de L-enunciados Φ tiene funciones de Skolem incorporadas si y sólo si para toda fórmula ψ = (∃ x)ϕ con lib(ψ) = {x1 , . . . , xn } existe un L-término tψ (x1 , . . . , xn ) tal que Φ ⊢ ∀ y1 · · · ∀ yn (ψ(y1 , . . . , yn ) ⇒ ϕ(tψ (y1 , . . . , yn ), y1 , . . . , yn )), (55) donde las variables y1 , . . . , yn no aparecen en ψ o en tψ . Note que los términos tψ son precisamente Fψ . Proposición 12.3. Si un conjunto de L-enunciados Φ tiene funciones de Skolem incorporadas, entonces Φ es completa respecto a modelos; es decir, siempre que A, B son L-modelos de Φ y A ⊆ B, entonces A ≺ B. Demostración. Como A es una subestructura de B, A es cerrada respecto a todos los L-términos tψ . El resultado se sigue de la prueba TV. 341 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 342 ✐ ✐ 5. Teoría de modelos Proposición 12.4. Sea Φ un conjunto de L-enunciados. Entonces existen una expansión L de L y una extensión Φ de Φ (Φ es un conjunto de L-enunciados) tales que Φ tiene funciones de Skolem incorporadas. Más aún, todo modelo de Φ tiene una expansión que es un modelo de Φ. Demostración. Comenzamos con el lenguaje L = L0 para definir una sucesión creciente de expansiones Ln , mediante Ln+1 = (Ln )∗ . Note que para cada n, la teoría de Skolem ΣLn es un conjunto de Ln+1 -enunciados. S S Sea L = n<ω Ln y Φ el conjunto de axiomas Φ ∪ n<ω ΣLn . Puesto que toda L-fórmula involucra a lo sumo una cantidad finita de símbolos, notemos que Φ tiene funciones de Skolem incorporadas. Mediante la proposición 12.1 efectuamos inducción para probar que todo modelo de Φ tiene una expansión que es un modelo de Φ. Los términos tψ se llaman funciones de Skolem. Teorema 12.5. Supongamos que Φ es un conjunto de L-enunciados que tienen funciones de Skolem incorporadas. Módulo Φ, cada L-fórmula ϕ(~x) (~x no vacío) es equivalente a una L-fórmula ϕ(~x) sin cuantificadores. Demostración. Note que la fórmula ϕ(tψ (y1 , . . . , yn ), y1 , . . . , yn ) implica lógicamente ∃ xϕ(x, ~y), así que de hecho, en la ecuación 55 podemos escribir Φ ⊢ ∀ ~y(∃ x(ψ(x, ~y) ⇔ ϕ(tψ (~y), ~y). Con esta equivalencia, una simple inducción sobre la construcción de ϕ arroja el resultado deseado. Corolario 12.6. En la proposición 12.4 podemos añadir lo siguiente. Supongamos que ϕ(~x) es una L-fórmula prenexa de la forma Cψ(~x, ~y), donde C es la matriz de cuantificadores y ψ no tiene cuantificadores. Entonces ϕ es equivalente módulo Φ a una Π1 -fórmula θ(~x) tal que (a) θ es de la forma C′ ψ(~x, ~t), donde C′ consiste en los cuantificadores universales en C y ~t son L′ -términos. (b) ⊢ ∀ ~x(θ ⇒ ϕ) Demostración. Ejercicio. 342 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 343 ✐ ✐ Conjuntos y modelos. Curso avanzado 13. Más aplicaciones a campos Proposición 13.1. Sean R y S anillos (o módulos, o campos) y supongamos que existe una familia Φ de isomorfismos de subanillos (o submódulos, o subcampos) de R sobre subanillos (o submódulos, o subcampos) de S que satisface las siguientes condiciones: (i) Para cada ϕ ∈ Φ y cada r ∈ R, existe ϕ′ ∈ Φ que extiende a ϕ de tal forma que r ∈ dom ϕ′ . (ii) Para toda ϕ ∈ Φ y toda s ∈ S, existe ϕ′ ∈ Φ que extiende a ϕ de tal forma que s pertenece a ran ϕ′ . Entonces R y S son elementalmente equivalentes. Demostración. (Note que aparece el argumento de “ida y vuelta” de Cantor). Usaremos el hecho de que todo enunciado σ con variables x1 , . . . , xn se puede expresar en forma prenexa C1 x1 , · · · Cn xn ψ, donde Ci ∈ {∀ , ∃ } y ψ no tiene cuantificadores. Sin pérdida de generalidad podemos suponer que σ tiene la forma ∀ x1 ∃ y1 ∀ x2 ∃ y2 · · · ∀ xn ∃ yn ψ(x1 , y1 , . . . , xn , yn ), donde ψ no tiene cuantificadores. Supongamos que σ es cierto en S y probemos que también lo es en R. Para a1 ∈ R arbitrario escogemos una función ϕ1 ∈ Φ que tenga a a1 en su dominio. Por hipótesis, existe s1 ∈ S tal que ∀ x2 ∃ y2 · · · ∀ xn ∃ yn ψ(ϕ(a1 ), s1 , . . . , xn , yn ) es cierta en S. Escogemos una función ϕ1′ ∈ Φ con s1 en su rango, es decir, s1 = ϕ1′ (b1 ) para alguna b1 ∈ R. Repetimos este procedimiento insertando un elemento arbitrario a2 ∈ R en lugar de x2 y conseguimos un elemento b2 ∈ R para deducir finalmente que es cierto en R. ∀ a1 ∃ b1 ∀ a2 ∃ b2 · · · ∀ an ∃ bn ψ(a1 , b1 , . . . , an , bn ) Proposición 13.2. Si K y L son campos algebraicamente cerrados de la misma característica y ambos de grado de trascendencia infinito sobre sus campos primos, entonces K y L son elementalmente equivalentes. 343 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 344 ✐ ✐ 5. Teoría de modelos Demostración. Basta probar que K y L satisfacen las condiciones de la proposición 13.1. Sea Φ la familia de todos los isomorfismos de subcampos K′ de K en L, donde el grado de trascendencia de K′ sobre su campo primo es finito (o cero). Debemos verificar (i) y (ii) de la mencionada proposición. Sea ϕ : K′ − → L′ un elemento de Φ y a ∈ K. Si a ∈ K′ , no hay nada que probar. Si a ∈ / K′ y a es trascendente sobre K′ , sea b un elemento en L que es trascendente sobre L′ . Tal elemento existe pues el grado de trascendencia de L sobre su campo primo es infinito. Extendemos ϕ a un isomorfismo ϕ′ : K′ (a) − → L′ (b). Si a ∈ K′ y a es algebraico sobre K′ , existe un elemento b ∈ L tal que el polinomio mínimo de a en K′ se transforma mediante ϕ en el polinomio mínimo de b sobre L′ (aquí se usa que L sea algebraicamente cerrado). También en este caso ϕ se puede extender a un isomorfismo ϕ′ : K′ (a) − → L′ (b). Esto muestra que se cumple la condición (i). La condición (ii) se demuestra mediante un argumento dual al usado para la condición (i). 14. Teorema de consistencia de Robinson Lema 14.1 (Separación). Sean Φ1 , Φ2 conjuntos de L-enunciados consistentes, H un conjunto de L-enunciados cerrado respecto a ∧, ∨ y que contiene los enunciados cierto y falso: ⊤, ⊥ respectivamente. Las siguientes afirmaciones son equivalentes: (a) Existe φ ∈ H tal que Φ1 ⊢ φ y A1 |= φ y Φ2 ⊢ ¬φ. (b) Para cualesquier modelos A1 de Φ1 y A2 de Φ2 existe φ ∈ H tal que A2 |= ¬φ. Decimos que en (a) φ separa a Φ1 y Φ2 y que en (b) separa a A1 y A2 . Demostración. La sencilla demostración queda como ejercicio al lector. (Se sigue directamente del Lema 3.1). Lema 14.2. Sean Φ un conjunto de enunciados, A una estructura y ∆ un conjunto de fórmulas cerrado respecto a cuantificación existencial, conjunción y sustitución de variables. Las siguientes afirmaciones son equivalentes. (a) Todos los enunciados φ ∈ ∆ válidos en A1 son consistentes con Φ. 344 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 345 ✐ ✐ Conjuntos y modelos. Curso avanzado ∆ (b) Existe un modelo B |= Φ y una función f : A − → B. Es decir, si Φ = Teo(B), obtenemos ∆ si y sólo si existe f : A − → B′ ≡ B. A ⇛∆ B ∆ Demostración. (b) ⇒ (a). Sea f : A − → B |= Φ. Si φ ∈ ∆ y es válida en A, φ también es válida en B y, por lo tanto, es consistente con Φ. (a) ⇒ (b) Considere Teo∆ (A, A). Los modelos (B, {f (a) : a ∈ A}) ∆ corresponden a f : A − → B. Buscamos un modelo de Φ ∪ Teo∆ (A, A). Para ello usamos compacidad. Si Φ∪Teo∆ (A, A) no fuera finito satisfacible, existiría ◦ ◦ δ(~a) ∈ Teo∆ (A, A) (∆ es cerrado respecto a conjunciones) tal que Φ ⊢ ¬δ(~a). Def Por el lema 4.12.20 logramos Φ ⊢ ∀ ~x¬δ(~x). Entonces φ = ∃ ~xδ(~x) es un ∆-enunciado cierto en A inconsistente con Φ, una contradicción con (a). Teorema 14.3. Sean Φ1 , Φ2 conjuntos de L-enunciados. Las siguientes afirmaciones son equivalentes. (a) Existe un enunciado universal, es decir, de la forma ∀ ~xϕ, con ϕ sin cuantificadores que separa Φ1 de Φ2 . (b) Si A1 es un modelo de Φ1 y A2 es modelo de Φ2 , A2 no puede ser subestructura de A1 . Demostración. (a)⇒(b). Sean φ un enunciado universal que separa Φ1 de Φ2 , A1 un modelo de Φ1 y A2 una subestructura de A1 . Puesto que A1 es modelo de Φ1 , A2 también es modelo de φ (Teorema 6.12), por lo que A2 no puede ser modelo de Φ2 . (b)⇒(a) Sean A1 y A2 modelos de Φ1 y Φ2 respectivamente, que no se pueden separar mediante un enunciado universal, es decir A2 ⇛∃ A1 . Del lema 14.2 (note que A ⇛∃ B implica que A es subestructura de B) se deduce que A2 tiene una supraestructura A′1 elementalmente equivalente a A1 . A′1 es modelo de Φ1 , lo que contradice (b). Definición 14.4. Las fórmulas Π2 tienen la forma con ψ sin cuantificadores. ∀ ~x∃ ~yψ Definición 14.5. Un conjunto Φ de enunciados es inductivo si la unión de cada familia dirigida de modelos de Φ es un modelo de Φ (una familia Ai , i ∈ I es dirigida si para cualesquier, j, k ∈ I existe l ∈ I tal que j ≤ l, k ≤ l). 345 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 346 ✐ ✐ 5. Teoría de modelos Teorema 14.6. Sean Φ1 , Φ2 conjuntos de enunciados. Las siguientes proposiciones son equivalentes. (a) Existe un Π2 -enunciado que separa Φ1 de Φ2 . (b) Ningún modelo de Φ2 es la unión de una cadena (o una familia dirigida) de modelos de Φ1 . Demostración. (a) ⇒ (b) Sean φ un Π2 -enunciado que separa Φ1 de Φ2 , {Ai : i ∈ I} una familia dirigida de modelos de Φ1 y B la unión de los Ai . Puesto que los Ai son modelos de φ1 , B también es modelo de φ: sea φ = ∀ ~x∃ ~yψ(~x, ~y). Si ~a ∈ B, existe un Ai que contiene a ~a. Como φ es cierto en Ai , ∃ ~yψ(~a, ~y) es cierto en Ai . Al ser ∃ yψ(~a, ~y) una fórmula Σ1 , también es cierta en B. Ya que B |= φ, B no puede ser modelo de Φ2 . ¬(a) ⇒ ¬(b). Si (a) fuera cierto, eixistirían modelos A y B de Φ1 y Φ2 que no se pueden separar mediante Π2 -enunciados, así que (Σ2 -fórmulas son equivalentes a negaciones de Π2 -fórmulas): B0 ⇛Σ2 A. ∀ De acuerdo con el lema 14.2 existe f : B0 − → A0 , con A0 ≡ A. Podemos suponer que B0 ⊆ A0 y que f es la inclusión. Entonces (A0 , B) ⇛∃ (B0 , B). Usamos otra vez el lema 14.2 para obtener una supraestructura (B1 , B) de Def (A0 , B) tal que (B1 , B) = (B0 , B), es decir B0 ≺ B1 y (B0 ⊆ A0 ⊆ B1 ). A1 | {z ≺ } Ahora usamos el mismo procedimiento y obtenemos dos supraestructuras Def ⊆ B2 con A1 = A y B1 ≺ B2 . Finalmente generamos una cadena B0 ⊆ A0 ⊆ B1 ⊆ A1 ⊆ B2 ⊆ A3 ⊆ · · · Def | {z ≺ }| {z ≺ }| {z ≺ } con Ai = A y Bi ≺ Bi+1 . Sea B la unión de los Ai . Como B también es la unión de la cadena elemental Bi , B es una extensión elemental de B0 y, por lo tanto, es un modelo de Φ2 . Los Ai son modelos de Φ1 , por lo que logramos un contraejemplo de (b). Corolario 14.7. Sea Φ un conjunto de enunciados. 1. Sea φ un enunciado. Las siguientes afirmaciones son equivalentes. 346 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 347 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) Existe un Π2 -enunciado equivalente a φ módulo Φ. (b) Sean A0 ⊆ A1 ⊆ · · · modelos de Φ y su unión B también modelos de Φ. Entonces φ es cierta en B cuando φ es cierta en cada Ai . 2. Φ es inductiva si y sólo si Φ es axiomatizable mediante Π2 - enunciados. Demostración. (1) En el corolario 5.4.4 se prueba (a) ⇒ (b). mostraremos (b) ⇒ (a). Considere Φ1 = Φ ∪ {φ} y De- Φ2 = Φ ∪ {¬φ}. (b) afirma que la unión de una clase de modelos de Φ1 no puede ser modelo de Φ2 . Por el teorema 14.6 podemos separar Φ1 de Φ2 mediante un Π2 enunciado ψ. De Φ ⊢ ψ se sigue que Φ1 ⊢ (φ ⇒ ψ) y de Φ2 ⊢ ¬ψ se deduce que Φ2 ⊢ (¬φ ⇒ ¬ψ). (2) Ya sabemos que los conjuntos de Π2 -enunciados son inductivos. Supongamos que Φ es inductivo y que φ es un axioma de Φ. Si B es la unión de modelos de Φ, B no puede ser modelo de ¬φ. Por el teorema 14.6 existe un Π2 -enunciado ψ tal que Φ ⊢ ψ y ¬φ ⊢ ¬ψ y todos los axiomas de Φ se siguen de ΦΠ2 = {ψ : Φ ⊢ ψ, ψ ∈ Π2 }. Pasemos ahora al motivo de la sección, la demostración del teorema de Robinson. Teorema 14.8 (Consistencia [Robinson]). Sean L1 , L2 lenguajes y L = L1 ∩ L2 . Supongamos que Φ1 , Φ2 son conjuntos consistentes de L1 -, respectivamente L2 -fórmulas. Entonces Φ1 ∪ Φ2 es L-consistente si y sólo si no existe ningún enunciado σ de L tal que Φ1 |= σ y Φ2 |= ¬σ. Demostración. La dirección ⇒ es obvia. Trataremos la dirección ⇐. Debemos demostrar que Φ1 ∪ Φ2 es satisfacible. El primer escalón en la demostración es: Afirmación 1. Φ1 ∪ {σ : σ ∈ Fml0 (L), Φ2 |= σ} es consistente. Demostración de la afirmación 1. En vista del teorema de compacidad y considerando conjunciones, es suficiente mostrar que si Φ1 |= σ1 y Φ2 |= σ2 con σ2 ∈ Fml0 (L), entonces {σ1 , σ2 } es consistente. Pero esto es cierto pues 347 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 348 ✐ ✐ 5. Teoría de modelos en caso contrario tendríamos σ1 |= ¬σ2 , de donde se deduce que Φ1 |= ¬σ2 y que ¬σ2 sería un enunciado de L, lo que contradice la hipótesis.◭ La idea de la demostración es la siguiente: para construir un modelo de Φ1 ∪Φ2 construiremos modelos A |= Φ1 y B |= Φ2 y un isomorfismo f : A ↾ L − → B ↾ L. Usaremos f para trasladar las interpretaciones de los símbolos en L1 − L de A a B, logrando de este modo una expansión B∗ de B al lenguaje L1 ∪ L2 . Finalmente probaremos que B∗ ↾ L1 ∼ = B, de donde = A y B ∗ ↾ L2 ∼ ∗ concluimos que B |= Φ1 ∪ Φ2 . El resto de la prueba estará dedicado a construir A, B y f . Las L-estructuras A y B serán uniones de cadenas elementales An , Bn y f la unión de las fn : An ֒→ Bn . Comenzamos con n = 0. Afirmación 2. Existen modelos A0 |= Φ1 , B |= Φ2 y un encaje elemental f0 : A0 ↾ L ֒→ B0 ↾ L. Demostración de la afirmación 2. Mediante la afirmación 1 definimos A0 |= Φ1 ∪ {σ : σ ∈ Fml0 (L), Φ2 |= σ}. Primero probamos que Teo(A0 ↾ L, A0 ) ∪ Φ2 es satisfacible. Otra vez por compacidad es suficiente probar que si σ ∈ Teo(A0 ↾ L, A0 ), entonces Φ2 ∪ {σ} es satisfacible. Para tal σ, sean ca0 , . . . , can los símbolos de constante de L(A0 ) − L que aparecen en σ. Sea ϕ la L-fórmula que se obtiene reemplazando cada cai por una variable ui . Claramente A0 ↾ L |= ϕ[~a] implica A0 ↾ L |= ∃ ~uϕ. Por la definición de A0 no puede ocurrir que Φ2 |= ¬∃ ~uϕ, así que existe un L2 -modelo D de Φ2 con D |= ∃ ~uϕ. Por consiguiente, hay elementos ~ Expandimos D a un L2 ∪ L(A0 )-modelo d0 , . . . , dn ∈ D tales que D |= ϕ[d]. ∗ D interpretando cada cai como di . Entonces D∗ |= σ y D∗ |= Φ2 ∪ {σ}. Sean B∗0 |= Teo(A0 ↾ L, A0 ) ∪ Φ2 y B0 = B0 ↾ L2 . Claramente, B0 |= Φ2 . Como B0 ↾ L se puede expandir a un modelo de Teo(A0 ↾ L, A0 ), el lema 6.16 asegura la existencia de un encaje f0 : A ↾ L ֒→ B0 ↾ L, lo que termina la demostración de la afirmación 2.◭ 348 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 349 ✐ ✐ Conjuntos y modelos. Curso avanzado Afirmación 3. Para cada n ≥ 0 existen modelos An+1 |= Φ1 y Bn+1 |= Φ2 y un encaje elemental fn+1 : An+1 ↾ L ֒→ Bn+1 ↾ L tales que An ≺ An+1 , Bn ≺ Bn+1 , fn+1 extiende a fn y Bn ⊆ ran(fn+1 ). Antes de probar la afirmación 3, consideremos S sus consecuencias. SuS B A , B pongamos que la afirmación 3 es cierta; sea A = n y n n∈N n∈N S f = n∈N fn . De acuerdo con el ejercicio 15, A |= Φ1 y B |= Φ2 . Concluimos la prueba del teorema verificando sin dificultad que f : A ↾ L − → B ↾ L es un isomorfismo. Demostración de la afirmación 3. Por inducción sobre n. Probaremos el caso de n = 0 y dejamos el caso general al lector, pues el caso de n arbitraria es muy similar al caso n = 0. Afirmación 4. Existen modelos A1 |= Φ1 y B |= Φ2 y un encaje elemental f1 : A1 ↾ L ֒→ B1 ↾ L tal que A0 ≺ A1 , B0 ≺ B1 , f1 extiende a f0 y B0 ⊆ ran(f1 ). + Demostración de la afirmación 4. Sea A+ 0 la expansión de A0 a L1 = L1 ∪ {ca : a ∈ A0 }, interpretando cada ca como a ∈ A0 ; A+ o es precisamente + ). Sea B+ (A0 , A0 ). El diagrama elemental de U0+ es Teo(A+ , A 0 0 0 la expansión de B0 ↾ L al lenguaje L∗ = L ∪ {ca : a ∈ A0 } ∪ {cb : b ∈ B0 }, interpretando cada ca como f0 (a) ∈ B0 y cada cb como b ∈ B0 . Queremos + ∗ probar que Teo(A+ 0 , A0 ) ∪ Teo(B0 ) es consistente. Por el teorema de com+ pacidad, es suficiente probar que Teo(A+ 0 , A0 ) ∪ {σ} es consistente para cada σ ∈ Teo(B∗0 ). Para dicho enunciado σ sean ca0 , . . . , cam , cb0 , . . . , cbm todos los símbolos de constante que aparecen en σ pero no en L. Sea ϕ(u0 , . . . , um , w0 , . . . , wm ) la fórmula de L que se obtiene de σ remplazando cada símbolo cai por la variable ui y cada símbolo de constante cbi por la variable wi . Tenemos B∗0 |= σ así que B0 ↾ L |= ϕ[f0 (a0 ), . . . , f0 (am ), b0 , . . . , bn ]; en consecuencia, ~ ϕ[f0 (a0 ), . . . , f0 (am )]. B0 ↾ L |= ∃ w Como f0 es un encaje elemental, se cumple ~ ϕ[~a]. A0 ↾ L |= ∃ w 349 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 350 ✐ ✐ 5. Teoría de modelos Sea ϕ̃(~ w) la fórmula de L+ 1 que se obtiene reemplazando las apariciones de ~ ) por cai ; entonces A+ ~ ϕ̃. Por supuesto, ui en ϕ(~u, w 0 |= ∃ w + ~ ϕ̃ (A+ 0 , A0 ) |= ∃ w y esto significa que existen d0 , . . . , dn ∈ A+ 0 = A1 tales que + ~ (A+ 0 , A0 ) |= ϕ̃[d]. + Ahora podemos expander (A+ 0 , A0 ) a un modelo D interpretando cada cbi + como di para obtener D |= σ, y entonces Teo(A+ 0 , A0 ) ∪ {σ} es consistente. + + ∗ Sea E |= Teo(A+ 0 , A0 ) ∪ Teo(B0 ). Por el lema del diagrama elemental, A0 + + + es elementalmente encajable en E ↾ L1 . Así que existe un L1 -modelo A1 con + + → E ↾ L+ A0 ≺ A+ 1 . Usando g expandemos A1 a un 1 y un isomorfismo g : A1 − modelo A′1 isomorfo a E. Sea A′1 ↾ L+ , y se cumple entonces A∗1 |= Teo(B+ 0 ). + + + Ahora queremos probar que Teo(A+ , A ) ∪ Teo(B , B ) es satisfacible, 1 1 0 0 ∗ donde B+ 0 es la expansión común de B0 y B0 al lenguaje L+ 2 = L2 ∪ {ca : a ∈ A0 } ∪ {cb : b ∈ B0 }. Por el teorema de compacidad es suficiente mostrar que Teo(B+ 0 , B0 ) ∪ {σ} es consistente para cada σ en Teo(A∗1 , A∗1 ). Sean cx0 , . . . , cxn los símbolos de constante que aparecen en σ pero que no pertenecen a L∗ . Sea ψ(~u) la fórmula de L∗ que se obtiene de σ reemplazando cada cxi por una variable ui . Como (A∗i , A∗1 ) |= σ, se logra que A∗1 |= ψ(~x), y en consecuencia A∗1 |= ∃ ~uψ. Por lo tanto, A∗1 |= Teo(B∗0 ) y Teo(B∗0 ) es una teoría completa en el lenguaje ∗ L , por lo que ∃ ~uψ pertenece a Teo(B∗0 ). En consecuencia, B∗0 |= ∃ ~uψ, y + ~ (B+ 0 , B0 ) |= ψ(b). + Podemos expandir (B+ 0 , B0 ) a un modelo F interpretando cada cxi como + bi ; en tal situación F |= σ y Teo(B+ 0 , B0 ) ∪ {σ} es consistente. + + + Sea G |= Teo(A1 , A1 )∪Teo(B0 , B0+ ). Por el lema del diagrama elemental + + B0 es elementalmente encajable en G ↾ L+ 2 . Así que existe un L2 -modelo + + + B+ → G ↾ L+ 1 con B0 ≺ B1 y un isomorfismo h : B1 − 2 . Mediante h + ′ expandimos B1 a un modelo B1 isomorfo a G. Sea B∗1 = B′1 ↾ L∗ . Otra vez por el lema del diagrama elemental, tenemos que A∗1 se encaja elementalmente en B∗1 . Sean f1 : A∗1 ֒→ B∗1 y a ∈ A0 ; mostraremos que f0 (a) = f1 (a). Por + definición B∗0 |= ca =f ˙ 0 (a),entonces B+ ˙ 0 (a). Como B+ 0 |= ca =f 0 ≺ B1 , 350 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 351 ✐ ✐ Conjuntos y modelos. Curso avanzado B+ ˙ 0 (a) y así B∗1 |= ca =f ˙ 0 (a). En consecuencia, A+ ˙ y 1 |= ca =f 0 |= (ca =a) + + ∗ |= (c =a). |= (c =a) ˙ y A ˙ puesto que A0 ≺ A1 , concluimos que A+ a 1 1 1 Ya que f1 es elemental, B∗1 |= (f0 (a)=f ˙ 1 (a)), por lo que f0 (a) = f1 (a). En resumen, f1 extiende a f0 . Sea b ∈ B0 ; mostraremos que b = f1 (a) para alguna a ∈ A1 . Por + ˙ b ) así que B+ ˙ Como B+ definición tenemos B∗0 |= (b=c 0 |= (cb =b). 0 ≺ B1 , + B1 |= (b=c ˙ b ) y B∗1 |= (b=c ˙ b ). Por otra parte, puesto que ∃ v1 (v1 =c ˙ b ) siempre ∗ ∗ ˙ b ). Ya que f1 es elemental, B1 |= (f1 (a)=c ˙ b) es satisfacible, A1 |= ∃ v1 (v1 =c ˙ 1 (a)) y b = f1 (a). Concluimos que B0 = ran(f1 ). por lo que B∗1 |= (b=f Sean A1 = A1 ↾ L1 y B1 = B+ 1 ↾ L2 . Obtenemos A0 ≺ A1 y B0 ≺ B1 , y que f1 : A1 ↾ L − → B1 ↾ L es un encaje elemental. Como consecuencia del teorema de Robinson podemos derivar el siguiente resultado debido a Craig. Teorema 14.9 (Interpolación de Craig). Sean ϕ, ψ L-enunciados tales que ϕ |= ψ. Entonces existe un enunciado θ con las siguientes propiedades: 1. ϕ |= θ y θ |= ψ. 2. Todo símbolo de relación, función o constante que aparece en θ ocurre tanto en ϕ como en ψ. Demostración. Supongamos ϕ |= ψ. Sea L1 el lenguaje4 de ϕ, L2 el de ψ y L = L1 ∩ L2 . Es suficiente mostrar que T0 |= ψ, donde T0 = {σ ∈ L : ϕ |= σ}, pues si esto es cierto, existe un subconjunto finito Φ de T0 tal que Φ |= ψ. Tomamos θ como la conjunción de las fórmulas en Φ para obtener el enunciado buscado. Si T0 6|= ψ, entonces T0 ∪ {¬ψ} es consistente. Sea T1 una extensión completa en L2 de T0 ∪ {¬ψ} y T los L-enunciados de T1 , entonces T es un conjunto completo en L. Afirmamos que T ∪ {ϕ} es consistente en L1 . Si no, existe un enunciado σ ∈ T tal que ϕ |= ¬σ. Pero en esa situación ¬σ ∈ T0 ⊆ T1 , lo que implica ¬σ ∈ T , una contradicción. En vista del teorema de consistencia de Robinson para T1 y T ∪ {ϕ}, el conjunto T ∪ T1 ∪ {ϕ} resulta satisfacible. En particular, {ϕ, ¬ψ} es satisfacible, lo que es una contradicción. 4 L1 es el lenguaje de ϕ en el sentido de que L1 ⊆ L y todo símbolo en ϕ pertenece a L1 . 351 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 352 ✐ ✐ 5. Teoría de modelos 15. Indicernibles Sean X un conjunto, < un orden lineal en X, n ∈ N+ y (X)n el conjunto de todas las n-adas estrictamente crecientes de elementos de X; así que (x1 , . . . , xn ) ∈ (X)n si y sólo si x1 < · · · < xn y x1 . . . , xn ∈ X. Sea f una función con dominio (X)n . Decimos que un subconjunto Y de X ((Y, <) ⊆ (X, ⊆)) es f indicernible, o que Y es un conjunto de indicernibles para f , si para cualesquier n-adas ~a, ~b de (Y )n , f (~a) = f (~b); en otras palabras, si f es constante en (Y )n . Un caso particular de gran importancia es el siguiente. Sean n ∈ Nn y Φ(x1 , . . . , xn ) un conjunto de L-fórmulas. Supongamos que X es un conjunto de elementos de A el dominio de la L-estructura A y que < es un orden lineal en X. Decimos que (X, <) es una sucesión Φ- indicernible en A, o que X es un conjunto de indicernibles para A si para toda fórmula ϕ ∈ Φ y toda pareja ~a, ~b ∈ (X)n : A |= ϕ[~a] ⇔ A |= ϕ[~b]. (56) Como lo mencionamos, éste es un caso particular de la definición de f indicernibles pues podemos escoger una función f : (X)n − → 2|L| de tal forma que ∀~a, ~b ∈ (X)n , f (~a) = f (~b) ⇔ la ecuación 56 es cierta ∀ ϕ ∈ Φ. (57) Entonces (X, <) es f -indicernible si y sólo si es Φ-indicernible. Ejemplo 15.1. Sea V un espacio vectorial, X una base de V y < un orden lineal en X. En consecuencia, X es ϕ(x1 , . . . , xn )-indicernible para toda Lfórmula ϕ, donde L es el lenguaje apropiado para espacios vectoriales: si a, b son elementos de (X)n , como X es una base de V , existe un automorfismo de V que transforma ~a en ~b. Por lo tanto, V |= ϕ[~a] ⇔ V |= ϕ[~b]. El conjunto X en el ejemplo es indicernible en un sentido más amplio. Supongamos que A es una L-estructura, X es un conjunto de elementos de A linealmente ordenado por < y (X, <) es {ϕ}-indicernible simultáneamente para toda L-fórmula ϕ(~x); decimos que (X, <) es una sucesión indicernible en A. El ejemplo muestra que una base de un espacio vectorial siempre es un conjunto indicernible. El lector puede verificar que una base de trascendencia en un campo algebraicamente cerrado es un conjunto indicernible. El siguiente teorema será de utilidad en lo sucesivo. 352 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 353 ✐ ✐ Conjuntos y modelos. Curso avanzado Proposición 15.2. Sea (P, ≤) un conjunto infinito parcialmente ordenado. Entonces P contiene un conjunto infinito linealmente ordenado o P contiene un conjunto infinito de elementos incomparables entre sí. Demostración. Introducimos un buen orden ≺ en P y definimos una función F : [P]2 − → 3 como sigue: siempre que a ≺ b, F (a, b) = 0 si a < b o F (a, b) = 1 si b < a; F (a, b) = 2 si a y b son <-incomparables. En este punto aplicamos el teorema de Ramsey 7.9.1. 15.1. Modelos de Ehrenfeucht-Mostowski. En esta sección construiremos modelos sobre conjuntos linealmente ordenados de tal forma que las propiedades de este conjunto linealmente ordenado controlen las características del modelo. Trabajaremos sobre conjuntos linealmente ordenados (η, <η ) y, si no hay ambigüedad, hablaremos simplemente del conjunto linealmente ordenado η. Usamos letras griegas para estos conjunto, pues en buena medida estamos interesados en tipos ordinales asociados a estos órdenes. Las variables η, ζ, ξ denotarán conjuntos linealmente ordenados. Decimos que una L-estructura A contiene al conjunto η si η ⊆ A; posiblemente no exista otra relación entre <η y A, es decir <η no tiene que representar una 2-relación de la signatura de L. Una función Ehrenfeucht-Mostowski (una EM-función) es una función F de una clase de órdenes lineales a una familia de L-estructuras, es decir, F (η) es una L-estructura que satisface las siguientes propiedades: EM1 Para cada conjunto linealmente ordenado η, la L-estructura F (η) contiene a η como conjunto de generadores. EM2 Para cada encaje f : η ֒→ ξ existe un encaje F (f ) : F (η) ֒→ F (ξ) que extiende a f . EM3 Para cualesquier encajes f : η ֒→ ξ y g : ξ ֒→ ζ, F (gf ) = F (g) ◦ F (f ), y para todo conjunto linealmente ordenado η, F (idη ) = idF (η) . Por ejemplo, si f es un automorfismo de un conjunto linealmente ordenado η, entonces F (f ) : F (η) − → F (η) es un automorfismo que extiende a f . Por EM1 F (η) contiene a η. Decimos que η es el espinazo de F (η) y como éste genera a F (η), cada elemento de F (η) es de la forma (véase el Ejer. 4.63) t F (η) (~a) para algún L-término t(x0 , . . . , xn−1 ) y alguna ~a ∈ (η)n . Las dos propiedades esenciales de las EM-funciones son el deslizamiento (se pueden “deslizar” elementos alrededor del espinazo) y el estiramiento (podemos estirar el espinazo). 353 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 354 ✐ ✐ 5. Teoría de modelos Teorema 15.3 (Deslizamiento). Sean F una EM-función, ~a, ~b n-adas crecientes en los conjuntos linealmente ordenados η y ξ, respectivamente. Entonces para toda L-fórmula sin cuantificadores φ(x0 , . . . , xn−1 ) se cumple F (η) |= φ[~a] si y sólo si F (ξ) |= φ[~b]. Demostración. Encontramos un conjunto linealmente ordenado ζ y encajes f : η − →ζyg:ξ − → ζ tales que f (~a) = g(~b). Considere el diagrama F (f ) F (g) F (η) −→ F (ζ) ←− F (ξ). (58) ~◦ Supongamos que F (η) |= φ[a] y recordemos que los encajes preservan ~◦ fórmulas sin cuantificadores, así que F (ζ) |= φ[f (a)]. Entonces F (ζ) |= φ[g(~b)] y, por lo tanto, F (ξ) |= φ(~b). Una consecuencia inmediata del teorema 15.3 es: Corolario 15.4. Si F es una EM-función y ζ es un conjunto linealmente ordenado, entonces ζ es una sucesión φ-indicernible en F (ζ) para toda fórmula φ sin cuantificadores. Supongamos que A es una L-estructura y η un conjunto linealmente ordenado contenido en A. Definamos la teoría de η en A, Teo(A, η), como el conjunto de todas las L-fórmulas φ(~x) tales que A |= φ[~a] para toda a ∈ (η)n . La teoría de la EM-función F en L, Teo(F ), se define como el conjunto de todas las L-fórmulas φ(~x) tales que para todo conjunto linealmente ordenado η y toda ~a ∈ (η)n , F (η) |= φ[~a]. Como toda L-fórmula tiene una cantidad finita de variables libres, el teorema 15.3 asegura que Teo(F ) contiene exactamente las mismas fórmulas sin cuantificadores que Teo(F (η), η) para todo η. Pero podemos decir más: Lema 15.5. Sea F una EM-función; supongamos que η es un conjunto linealmente ordenado infinito y φ es un Π1 -enunciado de L válido en F (η). Entonces φ ∈ Teo(F ). Demostración. Supongamos que φ es ∀ ~xψ(~x) con ψ sin cuantificadores. Sea ζ un conjunto linealmente ordenado y ~a una n-ada de elementos de F (ζ); debemos mostrar que F (ζ) |= ψ[~a]. Ya que ζ genera a F (ζ), existe un suborden finito ζ0 de ζ con ~a en el universo de F (ζ0 ). Como η es infinito, existe un encaje f : ζ0 − → η. Por hipótesis; F (f )(~a) satisface ψ en F (η); así, F (ζ0 ) |= ψ[~a] ya que ψ no tiene cuantificadores. Entonces F (ζ) |= ψ[~a]. 354 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 355 ✐ ✐ Conjuntos y modelos. Curso avanzado Un conjunto T de L-enunciados atómicos que satisfacen la siguiente condición se llama =-cerrado en L: 1. Para todo L-término cerrado t, t =t ˙ ∈ T. 2. Si φ(~x) es una L-fórmula atómica y la ecuación s=t ˙ ∈ T , entonces φ(s) ∈ T si y sólo si φ(t) ∈ T . El lema 15.5 implica que Teo(F ) se puede recuperar de Teo(F (ω), ω). Pero, de hecho, la totalidad de F se recupera de F (ω) (salvo isomorfismos). Teorema 15.6 (Estiramiento). Sea σ una signatura, L su lenguaje asociado y A una L-estructura que tiene al conjunto linealmente ordenado ω como conjunto de generadores. Si ω es una sucesión φ-indicernible en A para toda L-fórmula atómica φ, entonces existe una EM- función F tal que A = F (ω). Esta función F es única módulo el isomorfismo natural de funciones; es decir, si G es otra EM-función con esta propiedad, entonces para cada conjunto linealmente ordenado η existe un isomorfismo iη : F (η) − → G(η) que es la identidad en η. Demostración. Para construir F tomamos cualquier conjunto linealmente ordenado η, por ejemplo el ordinal η. Definimos un conjunto S(η) de L(η)-enunciados atómicos. Sea φ un L(η)-enunciado atómico, y entonces φ se puede escribir como ψ(~c) para alguna L-fórmula atómica ψ(~x) y c ∈ (η)n . Para φ en S(η), ψ(~x) ∈ Teo(A, ω). La elección de ψ no es única (pueden existir varibales redundantes en ~x), pero un sencillo argumento con deslizamiento muestra que la definición es correcta. Se afirma que S(η) es cerrado respecto a = en L(η). Claramente S(η) contiene t =t ˙ para todo L-término cerrado t, ya que x0 =x ˙ 0 ∈ Teo(A, ω). Supongamos que S(η) contiene a ψ(s(~c), ~c) y a s(~c) = t(~c), donde ψ(s(~x), ~x) es una fórmula atómica de L y ~c ∈ (η)n . Entonces para toda ~a ∈ (ω)n , A |= ψ(s(~a),~a) ∧ s(~a) = t(~a), así que ψ(t(~x), ~x) ∈ Teo(A, ω) y, por lo tanto, ψ(t(~c), ~c) ∈ S(η). Esto prueba la afirmación. Ahora definimos F (η) como el L-reducto del modelo canónico5 de S(η). Como x0 =x ˙ 1 ∈ / Teo(A, ω), los elementos aF (η) con a ∈ η son distintos entre sí, y podemos identificar cada aF (η) con a. Entonces F (η) contiene a η como conjunto de generadores. Sea F : η − → ξ un encaje de órdenes lineales. 5 Véase la construcción del modelo canónico al final del libro. 355 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 356 ✐ ✐ 5. Teoría de modelos Entonces para cada fórmula atómica ψ(~x) de L y cada n-ada ~a creciente en η, F (η) |= ψ(~a) ⇔ ψ(~x) ∈ Teo(A, ω) ⇔ F (ξ) |= ψ(f (~a)). (59) Se sigue del lema del diagrama que podemos definir un encaje F (f ) : F (η) ֒→ F (ξ) haciendo F (f )(t F (η) (~a)) = t F (ξ) (f (~a)), para cada L-término t y cada ~a ∈ (η)n . Esta definición satisface EM3, así que F es una EM-función. Construimos F de tal forma que Teo(F ) coincide con Teo(A, ω) en todas las fórmulas atómicas de L. Sea G otra EM-función con esta propiedad. Para todo orden lineal η, toda L-fórmula atómica ψ(~x) y toda n-ada creciente ~a de η, F (η) |= ψ(~a) si y sólo si G(η) |= ψ(~a). Como η genera tanto a F (η) como a G(η), podemos definir un isomorfismo iη : F (η) − → G(η) mediante iη (t F (η) (~a)) = t G(η) (~a). Tomando t como x0 , iη es la identidad en η. Por el mismo argumento, F (ω) se puede identificar con A. Si Φ es un conjunto de enunciados, un modelo de Ehrenfeucht-Mostowski de Φ (en caso de existir) es una L-estructura de la forma F (η) que es modelo de Φ, donde F es una EM-función. En la práctica, los reductos de F (η) se conocen también como modelos de Ehrenfeucht-Mostowski. En lo que sigue trataremos de encontrar tales modelos. Lema 15.7. Sea F una EM-función y supongamos que Teo(F (ω)) es una Lteoría de Skolem. Entonces para toda L-fórmula φ(~x), φ o ¬φ ∈ Teo(F ). En particular, todas las L-estructuras F (η) son elementalmente equivalentes y en cada estructura F (η), η es una sucesión de indicernibles. Demostración. Una teoría de Skolem está axiomatizada por Π1 -enunciados y, módulo la teoría, toda fórmula es equivalente a una fórmula sin cuantificadores. Si usamos el lema 15.5 y el teorema 15.3, terminamos la demostración. Teorema 15.8 (Ehrenfeucht-Mostowski). Sea A una L-estructura tal que Teo(A) es una teoría de Skolem. Supongamos que A contiene un orden lineal infinito η. (El orden <η puede no ser la interpretación de una 2-relación en L). Entonces existe una EM-función F en L cuya teoría contiene a Teo(A, η). 356 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 357 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sea ~c una sucesión (ci : i ∈ ω) de nuevos símbolos de constante distintos. Sea T el siguiente conjunto de L(~c)-enunciados: φ[~a] ⇔ φ[~b] para cada L-fórmula φ(~x) y cualesquier ~a, ~b ∈ (~c)n . (60) φ(c0 , . . . , cn+1 ) para cada fórmula φ(~x) ∈ Teo(A, η). (61) Afirmamos que T tiene un modelo. Habremos demostrado esta afirmación si probamos que todo subconjunto finito de T tiene un modelo. Sea U subconjunto finito de T . Las fórmulas φ(~x) en las ecuaciones 60 y 61 que aparecen en U se pueden listar como φ0 , . . . , φm−1 y para algún k ∈ N, los nuevos símbolos de constante que aparecen en U se encuentran entre c0 , . . . , ck−1 . Añadiendo variables redundantes en el extremo derecho, de ser necesario, podemos escribir cada φi como φi (x0 , . . . , xn−1 ). Si ~a, ~b ∈ (η)n , escribimos ~a ∼ ~b si A |= φj [~a] ⇔ A |= φj [~b] ∀ j < m. (62) Entonces ∼ es una relación de equivalencia en (η)n con una cantidad finita de clases de equivalencia. Mediante el teorema de Ramsey 7.9.1 podemos obtener una sucesión creciente ~e = (ej : j < 2k) en η tal que cualesquier dos n-adas crecientes de ~e están en la misma clase de equivalencia respecto a ∼. Si interpretamos cada cj como ej (j < k), podemos convertir A en un modelo de U. Escogemos ~e de longitud 2k para tener espacio para variables redundantes en φi . Hemos probado la afirmación. Sea B un modelo de T . Como la fórmula x0 6= x1 pertenece a Teo(A, η), los elementos ciB son distintos entre sí, así que podemos identificar cada ciB con el número i, y B contiene a ω. Sea C la subestructura de B ↾ L generada por ω. Por el lema 15.7, Teo(A, η) ⊆ Teo(B ↾ L, ω). En particular, Teo(B ↾ L) es una teoría de Skolem, por lo que C ≺ B ↾ L. Se sigue que Teo(A, η) ⊆ Teo(C, ω). Por el lema 60, ω es una sucesión indicernible en C. El teorema se deduce del teorema 15.6 y del lema 15.7 El teorema 15.8 implica que toda teoría con modelos infinitos tiene modelos de Ehrenfeucht-Mostowski con espinazo de cualquier tipo ordinal, aunque debemos “eskolemizar” la teoría antes de construir sus modelos. 357 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 358 ✐ ✐ 5. Teoría de modelos 16. Ejercicios 1. Dé una prueba de cada uno de los siguientes teoremas de la teoría de grupos (con ◦ denotamos el símbolo de 2-función, mientras que e es el símbolo de constante y ∗ es la 1-función): (a) ∀ x(x ◦ x = e) ⇒ ∀ x∀ y(x ◦ y = y ◦ x). (b) ∀ x[(x∗ )∗ = x]. (c) ∀ x∀ y∃ z(x = y ◦ z). (d) ∀ x∀ y∃ z(x = z ◦ y). (e) ∃ y∀ x(x ◦ y = y ◦ x). 2. Para cada uno de los siguientes LGr -enunciados, muestre que tanto él como su negación no son teoremas de la teoría de grupos. (a) ∀ x∀ y[∃ z(x ◦ z = z ◦ y) ⇒ x ◦ y = y ◦ x]. (b) ∃ y∀ x(x ◦ y = y ◦ x∗ ). (c) ∃ x∃ y[x 6= y ∧ ∀ z(z = x ∨ z = y)]. 3. Determine si cada uno de los siguientes conjuntos de enunciados es consistente con los axiomas de la teoría de relaciones de equivalencia; si resulta consistente, dé un modelo; si no es así, dé un modelo contraejemplo. (a) {∀ x∀ y(Px ∧ Py ⇔ Exy), ∃ x∃ y(x 6= y)}. (b) {∃ y∀ x(f (x) = f (y)), ∀ x∀ y(f (x) = f (y) ⇒ x = y), ∀ x ∃ y¬Exy}. 4. Sea Γ la L-teoría que tiene como axiomas los siguientes enunciados: (L es el lenguaje asociado a la signatura σ que consiste en un símbolo ◦ de 2-función, un símbolo e de constante) (B1) ∀ x∀ y∀ z[x ◦ (y ◦ z) = (x ◦ y) ◦ z]. (B2) ∀ x(x ◦ e = x). (B3) ∀ x∀ y∃ z(x ◦ z = y ∧ z ◦ x = y). (a) Dé una prueba de cada uno de los siguientes teoremas de Γ: (i) ∀ x∀ y∀ z(x ◦ z = y ◦ z ⇒ x = y). (ii) ∀ x∀ y∀ z(z ◦ x = z ◦ y ⇒ x = y). (iii) ∀ x∃ y(x ◦ y = e). (iv) ∀ x∀ y∀ z(x ◦ y = e ∧ x ◦ z = e ⇒ y = z). (b) Introduzca un nuevo símbolo de 1-función h y un axioma (B4) que implique que h es la operación “inverso”. 358 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 359 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Muestre que cada uno de los siguientes enunciados es consecuencia lógica de {B1, B2, B3, B4} dando una prueba: (i) ∀ x(x ◦ h(x) = e). (ii) ∀ x(x ◦ h(x) = h(x) ◦ x). (iii) ∀ x∀ y(h(x ◦ y) = h(y) ◦ h(x)). (d) Dé un modelo A = hA, ◦, ei de Γ tal que (i) A tenga dos elementos. (ii) A tenga tres elementos. (iii) A |= ∀ x∀ y(x ◦ y = x ∨ x ◦ y = y). (e) Muestre que cada uno de los siguientes conjuntos de fórmulas es inconsistente con Γ (h es como en el inciso [b]). (i) ∃ x∃ y(x 6= y), ∀ x(x ◦ x = x). (ii) ∃ x∃ y(x 6= y)(x 6= y), ∀ x∀ y(x ◦ y = x ∨ x ◦ y = y). (iii) ∃ x∃ y(h(x) = h(y) ∧ x 6= y). 5. ¿Qué axiomas se deben añadir a la teoría de grupos para asegurar que todo modelo A = hA, ◦, ei satisfaga lo siguiente? (i) A tiene exactamente dos elementos. (ii) A tiene exactamente tres elementos. (iii) A es un grupo linealmente ordenado. 6. Sea ϕ un LGr -enunciado. Suponga que para cada número natural n existe un grupo con al menos n elementos en el que ϕ es cierto. Pruebe que debe existir un grupo infinito en el que ϕ es cierto. 7. Sea Γ la teoría de una relación bien fundada; es decir, el único símbolo no lógico de Γ es un símbolo de 2-relación R, y Γ tiene los siguientes axiomas: (W1) ∀ x¬(Rxx). (W2) ∀ x∀ y∀ z(Rxy ∧ Ryz ⇒ Rxz). (W3) ∀ x∀ y(Rxy ∨ Ryx ∨ x = y). (W4) Si ϕ es una fórmula en el lenguaje de Γ con exactamente una variable libre x tal que y no ocurre en ϕ. Entonces el siguiente enunciado es un axioma: ∃ xϕ(x) ⇒ ∃ x[ϕ(x) ∧ ∀ y(ϕ(y) ⇒ ¬yRx)]. (a) Pruebe que existe un modelo de Γ que tiene una cadena infinita R-descendente: · · · Rx4 Rx3 Rx2 Rx1 . 359 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 360 ✐ ✐ 5. Teoría de modelos (b) El resultado en (a) parece dar lugar a una paradoja pues (W4) afirma que cada conjunto de elementos tiene un elemento R-menor. Esto implica que no hay cadenas infinitas R-descendentes. ¿Cómo explica usted está aparente paradoja? 8. Demuestre las siguientes afirmaciones: (a) Si Γ es un conjunto de enunciados, entonces para todo enunciado ϕ se tiene que Γ ∪ {ϕ} o Γ ∪ {¬ϕ} es consistente. (b) Suponga que ϕ es el enunciado: ∀ x∀ y∀ z[Rxx ∧ (Rxy ∨ Ryx) ∧ (Rxy ∧ Ryz ⇒ Rxz)] ⇒ ∃ y∀ xRyx. Pruebe que ϕ es verdadero en toda estructura del lenguaje de ϕ que tenga universo finito, pero que ϕ no es demostrable. (c) Suponga que ψ es un L-enunciado que no contiene cuantificadores y tampoco constantes ni símbolos de función. (i) Suponga que x1 , x2 , . . . , xn son las únicas variables libres en ψ, y suponga que ϕ es el enunciado ∀ x1 ∀ x2 · · · ∀ xn ψ. Pruebe que ⊢ ϕ si y sólo si ϕ es cierta en toda estructura de su lenguaje cuyo universo tiene a lo sumo n elementos. (ii) Suponga que x1 , x2 , . . . , xn son las únicas variables libres en ψ y suponga que ϕ es el enunciado ∃ x1 ∃ x2 · · · ∃ xn ψ. Pruebe que ⊢ ϕ si y sólo si ϕ es cierto en toda estructura de su lenguaje cuyo universo tenga un solo elemento. (iii) Suponga que x1 , x2 , . . . , xn , y1 , . . . , ym son las únicas variables libres en ψ y que ϕ es el enunciado ∀ x1 ∀ x2 · · · ∀ xn ∃ y1 ∃ y2 · · · ∃ ym ψ. Pruebe que ⊢ ϕ si y sólo si ϕ es cierto en toda estructura de su lenguaje cuyo universo tenga a lo más n elementos. 9. Sea L1 una extensión por definiciones de T y L2 una extensión por definiciones de T(L1 ). Pruebe que L2 es una extensión por definiciones de T. 10. Sea T una L-teoría consistente y ∆ un conjunto de enunciados tales que ϕ1 , . . . , ϕn ∈ ∆ ⇒ ϕ1 ∨ · · · ∨ ϕn ∈ ∆. Muestre la equivalencia de las siguientes afirmaciones: 1. T tiene un sistema de axiomas Γ ⊆ ∆, es decir, T |= Γ y Γ |= T. 2. Para cualesquier L-estructuras A, A′ se cumple A |= T y ∀ ϕ ∈ ∆(A |= ϕ ⇒ A′ |= ϕ) ⇒ A′ |= T. 360 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 361 ✐ ✐ Conjuntos y modelos. Curso avanzado [Sugerencia: Para la dirección importante sea Γ = {ϕ ∈ ∆ : T |= ϕ}. Para probar Γ |= T, defina para cualquier A′ arbitrario con A′ |= T el conjunto Σ = {¬ϕ : A′ |= ¬ϕ, ϕ ∈ ∆}. Muestre la consistencia de T ∪ Σ y deduzca la premisa de 2.] 11. Sea L un lenguaje de primer orden con solamente el símbolo no lógico =. Determine un criterio fácil tal que, para cualesquier L-estructuras A, A′ , decida si A ∼ = A′ . 12. Sea A una L-estructura y X ⊆ A. Defina A0 = \ {A′ : A′ ⊆ A ∧ X ⊆ A′ }. (a) Pruebe que existe una subestructura A0 de A con dominio A0 . (b) Muestre que A0 = {t A [s1 , . . . , sn ] : t es un L-término y s1 , . . . , sn ∈ X}. 13. Si T es un conjunto de fórmulas positivas (es decir, fórmulas que se construyen a partir de fórmulas atómicas y ∧, ∨, ∀ , ∃ ), entonces T se preserva respecto a epimorfismos, es decir, si A1 |= ϕ[s1 , . . . , sn ] y e es un epimorfismo sobre A2 , A2 |= ϕ[e(s1 ), . . . , e(sn )] para toda ϕ ∈ T . 14. Sean A0 ⊆ A1 ⊆ A2 L-estructuras. Demuestre o contradiga: (a) A0 ≺ A1 y A1 ≺ A2 ⇒ A0 ≺ A2 . (b) A0 ≺ A1 y A0 ≺ A2 ⇒ A1 ≺ A2 . (c) A0 ≺ A2 y A1 ≺ A2 ⇒ A0 ≺ A1 . 15. (Lema de Tarski). Sea hAn : n ∈ Ni una sucesión de L-estructuras con An ≺ An+1 para toda n ∈ N. Demuestre que para toda n ∈ N, An ≺ [ Ai . i∈N 16. Sean A, A′ L-estructuras con A ⊆ A′ . Demuestre que A ≺ A′ si y sólo si para cualquier fórmula ϕ y cualesquier s1 , . . . , sn ∈ A se cumple: si existe un s′ ∈ A′ con A′ |= ϕ[s1 , . . . , sn , s′ ], entonces existe un s ∈ A con A′ |= ϕ[s1 , . . . , sn , s]. 361 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 362 ✐ ✐ 5. Teoría de modelos 17. Sea L un lenguaje con igualdad que contiene sólo un símbolo de 1-predicado P. La teoría T debe determinar que P es cierto para una cantidad infinita de objetos y es falsa para una cantidad infinita de objetos, (a) Dé una axiomatización de T. (b) Pruebe que T es ℵ0 -categórica. (c) Pruebe que T no es κ-categórica para ningún κ no numerable. 18. Sean A = (Q, <Q ) y A′ = (R, <R ) las L-estructuras de los números racionales y reales, respectivamente. Demuestre las siguientes afirmaciones: (a) Si g : R − → R es biyectiva y monótona estrictamente creciente, entonces para cualesquier r1 , . . . , rn ∈ R se cumple A′ |= ϕ[r1 , . . . , rn ] ⇔ A′ |= ϕ[g(r1 ), . . . , g(rn )]. (b) Para q1 , . . . , qn ∈ Q y r ∈ R existe una biyección monótona estrictamente creciente g : R − → R con g(r) ∈ Q ∧ g(q1 ) = q1 , . . . , g(qn ) = qn . (c) A ≺ A′ . (d) A ∼ 6= A′ . 19. Un conjunto I 6= ∅ de isomorfismos parciales de A a A′ tiene la propiedad de “ida y vuelta”, es decir, 1. ∀ f ∈ I∀ x ∈ S∃ g ∈ I(f ⊆ g ∧ x ∈ dom(g)). 2. ∀ f ∈ I∀ y ∈ S ′ ∃ g ∈ I(f ⊆ g ∧ y ∈ ran(g)). f ⊆ g denota que g extiende a f en el siguiente sentido: dom(f ) ⊆ dom(g) ∧ ∀ x ∈ dom(f )(f (x) = g(x)). Puebe que A ∼ = A′ . 20. Sea hKi : i ∈ Ii una colección de clases elementales y sea K ⊇ ∩i∈I Ki una clase finitamente axiomatizable. Muestre que existe una subcolección finita hKi : i ∈ I0 i, I0 ⊆ I tal que K ⊇ ∩i∈I0 Ki . 21. Sea hKn : n ∈ Ni una sucesión de clases finitamente axiomatizables tales que para toda n ∈ N, Kn+1 es una subclase propia de Kn . Pruebe que ∪n∈N Kn no es finitamente axiomatizable. 22. Demuestre que la relación Φ |= ϕ es cierta si y sólo si Φ |=L ϕ para el menor lenguaje L que contenga a Φ y ϕ. Por lo tanto, es válido eliminar el símbolo L. 362 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 363 ✐ ✐ Conjuntos y modelos. Curso avanzado 23. Demuestre que Fml0 (L) es el único conjunto deductivamente cerrado e inconsistente de L-enunciados. 24. Sean T y T′ teorías en L. Demuestre que T′ ⊆ T si y sólo si para toda L-estructura A es cierto A |= T ⇒ A |= T′ . 25. Demuestre que Σ axiomatiza la teoría T si y sólo si Σ y T son lógicamente equivalentes, es decir, Σ|= = T. 26. La teoría T es una ∆-teoría si y sólo si T ⊆ T∆ (si y sólo si T = T∆ ). 27. Si A es isomorfa a una estructura de una clase elemental K, entonces A pertenece a K. [Sugerencia: Use inducción sobre la construcción de fórmulas para probar que las L-estructuras isomorfas poseen la misma Lteoría.] 28. Axiomatice la clase de todos los espacios vectoriales sobre un campo en K. Busque una signatura adecuada. 29. Use la notación del ejercicio 4.76. Sea Σ = {∃ !xPc (x) : c ∈ K} ∪ {∀ ~x∃ !yRf (~x, y) : f ∈ F} ⊆ Fml0 (L)∗ . Demuestre que 30. 31. 32. 33. 34. 35. 36. 37. Mod(Σ) = {A∗ : A es una L-estructura}. Demuestre el lema 6.1. ∆ Si ∆ ⊆ Fml0 (L), entonces f : A − → B si y sólo si A ⇛∆ B y f : A − → B. ∆ f :A− → B si y sólo si f : A − → B, donde ∆ = At(L). Un homomorfismo f : A − → B es un homomorfismo fuerte si para toda n ∈ N, para toda n-relación R ∈ R y b0 , . . . , bn−1 ∈ f [A] con RB (b0 , . . . , bn−1 ), existen elementos a0 , . . . , an−1 ∈ A con f (ai ) = bi (i < n) tales que RA (a0 , . . . , an−1 ). Demuestre: si ∆ ⊆ Fml(L) contiene todas las fórmulas atómicas y todas las negaciones de relaciones (es decir, fórmulas de la forma ¬R(~x) ∆ con R ∈ R), entonces de f : A − → B, se deduce que f es un homomorfismo fuerte. ∆ → B para ∆ = {¬(x=y)}. ˙ f :A− → B es inyectiva si y sólo si f : A − Si ∆ ⊆ Fml0 (L) contiene junto con cada enunciado también su negación, entonces de A ⇛∆ B se sigue A ≡∆ B. Si ∆ ⊆ Fml(L) contiene junto con cada fórmula también su negación, de ∆ f :A− → B se sigue que para toda ϕ ∈ ∆ y toda n-ada ~a de A es cierto que A |= ϕ[~a] si y sólo si B |= ϕ[f (~a)]. Use el lema del diagrama para demostrar que si dos estructuras A y B son Fml(L) isomorfas, entonces f : A − → B, en particular A ≡ B. [Sugerencia: 363 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 364 ✐ ✐ 5. Teoría de modelos Demuestre por inducción sobre la construcción de ϕ que (*) es cierta para toda L-fórmula ϕ, donde A |= ϕ[~a] ⇔ B |= ϕ[f (~a)].] (*) 38. Demuestre que los conjuntos definibles permanecen invariantes respecto a automorfismos, es decir, si A es una L-estructura y f es un automorfismo en A, entonces f [ψ(A)] = ψ(A) para toda L-fórmula ψ. [Sugerencia: Inmediato del Ejer. 37.] 39. Demuestre que para A ⊆ B es cierto que Teosc (A, A) = Teosc (B, A), y también Teosc (B, A) ⊆ (diag(A))|= . 40. Demuestre que dos estructuras isomorfas son elementalmente equivalentes. 41. Una L-teoría T es completa si y sólo si de ϕ ∨ ψ ∈ T se sigue que ϕ ∈ T o ψ ∈ T. 42. Sean A, B y C L-estructuras. Demuestre las siguientes propiedades: (i) A ≺ B si y sólo si A ⊆ B y (A, A) ≡ (B, A). Fml(L) 43. 44. 45. 46. (ii) f : A ֒→ B si y sólo si existe una L-estructura A′ ≺ B con f :A∼ = A′ . (iii) Si A ≺ B entonces A ≡ B. (iv) A ≺ A. (v) Si A ≺ B ≺ C, A ≺ C. (vi) Si A ⊆ B ≺ C y A ≺ C, A ≺ B. Demuestre que los encajes entre espacios vectoriales de dimensión infinita son elementales. Sea T una L-teoría, P un símbolo nuevo de relación o predicado, y L′ el lenguaje que se genera de L al añadir P. Encuentre una L′ -teoría T′ tal que los modelos de T′ sean las L′ estructuras A′ en la siguiente forma: el L-reducto A de A′ es modelo de T, el conjunto P(A′ ) es cerrado respecto a los símbolos no lógicos de L, y con ello la L-subestructura de A con universo P(A′ ) es un subestructura elemental de A. Demuestre mediante el orden ω de N que el criterio dado en el corolario 6.23 no es una condición necesaria. [Sugerencia: Demuestre que cada automorfismo de una extensión elemental de ω deja fijo al conjunto ω.] Demuestre el corolario 12.6. 364 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 365 ✐ ✐ Conjuntos y modelos. Curso avanzado 47. Sean A una L-estructura y ϕ ∈ Fmln (L) (n > 0) con ϕ(A) infinito. Entonces, para cada cardinal κ con κ ≥ |L| existe una L-estructura B ≡ A de cardinalidad κ con |ϕ(B)| = κ. 48. Si Φ es un conjunto finito de fórmulas y ϕ una fórmula, se cumple Φ(c) |= ϕ(c) ⇒ Φ |= ϕ. 49. Muestre que para todo LAr -término constante t existe un número natural n tal que t A = (S n (0))A , donde A es un modelo no estándar de la aritmética. Por lo tanto, los términos constantes siempre representan elementos estándar. (Para la notación asociada véase la pág. 331.) 50. En referencia a la notación de la página 331, demuestre que la función i : N − → Af es un isomorfismo. 51. Con la notación de la página 335 demuestre que la relación < realmente define un orden lineal en el conjunto A/ ∼, cuyo menor elemento es 0/ ∼= Af . En forma similar, demuestre que ∼ respeta la adición: Si a ∼ a′ y b ∼ b′ , entonces a + b ∼ a′ + b′ así que podemos definir la adición entre clases de equivalencia mediante a/ ∼ +b/ ∼= (a + b)/ ∼. Muestre que si a ∼ a′ y b ∼ b′ , entonces a + b ∼ a′ + b ′ . 52. Suponga que A es un modelo no estándar de la aritmética. Defina una operación ⊕ en A/ ∼ (notación de la pág. 335) tal que para cualesquier a, b ∈ A se cumple (a + b)/ ∼= (a/ ∼) ⊕ (b/ ∼). Muestre que no puede haber una operación binaria ⊙ en A/ ∼ que satisfaga (a ⊙ b)/ ∼= (a/ ∼) ⊙ (b/ ∼). [Sugerencia: Considere a ∈ A − A0 , b1 = 0, b2 = 1.] 53. Sea A un modelo no estándar de aritmética. Muestre que (1) Existe un elemento a ∈ A tal que para todo número primo p se cumple A |= S p 0|a. (2) Existe un elemento de a ∈ A, a > 1 tal que para ningún número primo p se satisface A |= S n 0|a. Fml(L) 54. Demuestre que de A ֒→ B se deduce A ≡ B. 365 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 366 ✐ ✐ 5. Teoría de modelos 55. Entre L-estructuras la equivalencia elemental es más débil que la isomorfía, pero todo encaje elemental es un encaje. Demuestre que el recíproco no es necesariamente cierto. 56. Sean Σ un conjunto de L-enunciados Φ(~x) y Ψ(~x) conjuntos de L-fórmulas con variables libres ~x = {x0 , . . . , xn−1 }; Φ, Ψ son equivalentes módulo Σ si y sólo si para alguna (toda) extensión L(~c) y una n-ada de nuevos símbolos de constante ~c ocurre que Ψ(~c) y Φ(~c) son equivalentes módulo Σ. 57. Sea T una L-teoría. ModL (T) es cerrada respecto a expansiones (o cerrada respecto a encajes) si para cualesquier L-estructuras A y B con A ֒→ B, de A |= T se sigue B |= T. Demuestre: (a) una L-fórmula ϕ(~x) es equivalente a una Σ1 -fórmula módulo una L-teoría T si y sólo si para cualesquier L-estructuras A, B, con A |= T y ϕ B |= T, de A ⊆ B se puede concluir A − → B, es decir, para toda n-ada ~a de elementos de A si A |= ϕ[~a], entonces B |= ϕ[~a]. (b) Sea ϕ un L-enunciado. ModL (ϕ) (respectivamente Mod(T) para una L-teoría T finitamente axiomatizable) es cerrada respecto a expansiones si y sólo si ϕ es equivalente a un Σ1 -enunciado (respectivamente a una Σ1 teoría). (c) Sea ∆ un conjunto de L-enunciados cerrado respecto a disyunciones finitas, es decir, si ϕ0 , . . . , ϕn−1 ∈ ∆, también ϕ0 ∨ · · · ∨ ϕn−1 pertenece a ∆. Una L-teoría T es una ∆-teoría (es decir, T ⊆ T∆ ) si y sólo si para cualesquier estructuras A, B con A |= T y B |= Teo∆ (A) es cierto que B |= T (se puede considerar que A y B son ajenas). [Sugerencia: ⇒ es trivial. Para la otra dirección, supongamos que B |= T∆ . Se debe probar que B |= T. Para ello sólo se requiere una L-estructura con B |= Teo∆ (A). Sea ¬∆ = {¬δ : δ ∈ ∆}. Si T ∪ Teo¬∆ (B) es consistente, existe tal A. ] (d) [Teorema de conservación de Łoś] Sea T una L-teoría. ModL (T) es cerrada respecto a expansiones si y sólo si T es una Σ1 -teoría. [Sugerencia: En el texto se observó que si una Σ1 -teoría cumple con Mod(T), es cerrada respecto a encajes. Para el recíproco, sea T una L-teoría cerrada respecto a expansiones. Demuestre que (*) Para cualesquier estructuras A, B con B |= Teo∃ (A), Teo(B) ∪ diag(A) es consistente. 366 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 367 ✐ ✐ Conjuntos y modelos. Curso avanzado 58. 59. 60. 61. Para probar (*): sea ϕ(~a) una conjunción de enunciados de diag(A); entonces ϕ no tiene cuantificadores, ~a ∈ An y A |= ϕ[~a]. Por lo tanto, A |= ∃ ~xϕ(~x), así que ∃ ~xϕ(~x) ∈ Teo∃ (A). Ya que B |= Teo∃ (A), B |= ∃ ~xϕ(~x). Existe ~b ∈ Bn con B |= ϕ(~b), por lo que (B, ~b) |= Teo(B) ∪ {ϕ(~a)}. De lo anterior concluya (*). Puesto que T es una Σ1 -teoría, basta probar (en vista del inciso [c]) que B |= T para toda A |= T y toda B |= TeoΣ1 (A). Sean A, B con esas propiedades. Por (*) Teo(B) ∪ diag(A) tiene un modelo, cuyo L-reducto B′ cumple con A ֒→ B′ y B ≡ B′ . De lo primero se sigue B′ |= T y de lo último B |= T. Pruebe que la teoría del grupo abeliano Q es κ-categórica si y sólo si κ es no numerable. Esta teoría es completa. Muestre que la teorı́a de los grupos abelianos infinitos de exponente primo (es decir, aquellos grupos abelianos infinitos que satisfacen ∀ x(px = 0)) es totalmente categórica y que esta teoría es completa. Pruebe que si un conjunto de L-enunciados T tiene funciones de Skolem incorporadas y A es un modelo de T, entonces Teo(A, A) también tiene funciones de Skolem incorporadas. Para toda L-fórmula ϕ existe una L∗ -fórmula universal ψ tal que ⊢ ψ⇒ϕ 62. 63. 64. 65. y ΣL ⊢ ϕ ⇒ ψ. (Una fórmula ϑ es universal si tiene la forma ∀ x1 · · · ∀ xn ϕ, donde ϕ0 no tiene cuantificadores y lib(ϕ0 ) ⊆ {x1 , . . . , xn }.) Sea A = hω, ≤i. Muestre que A tiene dos expansiones de Skolem que no son elementalmente equivalentes en L∗ . Ası́ la expansión de Skolem de Teo(A) no es completa. Suponga que en el teorema 6.30 tenemos A = B. Muestre que podemos construir A′ y B′ iguales. Esto demuestra lo siguiente: sea X ⊆ A y supongamos que f : X − → A es elemental con respecto a A y A. Entonces f se puede extender a un automorfismo de alguna extensión elemental de A. Sean A, B L-estructuras, X ⊆ A, f : X − → B, muestre que f es elemental con respecto a A y B si y sólo si (A, X) ≡ (B, f [X]). En particular, si existe una función f : X − → B que es elemental con respecto a A y B para algún subconjunto X de A (inclusive X = ∅), entonces A ≡ B. Sean g un isomorfismo entre A y B y f la restricción de g a un subconjunto X de A. Muestre que f es elemental respecto a A y B. 367 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 368 ✐ ✐ 5. Teoría de modelos 66. Considere espacios vectoriales sobre Q como L-estructuras donde L es el lenguaje asociado a la signatura con símbolos no lógicos +, 0, Fq para toda q ∈ Q. Cada Fq se interpreta como la multiplicación escalar por q en el espacio vectorial V . Supongamos que W es un Q-espacio vectorial y V es un Q-subespacio vectorial de W. Muestre que V ≺ W. 67. El teorema de consistencia de Robinson 14.8 se formuló originalmente como a continuación: sean Φ1 , Φ2 conjuntos consistentes de L1 -, L2 enunciados, respectivamente, y Φ ⊆ Φ1 ∪ Φ2 un conjunto completo de enunciados en el lenguaje L1 ∩ L2 . Entonces Φ es L1 ∪ L2 -consistente. Muestre que esta formulación es equivalente al teorema 14.8. Por supuesto, un conjunto Φ de enunciados es completo si para toda ϕ ∈ Fml0 (L), Φ |= ϕ o Φ |= ¬ϕ. 68. Muestre que si f es elemental respecto a A y B, g es elemental respecto a B y C y si el rango de g está contenido en el dominio de f , entonces f ◦ g es elemental respecto a A y C. 69. Muestre que si f es elemental respecto a A y B, entonces f −1 es elemental respecto a B y A. 70. Sea L un lenguaje y L′ una expansión mediante constantes de L. Muestre que si T es una L-teoría de Skolem, entonces T es una L′ -teoría de Skolem. 71. Suponga que T es una L-teoría y que para toda L-fórmula ϕ(~x, y) sin cuantificadores con ~x 6= ∅, existe un L-término t tal que T contiene el enunciado ∀ ~x(∃ yϕ(~x, y) ⇒ ϕ(~x, t(~x)). (a) Muestre que T tiene funciones de Skolem. (b) Muestre que para cualquier L-teoría T′ , con T ⊆ T′ , entonces T′ es equivalente a una Π1 -teoría. 72. Sea A una L-estructura con funciones de Skolem. Suponga que X es un conjunto de elementos que generan a A, y que < es un orden lineal de X (no necesariamente expresable en L). Muestre que todo elemento de A tiene la forma t A (~c) para algún L-término t(~x) y ~c ∈ (X)n . 368 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 369 ✐ ✐ CAPÍTULO 6 Ultrafiltros y ultraproductos 369 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 370 ✐ ✐ 6. Ultrafiltros y ultraproductos En este capítulo nos ocuparemos de los ultraproductos. Los ultraproductos son estructuras que se obtienen a partir de modelos ya existentes y permiten controlar algunas de sus propiedades. Requerimos una familia {Ai : i ∈ I} de L-estructuras y un ultrafiltro U sobre I. A partir de esto logramos una nueva Q L-estructura i∈I Ai /U, que es el ultraproducto de la familia {Ai : i ∈ I} respecto a U. Los ultraproductos tienen varias características importantes que los distinguen. La primera es que el ultraproducto se define en términos de estructuras y un ultrafiltro; su definición no usa recursión o fórmulas lógicas, figura muy apreciada por los algebristas. Sin embargo, los resultados de la teoría de modelos están presentes en el ultraproducto, escondidos en la elección del ultrafiltro. De hecho, frecuentemente la construcción del ultrafiltro involucra fórmulas lógicas o recursión. Existe una regla simple para determinar completamente la teoría del ultraproducto en términos del ultrafiltro y de las teorías de las estructuras que lo constituyen. Se trata precisamente del teorema de Łoś. Además, la formación de ultraproductos conmuta con la formación de reductos. Esto significa que la interpretación de cada símbolo de L en el ultraproducto es independiente de la interpretación de los otros símbolos, ası́ que podemos añadir o eliminar símbolos de la signatura sin afectar el resto del ultraproducto. Este hecho tiene numerosas aplicaciones, una de las cuales es que se pueden formar extensiones elementales en las que es posible controlar la cardinalidad de ciertos conjuntos definibles. Al inicio del capítulo estudiaremos filtros y ultrafiltros, herramienta fundamental para la construcción de ultraproductos. Presentamos la teoría con el detalle necesario para describir los ultraproductos y para calcular su cardinalidad en algunos casos. Sin embargo, varios hechos sobre ultrafiltros que aparecen en este capítulo serán de utilidad también en el capítulo 7. Para un estudio más detallado de ultraproductos, el lector puede consultar [BeSl69], [CK90] y [Hod97]. 1. Filtros Los filtros en conjuntos son una de las construcciones más útiles en cuanto a sus aplicaciones en diversas áreas: topología, álgebra y teoría de la medida, entre otras. A continuación presentamos su definición y propiedades principales. Definición 1.1. Sea S un conjunto no vacı́o. Un filtro sobre S es una colección F de subconjuntos de S que cumple las siguientes condiciones: 370 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 371 ✐ ✐ Conjuntos y modelos. Curso avanzado 1. S ∈ F y ∅ ∈ / F. 2. Si X, Y ∈ F entonces X ∩ Y ∈ F. 3. Si X ∈ F y X ⊆ Y ⊆ S entonces Y ∈ F. Ejemplo 1.2. El conjunto F = {S} es el filtro trivial sobre S y es el filtro más pequeño sobre S. Sean S un conjunto infinito y A ⊆ S, A 6= ∅. La colección FA = {X ⊆ S | A ⊆ X} es un filtro sobre S llamado filtro principal generado por A. Si A = {a} para algún a ∈ S, entonces el filtro principal FA es ⊆-máximo. Después veremos que hay filtros máximos y no principales. El filtro F = {X ⊆ S | S −X es finito} es el filtro de los conjuntos cofinitos de S si S es infinito, y es un filtro no principal porque si A ∈ F, entonces, al tomar un subconjunto propio suficientemente grande X ⊂ A de manera que X sea cofinito, X ∈ F. Definición 1.3. Sea G un conjunto. Decimos que G tiene laTpropiedad de intersección finita (pif) si para todo subconjunto finito H de G, H 6= ∅. Se sigue de la definición que cada filtro posee la propiedad de intersección finita; además, si G es un subconjunto de un filtro F entonces G tiene la pif. Recíprocamente, cada conjunto que tenga la pif es subconjunto de un filtro, tal como lo asegura el siguiente lema. Lema 1.4. Sea G 6= ∅ una colección de subconjuntos de S tal que G tiene la pif. Entonces hay un filtro F sobre S tal que G ⊆ F. Demostración. Sea F la colección de subconjuntos X de S con la propiedad de que hay un subconjunto finito de G, digamos {X1 , . . . , Xn } tal que X1 ∩ . . . ∩ Xn ⊆ X. Obviamente, S ∈ F; además, ∅ ∈ / F pues G tiene la pif. La tercera condición de la definición de filtro resulta clara. Para la segunda condición tomemos X, Y tales que para algunos conjuntos X1 , . . . , Xn , Y1 , . . . , Ym ∈ G se tiene X1 ∩ . . . ∩ Xn ⊆ X y Y1 ∩ . . . ∩ Ym ⊆ Y ; entonces X1 ∩ . . . ∩ Xn ∩ Y1 ∩ . . . ∩ Ym ⊆ Y ⊆ X ∩ Y , y por lo tanto X ∩ Y ∈ F. Ası́ que F es un filtro. El filtro construido en el lema anterior es el filtro mı́nimo que contiene al conjunto G. Definición 1.5. Un filtro U sobre S es un ultrafiltro si para cada X ⊆ S, X ∈ U o S − X ∈ U. 371 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 372 ✐ ✐ 6. Ultrafiltros y ultraproductos De manera equivalente, un ultrafiltro puede definirse como un filtro máximo respecto a la inclusión, según el siguiente lema. Lema 1.6. Un filtro F sobre S es un ultrafiltro si y sólo si es un filtro máximo sobre S. Demostración. ⇒ ) Supongamos que F es ultrafiltro y sea F ′ un filtro tal que F ⊆ F ′ . Si la contención fuera propia, entonces existirı́a un X ⊆ S tal que X ∈ F ′ − F y como F es ultrafiltro, entonces S − X ∈ F y por lo tanto S − X ∈ F ′ , de donde tendrı́amos que X ∩ (S − X) = ∅ ∈ F ′ , lo cual es absurdo. ⇐ ) Sea F un filtro que no es ultrafiltro. Entonces existe X ⊆ S tal que ni X ni S − X pertenecen a F. Sea G = F ∪ {X}, y afirmamos que G tiene la pif. Si X1 , . . . , Xn ∈ F, entonces Y = X1 ∩ . . . ∩ Xn ∈ F; además, Y ∩ X 6= ∅, de lo contrario Y ⊆ S − X, lo que implicaría S − X ∈ F. Por lo tanto, X1 ∩ . . . ∩ Xn ∩ X 6= ∅, lo cual significa que G = F ∪ {X} tiene la pif. Ası́ que por el lema 1.4 existe un filtro F ′ tal que G ⊆ F ′ , es decir, F no es un filtro maximal. Ya hemos visto que hay filtros principales maximales, es decir, existen ultrafiltros principales; pero ¿existirán ultrafiltros no principales, es decir, ultrafiltros que no estén generados por un elemento s ∈ S? La respuesta es sı́. Sea S un conjunto infinito y F el filtro de los cofinitos de S. Si U es un ultrafiltro y extiende a F, entonces U no puede ser principal puesto que el filtro de los cofinitos no es principal. Ası́ que para encontrar un ultrafiltro no principal basta con encontrar un ultrafiltro que extienda al filtro de los cofinitos. El inverso también es cierto; si U es un ultrafiltro no principal, entonces extiende al filtro de los cofinitos puesto que cada X ∈ U es infinito, de acuerdo con el lema 1.10. Culminaremos la sección presentando el teorema del ultrafiltro debido a Tarski. Este teorema utiliza el axioma de elección; además, se sabe que no puede ser probado en ZF. Veamos primero un lema. Lema 1.7. Si C es una ⊆-cadena de filtros sobre S, entonces sobre S. S C es un filtro Demostración. Ejercicio. Teorema 1.8 (Tarski). Todo filtro sobre S puede extenderse a un ultrafiltro. 372 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 373 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sean F0 un filtro sobre S y P el conjunto de todos los filtros F sobre S tales que F0 ⊆ F. Considere el orden parcial ⊆ en P. Claramente, P es no vacı́o y si C es una cadena en P, entonces por el lema S S 1.7 C es un filtro sobre S, de manera que C es una cota superior de C que pertenece a P. El lema de Zorn asegura que existe un elemento maximal U en P y U es un ultrafiltro por el lema 1.6. Lema 1.9. Si F es un filtro principal, entonces F es un ultrafiltro si y sólo si el conjunto que genera a F consiste solamente en un elemento. Demostración. Suponga que x ∈ S y F = {X ⊆ S : x ∈ X}. Para cada X ⊆ S, ya sea x ∈ X o x ∈ S − X, entonces F es un ultrafiltro. Recíprocamente, supongamos que F es un ultrafiltro principal y que T X0 = {X : X ∈ F} contiene dos elementos x, y. Como F es un ultrafiltro, {x} o S − {x} está en F. En el primer caso y ∈ / X0 y en el segundo caso x∈ / X0 . Esta contradicción muestra que X0 contiene un solo elemento. Este lema muestra que si S tiene cardinalidad κ, existen precisamente κ ultrafiltros principales distintos en S. Por supuesto, si S es finito, todos los ultrafiltros en S son principales (véase Ejer.6) El siguiente lema muestra que los ultrafiltros no principales contienen sólo conjuntos infinitos. Lema 1.10. Un ultrafiltro no principal contiene solamente conjuntos infinitos. Demostración. Sea U un ultrafiltro que contiene conjuntos finitos. Sea X un conjunto de cardinalidad mínima en U. Como U es propio, X no es vacío. Mostraremos que X contiene un único elemento. Supongamos lo contrario: digamos que x, y pertenecen a X. Como X es de cardinalidad mı́nima en U entonces {x} ∈ / U, por lo que S − {x} ∈ U. Por lo tanto, X ∩ (S − {x}) = X − {x} ∈ U. Pero X − {x} contiene menos elementos que X pues X es finito, lo que contradice nuestra elección de X. Esto demuestra que X contiene exactamente un elemento, digamos x. Se sigue que U es el ultrafiltro principal generado por x. Como ya vimos, el filtro de los conjuntos cofinitos se extiende a un ultrafiltro no principal. Sean U un ultrafiltro no principal en S y X, Y subconjuntos de S tales que X − Y es finito y X ∈ U. Entonces podemos concluir que Y ∈ U: puesto que X − Y es finito, S − (X − Y ) ∈ U; por consiguiente, X ∩ {S − (X − Y )} = X ∩ Y ∈ U. Pero X ∩ Y ⊆ Y , lo cual indica que Y ∈ U. 373 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 374 ✐ ✐ 6. Ultrafiltros y ultraproductos Ya hemos demostrado que existe al menos un ultrafiltro no principal en un conjunto infinito S. Suponga que |S| = κ. Entonces |Pot(S)| = 2κ . Un κ ultrafiltro en S es un subconjunto de Pot(S). Existen 22 subconjuntos de Pot(S) κ y, por lo tanto, pueden existir a lo sumo 22 ultrafiltros no principales en S. El siguiente teorema muestra que ésta es realmente la cardinalidad del conjunto de ultrafiltros no principales. Definición 1.11. Si S es un conjunto infinito, Fin(S) es el conjunto de subconjuntos finitos de S. Teorema 1.12. Si S es un conjunto infinito de cardinalidad κ, existen 22 ultrafiltros no principales en S. κ Demostración. Como S es infinito, |Fin(S)| = κ y Fin(Fin(S)) tiene cardinalidad también igual a κ. Puesto que S es infinito existen dos subconjuntos distintos A, B de cardinalidad κ cuya unión es S y f una función biyectiva de A sobre B. Si X ⊆ A, sea X+ = X ∪ (B − {f (x) : x ∈ X}), así que X+ es X unido con aquellos elementos de B que no están en la imagen de X respecto a f . Supongamos que X, Y ⊆ A y X 6= Y . Entonces X − Y o Y − X es no vacío. Si x ∈ X − Y , x ∈ X+ − Y + , y si x ∈ Y − X, f (x) ∈ X+ − Y + . En cualquier caso, X+ 6⊆ Y + . Hemos demostrado que Sea X, Y ⊆ A ∧ X 6= Y ⇒ X+ 6⊆ Y + . (63) S = Fin(S). S también tiene cardinalidad κ y sea A = {S − Fin(X+ ) : X ⊆ A}. Entonces A ⊆ Pot(S) y, por 63, A tiene cardinalidad 2κ . Supongamos que X = S − Fin(X+ ) ∈ A y que Y es un subconjunto finito de A que no contiene a X. Digamos que Y = {S − Fin(Yi+ ) : i ≤ n}. Para i ≤ n, X 6= Yi y, en consecuencia, por 63, X+ 6⊆ Yi+ . 374 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 375 ✐ ✐ Conjuntos y modelos. Curso avanzado Sea g(i) un elemento de X+ − Yi+ , y sea U = {g(i) : i ≤ n}. U es un subconjunto finito de X+ y, por lo tanto, no pertenece a X. Por construcción, para i ≤ n, U * Yi+ , por lo que U pertenece a S − Fin(Yi+ ), así que U ∈ ∩Y. Hemos demostrado entonces que X ∈ A ∧ Y ∈ Fin(A) ∧ X ∈ / Y⇒ Sea \ Y * X. (64) I = Fin(S). Otra vez I tiene cardinalidad κ. Sea B = {Fin(X) : X ∈ A}, con lo que B ⊆ Pot(I) y B tiene cardinalidad 2κ . Sean X = {Fin(Xi ) : i ≤ m} y Y = {Fin(Yj ) : j ≤ n} subconjuntos finitos ajenos de B. Entonces, para cada i ≤ m, Xi ∈ / {Yj : j ≤ n} y por 64 existe un elemento, digamos h(i), en T j≤n Yj V = {h(i) : i ≤ m}. − Xi . Sea V es un subconjunto finito de cada Yj y, por consiguiente, V∈ \ Fin(Yj ) = j≤n \ Y. V no es subconjunto de ningún Xi y, en consecuencia, V ∈ / hemos mostrado que si X, Y son ajenos y contenidos en B, entonces Para Z ⊆ B, sea \ S X. Por lo tanto, Y* [ X. (65) Z∗ = (B − Z) ∪ {I − X : X ∈ Z}. Si Z1 , Z2 ⊆ B y Z1 6= Z2 , claramente existe X ⊆ I con X ∈ Z∗1 e I − X ∈ Z∗2 . κ Así que existen 22 conjuntos distintos Z∗ , cada uno correspondiendo a cada subconjunto de B. 375 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 376 ✐ ✐ 6. Ultrafiltros y ultraproductos Supongamos que Z ⊆ B y sea {X1 , . . . , Xm , I − Y1 , . . . , I − Yn } un subconjunto finito de Z∗ tal que Xi ∈ / Z para i ≤ m, y Yi ∈ Z para j ≤ n. Por 65, X1 ∩ · · · ∩ Xm * Yi ∪ · · · ∪ Yn , de donde se sigue que X1 ∩ · · · ∩ Xm ∩ (I − Y1 ) ∩ · · · ∩ (I − Yn ) 6= ∅. Esto exhibe que Z∗ tiene la propiedad de la intersección finita. En consecuencia, se puede extender a un ultrafiltro UZ en I. Por lo antes observado, Z1 6= Z2 κ implica que UZ1 6= UZ2 por lo que {UZ : Z ⊆ B} es una familia de 22 ultrafiltros en I. Como I tiene la misma cardinalidad que S, podemos encontrar una biyección entre S e I y transformar los ultrafiltros de I en ultrafiltros de κ S. Como existen a lo sumo κ ultrafiltros principales en S, debemos tener 22 ultrafiltros no principales en S. Definición 1.13. Un ultrafiltro U en un conjunto S es uniforme si todos los conjuntos en U tienen la misma cardinalidad que S: En todo conjunto infinito existe al menos un ultrafiltro uniforme, como lo asegura el siguiente lema. Lema 1.14. Si S es un conjunto infinito, existe un ultrafiltro uniforme en S. Demostración. Sea κ la cardinalidad de S y A el conjunto de todos los subconjuntos de S cuyos complementos tienen cardinalidad < κ. Entonces X ∈ A si y sólo si X ⊆ S y |S − X| < κ. Se verifica fácilmente que A tiene la pif, por lo que se puede extender a un ultrafiltro U en S. Claramente, este ultrafiltro no contiene conjuntos de cardinalidad menor que κ y es, por lo tanto, uniforme. De hecho, todo ultrafiltro uniforme debe contener los conjuntos de A, y recíprocamente todo ultrafiltro que contenga a A es uniforme. Es obvio que en un conjunto numerable la familia de ultrafiltros no principales coincide con la familia de los ultrafiltros uniformes. El recíproco de esta afirmación también es cierto. 376 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 377 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 1.15. Sea S un conjunto infinito. La familia de ultrafiltros no principales en S y la familia de ultrafiltros uniformes en S coinciden si y sólo si S es numerable. Demostración. Por lo dicho, sólo una dirección no es trivial. Supongamos que S tiene cardinalidad κ no numerable. Sea λ un cardinal menor que κ y J un subconjunto de S de cardinalidad λ. Sea G = {X ⊆ S : J − X es finito}. Se comprueba fácilmente que G tiene la pif y contiene todos los subconjuntos de A (el conjunto de la prueba del lema 1.14). Por lo tanto, G se puede extender a un ultrafiltro no principal U en S. En particular, J ∈ G ⊆ U, así que U no es uniforme. El motivo de este capítulo es la construcción de ultraproductos que son cierto tipo de modelos; los ultrafiltros principales no dan lugar a nuevos modelos mediante ultraproductos y los ultrafiltros uniformes son realmente los únicos que debemos considerar para los ultraproductos, como veremos posteriormente. Definición 1.16. Un ultrafiltro U en el conjunto S es ℵ0 -completo si para toda T familia {Xn : n < ω} de elementos de U, su intersección {Xn : n < ω} también pertenece a U. U es ℵ0 -incompleto si no es ℵ0 -completo. La definición se puede generalizar a un cardinal infinito κ. U es κ-completo si para cualquier familia de conjuntos Xξ ∈ U con ξ < κ se tiene que T {Xξ : ξ < κ} también pertenece a U. U es κ-incompleto si no es κ-completo. Lema 1.17. Un ultrafiltro principal es κ-completo para toda κ. Demostración. Si U está generado por {x}, entoncesTpara cualquier colección {XT ξ : ξ < κ} de elementos de U tenemos que {x} ⊆ {Xξ : ξ < κ}. Por lo tanto, {Xξ : ξ < κ} ∈ U. La pregunta natural es: ¿existen ultrafiltros no principales que sean ℵ0 completos? A continuación logramos una respuesta completa para conjuntos numerables. Lema 1.18. Si S es un conjunto de cardinalidad κ, entonces no existen ultrafiltros no principales κ-completos en S. 377 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 378 ✐ ✐ 6. Ultrafiltros y ultraproductos Demostración. Sean {xξ : ξ < κ} una enumeración de S y U un ultrafiltro no principal en S. Para ξ < κ, sea Xξ =TS − {xξ }. Como U es no principal, los conjuntos Xξ pertenecen a U. Pero ξ<κ Xξ = ∅, que no es miembro de U. Por consiguiente, U no es κ-completo. Una consecuencia obvia es: Corolario 1.19. Todo ultrafiltro no principal en un conjunto numerable es ℵ0 -incompleto. La pregunta sobre la existencia de ultrafiltros ℵ0 -completos no principales en conjuntos no numerables es un problema muy famoso en teoría de conjuntos. A continuación introduciremos el concepto de cardinal medible en términos de ultrafiltros, y algunas de sus propiedades. Sin embargo, posponemos hasta el segundo volumen un estudio más detallado y otras caracterizaciones de los cardinales medibles. Definición 1.20. Un cardinal κ es medible si κ es no numerable y existe un ultrafiltro no principal en κ que sea λ-completo para toda λ < κ. Aquellos lectores familiarizados con la teoría de la medida notarán que si U es un ultrafiltro en S, entonces la función definida por µ : Pot(S) − → {0, 1}, ( 1, si X ∈ U, 0, si X ∈ / U, es una medida bivaluada en S que no es trivial, si U es no principal y es λ-aditiva, si U es λ-completo. En consecuencia, κ es un cardinal medible si y sólo si κ es no numerable y existe una medida no trivial bivaluada en κ que es λ-aditiva para cada λ < κ. Por ello a este tipo de cardinales se les llama medibles. Diremos que un cardinal κ es ℵ0 -medible si existe un ultrafiltro no principal ℵ0 -completo en κ. Por lo general se usa medible para nuestra noción de cardinal ℵ0 -medible, pero el siguiente teorema resta importancia a tal distinción. Requerimos la siguiente caracterización de ultrafiltros κ-completos. µ(X) = Lema 1.21. Sea U un ultrafiltro en S. U es κ-completo si y sólo si para todo λ ≤ κ y toda partición {Xξ : ξ < λ} de S existe un único ξ0 < λ tal que Xξ0 ∈ U. 378 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 379 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Supongamos que U es κ-completo, λ ≤ κ y {Xξ : ξ < λ} es una partición de S. Puesto que los Xξ son mutuamente ajenos, a lo sumo uno de ellos pertenece a U. Suponga que ninguno pertenece a U. Entonces para ξ < λ, tenemos que S − Xξ ∈ U. Como U es κ-completo, se cumple lo siguiente: \ ξ<λ (S − Xξ ) = S − [ ξ<λ Xξ = S − S = ∅ ∈ U, lo que contradice el hecho de que U es propio. El recíproco se prueba en forma similar (véase el Ejer. 7). Teorema 1.22. Existen cardinales medibles si y sólo si existen cardinales ℵ0 medibles. Demostración. Como todo cardinal medible es ℵ0 -medible, solamente debemos probar una dirección. Supongamos que existen cardinales ℵ0 medibles y sea κ el menor de tales cardinales. Por el lema 1.18, κ debe ser no numerable. Sea U un ultrafiltro no principal ℵ0 -completo en κ. Mostraremos que U es λ-completo para cada λ < κ. Suponga lo contrario; entonces existe λ < κ con la propiedad de que U es λ-incompleto. De acuerdo con el lema 1.21, existe una partición {Xξ : ξ < λ} de κ tal que para cada ξ < λ, Xξ ∈ / U. S S Sea I = {Xξ : ξ < λ} y para A ⊆ I, sea A = {Xξ : ξ ∈ A}. Definimos la colección E de subconjuntos de I por E = {A ⊆ I : [ A ∈ U}. Claramente, I ∈ E y ningún subconjuntoSfinito de I pertenece a E. Supongamos S S que A ∈ E y A ⊆ B ⊆ I. Entonces A ∈ U y A ⊆ B. Por lo tanto, S B ∈ U y, en consecuencia, B ∈ E. S S S S Si A ⊆ I, A∪ (I −A) = κ. En consecuencia, A ∈ U o (I −A) ∈ U pero, por supuesto, no ambos. Entonces A ∈ E o I − A ∈ E, pero no ambos. Finalmente suponga que para cada n ∈ ω, An ∈ E. Para n ∈ ω, S n∈ω An ∈ U, lo que implica, en vista de la ℵ0 -completud de U, que \ n∈ω [ An n∈ω ! ∈ U. 379 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 380 ✐ ✐ 6. Ultrafiltros y ultraproductos Puesto que los conjuntos en I son mutuamente ajenos, \ n∈ω T [ An n∈ω ! = [ n∈ω \ ! An , n∈ω de donde se sigue que n∈ω An ∈ E. Hemos demostrado que E es un ultrafiltro no principal ℵ0 -completo en I. Como I tiene cardinalidad λ < κ, esto contradice nuestra elección de κ. Podemos concluir que U es λ-completo para cada λ < κ y que κ es, por tanto, un cardinal medible. Lema 1.23. Sean U un ultrafiltro en S y κ el menor cardinal tal que U es κ-incompleto. Entonces existe una sucesión hXξ : ξ < κi de elementos de U tal que: (1) X ⊆ Xξ , si ξ ≤ η < κ. Tη (2) ξ<κ Xξ = ∅. Demostración. Como U es κ-incompleto, existe una familia {Yξ : ξ < κ} T / U. Así que S − Y ∈ U. Para de elementos de U tales que Y = ξ<κ Yξ ∈ ξ < κ, sea \ Xξ = (S − Y ) ∩ Yζ . ζ<ξ Como |ξ| < κ, U es |ξ|-completo y Xξ ∈ U. Claramente, (1) es cierto y finalmente \ ξ<κ Xξ = (S − Y ) ∩ Esto completa la prueba. \ ξ<κ Yξ = (S − Y ) ∩ Y = ∅. Ahora introducimos el concepto de ultrafiltro regular, cuya importancia se hará patente cuando consideremos cardinalidades de ultraproductos. Definición 1.24. Decimos que U es un ultrafiltro regular en S si existe una biyección f : S −→ Fin(S) tal que para cada s ∈ S, {j ∈ S : s ∈ f (j)} ∈ U. Note que siempre existe una biyección entre S y Fin(S), pero esta biyección no necesariamente cumple la condición de la definición. Es importante identificar las relaciones que existen entre los ultrafiltros regulares y las otras clases de ultrafiltros. 380 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 381 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 1.25. Sea S un conjunto infinito. Entonces existe un ultrafiltro regular en S. Todo ultrafiltro regular en S es ℵ0 -incompleto y uniforme. sea Demostración. Sea f una biyección de S sobre Fin(S). Para cada i ∈ S, Ei = {j ∈ S : i ∈ f (j)}. Mostraremos que la familia E = {Ei : i ∈ S} tiene la pif. Sea {Ei1 , . . . , Ein } un subconjunto finito de E e {i1 , . . . , in } es un subconjunto finito de S, por lo que es la imagen f (i0 ) para alguna i0 ∈ S. Para j ≤ n, ij ∈ f (i0 ), y en consecuencia i0 ∈ Ei1 ∩ · · · ∩ Ein . Por consiguiente, E tiene la pif y se puede extender a un ultrafiltro U en S. Por nuestra construcción, U es un ultrafiltro regular. Ahora suponga que U es un ultrafiltro regular en S. Entonces existe una función f : S −→ Fin(S) tal que para i ∈ S, {j ∈ S : i ∈ f (j)} ∈ U. Por hipótesis, cada Xn pertenece a U, pero obviamente \ n∈ω Xn = {j ∈ S : ∀ n ∈ ω, in ∈ f (j)} = ∅ y no pertenece a U. Esto muestra que U es ℵ0 -incompleto. Falta probar que U es uniforme. Suponga que X ⊆ S y |X| < |S|. Claramente, [ i∈X f (i) < |S|, y por lo tanto, existe algún j0 ∈ I − entonces i ∈ / X. Se sigue que S i∈X f (i). Si, para i ∈ S, j0 ∈ f (i), {i ∈ S : j0 ∈ f (i)} ⊆ S − X. Como {i ∈ S : j0 ∈ f (i)} ∈ U, podemos concluir que S − X ∈ U y así X ∈ / U. Esto demuestra que U es uniforme. No se sabe si todo ultrafiltro ℵ0 -incompleto uniforme es regular. No obstante, el caso de un conjunto numerable es más simple. 381 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 382 ✐ ✐ 6. Ultrafiltros y ultraproductos Lema 1.26. Sea S = {in : n ∈ ω} un conjunto numerable y U un ultrafiltro no principal en S. Existe una sucesión hXn : n ∈ ωi de subconjuntos de S tales que (1) X0 = S, (2) para cada n, Xn+1 ⊆ Xn , y Xn − Xn+1 es infinito, (3) T para cada n, Xn ∈ U, (4) n∈ω Xn = ∅. Demostración. Sea X0 = S. Suponga que k < ω, y que para cada n ≤ k se han definido los Xn de forma que satisfagan (1)–(3) y (5) para m < n, im ∈ / Xn . Sean Ak , Bk conjuntos infinitos ajenos cuya unión es Xk . Como Xk ∈ U, Ak o Bk pertenece a U. Si Ak ∈ U, entonces también Ak − {ik } y sea Xk+1 este conjunto. Si Ak ∈ / U, Bk ∈ U y Bk − {ik } ∈ U, sea Xk+1 este conjunto. En cualquier caso, hemos encontrado conjuntos Xn para n ≤ k + 1 de tal forma que se satisfacen (1)–(3) y (5). Por inducción, para toda n podemos encontrar un conjunto Xn tal que se satisfacen esas condiciones. Como cada Xn satisface T (5), se sigue que n∈ω Xn = ∅ y la prueba está completa. Lema 1.27. Si U es un ultrafiltro no principal en el conjunto numerable S = {in : n ∈ ω}, entonces U es regular. Demostración. Sea hXn : n ∈ ωi la sucesión de conjuntos dada por el lema 1.26. Para cada n ∈ ω, sea Yn la colección de todos aquellos subconjuntos finitos de S que contienen a cada ik con k < n. Claramente, (1) Y0 = Fin(S), (2) T para cada n, Yn+1 ⊆ Yn y Yn − Yn+1 es infinito, (3) n∈ω Yn = ∅. Para cada n, sean fn : Xn − Xn+1 − → Yn − Yn+1 una función inyectiva y S f = {fn : n ∈ ω}. En vista de las propiedades de los conjuntos Xn y Yn , f : S −→ Fin(S) es una función biyectiva. Para cada n ∈ ω, si i ∈ Xn+1 entonces f (i) ∈ Yn+1 y, por lo tanto, in ∈f (i). En consecuencia, Xn+1 ⊆ {i ∈ S : in ∈ f (i)}, pero Xn+1 ∈ U, de donde {i ∈ S : in ∈ f (i)} ∈ U. Esto muestra que U es regular. 382 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 383 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 1.28. Sea S un conjunto numerable. Entonces las familias de ultrafiltros no principales ℵ0 -incompletos, uniformes y regulares sobre S coinciden. Demostración. Es inmediata a partir de los lemas 1.15, 1.18 y 1.27. 2. Ultrapotencias Los ultraproductos son estructuras nuevas que se conforman a partir de estructuras ya conocidas. Los ingredientes son: una familia {Ai | i ∈ I} de Lestructuras para una signatura fija σ con su lenguaje asociado L y un ultrafiltro Q U sobre I. El resultado es una nueva L-estructura denotada i∈I Ai /U y conocida como ultraproducto de {Ai | i ∈ I} sobre U. La definición del ultraproducto Q Q i∈I Ai /U se hace en dos pasos: primero definimos el producto directo i∈I Ai y después formamos una imagen homomorfa mediante U. Antes de seguir con la definición, recordemos lo que es un producto cartesiano o producto directo de conjuntos. En lo sucesivo fijamos una signatura σ = (R, F, K, τ) y su lenguaje asociado L. Definición 2.1. Sea {Ai | i ∈ I} una familia de conjuntos; definimos el Q producto directo de {Ai | i ∈ I}, denotado i∈I Ai , como el siguiente conjunto de funciones: Y [ Ai = {a : I −→ Ai | a(i) ∈ Ai }. i∈I i∈I Ahora definimos el producto directo de una familia de L-estructuras. Definición 2.2. Q Sea {Ai | i ∈ I} una familia de L-estructuras. Definimos el producto directo i∈I Ai como la siguiente L-estructura P: Q 1. dom(P) = i∈I dom(Ai ) S 2. Para cada sı́mbolo de constante c ∈ K, cP : I −→ i∈I dom(Ai ) cumple con cP (i) = cAi . 3. Para cada sı́mbolo de n-función f ∈ F y cada n-ada (a0 , . . . , an−1 ) ∈ dom(P)n , f P (a0 , . . . , an−1 ) = b si y sólo si b(i) = f Ai (a0 (i), . . . , an−i (i)). 4. Para cada sı́mbolo de n-relación R ∈ R y cada n-ada (a0 , . . . , an−1 ) ∈ dom(P)n , RP (a0 , . . . , an−1 ) si y sólo si para toda i ∈ I, RAi (a0 (i), . . . , an−1 (i)). 383 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 384 ✐ ✐ 6. Ultrafiltros y ultraproductos Para terminar la definición de ultraproducto necesitamos la siguiente definición: Definición 2.3. Sea ϕ(~x) una L-fórmula y ~a una n-ada de elementos de dom(P). Definimos el valor booleano de ϕ(~a), denotado kϕ(~a)k, como1 kϕ(~a)k = {i ∈ I | Ai |= ϕ(~a(i))}. Tenemos las siguientes propiedades del valor booleano. Proposición 2.4. Sean ϕ(~x), ψ(~x) fórmulas y ~a una n-ada de elementos de i∈I Ai . Entonces 1. k¬ϕ(~a)k = I \ kϕ(~a)k. 2. kϕ(~a) ∧ ψ(~a)k = kϕ(~a)k ∩ kψ(~a)k. 3. kϕ(~a) ∨ ψ(~a)k = kϕ(~a)k ∪ kψ(~a)k. Q Q 4. Para toda (n − 1)-ada de elementos de i∈I Ai y toda b ∈ i∈I Ai , se cumple kϕ(b,~ a)k ⊆ k∃xϕ(x,~a)k. Q 5. Existe b ∈ i∈I Ai tal que kϕ(b,~a)k = k∃xϕ(x,~a)k. Q Demostración. Las afirmaciones (1) a (4) son consecuencia directa de la definición. Vamos a demostrar (5), para lo cual basta demostrar que hay un Q b ∈ i∈I Ai tal que kϕ(b,~a)k ⊇ k∃xϕ(x,~a)k. Para cada i ∈ k∃xϕ(x,~a)k existe ci ∈ Ai tal que Ai Q|= ϕ(ci ,~a(i)). Mediante el axioma de elección tomemos un elemento b ∈ i∈I Ai tal que si i ∈ k∃xϕ(x,~a)k, se cumple b(i) = ci ; y si j ∈ I \ k∃xϕ(x,~a)k, b(j) es cualquier elemento de Aj . Sea i ∈ k∃xϕ(x,~a)k, es decir, Ai |= ∃xϕ(x,~a(i)). Por la elección de b(i) tenemos Ai |= ϕ(b(i),~a(i)). Por lo tanto, i ∈ kϕ(b,~a)k. La construcción de un ultraproducto se hace mediante una relación de equivalencia que definimos en seguida. Definición 2.5. Sea I un conjunto no vacı́o y F un filtro sobre I. Definimos Q la relación de equivalencia ∼ sobre dom( i∈I Ai ) como a ∼ b si y sólo si ka=bk ˙ ∈F Proposición 2.6. ∼ es una relación de equivalencia. 1 Debe quedar claro que si ~a = (a0 , . . . , an−1 ) es una n-ada de elementos de entonces ~a(i) significa siempre (a0 (i), . . . , an−1 (i)). Q i∈I Ai , 384 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 385 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. - Claramente ∼ es reflexiva pues como para toda i ∈ I, Ai |= a(i) = a(i), entonces ka=ak ˙ = I ∈ F. ˙ = kb=ak. ˙ - La simetrı́a resulta obvia pues ka=bk - La transitividad también es inmediata pues si ka=bk, ˙ kb=ck ˙ ∈ F, entonces ka=bk ˙ ∩ kb=ck ˙ ∈ F y como ka=bk ˙ ∩ kb=ck ˙ ⊆ ka=ck, ˙ entonces ka=ck ˙ ∈ F. A la clase de equivalencia de a módulo un filtro F la denotamos mediante a/F. Mediante esta relación de equivalencia y el producto directo de Lestructuras, vamos a definir una nueva L-estructura. Definición 2.7. Sean {Ai | i ∈ I} una Q familia de L-estructuras y P = A . Definimos el producto reducido i i∈I Ai /F como la siguiente σi∈I estructura U: Q 1. dom(U) = {a/F | a ∈ dom(P)} 2. Para cada sı́mbolo de constante c ∈ K, cU = cP /F. 3. Para cada símbolo de n-función f ∈ F y cada n-ada (a0 /F, . . . , an−1 /F) ∈ dom(U)n , f U (a0 /F, . . . , an−1 /F) = f P (a0 , . . . , an−1 )/F. 4. Para cada símbolo de n-relación R ∈ R y cada n-ada (a0 /F, . . . , an−1 /F) ∈ dom(U)n , RU (a0 /F, . . . , an−1 /F) si y sólo si ~bR(a0 , . . . , an−1 ) ∈ F Q de Si U es un ultrafiltro entonces la estructura i∈I Ai /U es el ultraproducto Q {Ai | i ∈ I} sobre U. Si tenemos Ai = A para toda i ∈ I, entonces i∈I A/F se denota con AI /F y es una potencia reducida de A o una ultrapotencia si F es un ultrafiltro. Como siempre que se utilizan relaciones de equivalencia, el lector debe cerciorarse de que la definición es independiente del representante (véase el Ejer. 8). El siguiente lema muestra cómo se interpretan los términos en un ultraproducto. 385 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 386 ✐ ✐ 6. Ultrafiltros y ultraproductos Lema 2.8. Sean t(x1 , . . . , xn ) un término con n variables, U un ultrafiltro sobre Q I, U = i∈I Ai /U y (a1 , . . . , an ) una n-ada de elementos de dom(U). Entonces t U [a1 /U, . . . , an /U] = b/U si y sólo si b(i) = {i ∈ I : tiA [a1 (i), . . . , an (i)]} ∈ U, es decir, t U [a1 /U, . . . , an /U] = t P [a1 , . . . , an ]/U. Demostración. Por inducción sobre la construcción de términos. Sea ~a = (a1 , . . . , an ). t = c. t U [~a/U] = cU [~a/U] = cU = cP /U = t P [~a]/U. t = x1 . t U [~a/U] = x1U [~a/U] = a1 /U y claramente a1 (i) = x1Ai [a1 (i)]. Por lo tanto, a1 /U = x1P [~a]/U = t P [~a]/U. t = f (t1 , . . . , tn ). La hipótesis de inducción es tjU [~a/U] = tjP [~a]/U para 1 ≤ j ≤ n. f (t1 , . . . , tn )U [~a/U] = f U (t1U [~a/U], . . . , tnU [~a/U]) = f U (t1P [~a]/U, . . . , tnP [~a]/U) = f P (t1P [~a], . . . , tnP [~a])/U = f (t1 , . . . , tn )P [~a]/U = t P [~a]/U. Ahora presentamos el teorema fundamental de ultraproductos debido a Jersy Łoś. Teorema 2.9 (Łoś). Sean {Ai | i ∈ I} una familia de L-estructuras, U un Q ultrafiltro sobre I y ~a una n-ada de elementos de dom( i∈I Ai /U). Entonces Y i∈I Ai /U |= ϕ(~a/U) si y sólo si kϕ(~a)k ∈ U. Q prueba es por inducción sobre Demostración. Sea U = i∈I Ai /U. La Q la construcción de las fórmulas. Otra vez P = i∈I Ai . 1. ϕ es una fórmula atómica. 386 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 387 ✐ ✐ Conjuntos y modelos. Curso avanzado • ϕ = t1 =t ˙ 2. U |= (t1 =t ˙ 2 )[~a/U] ⇔ t1U [~a/U] = t2U [~a/U] ⇔ t1P [~a]/U = t2P [~a]/U t1P (~a) (por el lema 2.8) t2P (~a) ⇔ ∼ ⇔ kt1 (~a)=t ˙ 2 (~a)k ∈ U. • ϕ = R(t1 , . . . , tn ). Es análogo al caso anterior. 2. Paso inductivo. • ϕ = ¬ψ. U |= ϕ[~a/U] ⇔ ⇔ ⇔ ⇔ ⇔ • ϕ = ψ ∧ χ. U |= ϕ[~a/U] ⇔ ⇔ ⇔ ⇔ ⇔ U 6|= ψ[~a/U] kψ(~a)k ∈ /U I \ kψ(~a)k ∈ U k¬ψ(~a)k ∈ U kϕ(~a)k ∈ U. (por HI) (pues U es ultrafiltro) (por la Proposición 2.4) U |= ψ[~a/U] y U |= χ[~a/U] kψ(~a)k ∈ U y kχ(~a)k ∈ U (por HI) kψ(~a)k ∩ kχ(~a)k ∈ U(pues U es filtro) k(ψ ∧ χ)(~a)k ∈ U (Prop. 2.4) kϕ(~a)k ∈ U. • ϕ = ∃xψ(x, ~y). Q U |= ϕ[~a/U] ⇔ U |= ψ(b/U,~a/U) para alguna b ∈ dom( i∈I Ai ) Q ⇔ kψ(b,~a)k ∈ U para alguna b ∈ dom( i∈I Ai ) (por HI) ⇔ k∃xψ(x,~a)k ∈ U (por la Proposición 2.4) ⇔ kϕ(~a)k ∈ U. Con lo que queda demostrado el teorema. Como primera aplicación del teorema de Łoś, damos otra demostración del teorema de compacidad 12.29. El lector debe advertir que este ejemplo no es una aplicación artificial del teorema de Łoś: la demostración que tenemos del teorema de compacidad (Teorema 4.12.29) hace uso del cálculo de secuencias. 387 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 388 ✐ ✐ 6. Ultrafiltros y ultraproductos La demostración mediante ultraproductos no requiere de este cálculo. En lo que a teoría de modelos concierne, no se necesita el cálculo de secuencias, pero sí el teorema de compacidad. Teorema 2.10 (Compacidad). Sea M un conjunto de L-enunciados. Entonces M tiene un modelo si y sólo si todo subconjunto finito de M tiene un modelo. Demostración. ⇒ ) Es trivial. ⇐ ) Supongamos que todo subconjunto finito N ⊆ M tiene un modelo, digamos AN . Sea I = {N ⊂ M | N es finito}. Vamos a construir un ultrafiltro Q U tal que para toda ϕ ∈ M se cumpla que i∈I Ai /U |= ϕ; de esta manera el ultraproducto será modelo de todo M. Utilizando el teorema de Łoś, basta construir un ultrafiltro U tal que kϕk = {N ∈ I | AN |= ϕ} pertenezca a U. Observe que {N | ϕ ∈ N} ⊆ kϕk puesto que si ϕ ∈ N, entonces AN |= ϕ. Ası́ que basta construir un ultrafiltro que contenga los conjuntos ϕ = {N | ϕ ∈ N}, y para esto último, utilizando el lema 1.4 y el teorema 1.8, basta mostrar que esta colección tiene la pif. Pero esto es inmediato, puesto que si ϕ1 , . . . , ϕm ∈ M entonces {ϕ1 , . . . , ϕm } ∈ ϕ1 ∩ . . . ∩ ϕm . Nuestra siguiente aplicación caracteriza las nociones de clase elemental y equivalencia elemental en términos de ultraproductos. Una clase de Lestructuras K es cerrada respecto a equivalencia elemental si para toda A ∈ K, A ≡ B, implica que B ∈ K. La clase K es cerrada respecto a ultraproductos si Q todo ultraproducto i∈I Ai /U de una familia de L-estructuras Ai ∈ K pertenece a K. Teorema 2.11. Sea K una clase arbitraria de L-estructuras. Entonces: (i) K es una clase ∆-elemental para una L-teoría T, es decir, K = Mod L (T) si y sólo si K es cerrada respecto a ultraproductos y equivalencia elemental. (ii) K es elemental si y sólo si tanto K como su complemento son cerrados respecto a ultraproductos y equivalencia elemental. Demostración. (i) ⇒ ) Obviamente, toda clase ∆-elemental es cerrada respecto a la equivalencia elemental. El teorema de Łós muestra que si Ai |= ϕ para toda Q i ∈ I, entonces i∈I Ai /U |= ϕ. Así que toda clase ∆-elemental también es cerrada respecto a ultraproductos. 388 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 389 ✐ ✐ Conjuntos y modelos. Curso avanzado ⇐ ) Sea K una clase de modelos cerrada respecto a ultraproductos y equivalencia elemental. Sea T el conjunto de todos los L-enunciados que son válidos en A para toda A ∈ K. Entonces T es una L-teoría y cualquier A ∈ K es modelo de T, es decir, K ⊆ Mod L (T). Veamos ahora que Mod L (T) ⊆ K. Sean B ∈ Mod L (T), Σ el conjunto de todos los enunciados ciertos en B e I = Fin(Σ), el conjunto de subconjuntos finitos de σ. Para cada i = {ϕ1 , . . . , ϕn } ∈ I, existe Ai ∈ K que es modelo de i, pues en caso contrario el enunciado ¬(ϕ1 ∧ · · · ∧ ϕn ) pertenecería a T y sería falso en B. Para cada i ∈ I escogemos un modelo de i, digamos Ai ∈ K. Análogamente a la prueba del teorema 2.10, podemos encontrar Q que es modelo de Σ. Dado que K es cerrado un ultraproducto i∈I Ai /U Q de Σ, todo respecto a ultraproductos, ∈I Ai /U ∈ K. Por la construcción Q modelo de Σ es elementalmente equivalente a B, así que ∈I Ai /U ≡ B y como K es cerrado bajo equivalencia elemental, concluimos que B ∈ K. Por lo tanto, K = Mod L (T), es decir, K es una clase ∆-elemental. (ii) Se sigue de (i) y del teorema 2.10. Una pregunta natural es ¿qué sucede con los ultraproductos en el caso de que A ≡ B? Una respuesta la proporciona el siguiente teorema. Teorema 2.12 (Keisler-Shelah). Si A y B son dos L-estructuras, entonces las siguientes condiciones son equivalentes. 1. A ≡ B. 2. Existe un conjunto I y un ultrafiltro U sobre I tales que AI /U ∼ = BI /U. Demostración. La demostración se pospone hasta el volumen II. Teorema 2.13. Una clase K de L-estructuras es elemental si y sólo si es ∆-elemental y su complemento es cerrado respecto a la formación de ultraproductos. Demostración. Si tanto K como su complemento Kc son elementales, ambas son cerradas respecto a la formación de ultraproductos. Recíprocamente, supongamos que K y su complemento tienen esa propiedad. Por el teorema de Keisler-Shelah sabemos que tanto K como su complemento son cerrados respecto a equivalencia elemental, por lo que K es ∆-elemental de acuerdo con el teorema 2.11. Afirmamos que para alguna ϕ ∈ Φ = Teo(K) la clase Mod(ϕ) coincide con K. Si no es cierto, 389 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 390 ✐ ✐ 6. Ultrafiltros y ultraproductos para cada ϕ ∈ Φ encontramos un Aϕ ∈ Mod(ϕ) que también pertenece al complemento de K. Los conjuntos Jϕ = {ψ ∈ Φ : Aψ |= ϕ} pertenecen a algún ultrafiltro F (noteQque Jϕ1 ∩ Jϕ2 = Jϕ1 ∧ϕ2 ) en Φ. De acuerdo con el teorema de Łoś, A = ψ∈Φ Aψ /F es un modelo de Teo(K), así que A ∈ K por el teorema 2.11. Como el complemento de K es cerrado respecto a la formación de ultraproductos, pertenece al complemento de K, una contradicción. Ejemplo 2.14. Para un número primo fijo p la clase de todos los campos de característica p es elemental pues se puede definir añadiendo el enunciado Def ϕp = ∀ xpx = 0. Los campos de característica 0 se pueden definir añadiendo la familia de negaciones ¬ϕp , p primo, y en consecuencia forma una clase axiomatizable. Por otra parte, los campos de carecterística 6= 0Qno son cerrados respecto a ultraproductos, ya que el ultraproducto no trivial p∈P F/F sobre el campo F es un campo de característica 0. Por lo tanto, los campos de característica 0 forman una clase axiomatizable pero no elemental. Ejemplo 2.15. Un campo es cerrado separable si no tiene una extensión algebraica separable propia. Un campo K es cerrado separable si y sólo si se satisface la siguiente familia de enunciados: todo polinomio f (x) ∈ K[x], para el que existen polinomios a(x), b(x) ∈ K[x] tales que a(x)f (x) + b(x)f ′ (x) = 1 y máx (grado(a), grado(b)) = 1 ≤ grado(f ) tiene una raíz en K. (f ′ (x) es la derivada de f (x) con respecto a x). Por consiguiente, la clase de los campos algebraicamente cerrados separables es axiomatizable. Se sigue del teorema 4.9 que esta clase no es elemental. Ya vimos que los campos algebraicos de la misma característica son elementalmente equivalentes si y sólo si sus índices [K : Kp ] y [L : Lp ] son infinitos o finitos e iguales. Véase [Ers67]. Ejemplo 2.16. La clase de todos los campos es finita axiomatizable (en la clase de todos los anillos); en particular, es axiomatizable ya que los campos se pueden definir mediante el enunciado ∀ x(x 6= 0 ⇒ ∃ y(x · y = 1). 390 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 391 ✐ ✐ Conjuntos y modelos. Curso avanzado Es bien conocido (p. ej., véase [Jac64]) que un campo K se puede ordenar si y sólo si K es formalmente real, es decir, −1 no es la suma de cuadrados de elementos en K. Para un entero positivo fijo n sea ψn el enunciado ∀ x1 · · · xn (−1 6= x12 + · · · + xn2 ). Claramente, K es formalmente real si y sólo si K satisface ψn para toda n ∈ N. Por lo tanto, los campos formalmente reales conforman una clase axiomatizable. Proposición 2.17. Los campos formalmente reales conforman una clase axiomatizable pero no elemental. Demostración. Debemos verificar solamente que la clase de campos formalmente reales no es elemental; para ello considere, en un campo K que no es formalmente real, el menor natural n tal que −1 es la suma de n cuadrados de elementos de K. Este número es conocido como el nivel de K. Se puede demostrar ([Rib72]) que el nivel de un campo no ordenable es una potencia de 2, y recíprocamente que toda potencia de 2 es el nivel de un campo. Para cada t ∈ N sea Kt un campo de nivel 2t y sea F un ultrafiltro libre en N. Por el teoremaQde Łoś concluimos que −1 no es la suma de cuadrados en el ultraproducto n∈N Kt /F, por lo tanto, este ultraproducto es formalmente real, lo que demuestra la afirmación. La siguiente aplicación muestra que todo modelo A es elementalmente encajable en toda ultrapotencia de A en forma natural. Sean I un conjunto no vacío, U un ultrafiltro sobre I y A una L-estructura. El encaje natural Q d : A −→ ∈I Ai /U es la función d tal que d(a) es la clase de equivalencia de la función constante con valor a, es decir, d(a) = {a : i ∈ I}/U. Q El rango de d se denota con d[A] y la restricción de ∈I Ai /U a d[A] con d(A). Este encaje es excepcionalmente importante en el estudio de ultraproductos. Corolario 2.18. Sea A una L-estructura y U un ultrafiltro en I. Entonces el Q encaje natural de A en la ultrapotencia ∈I Ai /U es un encaje elemental. 391 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 392 ✐ ✐ 6. Ultrafiltros y ultraproductos Demostración. Mediante elQuso del teorema 4.9.5(c) basta probar que A |= ϕ[a1 , . . . , an ] si y sólo si Ai /U |= ϕ[d(a1 ), . . . , d(an )], para toda fórmula atómica ϕ. Sean ϕ(x1 , . . . , xn ) una L-fórmula atómica y a1 , . . . , an ∈ A. Por el teorema de Łoś, las siguientes afirmaciones son equivalentes: Y i∈I Ai /U |= ϕ[d(a1 ), . . . , d(an )] ⇔ {i ∈ I : A |= ϕ[a1 , . . . , an ]} ∈ U ⇔ A |= ϕ[a1 , . . . , an ], lo que concluye la demostración. Así pues, d es un isomorfismo entre A y d(A); d(A) es una subestructura Q elemental de la ultrapotencia ∈I Ai /U. 3. Propiedades de los ultraproductos En esta sección estudiaremos propiedades de los ultraproductos que no están relacionadas con el lenguaje L, sino solamente con su estructura. Decimos que las parejas (S, U) y (S ′ , U ′ ) (donde U, U ′ son ultrafiltros sobre S y S ′ respectivamente) son isomorfas si existe una biyección π : S −→ S ′ tal que para todo X ⊆ S, X ∈ U ⇔ π[X] ∈ U ′ . Si |S| = |S ′ | U y U ′ son ultrafiltros principales, entonces (S, U) es isomorfo a El lema 1.28 podría sucitar la falsa idea de que la observación sigue siendo cierta si U y U ′ son ultrafiltros no principales. Un simple argumento de cardinalidad muestra que esto no es cierto. (S ′ , U ′ ). Lema 3.1. Si S es infinito, existen ultrafiltros no principales U, U ′ en S tales que (S, U) no es isomorfa a (S, U ′ ). Demostración. Sea S un conjunto de cardinalidad κ, y U un ultrafiltro no principal en S. Sea P el conjunto de todas las biyecciones de S en S. P tiene cardinalidad 2κ . Si π ∈ P, sea π[U] = {π[X] : X ∈ U}. Entonces {(S, π[U]) : π ∈ P} es la familia de todas las parejas isomorfas a (S, U). κ Esta familia tiene cardinalidad 2κ , pero por el teorema 1.12 existen 22 parejas (S, U ′ ) con U ′ como un ultrafiltro no principal. Por consiguiente, existe un κ ultrafiltro (de hecho hay 22 ) no principal U ′ en S tal que (S, U) no es isomorfo a (S, U ′ ). 392 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 393 ✐ ✐ Conjuntos y modelos. Curso avanzado Suponga que (S, U) es una pareja y G ⊆ S. Entonces definimos U ↾ G = {X ∩ G : X ∈ U}. Lema 3.2. Si (S, U) es una pareja y G ∈ U, entonces (G, U ↾ G) también es una pareja, y para todo X ⊆ S, X ∈ U ⇔ X ∩ G ∈ U ↾ G. Demostración. Ejercicio. Teorema 3.3. Sean {Ai : i ∈ I} una familia de L-estructuras, (I, U) una pareja y G ∈ U; entonces Y Y Ai /U ∼ Ai /(U ↾ G). = i∈I i∈G Demostración. Definimos la función h: Y i∈I como sigue: si f ∈ a G. Sea Q i∈I Ai /U − → Y Ai /(U ↾ G) i∈G Ai , entonces f ↾ G ∈ Q i∈G Ai es la restricción de f h(f/U) = (f ↾ G)/U ↾ G. Q h transforma Ai /U sobre Ai /(U ↾ G); mostraremos que h es un isomorfismo. Debemos verificar las condiciones de la definición 4.4.4. Por supuesto, h es biyectiva. Como ejemplo consideremos la condición para Q símbolos de relación R. Sea T la interpretación de R en i∈I Ai /U ↾ G. Q RU (a1 /U, . . . , an /U) ⇔ {i ∈ I : RAi (a1 (i), . . . , an (i))} ∈ U ⇔ {i ∈ I : RAi (a1 (i), . . . , an (i))} ∩ G ∈ U ↾ G ⇔ {i ∈ G : RA1 (a1 (i), . . . , an (i))} ∈ U ↾ G ⇔ T (a1 ↾ G/U ↾ G, . . . , an ↾ G/U ↾ G) ⇔ T (h(a1 /U), . . . , h(an /U)). Así que h es un isomorfismo. Corolario 3.4. Si U es un ultrafiltro principal en I, entonces para alguna k ∈ I, Y Ai /U ∼ = Ak . i∈I 393 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 394 ✐ ✐ 6. Ultrafiltros y ultraproductos Demostración. Como U es principal, está generado por algún k ∈ I, y {k} ∈ U. Por el teorema 3.3, Y Y Ai /(U ↾ {k}) ∼ Ai /U ∼ = Ak . = i∈I i∈{k} Este corolario muestra que los ultrafiltros principales no generan nuevos modelos mediante ultraproductos, ası́ que en lo sucesivo sólo consideraremos ultrafiltros no principales. Corolario 3.5. Sea U un ultrafiltro no principal en I. Existe un subconjunto J de I y un ultrafiltro uniforme U ′ en J tal que para cualquier familia {Ai : i ∈ I} de L-estructuras, Y Y Ai /U ∼ Ai /U ′ . = i∈I i∈J Demostración. Sean κ = mín{µ | ∃A ∈ U(|A| = µ)} y J cualquier conjunto en U de cardinalidad κ. Por el teorema 3.3, para cualquier familia {Ai : i ∈ I} de estructuras se tiene Y Y Ai /U ∼ Ai /G, = i∈I i∈I donde G = U ↾ J. Para cualquier X ∈ U se cumple X ∩ J ∈ U y, por lo tanto (por la elección de κ), X ∩ J tiene cardinalidad κ. Como todos los elementos de G son de esta forma, G es un ultrafiltro uniforme. El corolario 3.4 se puede generalizar de la siguiente forma: Lema 3.6. Si A es una L-estructura de cardinalidad ≤ κ y U es un ultrafiltro κ-completo en I, entonces AI /U ∼ = A. Demostración. Es suficiente probar que el encaje canónico d : A ֒→ AI /U es sobre. Suponga que a/U ∈ AI /U. Para cada a′ ∈ A, sea Xa′ = {i ∈ I : a(i) = a′ }. El conjunto {Xa′ : a′ ∈ A} es una partición de I en a lo sumo κ conjuntos ajenos. Por el lema 1.21, existe un único a0 ∈ A tal que Xa0 ∈ U. En consecuencia, a/U = d(a0 ). Esto muestra que AI /U = d[A], lo que completa la prueba. 394 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 395 ✐ ✐ Conjuntos y modelos. Curso avanzado 4. Ejemplos A continuación presentamos algunos ejemplos del uso de las ultrapotencias en el álgebra. Ejemplo 4.1. Sea σ = h+, 0, (+, 2)i una signatura y L el lenguaje asociado a ella. La clase de los grupos abelianos de torsión no es axiomatizable. Para demostrar esta afirmación construiremos un ultraproducto libre de torsión de grupos abelianos de torsión. Si la clase en cuestión fuera axiomatizable, cada factor satisfaría los axiomas y así lo haría también el ultraproducto. Sea Gn el grupo cíclico de orden n + 1Qpara cada n ∈ ω. Se afirma que si U esQun ultrafiltro libre sobre ω, entonces n<ω Gn /U no es de torsión. Sea g ∈ n<ω Gn /U tal que g(n) tiene orden n + 1 para cada n ∈ ω. Para cualquier m > 0, si ϕm (x) es la fórmula x| + x +{z· · · + x} = 0; m sumandos Q entonces, por el teorema de Łoś, i<ω Gi /U 6|= ϕm [gU ] ya que el conjunto {n ∈ ω : Gn |= ϕmQ[g(n)]} es finito y no pertenece a U. Por lo tanto, gU no tiene orden finito y i<ω Gi /U no es de torsión. Este método de probar que una clase no es axiomatizable no siempre funciona, pues existen clases cerradas respecto a ultraproductos que no son axiomatizables: Definición 4.2. Una clase K de L-estructuras es seudoelemental si K = {A : A |= ϕ} para algún L′ -enunciado, donde L′ ⊇ L. Ejemplo 4.3. Sea n ∈ ω si A es la clase de todos los grupos isomorfos al grupo lineal general de orden n sobre un campo fijo F; entonces A es cerrada respecto a ultraproductos. Es suficiente probar que A es seudoelemental, de acuerdo con el ejercicio 29. Expandimos el lenguaje L asociado a la signatura σ = (◦, e) a L′ asociado a la signatura σ ′ = {◦, e, +, ∗, 0, 1, πij }, donde +, ∗ son símbolos de 2-función, 0,1 son símbolos de constante, y πij , 1 ≤ i, j ≤ n son símbolos de 1-función. Sea A′ la clase de todas las L′ -estructuras A que satisfacen las siguientes propiedades (el lector las podrá expresar fácilmente como L′ -enunciados): 395 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 396 ✐ ✐ 6. Ultrafiltros y ultraproductos - Dos elementos a1 , a2 ∈ A son iguales si y sólo si πij (a1 ) = πij (a2 ), para cualesquier i, j (por lo que los elementos de A son matrices de n × n). - La unión F de los rangos de las πij forma un campo con respecto a +, ∗, 0 y 1. - La matriz e es la matriz identidad. - La operación ◦ es la multiplicación de matrices. - Los elementos de A son precisamente las matrices n × n sobre F que son invertibles. El lector podrá verificar que con la expansión L′ así definida, A resulta seudoelemental, es decir, existe un L′ -enunciado ϕ que axiomatiza A. Así que la clase A es cerrada respecto a ultraproductos, pero no es axiomatizable de acuerdo con un resultado de Sabbagh [Sab69] que lo demuestra para n = 1; sin embargo, se generaliza fácilmente a n arbitraria. Las ultrapotencias también encuentran aplicaciones en la teoría de campos, como lo muestra el siguiente ejemplo. Ejemplo 4.4. Sea P un conjunto infinito de números primos y U un ultrafiltro libre en P. Para cada p ∈ P sea Fp la cerradura algebraica del campo primo Q Fp con p elementos. Considere el ultraproducto K = p∈P Fp /U. Para todo p ∈ P, la propiedad de tener característica p se puede expresar mediante el LAr enunciado ∀ x(px = 0). Por lo tanto, como U es libre, K tiene característica 0. Como cada factor es algebraicamente cerrado, el teorema de Łoś implica que K mismo es algebraicamente cerrado. Es fácil verificar que |K| = 2ℵ0 . Puesto que dos campos algebraicamente cerrados de la misma característica y cardinalidad no numerable son isomorfos (de acuerdo con el famoso teorema de Steinitz; véase [PiViZa00] para una demostración corta del teorema de Steinitz), podemos concluir que K es isomorfo a C. Teorema 4.5. Dos campos K, M algebraicamente cerrados son elementalmente equivalentes si y sólo si tienen la misma característica. Demostración. Supongamos que K, M son elementalmente equivalentes y que la característica de K es p > 0. Entonces K y M satisfacen el LAr enunciado ∀ x(px = 0), por lo que M tiene característica p (¿qué pasa si p = 0?). Recíprocamente, supongamos que K y M tienen la misma carcterística. De acuerdo con el corolario de Löwenheim-Skolem, (7.3), existe un campo 396 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 397 ✐ ✐ Conjuntos y modelos. Curso avanzado K′ tal que K′ ≡ K y |K′ | = ℵ1 . De manera similar, existe un campo M ′ elementalmente equivalente a M y de cardinalidad ℵ1 . Como ambos campos tienen la misma característica y son algebraicamente cerrados, usamos de nuevo el teorema de Steinitz para certificar que son isomorfos. En consecuencia, K y M son elementalmente equivalentes. Así que una propiedad expresable en nuestro lenguaje LAr que es cierta en un campo algebraicamente cerrado, es válida en todo campo algebraicamente cerrado de la misma característica. La pregunta ahora es si podemos transferir propiedades entre campos de diversas características. Teorema 4.6 (Principio de transferencia). Sea ϕ un LAr -enunciado. Las siguientes afirmaciones son equivalentes. (i) ϕ es cierto en algún (en todo) campo algebraicamente cerrado de característica 0. (ii) Existe una cantidad infinita de números primos p tales que ϕ es cierto en algún (en todo) campo algebraicamente cerrado de característica p. (iii) Existe un conjunto E de números primos tales que ϕ es cierto en algún (en todo) campo algebraicamente cerrado de característica p ∈ / E. Demostración. Sean P un conjunto infinito de números primos, U un ultrafiltro sobre P y Fp la cerradura algebraica de Fp . Si σ es cierta en Fp para toda p ∈ P, se desprende del teorema de Łoś y del isomorfismo C∼ = Y Fp /U, p∈P que ϕ es cierto en C. Esto demuestra (ii) ⇒ (i) e (i) ⇒ (iii). La implicación (iii) ⇒ (ii) es obvia. Finalmente, consideremos ultraproductos de módulos de donde se desprenden resultados sorprendentes. Consideremos a los módulos como L-estructuras modelo de la teoría de módulos. Proposición 4.7. Sean {Mi : i ∈ I} una familia de R-módulos y U un Q ultrafiltro κ-completo en I tal que |R| < κ. Si G es un subgrupo de Q i∈I Mi /U M tal de cardinalidad menor que κ, entonces existe un encaje φ : G − → i∈I Q i que πQ ◦ φ es la identidad en G. Aquí π es la función canónica de i∈I Mi sobre i∈I Mi /U. 397 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 398 ✐ ✐ 6. Ultrafiltros y ultraproductos en y Demostración. Para cada elemento g ∈ G, elegimos un representante xg i∈I Mi . Entonces para g, h ∈ G y r ∈ R, los conjuntos Q Yg,h = {i ∈ I : xg (i) + xh (i) = xg+h (i)} Yr,g = {i ∈ I : rxg (a) = xrg (i)}, pertenecen a U. Como U es κ-completo, el conjunto Y = ∩{Yg,h : g, h ∈ G} ∩ \ {Yr,g : r ∈ R, g ∈ G} también pertenece a U. Definimos φ mediante φ(g)(i) = ( xg (i), 0, si i ∈ I en otro caso. Se verifica fácilmente que φ es la función buscada. Q Si Bi es un subconjunto del módulo Mi para cada i ∈ I, entonces Qi∈I Bi Q Q de i∈I Bi con Qi∈I Bi /U la imagen Q es un subconjunto de i∈I Mi ; denotamos Q → i∈I Mi /U; es decir, i∈I Bi /U respecto a la función canónica π Q : i∈I Mi − es el conjunto de elementos de i∈I Mi /U representados por un elemento de Q i∈I Bi . Lema 4.8. Si Bi es un subconjunto linealmente independiente del módulo Mi Q Bi /U es un para cada i ∈ I, entonces para todo ultrafiltro U en I, i∈I Q subconjunto linealmente independiente de i∈I Mi /U. Demostración. Suponga lo contrario: sean (xo )U , . . . , (xn )U elementos Q existen elementos distinto de cero r0 , . . . , rn diferentesP de i∈I Bi /U tales que Q de R con j≤n rj (xj )U = 0 en i∈I Mi /U. Entonces Def Y = {i ∈ I : pertenece a U, como también X j≤n rj xj (i) = 0 en Mi } Def Zj,k = {i ∈ I : xj (i) 6= xk (i)} para j 6= k (pues (xj )U 6= (xk )U ). Por lo tanto, Def W =Y∩ \ Zj,k j6=k 398 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 399 ✐ ✐ Conjuntos y modelos. Curso avanzado es un elemento de U, así que W no es vacío. Para cualquierP i ∈ W, puesto que Bi es linealmente independiente, los xj (i) son distintos y j≤n rj xj (i) = 0, concluimos que rj = 0 para toda j. Teorema 4.9. Sea U un ultrafiltro κ-completo sobreQI, donde κ > |R| + ℵ0 . Si Mi es un módulo libre para cada i ∈ I, entonces i∈I Mi /U es un módulo libre. Q Demostración. Sea Bi una base de Mi .QPor el lema 4.8, i∈I Bi /U es /U, así que necesitamos un subconjunto linealmente independiente de i∈I MiQ Q solamente probar que genera a i∈I Mi /U. Sea y ∈ i∈I Mi . Para cualquier n + 1-ada ~r = (r0 , . . . , rn ) ∈ Rn+1 , sea Def Y (~r) = {i ∈ I : ∃ x0 (i), . . . , xn (i) ∈ Bi (y(i) = X rj xj (i))}. j≤n S Como cada Bi genera a Mi , {Y (~r) : ~r ∈ Rn+1 , n ∈ ω} = I. Por la hipótesis sobre |R|, existen menos de κ sucesiones. Por lo tanto, existe ~r = (r0 , . . . , rn ) P tal que Y (~r) pertenece a U. Entonces yU = j≤n rj (xj )U , donde xj (i) se define P de manera que y(i) = j≤n rj xj (i) para i ∈ Y (~r). 5. Campos real cerrados Definición 5.1. Sea K un campo y ≤ un orden lineal en K; K es un campo ordenado si ab ∈ K+ = {x ∈ K : x > 0} para cualesquier a, b ∈ K+ y para cualesquier x, y, z ∈ K con x < y se cumple x + z < y + z. Definición 5.2. Un conjunto linealmente ordenado E es un η1 -conjunto si para cualesquier dos subconjuntos a lo sumo numerables A y B, con a < b para toda a ∈ A y toda b ∈ B, existe un elemento x ∈ E que satisface a < x < b para toda a ∈ A y toda b ∈ B. En particular, tomando A = ∅ o B = ∅ se sigue que un η1 -conjunto no tiene subconjuntos numerables coiniciales o cofinales. Un campo es real-cerrado si está ordenado y no tiene una extensión algebraica ordenada propia. En forma equivalente, un campo ordenado K es real-cerrado si su complexificación KC es algebraicamente cerrada; también en forma equivalente, si todo elemento positivo en K es el cuadrado de algún elemento en K y todo polinomio sobre K de grado impar tiene una raíz en K. 399 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 400 ✐ ✐ 6. Ultrafiltros y ultraproductos Un campo real-cerrado tiene un orden único ≤ (como campo ordenado) que se define haciendo que los elementos positivos sean los cuadrados de elementos del campo. Un campo real-cerrado K es un η1 -campo si el conjunto universo del campo K con el orden del campo es un η1 -conjunto. El lector puede verificar que si F es un ultrafiltro libre en N, KN /F es un η1 -campo real-cerrado si K es un campo real-cerrado. Proposición 5.3. Si K y L son η1 -campos real-cerrados, entonces son elementalmente equivalentes. Demostración. Es suficiente probar que se satisfacen las condiciones de la propisición 13.1. Sea Φ la familia de todos los isomorfismos de subcampos real-cerrados numerables de K sobre subcampos real-cerrados numerables de L. Sea ϕ : K′ − → L′ un isomorfismo de Φ y c ∈ K. Queremos extender ϕ a un isomorfismo en Φ que tenga a c en su dominio. Si c ∈ K′ , no hay nada que probar. Si c ∈ / K entonces c es trascendente sobre K′ pues K′ es real-cerrado. Sea A = {a ∈ K′ : a < c} y B = {b ∈ K′ : c < b}. Ya que ϕ preserva el orden, ϕ(A) < ϕ(B). Los conjuntos ϕ[A] y ϕ[B] son numerables y L es un η1 -campo; por lo tanto, existe un elemento c ∈ L tal que ϕ[A] < c < ϕ[B]; (66) c∈ / L′ , por lo que c es trascendente sobre L′ . La función ϕ se extiende a un isomorfismo ϕ : K′ (c) − → L′ (c) definido mediante ϕ(c) = c. Se afirma que ϕ preserva el orden. Es suficiente mostrar que un elemento f = k0 + k1 c · · · + kn cn ∈ K′ [c], k0 , . . . , kn ∈ K′ , es positivo en el orden de K si y sólo si ϕ(k0 ) + ϕ(k1 )c + · · · + ϕ(kn )cn es positivo en el orden de L. Podemos suponer que kn > 0 (en el orden de K). Como K′ es real-cerrado, podemos escribir f = kn r Y i=1 (c − αi ) s Y [(c − βj )2 + γj2 ], (67) j=1 donde r + 2s = n y αi , βj ∈ K′ . f es positivo en el orden de K si y sólo si el número de factores negativos en el lado derecho de la ecuación 67 es par. Aplicando ϕ a la ecuación 67 y usando la ecuación 66, obtenemos f > 0 si y sólo si ϕ(f ) > 0. 400 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 401 ✐ ✐ Conjuntos y modelos. Curso avanzado Entonces ϕ preserva el orden y es un isomorfismo de K′ (c) a L′ (c), por lo que se extiende a un isomorfismo ϕ′ de la cerradura real de K′ (c) (dentro de K) sobre la cerradura real de L′ (c) (dentro de L). Estas cerraduras reales son numerables, así que la condición (i) se satisface. Mediante un argumento dual se verifica la condición (ii). Ahora podemos demostrar el famoso teorema de Tarski sobre equivalencia elemental de campos real-cerrados. Teorema 5.4 (Tarski). Cualesquier dos campos real-cerrados son elementalmente equivalentes. Demostración. Sean K y L dos campos real cerrados. Si F es un ultrafiltro en N, entonces KN /F y LN /F son η1 -campos real-cerrados, de acuerdo con el ejercicio 42. Por la proposición 5.3, los ultraproductos KN /F y LN /F son elementalmente equivalentes. Como K ≡ KN /F y L ≡ LN /F, concluimos que K ≡ L por el teorema de Keisler-Shelah. Ahora pretendemos probar que todo campo ordenado se puede encajar en un campo real-cerrado. Lema 5.5. El inverso de una suma de cuadrados es una suma de cuadrados. Demostración. La demostración es evidente, por ejemplo: a 1 a2 + b 2 = = 2 2 2 2 2 2 a +b (a + b ) a + b2  2  b + 2 a + b2 2 . Lema 5.6. Sea A = hA, +, ·, <A , 0, 1i un campo ordenado tal que cada elemento positivo de A es la suma de cuadrados de elementos de A. Sea B un campo que contiene al reducto de A a {+, ·, 0, 1} como subcampo y tal que el cero no es la suma de cuadrados (distintos de cero) en B. Sea b ∈ B − A tal que no es la suma de cuadrados de elementos de B. Entonces existe un orden <B en B que extiende al orden <A y b <B 0. Demostración. Es suficiente encontrar un conjunto P ⊆ B de “elementos positivos” de B con las siguientes propiedades: 1. −b ∈ P. 2. 0 ∈ / P. 3. c2 ∈ P para toda c ∈ B. 401 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 402 ✐ ✐ 6. Ultrafiltros y ultraproductos 4. P es cerrado respecto a +. 5. Para toda c ∈ B − {0}, c ∈ P o −c ∈ P. Nuestra primera propuesta para P es P0 : P0 =  l X  i=1 c2 − m X j=1   dj2 b : l, m ∈ N, ci ∈ B, dj ∈ B no todos cero .  Afirmamos que (1)–(4) se cumplen para P0 : (1) y (3) son obvias. Para P Pl 2 2 (2), notemos que si m j=1 dj b = i=i ci , entonces, por el lema 5.5, b sería la suma de cuadrados. (4) es cierta por definición de P0 y puesto que ci2 (−dj2 b) = −(ci dj )2 b y (−dj2 b)(−dk2 b) = (dj dk b)2 . Ahora construimos versiones adecuadas de P0 para que se verifique (5): suponga que P0 ⊆ P1 , P1 satisface (1)–(4) y c ∈ / P1 . Definamos P2 como {p(−c) : p es un polinomio con coeficientes en P1 }. Es fácil verificar que −c ∈ P2 , P1 ⊆ P2 y que (1), (3), (4) son ciertas en P2 . Para (2) supongamos que p(−c) = 0 y derivemos una contradicción. Consideremos expansiones pares e impares para obtener p(x) = q(x2 ) + xr(x2 ), para polinomios q y r con coeficientes en P1 . Si r(c2 ) = 0, entonces q(c2 ) = 0 pero q(c2 ) está en P1 , lo que es una contradicción. Por otra parte, si r(c2 ) 6= 0 entonces 0 = p(−c) = q(c2 ) − cr(c2 ), lo cual significa que  2 1 2 2 c = q(c )r(c ) r(c2 ) y como cada factor en el lado derecho pertenece a P1 , llegamos a una contradicción. Ya que tenemos P definimos <B como sigue: c1 <B c2 si y sólo si c2 − c1 ∈ P. Para cada a ∈ A, si 0 <A a entonces a es una suma de cuadrados y por (3) y (4) a ∈ P. Así, <B extiende al orden <A . Lema 5.7. Todo campo ordenado se puede encajar como subestructura de un campo real-cerrado. 402 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 403 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Es suficiente probar que para todo campo ordenado A existe un campo ordenado B tal que A ⊆ B y para cada número natural n ≥ 1, B |= σn donde σn es el enunciado en el lenguaje de la teoría de campos que establece: Si p es un polinomio de grado a lo sumo n y w < y es tal que p(w) < 0 < p(y), entonces existe una x con w < x < y y p(x) = 0. Considere el enunciado ψn ≡ para cualquier campo ordenado A existe un campo ordenado B tal que A ⊆ B y B |= σn . ψ1 es cierta pues todo campo ordenado A es modelo de σ1 . Probamos que para cada n, ψn ⇒ ψn+1 . Dado cualquier modelo A |= T, donde T es la teoría de campos ordenados, construiremos una cadena de modelos A ⊆ B1 ⊆ B2 ⊆ · · · ⊆ Bn ⊆ Bn+1 ⊆ · · · tal que cada Bn |= T ∪ {σn }. Sea B la unión de la cadena. Puesto que T es una Π1 -teoría, B es modelo de T. Además, la naturaleza de los enunciados σn nos permite concluir que para cada n, B |= σn y entonces B |= T ∪ {σn : n ∈ N}. Resta probar que para cada n, ψn ⇒ ψn+1 . Afirmación 1 Si A |= T ∪ {σn } y p es un polinomio de grado a lo más n + 1 con coeficientes en A y a < d son elementos de A tales que p(a) < 0 < p(d); entonces existe un modelo B con A ⊆ B, B |= T y existe b ∈ B, a < b < d y p(b) = 0. Antes de probar la afirmación 1, veamos cómo nos auxilia en la prueba de ψn ⇒ ψn+1 . Sea A |= T, y usamos la afirmación 1 para construir un modelo B tal que A ⊆ B y B |= σn+1 . Primero construimos una cadena de modelos de T A ⊆ A0 ⊆ · · · · · · ⊆ Am ⊆ Am+1 ⊆ · · · tales que para cada m y cada polinomio p de grado a lo sumo n + 1 con coeficientes en Am y cada pareja a, d de elementos de Am con p(a) < 0 < p(d), existe b ∈ Am+1 tal que a < b < d y p(b) = 0. Supongamos que hemos construido Am ; para obtener Am+1 , sea Σm el conjunto de todos los L(Am )-enunciados Σ1 de de la forma ∃ x(ca < x ∧ x < cd ∧ p(x) = 0), donde p es un polinomio de grado a lo sumo n + 1 y con la propiedad de que ca , cd y los coeficientes del polinomio p son símbolos de constante de L(Am ) y (Am , Am ) |= p(ca ) < 0 ∧ 0 < p(cd ). 403 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 404 ✐ ✐ 6. Ultrafiltros y ultraproductos Afirmamos que T ∪ diag(Am ) ∪ Σm es satisfacible. De acuerdo con el teorema de compacidad es suficiente encontrar, para cada subconjunto finito {τ1 , . . . , τk } de Σm , un modelo C tal que Am ⊆ C y C |= T ∪ {τ1 , . . . , τk }. Por ψn , obtenemos un modelo B1 con Am ⊆ B1 y B1 |= T ∪ {σn }. Por la afirmación, obtenemos un modelo B2 con B1 ⊆ B2 y B2 |= T ∪ {τ1 }. Otra vez por ψn , obtenemos B3 tal que B2 ⊆ B3 y B3 |= T ∪ {σn }. Una vez más usamos la afirmación para obtener B4 con B3 ⊆ B4 |= T∪{τ2 }. Continuamos con este proceder para conseguir modelos de T, Am ⊆ B1 ⊆ · · · ⊆ B2k , con B2j |= τj . Ya que cada τj es existencial, B2k es un modelo de cada τj . Sea D |= T∪diag(Am )∪Σm . Usamos el lema del diagrama para obtener un Am+1 con Am ⊆ Am+1 , Am+1 |= T y Am+1 |= Σm que satisfaga las propiedades requeridas sobre polinomios en Am . Sea B la unión de la cadena. Como T es una Π2 -teoría, B |= T y B |= σn+1 por construcción. Hemos demostrado ψn+1 . Para concluir la demostración del lema, probaremos la afirmación 1. Demostración de la afirmación 1. Si p(x) = 0 para alguna x tal que a < x < d entonces hacemos B = A. En otro caso introducimos un nuevo elemento b a A, donde b = sup{t ∈ A : t < d ∧ p(t) < 0}. Es fácil verificar que b 6= d. Ahora probaremos que el polinomio p no se puede factorizar en A si A |= σn . Supongamos que p(x) = q(x)s(x); la definición de b nos permite encontrar a1 y d1 con a1 < b < d1 y p(a1 ) < 0 < p(d1 ) y de tal suerte que ningún otro, excepto posiblemente b, q y s, tiene raíces en el intervalo entre a1 y d1 . Como p(a1 )p(d1 ) < 0, q(a1 )q(d1 ) < 0 o s(a1 )s(d1 ) < 0 y q, s tienen grado no mayor que n, forzando a que b sea un elemento de A. El hecho de que p es irreducible sobre A significa que podemos extender hA, +, ·, 0, 1i mediante cocientes de polinomios en b de grado no mayor que n para formar un campo hB, +, ·, 0, 1i en la forma usual. Los detalles se dejan al lector. Note que la construcción no puede obligar a que q(b) = 0 para ningún polinomio q(x) con coeficientes en A de grado ≤ n. Esto se debe a que podemos 404 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 405 ✐ ✐ Conjuntos y modelos. Curso avanzado tener tal q(x) de grado mínimo y dividirlo entre p(x) para obtener p(x) = q(x)s(x) + r(x), donde el grado de r es menor que el grado de q. Esto significa que r(x) = 0 y p se podría factorizar en A. Ahora debemos expandir hB, +, ·, 0, 1i a un campo ordenado B preservando el orden de A. Aquí nos ayuda el hecho de que si q es un polinomio de grado a lo sumo n con coeficientes en A, entonces existen a1 y a2 en A tales que a1 < b < a2 y q no cambia de signo entre a1 y a2 ; esto se debe a que A |= σn . Quedan demostrados la afirmación y el teorema. 6. Ejercicios T 1. Si F es una familia no vacía de filtros en un conjunto S, entonces {F : F ∈ F} es un filtro en S. 2. Sea U un ultrafiltro en S. Muestre que la colección V de conjuntos X ⊆ S × S definida por X ∈ V si y sólo si {a : {b : (a, b) ∈ X} ∈ U} ∈ U es un ultrafiltro en S × S. 3. Sea U un ultrafiltro en S y f : S − → T . Muestre que la colección W de conjuntos X ⊆ T , definida mediante X ∈ W si y sólo si f −1 [X] ∈ U, es un ultrafiltro en T . 4. Un ultrafiltro no principal U en ω es un p-punto si para toda sucesión decreciente A0 ⊇ A1 ⊇ . . . ⊇ An ⊇ . . . de conjuntos en U existe X ∈ U tal que X − An es finito. Un ultrafiltro no principal U en ω es un ultrafiltro de Ramsey si para toda partición {P1 , P2 } de [ω]2 existe un conjunto homogéneo (véase la pág. 494) H ∈ U. La existencia de ultrafiltros Ramsey o de p-puntos no puede probarse o refutarse en ZFE . Muestre que todo ultrafiltro Ramsey es un p-punto. [Sugerencia: Dada A0 ⊂ A1 ⊂ · · · ⊂ An ⊂ · · · en U, sea {n, k} (n < k) en P1 si y sólo si k ∈ An . Demuestre que si H ∈ U es homogéneo, entonces no es el caso que [H]2 ⊆ P2 , y así [H]2 ⊆ P1 .] 5. Si (P, <) es un conjunto linealmente ordenado numerable y si U es un ppunto sobre P, muestre que existe X ∈ U tal que el tipo ordinal de X es ω o ω∗ (X tiene tipo ordinal ω∗ si y sólo si X = {xn : n < ω} y x0 > x1 > · · · > xn > · · · ) 405 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 406 ✐ ✐ 6. Ultrafiltros y ultraproductos 6. Demuestre que todo ultrafiltro en un conjunto finito S es principal. 7. Demuestre que si U es un ultrafiltro en κ, κ es un cardinal no numerable y para todo λ ≤ κ y toda partición {Xξ : ξ < λ} de κ existe un único ξ0 < λ tal que Xξ0 ∈ U; y entonces U es κ-completo. 8. Demuestre que la definición de ultraproducto no depende de la elección de representantes. 9. Demuestre el lema 3.2. 10. Si n es un cardinal finito y U cualquier ultrafiltro en un conjunto infinito I, demuestre que |nI /U| = n. 11. Sean ni un cardinal finito para cada i ∈ I, donde I es un conjunto infinito, y U un ultrafiltro en I. Si para alguna n < ω, se tiene que {i ∈ I : ni = n} ∈ U, entonces | Y ni /U| = n. 12. Si {ni : i ∈ I} es un conjunto acotado de cardinales finitos y U un ultrafiltro en I, entonces | Y ni /U| es finito. Y ni /U| es finito. 13. Si {ni : i ∈ I} es una familia de cardinales finitos y U es un ultrafiltro ℵ0 -completo en I, entonces | 14. Sea {ni : i ∈ I} una familia de cardinales finitos y U un ultrafiltro en I tal que ninguno de los conjuntos Xn = {i ∈ I : ni = n} pertenece a U. Entonces 2 ℵ0 ≤ | Y ni /U|. 15. Demuestre que existe una familia A ⊆ ωω de cardinalidad 2ℵ0 tal que: (1) Si f ∈ A y n ∈ ω, entonces f (n) < 2n . (2) Si f, g ∈ A y f 6= g, entonces {n ∈ ω : f (n) = g(n)} es finito. 406 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 407 ✐ ✐ Conjuntos y modelos. Curso avanzado 16. Sean {ni : i ∈ I} una familia numerable de cardinales finitos y U un ultrafiltro en I. Si para alguna n ∈ ω {i ∈ I : ni = n} ∈ U, entonces | en otro caso | Y Y ni /U| = n; ni /U| = 2ℵ0 . 17. Si U es ℵ0 -completo, demuestre que |ωI /U| = ℵ0 . Si U es ℵ0 -incompleto, entonces |ωI /U| ≥ 2ℵ0 . En particular, si |I| = ℵ0 y U es ℵ0 -incompleto, |ωI /U| = 2ℵ0 . 18. Si los cardinales κi son infinitos y U es ℵ0 -incompleto, entonces 2 ℵ0 ≤ | Y κi /U|. 19. Demuestre que si U es un ultrafiltro ℵ0 -incompleto en I, existe una función tal que para cada n ∈ ω, f :I− → [ω]<ℵ0 {i ∈ I : n ∈ f (i)} ∈ U. [Sugerencia: Sea {Xn : n ∈ ω} una sucesión decreciente de elementos de U con intersección vacía; podemos suponer que X0 = I. Para i ∈ I, defina f (i) = {n ∈ ω : i ∈ Xn }]. 20. (Keisler). Si U es un ultrafiltro ℵ0 -incompleto y cada κi es infinito, demuestre que Y Y [| κi /U|]ω = | κi /U|. [Sugerencia: Sea f la función del ejercicio 19. Para cada i ∈ I existe una función inyectiva gi : κif (i) −→ κi . Defina una función φ: Y κi /U ω − → Y κi /U. 407 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 408 ✐ ✐ 6. Ultrafiltros y ultraproductos Para ello, suponga que h = (hn /U : n ∈ ω) ∈ ( h∗i ∈ κif (i) mediante Defina g ∈ Q Si κi /U)ω . Defina h∗i (n) = hn (i) para cada n ∈ f (i). κi haciendo y finalmente haga h, h′ Q g(i) = gi (h∗i ), ∀ i ∈ I, φ(h) = g/U. Q son elementos distintos de ( κi /U)ω , entonces φ(h) = g/U ∧ φ(h′ ) = g′ /U para alguna n ∈ ω, hn /U = 6 h′n /U y X = {i ∈ I : hn (i) 6= h′n (i)} ∈ U. Sea Y = {i ∈ I : n ∈ f (i)}; por hipótesis Y ∈ U, lo que implica X∩Y ∈ U. Tome i ∈ X ∩ Y . Entonces hn (i) 6= h′n (i) y n ∈ f (i). Por lo tanto, ′ ′ ∗ hi (n) 6= hi∗ (n), por lo que h∗i 6= hi∗ . Como gi es inyectiva, se sigue que g(i) 6= g′ (i). Así, X ∩ Y ⊆ {i ∈ I : g(i) 6= g′ (i)} = Z. Z ∈ U y concluya que g/U = 6 g′ /U. Muestre que φ es inyectiva y, en consecuencia, Y Y [| κi /U|]ω = | κi /U|.] 21. Si κ es un cardinal infinito y U es un ultrafiltro ℵ0 -incompleto en I, demuestre que |κI /U|ω = |κI /U|. 22. Demuestre: si λ es infinito y κ ≥ λ, existe un subconjunto X de κI de cardinalidad mayor que λ tal que si f, g ∈ X y f 6= g, entonces |{i ∈ I : f (i) = g(i)}| < λ. (1) [Sugerencia: Sea {xη : η < λ} una enumeración de I. Sea Y la familia de todos los subconjuntos de κI que satisfacen (1). Aplique el lema de Zorn para encontrar un elemento máximo X en Y . Demuestre que |X| > λ: suponga lo contrario, y enumere X como {fξ : ξ < λ}. Defina una función g ∈ κI como sigue: g(x0 ) = 0. Ya definida g(xη ) para toda η < ζ < λ, el conjunto {fξ (xζ ) : ξ < ζ} tiene cardinalidad menor que λ. Sea λξ el 408 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 409 ✐ ✐ Conjuntos y modelos. Curso avanzado menor de tales elementos de κ. g(xξ ) = λξ . Muestre que g(xξ ) 6= fξ (xζ ) siempre que ξ < ζ < λ. Sea f un elemento de X, f = fµ . El conjunto {i ∈ I : fµ (i) = g(i)} ⊆ {xξ : ξ ≤ µ} tiene cardinalidad menor que λ. Así X ∪ {g} satisface (1), lo cual contradice la elección de X]. 23. Si κ ≥ γ ≥ ℵ0 y U es un ultrafiltro uniforme en I, demuestre que |κI /U| > γ. 24. Si κ es infinito y U es un ultrafiltro regular en I, demuestre que |κI /U| = κγ . [Sugerencia: Basta probar que κγ ≤ |κI /U|. Sea A el conjunto de sucesiones finitas en κ. |A| = κ, por lo que basta probar que κγ ≤ |AI /U| mediante la construcción de una función inyectiva de κI en AI /U. Sea φ una inyección de I en Fin(I) tal que para cada j ∈ I, Jj = {i ∈ I : j ∈ φ(i)} ∈ U. Sean < un orden lineal de I y f ∈ κI . Construya la función f ∗ ∈ AI : para i ∈ I, φ(i) es {i0 , . . . , ik } ⊆ I con i0 < i1 < · · · < ik . Haga f ∗ (i) = (f (i0 ), . . . , f (ik )). Sea h(f ) = f ∗ /U. Demuestre que h es inyectiva: sean f, g ∈ κI distintas. Sean j ∈ I, con f (j) 6= g(j), i ∈ Im j ∈ φ(i) = {i0 , . . . , j, . . . , ik } e i0 < · · · < j < · · · < ik . Entonces f ∗ (i) = (f (i0 ), . . . , f (j), . . . , f (ik )), y g∗ (i) = (g(i0 ), . . . , g(j), . . . , g(ik )), de manera que f ∗ (i) 6= g∗ (i). De aquí deduzca que f ∗ /U = 6 g∗ /U, es decir, h(f ) 6= h(g)]. 25. En la definición 2.2 se define el producto directo de L-estructuras. DeQ muestre que el producto directo i∈I Ai es isomorfo al ultraproducto trivial Q A /U, donde U = {I}. i i∈I Q 26. Si D, E son filtros propios sobre I y D ⊆ E, entonces i∈I Ai /E es la imaQ gen homomorfa de i∈I Ai /D. Así que todo ultraproducto es una imagen homomórfica del producto directo de modelos Ai . 409 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 410 ✐ ✐ 6. Ultrafiltros y ultraproductos 27. Q Sea F un filtro propio sobre I. Si cada Ai se encaja en Bi , entonces Q B A /F se encaja en i i∈I Q i /F. Si cada Ai es isomorfa a Bi , entoni∈I Q ces i∈I Ai /F es isomorfo a i∈I Bi /F. 28. Sea U un ultrafiltro en I. Si Ai ≡ Bi para toda i ∈ I, entonces Y i∈I Ai /U ≡ Y Bi /U. i∈I Si Ai se encaja elementalmente en Bi para toda i ∈ I, entonces Q se encaja elementalmente en i∈I Bi /U. Q i∈I Ai /U 29. Una clase de L-modelos K es seudoelemental si para alguna expansión L′ de L y alguna clase ∆-elemental K′ de L′ -estructuras, K es la clase de todos los reductos de modelos de K′ a L. Pruebe que toda clase seudoelemental es cerrada respecto a ultraproductos. 30. Sean K una clase de L-estructuras y M la clase de todas las L- estructuras A tales que A es elementalmente equivalente a un ultraproducto de miembros de K. Pruebe que M es una clase ∆-elemental y es la más pequeña que contiene a K. 31. Sean K y M dos clases de modelos, T1 la teoría de K y T2 la teoría de M. Pruebe que T1 ∪ T2 es consistente si y sólo si algún ultraproducto de elementos de K es elementalmente equivalente a algún ultraproducto de miembros de M. 32. Sea (Aα : α < β) una cadena elemental de modelos, es decir, una cadena de modelos entre los cuales se presenta la relación A0 ≺ A1 ≺ . . . ≺ Aα ≺ . . . . Sea U un ultrafiltro no principal en β tal que para cada α < β, S el conjunto {γ : α ≤ γ < β} pertenece a U. Pruebe que α<β Aα es Q elementalmente encajable en el ultraproducto α<β Aα /U. 33. Muestre que ninguna de las siguientes clases de modelos es cerrada respecto a la equivalencia elemental: (i) La clase de los grupos con torsión. (ii) La clase de los grupos simples. (iii) La clase de los grupos libres. 34. Suponga que la signatura no tiene símbolos de constante o de función. Pruebe que todo modelo A se puede encajar en algún ultraproducto de submodelos finitos de U. 410 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 411 ✐ ✐ Conjuntos y modelos. Curso avanzado 35. Sea {F : i ∈ I} una familia de campos. Forme el producto directo Qi R = i∈I Fi . R es un anillo. Para cada ultrafiltro U en I, sea MU = {f ∈ R : {i ∈ I : f (i) = 0} ∈ U}. Pruebe lo siguiente: (i) Para cada U, MU es un ideal (algebraico) máximo en R. (ii) Para todo ideal (algebraico) máximo M en R, existe un ultrafiltro U en I tal que M = MU . Q (iii) El ultraproducto i∈I Fi /U es isomorfo al campo cociente R/M. Así que los ultraproductos de campos son esencialmente lo mismo que los cocientes de producto directo de campos. Muestre que ocurre algo similar para anillos con división. 36. Sea U un ultrafiltro y sea A × B el producto directo de A con B. Pruebe que Y Y Y A/U × B/U. (A × B)/U ∼ = i∈I i∈I i∈I 37. Sea U un ultrafiltro no principal en ω. Q Pruebe que para todo conjunto infinito A, el encaje natural d : A − → i∈I A/U es un encaje propio. Pruebe lo mismo suponiendo que el conjunto de índices I se puede partir en una cantidad numerable de conjuntos, ninguno de los cuales pertenece a U. 38. Si U es un ultrafiltro en I que es ω1 -incompleto, entonces para cualesquier módulos MQi (i ∈ I) cualquier familia de ecuaciones lineales con coefiQ cientes en i∈I Mi /U que es finitamente soluble en i∈I Mi /U (es decir, cualquierQsubconjunto finito de ecuaciones de la familia es soluble) es soluble en i∈I Mi /U. 39. Sea U un ultrafiltro en I, Mi (i ∈ I) una familia de R-módulos y X rkj xkj = yj k≤nj (j ∈ J) un sistema de ecuaciones lineales (donde J es cualquier conjunto finito). Q (i) Para cada aj ∈ i∈I Mi , X rkj xkj = (aj )U k≤nj (j ∈ J) 411 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 412 ✐ ✐ 6. Ultrafiltros y ultraproductos tiene solución en X Q i∈I Mi /U si y sólo si el conjunto de i ∈ I tal que rkj xkj = aj (i) k≤nj (j ∈ J) tiene una solución en Mi pertenece a U. (ii) Si U es κ-completo, (i) es cierto para cualquier conjunto de cardinalidad menor que κ. 40. Si λ > |R|, entonces un ultraproducto de R-módulos sin torsión con respecto a un ultrafiltro λ-completo no es de torsión. [Sugerencia: Si fi : MiQ− → R, para i ∈ I, son homomorfismos, entonces, usando notación Q obvia, i∈I fi /U es un homomorfismo de i∈I Mi /U a R.] 41. Decimos que un R-módulo M es κ-sin torsión si todo submódulo de cardinalidad menor que κ no tiene torsión. Pruebe que ZI /U es κ-sin torsión si U es un filtro κ-completo en I. 42. Si F es un ultrafiltro libre en N, KN /F es un η1 -campo real cerrado si K es un campo real cerrado. 412 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 413 ✐ ✐ CAPÍTULO 7 Combinatoria infinita 413 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 414 ✐ ✐ 7. Combinatoria infinita 1. Introducción Este capítulo trata sobre algunos métodos sofisticados de la aritmética cardinal y ordinal. Varios de los temas de la combinatoria infinita son generalizaciones del caso finito. Sin embargo, muchos principios combinatorios se basan en propiedades de cardinales infinitos, ya sea en la regularidad o en el hecho de que un cardinal sea límite o sucesor. Quizá el origen de la combinatoria infinita se encuentre en el teorema de Ramsey, que en su forma más simple, publicada en 1930, establece que si ponemos los bordes de una gráfica infinita y completa en dos clases, entonces existe una subgráfica infinita y completa cuyos bordes, en su totalidad, pertenecen a la misma clase. El cálculo de particiones, parte fundamental de este capítulo, fue impulsado por una serie de generalizaciones del teorema de Ramsey. La primera extensión importante tomó forma como el teorema de Erdös-Dushnik-Miller, el cual establece que para un cardinal infinito arbitrario κ, si ponemos los bordes de una gráfica completa de cardinalidad κ en dos clases, la primera clase contiene una gráfica completa de cardinalidad κ o la segunda contiene una gráfica completa infinita. Un resultado previo de Sierpiński afirma que en el caso κ = 2ℵ0 no podemos esperar que cualquiera de las clases contenga una gráfica completa no numerable. En sus orígenes, entre quienes más contribuyeron al desarrollo de esta teoría, principalmente en el cálculo de particiones, se encuentran Erdös, Hajnal y Rado con algunas aportaciones de Specker. En lo que respecta a árboles, en gran medida desarrollaron esta área Kurepa y Souslin (aunque no propiamente en términos de árboles). De gran trascendencia fue el resultado de G. Fodor para los aspectos que conciernen a funciones regresivas, clubes y conjuntos estacionarios. Una gran revolución se originó con la aparición de los métodos de forcing y de los modelos internos, desarrollados por Cohen, Solovay, Jensen y Devlin. Grandes matemáticos como J. Baumgartner, F. Galvin, J. Larson, R. Laver, E. Miller, K. Prikry y S. Shelah aportaron enormemente a este campo. En este periodo se origina un fuerte interés en árboles, familias casi disjuntas, clubes y otras manifestaciones combinatorias como el axioma de Martin (AM), ♦ y ✷. La principal aplicación de estos principios se encuentra en la demostración de la 414 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 415 ✐ ✐ Conjuntos y modelos. Curso avanzado consistencia relativa de varios resultados de la teoría de conjuntos, la topología general, el álgebra y la teoría de la medida. En este capítulo revisaremos algunos de estos temas. La primera sección trata sobre funciones entre ordinales, funciones normales, puntos fijos y representación de ordinales. A continuación presentamos el lema de la raíz en la sección 3 para pasar al estudio de conjuntos estacionarios, incluyendo los teoremas de Fodor y Solovay. La siguiente sección considera el estudio de familias casi ajenas; continuamos con un detallado estudio del principio ♦ y algunas de sus variantes. Motivo de la siguiente sección es el cálculo de particiones (o relaciones flecha), para seguir con el estudio de cardinales débilmente compactos y el teorema de Erdös-Dushnik-Miller. Una aclaración muy importante es que hemos dejado fuera de nuestro análisis varios temas que con todo derecho debieron considerarse. Algunas de estas omisiones se explican por la imposibilidad física de incluir todo lo posible. Pero en el caso específico del axioma de Martin, su ausencia se debe a que, junto con el método de forcing con el que está estrechamente relacionado, hemos pospuesto su estudio hasta el segundo volumen. 2. Funciones normales Motivo de esta sección es el estudio de funciones entre ordinales, principalmente las funciones llamadas normales que ya fueron mencionadas en el capítulo 3 durante el desarrollo del los números Beth. Tales funciones merecen un estudio más detallado, que aquí presentamos en parte. Sea Ω un ordinal límite o Ω = OR. Por ejemplo, Ω = ω1 = ℵ1 . Con α, β, γ, ε, ξ, η, ζ denotaremos elementos de Ω. Una función f : Ω − → Ω es creciente si de α < β se sigue f (α) < f (β). La función f es continua si f (α) = supξ<α f (ξ) para cada ordinal límite α. f es normal si es continua y creciente. Lema 2.1. Para toda función creciente f se cumple que α ≤ f (α). Demostración. Por inducción sobre α. Caso α = 0, 0 ≤ f (0). Caso α + 1, α ≤ f (α) < f (α + 1), por lo que α + 1 ≤ f (α + 1). Caso α límite, α = supξ<α ξ ≤ supξ<α f (ξ) ≤ f (α). Una clase B ⊆ Ω es acotada si sup(B) ∈ Ω. Una clase A ⊆ Ω es cerrada si para cada subclase acotada B ⊆ A es cierto que sup(B) ∈ A. Las clases cerradas y no acotadas se conocen como normales. 415 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 416 ✐ ✐ 7. Combinatoria infinita Note que si Ω = ω1 , entonces cada B ⊆ Ω es un conjunto, y B es acotado si y sólo si B es numerable. Si Ω = OR, entonces B es acotada si y sólo si B es un conjunto. En vista del isomorfismo de Mostowski (que demostraremos posteriormente [pág. 574]), para cada A ⊆ OR existe un isomorfismo único de una clase de ordinales sobre A, es decir, f : OR − → A respectivamente f : α − → A. A este isomorfismo lo llamaremos función orden de A. Esta función orden se puede pensar sencillamente como una enumeración de los elementos de A. Lema 2.2. El rango de una función normal es una clase normal. Recíprocamente, la función orden de una clase normal es una función normal. Demostración. Sea f una función normal de Ω en Ω. f [Ω] no está acotado, pues para cada α se cumple α ≤ f (α). Ahora mostraremos que f [Ω] es cerrado. Sea B = {f (ξ) : ξ ∈ A} acotado, es decir, sup(B) ∈ Ω. Puesto que ξ ≤ f (ξ), A está acotado. Debemos mostrar que sup(B) = f (α) para alguna α. Si A tiene un elemento maximal, terminamos. En otro caso, sea Def α = sup(A). Claramente α es un límite. Por lo tanto, f (α) = supξ<α f (ξ) = supξ∈A f (ξ) = sup(B). Recíprocamente, sea A cerrada y no acotada. Definimos una función f : Ω − → A, donde Ω es un ordinal límite o OR, por recursión transfinita a continuación: Def f (α) = mín{γ ∈ A : ∀ ξ(ξ < α ⇒ f (ξ) < γ)}. f está bien definida pues A no está acotada. Claramente f es una función de orden de A y, por lo tanto, creciente. Falta probar que f es continua. Sea α un ordinal límite. Ya que f [α] está acotado (se sigue de f (ξ) < f (α) para ξ < α) y A es cerrada, y es válido que supξ∈α f (ξ) ∈ A; por definición, f (α) = supξ∈α f (ξ). En consecuencia, f es una función que enumera, por lo que es el isomorfismo de Mostowski (por unicidad). Definición 2.3. sea f una “función” de la clase A en sí misma. Un elemento p ∈ A es un punto fijo de f si f (p) = p. Las funciones normales tienen realmente muchos puntos fijos: Lema 2.4. Los puntos fijos de una función normal forman una clase normal. 416 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 417 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sea f una función normal. Para cada ordinal α obtenemos un punto fijo β ≥ α de ϕ mediante Def β = sup{f n (α) : n ∈ N}, donde f n = f ◦ f ◦ · · · ◦ f . Así que la clase de los puntos fijos de f no está | {z nveces } acotada. Pero además es cerrada, pues para cada clase B de puntos fijos de f se cumple que f (sup(B)) = sup{f (α) : α ∈ B} = sup(B), es decir, sup(B) es un punto fijo de f . La función de orden de la clase de los puntos fijos de una función normal se conoce (de acuerdo con Veblen [Ve08]) como la primera derivada f ′ de f . Lema 2.5 (Veblen). Sea (Aγ : γ < β) con β límite T como una sucesión decreciente de clases normales. Entonces la intersección γ<β Aγ es normal. Def Demostración. La intersección no está acotada: sea α un ordinal y δγ = Def mín{ξ ∈ Aγ : ξ > α}. Entonces (δγ : γ < β) es creciente. Sea δ = supγ<β δγ . Por lo tanto, δ ∈ Aγ para cada γ < β, ya que las Aγ decrecen. Por consiguiente, T α < δ ∈ γ<β Aγ . T Para la cerradura, sea B ⊆ γ∈β Aγ una clase acotada. Entonces B ⊆ Aγ T para cada γ < β y en consecuencia sup(B) ∈ Aγ , por lo que sup(B) ∈ γ<β Aγ . Ahora podemos definir la jerarquía de Veblen de funciones normales. Partimos de una función normal arbitraria dada h : Ω − → Ω. Utilizamos recursión transfinita para definir una función normal hβ : Ω − → Ω para cada β ∈ Ω: Def h0 = h, Def hβ+1 = (hβ )′ Para β límite, sea hβ la función orden para \ hγ [Ω]. γ<β Lema 2.6. Sea β > 0. Entonces hβ es la función orden de la clase de todos los puntos fijos comunes de todas las hγ para γ < β. 417 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 418 ✐ ✐ 7. Combinatoria infinita Demostración. Debemos mostrar que hβ [Ω] = {ξ : ∀ γ(γ < β ⇒ hγ (ξ) = ξ)}. (⊆). Se prueba por inducción transfinita sobre β. En el caso β + 1 cada hβ+1 (α) es un punto fijo de hβ y, por lo tanto (por hipótesis de inducción), es un punto fijoTde todas las hγ para γ < β. Si β es límite, la afirmación se sigue de hβ [Ω] = γ<β hγ [Ω]. (⊇). Sea ξ con ∀ γ(γ < β ⇒ hγ (ξ) = ξ). Si β es sucesor, entonces ξ ∈ hβ [Ω] por la definición de hβ . Si β es límite, entonces ξ ∈ ∩γ<β hγ [Ω] = hβ [Ω]. Del lema 2.6 se sigue que hγ (hβ (ξ)) = hβ (ξ) para toda γ < β. Obtenemos otra función normal λβ como sigue: de cada clase normal hβ [Ω] tomamos el menor punto fijo. La clase así formada es otra vez normal, y la podemos enumerar mediante una función normal. Esta función normal asocia a cada β el ordinal hβ (0). Lema 2.7. Si h es una función normal con 0 < h(0) (h es la función generadora), entonces también λβ (hβ (0)) es una función normal. Demostración. Primero mostramos que β < γ ⇒ hβ (0) < hγ (0), por inducción sobre γ. Sea β < γ y note que 0 < hβ (0) por hipótesis de inducción o, en el caso β = 0, por hipótesis. En consecuencia, 0 no es punto fijo de hβ y, por lo tanto, 0 < hγ (0). De esto se sigue que hβ (0) < hβ (hγ (0)) = hγ (0). Def Ahora probamos que λβ (hβ (0)) es continua: sea δ = supβ<γ hβ (0) para γ Def límite. Debemos probar que δ = hγ (0). Ya que hβ (0) ∈ hα [Ω] para todo α ≤ Tβ < γ y puesto que hα [Ω] es cerrado, ocurre δ ∈ hα [Ω] así que δ ∈ α<γ hα [Ω] = hγ [Ω] y, por consiguiente, δ ≥ hγ (0). Por otro lado, hβ (0) < hβ (hγ (0)) = hγ (0) y entonces δ ≤ hγ (0). Los puntos fijos de esta función, es decir, los ordinales α con hα (0) = α, son los ordinales fuertemente críticos. Su función de orden se denota usualmente con Γ. Por definición, Γ0 = Γ(0), el menor ordinal β para el que ϕβ (0) = β. Ahora queremos generalizar la forma normal de Cantor mediante el uso de la jerarquía de Veblen (en lugar de ωξ ). Para encontrar la representación de un 418 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 419 ✐ ✐ Conjuntos y modelos. Curso avanzado ordinal en términos de funciones, requerimos una serie de resultados técnicos previos. Lema 2.8. hβ0 (α0 ) < hβ1 (α1 ) ⇔ y hβ0 (α0 ) = hβ1 (α1 ) ⇔    α0 < hβ1 (α1 ), si β0 < β1 ; si β0 = β1 ; si β0 > β1 . (1)    α0 = hβ1 (α1 ), si β0 < β1 ; si β0 = β1 ; si β0 > β1 . (2) α <α , 0 1   h (α ) < α , β0 0 1 α =α , 0 1   h (α ) = α , β0 0 1 Demostración. (⇐). (1) Si β0 < β1 y α0 < hβ1 (α1 ), ocurre hβ0 (α0 ) < hβ0 (hβ1 (α1 )) = hβ1 (α1 ). Si β0 = β1 y α0 < α1 , se sigue que hβ0 (α0 ) < hβ1 (α1 ). Si β0 > β1 y hβ0 (α0 ) < α1 , deducimos que hβ0 (α0 ) = hβ1 (hβ0 (α0 )) < hβ1 (α1 ). (2) Se obtiene en forma similar. ( ⇒ ). Si el lado derecho de (1) es falso, entonces    α1 ≤ hβ0 (α0 ), α1 ≤ α0 ,   h (α ) ≤ α , β1 1 0 si β1 < β0 ; si β1 = β0 ; si β1 > β0 . En consecuencia, mediante ( ⇒ ) (intercambiando 0 y 1) hβ1 (α1 ) < hβ0 (α0 ) respectivamente hβ1 (α1 ) = hβ0 (α0 ), con lo que deducimos ¬(hβ0 (α0 ) < hβ1 (α1 )). Si el lado derecho de (2) es falso, entonces    α0 6= hβ1 (α1 ), α 6= α , 0 1   h (α ) 6= α , β0 0 1 si β0 < β1 ; si β0 = β1 ; si β0 > β1 . Por lo tanto, de acuerdo con ( ⇒ ) en (1), hβ0 (α0 ) < hβ1 (α1 ) o hβ1 < hβ0 (α0 ), con lo que concluimos que hβ1 (α1 ) 6= hβ0 (α0 ). Corolario 2.9. Si β0 ≤ β1 , hβ0 (α) ≤ hβ1 (α). 419 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 420 ✐ ✐ 7. Combinatoria infinita Demostración. Supongamos que β0 < β1 . Por el lema 2.8 (para ≤), basta demostrar que α ≤ hβ1 (α1 ). Pero esto es inmediato del hecho de que para toda función creciente h, α ≤ h(α). Corolario 2.10. Si hβ0 (α0 ) = hβ1 (α1 ), entonces α0 = α1 y β0 = β1 cuando α0 < hβ0 (α0 ) y α1 < hβ1 (α1 ). Demostración. Si β0 = β1 , entonces del lema 2.8 se sigue que α0 = α1 . Si β0 < β1 , por el lema 2.8 se deduce que α0 = hβ1 (α1 ) = hβ0 (α0 ), lo que contradice nuestra hipótesis. Si β1 < β0 , se procede en forma similar. Corolario 2.11. Si h es una función normal con 0 < h(0), todo punto fijo α de h = h0 se puede representar unívocamente en la forma α = hβ (α) con α′ < α. Demostración. Por el lema 2.7, α + 1 ≤ hα+1 (0) y, por lo tanto, α < hα+1 (α). Sea β el mínimo con α < hβ (α). Por hipótesis, 0 < β. Ya que α es punto fijo de todas las hγ con γ < β, α = hβ (α′ ) para alguna α′ . De α < hβ (α) deducimos α′ < α. Unicidad: sea α = hβ1 (α1 ) con α1 < α. Entonces α1 < hβ1 (α1 ), así β ≤ β1 por la elección de β. Si tuviésemos β < β1 , se seguiría hβ (α) = hβ (hβ1 (α1 )) = hβ1 (α1 ) = α, en contradicción con la elección de β. Por lo tanto, β = β1 y por ello α1 = α. En este momento ya podemos demostrar la representación de un número ordinal mediante funciones normales. Supondremos que la función normal inicial h0 = h es la exponenciación con base ω. Teorema 2.12 (h-forma normal). Sea h0 (ξ) = ωξ . Entonces cada número ordinal α se puede representar en forma única como α = hβ1 (α1 ) + · · · + hβn (αn ), con hβ1 (α1 ) ≥ · · · ≥ hβn (αn ) y αi < hβi (αi ) para i = 1, . . . , n. Demostración. Existencia. Primero escribimos α en la forma normal de Cantor α = h0 (δ1 ) + · · · + h0 (δn ) con δ1 ≥ · · · ≥ δn . Aquellos sumandos con δi < h0 (δi ) no se cambian; los otros sumandos satisfacen δi = h0 (δi ) y, por el corolario 2.11, pueden ser sustituidos por hβ (α′ ) con α′ < hβ (α′ ). Unicidad: sea α = hβ1 (α1 ) + · · · + hβn (αn ) ′ ) = hβ1′ (α1′ ) + · · · + hβm′ (αm 420 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 421 ✐ ✐ Conjuntos y modelos. Curso avanzado y supongamos que ambas representaciones son distintas. Puesto que ninguna representación puede ser una extensión de la otra, existe un i ≤ n, m con (βi , αi ) 6= (βi′ , αi′ ). Sin pérdida de generalidad, podemos suponer que i = 1. Si tuviésemos hβ1 (α1 ) < hβ1′ (α1′ ), se cumpliría (en vista de que hβ1′ (α1′ ) es un número principal aditivo1 y hβ1 (α1 ) ≥ · · · ≥ hβn (αn )) ′ ), hβ1 (α1 ) + · · · + hβn (αn ) < hβ1′ (α1′ ) + · · · + hβm′ (αm lo que no es posible. Falta probar que en el caso α < Γ0 , es cierto βi < hβi (αi ) para i = 1, . . . , n. Supongamos que hβi (αi ) ≤ βi para alguna i. Entonces obtenemos hβi (0) ≤ hβi (αi ) ≤ βi ≤ hβi (0). Así, hβi (0) = βi ; en consecuencia, Γ0 ≤ βi = hβi (0) ≤ hβi (αi ) ≤ αi . Esta jerarquía de funciones normales fue extendida por Veblen [Ve08] a funciones con más de un argumento. Schütte [Schü54] estudió con detalle tales funciones. Bachmann generalizó la jerarquía de Veblen usando el primer ordinal no numerable ω1 . 3. El lema de la raíz El lema de la raíz debe su nombre al hecho de que para una familia de conjuntos con ciertas propiedades, existe un conjunto común a todos los miembros de la familia. Esta parte común se llama raíz. Antes de probar el lema requerimos un resultado que es uno de los pilares de toda la combinatoria infinita, un principio llamado principio de las cajas, que generaliza una situación muy conocida en combinatoria finita: si tenemos m palomas y n nidos (m > n), necesariamente alguno de los nidos deberá albergar a más de una paloma si queremos que todas tengan un hogar. Teorema 3.1 (Principio de las cajas). Sean κ un cardinal regular, λ otro cardinal con λ < κ y f : κ − → λ. Entonces existe z ⊆ κ con |z| = κ para el que ocurre lo siguiente: ∀ α, β ∈ z f (α) = f (β). 1 Un ordinal α es un número principal aditivo si α 6= 0 y de β, γ < α se sigue β + γ < α. 421 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 422 ✐ ✐ 7. Combinatoria infinita Demostración. Supongamos que no es cierta la conclusión. Para γ < λ se cumple entonces |f −1 [{γ}]| < κ. De la regularidad de κ se sigue que S S Def αλ = sup f −1 [{γ}] < κ. Por otro lado, κ = γ<λ f −1 [{γ}] ⊆ γ<λ αλ ⊆ κ. Así que {αγ : γ < λ} es un conjunto no acotado en κ de cardinalidad ≤ λ < κ. Esto contradice la regularidad de κ. 3.1. ∆-sistemas. Una familia A es un ∆-sistema si existe un conjunto r tal que a ∩ b = r para cualesquier a, b ∈ A, a 6= b. Si |A| ≥ 2, el conjunto r es único para A y se conoce como raíz. Teorema 3.2. Toda familia no numerable de conjuntos finitos contiene un ∆-sistema no numerable. Demostración. Sea n > 0 un natural, y considere la siguiente afirmación: (∆n ) Todo subconjunto no numerable B ⊆ [ω1 ]n contiene un ∆-sistema no numerable. Afirmación 1. (∆n ) es cierta para toda n. Demostración de la afirmación 1. Por inducción sobre n > 0. Para empezar, note que todo B como en (∆1 ) es un ∆-sistema con raíz ∅. Ahora suponga que (∆n ) es cierta, y sea B = {bξ : ξ < ω1 } ⊆ [ω1 ]n+1 . Para exhibir un ∆-sistema contenido en B, distinguimos dos casos: Caso 1. Para cada α ∈ ω1 , el conjunto {b ∈ B : α ∈ b} es numerable. En esta ocasión, para cada C ⊆ ω1 numerable, el conjunto S {ξ < ω1 : bξ ∩ η∈C bη 6= ∅} es numerable. Definimos recursivamente una función h : ω1 − → ω1 como sigue: h(0) = 0 h(ξ) = mín{η : bη ∩ [ bh(ζ) = ∅}. ζ<ξ La familia A = {bh(ξ) : ξ < ω1 } es un ∆-sistema con raíz ∅. Caso 2. Existe un α ∈ ω1 tal que |{b ∈ B : α ∈ b}| = ℵ1 . Fijemos tal α. Sea C = {b ∈ B : α ∈ b} y C′ = {b \ {α} : b ∈ C}. Por (∆n ) existe un ∆sistema no numerable A′ ⊆ C′ . Sean r la raíz de A′ y A = {a ∪ {α} : a ∈ A′ }. Éste es un ∆-sistema con raíz r ∪ {α}. La conclusión del teorema se sigue de (∆n ): dada cualquier familia no numerable B de conjuntos finitos, a cada miembro b de la familia B le asociamos un natural n, el tamaño de b. Puesto que ω1 es regular, debe existir un natural 422 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 423 ✐ ✐ Conjuntos y modelos. Curso avanzado n y una subfamilia C de B no numerable tal que |c| = n para toda c ∈ C. Por (∆n ) encontramos un ∆-sistema para C que es un ∆-sistema para B. El teorema 3.2 se puede generalizar como a continuación. Teorema 3.3 (Teorema del ∆-sistema). Sean κ, λ cardinales infinitos tales κ que λ es regular y se cumple la desigualdad ν⌣ < λ para cualquier cardinal ν < λ. Si B es un conjunto de cardinalidad al menos λ tal que |b| < κ para todo b ∈ B, existe un ∆-sistema A ⊆ B con |A| = λ. Demostración. Sean κ, λ y B como en las hipótesis. Observe que éstas implican κ < λ. Sin pérdida de generalidad, podemos suponer que |B| = λ. Ya que todo elemento de B tiene cardinalidad menor que λ, nos podemos restringir al caso S en que B ⊆ λ. Cada b ∈ B es un conjunto de ordinales de tipo ordinal menor que κ. Por la regularidad de λ y puesto que κ < λ, existe un ordinal ρ < κ y un subconjunto C ⊆ B de cardinalidad λ tales que todo c ∈ C tiene tipo ordinal ρ.PPara ver esto, sea Bρ = {b ∈ B : to(b) = ρ}; entonces B = ∪ρ<κ Bρ y |B| = ρ<κ Bρ , por lo que algún Bρ debe tener cardinalidad λ. Fijemos tales ρ y C. Por la κ S hipótesis ν⌣ < λ, C es cofinal en λ. Enumeremos C = {cξ : ξ < λ} y para ζ < ρ y c ∈ C, sea c(ζ) el ζ-ésimo elemento de c. Por la regularidad de λ, existe una ζ < ρ tal que {c(ζ) : c ∈ C} no está acotado en λ. Sea ζ0 el menor de tales ζ y definamos α0 = sup{c(η) + 1 : c ∈ C, η < ζ0 }. Entonces α0 < λ y c(η) < α0 para toda c ∈ C, y η < ζ0 . Definimos recursivamente una función h : λ − → λ mediante h(0) = mín{ξ : cξ (ζ0 ) > α0 }, h(α) = mín{ξ : cξ (ζ0 ) > [ {ch(γ) (δ) : γ < α ∧ δ < ρ}}. Observe que h es estrictamente creciente. Sea D = {ch(α) : α < λ} y note que la intersección de cualesquier dos elementos de D es un subconjunto de α0 , pues dos de tales elementos sólo se pueden intersecar “antes” de sus ζ0 -ésimos elementos. κ Como |α0 |⌣ < λ, por hipótesis existe un subconjunto E ⊆ D de cardinalidad λ y un conjunto r ⊆ α0 tal que para cualesquiera e1 , e2 ∈ E, e1 ∩ e2 = r. Para verificar esto, note que |ch(α1 ) ∩ ch(α2 ) | < κ y esta intersección 423 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 424 ✐ ✐ 7. Combinatoria infinita está contenida en α0 ; como tenemos λ posibles parejas a intersecar y a cada intersección está asociado un subconjunto de α0 , debe existir la r mencionada. E es el ∆-sistema requerido con raíz r. 3.2. Aplicaciones. A continuación presentamos algunas aplicaciones a la topología. El lector no versado en esta área es requerido a consultar los conceptos involucrados en la obra [En89] o, en el peor de los casos, evadir estos ejemplos. Todos los espacios topológicos, que en lo sucesivo llamaremos simplemente espacios, se consideran de Tikhonov, aunque en ocasiones esta condición es inecesariamente fuerte. Definición 3.4. Sea µ un cardinal y X un espacio. Se dice que X tiene calibre µ si siempre que se tenga una colección OTde abiertos en X con |O| = µ, existe una subfamilia O′ de O con |O′ | = µ y O′ 6= ∅. Note que un espacio topológico puede tener muchos calibres. La importancia de la noción de calibre se resalta en el siguiente teorema: Q Teorema 3.5. Sea µ un cardinal regular no numerable y sea X = α∈A Xα , donde cada uno de los espacios Xα tiene calibre µ. Entonces X tiene calibre µ. Demostración. Dada una colección O de abiertos enTX con |O| = µ, debemos encontrar una subfamilia O′ de O con |O′ | = µ y O′ 6= ∅. Sea entonces O = {Uλ : λ < µ} y podemos suponer que los conjuntos Uλ son no vacíos y básicos de la forma Uλ = Y α∈Sλ Uλ (α) × Y Xα , α∈A\Sλ donde, para cada λ, el conjunto Sλ es finito (puede ser vacío) contenido en A y pα (Uλ ) es un subconjunto abierto propio de Xα (pα es la proyección de X sobre Xα ). También podemos suponer que Uλ1 6= Uλ2 siempre que λ1 , λ2 sean distintos y menores que µ. Por el teorema 3.2, existen un conjunto F y un subconjunto Λ′ de µ con |Λ′ | = µ, para los cuales Sλ1 ∩ Sλ2 = F siempre que λ1 , λ2 sean elementos distintos de Λ′ . Consideremos dos casos: 424 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 425 ✐ ✐ Conjuntos y modelos. Curso avanzado Caso 1. F = ∅. Entonces para cada α ∈ A tenemos α ∈ Sλ para a lo sumo una λ ∈ Λ′ . Elegimos rα = ( un elemento de pα (Uλ ), un elemento arbitrario de Xα , si α ∈ Sλ para alguna λ ∈ Λ′ ; S si α ∈ / λ∈Λ′ Sλ . Entonces r = {rα : α ∈ A} ∈ ∩{Uλ : λ ∈ Λ′ } como se requiere. Caso 2. F 6= ∅. Puesto que el producto finito de espacios con calibre Q p µ tiene claramente calibre µ, y cada uno de los conjuntos α∈F α (Uλ ) con Q ′ con |M| = µ y X , existe un subconjunto M de Λ λ ∈ Λ′ es abierto en α∈F α Q un punto r en α∈F Xα tales que r∈ \ λ∈ M Y α∈F ! pα (Uλ ) . Ahora, para cada α ∈ A \ F tenemos α ∈ Sλ para a lo sumo una λ ∈ M (de hecho, para a lo sumo una λ ∈ Λ′ ). Escogemos    rα , si α ∈ F ; qα = un elemento de pα (Uλ ), si α ∈ / F ∧ α ∈ Sλ para algún λ ∈ M;   un punto arbitrario en X , si F ∪ (S α λ∈M Sλ ); por lo que q = {qα : α ∈ A} ∈ T {Uλ : λ ∈ M} como se requiere. Ejemplo 3.6. Sea µ un cardinal débilmente inaccesible, es decir, un cardinal regular y límite, y para cada cardinal κ < µ sea Xκ un espacio discreto de Q cardinalidad κ. Definimos Xκ = κ<µ Xκ . Entonces c(X) = µ (c(X) es la celularidad) y c(X) no se alcanza, es decir |O| < µ para toda colección O de abiertos no vacíos ajenos entre sí en X. Cada uno de los espacios Xκ para κ < µ tiene calibre µ: si O es una colección de abiertos no vacíos de Xκ con |O| = µ, entonces definimos O(x) = {U ∈ O : x ∈ U}. S Para cada x ∈ Xκ se observa que, dado que µ es regular y O = x∈Xκ O(x), existe x ∈ Xκ con |O(x)| = µ. Por el teorema 3.5 el espacio X tiene calibre µ, así que c(x) ≤ µ y ninguna colección de subconjuntos abiertos no vacíos mutuamente ajenos puede tener µ elementos. 425 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 426 ✐ ✐ 7. Combinatoria infinita Falta demostrar que c(X) ≥ µ. Esto es evidente porque si κ < µ y pκ es la proyección de X sobre Xκ , entonces la familia {p−1 κ (x) : x ∈ Xκ }, que tiene κ elementos, es una familia de abiertos no vacíos ajenos entre sí en X. 4. Clubes y conjuntos estacionarios En la sección 2 se introdujo el concepto de clase normal. En esta sección describiremos dos tipos de subconjuntos “grandes” de cardinalidad κ y extenderemos el concepto de clase normal a cardinales. Para empezar, estudiaremos las familias casi ajenas. 4.1. Familias casi ajenas. Definición 4.1. Sea κ un cardinal infinito. Si x, y ⊆ κ, x y y son casi ajenos si |x ∩ y| < κ. Una familia casi ajena es un conjunto A ⊆ Pot(κ) tal que ∀ x ∈ A(|x| = κ) y cualesquier dos elementos distintos de A son casi ajenos. Una familia máxima casi ajena es una familia casi ajena A que no está contenida propiamente en otra familia B casi ajena. Existe una gran diferencia entre familias casi ajenas y familias ajenas. En un cardinal κ una familia ajena no puede tener más de κ elementos. En cambio, para ciertos κ podemos encontrar familias casi ajenas de cardinalidad 2κ . Teorema 4.2. Sea κ ≥ ω un cardinal regular; entonces: (a) Si A ⊆ Pot(κ) es una familia casi ajena y |A| = κ, entonces A no es máxima. (b) Existe una familia casi ajena máxima B ⊆ Pot(κ) de cardinalidad ≥ κ+ . Demostración. (b) se sigue directamente de (a) y del lema de Zorn: sea A ⊆ Pot(κ) una familia ajena (o casi ajena) de cardinalidad κ, y sea B ⊃ A una familia casi ajena máxima; entonces |B| > κ por (a). (a) se demuestra de la siguiente forma: sean A = {Aξ : ξS < κ} y Bξ = S Aξ \ η<ξ Aη . Los conjuntos Bξ no son vacíos pues Bξ = Aξ \ η<ξ (Aξ ∩ Aη ), S |Aξ | = κ, y | η<ξ (Aξ ∩ Aη )| < κ por la regularidad de κ. Elegimos βξ ∈ Bξ . Por lo tanto, todos los βξ son distintos ya que los conjuntos Bξ son ajenos, por lo que D = {βξ : ξ < κ} tiene cardinalidad κ. Si βξ ∈ Aη , η ≥ ξ, se cumple 426 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 427 ✐ ✐ Conjuntos y modelos. Curso avanzado D ∩ Aη ⊆ {βξ : ξ ≤ η}. En consecuencia, D y Aη son casi ajenos para toda η. Respecto a la cardinalidad de familias casi ajenas, tenemos la siguiente estimación: κ Teorema 4.3. Si κ ≥ ω y 2⌣ = κ, entonces existe una familia casi ajena A ⊆ Pot(κ) con |A| = 2k . κ Demostración. Por el teorema 3.2.9, la hipótesis implica κ = κ⌣ , así que tenemos κ subconjuntos de cardinalidad menor que κ. Sea I = {x ⊆ κ : κ T sup(x) < κ}. Como 2⌣ = κ, |I| = κ. Si X ⊆ κ, sea AX = {X α : α < κ}. Si |X| = κ, se cumple |AX | = κ. Si X 6= Y , |AX ∩ AY | < κ; fijamos una β tal que ¬(β ∈ X ⇔ β ∈ Y ), y entonces AX \ AY ⊆ {X ∩ α : α ≤ β}. Sea A = {AX : X ⊆ κ ∧ |X| = κ}; en consecuencia, |A| = 2κ y A es una familia casi ajena de subconjuntos de I. Si f es una función inyectiva de I sobre κ, {f [A] : A ∈ A} es una familia casi ajena de 2κ subconjuntos de κ. Pasemos ahora el estudio de conjuntos de ordinales cerrados y no acotados. En lo sucesivo fijamos un cardinal infinito κ de cofinalidad no numerable. Definición 4.4. Un subconjunto C de κ es un club2 si: (i) C es cerrado, es decir, para todo Y ⊆ C, si sup Y ∈ κ, entonces sup Y ∈ C. (ii) C no es acotado, es decir, sup C = κ. Como ejemplo considere los segmentos terminales del cardinal κ, es decir, conjuntos del tipo {α : α ≥ β} para algún β < κ. Si A no está acotado en κ, el conjunto A′ = {α < κ : α = sup(α ∩A)} de los puntos de acumulación de A es un club: para mostrar que no está acotado, comencemos con un β < κ. Ya que A no está acotado, encontramos una sucesión β < α0 < α1 < · · · < αn < · · · de elementos de A. Dado que la cofinalidad de κ no es numerable, el supremo de las αi está en κ y pertenence a A′ . Si κ es un cardinal límite, el conjunto de los cardinales menores de κ es un club. 2 Del inglés closed and unbounded. Utilizamos esta nomenclatura pues está muy difundida en la literatura, y creemos que el lector sólo ganaría en confusión si empleáramos alguna traducción al español. 427 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 428 ✐ ✐ 7. Combinatoria infinita También κ es un club en κ. Decimos que α es un punto límite de C ⊆ κ si para todo β < α existe γ ∈ C tal que β < γ < α, es decir, α es un punto de acumulación de C. Ası́, se puede decir que un conjunto C es cerrado en κ si contiene todos sus puntos límite. El lector puede verificar que cuando C es un club, el conjunto C∗ = {α ∈ C : α es punto límite de C} también es un club. Más aún, si X es un subconjunto no acotado de un cardinal regular no numerable, entonces X∗ es un club: Lema 4.5. Sea κ un cardinal regular no numerable. Si X es un subconjunto no acotado de κ, entonces el conjunto formado por todos los puntos lı́mite de X es un club de κ. Demostración. Sea A el conjunto de puntos lı́mite de X. El conjunto A es no acotado en κ: Sea γ < κ. Por recursión sobre ω definimos: β0 = γ, una vez definido βn , sabemos que existe α ∈ X tal que βn < α, y definimos βn+1 como dicha α. S Ahora, sea β = n∈ω βn , y puesto que S {βn |n ∈ ω \ {∅}} ⊆ X ∩ β, S S entonces β = n∈ω βn ≤ (X ∩ β) ≤ β, es decir, β = (X ∩ β), lo cual implica que β ∈ A; pero como β > γ, hemos demostrado que A es no acotado en κ. El conjunto A es cerrado en κ: sea γ < κ un punto lı́mite de A. Demostraremos que γ ∈ A, es decir, que γ es un punto lı́mite de X. Sea β ∈ γ, y buscamos ν ∈ (X ∩ γ) tal que β < ν. Por la elección de γ sabemos S que existe λ ∈ A tal que β < λ < γ; ası́, (X ∩ λ) = λ y (β < λ < γ). Luego, existe ν ∈ (X ∩ λ) tal que β ≤ ν. Pero como X ∩ λ ⊆ X ∩ γ ocurre que dicho ν ∈ (X ∩ γ) y β ≤ ν. Concluimos ası́ que γ es un punto lı́mite de X, es decir, que γ ∈ A. Ejemplo 4.6. Sean κ un cardinal regular no numerable, f : κn − → κ para alguna n ≥ 1 y C = {σ ∈ κ : f (x) ∈ σ∀ x ∈ σ n }. Se afirma que C es un club en κ; si σ ∈ κ, σ n = (σ, σ, . . . , σ) ∈ κn . Es claro que C es cerrado en κ. Para probar que no está acotado debemos mostrar que para toda β ∈ κ existe α > β tal que α ∈ C. Definimos una sucesión creciente de βm como sigue: n es menor que sea β0 = β; si βm se ha definido, como la cardinalidad de βm 428 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 429 ✐ ✐ Conjuntos y modelos. Curso avanzado n . Si hacemos κ, existe βm+1 > βm tal que f (x) ∈ βm+1 para todo x ∈ βm α = sup{βm : m ∈ N}, es claro que α ∈ C. Por otro lado, esto demuestra que existe un club de subconjuntos de κ que es cerrado respecto a f . Es conveniente describir ciertas propiedades de los clubes, tarea que a continuación realizamos. Lema 4.7. La intersección de dos clubes es un club. Demostración. Es claro que la intersección de conjuntos cerrados es cerrada. Sean C y D clubes y γ un elemento de κ. Escogemos una sucesión creciente γ < α0 < β0 < α1 < β1 < · · · de elementos αi ∈ C y βi ∈ D. Entonces supi<ω αi = supi<ω βi pertenece a C ∩D. Por lo tanto, la intersección es no acotada. Note que el lema 4.7 se generaliza inmediatamente a un número finito de clubes. En particular, la familia de todos los clubes es una base filtro3 y podemos generar un “filtro de clubes” (véase el Cap. 6). Es claro que la intersección de cualquier cantidad de clubes en κ es cerrada en κ, pero puede ser no acotada. Por ejemplo, si λ = cf (γ) y f : λ − → γ tiene rango cofinal en γ, seaTCα = {ν ∈ γ : ν > f (α} para cada α ∈ λ; entonces cada Cα es un club, pero {Cα : α ∈ λ} es vacío. Sin embargo, tenemos el siguiente resultado positivo: Lema 4.8. La intersección de menos que cf (κ) clubes es un club. Demostración. Sea µ un cardinal menor que κ y {Cα : α < µ} una familia de clubes. Mostraremos, por inducción sobre µ, que la intersección D de los Cα no está acotada. El caso µ finito se sigue del lema 4.7. Sea µ infinito T y γ < cf (κ). Por hipótesis de inducción, todos los Dα = β<α Cβ no están acotados. Definimos recursivamente f : µ − → κ mediante Def f (α) = {ε ∈ Dα : ε ≥ γ; ε es mayor que cualquier elemento def [α]}. La función f está bien definida pues f [α] no puede ser cofinal en κ. Dado que µ es límite, δ = supα<µ f (α) para cada β < µ y de hecho es igual al supβ<α<µ f (α); como supremo de elementos de Cβ , δ pertenece a todos los Cβ y es mayor que γ. 3 Una familia de conjuntos no vacíos es una base filtro si la intersección de cualesquier dos elementos de la familia contiene un elemento también de la familia. 429 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 430 ✐ ✐ 7. Combinatoria infinita Sea {Aα : α < κ} una familia de subconjuntos de κ. La intersección diagonal de los Aα se define como ∆α Aα =   α<κ:α∈  \ β<α Aβ   .  Teorema 4.9. Si κ es un cardinal regular no numerable, la intersección diagonal de clubes es un club. Demostración. Sea D la intersección diagonal de la familia de clubes {Cα : α < κ}. El conjunto D es cerrado: sea α = sup(D ∩ α) < κ un ordinal. Fijemos un β < α. Entonces α es el supremo de ordinales miembros de D que están entre β y α. Sin embargo, todos estos ordinales están en Cβ ; por consiguiente, α pertenece a Cβ . Concluimos que α ∈ D. D no está acotado: dado β ∈ κ, debemos encontrar un α ∈ C tal que α > β. Definimos una sucesión de βn por inducción sobre n ∈ ω: β0 = β; si βn se ha definido, elegimos βn+1 > βn tal que βn+1 ∈ Cβn . Sea α = sup{βn : n ∈ ω}. Entonces, para cualquier ν < α existe m con βm ≥ ν ∈ Cβn ⊆ Cβm ⊆ Cν ; por consiguiente, α = sup{βn : n > m} pertenece a Cν . En relación con los resultados de la segunda sección, podemos establecer el siguiente lema que remite a las funciones normales: Lema 4.10. Sean κ un cardinal regular no numerable y f : κ −→ κ una función normal. El conjunto {α ∈ κ|f (α) = α} es un club de κ. Demostración. Sean A = {α ∈ κ|f (α) = α} y γ < κ un punto lı́mite de A; ası́, [ [ [ f (α) = f (α) = α = γ. f (γ) = α<γ α∈A∩γ α∈A∩γ Por lo tanto γ ∈ A, y queda demostrado el hecho de que A es cerrado en κ. Para demostrar que A es no acotado, tome γ < κ arbitrario y considere la siguiente sucesión definida por recursión: α0 = γ; αn+1 = f (αn ), 430 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 431 ✐ ✐ Conjuntos y modelos. Curso avanzado S y el ordinal α = n∈ω αn . Ahora, dado que f es creciente, α ≥ γ. Pero además, la continuidad de f implica que f (α) = [ β<α f (β) = [ f (αn ) = n∈ω [ n∈ω es decir, hemos encontrado α ∈ A tal que γ ≤ α. ℵn+1 = α; También hay otras formas de obtener clubes en términos de funciones: Lema 4.11. Sea κ un cardinal regular no numerable, y sea h : κ −→ κ. El conjunto A definido por es un club de κ. A = {α ∈ κ|(∀β < α)(h(β) < α)} S Demostración. Sea γ un punto lı́mite de A. Como (A ∩ γ) = γ, para cada ν < γ existe un ordinal λν ∈ A ∩ γ tal que ν < λν ; ası́, h(ν) < λν < γ para toda ν < γ, lo cual implica que A es cerrado en κ. Para demostrar que A es no acotado en κ, considere γ ∈ κ arbitrario y la siguiente sucesión: Si α = S α0 = γ; αn+1 = mín{λ ∈ κ|h[αn ] ⊆ λ}. n∈ω ℵn , entonces α ≥ γ y α ∈ A. Definición 4.12. Un subconjunto S de κ es estacionario si intersecta todo club en κ. Proposición 4.13. Sea κ un cardinal regular no numerable. Entonces existe una familia A ⊆ Pot(κ) de cardinalidad 2κ tal que A − B es estacionario en κ para todo A, B ∈ A, A 6= B. Demostración. Sea hEα : α < κi una sucesión de subconjuntos ajenos estacionarios de κ (Teorema 4.27 más adelante). Sea F ⊆ Pot(κ) una familia de cardinalidad 2κ tal que S A \ B 6= ∅ para todo A, B ∈ F con A 6= B. Para A ∈ F definimos EA = {Eα : α ∈ A}. Entonces A = {EA : A ∈ F} satisface la conclusión de la proposición. Lema 4.14. Sean κ un cardinal regular no numerable, E un conjunto estacionario en κ y C un club de κ. El conjunto intersección E ∩ C es estacionario en κ. 431 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 432 ✐ ✐ 7. Combinatoria infinita Demostración. Si D es un club cualquiera de κ, entonces sabemos (por el Lema 4.8) que C ∩ D es de nuevo un club de κ; ası́ E ∩ (C ∩ D) 6= ∅, es decir, (E ∩ C) ∩ D 6= ∅. S Lema 4.15. Si λ < cf (κ) y {Xν : ν < κ} es estacionario en κ, existe ν < λ tal que Xν es estacionario en κ. Demostración. Si no fuese cierta la afirmación, entonces  S para cada ν T existe un club Cν con Cν ∩Xν = ∅. Pero entoncesS ν<λ Cν ∩ ν<λ Xν = ∅, que es una contradicción de la hipótesis de que ν<λ Xν es estacionario, pues T ν<λ Cν es un club. Los tres últimos teoremas se pueden expresar en términos de conjuntos estacionarios: la unión de dos conjuntos no estacionarios es un conjunto no estacionario. La unión de menos que cf (κ) conjuntos no estacionarios no es estacionaria. Finalmente, la unión diagonal {α < κ : α ∈ [ β<α Aβ } de una familia {Aα } de conjuntos no estacionarios no es estacionaria: para cada α, sea Cα un club ajeno a Aα , entonces la unión diagonal de los Aα es ajena a la intersección diagonal ∆α Cα . Otra formulación de esta afirmación es el teorema de Fodor: Teorema 4.16 (Fodor). Sean S un subconjunto estacionario del cardinal no numerable y regular κ y f : S − → κ una función regresiva, es decir, f (α) < α para toda α ∈ S. Entonces f es constante en un subconjunto estacionario de S. Demostración. Sea S la unión diagonal de los Aα = {β ∈ S : f (β) = α}. Ya que S es estacionario, alguno de los conjuntos Aα debe ser estacionario. En conjuntos no estacionarios S que no contengan al 0 siempre existen funciones regresivas f que no toman el mismo valor un número cofinal de veces: si C es un club ajeno a S, definimos f (s) = máx(s ∩ C). Definición 4.17. Sea κ un cardinal regular no numerable. subconjunto de κ, definimos Si E es un E′ = {γ ∈ κ : cf (γ) > ℵ0 , E ∩ γ es estacionario en γ}. 432 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 433 ✐ ✐ Conjuntos y modelos. Curso avanzado Decimos que E es disperso si E′ = ∅. Ejemplo 4.18. Para cualquier cardinal regular ρ < κ, sea Eρ = {α ∈ κ : cf (α) = ρ}. Entonces Eρ es un subconjunto estacionario de κ: dado un club C en κ, podemos definir fácilmente por recursión una función normal f : κ − → C tal que f (ρ) es un miembro de C de cofinalidad ρ, por lo que pertenece a Eρ ; así, C ∩ Eρ 6= ∅. Si κ = ℵ1 , Eℵ0 es un club; de hecho, Eℵ0 es el conjunto de ordinales límite menores que ℵ1 . Para κ > ℵ1 , Eρ no contiene un club pues cualquier club contiene elementos de todas las posibles cofinalidades menores que κ. Si κ = λ+ , donde λ es regular, Eλ es un subconjunto disperso de κ pues para cualquier γ ∈ κ de cofinalidad no numerable existe un club γ con elementos de toda cofinalidad menor que cf (γ) ≤ λ. Proposición 4.19. Suponga que F es un filtro κ-completo en κ = λ+ que contiene al filtro cofinito. Sea S ⊆ κ tal que κ \ S ∈ / F . Entonces existe una S descomposición S = β∈κ Sβ , en κ subconjuntos Sβ mutuamente ajenos, tal que para toda β, κ \ Sβ ∈ / F. Demostración. Para cada α < κ, escogemos una función gα : λ − →α sobre. Para toda ν ∈ λ, β ∈ κ, sea Sβν = {α ∈ S : gα (ν) = β}. Afirmamos que existe un ν tal que {Sβν : β ∈ κ, κ \ Sβν ∈ / F } tiene S ν cardinalidad κ. Primero fijamos β, y sea Yβ = {Sβ : ν ∈ λ}; entonces Yβ = {α ∈ κ : α > β} ∩ S. Ya que las gα son suprayectivas, F es κ-completo y contiene al filtro cofinito; las hipótesis implican que {α ∈ κ : α > β} ∈ F . Así que κ \ Yβ no pertenece a F . Puesto que F es κ-completo, existe ν(β) tal T que κ \ Sβν(β) ∈ / F (en otro caso, κ \ Yβ = ν κ \ Sβν pertenecería a F ). Sabemos que β varía sobre κ y ν(β) varía sobre λ que es menor que κ, por lo que existe ν ∈ λ tal que ν = ν(β) para κ elementos β, que es exactamente nuestra afirmación. Sean ν como en la afirmación, I = {β ∈ κ : κ \ Sβν ∈ / F} y S W = S \ {Sβν : β ∈ I}. Note que para ν fija, los Sβν son ajenos entre sí. Sean µ el primer elemento de I, Sµ = Sµν ∪ W y para β ∈ I \ {µ} Sβ = Sβν . S Entonces, S = β∈I Sβ es la descomposición requerida. A continuación definiremos dos nuevos conceptos de gran utilidad en álgebra: el de κ-filtración y el de coloración de una “escala”. 433 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 434 ✐ ✐ 7. Combinatoria infinita Definición 4.20. Sea A un conjunto de cardinalidad no mayor que κ. Una κfiltración de A es una sucesión hAν : ν < κi tal que para cualesquier, µ, ν < κ: (1) La cardinalidad de Aν es menor que κ. (2) µ < ν implica Aµ ⊆ Aγ . S (3) (Continuidad) si ν es límite menor que κ, Aν = τ<ν Aτ . S (4) A = ν<κ Aν . Observación 4.21. Las filtraciones de un conjunto son “casi” únicas. Suponga que {A′ν : ν < κ} es otra κ-filtración de A. Se afirma que C = {ν ∈ κ : Aν = A′ν } (*) es un club en κ. Está claro que C es cerrado en κ (por la continuidad de las filtraciones). Para probar que C no está acotado, sea β ∈ κ, y defina β0 = β; si βn se ha definido y n es impar (respectivamente par), sea βn+1 > βn elegido de tal manera que Aβn ⊆ A′βn+1 (respectivamente A′βn ⊆ Aβn+1 ); esto es posible por las condiciones (1), (4) y la regularidad de κ. Entonces, si α = sup{βn : n es impar} = sup{βn : n es par}, tenemos Aα = A′α ; así que α ∈ C. Más generalmente, si {Bν : ν < κ} es una κ-filtración de otro conjunto de cardinalidad κ y Θ : A − → B es sobre, entonces existe un club tal que para ν ∈ C, Θ[Aν ] = Bν . Si f : An − → A, justo como en el ejemplo 4.18, se puede mostrar que {ν < κ : Aν es cerrado respecto a f } es un club en κ. Si Θ : κ − → A es tal que para toda ν, Θ(ν) ∈ Aν , entonces existe un conjunto estacionario S de tal forma que f es constante en S, que es una modificación del teorema de Fodor. La filtraciones tienen muchas aplicaciones en álgebra, o donde los elementos de las filtraciones son subgrupos (o subanillos, submódulos). Trataremos a continuación el caso de grupos κ-libres. Un grupo G es κ-libre si todo subgrupo de cardinalidad menor que κ es libre. Para tales grupos se puede escoger la filtración canónica, es decir, tal que cada elemento Gν es κ-puro en G o Gν+1 /Gν no es libre, donde un subgrupo H de G es κ-puro en G si siempre que H ⊆ K ⊆ G y |K/H| < κ, entonces H es un sumando directo de K. Así que Gν es κ-puro en G si y sólo si Gµ /Gν es libre para todo µ < ν. Es fácil mostrar que existe una κ-filtración canónica: sean {Gν : ν < κ} una 434 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 435 ✐ ✐ Conjuntos y modelos. Curso avanzado filtración en G y µ = 0. En general, si µν se ha elegido, quedan dos casos: si Gµν es κ-puro, entonces sea µν+1 = µν +1; si Gµν no es κ-puro, elegimos µν+1 tal que Gµν+1 /Gµν no sea libre. Para ordinales límite λ, sea µλ = supν<λ µν . Por lo tanto, {Gµν : ν < κ} es una filtración canónica. Otro ejemplo refiere a módulos ≤κ -generados (véase pág. 511). Todo módulo ≤κ -generado tiene una κ-filtración canónica {Mν : ν < κ} con la propiedad de que Mν es un submódulo <κ -generado de M. Sea X = {xµ : µ < κ} un conjunto de generadores para M. Simplemente tomamos Mν = hxµ : µ < νi para obtener la filtración buscada. Lema 4.22. Sean κ un cardinal regular no numerable y M un módulo ≤κ generado. Entonces: (i) M tiene una κ-filtración. (ii) Si {Mν : ν ∈ κ} y {Mν′ : ν ∈ κ} son dos filtraciones de M, existe un club C en κ tal que para toda ν ∈ C, Mν = Mν′ . Demostración. (i) Sea X = {xµ : µ < κ} un conjunto generador para M. La κ-filtración buscada la determinan los conjuntos Mν = hxµ : µ < νi. (ii) La prueba se basa en un argumento enteramente similar al de la observación 4.21. Definición 4.23. Sea E un subconjunto de ω1 consistente en ordinales límite. Si δ ∈ E, una escala en δ es una función ηδ : ω − → δ que es estrictamente creciente y tiene rango cofinal en δ. Un sistema de escalas en E es una familia η = {ηδ : δ ∈ E} tal que cada ηδ es una escala en δ. El teorema de Fodor implica que si E es estacionario en ω1 , entonces los miembros de un sistema de escalas dado no pueden ser ajenos: dado un sistema de escalas η, para una n fija definimos fn : E − → ω1 mediante fn (δ) = ηδ (n). Esta función es regresiva, por lo que existe una α y un subconjunto estacionario E′ de E tal que para toda δ ∈ E′ , ηδ (n) = α. Lema 4.24. Supongamos que λ = µ+ y µ = µℵ0 . Para todo conjunto estacionario S ⊆ λ que consiste enteramente en ordinales de cofinalidad ω, existe un sistema de escalas {ηδ : δ ∈ S} tal que para todo club C ⊆ λ, el conjunto {δ ∈ S : ηδ [ω] ⊆ C} es estacionario. Demostración. Para δ ∈ S sea {ηiδ : i < µ} una enumeración de {η : η es una familia creciente de ω a δ con límite δ}. 435 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 436 ✐ ✐ 7. Combinatoria infinita Para i < µ, sea ηi = {ηiδ : δ ∈ S}. Afirmamos que una de las ηi satisface la conclusión del lema. Si no fuera así, para cada i < µ existe un club Ci ⊆ λ Ttal que el conjunto Ti = {δ ∈ S : ηiδ [ω] ⊆ Ci } no es estacionario. Sea C = i<µ Ci . Escogemos δ ∈ S, que es un punto límite de C. Así que para algún i, ηi [ω] ⊆ C ⊆ Ci , lo que es una contradicción. Para un cardinal λ ≥ 2, una λ-coloración de un sistema de escalas η en E es una familia c = {cδ : δ ∈ E} tal que cδ : ω − → λ. Podemos pensar que λ es un conjunto de “colores” y que cδ es una coloración de ηδ (n) con el color cδ (n). Queremos uniformar esta coloración en el sentido de que c asigne un color fijo a cada ordinal α independientemente de la o las escalas en las que α aparezca. En vista de lo recién demostrado con el teorema de Fodor, no podemos esperar lograrlo en general porque podemos tener ηδ (n) = ηγ (m) = α con δ 6= γ y podría ocurrir cδ (n) 6= cγ (m). Por ello usamos una noción modificada: la uniformación de una coloración c de un sistema de escalas η en E es una pareja (f, f ∗ ) donde f : ω1 − → λ, f ∗ : E − → ω y para toda δ ∈ E y toda ∗ n ≥ f (δ), si α = ηδ (n), entonces f (α) = cδ (n). Si tal pareja existe, decimos que c se puede uniformar. Posteriormente veremos que suponiendo ♦(E), no toda (η, λ)-uniformación es cierta. Sin embargo, suponiendo una variante del axioma de Martin (MA(ℵ1 )), entonces sí es cierta, lo que probaremos en el segundo volumen. Para que exista la pareja es suficiente con tener alguno de los miembros de la pareja, es decir, ya sea f de tal forma que para toda δ ∈ E, f (ηδ (n)) = cδ (n), para toda n con un número finito de excepciones, o f ∗ tal que para toda δ, α ∈ E, si n ≥ f ∗ (δ), m ≥ f ∗ (α) y ηδ (n) = ηα (m), entonces cδ (n) = cα (m). Si tenemos f , entonces f ∗ (δ) se puede definir como el menor n tal que f (ηδ (m)) = cδ (m) para toda m ≥ n. Por otra parte, si tenemos f ∗ escogemos cualquier f tal que f (ηδ (n)) = cδ (n) para toda n ≥ f ∗ (δ). Decimos que la (η, λ)-uniformación es cierta si toda λ-coloración de η se puede uniformar. Nuestro siguiente objetivo es introducir un juego basado en conjuntos estacionarios y clubes. El lector puede consultar [Hod97] o [MiMa99] para conocer sobre juegos y teoría de modelos. Sea A un subconjunto de ω1 . El A-juego se efectúa entre dos competidores I y II. Si I escoge un ordinal α0 de ω1 , II escoge un ordinal mayor α1 de ω1 , entonces I escoge α2 > α1 , y así sucesivamente, todo en ω1 . Después de ω etapas I gana si supi<ω αi ∈ A; en otro caso, II vence. Una estrategia ganadora 436 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 437 ✐ ✐ Conjuntos y modelos. Curso avanzado para I es una prescripción que determina la tirada de I dependiendo de las tiradas previas, con lo que I debe ganar sin importar lo que haga II. Por lo tanto, una estrategia ganadora es una familia (fn : n < ω) de funciones fn : ω1n − → ω1 tales que para toda sucesión α0 < α1 < α2 < . . . con α2n = fn (α1 , . . . , α2n−1 ), su supremo está en A. Una estrategia ganadora para II se define de manera similar. Un juego está determinado si alguno de los jugadores tiene una estrategia ganadora. Un juego es cerrado en el siguiente caso: cualquier partida (aα : α < λ) es una partida ganadora para I si para toda δ < λ, (aα : α < δ) se puede extender a una partida ganadora para I. En forma similar, un juego es abierto cuando ocurre lo siguiente: toda partida (aα : α < δ) del juego es una partida ganadora para II si para toda δ < λ, (aα : α < δ) se puede extender a una partida ganadora para II. El siguiente es una consecuancia de las definiciones previas: Teorema 4.25. Todo juego abierto o cerrado está determinado. Demostración. Consideremos sólo el caso de juegos cerrados. Supongamos que el jugador II no tiene una estrategia ganadora. Describiremos una estrategia ganadora para I. En toda etapa ordinal par I mueve de tal forma que II no tiene una estrategia ganadora para este juego y después de que I ha tirado. La suposición de que II no tiene una estrategia ganadora significa que existe una tirada para I en cada etapa. Como el juego es cerrado, I gana la partida. Teorema 4.26. El jugador I (respectivamente II) tiene una estrategia ganadora si y sólo si A (respectivamente ω1 \ A) contiene un club. Demostración. Mostramos la afirmación para I. Supongamos que A contiene el club C; I escoge simplemente como α2n un elemento de C mayor que α2n−1 . Esto siempre es posible pues C no está acotado. Ya que C es cerrado, el supremo de los αi así elegidos pertenece a C. Recíprocamente, sea (fn ) una estrategia ganadora para I. Llamaremos a un ordinal α < ω1 cerrado si para toda n se cumple α1 , . . . , αn < α ⇒ fn (α1 , . . . , αn ) < α. Afirmación. El conjunto C de todos los ordinales cerrados es un club. Demostración de la afirmación. Es fácil ver que C es cerrado. Sea β0 un ordinal arbitrario de ω1 . Definimos recursivamente βi+1 = máx{βi , sup(∪fn [βin ])}, 437 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 438 ✐ ✐ 7. Combinatoria infinita y entonces supi<ω βi ∈ C.◭ Sea D el conjunto de los ordinales límite de ω1 y α ∈ C ∩ D. Dejamos que I juegue con su estrategia. Como α es límite II, puede elegir un α2n+1 < α después de α2n < α. Toda la partida se desarrolla debajo de α, pues α es un ordinal cerrado. Si II escoge finalmente un ordinal suficientemente grande, α será el supremo de la sucesión. Dado que I debe ganar el juego, α ∈ A. Entonces A contiene el club C ∩ D. En consecuencia, II no tiene estrategia ganadora si A es estacionario. Un juego está determinado si I o II tiene una estrategia ganadora. El siguiente teorema asegura la existencia de juegos de este tipo no determinados. Teorema 4.27 (Solovay). Todo cardinal regular κ no numerable se puede descomponer en κ conjuntos estacionarios ajenos entre sí. Demostración. Sea S el conjunto (estacionario) de los ordinales límite en κ de cofinalidad ω. Para cada α ∈ S escogemos una sucesión estrictamente creciente hδiα : i < ωi que converge a α. Fijemos β < κ. Para cada α del estacionario S \ β existe un n(α) con α δn(α) > β. De acuerdo con la “la versión estacionaria” del lema 4.8, existe un nβ tal que el conjunto Rβ = {α ∈ (S \ β) : n(α) = nβ } es estacionario. Si utilizamos el teorema 4.16 con la función regresiva α 7→ δnαβ y obtenemos un conjunto estacionario Sβ ⊆ Rβ en el que esta función es constante y toma el valor δβ . Ya que siempre se tiene δβ > β, el conjunto de los δβ es cofinal en κ y tiene entonces cardinalidad κ. Por lo tanto, existe un subconjunto I de κ de cardinalidad κ para el que todos los δβ (β ∈ I) son distintos. Puesto que cf (κ) > κ, existe un n tal que el conjunto J = {β ∈ I : nβ = n} tiene cardinalidad κ. En consecuencia, los conjuntos estacionarios Sβ para β ∈ J son ajenos entre sí, pues si α ∈ Sβ , entonces δnα = δβ . Corolario 4.28. Cada κ con cardinalidad no numerable se puede descomponer en cf (κ) subconjuntos estacionarios mutuamente ajenos. 438 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 439 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sean C un club en κ isomorfo a cf (κ) (Lema 2.16.5) y f : cf (κ) − → C el isomorfismo. Si los Sα son subconjuntos estacionarios ajenos entre sí de cf (κ), los f [Sα ] son subconjuntos ajenos estacionarios de κ. Los f [Sα ] también son estacionarios ajenos entre sí pues, debido a la continuidad de f , para cada club D en κ, f −1 (D) es un club en cf (κ). Ya que todos los conjuntos estacionarios de κ tienen intersección no vacía con C, κ no puede tener más que |C| = cf (κ) subconjuntos estacionarios. Con los conceptos recién introducidos restringidos a ω1 podemos definir varias nociones de tamaño para subconjuntos de ω1 . Por ejemplo, un conjunto numerable sería pequeño. Es evidente que un club es muy grande. Como los conjuntos estacionarios son necesariamente cofinales en ω1 , entonces no son pequeños, y de hecho son los conjuntos más grandes después de los clubes. Todo club es un conjunto estacionario, y los conjuntos estacionarios presentan muchas de las propiedades útiles de los clubes. No todos los conjuntos no acotados son estacionarios, y no todos los conjuntos estacionarios son clubes, puesto que todo estacionario se puede descomponer en ℵ1 subconjuntos estacionarios ajenos entre sí, de acuerdo con el teorema 4.27. De hecho, frecuentemente se considera a los conjuntos estacionarios como “casi” clubes. Se pueden caracterizar los subconjuntos estacionarios de ω1 como aquellos conjuntos que son “potencialmente clubes”. Estas ideas se formalizan en el siguiente teorema, cuya demostración excede los límites de este primer volumen. El lector puede consultar una demostración en [De79, pág. 52]. Teorema 4.29. Sea E ⊆ ω1 . Entonces E es estacionario si y sólo si existe una extensión W del universo V tal que ωjW = ω1 y W |= (E contiene un club). Entendemos por extensión del universo a una clase transitiva que contenga a V y que satisfaga todos los axiomas de ZFE . En este caso, ω1W es precisamente el ordinal ω1 según W (véase el Cap. 8). 5. El teorema de Silver Como ya se mencionó, es poco lo que se puede decir sobre la exponenciación cardinal. El uso de HC o HGC ayuda en algunos casos. En esta sección probaremos el teorema de Silver (véase [Sil74]) en ZFE , que asegura que la HGC es cierta en algunos casos. La demostración original de Silver involucra un hermosa construcción usando teoría de modelos. Posteriormente, Baumgartner y Prikry [BaPr76] eliminaron la parte de la teoría de modelos en la 439 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 440 ✐ ✐ 7. Combinatoria infinita demostración. El teorema de Silver afirma que si la HGC se cumple en una cantidad suficiente de cardinales debajo de un cardinal µ, también se cumple en µ. La demostración se descompone en varios lemas para facilitar su lectura. Próximos a abordar el teorema de Silver, debemos concentrarnos en el análisis de la exponenciación cardinal. En el siguiente caso, el valor de 2κ está determinado por los valores de la función continuo debajo de κ, donde la función continuo está definida mediante ℵα 7→ 2ℵα . Más adelante requerimos el siguiente lema técnico. Lema 5.1. Si κ es un cardinal límite, entonces κ 2κ = (2⌣ )cf (κ) . Demostración. Sea κ = κ 2 =2 P i<cf (κ) κi = = Y i<cf (κ)  P 2κi ≤ κ cf (κ) = 2⌣ = 2κ . i<cf (κ) κi , donde κi Y < κ para toda i. Entonces κ 2⌣ i<cf (κ) ≤ 2κ cf (κ) κ pues claramente 2⌣ ≤ 2κ Teorema 5.2. Sea κ un cardinal singular tal que la función continuo debajo de κ es finalmente constante, es decir, existe γ0 < κ tal que 2 γ = 2 γ0 para toda γ tal que γ0 ≤ γ < κ. Entonces 2κ = 2γ0 . Demostración. Si κ es un cardinal singular que satisfaga la suposición del teorema, sin pérdida de generalidad podemos suponer que γ0 ≥ cf (κ), 440 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 441 ✐ ✐ Conjuntos y modelos. Curso avanzado κ entonces existe γ0 tal que cf (κ) ≤ γ0 < κ y 2⌣ = 2γ0 , pues γ0 κ X 2⌣ = 2 ⌣ + = X γ 2⌣ γ0 ≤γ<κ γ 2⌣ γ0 ≤γ<κ γ0 =κ·2 (∗) γ0 =2 . (*) ocurre pues si κ > 2γ0 , como κ es singular, existe µ < κ, µ > 2γ0 y 2µ > µ > 2γ0 , una contradicción con nuestra hipótesis. En consecuencia,  κ cf (κ) 2κ = 2⌣ = 2 γ0 cf (κ) = 2 γ0 . Supongamos que κ es un cardinal límite y que la función continuo debajo κ P de κ no es finalmente constante; sea λ = 2⌣ = β<κ 2β . Por supuesto, cf (κ) = cf (λ):Pes claro que λ ≥ κ, así que cf (λ) ≥ cf (κ). Por otra parte, puesto que λ = β≤κ 2β , la sucesión (2β : β ≤ cf (κ)) es cofinal en λ, por lo que cf (κ) ≥ cf (λ). Por el lema 5.1,  κ cf (κ) 2κ = 2⌣ = λcf (λ) . (*) Si κ es un cardinal regular, entonces κ = cf (κ), y como 2κ = κκ , se cumple 2κ = κcf (κ) . (**) Las ecuaciones (*) y (**) muestran que la función continuo se puede definir en términos de la función Gimel ‫ג‬: ‫(ג‬κ) = κcf (κ) . Observación 5.3. (a) Si κ es un cardinal sucesor, 2κ = ‫(ג‬κ). (b) Si κ es un cardinal límite y si la función continuo es finalmente constante κ κ κ debajo de κ, 2κ = 2⌣ · ‫(ג‬κ), pues si κ es singular 2κ = 2⌣ y 2⌣ ≥ κcf (κ) por el ejercicio 3.12, si κ es regular se sigue de (**). 441 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 442 ✐ ✐ 7. Combinatoria infinita (c) Si κ es un cardinal límite y si la función continuo debajo de κ no está κ acotada en κ, 2κ = ‫(ג‬2⌣ ). Hemos demostrado que ‫(ג‬κ) > κ y cf (‫(ג‬κ)) > cf (κ) para toda κ. Por lo tanto, si κ es regular, ‫(ג‬κ) = 2κ . Si κ es singular, la función ‫(ג‬κ) está determinada por el comportamiento de ‫ ג‬debajo de κ. Un cardinal singular κ es acotado si λcf (κ) ≥ κ, (68) κcf (κ) = λcf (κ) , (69) para alguna λ < κ. κ es acotado en el caso en que κ ≤ ‫(ג‬λ) para alguna λ < κ de cofinalidad no mayor que cf (κ). Un cardinal singular límite fuerte no es acotado, pues es fácil verificar que ν λ < κ para cualesquier λ, ν < κ si κ es límite fuerte, pero pueden existir cardinales singulares que no sean límites fuertes ni acotados (p. ej. ℵω si 2ℵ0 = ℵ1 y 2ℵ1 > ℵω ). Si κ es un cardinal singular acotado y es cierto 68 para alguna λ < κ, entonces pues λcf (κ) ≤ κcf (κ) ≤ (λcf (κ) )cf (κ) = λcf (κ) , y el valor de ‫(ג‬κ) está determinado por la potencia de cardinales más pequeños. Si un cardinal singular no es límite fuerte, ‫(ג‬κ) satisface la siguiente condición: si κ ≤ ‫(ג‬λ) para algún λ < κ tal que cf (κ) ≤ cf (λ), ‫(ג‬κ) ≤ ‫(ג‬λ), (70) lo que es obvio pues κcf (κ) ≤ (λcf (λ) )cf (κ) = λcf (λ) . Considere la siguiente hipótesis, la hipótesis de los cardinales singulares HCS: Para todo cardinal singular κ, si 2cf (κ) < κ, entonces κcf (κ) = κ+ . Es evidente que la HCS se deriva de la HGC (Teorema 2.16.18[b]). Si 2cf (κ) ≥ κ, κcf (κ) = 2cf (κ) , por el teorema 2.16.17. Si 2cf (κ) < κ, entonces κ+ es el menor valor posible de κcf (κ) . Si conocemos la función continuo en cardinales regulares y si sabemos el valor de κcf (κ) en cardinales singulares, podemos determinar κλ para toda κ y λ. En el caso en que la HCS sea cierta, la aritmética cardinal es particularmente simple. Lema 5.4. Suponga que la HCS es cierta: 442 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 443 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) Si κ es un cardinal singular, κ 2 =  κ  2⌣ ,    κ +    2⌣ , si la función continuo es constante debajo de κ (71) en otro caso. (b) Si κ, λ son cardinales infinitos, λ κ =  λ   2 , κ,   κ+ , si 2λ ≥ κ. si 2λ < κ y λ < cf (κ) si 2λ < κ y λ ≥ cf (κ). (72) Note que el tamaño de κλ en 72 es el menor posible: es necesario que κλ ≥ κ y κλ ≥ 2λ . Más aún, como cf (κλ ) > λ, es necesario que κλ > κ siempre que λ ≥ cf (κ). Demostración. κ (a) Si κ es singular, por el lema 5.1, 2κ es igual a λ o a λcf (λ) , donde λ = 2⌣ . Lo último es cierto si 2α no es finalmente constante debajo de κ. Entonces κ cf (λ) = cf (κ), y como 2cf (κ) < 2⌣ = λ pues cf (κ) es uno de los κ sumandos en 2⌣ , tenemos λcf (λ) = λ+ por la HCS. (b) Probamos 72 por inducción sobre κ, para λ fija. Sea κ > 2λ . Si κ es un cardinal sucesor, κ = ν+ , entonces νλ ≤ κ (por la hipótesis de inducción) y κλ = (ν+ )λ = ν+ · νλ = κ, por la fórmula de recursión de Hausdorff (Teorema 2.22). Si κ es un cardinal límite, por consiguiente, νλ < κ paraPtoda ν < κ. Entonces κλ = κ si λ < cf (κ), pues en este caso κλ = ν<κ |ν|λ = κ · κ = κ. κλ = κcf (κ) , si λ ≥ cf (κ) por el lema 2.16.15. En el último caso, 2cf (κ) ≤ 2λ < κ, y por la HCS, κcf (κ) = κ+ . Observe que por (b), HCS es equivalente a la afirmación κλ ≤ 2λ · κ+ para cualesquier cardinales infinitos κ, λ. 443 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 444 ✐ ✐ 7. Combinatoria infinita Por un resultado de Jensen, la HCS es cierta a menos que un axioma de grandes cardinales4 sea verdadero, ¬HCS ⇒ 0# . Para más sobre la HCS véase [Gi91a], [Gi91b], [Gi89], [Mitch1] y [Mitch2]. Por otro lado, si cierto gran cardinal existe, se puede mostrar que la HCS es independiente de ZFE . Procederemos a continuación con la demostración del teorema de Silver: Teorema 5.5 (Silver). Sea κ un cardinal singular de cofinalidad no numerable. Si 2µ = µ+ para un conjunto estacionario de cardinales µ menores que κ, entonces 2κ = κ+ . Probaremos este teorema en el resto de esta sección. Sea E ⊆ κ un conjunto estacionario de números cardinales µ para los que 2µ = µ+ . Escogemos una sucesión estrictamente creciente (κα : α < cf (κ)) de cardinales infinitos, cuyo supremo es κ. Entonces S = {α < cf (κ) : κα ∈ E} es estacionario en cf (κ). Sean f, g funciones de λ a λ. Decimos que f y g son casi ajenas si existe α0 < λ tal que f (α) 6= g(α) para toda α ≥ α0 . Una familia F de funciones de λ en λ es una familia casi ajena si cualesquier dos funciones f, g ∈ F son casi ajenas. A cada subconjunto A de κ le asociamos la función fA = hA ∩ κα : α ∈ Si ∈ Y Pot(κα ). (73) α∈S La familia de funciones fA es casi ajena. El teorema 5.5 se deduce del siguiente: Teorema 5.6. Sea λ un cardinal regular no numerable. Sea α 7→ κα una función normal de λ a la clase de los cardinales con supremo κ. Supongamos que λ < κ. Para cada α de un subconjunto estacionario S0 de λ tenemos conjuntos Aα deQcardinalidad no mayor que κ+ α . Entonces cada subconjunto casi disjunto de α∈S0 Aα tiene cardinalidad no mayor que κ+ . 4 Será hasta el volumen dos en que el lector conozca la definición de gran cardinal. Mientras tanto, mantenemos el suspenso. 444 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 445 ✐ ✐ Conjuntos y modelos. Curso avanzado Note que de la hipótesis sobre la existencia de la función normal de λ a κ se deduce 2λ ≤ κ. Demostración del teorema 5.5 a partir del teorema 5.6: sea S0 = {µ < λ : 2µ = µ+ }, λ = cf (µ). Encontramos la sucesión hκα : α < λi ⊆ S0 normal de cardinales con supremo κ. Para cada µ ∈ S0 , sea Aµ = Pot(µ), entonces |Aµ | ≤ µ+ . Para cada A ⊆ κ definimos la función fA como en la ecuación 73, fA : κ − → Pot(κ). Note que si A, B ⊆ κ y A 6=QB, fA y fB son casi ajenas. Sea es inmediato de F = {fA : A ⊆ κ}, y entonces F ⊆ µ<λ Aµ , lo que Q la definición de producto cartesiano; recuerde que f ∈ µ<λ Aµ si f : λ S − → µ<λ Aµ , f (µ) ∈ Aµ para toda µ < λ. Por el teorema 5.6, |F| ≤ κ+ implica que |Pot(κ)| ≤ κ+ . Para la demostración del teorema 5.6 requerimos el siguiente lema: Lema 5.7. Sean λ y κ como en el teorema 5.6. Además, para cada α de un subconjunto estacionario S de λ tenemos conjuntos Bα de cardinalidad no Q mayor que κα . Entonces cada subconjunto de α∈S Bα casi disjunto tiene cardinalidad no mayor que κ. Demostración. Sea F una familia casi ajena de funciones. Entonces cada f ∈ F está determinado por sus valores en ordinales límite de S. Ya que el conjunto de los ordinales límite de S es estacionario, podemos suponer que S consiste sólo en ordinales límite y que Bα = κα . Sea f ∈ F. Entonces f (α) < κα para cada α ∈ S. Existe entonces un βα < α con f (α) < κβ . Por el teorema de Fodor (4.16), existe un subconjunto estacionario Sf de S y un ordinal β tal que f (α) < κβ para toda α ∈ Sf . En vista de que F es casi ajena, f se determina con f ↾ Sf . Cada f ↾ Sf pertenece a [ T = {T µ : T ⊆ λ, µ < κ}. κ Puesto que µ|T | ≤ µλ ≤ 2máx{µ,λ} ≤ 2⌣ = κ para todo T ⊆ λ y µ < κ, se cumple |T| ≤ κ · 2λ · κ = κ. Ahora continuamos la demostración del teoremaQ5.6. Podemos suponer que Aα = κ+ α . Sea F0 un subconjunto casi ajeno de α∈S0 Aα . Definimos la 445 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 446 ✐ ✐ 7. Combinatoria infinita relación < en F0 mediante: f < g ⇔ existe un club C con f (α) < g(α) ∀ α ∈ S0 ∩ C. Afirmación 1. < es un orden parcial. Demostración de la afirmación 1. < es irreflexiva pues el conjunto S0 ∩ C es no vacío y es transitiva, ya que la intersección de dos clubes es un club.◭ Afirmación 2. Para toda g0 ∈ F0 se cumple |{f : g 6< f }| ≤ κ. Demostración de la afirmación 2. Si g ≮ f , el conjunto {α ∈ S0 : g(α) < f (α)} ∪ (λ \ S0 ) no contiene ningún club, así que el conjunto {α ∈ S0 : f (α) ≤ g(α)} es estacionario. Puesto que F0 es casi ajena, también es cierto que S = {α ∈ S0 : f (α) < g(α)} es estacionario (si suponemos que f 6= g). f pertenece entonces a FS = {f ∈ F0 : f ↾ S ∈ Y g(α)}. α∈S Puesto que una f ∈ FS está determinada por f ↾ S y el conjunto de las funciones f ↾ S(f ∈ F0 ) es casiSajeno, se sigue del lema 5.7 que |FS | ≤ κ. Por consiguiente, {f : g 6< f } = {FS : S ⊆ S0 , S estacionario } ∪ {g} tiene cardinalidad no mayor que 2λ κ = κ. ◭ Finalmente, el teorema 5.6 se deduce del siguiente lema: Lema 5.8. Sea < un orden parcial en un conjunto P. Si para toda p ∈ P, el conjunto Pq = {q ∈ P : p ≮ q} tiene cardinalidad no mayor que κ, entonces P tiene cardinalidad no mayor que κ+ . Demostración. Aplicamos el lema de Zorn al conjunto de todas las funciones estrictamente monótonas f : δ − → P ordenadas por inclusión (propia). Sea f0 : δ0 − → P máxima. Entonces para cada q ∈ P existe un α < δ0 con f0 (α) 6< q. Se cumple P = ∪α<δ0 Pf0 (α) y, por lo tanto, |P| ≤ κ|δ0 | = máx{κ, |δ0 |}. Pero como f0 [α] ⊆ Pf0 (α) para toda α < δ0 , entonces todos los α < δ0 tienen cardinalidad no mayor que κ. Se concluye que δ0 ≤ κ+ . 446 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 447 ✐ ✐ Conjuntos y modelos. Curso avanzado 6. El principio ♦ y otros principios combinatorios En muchas construcciones recursivas se deben predecir los posibles obstáculos; cuando se conocen, se pueden evadir. Una forma de lograrlo es mediante principios de predicción. El primer uso de un principio de predicción es la construcción hecha por Dushnik-Miller en 1940 de un subconjunto de R denso que no tiene automorfismos (de orden) no triviales. Para la demostración se utiliza el hecho de que si X es un subconjunto denso de R y f : X − → X es un automorfismo de orden, entonces f tiene una extensión única fˆ a un automorfismo de orden de R. Además, cualquier automorfismo de orden de R está determinado por sus valores en Q. Puesto que hay (2ℵ0 )ℵ0 = 2ℵ0 funciones de Q a R, enumeramos todos los automorfismos de orden de R mediante {fi : i < 2ℵ0 }. Por ello, si X es un subconjunto denso de R, el conjunto de los automorfismos de X está contenido en {fi ↾ X : i < 2ℵ0 }. La construcción del conjunto requerido X se logra mediante recursión en 2ℵ0 etapas, donde en la etapa i+1 se evita que fi sea un automorfismo de orden de X, “se destruye” al automorfismo. Con más exactitud, se construyen dos conjuntos ajenos A , B por recursión sobre i de tal forma que el conjunto requerido X S i i S será Ai , mientras que Bi forma un conjunto de elementos prohibidos. Sea A−1 = Q y B−1 = ∅. Tomamos uniones en ordinales límite. En la etapa i + 1, escoja ai ∈ / Bi tal que fi (ai ) ∈ / Ai ∪ {ai }. Sea Ai+1 = Ai ∪ {ai } y Bi+1 = Bi ∪ {fi (ai )}. En esta construcción fue posible encontrar todas las funciones que queremos eliminar y continuar la recursión lo suficiente para eliminarlas todas. En muchas ocasiones esto no es posible, y es cuando puede ser útil el principio diamante. En la siguiente sección estudiaremos los árboles, una generalización de los ordinales. Algunos de los problemas en la construcción de árboles con ciertas propiedades se resolvieron mediante el principio diamante, principio combinatorio que apareció en repetidas ocasiones. R. Jensen aisló este principio y lo llamó principio ♦. Su utilización se ha generalizado a otros problemas de la teoría de conjuntos, la topología general y el álgebra. En esta sección presentamos el principio, algunas de sus variantes y su aplicación. En breve demostraremos que ♦ ⇒ HC y en el capítulo 9 se demostrará que (V = L) ⇒ ♦. En [De73] se muestra cómo obtener ♦ mediante forcing; de hecho, si W es una extensión booleana de V mediante la adición de un subconjunto genérico de ω1 (es decir, usando subconjuntos numerables de ω1 como condiciones de 447 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 448 ✐ ✐ 7. Combinatoria infinita forcing), entonces ♦ es válido en W. También en [De73] se demuestra que HC ; ♦, un resultado debido a Jensen. Por lo tanto, ♦ es un extensión estricta de HC consistente con ZFE . Definición 6.1. Sea E un subconjunto estacionario de un cardinal regular no numerable κ. Por ♦κ (E) entenderemos el siguiente principio: existe una sucesión hWα : α ∈ Ei de conjuntos tales que para cada α ∈ E, Wα ⊆ α y para todo X ⊆ κ, {α ∈ E : Wα = X ∩ α} es estacionario en κ. Una sucesión hWα : α ∈ Ei que satisface esas hipótesis es una ♦κ (E)sucesión. El principio ♦κ (κ) se denota como ♦κ . A su vez, el principio ♦ω1 (E) se escribe ♦(E) y ♦ω1 se denota simplemente como ♦. Una ♦κ (E)-sucesión predice lo que son las intersecciones de X con α y, sin importar cómo se escoja X, la predicción es correcta para un conjunto grande de α. En 1972 R. B. Jensen demostró que ZF + V = L implica que ♦κ (E) es cierto para todo κ regular no numerable y todo conjunto estacionario E ⊆ κ; por lo tanto, ♦κ (E) es consistente con ZFE , pero no es demostrable desde ZFE . Es obvio que si E ⊆ E′ y ♦κ (E) es cierto, también lo es ♦κ (E′ ). Nuestro próximo lema proporciona una formulación alternativa, muy conveniente, de los principios diamante en términos de κ-filtraciones. Lema 6.2 (♦κ (E)). (i) Para cualquier conjunto A de cardinalidad κ y cualquier κ- filtración {Aν : ν < κ} de A, existe una familia {Yα : α ∈ E} tal que para cada α ∈ E, Yα ⊆ Aα y para todo X ⊆ A, {α ∈ E : Yα = X ∩ Aα } es estacionario en κ. (ii) Para cualesquier conjuntos A de cardinalidad κ y B de cardinalidad no mayor que κ, y toda κ-filtración {Aν : ν ∈ κ} y {Bν : ν ∈ κ} de A y B respectivamente, existe una familia {gα : α ∈ E} tal que para cada α ∈ E, gα es una función de Aα en Bα y para toda función f : A − → B, {α ∈ E : f ↾ Aα = gα } es estacionario en κ. Demostración. (i) Existe un club C tal que para toda ν ∈ C, |Aν+ \ Aν | = |ν+ \ ν| (véase el Ejer. 36). Definimos por recursión transfinita una biyección θ : κ − → A tal que para toda ν ∈ C, θ[ν] = Aν . Si hWα : α ∈ Ei es una ♦κ (E)-sucesión, hacemos Yα = θ[Wα ] para α ∈ E ∩ C y Yα arbitrario para α ∈ E \ C; entonces {Yα : α ∈ E} tiene las propiedades requeridas. 448 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 449 ✐ ✐ Conjuntos y modelos. Curso avanzado (ii) La clave para la demostración es considerar las funciones de A en B como subconjuntos de A × B. Aplicamos (i) a la κ-filtración {Aν × Bν : ν ∈ κ} de A × B para obtener la familia {Yα : α ∈ E}. Si Yα (⊆ Aα × Bα ) es una función de Aα en Bα , sea gα = Yα ; en otro caso, sea gα arbitraria. Dada f : A − → B, existe un club C tal que para ν ∈ C, f [Aν ] ⊆ Bν , y por lo tanto f ∩ (Aα × Bα ) = f ↾ Aα . Entonces es claro, por la elección de {Yα : α ∈ E}, que {gα : α ∈ E} tiene las propiedades deseadas. Si el contexto es apropiado, nos referiremos a {Xα : α ∈ E} y {gα : α ∈ E}, con las propiedades dadas en el lema, como ♦κ (E)-sucesiones. El siguiente lema muestra que ♦ implica la HC . Proposición 6.3. Si κ = λ+ , ♦κ implica 2λ = λ+ . En particular, ♦ implica 2 ℵ 0 = ℵ1 . Demostración. Sea hWα : α ∈ κi una ♦κ -sucesión. Para todo X ⊆ λ existe un conjunto estacionario E de κ tal que para todo α ∈ E, X ∩ α = Wα . De aquí que exista una α > λ tal que X∩α = Wα ; pero en este caso, X = X∩α, así que todo subconjunto de λ aparece en la sucesión {Wα : α ∈ κ}. Por ello, la cardinalidad 2λ de Pot(λ) es ≤ κ = λ+ . Gregory [Gre76] y Shelah [Sh81] han demostrado que la hipótesis generalizada del continuo implica ♦κ para todo κ sucesor mayor que ℵ1 . Sin embargo, no es cierto que la HGC implique ♦. Lo que sı́ podemos asegurar es que la HC es equivalente a una forma debilitada de ♦: Lema 6.4. La hipótesis del continuo es equivalente a la siguiente afirmación: Existe una ω1 -sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto numerable de Pot(α), y para cualquier X ⊆ ω1 , se tiene que (∀α < ω1 )(∃β < ω1 )(α ≤ β ∧ X ∩ α ∈ Sβ ). S Demostración. ⇒ ) Sea AC(ω1 ) = α<ω1 Pot(α) el conjunto formado por todos aquellos subconjuntos numerables (y, por lo tanto, todos aquellos acotados) de ω1 . Dado que la hipótesis del continuo se supone válida el conjunto AC(ω1 ) tiene cardinal igual a ℵ1 . Ahora, sea h : AC(ω1 ) − → ω1 una enumeración de los elementos de AC(ω1 ) con la propiedad de que para todo X ∈ AC(ω1 ), se tiene que h(X) ≥ mín{α < ω1 |X ⊆ α}. 449 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 450 ✐ ✐ 7. Combinatoria infinita Definimos, pues, la sucesión hSα |α < ω1 i de forma tal que {Sα |α < ω1 } = {{X}|X ∈ AC(ω1 )} y que Sα = {X} si y sólo si h(X) = α. Observe que: 1. Para cada α < ω1 , Sα es un subconjunto numerable de Pot(α). 2. Si X ⊆ ω1 y α < ω1 , entonces X ∩ α ⊆ α; luego, h(X ∩ α) = β ≥ α, ası́ que Sβ = {X ∩ α} (para algún β ≥ α). De aquí se concluye que X ∩ α ∈ Sβ . ⇐) Sea X ∈ Pot(ω) y sea α = ω + 1; ası́, para dicho X y para dicho α, existe un ordinal β mayor que ω tal que X ∩ α ∈ Sβ , es decir, X ∈ Sβ . Por lo tanto, [ Pot(ω) ⊆ Sβ , β<ω1 lo cual implica que |Pot(ω)| ≤ | [ β<ω1 Sβ | ≤ ℵ1 · ℵ0 = ℵ1 . Como ejemplo de los usos del diamante, presentamos el que se mencionó de que no toda coloración se puede uniformar. Proposición 6.5. Suponga que ♦(E) es cierto para algún subconjunto estacionario de ordinales límite en ω1 . Entonces, para cualquier sistema de escalas η en E existe una 2-coloración de η que no se puede uniformar. Demostración. En el lema 6.2(ii) sea A = ω1 , Aν = ν y B = Bν = 2. Sea hgα : α ∈ Ei la correspondiente ♦(E)-sucesión. Consideremos las funciones gα como “predicciones” de las funciones f : ω1 − → 2, y definamos la coloración de manera que eliminemos la posibilidad de que f se convierta en la primera coordenada de una pareja uniformadora (f, f ∗ ). Para cada α ∈ E, defina ( 1, si {n : gα (ηα (n)) = 0} es infinito cα (k) = 0, en otro caso, para toda k ∈ ω (así que cα es una función constante). Se afirma que c = {cα : α ∈ E} no se puede uniformar: suponga que existe una uniformación (f, f ∗ ). Por el lema 6.2(ii) existe α ∈ E (incluso un conjunto estacionario de tales α) tal que f ↾ α = gα . Consideremos dos casos: que exista f (ηα (n)) = 0, 450 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 451 ✐ ✐ Conjuntos y modelos. Curso avanzado para una infinidad de n, o que no exista. En el primer caso hemos definido cα (k) = 1 para toda k, así que para una infinidad de n, f (ηα (n)) 6= cα (n); en el segundo caso hemos definido cα (k) = 0 para toda k, así que existe una cantidad infinita de n tales que f (ηα (n)) 6= cα (n). En cualquier caso, llegamos a una contradicción con la definición de uniformación. En nuestra segunda aplicación usamos el diamante para predecir clubes. Proposición 6.6. Sea E0 un subconjunto de ordinales límite de ω1 y suponga que ♦(E0 ) es cierto. Dados dos conjuntos estacionarios E0 y E1 de ω1 , existe un sistema de escalas η en E0 tal que para todo club C existe α ∈ E0 con la propiedad de que para toda n, ηα (n) ∈ C ∩ E1 . Demostración. Sea hWα : α ∈ E0 i una ♦(E0 )-sucesión. Usamos estas predicciones del club C para definir nuestras escalas. Si Wα ∩ E1 es cofinal en α, sea ηα arbitrario. Dado un club C, C ∩ E1 no está acotado en ω1 ya que E1 es estacionario en ω1 . Sea D = {δ ∈ ω1 : δ = sup Y para algún subconjunto Y ⊆ C ∩ E1 tal que δ ∈ / Y }. Es decir, D es un conjunto de puntos límite de la cerradura de C ∩ E1 . Entonces es fácil ver que D es un club, así que por la definición de una ♦(E0 )sucesión, existe δ ∈ D ∩ E0 tal que C ∩ δ = Wδ . Por la elección de δ en D, Wδ ∩ E1 (= C ∩ δ ∩ E1 ) es cofinal en δ, así que hemos definido ηδ de tal forma que para toda n, ηδ (n) ∈ C ∩ E1 . Ahora presentaremos una serie de formulaciones equivalentes a ♦. Cada una de estas formas (equivalentes entre sí), que enunciaremos a continuación, permite un acercamiento al principio ♦. Las diversas formas de expresar el principio ♦ ayudan a entender su esencia y, más aún, podrı́an llegar a aportar a la razón nuevos criterios para discernir acerca de la admisibilidad de ♦. Considere los siguientes enunciados: ♦1 : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα ⊆ α y para toda X ⊆ ω1 , existe un ordinal infinito α tal que X ∩ α = Sα . ′ ♦1 : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto numerable de Pot(ω) y para toda X ⊆ ω1 , existe un ordinal infinito α tal que X ∩ α ∈ Sα . 451 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 452 ✐ ✐ 7. Combinatoria infinita ♦l : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto numerable de Pot(ω) y para toda X ⊆ ω1 , existe un ordinal lı́mite α tal que X ∩ α ∈ Sα . ♦‘ : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto numerable de Pot(ω) y para toda X ⊆ ω1 , el conjunto {α ∈ ω1 |(X ∩ α) ∈ Sα } es estacionario en ω1 . ′ ♦× : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto numerable de Pot(α×α) y para todo X ⊆ ω1 ×ω1 , el conjunto {α ∈ ω1 |(X ∩ (α × α)) ∈ Sα } es estacionario en ω1 . ♦× : existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα ⊆ α × α y para todo X ⊆ ω1 × ω1 , el conjunto {α ∈ ω1 |(X ∩ (α × α)) = Sα } es estacionario en ω1 . ♦f : existe una sucesión de funciones hhα |α < ω1 i (hα : α → α) tal que para toda función f : ω1 → ω1 , el conjunto {α ∈ ω1 |f ↾α = hα } es estacionario. ′ ′ Teorema 6.7. Los principios ♦1 , ♦1 , ♦l , ♦‘, ♦× , ♦× y ♦f son equivalentes al principio ♦. Demostración. a) ♦ ⇒ ♦1 : es trivial. ′ b) ♦1 ⇒ ♦1 : Si hSα |α < ω1 i es una ♦1 -sucesión, entonces es claro que la sucesión ′ hTα |α < ω1 i definida por Tα = {Sα } es una ♦1 -sucesión. ′ c) ♦1 ⇒ ♦l : ′ Sea hSα |α < ω1 i una ♦1 -sucesión. Para cada α < ω1 , definimos Tα como Tα = {X ∩ α|X ∈ [ n∈ω Sα+n }. Es claro que Tα es un subconjunto numerable de Pot(α); pero, además, ′ hTα |α < ω1 i es una ♦l -sucesión: sea X ⊆ ω1 ; por hipótesis (♦1 ), existe α ≥ ω tal que X ∩ α ∈ Sα . Si α es lı́mite hemos terminado; si no, entonces sabemos que existe un ordinal lı́mite γ y un natural distinto de cero n tal que α = γ + n. Ası́, dado que X∩α ∈ [ Sγ+n , n∈ω se tiene que (X ∩ α) ∩ γ ∈ Tγ , es decir, X ∩ γ ∈ Tγ . 452 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 453 ✐ ✐ Conjuntos y modelos. Curso avanzado d) ♦l ⇒ ♦‘: Sea hSα |α < ω1 i una ♦l -sucesión. Definimos una función h : ω1 − → ω1 , por h(ν) = 2ν. Observe que si α es lı́mite, entonces h ↾α : α −→ α, y ran(h ↾ω1 \α ) ∩ α = ∅. Para cada α < ω1 , definimos Tα ⊆ Pot(α) de la siguiente manera: Tα = {h−1 [X]|X ∈ Sα }. Es claro que Tα es numerable, pero además, hTα |α < ω1 i es una ♦‘-sucesión: sea X ⊆ ω1 , y se debe demostrar que el conjunto E = {α ∈ ω1 |X ∩ α ∈ Tα } es estacionario en ω1 . Sea, pues, C un club de ω1 . Observe que se puede encoger a C de tal manera que (∀α ∈ C)(lím(α)) ∧ (∀α, β ∈ C)(α < β ⇒ α + ω · ω ≤ β), y que no pierda su propiedad de ser club en ω1 . Ası́, sin pérdida de generalidad, supondremos que C cumple con dichas propiedades. Sea, entonces, hcν |ν < ω1 i la enumeración canónica de C. Ahora, sea Z0 ⊆ ω1 tal que satisface la siguiente definición por inducción sobre ω1 : Z0 ∩ C0 = ∅; si Z0 ∩ cν se ha definido, considere una enumeración hτnν |n ∈ ωi del conjunto {τ ∈ ω1 | lím(τ) ∧ (cν < τ < cν+1 )} ν |m < ωi del conjunto y una enumeración hXm [ Sτnν . n∈ω Para cada m ∈ ω, diremos que cν + 2m + 1 ∈ Z0 si y sólo si dicho ordinal ν . Ası́, queda definido Z ∩ c no pertenece a Xm 0 ν+1 , y para el caso lı́mite la definición es la usual. Ahora, sean Z1 = h[X] y Z = Z0 ∪ Z1 ; ası́, Z ⊆ ω1 y Z0 consiste en aquellos ordinales en Z que son impares y Z1 en los elementos de Z que son pares. Por hipótesis, se sabe que existe un ordinal lı́mite α tal que Z ∩ α ∈ Sα . Aseguramos que α ∈ C; en caso de que esto no se cumpliera, se tendrı́a que existe ν < ω1 tal que cν < α < cν+1 ; ası́, para algún n ∈ ω existiría α = τnν . Continuando el argumento, dado que Z ∩ α ∈ Sα , se debe cumplir que ν (para algún m ∈ ω); por lo tanto (según la construcción anterior), Z ∩ α = Xm cν + 2m + 1 ∈ Z si y sólo si cν + 2m + 1 ∈ Z0 453 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 454 ✐ ✐ 7. Combinatoria infinita ν si y sólo si cν + 2m + 1 ∈ / Xm si y sólo si cν + 2m + 1 ∈ / Z ∩ α, lo cual es una contradicción, pues como α es lı́mite, cν + 2m + 1 ∈ α. Ası́, se debe tener que α ∈ C. Pero como X ∩ α = h−1 [Z1 ] ∩ α = h−1 [Z] ∩ α = h−1 [Z ∩ α], según la definición de Tα , se concluye que Z ∩ α ∈ Tα . e) ♦‘ ⇒ ♦ב : Sea hSα |α < ω1 i una ♦‘-sucesión, y sea h : ω1 − → ω1 × ω1 una función biyectiva con la propiedad de que si α es un ordinal lı́mite menor que ω1 , entonces h ↾α : α − → α × α será una biyección. Definimos la sucesión hTα |α < ω1 i de la siguiente manera: Tα = ( {h[X]|X ∈ Sα } ∅ si α es lı́mite, si α es sucesor. Aseguramos que la ω1 -sucesión recién definida es una ♦ב -sucesión. De la definición de esta sucesión se sigue directamente que para toda α ∈ ω, Tα es un subconjunto numerable de Pot(α × α). Ahora, sean X ⊆ ω1 × ω1 y C un club en ω1 , y definimos el conjunto X‘ como X‘ = h−1 [X]. Luego, (por hipótesis) el conjunto E‘ = {α < ω1 |(X‘ ∩ α) ∈ Sα } es estacionario en ω1 y como el conjunto L(< ω1 ) formado por los ordinales lı́mites menores que ω1 es (trivialmente) un club de ω1 , se tiene que (gracias al Lema 4.14) el conjunto E‘ ∩ L(< ω1 ) es estacionario en ω1 . Ası́, existe un ordinal lı́mite α0 ∈ C tal que (X‘ ∩ α0 ) ∈ Sα0 . Como α0 es lı́mite, la definición de Tα0 implica que h[X‘ ∩ α0 ] es un elemento de Tα0 . Pero h[X‘ ∩ α0 ] = h[X‘] ∩ h[α0 ] = X ∩ (α0 × α0 ); ası́, X ∩ (α0 × α0 ) ∈ Tα0 , es decir, el conjunto es estacionario en ω1 . E = {α < ω1 |X ∩ (α × α) ∈ Tα } f ) ♦ב ⇒ ♦× . 454 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 455 ✐ ✐ Conjuntos y modelos. Curso avanzado Sea hSα |α < ω1 i una ♦ב -sucesión. Construiremos una sucesión hTα |α < ω1 i de tal forma que 1. Tα ⊆ Pot((α × α) × ω). 2. |Tα | ≤ ℵ0 . 3. Para toda X ⊆ ((ω1 × ω1 ) × ω), el conjunto EX = {α ∈ ω1 |X ∩ ((α × α) × ω) ∈ Tα } es estacionario en ω1 . Sea h : (ω1 × ω1 ) − → ((ω1 × ω1 ) × ω) una biyección con la propiedad de que si α es un ordinal lı́mite menor que ω1 , entonces la restricción de h a (α × α) (h ↾(α×α) ) es una biyección entre α × α y (α × α) × ω. Definimos, pues, dicha sucesión: para α < ω1 sea Tα = ( {h[X]|X ∈ Sα }, si α es lı́mite; ∅, si α es sucesor. Veamos si hTα |α < ω1 i cumple las propiedades mencionadas: los puntos 1 y 2 se cumplen trivialmente. Para demostrar que se cumple la propiedad enunciada en el punto 3, considere un conjunto X ⊆ (ω1 × ω1 ) × ω arbitrario, la definición del conjunto EX y un club C ⊆ ω1 en ω1 . Luego, definimos X‘ como la imagen inversa del conjunto X bajo la función h (es decir, X‘ = h−1 [X]). Observe que, por hipótesis, el conjunto E‘ = {α ∈ ω1 |X‘ ∩ (α × α) ∈ Sα } debe ser estacionario en ω1 . Ası́, al igual que en la demostración del caso anterior, existe α0 un ordinal lı́mite menor que ω1 tal que α0 ∈ E‘∩C. Es decir, existe un ordinal α0 , lı́mite y menor que ω1 tal que α0 ∈ C y X‘∩(α0 ×α0 ) ∈ Sα0 . Sin embargo, esto último implica que h[X‘ ∩ (α0 × α0 )] ∈ Tα0 , y como h[X‘∩(α0 ×α0 )] = X∩((α0 ×α0 )×ω) se cumple que X∩((α0 ×α0 )×ω) ∈ Tα0 , es decir, E ∩ C 6= ∅ y queda demostrada la afirmación del punto 3. Ahora, para cada α < ω1 considere una enumeración hTαn |n < ωi de todos los elementos de Tα (en caso de que Tα sea finito agregue ceros). Observe que Tαn ⊆ (α × α) × ω y que para todo X subconjunto de ((ω1 × ω1 ) × ω) y para todo α ∈ EX , existe nα < ω tal que X ∩ ((α × α) × ω) = Tαnα . Más aún, afirmamos que para cada X ⊆ ((ω1 × ω1 ) × ω) existe un conjunto F ⊆ ω1 estacionario en ω1 y existe n0 ∈ ω tal que para todo α ∈ F , se tiene 455 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 456 ✐ ✐ 7. Combinatoria infinita que X ∩ ((α × α) × ω) = Tαn0 . En otras palabras, se afirma que existen F un conjunto estacionario en ω1 y n0 ∈ ω tales que n0 = {α ∈ ω1 |X ∩ ((α × α) × ω) = Tαn0 }. F ⊆ EX Para demostrar esta afirmación, se define una función f : EX −→ ω1 con la propiedad de que el conjunto f (α) = ( mín{n ∈ ω|X ∩ ((α × α) × ω) = Tαn }, si ω ≤ α; 0, si α < ω. Observe que la función f es regresiva, y como el conjunto EX es estacionario en ω1 , el lema de Fodor garantiza la existencia de un elemento n0 ∈ ω en la imagen de f tal que el conjunto F = {α ∈ EX |f (α) = n0 } es estacionario en ω1 . Ahora, para cada n ∈ ω y para cada α < ω1 , definimos el conjunto Uαn = {(λ, γ) ∈ α × α|((λ, γ), n) = Tαn } y aseguramos que existe m ∈ ω tal que la sucesión hUαm |α < ω1 i es una ♦× sucesión. Veamos cómo es esto: suponga, por el contrario, que para toda n ∈ ω existen Xn ⊆ (ω1 × ω1 ) y un club Cn de ω1 tal que si α ∈ Cn , entonces Xn ∩ (α × α) 6= Uαn . Con esta hipótesis, si definimos los conjuntos S X = n∈ω (Xn × {n}) T C = n∈ω Cn se tendrı́a que existe n0 ∈ ω y que existe α ∈ C tal que X ∩ ((α × α) × ω) = Tαn0 . Esto último resulta de aplicar la afirmación demostrada arriba (la que garantiza, haciendo uso del lema de Fodor, la existencia de un conjunto estacionario F ), a los conjuntos X y C recién definidos (observe que en virtud del lema 4.8, el conjunto C es un club de ω1 ). Pero si X ∩ ((α × α) × ω) = Tαn0 , entonces Uαn0 = {(λ, γ) ∈ α × α|((λ, γ), n) ∈ [X ∩ ((α × α) × ω)]}. Por lo tanto, se tendrı́a que 456 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 457 ✐ ✐ Conjuntos y modelos. Curso avanzado Uαn0 = {(λ, γ) ∈ α × α|((λ, γ), n) ∈ X} = {(λ, γ) ∈ α × α|((λ, γ), n) ∈ (Xn × {n})}. Es decir, Uαn0 = Xn ∩(α ×α) con α ∈ Cn , derivamos así una contradicción. Por consiguiente, se puede asegurar que para algún m ∈ ω, la sucesión hUαm |α < ω1 i es una ♦× -sucesión. g) ♦× ⇒ ♦f . Sea hSα |α < ω1 i una ♦× -sucesión. Definimos la sucesión hAα |α < ω1 i donde para cada α < ω1 , Aα es una función de α en α definida de tal suerte que para cada γ < α, Aα (γ) = ( mín{λ < α|(γ, λ) ∈ Sα }, si γ ∈ dom(Sα ); ∅, si γ ∈ / dom(Sα ). (Observe que dom(Sα ) ⊆ dom(Aα ) y en caso de que Sα sea una función, Sα = Aα ↾dom(Sα ) .) Aseguramos que la sucesión hAα |α < ω1 i es una ♦f sucesión. Veamos: si f es una función de ω1 en ω1 , entonces, por hipótesis, se cumple que el conjunto E = {α < ω1 |f ∩ (α × α) = Sα } es estacionario en ω1 . Luego, por el lema 4.11 se sabe que el conjunto C = {α < ω1 |(∀γ < α)(f (γ) < α)} es un club de ω1 , y, de nuevo, gracias al lema 4.14, sabemos que el conjunto E ∩ C es estacionario. Recordemos que lo que nos interesa demostrar es que el conjunto E‘ = {α ∈ ω1 |f ↾α = Aα } es estacionario en ω1 , pero esto se sigue de que (E ∩ C) ⊆ E‘. Para demostrar esto último, observe que si α ∈ E ∩ C entonces f ↾α = f ∩ (α × α) y f ∩ (α × α) = Sα , es decir, f ↾α = Sα . Esto implica que Sα es una función con dominio igual a α, pero antes se observó (después de la definición de Aα ) que con estas hipótesis, el conjunto Aα coincide con Sα , que a su vez coincide con f ↾α . En consecuencia, α ∈ E‘ y, por lo tanto, E‘ es estacionario en ω1 . h) ♦f ⇒ ♦. 457 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 458 ✐ ✐ 7. Combinatoria infinita Sea hhα |α < ω1 i una ♦f -sucesión. Definimos la siguiente ω1 -sucesión: para α < ω1 , se define Sα = {γ ∈ α|hα (γ) > 0}. Afirmamos que la sucesión hSα |α < ω1 i recién definida es una ♦-sucesión. Claramente, para cada α < ω1 , Sα ⊆ α. Luego, sea X ⊆ ω1 y considere la función caracterı́stica de X en ω1 , es decir, la función XX : ω1 −→ ω1 definida de la siguiente manera: XX (α) = ( 1, si α ∈ X; 0, si α ∈ / X. Ahora, por hipótesis, se tiene que el conjunto E = {α ∈ ω1 |XX ↾α = hα } es estacionario en ω1 , pero como la función XX ↾α es la misma que X(X∩α) (la función caracterı́stica de X ∩ α en ω1 ), se cumple que E = {α ∈ ω1 |X(X∩α) = hα }. Para demostrar que el conjunto E‘ = {α ∈ ω1 |X ∩ α = Sα } es estacionario en ω1 , será suficiente con demostrar que E ⊆ E‘ (pues E es estacionario en ω1 ). Sea pues α ∈ E; ası́, X(X∩α) = hα , lo cual implica que X ∩ α = Sα . Hemos demostrado que E ⊆ E‘, y agregando que E es estacionario, concluimos lo que se buscaba en esta demostración: que E‘ es estacionario en ω1 . Con respecto a la versión ♦f del principio ♦, es posible enunciar los ′ principios ♦‘, ♦1 y ♦1 en términos de funciones; veamos cómo: Considere los siguientes principios: ♦‘F : existe una sucesión hFα |α < ω1 i tal que Fα ⊆ αα , |Fα | ≤ ℵ0 y tal que para toda función f : ω1 → ω1 , el conjunto {α ∈ ω1 |f ↾α ∈ Fα } es estacionario. ♦1F : existe una sucesión hfα : α < ω1 i tal que fα : α − → α y siempre que f : ω1 − → ω1 , existe una α ≥ ω tal que f ↾ α = fα . ′ ♦1F : existe una sucesión hFα : α < ω1 i tal que Fα ⊆ αα , |Fα | ≤ ℵ0 , y siempre que f : ω1 − → ω1 , existe una α ≥ ω tal que f ↾ α ∈ Fα . 458 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 459 ✐ ✐ Conjuntos y modelos. Curso avanzado ′ ′ Claramente, ♦f ⇒ ♦‘F ⇒ ♦1F y ♦f ⇒ ♦1F ⇒ ♦1F . Ası́, para demostrar que estos principios son equivalentes a ♦, será suficiente con demostrar que ′ ′ ♦1F ⇒ ♦1 , resultado que a continuación demostramos: Teorema 6.8. ′ ′ ♦1F ⇒ ♦1 . ′ Demostración. Sea hFα : α < ω1 i una ♦1F -sucesión. Para cada α, sea Fα = {fnα : n < ω} una enumeración de los elementos de Fα . Definimos Snα = {ν ∈ α : fnα (ν) = 0} y Sα = {Snα : n < ω}. Se verifica fácilmente, aplicando la hipótesis a la función caracterı́stica de un subconjunto X ⊆ ω1 arbitrario, que hSα : α < ω1 i es una ♦3 -sucesión. El siguiente resultado que presentamos en esta sección aporta un nuevo equivalente del diamante bajo la suposición de la hipótesis del continuo. El siguiente principio se conoce con el nombre de Principio de Ostaszewski y se denota con ♣: Existe una sucesión hAα : Lím(α), 0 < α < ω1 i tal que para cada α, Aα es el rango de una ω-sucesión (aα : ω → α) cofinal en α. Para todo X ⊆ ω1 no acotado en ω1 , existe α tal que Aα ⊆ X ∩ α. Ostaszewski observó que el principio ♦ implica su principio: Teorema 6.9 (Ostaszewski). ♦ ⇒ ♣. Demostración. Sea hSα : α < ω1 i una ♦-sucesión. Para α < ω1 lı́mite y distinto de cero, seaSaα : ω → α una función cofinal en α que cumpla con la propiedad de que si ( Sα = α), entonces (ran(aα ) = Aα ⊆ Sα ). Aseguramos que la sucesión hAα | lím(α)∧0 < α < ω1 i es una ♣-sucesión: sea X ⊆ ω1 no acotado en ω1 , y sea C el conjunto club de ω1 formado por todos los puntos lı́mite de X. Ahora, por hipótesis de inducción, el conjunto E = {α ∈ ω1 |X ∩ α = Sα } es un conjunto estacionario en ω1 . Ası́, existe α ∈ C con X ∩ α = Sα , pero como α ∈ C, en realidad se tiene que lím(α) y S [ (X ∩ α) = α, es decir, Sα = α. Por lo tanto, según la definición de Aα , se concluye que Aα ⊆ Sα , es decir, Aα ⊆ X ∩ α. 459 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 460 ✐ ✐ 7. Combinatoria infinita Posteriormente Devlin demostró que ♣ es equivalente a ♦ en presencia de HC: Teorema 6.10 (HC). ♦ ⇔ ♣. Demostración. ⇒) esta demostración es justamente la del teorema anterior. Recuerde que, además, el principio ♦ implica la hipótesis del continuo. ⇐) Sea hSα | lím(α) y 0 < α < ω1 i una ♣-sucesión. Por la hipótesis del continuo se sabe que el conjunto AC(ω1 ) = [ Pot(α) α<ω1 formado por todos los subconjuntos acotados de ω1 tiene cardinalidad ℵ1 . Sea hXν |ν < ω1 i una enumeración de AC(ω1 ) tal que cada X ∈ AC(ω1 ) aparezca ℵ1 veces en dicha enumeración. Para cada 0 < α < ω lı́mite definimos Sα = [ {Xν ∩ α|ν ∈ Aα }, y para α sucesor o cero, definimos Sα = ∅. Demostraremos que la sucesión hSα |α < ω1 i es una ♦1 -sucesión (en el teorema se demostró que ♦1 es equivalente a ♦). Sea X ⊆ ω1 , y definimos una ω1 -sucesión hλν |ν < ω1 i por inducción sobre ω1 , de la siguiente manera: λ0 = ω; λν+1 = mín{λ > λν |X ∩ λν = Xλ }; S λδ = ν<δ λν , para lím(δ). Observe que el conjunto C = {λν |ν < ω1 } es un club de ω1 : C es no acotado, pues λν 6= λδ si ν 6= δ. C S es cerrado, ya que para γ < ω1 punto lı́mite de C existe δ lı́mite tal que α = ν<δ λν = λδ ∈ C. Según nuestra hipótesis (♣), existe α lı́mite tal que Aα ⊆ C. Ası́, como Aα es el rango de una ω-sucesión aα que es cofinal en α, por un lado α debe ser un punto lı́mite de C, y por lo tanto existe δ lı́mite tal que α = λδ . Por otro lado, para cada n ∈ ω, aα (n) ∈ C, así que debe existir una ω-sucesión hδ(n)|n ∈ ωi cofinal en δ tal que Aα = {λδ(n) |n ∈ ω}. 460 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 461 ✐ ✐ Conjuntos y modelos. Curso avanzado Ahora, según su definición, Sα = establecido arriba se cumple que [ S {Xν ∩ α|ν ∈ Aα }, por lo que al aplicar lo {Xν ∩ α|ν ∈ Aα } = [ n∈ω (Xλδ(n) ∩ α); pero dado S que para n, m ∈ ω, si n < m entonces Xλδ(n) ⊆ Xλδ(m) , y además, dado que ( n∈ω λδ(n) ) = λδ = α, se concluye que [ n∈ω (Xλδ(n) ∩ α) = [ n∈ω (Xλδ(n) ∩ λδ(n) ) = [ n∈ω Xλδ(n) +1 = X ∩ α. Es decir, se ha demostrado que Sα = X ∩ α para algún α infinito (en realidad lı́mite) y, por lo tanto, se probó el principio ♦1 que es equivalente a ♦. S. Shelah [Sh98] demuestra que ♣ no implica ♦, por lo que ♣ y ♦ no son equivalentes en ZFE . A pesar de este resultado, ♣ es muy cercano a ♦: Teorema 6.11. Sea hSα : α es límite ∧ 0 < α < ω1 i una ♣-sucesión. Si X ⊆ ω1 no está acotado, entonces {α ∈ ω1 : Sα ⊆ X} es estacionario en ω1 . Demostración. Sean X ⊆ ω1 no acotado y C ⊆ ω1 un club. Mostraremos que Sα ⊆ X para alguna α ∈ C. Definamos hyν : ν < ω1 i por inducción como sigue: y0 es el menor elemento de X; Sea yν+1 el menor elemento de X tal que para alguna α ∈ C, yν < α < yν+1 ; yλ = supν<λ yν , si λ es límite. Sea Y = {yν+1 : ν < ω1 }. Entonces Y es un subconjunto no acotado de X, así que para algún ordinal límite α, Sα ⊆ Y . Como Y ⊆ X, Sα ⊆ X. Ahora, sup Sα = α, por lo que sup(Y ∩ α) = α. Por la construcción de Y , sup(C ∩ α) = α. Por lo tanto, como C es cerrado en ω1 , α ∈ C, y finalizamos la prueba. Haciendo algunas modificaciones al principio del diamante, se pueden obtener otros principios combinatorios. En algunos casos estas modificaciones pueden llevar a nuevos principios que tienen implicaciones que el propio diamante no posee; en otros casos, las modificaciones pueden llevar a principios contradictorios. Como primera modificación, se podrı́a pensar en cambiar el término estacionario (del principio ♦) por el término club. Es decir, modificar ♦ para obtener el siguiente principio: 461 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 462 ✐ ✐ 7. Combinatoria infinita Existe una sucesión hSα |α < ω1 i (donde para cada α < ω1 , Sα ⊆ α) tal que para cualquier conjunto X ⊆ ω1 , el conjunto es un club de ω1 . {α ∈ ω1 |X ∩ α = Sα } Llamaremos ♦! a este principio y demostraremos que es inconsistente con la teorı́a de conjuntos, es decir, que del conjunto de enunciados ZF + ♦! se deriva una contradicción. Teorema 6.12. El enunciado ♦! es inconsistente con la teorı́a de conjuntos. Demostración. Sean X y Y subconjuntos de ω1 tales que X 6= Y . Si se supone el enunciado ♦!, tendrı́amos que los conjuntos CX = {α < ω1 |X ∩ α = Sα } y CY = {α < ω1 |Y ∩ α = Sα } son conjuntos club de ω1 . Ası́, el lema 4.8 implica que el conjunto C = CX ∩ CY es un club de ω1 . Pero este conjunto debe ser acotado, pues C = {α < ω1 |X ∩ α = Y ∩ α}, y en caso de que éste no fuese acotado, se tendrı́a que X = Y , contradiciendo ası́ la elección de X y Y . Por lo tanto, C debe ser un club acotado, lo cual es absurdo. En términos de la versión ♦′ del principio diamante, se puede obtener un principio combinatorio nuevo si aseguramos que el conjunto estacionario (del cual se asegura su existencia para cada X ⊆ ω1 ) contiene un club de ω1 . Llamamos ♦∗ a este principio y lo enunciamos formalmente: Existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto a lo sumo numerable de Pot(α) y para todo X ⊆ ω1 existe un conjunto club CX de ω1 tal que CX ⊆ {α ∈ ω1 |X ∩ α ∈ Sα }. Como demostraremos en el capı́tulo de constructibilidad, este principio no es contradictorio con la teorı́a de los conjuntos pues se cumple en el modelo L. Por otro lado, es claro que este principio implica al principio diamante en su forma ♦′ , ya que si un subconjunto de ω1 contiene un club, entonces dicho conjunto es estacionario. Pero además, haciendo uso de los métodos de forcing 462 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 463 ✐ ✐ Conjuntos y modelos. Curso avanzado iterado, se puede demostrar que ♦∗ es una extensión propia de ♦, es decir, que el principio diamante no implica al principio ♦∗ . Esto se logra, como es de esperarse, garantizando la existencia de un modelo de ZF + ♦ + ¬♦∗ . Por último, agregamos al principio ♦∗ una propiedad más, para ası́ obtener el principio ♦+ que a continuación enunciamos: Existe una sucesión hSα |α < ω1 i tal que para cada α < ω1 , Sα es un subconjunto a lo sumo numerable de Pot(α) y para todo X ⊆ ω1 existe un club CX de ω1 tal que CX ⊆ {α ∈ ω1 |X ∩ α ∈ Sα } ∩ {α ∈ ω1 |CX ∩ α ∈ Sα }. Claramente, este principio implica al principio ♦∗ y, por lo tanto, al principio diamante. Más aún, de nuevo éste es una extensión propia de ♦∗ . En particular, el principio ♦+ implica cierta propiedad de árboles llamada hipótesis de Kurepa (véase la Sec. 8 del presente capı́tulo), mientras que ♦∗ es consistente con la negación de dicha hipótesis, es decir, este último no la implica. Finalmente presentamos algunas extensiones de ♦: Definición 6.13. Sea κ un cardinal regular y E un subconjunto estacionario de κ. Por ♦∗κ (E) entenderemos el siguiente principio: existe una familia {Sα : α ∈ E} tal que cada Sα es un subconjunto de Pot(α) de cardinalidad < κ y para todo X ⊆ κ existe un club C ⊆ κ tal que X ∩ α ∈ Sα para toda α ∈ C ∩ E. Decimos que {Sα : α ∈ E} es una ♦∗κ (E)-sucesión. 7. 2ℵ0 < 2ℵ1 implica una versión débil de ♦. Como hemos visto, el principio ♦ enuncia la existencia de funciones fα : α − → 2 = {0, 1}, α < ω1 tales que para toda función f : ω1 − → 2, el conjunto {α < ω1 : f ↾ α = fα } es un subconjunto estacionario de ω1 . Como veremos en el capítulo 9, ♦ es cierto en presencia de V = L. Sabemos que ♦ implica HC pero no recíprocamente. Devlin y Shelah [DeShe78] formularon un principio más débil que ♦: Sea ⊛ la siguiente afirmación: ω1 → 2 existe una g ∈ 2ω1 tal que para cualquier Para cada función F : 2 ⌣ − ω 1 f ∈ 2 , el conjunto {α ∈ ω1 : F (f ↾ α) = g(α)} es estacionario. 463 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 464 ✐ ✐ 7. Combinatoria infinita Por supuesto que para ciertas F la existencia de la función g requerida en ⊛ puede ser evidente (p. ej. si F es constante). Pero realmente ⊛ es una afirmación muy fuerte. Es fácil ver (Ejer. 21) que ♦ implica ⊛. ω1 Si S ⊆ ω1 , denotamos con ⊛(S) la afirmación: para cualquier F = 2 ⌣ − → 2 existe g ∈ 2ω1 tal que para toda f ∈ 2ω1 , el conjunto {α ∈ S : F (f ↾ α) = g(α)} es estacionario. De acuerdo con el ejercicio 22, si ⊛(S) es una afirmación cierta, S es un conjunto estacionario. Llamamos a un subconjunto S de ω1 pequeño si ⊛(S) es falsa. Se demostrará que los conjuntos pequeños forman un ideal normal. En los siguientes párrafos utilizaremos los conceptos de ideal y ultrafiltro que el lector puede revisar en el capítulo 6 y en el apéndice al final de este capítulo. Sea F el filtro en ω1 generado por los clubes de ω1 e I el ideal dual. Por lo tanto, I es el ideal de los subconjuntos de ω1 no estacionarios. Tanto F como I son normales. Decimos que un conjunto S ⊆ ω1 es pequeño si existe una ω1 → 2 tal que para toda g ∈ 2ω1 existe f ∈ 2ω1 con la propiedad función F : 2 ⌣ − de que {α ∈ S : F (f ↾ α) = g(α)} ∈ I. Sea L la colección de todos los subconjuntos pequeños de ω1 . Claramente, ⊛ es equivalente a la afirmación ω1 ∈ / L. Teorema 7.1. L es un ideal normal en ω1 . Demostración. Es obvio que si S ′ ⊆ S ∈ L, entonces S ′ ∈ L. Basta entonces demostrar que si {Sν : ν < ω1 } ⊆ L, entonces S = {α ∈ ω1 : (∃ ν < α)(α ∈ Sν )} ∈ L. Sea Fν el testigo de que Sν es pequeño para cada ν. Sean h : ω1 × ω1 − → ω1 una biyección y C = {α ∈ ω1 : h[α × α] = α}. Se verifica sin dificultad que C es un club en ω1 . ω1 → 2 como sigue. Sea f ∈ 2α , α < ω1 . Si Definamos F : 2 ⌣ − α ∈ C y existe ν < α con α ∈ Sν , elegimos el menor de tales ν y hacemos F (f ) = Fν (f # ), donde f # ∈ 2α está definida por f # (τ) = f (h(ν, τ)). En los otros casos hacemos F (f ) = 0. Sea g ∈ 2ω1 dada. Construimos una f ∈ 2ω1 para la cual {α ∈ S : F (f ↾ α) = g(α)} ∈ I, con lo que se demuestra que S ∈ L. Para cada ν < ω1 , Sν es pequeño respecto a Fν , así que podemos encontrar fν ∈ 2ω1 tal que Nν = {α ∈ Sν : Fν (fν ↾ α) = g(α)} ∈ I. Como I es normal, N = {α ∈ ω1 : (∃ ν < α)(α ∈ Nν )} ∈ I. Definimos f ∈ 2ω1 mediante f (h(ν, τ)) = fν (τ) 464 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 465 ✐ ✐ Conjuntos y modelos. Curso avanzado para cada ν, τ. Suponga que {α ∈ S : F (f ↾ α) = g(α)} ∈ / I. Así, como C es un club, E = {α ∈ S ∩ C : F (f ↾ α) = g(α)} ∈ / I. Pero suponga que α ∈ E. Como α ∈ S, podemos encontrar ν < α con α ∈ Sν . Sea ν el menor de éstos. Entonces, por definición, F (f ↾ α) = Fν ((f ↾ α)# ). Por lo tanto, como α ∈ E, Fν ((f ↾ α)# ) = g(α). Pero para todas las τ < α, (f ↾ α)# (τ) = (f ↾ α)(h(ν, τ)) = f (h(ν, τ)) = fν (τ). En consecuencia (f ↾ α)# = fν ↾ α, propiciando que Fν (fν ↾ α) = g(α). Por lo tanto, α ∈ Nν . Hemos demostrado que si α ∈ E, (∃ ν < α)(α ∈ Nν ). En otras palabras, E ⊆ N. Pero esto implica E ∈ I lo que es absurdo. Esto demuestra que S ∈ L. Una consecuencia inmediata es que: Corolario 7.2. ⊛ es válida si y sólo si L es un ideal normal no trivial en ω1 . Ahora probaremos el resultado principal de esta sección: ⊛ se deduce de 2ℵ0 < 2ℵ1 . Obviamente, la hipótesis 2ℵ0 < 2ℵ1 es más débil que HC . Teorema 7.3. Suponga que 2ℵ0 < 2ℵ1 . Entonces ⊛ es cierto. Demostración. Suponga que ⊛ es falso. Entonces ω1 ∈ L, así que ω1 → 2 tal que para toda g ∈ 2ω1 existe f ∈ 2ω1 con podemos encontrar F : 2 ⌣ − {α ∈ ω1 : F (f ↾ α) = g(α)} ∈ F (dada la g, sea f la función asociada a 1 − g [módulo 2] por la definición de L). Fijemos una correspondencia unívoca H entre el conjunto de todas las sucesiones de la forma hα, g0 , f0 , . . . , gν , fν , . . . : ν < βi, donde α, β < ω1 , gν , fν ∈ 2α para toda ν < β, y el conjunto 2ω . Dada g ∈ 2ω1 , elegimos f ∈ 2ω1 tal que {α ∈ ω1 : F (f ↾ α) = g(α)} ∈ F, y sea C ⊆ ω1 un club con la propiedad de que si α ∈ C, F (f ↾ α) = g(α). Por recursión sobre n ∈ ω, definimos funciones gν , fν ∈ 2ω1 , ν < ω · n y clubes Cn ⊆ ω1 tales que siempre que ν < ω · n, Cn ⊆ {α ∈ ω1 : F (f ↾ α) = gν (α)}. Etapa 1 (n = 1) Para cada ν < ω, sea gν = g, fν = f , Cν = C. Etapa n + 1 (n ≥ 1) Para cada ω < ω1 , sea βα,n el menor elemento de Cn mayor que α y hagamos hgωn+k (α) : k < ωi = H(βα,n , g0 ↾ βα,n , f0 ↾ βα,n , . . . , gν ↾ βα,n fν ↾ βα,n , . . . : ν < ωn). 465 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 466 ✐ ✐ 7. Combinatoria infinita Esto define gωn+k ∈ 2ω1 para toda k ∈ ω. Por hipótesis, existen funciones fωn+k ∈ 2ω1 tales que Aωn+k =T{α ∈ ω1 : F (fωn+k ↾ α) = gωn+k (α)} ∈ F, para cada k. Sea Cn+1 ⊆ Cn ∩ k<ω Aωn+k un club. Claramente, para cada g ∈ 2ω1 podemos efectuar tales definiciones. Sea g gν , fνg , ν < ωω, y Cng , n < ω la sucesión así definida comenzando con g. Establezcamos una relación de equivalencia E en 2ω1 por: gEg′ si y sólo si: ′ T T (i) mín( n<ω Cng ) = mín( n<ω Cng ) = γ; ′ ′ (ii) gνg ↾ γ = gνg ↾ γ y fνg ↾ γ = fνg ↾ γ para toda ν < ωω. No es dificil notar que la relación de equivalencia E tiene a lo sumo 2ℵ0 clases de equivalencia. Pero 2ℵ0 < 2ℵ1 y hay 2ℵ1 posibles funciones g, por lo que podemos encontrar funciones g, g′ tales que g 6= g′ y gEg′ . ′ ′ En lo sucesivo escribiremos gν , fν , Cn en lugar de gνg , fνg , Cng y gνg , fνg , ′ T T Cng en lugar de gν′ , fν′ , Cn′ . Definimos C = n<ω Cn , C′ = n<ω Cn′ . Sea hγρ : ρ < ω1 i una enumeración de C, y hγρ′ : ρ < ω1 i una enumeración de C′ . Probaremos por inducción sobre ρ que γρ = γρ′ y que para todo ν < ωω, gν ↾ γρ = gν′ ↾ γρ , fν ↾ γρ = fν′ ↾ γρ . Claramente, esto propiciará la contradicción deseada pues, en particular, tendríamos g = g0 = g0′ = g′ , contrario a g 6= g′ . Para ρ = 0, la igualdad requerida ocurre pues gEg′ . Para ρ límite, la etapa de inducción es trivial porque γρ = supσ<ρ γσ , γρ′ = supσ<ρ γσ′ . Así que supongamos ahora las igualdades para ρ. Las probaremos para ρ + 1. Para cada n y cada α < ω1 , sea Mα,n = (βα,n , g0 ↾ βα,n , f0 ↾ βα,n , . . . , gν ↾ βα,n , fν ↾ βα,n , . . . : ν < ωn), ′ con βα,n , etc. como antes, y definimos Mα,n de manera similar para g′ . Por definición, H(Mγρ ,n ) = hgωn+k (γρ ) : k < ωi. Sin embargo, γρ ∈ C, lo que implica que H(Mγρ ,n ) = hF (fωn+k ↾ γρ ) : k < ωi. ′ Así que por hipótesis de inducción obtenemos H(Mγρ ,n ) = hF (fω,n+k ↾ γρ : k < ωi; invirtiendo las implicaciones anteriores para la deducción con g′ se obtiene H(Mγρ ,n ) = H(Mγ′ ρ ,n ). De aquí que H sea inyectiva, y tenemos Mγρ ,n = Mγ′ ρ ,n . En particular, βγρ ,n = βγ′ ρ ,n . Pero esto es cierto para toda n, y ′ ′ se cumple γρ+1 = supn<ω βγρ ,n y γρ+1 = supn<ω βγ′ ρ ,n . Por ello, γρ+1 = γρ+1 . 466 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 467 ✐ ✐ Conjuntos y modelos. Curso avanzado Más aún, como Mγρ ,n = Mγ′ ρ ,n , tenemos gν ↾ βγρ ,n = gν′ ↾ βγρ ,n para toda n, así que gν ↾ γρ+1 = gν′ ↾ γρ+1 para toda ν < ωω, y de la misma manera para fν , fν′ . Con esto termina la prueba. Ahora generalizamos ⊛ a otros cardinales. Definición 7.4. Sea E un subconjunto estacionario de un cardinal regular no numerable κ. Mediante ⊛κ (E) denotamos el siguiente principio: Dada α ∈ E, sea Pα : P(α) − → 2; y existe una función ρ : E − → 2 tal que para todo X ⊆ κ, {α ∈ E : Pα (X ∩ α) = ρ(α)} es estacionario en κ. Otra vez Eα es pequeño si ⊛κ (E) es cierto. Así, Pα parte los subconjuntos de α en 2 clases y ⊛κ (E) nos permite predecir, no lo que será X ∩ α, sino si pertenecen al primer o segundo miembro de la partición denotada por Pα . Teorema 7.5. ⊛ω1 (ω1 ) implica 2ℵ0 < 2ℵ1 . Demostración. Suponga que ⊛ω1 (ω1 ) es cierto, pero que 2ℵ0 = 2ℵ1 . Sea C = ω1 − ω. Entonces existe una función inyectiva G : 2C − → 2ω . Para cada α > ω, defina Pα como sigue: si σ : α − → 2, Pα (σ) = 0 si y sólo si existe τ : ω1 − → 2 tal que σ ⊆ τ, τ(α) = 0 y G(τ ↾ C) = σ ↾ ω. Sea ρ la función predicha por ⊛ω1 (ω1 ) para esta familia de funciones partición. Definimos η : ω1 − →2 mediante η ↾ ω = G((1 − ρ) ↾ C) y η ↾ C = (1 − ρ) ↾ C. Por hipótesis, existe α > ω tal que Pα (η ↾ α) = ρ(α); esto conduce a una contradicción: primero suponga que ρ(α) = 1. Entonces, η(α) = (1 − ρ)(α) = 0, una contradicción. Suponga que ρ(α) = 0. Entonces por definición de Pα , existe una función τ que extiende a η ↾ α tal que τ(α) = 0 y G(τ ↾ C) = η ↾ ω = G(((1 − ρ) ↾ C); lo último implica que τ ↾ C = η ↾ C, ya que G es inyectiva; así que τ = η, lo cual es una contradicción pues 0 = τ(α) = η(α) = (1 − ρ)(α) = 1. Por lo tanto, ω1 no es pequeño si y sólo si 2ℵ0 < 2ℵ1 . Es tiempo de regresar a los conjuntos estacionarios e introducir nuevas nociones. Proposición 7.6. Suponga que F es un filtro κ-completo en κ = λ+ que contiene al filtro cofinito. Sea S S ⊆ κ tal que κ − S ∈ / F . Entonces existe una descomposición de S, S = β<κ Sβ en conjuntos ajenos entre sí tales que κ − Sβ ∈ / F. 467 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 468 ✐ ✐ 7. Combinatoria infinita Demostración. Para cada α < κ, elegimos una función sobre gα : λ − → α. Para cualesquier ν ∈ λ, β ∈ κ, sea Sβν = {α ∈ S : gα (ν) = β}. Afirmamos que existe ν tal que {Sβν : β ∈ κ, κ − Sβν ∈ / F } tiene cardinalidad S ν κ. Primero fijamos β y sea Yβ = {Sβ : ν ∈ λ}; entonces Yβ = {α ∈ κ : α > β} ∩ S, ya que las gα son sobre. Como F es κ-completo y contiene al filtro cofinito, las hipótesis implican que {α ∈ κ : α > β} ∈ F ; así, κ − Yβ no pertenece a F . Puesto que F es κ-completo, existe ν(β) tal que κ − Sβν(β) ∈ /F T ν (en otro caso, κ − Yβ = ν κ − Sβ pertenecería a F ). Ahora β varía sobre κ y ν(β) varía sobre λ < κ, por lo que existe ν ∈ λ tal que ν = ν(β) para κ ordinales β, que es lo que se afirmaba. Sean ν como en la afirmación, I = {β ∈ κ : κ − Sβν ∈ / F} y S W = S − {Sβν : β ∈ I}. Note que, para ν fija, las Sβν son mutuamente ajenas. Sea µ el primer elemento de I, Sµ = Sµν ∪ W; para β ∈ I − {µ}, sea S ν Sβ = Sβ . Entonces S = β∈I Sβ es la descomposición buscada. Definición 7.7. Decimos que X ⊆ γ es coestacionario si γ−X es estacionario; X es delgado si no es estacionario. Teorema 7.8. Suponga que κ = λS+ y que ⊛ω1 (ω1 ) es cierto. Entonces existe una descomposición de E, E = β∈κ Eβ , en κ subconjuntos no pequeños mutuamente ajenos. Demostración. Sea F = {X ⊆ κ : κ − X es pequeño}. Por la proposición 7.6, es suficiente probar que F es un filtro κ-completo en κ. Si X ⊆ Y y X ∈ F , entonces Y ∈ F ya que si κ − X es pequeño, κ − Y ⊆ κ − X también lo es. Falta demostrar que F es cerrado respecto a intersecciones de familias de tamaño menor que κ. Para esto es suficiente mostrar que si {Sν S: ν < λ} es una familia de subconjuntos pequeños de κ, entonces S = ν<λ Sν sigue siendo pequeño. Para cada ν < λ sea P ν = {pνα : α ∈ Sν } una familia de funciones partición, cada una de las cuales atestigua que ⊛κ (Sν ) falla; es decir, para toda ρ : Sν − → 2 existe Z ⊆ κ tal que {α ∈ Sν : pνα (Z ∩ α) = ρ(α)} es delgado. Elijamos una biyección θ : κ × λ − → κ. Entonces existe un club C tal que para α ∈ C, θ[α × λ] = α. Definamos las funciones partición Pα (α ∈ S) 468 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 469 ✐ ✐ Conjuntos y modelos. Curso avanzado que usaremos para mostrar que S es pequeño. Dada α ∈ S ∩ C, sea ν el menor tal que α ∈ Sν ; entonces, para cualquier Y ⊆ α sea Pα (Y ) = pνα ({µ ∈ κ : θ(µ, ν) ∈ Y }). (Si α ∈ S − C, se toma Pα arbitraria.) Ahora, dada ρ : S − → 2, sabemos ν que ρ ↾ Sν no es una función diamante débil para {pα : α ∈ Sν }, es decir, no satisface la definición de ⊛κ (E), así que existen Zν ⊆ κ y un club Cν con Cν ∩ {α ∈ Sν : pνα (Zν ∩ α) = ρ(α)} = ∅. Sea Z = {θ(µ, ν) : µ ∈ Zν , ν < λ}. Mostraremos que ρ no es una función diamante débil para {Pα : α ∈ S} probando que C∩ \ ν<λ Cν ∩ {α ∈ S : Pα (Z ∩ α) = ρ(α)} = ∅. Suponga que α pertenece a C ∩ S. Sea ν el menor ordinal tal que α ∈ Sν . Por la definición de Pα , Pα (Z ∩ α) = pνα (Zν ∩ α). Pero entonces, si α ∈ Cν , pνα (Zν ∩ α) 6= ρ(α), así que α no pertenece al último conjunto en la intersección. Con ayuda de ♦ podemos probar un importante resultado sobre familias casi ajenas constituidas de conjuntos estacionarios. Teorema 7.9 (♦). Existe una familia de 2κ subconjuntos de κ estacionarios casi ajenos. Demostración. Sea hAα : α < κi una ♦-sucesión. Para cada A ⊆ κ, sea SA = {α < κ : A ∩ α = Aα }. (74) SA1 ∩ SA2 ⊆ α. (75) Si A1 , A2 ⊆ κ, A1 6= A2 , y sea α < κ tal que (α ∈ A1 y α ∈ / A2 ) o (α ∈ / A1 y α ∈ A2 ). Si β ∈ SA1 y β ∈ SA2 , A1 ∩ β = Aβ = A2 ∩ β, por lo que β < α; en consecuencia, Por lo tanto, {SA : A ⊆ κ} es una familia de 2κ subconjuntos estacionarios casi ajenos. 469 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 470 ✐ ✐ 7. Combinatoria infinita En el segundo volumen estudiaremos con detalle algunos grandes cardinales. Si κ es un gran cardinal, por ejemplo, uno medible, los clubes en κ desempeñan un papel preponderante en muchas investigaciones sobre κ. Por ello, a continuación introducimos en el conjunto [λ]<κ una construcción análoga a la de los clubes. Sea κ un cardinal regular y λ ≥ κ un cardinal. Un conjunto D ⊆ [λ]<κ está dirigido si para cualesquier P1 , P2 ∈ D existe P ∈ D tal que P1 ∪ P2 ⊆ P. Un conjunto D ⊆ [λ]<κ es una cadena si D = {Pα : α < γ} con P0 ⊆ P1 ⊆ · · · ⊆ Pα ⊆ · · · , α < γ. Definición 7.10. Un conjunto C ⊆ [λ]<κ esScerrado si para toda cadena no vacía D ⊆ C tal que |D| < κ, se cumple que {P : P ∈ D} ∈ C. C no está acotado si ∀ P ∈ [λ]<κ ∃ Q[P ⊆ Q ∧ Q ∈ C]. Un conjunto S ⊆ [λ]<κ es estacionario si S ∩C 6= ∅ para todo conjunto cerrado y no acotado C ⊆ [λ]<κ . En lo sucesivo, por ccna entenderemos un conjunto cerrado y no acotado en [λ]<κ . Sea F el filtro generado por los conjuntos cerrados y no acotados. Teorema 7.11. (a) Los conjuntos P̃ = {Q ∈ [λ]<κ : Q ⊇ P} son ccna. (b) La intersección de menos que κ ccna es un ccna. Por lo tanto, F es un filtro κ-completo en [λ]<κ . (c) La intersección diagonal de conjuntos cerrados y no acotados es cerrada y no acotada; por lo tanto, F es normal. (d) Si S es estacionario y f regresiva en S, entonces f es constante en algún subconjunto estacionario de S. Demostración. (a) Evidente. (b) Sean Cξ , ξ < α conjuntos cerrados y no acotados; con α < κ mostraremos que \ C= Cξ ξ<α 470 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 471 ✐ ✐ Conjuntos y modelos. Curso avanzado es cerrado y no acotado. Podemos suponer que C0 ⊇ C1 ⊇ · · · ⊇ Cξ ⊇ ·S· · . C es cerrado y no acotado: sea D ⊆ C una cadena, |D| < κ.SEntonces D ∈ Cξ para cada ξ, y ya que Cξ es cerrado, se deduce que D ∈ C. Para exhibir que C no es acotado, considere un P ∈ [λ]<κ . Como C0 no es acotado, existe P0 ⊇ P tal que P0 ⊆ C0 . De manera similar, existe S P1 ⊇ P0 tal que P1 ∈ C1 y en general podemos encontrar Pξ ⊇ η<ξ Pη tal que Pξ ∈ Cξ para toda ξ < α. Sea Q= [ Pξ . ξ<α Para cada ξ, Q ∈ Cξ pues Cξ es cerrado, así que Q ∈ C. Por consiguiente, C no es acotado. (c) Sean Cα conjuntos cerrados y no acotados para cada α < λ. Sea C = △α<λ Cα = {P ∈ [λ]<κ : P ∈ Cα ∀ α ∈ P}. Para probar que C es cerrado, sea D ⊆ C una cadena, |D| < κ. S Fijemos S α ∈ D. Sea D′ = {Q ∈ D : α ∈ Q}, que es no vacío pues α ∈ D. D′ es una cadena y |D′ | < κ. Así, D′ ⊆ α ya que si Q ∈ D′ entonces α ∈ Q, S ′ por lo que Q ∈ Cα . Ahora, como Cα es cerrado, S D ∈ Cα . Es claro que S ′ S S D = D. Por ello, SD ∈ Cα . Para un α ∈ D arbitrario se cumple S D ∈ Cα ; por lo tanto, D ∈ C y en consecuencia C es cerrado. Para mostrar que C no es acotado, sea P ∈T[λ]<κ . En vista de (b) podemos escoger P0 ⊇ P tal que P0 ∈ α∈P Cα , P1 tal que T P1 ∈ α∈P0 Cα , y así sucesivamente. Sea Q= [ Pn . (76) n<ω Obviamente, Q ⊇ P. Afirmamos que Q ∈ C: para cualquier α ∈ Q existe m tal que para toda n ≥ m, α ∈ P , y entonces Pn+1 ∈ Cα para toda Sn∞ n ≥ m. Como Cα es cerrado y Q = n=m Pn+1 , tenemos Q ∈ Cα . Así que Q ∈ Cα para cualquier α ∈ Q, lo que implica Q ∈ C, y C no está acotado. (d) Sea f una función regresiva en un conjunto estacionario S. Para llegar a una contradicción, supongamos que para toda γ < λ, el conjunto {P ∈ S : f (p) = γ} (77) 471 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 472 ✐ ✐ 7. Combinatoria infinita no es estacionario, es decir, existe un ccna Cγ tal que f (p) 6= γ siempre que p ∈ Cγ ∩ S. Definimos C = △α<λ Cα . Afirmamos que C ∩ S = ∅, contrario a la suposición de que S es estacionario. Suponga que C ∩ S no es vacío y escoja P ∈ C ∩ S. Como P ∈ C, tenemos P ∈ Cα para cada α ∈ P y como también P ∈ S, se cumple f (p) 6= α para cada α ∈ P. En otras palabras, f (p) ∈ / P, una contradicción. Ahora pretendemos considerar descomposiciones de conjuntos estacionarios de [λ]<κ . Es un problema abierto si el siguiente teorema es cierto para κ límite. Teorema 7.12. Sean κ un cardinal sucesor y λ ≥ κ un cardinal regular. Entonces todo conjunto estacionario S ⊆ [λ]<κ es la unión de λ subconjuntos estacionarios ajenos. Demostración. Probaremos el teorema para el caso ℵ1 . Se pide al lector probarlo en el caso general κ = µ+ . Para todo P ∈ [λ]<ℵ1 sea P = {αnP : n ∈ ω} una enumeración del conjunto P. Primero probaremos que existe alguna n tal que para toda γ < λ el conjunto {P ∈ S : αnP ≥ γ} (78) es estacionario. En otro caso, para toda n existe γn < λ tal que el conjunto 78 no es estacionario, es decir, existe un conjunto cerrado y no acotado Cn tal que para toda P ∈ Cn ∩ S, se cumple αnP < γn . Así, si definimos γ = sup γn C= n \ Cn n tenemos αnP < γ para todo P ∈ C ∩ S y toda n, es decir, P ⊆ γ para todo P ∈ C ∩ S, contrario al hecho de que C ∩ S es estacionario. Ahora, sea f una función en S definida por f (P) = αnP , 472 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 473 ✐ ✐ Conjuntos y modelos. Curso avanzado donde n es como antes. Ya que f es regresiva en S, f es constante en algún subconjunto estacionario de S. Más aún, puesto que tenemos que ∀ γ < λ {P ∈ S : f (P) ≥ γ} es estacionario, ∀ γ∃ δ ≥ γ {P ∈ S : f (P) = δ} es estacionario. Obviamente, si δ1 6= δ2 , los conjuntos estacionarios correspondientes f −1 (δ1 ) y f −1 (δ2 ) son ajenos. Ya que λ es regular, esto proporciona λ subconjuntos estacionarios de S. Finalmente introducimos un principio combinatorio (♠), que es una adaptación de ♦ a nuestro contexto. Definición 7.13. El principio ♠ es el siguiente enunciado: existe una familia {AP : P ∈ [λ]<κ } con la siguiente propiedad: para todo A ⊆ λ, el conjunto es estacionario. {P ∈ [λ]<κ : A ∩ P = Ap } (79) Se puede probar (véase [Je73]) que ♠ es consistente con ZFE . Proposición 7.14 (♠). Existe una familia de 2λ subconjuntos estacionarios de [λ]<κ tales que cualesquiera dos de ellos tienen intersección no estacionaria. Demostración. Sea {AP : P ∈ [λ]<κ } una familia que satisface ♠. Para cada A ⊆ λ, sea SA = {P ∈ [λ]<κ : A ∩ P = AP }. Si A1 , A2 ⊆ λ, A1 6= A2 , sea α < λ tal que (α ∈ A1 y α ∈ / A2 ) o (α ∈ A2 y α∈ / A1 ). Si P ∈ SA1 ∩ SA2 , entonces A1 ∩ P = AP = A2 ∩ P, así que α ∈ / P; en consecuencia, SA1 ∩ SA2 ⊆ {P ∈ [λ]<κ : α ∈ / P}, donde el conjunto a la derecha en la contención no es estacionario. Por lo tanto, {SA : A ⊆ λ} es una familia de 2λ subconjuntos estacionarios con las propiedades requeridas. 473 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 474 ✐ ✐ 7. Combinatoria infinita 8. Árboles La teoría de árboles forma una parte indispensable en el desarrollo de la combinatoria infinita, con numerosas aplicaciones en el álgebra y la topología general. En esta sección presentamos las definiciones y los resultados fundamentales de la teoría. Para empezar, estudiamos el problema de Souslin, que aunque en su primera formulación no parece tener relación con árboles, después se verá que ambos están estrechamente relacionados. 8.1. El problema de Souslin. El problema de Souslin tiene su origen en un teorema clásico de Cantor que caracteriza la línea real (salvo isomorfismos) como un continuo ordenado sin extremos que tiene un subconjunto denso numerable. Para investigar este problema requerimos varios preliminares. Definición 8.1. Sea (X, ≤) un conjunto linealmente ordenado. (i) (X, ≤) es un orden denso si (∀x, y ∈ X)[(x < y) → (∃z ∈ X)(x < z < y)]; (ii) Y ⊆ X es un intervalo de X si y sólo si existen x, y ∈ X tales que Y = {z ∈ X : x < z < y} (en tal caso, Y se denota como (x, y)); (iii) (X, ≤) es un orden completo si (X, ≤) es un orden denso tal que para todo intervalo I de X y para todo Y ⊆ I, se tiene que (∃z ∈ X)[z = mín{z ∈ X : ∀y ∈ Y (z ≥ y)}] ∧(∃x ∈ X)[x = máx{x ∈ X : ∀y ∈ Y (x ≤ y)}] (en tal caso, dicha z se llama supremo de Y y x ínfimo de Y ); (iv) (X, ≤) es abierto si no tiene puntos extremos, es decir, si y sólo si (∀x ∈ X)(∃y, z ∈ X)[(y < x) ∧ (x < z)]; (v) sea (X, ≤) un orden denso; se dice que (X, ≤) es un continuo ordenado si es un orden completo y abierto; (vi) sea (X, ≤) un orden denso, se dice que Y ⊆ X es denso en X si se cumple lo siguiente: (∀x, z ∈ X)[x < z → (∃y ∈ Y )(z < y < x)]; 474 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 475 ✐ ✐ Conjuntos y modelos. Curso avanzado (vii) sea (X, ≤) un orden denso, se dice que (X, ≤) es separable si existe Y ⊆ X tal que Y es denso en X y numerable. En 1920, M. Souslin planteó la pregunta: ¿Podemos debilitar estas condiciones y aún caracterizar a R? Para formular el problema requerimos algunos antecedentes. Teorema 8.2 (Cantor). Si (X, ≤) es un continuo linealmente ordenado y separable, entonces (X, ≤) es isomorfo a R (con el orden usual de R). Demostración. Ejemplo 5.9.6(2). Definición 8.3. Sea (X, ≤) un conjunto linealmente ordenado. Se dice que (X, ≤) tiene la propiedad de Souslin si y sólo si toda familia de intervalos de X ajenos entre sí es numerable. Problema de Souslin. ¿Todo continuo ordenado que satisface la propiedad de Souslin es isomorfo a R? Aunque Souslin no publicó ningún indicio de que él creyera en la posibilidad de una contestación afirmativa al problema, es común referir la hipótesis de Souslin como una respuesta afirmativa a la pregunta. Hipótesis de Souslin HS. Si (X, ≤) es un continuo ordenado que satisface la propiedad de Souslin, entonces (X, ≤) es isomorfo a R. Ahora se sabe que el problema de Souslin no se puede resolver en ZFE aún si se supone la HGC . Para fines prácticos, demostraremos que la hipótesis de Souslin se puede enunciar eliminando dos hipótesis: la de ser completo y la de ser abierto, es decir, la hipótesis de continuidad. Teorema 8.4. Las siguientes afirmaciones son equivalentes: (i) HS. (ii) Si (X, ≤) es un orden denso que satisface la propiedad de Souslin, entonces es separable. Demostración. (ii)⇒(i) es trivial. Para demostrar (i)⇒(ii), sea (X, <X ) un orden denso que satisface la propiedad de Souslin. Definiremos un encaje (que preserva el orden) de (X, <X ) en R. En el caso en que (X, <X ) tenga puntos finales (es decir, que no sea abierto) extendemos (X, <X ) a un orden 475 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 476 ✐ ✐ 7. Combinatoria infinita denso (X̂, <X̂ ) y abierto: sea X̂ = X ∪ (Q \ {0}) y definimos <X̂ de la siguiente manera,   (a ∈ Q− ∧ b ∈ Q+ )      (a ∈ Q− ∧ b ∈ X)    (a ∈ X ∧ b ∈ Q+ ) a <X̂ b ⇔  (a, b ∈ X ∧ a <X b)      (a, b ∈ Q− ∧ a <Q b)     + (a, b ∈ Q ∧ a <Q b). ∨ ∨ ∨ ∨ ∨ Lo que se hizo fue agregar una “copia” de Q a cada punto final de X (observe que X̂ hereda la propiedad de Souslin). Por otro lado, es claro que la identidad en X es un encaje en X̂ (esto es, es inyectiva y preserva el orden). A continuación obtenemos la compleción mediante cortaduras de Dedekind. Llamemos X∗ a la compleción de X̂. Aplicamos la hipótesis de Souslin (que en este caso es la hipótesis de nuestra demostración) a X∗ (observe que X∗ es un continuo ordenado que satisface la propiedad de Souslin) para concluir que X∗ es isomorfo a R. Así deducimos que existe un encaje f de X en R, a saber, la restricción del isomorfismo entre R y X∗ . A continuación definiremos, en términos del encaje f , un subconjunto denso y numerable de X. Sea hqi |i ∈ ωi una enumeración de los racionales. Para cada i, j ∈ ω definimos dij como f −1 (x), donde se elige a x del conjunto (qi , qj ) ∩ f [X] siempre y cuando éste no sea vacío. En otro caso definimos dij como algún elemento de X. Observe que si tomamos x < y ∈ X, entonces existe z ∈ X tal que x < z < y, luego f (x) < f (z) ∧ f (z) < f (y), por lo que existen qi , qj ∈ Q tales que f (x) < qi < f (z) < qj < f (y). Así, (qi , qj ) ∩ f [X] 6= ∅, por lo que dij tiene la propiedad de que su imagen está entre qi y qj . De aquí se tiene que x < dij < y. Podemos concluir que D = {dij |i, j ∈ ω} es un conjunto denso numerable de X. En consecuencia, la hipótesis de Souslin niega la existencia de conjuntos densamente ordenados que tengan la propiedad de Souslin pero que no sean separables. A continuación damos nombre a dichos conjuntos: Definición 8.5. Una lı́nea de Souslin es un orden denso que no es separable y que satisface la propiedad de Souslin. 476 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 477 ✐ ✐ Conjuntos y modelos. Curso avanzado De aquí que la hipótesis de Souslin (HS) puede ser enunciada de la siguiente manera: No existen las lı́neas de Souslin. Es conveniente enunciar este problema en términos de órdenes parciales, en particular, de aquellos denominados árboles. Un árbol es un conjunto parcialmente ordenado (T, ≤T ) tal que para todo t ∈ T , el conjunto tˆ = {s ∈ T : s <T t} está bien ordenado. Así que podemos considerar a los árboles como una generalización natural de los ordinales. La altura (AltT (t)) de t en (T, ≤T ) es el tipo ordinal de tˆ. El nivel α de T es el conjunto Tα = {t ∈ T : Alt T (t) = α}. Frecuentemente identificaremos a (T, ≤T ) con T . La altura Alt(T ) de T es mín{α : Tα = ∅}. Como todo árbol T es un conjunto parcialmente ordenado bien fundado, podemos introducir los niveles de T también de la siguiente manera: si X es un subconjunto de T entonces X0 denota el conjunto de todos los elementos mínimos de X. Por inducción sobre α se verifica fácilmente que Tα = (T \ ∪{Tβ : β < α})0 . Todo subconjunto de T se puede considerar como un subárbol de T . Note que si U es un subárbol de T , entonces AltU (t) ≤ AltT (t) para todo t ∈ U, y que en general Uα 6⊆ Tα . Sin embargo, si U es un segmento inicial de T , es decir, si tˆ ⊆ U para toda t ∈ U, entonces para toda α se cumple Uα = Tα ∩ U, es decir, AltU (t) = Alt T (t) para todo t ∈ U. Si A es un conjunto de ordinales, entonces un ejemplo típico de subárbol de T es el conjunto T ↾ A = ∪{Tα : α ∈ A}. Si t ∈ T , entonces T t = {s ∈ T : t ≤T s} es otro ejemplo de un subárbol. Observe que en ambos casos, T ↾ A y T t , es fácil calcular las alturas de sus elementos. Una rama de un árbol T es una cadena (un subconjunto linealmente ordenado) máximo de T . Una trayectoria de T es cualquier cadena de T que es a su vez un segmento inicial de T . Una α-cadena de T es una cadena de tipo ordinal α. En forma similar se definen α-rama y α-trayectoria. Un buen ejemplo de árbol infinito es el conjunto S de todas las sucesiones finitas de 0 y 1 ordenadas por ⊆: S= [ {2n : n < ω}. Claramente, Alt S (s) = |s| para s ∈ S. Por lo tanto, Sn = 2n para todo n < ω, y Alt(S) = ω. Observe que toda rama de S tiene la forma {f ↾ n : n < ω}, donde 477 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 478 ✐ ✐ 7. Combinatoria infinita f ∈ 2ω . Por lo tanto, el conjunto de todas las ramas de S tiene cardinalidad 2ℵ0 . Tenemos entonces un fenómeno muy interesante: un árbol S de altura ω y con todos sus niveles finitos, pero con 2ℵ0 ω-ramas. Después veremos que una generalización de esto, incluso al primer cardinal no numerable, propicia una afirmación que no se puede decidir en ZFE. Si E ⊆ ω 2, sea SE = S ∪ E, ordenado por ⊆. Si E no es numerable, entonces SE es un árbol de Cantor. Extendemos esta definición y decimos que T es un árbol de Cantor si y sólo si T es isomorfo a un subárbol no numerable de S(ω2 ) . S La restricción del árbol T a β<α Tβ se denota con T ↾ α. Sea θ un ordinal, y λ un cardinal. Un árbol T es un (θ, λ)-árbol si (i) (∀ α < θ)(Tα 6= ∅); (ii) Tθ = ∅; (iii) (∀ α < θ)(|Tα | < λ). Es decir, un (θ, λ)-árbol tiene altura θ y anchura menor que λ. Un árbol T tiene límites únicos si siempre que α es un ordinal límite y x, y ∈ Tα , si x̂ = ŷ, entonces x = y. Un (θ, λ)-árbol T es normal si (i) |T0 | = 1; (ii) (∀α < λ)(∀x ∈ Tα )(|{y ∈ Tα+1 |y > x}| = ℵ0 ). (iii) (∀ α < β)(∀ x ∈ Tα )(∃ y ∈ Tβ )(x <T y); (iv) (∀ α < θ)(Lím(α) ⇒ (∀ x, y ∈ Tα )(x̂ = ŷ ⇒ x = y), es decir, tiene límites únicos. Si κ es un cardinal infinito, un κ-árbol es un (κ, κ)-árbol. Una pregunta muy natural acerca de árboles es: ¿cuándo un árbol dado T debe tener una rama cofinal?, es decir ¿cuándo contiene una rama que intersecte todos sus niveles? Es claro que nos podemos restringir al caso en que Alt T = κ es un cardinal. También es fácil concluir que podemos suponer que |Tα | < κ para todo α < κ. Así que nos podemos restringir a κ-árboles. Si κ es un cardinal singular, entonces es claro que existe un κ- árbol sin ramas cofinales (véase el Ejer. 72). Por consiguiente, el único caso no trivial es cuando κ es un cardinal regular. En el caso κ = ℵ0 , tenemos la siguiente respuesta positiva: Teorema 8.6 (König). Todo ℵ0 -árbol tiene una rama cofinal. 478 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 479 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sea T un ℵ0 -árbol. Por inducción sobre n < ω, elegimos tn ∈ Tn tal que T tn es infinito y tn <T tn+1 . Entonces {tn : n < ω} es una rama cofinal de T . Una anticadena en un árbol T es un subconjunto de T cuyos elementos son <T - incomparables entre sí. Resulta que una generalización del teorema de König para el caso κ = ℵ1 es falsa, es decir, existen ℵ1 -árboles sin ramas cofinales. Tales árboles se conocen como árboles de Aronszajn. En general, un árbol κ-Aronszajn es un κ-árbol sin ramas cofinales. Recuerde que λ<κ es el conjunto de todas las funciones f :µ− → λ, para toda µ < κ. Teorema 8.7. Existe un árbol de Aronszajn. Demostración. Considere el árbol hT, <i, donde T = {s ∈ ω<ω1 : s es inyectiva}, y la relación < se define como la contención propia, es decir, s < t si y sólo si t extiende como función a s. Observe que la altura de T es ω1 , pues para cada α < ω1 existe una función inyectiva de α en ω. Además, T no tiene cadenas no numerables, pues si existiese una cadena C no numerable en T , entonces S C serı́a una función inyectiva de ω1 en ω, y por último, observe que para ω ≤ α < ω1 se tiene que |Tα | = ℵ1 . Ası́, este último hecho asegura que el árbol T no es un ω1 -árbol, aunque está cerca de ser Aronszajn. Sólo hace falta reducir el cardinal de los niveles Tα a ℵ0 . Para lograr esto, definiremos un subárbol T ∗ de T que cumple con las propiedades que exige la definición de ω1 -árbol. Primero, para cada α < ω1 definimos una relación ∼α de equivalencia sobre el conjunto α ω: Sean s, t ∈ α ω. s ∼α t si y sólo si el conjunto {ξ < α|s(ξ) 6= t(ξ)} es finito. Ahora, para cada α < ω1 definiremos sα ∈ T con las siguientes propiedades: (i) sα ∈ α ω, (ii) α < β ⇒ sα ∼α sβ ↾α , (iii) |ω − ran(sα )| = ω. Si definimos s0 = ∅ claramente s0 cumple con las propiedades enunciadas. Suponiendo que sα está definido, sea sα+1 = sα⌢ hα, ni, donde n ∈ (ω\ran(sα )). De la definición de sα+1 , es directo que (i) y (iii) se cumplen en este caso; 479 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 480 ✐ ✐ 7. Combinatoria infinita aplicando la transitividad de la relación ∼γ es inmediato que si γ < β(= α +1), entonces sγ ∼γ sβ ↾γ . Ahora, para definir sα en el caso en que α es lı́mite, suponemos definido a sγ (γ < α). Se fija una sucesión numerable hαn |n ∈ ωi estrictamente creciente, de ordinales menores que α, que converja en α. Sea t0 = sα0 e inductivamente definimos tn ∈ Tαn de manera que (tn ∼αn sαn ) y tn+1 ↾ αn = tn . Luego, sea S t = n∈ω tn . Por último, definimos sα como la siguiente función en α: sα (αn ) = t(α2n ); sα (ξ) = t(ξ) cuando ξ ∈ / {αn : n ∈ ω}. Claramente sα ∈ ωα , y sα es 1 − 1 (esto último se sigue del hecho de que t es 1 − 1). Ası́, sα satisface (i). Luego, (ii) se sigue de los siguientes hechos (fácilmente verificables): (∀γ < α)∃αn (γ < αn < α), (∀γ < α)(sα ↾γ ∼γ t ↾γ ), (∀γ < α)(∀x, y ∈ ωα )[(x ∼α y) ⇒ (x ↾ γ ∼γ y ↾ γ), (∀n ∈ ω)(∀γ < αn )(tn ↾ γ ∼γ sγ), (∀n ∈ ω)(t ↾ αn = tn ). Por último, (iii) se sigue de la siguiente observación: {t(α2n+1 ) : n ∈ ω} ⊂ (ω − ran(sα )). Definimos T∗ = [ α<ω1 {t ∈ Tα : t ∼α sα }. Haciendo uso de la propiedad (ii) se puede corroborar que en realidad T ∗ es un subárbol de T . Este árbol T ∗ es un ω1 -árbol, pues por la propiedad (i), para cada α < ω1 , sα ∈ Tα∗ y, por lo tanto, Tα∗ = {t ∈ Tα : t ∼α sα } = 6 ∅. Además, Tω∗1 ⊆ Tω1 = ∅. Y por la observación que hicimos al inicio con respecto a que en T no hay cadenas no numerables, se concluye que T ∗ es un árbol de Aronszajn. A pesar del último teorema, son posibles algunas generalizaciones del teorema de König: 480 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 481 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 8.8 (Kurepa). Sea κ un cardinal regular y sea T un árbol de altura κ tal que para alguna λ < κ, |Tα | < λ para toda α < κ. Entonces T tiene una rama cofinal. Demostración. Podemos suponer que λ es un cardinal regular. Para cada δ < κ con cf (δ) = λ elegimos arbitrariamente tδ ∈ Tδ . Para cada δ < κ con cf (δ) = λ, escogemos sδ <T tδ con la propiedad de que T sδ ∩ Tδ = {tδ }. Claramente, tal sδ existe pues en caso contrario tendríamos |Tδ | ≥ λ, lo cual es una contradicción. Por el lema de Fodor, podemos encontrar un subconjunto estacionario A ⊆ {δ < κ : cf (δ) = λ} y γ < κ tal que AltT (sδ ) = γ para toda γ ∈ A. Como |Tγ | < λ < κ, podemos suponer que para alguna s ∈ Tγ , sδ = s para δ ∈ A. Ahora es fácil ver que {tδ : δ ∈ A} es una κ-cadena, es decir, un subconjunto linealmente ordenado de cardinalidad κ. Esto completa la prueba. Ahora estamos en posibilidad de definir la noción de árbol de Souslin como aquellos ω1 -árboles en los que todas sus cadenas y anticadenas son numerables. Se puede observar que un árbol de Souslin siempre es un árbol de Aronszajn. Arriba se definieron por separado (y en particular para κ = ω1 ) las nociones de ω1 -árbol y ω1 -árbol normal. Lo que a continuación veremos es que cuando se tiene un árbol de Souslin, poseemos también un árbol de Souslin normal. Es decir, el hecho de que exista un ω1 -árbol sin anticadenas ni cadenas no numerables garantiza la existencia de un árbol con las mismas caracterı́sticas (Souslin), pero que además es normal. Este resultado facilita mucho el manejo de la demostración de la equivalencia entre la existencia de líneas y árboles de Souslin. Lema 8.9. Sea hT, ≤i un árbol de Souslin. Existe T ∗ tal que hT ∗ , ≤↾T ∗ i es un árbol de Souslin normal. Demostración. Definimos T 1 ⊆ T como T 1 = {x ∈ T : |T (x)| > ℵ0 }. Observe que T 1 6= ∅, que T 1 es un árbol de Souslin y que además T 1 ∩ T0 6= ∅. Ahora, tomando x0 ∈ T 1 ∩ T0 arbitrario, definimos el árbol T 2 como T 2 = T 1 (x0 ), el segmento inicial determinado por x0 en T . Una vez más, se debe observar que T 2 es un árbol de Souslin que (por la regularidad de ω1 ) satisface las propiedades (a) y (c) de normalidad. Para garantizar la unicidad de lı́mites (propiedad [iv] de normalidad), consideremos lo siguiente: para cada cadena 481 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 482 ✐ ✐ 7. Combinatoria infinita C en T 2 de la forma C = x̂ = ẑ agregamos un nodo ac tal que para toda z ∈ C, z < ac y tal que ∀x[(∀z ∈ C)(x > z) ⇒ ac < x]. Por último, para garantizar la existencia de ω sucesores (propiedad [ii]) se considera el árbol T 3 definido como T 3 = {x ∈ T 2 : Lím(AltT 2 (x))}. Claramente, T 3 es un árbol de Souslin que satisface las propiedades de normalidad. El siguiente teorema establece, con ayuda del lema 8.9, que la existencia de líneas de Souslin es equivalente a la existencia de árboles de Souslin. Será pues este teorema el que permita la reformulación de la hipótesis de Souslin en términos de árboles. Teorema 8.10. Existe una línea de Souslin si y sólo si existe un árbol de Souslin. Demostración. ⇐) Sean hT̂ , <T̂ i un árbol de Souslin y hT, <T i un árbol de Souslin normal (el lema anterior garantiza su existencia). Considere el conjunto L = {C ⊆ T : C es una cadena máxima deT }. Ahora, como en T todas las cadenas son numerables, sabemos que para cada C ∈ L existe un ordinal h(C) tal que h(C) < ω1 y (∀α < h(C))(|Tα ∩ C| = 1) ∧ (∀α ≥ h(C))(Tα ∩ C = ∅). Además, como T es normal, h(C) no puede ser sucesor, por lo que h(C) es un ordinal lı́mite menor que ω1 . Luego, para cada C ∈ L y cada α < h(C), definimos C(α) como el único elemento de Tα ∩ C. La idea que continúa es la de demostrar que el conjunto L es una línea de Souslin. A continuación probaremos que bajo la definición de cierto orden <L en L, el par hL, <L i cumple con las propiedades de Souslin y densidad, pero que no es separable. Para definir el orden citado en L, consideramos primero un orden <α en Tα (para cada 0 < α < ω1 ) isomorfo al orden usual de los números racionales (recuerde que cada uno de dichos Tα tienen cardinalidad ℵ0 ). Pero además el 482 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 483 ✐ ✐ Conjuntos y modelos. Curso avanzado par hS(x), <α+1 i debe ser isomorfo a los racionales (con el orden usual), donde x ∈ Tα (0 < α < ω1 ) y S(x) = {y ∈ Tα+1 : y > x}. Luego, definimos el orden <L en L de la siguiente manera: C <L D si y sólo si C(d(C, D)) <d(C,D) D(d(C, D)), donde d(C, D) = mín{α < mín(h(C), h(D))|C(α) 6= D(α)}. (Observe que por el hecho de que T es normal, la unicidad de lı́mites asegura que el ordinal d(C, D) siempre es un ordinal sucesor.) Veamos pues que en realidad el orden <L es un orden denso en L (es claro que éste orden es lineal): Sean C, D ∈ L tales que C <L D; ası́, si α = d(C, D), se tiene que C(α) <α D(α). Pero debido a la elección del orden <α , se puede garantizar la existencia de un elemento e de Tα tal que C(α) <α e <α D(α). Ahora, si consideramos la cadena E como aquella que se obtiene al extender la cadena {x ∈ T |x ≤ e} a una cadena máxima, entonces d(C, E) = α = d(E, D). Concluimos que C(α) <α E(α) <α D(α) y, por lo tanto, que C <L E <L D. Para demostrar que L cumple con la propiedad de Souslin, definimos, para cada intervalo I = (C, D) en L, una cadena EI en L como aquella que se obtiene al extender de manera máxima la cadena {x ∈ T |x ≤ eI }, donde eI es un elemento de T que tiene la propiedad C(d(C, D)) <d(C,D) eI <d(C,D) D(d(C, D)). Claramente, EI ∈ I; ası́, si I y J son intervalos ajenos en L, entonces EI 6∈ J y EJ 6∈ I. Por ello, los elementos eI y eJ de T son incomparables en T . Luego, como no existen cadenas no numerables en T , cualquier familia de intervalos mutuamente ajenos en L debe ser numerable. Por último, para demostrar que L no es separable, suponga, por el contrario, que existe A ⊆ L numerable y denso en L. Definimos γ como γ = sup{d(C, D) < ω1 : (C, D ∈ A) ∧ (C 6= D)}. (Se debe observar que γ < ω1 , pues A es numerable.) Luego, sean w ∈ Tγ y x, y, z ∈ S(w) (S(w) definido arriba) tales que x <α+1 y <α+1 z, y considere 483 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 484 ✐ ✐ 7. Combinatoria infinita cadenas máximas Ex , Ey , Ez que contengan, repectivamente, a x, y y z. De aquı́ que las cadenas Ex , Ey y Ez están ordenadas en L, de la siguiente manera: Ex <L Ey <L Ez , pero como además hemos supuesto que A es denso en L, deben existir cadenas C, D en A tales que Ex <L C <L Ey <L D <L Ez , concluimos: d(C, D) > γ, una contradicción. ⇒) Sea hL, <L i una lı́nea se Souslin. Construiremos T como un subconjunto del conjunto {I ∈ P(L) : I es un intervalo en L} tal que hT, ⊇i sea un árbol de Souslin. La construcción se efectúa por niveles: Sea T0 = {L}. Para definir Tα+1 en términos de Tα , consideremos, primeramente, los siguientes inrtervalos: I0 = {y ∈ I|y <L x(I)}, I1 = {y ∈ I|x(I) ≤L y}, donde I es un intervalo de L con al menos dos elementos distintos, y x(I) es un punto interior de I. Definimos Tα+1 de la siguiente manera: Tα+1 = {I0 : I ∈ Tα ∧ |I| > 1} ∪ {I1 |I ∈ Tα ∧ |I| > 1}. Para α lı́mite, definimos: Tα = {∩r : r es una α − rama de T ↾α y tal que | ∩ r| > 1}. (Recuerde que, en este caso, una rama es una sucesión decreciente de intervalos de L.) Por último, definimos T = [ Tα . α<ω1 Demostraremos a continuación que hT, ⊇i es un árbol de Souslin, es decir, demostraremos que 1. 2. 3. 4. Tω1 = ∅. (∀α < ω1 )(0 < |Tα | < ω1 ). T no tiene cadenas no numerables. T no tiene anticadenas no numerables. 484 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 485 ✐ ✐ Conjuntos y modelos. Curso avanzado Por reducción al absurdo, demostraremos a continuación el punto 3: sea B una cadena no numerable de T (supondremos que B es máxima). Consideremos hIα |α < ω1 i la enumeración canónica de los primeros ω1 elementos de B, y definamos: A0 = {α < ω1 : (∀y ∈ Iα+1 )(y <L x(Iα ))}. A1 = {α < ω1 : (∀y ∈ Iα+1 )(x(Iα ) ≤L y)}. Ası́, A0 ∪ A1 = ω1 y A0 ∩ A1 = ∅, por lo que se tiene que A0 o A1 es no numerable. Si suponemos, sin pérdida de generalidad, que A0 es no numerable, y definimos, para α ∈ A0 , el intervalo Jα de L como Jα = (x(Iβ ), x(Iα )), donde β = mín{β ∈ A0 |β > α}, tendremos que x(Iβ ) <L x(Iα ). Por lo tanto, la colección {Jα |α ∈ A0 } es una colección de ω1 intervalos abiertos, distintos y mutuamente ajenos de L. Una contradicción con el hecho de que L es una línea de Souslin. Para demostrar 4 (es decir, que T no tiene anticadenas no numerables), es suficiente con observar que, en caso de que existiera una anticadena tal, de la forma A = {Iα |α < ω1 }, es posible elegir elementos xα , yα ∈ Iα (para cada α < ω1 ) tales que xα <L yα y que la colección {(xα , yα )|α < ω1 } de intervalos abiertos de L viole la propiedad de Souslin en L, es decir, que sea una colección no numerable de intervalos abiertos y mutuamente ajenos de L. Observe que el punto 3 se sigue directamente del punto anterior y del hecho de que |T | > ℵ0 . Esto último se cumple pues el conjunto {x(I)|I ∈ T } es denso en L y, por lo tanto (L no es separable), no numerable, de donde T tampoco lo es. Por último, el punto 1 se cumple gracias a la validez del punto 2 en T y al hecho de que todas las cadenas son numerables. Si utlizamos un principio de predicción como ♦ (ahora bien conocido para nosotros), podemos mostrar que existe un árbol de Souslin, con lo que demostramos adicionalmente que la existencia de árboles de Souslin es consistente con ZFE . Teorema 8.11 (Jensen). Suponga que ♦ es cierto. Entonces existe un árbol de Souslin. 485 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 486 ✐ ✐ 7. Combinatoria infinita Demostración. Por recursión sobre los niveles construiremos un árbol de Souslin T̆ = (ω1 , < ). La recursión se lleva a cabo de tal forma que α < β T̆ T̆ implique α < β y, para cada α < ω1 , T̆ ↾ α es un (α, ω1 )-árbol normal. Sea T̆ 0 = {0}. Si T̆ ↾ (α + 1) está definido, obtenemos T̆ α+1 como sigue. Los elementos de Tα son ordinales numerables, y por ello T̆ α tiene un buen orden canónico. Procediendo de esta forma en T̆ α con este orden, para cada x ∈ T̆ α ponemos como inmediatos sucesores a los siguientes dos ordinales no utilizados aún en T̆ α+1 . Esto define T̆ ↾ (α + 2). Si T̆ ↾ (α + 1) era un ((α + 1), ℵ1 )-árbol, entonces T̆ ↾ (α + 2) será claramente un ((α + 2), ℵ1 )-árbol normal. Falta el caso en el que T̆ ↾ α está definido, y es un (α, ℵ1 )-árbol normal para α < ω1 límite. Como queremos que T̆ ↾ (α + 1) sea un ((α + 1), ℵ1 )-árbol normal, sabemos que sólo podemos añadir un punto en T̆ α para extender cada rama cofinal de T̆ ↾ α. (Por la normalidad y el hecho de que cf (α) = ℵ0 , para todo punto x ∈ T̆ ↾ α debe haber una rama cofinal de T̆ ↾ α que contiene a x). El problema es decidir qué rama de T̆ ↾ α extender. Como debemos tener |T̆ α | = ℵ0 , no podemos extender todas ellas pues hay 2ℵ0 . Para tomar la decisión, usamos una ♦-sucesión hSα : α < ω1 i. Consideremos Sα . Si Sα no es una anticadena maximal de T̆ ↾ α, y bx es una rama cofinal arbitraria de T̆ ↾ α que contiene a x, para cada x ∈ T̆ ↾ α, sea T̆ α las extensiones mediante un punto de cada bx . Como el buen orden canónico de los puntos x ∈ T̆ ↾ α(⊆ ω1 ) induce un buen orden de los bx , podemos hacerlo en forma canónica usando el siguiente intervalo disponible de ordinales. Suponga que Sα es una anticadena maximal de T̆ ↾ α. Entonces, para cada x ∈ T̆ ↾ α podemos encontrar x′ ∈ Sα tal que x y x′ son T̆ -comparables. Sea x′′ el T̆ -mayor de x, x′ . Para cada x ∈ T̆ ↾ α, sea bx una rama arbitraria cofinal de T̆ ↾ α que contiene a x′′ . T̆ α consiste en las extensiones unipuntuales de cada bx . Note que, en cualquiera de los casos anteriores, T̆ ↾ (α + 1) es claramente un ((α + 1), ℵ1 )-árbol normal. Además, si Sα es una anticadena maximal de T̆ ↾ α, entonces todo punto en T̆ α es comparable con algún punto de Sα abajo de él. Esto completa la definición S del árbol. Sea T̆ = α<ω1 T̆ ↾ α. Claramente T̆ es un ℵ1 -árbol con dominio ω1 . Mostraremos que T̆ es de Souslin. Es suficiente con demostrar que toda anticadena maximal de T̆ es numerable. Supongamos lo contrario, y sea A una anticadena maximal no numerable de T̆ . Por supuesto, el conjunto C ={α ∈ ω1 : α es límite, T̆ ↾ α = T̆ ∩ α, A ∩ α es una anticadena maximal de T̆ ↾ α} 486 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 487 ✐ ✐ Conjuntos y modelos. Curso avanzado es cerrado y cofinal en ω1 . Esto se demuestra fácilmente usando sólo el hecho de que cada T̆ ↾ α es numerable y cf (ω1 ) > ω. Así que por ♦ podemos encontrar α ∈ C tal que A ∩ α = Sα . Como α ∈ C, α es límite, T̆ ↾ α = T̆ ∩ α, y Sα es una anticadena maximal de T̆ ↾ α. Por construcción, todo elemento de T̆ α está encima de algún elemento de Sα . Entonces x está encima de algún y ∈ T̆ α . Por lo observado, sabemos que existe z ∈ Sα debajo de y. Pero z ∈ A ∩ α y x ∈ A está encima de z, lo que contradice el hecho de que A es una anticadena de T̆ . Terminamos la demostración. Lema 8.12. Suponga que existe un ℵ1 -árbol T que no tiene ramas cofinales ni anticadenas no numerables. Entonces existe un árbol de Souslin (encajado en T ). Demostración. Sean T como se afirma y T ′ = {x ∈ T : ∀ β > Alt(x)(∃ y ∈ Tβ )(x <T y)}. Se observa sin dificultad que T ′ es un ℵ1 -árbol sin ramas cofinales ni anticadenas inumerables, tal que Tα′ ⊆ Tα para todo α, y que además satisface el inciso (iii) del requerimiento de normalidad. Sea x0 un miembro arbitrario de T0′ y hagamos T ′′ = {x ∈ T ′ : x0 ∈ x}. Entonces T ′′ tiene las mismas propiedades mencionadas que T ′ , pero adicionalmente satisface la condición (i) de normalidad. Por recursión sobre α < ω1 , definimos una función estrictamente creciente f : ω1 − → ω1 tal que f (0) = 0, f (α) = supβ<α f (β) si α es límite, y f (α + 1) es el menor β > f (α) tal que (∀ x ∈ Tf′′(α) )(∃ y1 , y2 ∈ Tβ′′ )(y1 6= y2 , x <T y1 , x <T y2 ). S Definamos T ∗ = α<ω1 Tf′′(α+1) . En consecuencia, T ∗ es un (ℵ1 , ℵ1 )- árbol sin ramas cofinales ni anticadenas inumerables, tal que T ∗ satisface (i)–(iii) de la definición de normalidad. En particular, como T ′′ no tenía ramas cofinales y satisface (iii), T ∗ está bien definido. Finalmente, por recursión sobre los niveles de T ∗ , es fácil obtener un subárbol de T ∗ que satisfaga la condición (iv) de normalidad. Por supuesto, este árbol es de Souslin. Simplemente escojamos (por inducción en los niveles) una extensión límite de cada rama límite que tenga una extensión. Queda demostrado el lema. Vale la pena especializar un poco la noción de árbol de Aronszajn, lo que nos permite obtener una caracterización adecuada de los árboles de este tipo. Definición 8.13. Un árbol normal T de tamaño ℵ1 es un árbol de Aronszajn especial si T es la unión de una cantidad numerable de sus anticadenas. 487 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 488 ✐ ✐ 7. Combinatoria infinita Claramente, todo árbol de Aronszajn especial es en particular de Aronszajn. Si T = (T, ≤T ) es un árbol y X = (X, ≤X ) es un conjunto parcialmente ordenado, decimos que T es X-encajable si existe f : T − → X tal que x <T y implica f (x) <X f (y). La función f encaja T en X. Los árboles encajables en R (en Q) son (precisamente) los árboles (especiales) de Aronszajn, como se demuestra a continuación. Teorema 8.14. Sea T un ℵ1 -árbol normal, es decir un (ω1 , ω1 )-árbol normal. (i) T es Q-encajable si y sólo si T es un árbol especial de Aronszajn. (ii) Si T es R-encajable, entonces T es de Aronszajn y todo subconjunto no numerable de T contiene una anticadena no numerable de T . Demostración. (i) Sea f un encaje de T en Q. Para cada q ∈ Q, sea Aq =S {x ∈ T : f (X) = q}. Entonces cada Aq es una anticadena en T y T = q∈Q Aq . S Recíprocamente, sea T = n∈N An , donde las anticadenas An son ajenas entre sí. Definimos un encaje f : T − → Q como sigue: para cada x ∈ A0 sea f (x) = 0. Para x ∈ A1 , f (x) = 1 (respectivamente f (x) = −1) si x no está debajo (respectivamente está debajo) de un punto de A0 . Continuamos de esta forma, haciendo por ejemplo f (x) = − 21 si x es un punto de A2 que está encima de A1 pero debajo de A0 . Claramente, f es el encaje requerido. (ii) Si T es R-encajable entonces toda rama de T debe ser numerable, por lo que T es de Aronszajn. Sea U ⊆ T no numerable. U hereda la estructura de árbol de T con nuevos niveles Uα . Podemos suponer que Uα 6= ∅ para toda α < ω1 , sino habríamos terminado, pues en tal caso alguno de los Uα (de los cuales contamos con una cantidad no numerable) debe ser no numerable. Sea U ∗ = Uα<ω1 Uα+1 . Si f encaja T (y por lo tanto U) en R, sea g tal que g(x) ∈ Q y f (y) < g(x) ≤ f (x) siempre que x está en algún Uα+1 y y es su predecesor en Uα . Entonces g encaja U ∗ en Q. Por consiguiente, U ∗ es la unión de una cantidad numerable de anticadenas, una de las cuales es no numerable. 8.2. La hipótesis de Kurepa. En este apartado se desarrolla una importante aplicación del principio ♦+ ; se establece la existencia de cierto tipo de árboles llamados árboles de Kurepa bajo la suposición de ♦+ . Al igual que en el caso de la demostración de la existencia de al menos un árbol de Souslin en términos del principio ♦, en este caso se podrá establecer la existencia de al menos un árbol de Kurepa bajo la hipótesis de ♦+ . 488 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 489 ✐ ✐ Conjuntos y modelos. Curso avanzado La pregunta por la existencia de dichos árboles se vislumbra a partir del estudio de los árboles Aronszajn. Ahora también existen (según ZFE ) ω1 -árboles que no son Aronzajn, esto es, que tienen ω1 -ramas; más aún, el siguiente es ejemplo de un ω1 -árbol con ℵ1 , ω1 -ramas: Ejemplo 8.15. Considere el árbol hT, ⊂i, donde T = {s ∈ 2<ω1 : “el conjunto S −1 (1) es finito”}. Ası́, uno podrı́a preguntarse si existen ω1 -árboles con más de ℵ1 , ω1 -ramas. Es bajo este espı́ritu que definimos la noción de árbol de Kurepa: Definición 8.16. Se dice que un ω1 -árbol T es un árbol de Kurepa si T tiene ℵ2 o más ω1 -ramas. Y la hipótesis de Kurepa es la siguiente afirmación: Hipótesis de Kurepa (HK): Existe un árbol de Kurepa. Esta afirmación es consistente con la teorı́a de los conjuntos, pero, más aún, es independiente de dicha teorı́a (la demostración de la consistencia de la negación de la hipótesis de Kurepa hace uso del método de forcing iterado (véase [Ku80, Cap. VIII]). Ahora, para demostrar que HK es consistente con ZF , se demuestra primeramente (a continuación) que el principio ♦+ implica la existencia de árboles de Kurepa, es decir, implica HK. Posteriormente se demuestra (capítulo de constructibilidad, Lema 7.7) que ♦+ se cumple en el universo L. Para facilitar la demostración de la primera parte, introducimos ciertas nociones para ası́ poder establecer la HK en términos de cierto tipo de familias: Definición 8.17. Se dice que un subconjunto F de Pot(ω1 ) es una familia de Kurepa si |F| = ℵ2 , y para toda α < ω1 el conjunto es numerable. Fα = {x ∩ α : x ∈ F} El paso siguiente será demostrar que la hipótesis de Kurepa es equivalente a afirmar la existencia de una familia de Kurepa. Pero antes demostramos un lema que ayuda a clarificar esta demostración: 489 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 490 ✐ ✐ 7. Combinatoria infinita Lema 8.18. Existe una familia de Kurepa si y sólo si existe un conjunto T tal que |T | = ω1 y existe una familia F ⊆ Pot(T ) tal que |F| = ω2 y (∀X ⊆ T )(|X| < ω1 ⇒ |FX | < ω1 ), donde FX = {X ∩ A : A ∈ F}. Demostración. La implicación (⇒) es trivial pues la misma familia de Kurepa funciona (recuerde que ω1 es regular). Para la implicación inversa, considere un conjunto T y una familia F con las caracterı́sticas descritas. Sea h : T − → ω1 una biyección; ası́, si F ′ = {h[A]|A ∈ F}, entonces |F ′ | = ω2 . Ahora, dado α < ω1 , observe que |Fα′ | = |{h[A] ∩ α : A ∈ F}| = |{h[A ∩ h−1 (α)] : A ∈ F}| = |{A ∩ h−1 (α) : A ∈ F}| = Fh−1 (α) < ω1 . Por lo tanto, concluimos que F ′ ⊆ Pot(ω1 ) es una familia de Kurepa. Teorema 8.19. Existe un árbol de Kurepa si y sólo si existe una familia de Kurepa. Demostración. ⇒) Sean T un árbol de Kurepa y F ⊆ Pot(T ) el conjunto formado por todas la ω1 -ramas de T . Como |T | = ω1 y |F| = ω2 , para demostrar que existe una familia de Kurepa, según el lema anterior sólo hace falta demostrar que para cualquier ω1 -rama numerable, el conjunto FX también es numerable. Sea, pues, C una ω1 -rama numerable de T . Ahora, como ω1 es regular, debe existir ℵ < ω1 tal que (∀x ∈ X)(Alt(x) < α); así, |FX | ≤ |Tα | < ω1 . ⇐) Sea F una familia de Kurepa. Para cada B ∈ F, construimos χB como la función caracterı́stica de B en α, para ası́ obtener el árbol de Kurepa: T = [ α<ω1 {χB : B ∈ Fα }, donde <T está definido como la contención ⊂ de conjuntos. Ahora sólo falta demostrar que el principio ♦+ implica la existencia de una familia de Kurepa, es decir, la hipótesis de Kurepa. Esta demostración hace uso de nociones que remiten a los conjuntos H(κ) (conjuntos κ-hereditarios) definidos en el capítulo 8, sección 6; el uso de estos conjuntos se centra en 490 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 491 ✐ ✐ Conjuntos y modelos. Curso avanzado el hecho de que para ciertos cardinales κ, dichos conjuntos son modelos de la teorı́a ZF − (véase el Teorema 8.7.17). Teorema 8.20. El principio ♦+ implica la hipótesis de Kurepa. Demostración. Se busca demostrar la existencia de una familia F ⊆ Pot(ω1 ) tal que |F| = ω2 y |F ↾ µ| ≤ ℵ0 (para todo µ < ω1 ). Sea hSα : α < ω1 i una ♦+ -sucesión; definimos una familia {Mα : α < ω1 } de subestructuras elementales (numerables) de H(ω1 ) de la siguiente manera. Para α < ω1 , sea Mα ≺ H(ω1 ) tal que i) Mα sea numerable, y S ii) (α + 1) ∪ ( β≤α Sβ ) ⊆ Mα . La existencia de dicha familia está garantizada por el corolario al lema 9.6.2. Debido al lema 8.18, se puede garantizar que para cada α < ω1 , Mα es modelo de ZF − . Ahora, sea F = {x ⊆ ω1 : (∀α < ω1 )(x ∩ α ∈ Mα )}. Observe que Fα ⊆ Mα , pues si y ∈ Fα , entonces y = x ∩ α con x ∈ F; ası́, x ∩ α ∈ Mµ . Por lo tanto, dado que Mα es numerable, entonces Fα también lo es. En consecuencia, para demostrar que F es una familia de Kurepa, sólo falta demostrar que el cardinal de dicha familia es ℵ2 . A continuación demostramos, por reducción al absurdo, este hecho. Supondremos pues que el cardinal de F es ℵ1 . Observe que ω1 ∈ F; por lo que el conjunto formado por aquellos subconjuntos no acotados de ω1 que pertenecen a F es no vacío, y se puede definir una enumeración hxν |ν < ω1 i (no necesariamente inyectiva) de los subconjuntos no acotados de ω1 que pertenecen a F. Luego, para cada ν < ω1 , sea Bν el conjunto de puntos lı́mite de xν que es un club en ω1 (Lema 4.5). Por consiguiente, la intersección diagonal B′ de la familia {Bν |ν < ω1 } es un club de ω1 (véase el Teorema 4.9), y como el conjunto B′′ formado por los ordinales lı́mites menores que ω1 es también un club de ω1 , podemos concluir que el conjunto: B = B′ ∩ B′′ = {α ∈ ω1 : Lím(α) ∧ (α ∈ \ Bν )} ν<ω es un club de ω1 . Ahora, si se aplica el principio ♦+ al conjunto B, se puede asegurar la existencia de un club C de ω1 tal que (∀α ∈ C)[(B ∩ α ∈ Sα ) ∧ (C ∩ α ∈ Sα )]. 491 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 492 ✐ ✐ 7. Combinatoria infinita Sea D la intersección de B y del conjunto de puntos lı́mite de C, entonces D es un club de ω1 . Consideramos ahora la enumeración monótona hµν |ν < ω1 i del conjunto D y definimos para cada ν < ω1 , el ordinal βν = \ (C \ (αν + 1)). Observe que para toda ν < ω1 se cumple que αν < βν < αν+1 , pues si αν+1 = βν , se tendrı́a que αν = αν+1 , lo cual es falso; por otro lado, es claro que αν < βν . Ası́, como αν+1 ∈ B, entonces αν+1 ∈ Bν , es decir, xν ∩ ℵν+1 es no acotado en αν . Ahora, considere el siguiente conjunto: x = {βν : ν < ω1 } (observe que este conjunto es no acotado en ω1 ). De las observaciones anteriores se sigue que: x ∩ αν+1 = {βξ |ξ < ν + 1} ⊆ βν + 1; por lo tanto, como αν+1 es lı́mite, se tiene que βν + 1 < αν+1 y por lo que el conjunto X ∩ αν+1 es acotado en αν+1 . Por consiguiente, dado que xν ∩ αν+1 es no acotado en αν+1 , se cumple que x 6= xν para toda ν < ω1 . Habremos terminado la demostración si mostramos que x ∈ F, pues estarı́amos contradiciendo la existencia de la sucesión hxν : ν < ω1 i. Bajo este espı́ritu continuamos la demostración, encaminada a probar que x ∈ F. Según la definición de F, se tiene que x ∈ F si x ∩ α ∈ Mα para toda µ ∈ ω1 . Sea µ ∈ ω1 , en caso de que x ∩ α sea finito, es directo el hecho de que x ∩ α ∈ Mα , pues dado que α ⊆ Mα , los axiomas de Par y Unión (en Mα ) garantizan la construcción (en Mα ) de dicho conjunto. Supondremos pues que x ∩ α es infinito y demostraremos que x ∩ β ∈ Mα para cierto β ≤ α que tenga la propiedad de que el conjunto (x ∩ α) \ (x ∩ β) sea finito. Observe que si demostramos lo anterior, entonces se podrá afirmar que x ∩ α ∈ Mα , pues Mα es modelo de ZF − . S S Sea β ≤ α definido por β = {ξ ≤ α : (x ∩ ξ) = ξ}, es decir, β es el mayor punto lı́mite de x ∩ α. Por la definición de β, es claro que x ∩ α difiere de x ∩ β en un número finito de puntos. Por ello, según la observación anterior, sólo falta demostrar que x ∩ β ∈ Mα . Para demostrar esto, primero observe que (como β es un punto lı́mite de x ∩ α) β es un punto lı́mite de x y que x es un subconjunto de C; por lo tanto, β es a su vez un punto lı́mite de C. Pero como C es club de ω1 , se concluye 492 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 493 ✐ ✐ Conjuntos y modelos. Curso avanzado que β ∈ C. En consecuencia, por la elección de C, es cierto que (B ∩ β ∈ Sβ ) ∧ (C ∩ β ∈ Sβ ). Y como β ≤ α, la definición de Mα garantiza que tanto B ∩ β como C ∩ β sean elementos de Mα . Luego, según la definición de β, existe un ordinal λ tal S que β = ν<λ βν ; ası́, se tiene que {µν |ν < λ} = {γ ∈ (B ∩ β) : γ = [ ((C ∩ β) ∩ γ)}, pues γ = µν para ν < λ si y sólo si γ < β, γ ∈ B y γ es un punto lı́mite de C, pero como γ < β, lo anterior es equivalente a decir que γ es un punto lı́mite de C∩β. Ası́, como Mα es modelo de ZF − , el hecho de que (B∩β), (C∩β) ∈ Mα garantiza la existencia del conjunto {αν : ν < λ} en Mα , es decir, {αν : ν < λ} ∈ Mα . Sin embargo, como para ν < λ la definición de βν es equivalente a βν = \ ((C ∩ β) \ (αν + 1)), se concluye (de nuevo haciendo uso del hecho de que Mα es modelo de ZF − ) que x ∩ β = {βν : ν < λ} ∈ Mα . 9. Relaciones flecha Uno de los principios fundamentales de la combinatoria infinita es el siguiente: si tenemos una descomposición de un conjunto infinito en un número finito de partes, alguna de estas partes debe contener un número infinito de elementos. En otras palabras: si A es infinito y f : A − → m es una función de A a un número natural m, entonces f es constante en un subconjunto infinito de A. El teorema de Ramsey es una generalización de este principio. Teorema 9.1 (Ramsey). Sea A un conjunto infinito y f : [A]n − → m. Entonces existe un subconjunto infinito de A f -homogéneo, es decir, un subconjunto infinito B ⊆ A para el que f es constante en [B]n . 493 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 494 ✐ ✐ 7. Combinatoria infinita Demostración. Probamos el teorema por inducción sobre n. Para n = 0 no hay nada que demostrar, pues f es constante sobre [A]n = {∅}. Sea n > 0. Definimos recursivamente una sucesión decreciente A0 ⊃ A1 ⊃ · · · de subconjuntos infinitos de A y una sucesión a0 , a1 , . . . de elementos de A con ai ∈ Aj ⇔ i ≥ j. Comenzamos con A0 = A. Supongamos que ya se construyó Ai . Escogemos un elemento arbitrario ai ∈ Ai . Definimos fi : [Ai \ {ai }]n−1 − → m mediante fi (b) = f ({ai } ∪ b). Como Ai+1 , escogemos un subconjunto infinito fi -homogéneo de Ai \ {ai }. Sea mi el valor que toma fi en [Ai+1 ]n−1 . Entonces, para cada k < m el conjunto B = {ai : mi = k} es f -homogéneo: cada subconjunto de n elementos c de B tiene la forma {ai } ∪ b para alguna b ∈ [Ai+1 ]n−1 . Se tiene f (c) = fi (b) = k. Existe entonces una k < m tal que mi = k para una cantidad infinita de i ∈ ω. B es infinito para esta k. Éste es el primer ejemplo de un teorema del cálculo de particiones, motivo de esta sección. Una familia P = {Pi : i ∈ I} es una partición de [X]ρ (ρ un cardinal) si [ {Pi : i ∈ I} = [X]ρ , Pi ∩ Pk = ∅ para i, k ∈ I, i 6= k. Sea fP : [X]ρ − → I la función (única) f con f −1 (i) = Pi para toda i ∈ I. Llamemos a fP la coloración canónica asociada con P. Recíprocamente, existe una partición canónica de [X]ρ asociada con la coloración f : [X]ρ − → σ. Un conjunto Y es homogéneo para la partición P (así como para la coloración fP asociada con ella) si existe un i0 ∈ I tal que [Y ]ρ ⊆ Pi0 . Definición 9.2. Sean κ, µ, ρ y ν cardinales. Escribimos κ− → (µ)ρν , si para cada función f : [κ]ρ − → ν existe un subconjunto f -homogéneo de κ de cardinalidad µ. Otra forma de expresarlo es: siempre que X sea un conjunto de cardinalidad κ, I un conjunto de cardinalidad ν y P = {Pi : i ∈ I} una partición de [X]ρ , existe Y ⊆ X con |Y | = µ que es homogéneo para P. El teorema de Ramsey se traduce a ω − → (ω)nm para cualesquier números naturales n, m. Si µ < cf (κ) para un cardinal infinito κ, entonces κ − → (κ)1µ , lo que se comprueba fácilmente. Para exponentes mayores, la afirmación no es necesariamente correcta: 494 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 495 ✐ ✐ Conjuntos y modelos. Curso avanzado Proposición 9.3. 2ℵ0 9 (ℵ1 )22 . Demostración. El conjunto de los números reales tiene cardinalidad 2ℵ0 . Sea < el orden natural sobre R y ≺ un buen orden sobre R. Definimos f : [R]2 − → 2, asociando el valor 1 a todo conjunto b de dos elementos si < y ≺ coinciden en b; en otro caso asignamos el valor 0. Si B ⊆ R es f -homogéneo, B es un subconjunto de R, que se puede bien ordenar con < o con <−1 . Tales conjuntos son a lo sumo numerables pues si B = {rα : α < δ} es una enumeración de B, para todo α + 1 < δ existe un racional qα entre rα y rα+1 . Como sólo existe una cantidad numerable de racionales, δ debe ser numerable, por lo que no puede existir un conjunto B ⊆ R que sea f -homogéneo y de cardinalidad ℵ1 . Note que de la demostración de la proposición 9.3 se deduce que 2ℵ0 9 (κ)22 para todo κ ≥ ℵ1 . Pero esto es cierto en general, es decir, si κ 9 (µ)νρ , entonces κ 9 (λ)νρ para toda λ ≥ µ. También existe una versión del teorema de Ramsey para cardinales finitos: Teorema 9.4. Sean m, l, k números naturales. Existe un número natural n tal que n− → (m)kl . Demostración. Suponga que m, l, k ∈ N \ {0} son tales que n 6− → (m)kl para toda n ∈ N. Esto significa que para toda n ∈ N existe una coloración f : [n]k − → l que no tiene un subconjunto homogéneo de tamaño m. Sea k F = {f : ∃ n ∈ N, f ∈ l[n] , 6 ∃ un conjunto homogéneo de tamaño m para f }. Considere el conjunto parcialmente ordenado (F, ⊆), que claramente resulta ser un árbol T en el que Tr son todas las funciones f ∈ F con dominio [k+r−1]k . Nuestra suposición implica que todo nivel del árbol (F, ⊆) no es vacío. Por otra parte, ya que sólo tenemos una cantidad finita de funciones de [r + k − 1]k en l, cada nivel del árbol es finito. El lema de König 8.6 implica que el árbol (F, ⊆) tiene una rama infinita. Sean B una rama infinita de (F, ⊆) y g = ∪B. Se verifica sin dificultad que (a) g es una función de [ω]k en l; (b) g ↾ [n]k ∈ F para toda n ∈ ω. 495 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 496 ✐ ✐ 7. Combinatoria infinita El teorema de Ramsey implica la existencia de un subconjunto infinito A de ω que es homogéneo para g. Sean a0 < · · · < an−1 los primeros m elementos de A, y n = am−1 + 1. Entonces {a0 , . . . , an−1 } es un conjunto homogéneo de tamaño m para g ↾ [n]k , lo que contradice (b) y la definición de F . El teorema de Erdös-Rado, que probaremos en esta sección, muestra que para cada µ, cada ν y cada natural n existe un cardinal κ con κ − → (µ)nν . Para su demostración requerimos algunos antecedentes. Un árbol T se llama λ-ramificado si para cada rama b el conjunto N(b) = {x : x̂ = b} κ de sucesores de b tiene cardinalidad a lo sumo λ. Por ejemplo, λ⌣ es un árbol λramificado. Para un elemento x de T escribimos también N(x) para el conjunto de sucesores inmediatos de x̂ ∪ {x}. Es claro que N(x) = {y ∈ Tα+1 : x < y} si x ∈ Tα . Lema 9.5. Sean κ un cardinal infinito y T un árbol con Alt(T ) ≤ κ. Si T es κ λ-ramificado (para λ > 1), se cumple |T | ≤ λ⌣ . Demostración. Escogemos una inyección fb : N(b) − → λ para cada rama b. Asociamos a cada x ∈ Tα (α < Alt(T )) una función gx : (α + 1) − →λ mediante gx (β) = fT (x↾β) (x ↾ β). Si x 6= y, gx 6= gy : sea β ≤ α mínimo con x ↾ β 6= y ↾ β. Entonces κ T(x↾β) = T(y↾β) y, por lo tanto, gx (β) 6= gy (β). Se sigue que |Tα | ≤ λ|α+1| ≤ λ⌣ κ κ y de aquí que |T | ≤ |Alt(T )| · λ⌣ = λ⌣ . Teorema 9.6. Sea ν ≤ κ. (2κ )+ −→ (µ)νn+1 . Entonces, de κ+ −→ (µ)nν se deduce que Antes de probar el teorema, note que puesto que κ+ −→ (κ+ )1κ , se sigue por inducción y el teorema 9.6 que: Corolario 9.7 (Erdös–Rado). (in (κ))+ −→ (κ+ )n+1 κ , donde los números κ-beth se definen recursivamente por i0 (κ) = κ y in+1 (κ) = 2in (κ) . 496 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 497 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración del teorema 9.6. Sea A un conjunto de cardinalidad (2κ )+ con un buen orden ≺. Sean f : [A]n+1 − → ν y B un subconjunto de A y a un elemento de A \ B. El tipo de a es una función t(a/B) : [B]n − → ν definida mediante t(a/B)(b) = f (b∪{a}). Sea a ∈ A. Definiremos recursivamente una “función” (un término clase) ga : OR − → A, donde gα (a) es el menor elemento de A \ ga [α] que tiene el mismo tipo que a en gα [α]. Dado que gα es inyectiva, la recursión debe detenerse en algún ordinal δa para el que ga (δa ) = a. Por lo tanto, ga está definida en δa + 1. Transformamos A en un árbol, definiendo a < b si gα es un segmento inicial propio de gb . La altura de a es entonces exactamente δa . Si A(a) = A(b) (los segmentos iniciales determinados por a y b, respectivamente), δa = δb y ga coincide con gb en δa . Si a 6= b, a y b deben ser de tipo diferente en ga [δa ]. Mostraremos que Alt(A) es mayor que κ+ : en caso contrario todos los δa serían menores que κ+ y habría a lo sumo νκ ≤ 2κ tipos diferentes sobre ga [δa ]. El árbol sería entonces 2κ -ramificado y del lema 9.5 se + seguiría |A| ≤ (2κ )<κ = 2κ . Pero hemos supuesto |A| = (2κ )+ . Sea a un elemento de altura κ+ . De κ+ −→ (µ)nν se deduce que A(a) tiene un subconjunto de B de cardinalidad µ tal que t(a/B) es una función constante. Sea ε el valor de la función. Si c ∈ [B]n+1 , escribimos c = b ∪ {x} para un subconjunto b de A(x) de n elementos. Ya que a y x tienen el mismo tipo sobre A(x), f (c) = f (b ∪ {x}) = f (b ∪ {a}) = ε. B es entonces f -homogéneo. A continuación presentamos una importante variación del teorema de Erdös-Rado, pero antes requerimos los siguientes preliminares: Definición 9.8. Sean β y κ cardinales. β es κ-inaccesible si γ λ < β siempre que γ < β y λ < κ. Note que si β > 2 y β es κ-inaccesible, κ ≤ β. Así que un cardinal β es inaccesible si y sólo si es κ-inaccesible para toda κ < β. Lema 9.9. (a) Si ω ≤ µ y κ ≤ cf (µ), entonces µ es κ-inaccesible si y sólo si se satisface la siguiente condición: si λ < κ y βi < α para i < λ, entonces Y (*) βi < µ. i<λ κ (b) Si ω ≤ µ, entonces µ+ es κ-inaccesible si y sólo si µ = µ⌣ . 497 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 498 ✐ ✐ 7. Combinatoria infinita Demostración. (a) SeanP µ un cardinal κ-inaccesible, λ < κ y βi < µ para i < λ. Hacemos β = i<λ βi y del hecho de que λ < κ ≤ cf (µ) concluimos β < µ. Así, Y i<λ βi ≤ βλ < µ. Para el recíproco, aplicamos (*) con βi = β para i < λ. (b) Si µ+ es κ-inaccesible y λ < κ, entonces µλ < µ+ ; así, µλ = µ y tenemos κ κ P µ⌣ = λ<κ µλ ≤ µ · κ = µ. Si µ = µ⌣ , λ < µ y β < µ+ , entonces κ βλ ≤ µλ ≤ µ⌣ = µ. Ahora presentamos otra versión del teorema de Erdös-Rado. Teorema 9.10. Sean µ un cardinal regular infinito y κ < µ. Las siguientes afirmaciones son equivalentes: (a) µ es κ-inaccesible. (b) Para toda función f : µ − → [µ]<κ existen conjuntos J ∈ [µ]<κ y A ∈ Pot(µ) tales que |A| = µ. f (ξ) ∩ f (ξ ′ ) = f (ξ ′ ) = J para ξ < ξ ′ < α, ξ, ξ ′ ∈ A. Demostración. (a) ⇒ (b). Como µ es regular, existe un ordinal ρ < κ tal que |{ξ < µ : f (ξ) tiene tipo ordinal ρ}| = µ. Sin pérdida de generalidad, podemos suponer que f (ξ) tiene tipo ordinal ρ para toda ξ < µ. Existe un único isomorfismo de orden eξ : ρ − → f (ξ) para ξ < µ. Hacemos ηi = sup{eξ (i) : ξ < µ} para i < ρ η = sup{ηi : i < ρ}. Es claro que ηi ≤ ηj para i < j < ρ. Hay dos posibilidades que debemos considerar. Caso 1. η < µ. Así, f (ξ) ⊆ η + 1 para ξ < µ y por ello f :µ− → [η + 1]|ρ| . 498 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 499 ✐ ✐ Conjuntos y modelos. Curso avanzado Como |η + 1| < µ, |ρ| < κ y µ es inaccesible, tenemos |[η + 1]||ρ| = |η + 1||ρ| < µ. Como µ es un cardinal regular, sabemos que existe un conjunto J ∈ [η + 1]|ρ| y A ∈ Pot(µ) tal que |A| = µ |{ξ < µ : f (ξ) = J}| = µ. Entonces se satisfacen los requerimientos del teorema. Caso 2. η = µ. Como κ < µ = cf (µ), existe i < ρ tal que ηi = µ. Hacemos ī = mín{i < ρ : ηi = µ}. Así que sup{eξ (ī) : ξ < µ} = µ y existe una función inyectiva φ : µ − →µ que preserva el orden tal que eφ(ξ) (ī) < eφ(ξ ′ ) (ī) para ξ < ξ ′ < µ. sup{eφ(ξ) (ī) : ξ < µ} = µ. Sin pérdida de generalidad y sin cambiar ī podemos suponer que φ es la identidad en µ. En consecuencia, eξ (ī) < eξ ′ (ī) para ξ < ξ ′ < µ. (*) Definimos η̄ = sup{ηi : i < ī} (por lo que η̄ = 0 si ī = 0); como ī < ρ < µ y ηi < µ para i < ī y µ es regular, se deduce que η̄ < µ. Afirmamos que existe J ⊆ η̄ + 1 y B ∈ Pot(µ) tal que |B| = µ, f (ξ) ∩ (η̄ + 1) = J para ξ ∈ B. + En efecto, la función ξ 7→ f (ξ) ∩ (η̄ + 1) es una función de µ en [η̄ + 1]|ρ| . + Además, |[η̄ + 1]|ρ| | < µ ya que |η̄ + 1| < µ, |ρ| < κ y µ es κ-inaccesible. Como µ es regular, existe J ⊆ η̄ + 1 tal que |{ξ < µ : f (ξ) ∩ (η̄ + 1) = J}| = µ, lo que demuestra la afirmación. Sin pérdida de generalidad y sin cambiar ī (por [*]), suponemos que f (ξ) ∩ (η̄ + 1) = J para ξ < µ. (**) 499 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 500 ✐ ✐ 7. Combinatoria infinita Ahora definimos un conjunto de ordinales {ψ(ζ) : ζ < µ} menores que µ de tal forma que (i) ψ(0) = S 0 (ii) si ξ ∈ ζ ′ <ζ f (ψ(ζ ′ )), entonces ξ < eψ(ζ) (ī) para ζ < µ. Procedemos recursivamente. Hacemos ψ(0) = 0; si 0 < ζ < µ y si ψ(ζ) está definido para ζ ′ < ζ, entonces note que | [ ζ ′ <ζ f (ψ(ζ ′ ))| ≤ X ζ ′ <ζ |f (ψ(ζ))| ≤ |ρ| · |ζ| < µ, y puesto que µ es regular y sup{eξ (ī) : ξ < µ} = µ, existe un ordinal ψ(ζ) < µ tal que [ f (ψ(ζ ′ ))} < eψ(ζ) (ī). sup{ξ < µ : ξ ∈ ζ ′ <ζ Esto completa la definición recursiva. Hacemos A = {ψ(ζ) : ζ < µ}. Observe que si ξ ∈ f (ψ(ζ)) y η̄ < ξ, entonces eψ(ζ) (i) < ξ para i < ī, y de aquí eψ(ζ) (ī) ≤ ξ para ζ < µ; es decir, eψ(ζ) (ī) es el menor elemento de f (ψ(ζ)) en µ \ (η̄ + 1). Se sigue de (ii) que f (ψ(ζ ′ )) ∩ f (ψ(ζ)) ∩ (µ \ (η̄ + 1)) = ∅, para ζ ′ < ζ < µ, que junto con (**) implican (b). (b) ⇒ (a). Supongamos que existen cardinales β < µ y λ < κ con µ ≤ βλ . + Sea L ⊆ βλ tal que |L| = µ; note que L ⊆ [λ × β]λ . Sea + f :µ− → [λ × β]λ ⊆ [µ]<κ , una función inyectiva con la propiedad de que f [µ] = L. De la condición (a) deducimos que existen A ∈ Pot(µ) y J ∈ [µ]<κ con |A| = µ f (ξ) ∩ f (ξ ′ ) = J, para ξ < ξ ′ < µ, ξ, ξ ′ ∈ A. Como |A| > β, claramente existen ξ, ξ ′ ∈ A con ξ < ξ ′ < µ y φ(i) < β para i < λ tales que f (ξ)(i) = f (ξ ′ )(i). Entonces hi, φ(i)i ∈ f (ξ) ∩ f (ξ ′ ) = J para toda i < λ y ξ, ξ ′ ∈ A con ξ < ξ ′ < µ, de donde obtenemos A = {∅}, una contradicción. 500 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 501 ✐ ✐ Conjuntos y modelos. Curso avanzado Una interpretación de la condición (b) del teorema es: para toda familia {Aξ : ξ < µ} de conjuntos tales que |Aξ | < κ para ξ < µ, existen un conjunto J y un subconjunto A de µ tal que |A| = µ, Aξ ∩ Aξ ′ = J para ξ < ξ ′ < µ, ξ, ξ ′ ∈ A. 9.1. Aplicaciones a la topología. Una familia celular en un espacio topológico X es una familia de abiertos no vacíos mutuamente ajenos de X. El número de Souslin de X, S(X) es el menor cardinal µ tal que no existe una familia celular en X con µ elementos. No confundir con c(X), que denota el cardinal µ más pequeño tal que toda familia celular en X tiene cardinalidad no mayor que µ. Por lo tanto, c(X) < S(X). Por otro lado d(X), la densidad de X, denota la cardinalidad del conjunto denso más pequeño de un espacio X. Una sencilla aplicación del lema de Zorn propicia que toda familia celular esté contenida en una familia celular maximal. Es claro que si Y es denso en X, S(X) = S(Y ). Lema 9.11. (a) S(X) ≤ d(X)+ . (b) Si X es un espacio infinito, ℵ1 ≤ S(X). Demostración. (a) Sea D un subconjunto denso en X tal que |D| = d(X) y sea C una familia celular en X. Para toda C ∈ C, sea pC ∈ C ∩ D. La función C 7→ pc es inyectiva de C en D. Así que |C| ≤ d(X) para toda familia celular C en X, por lo que S(X) ≤ d(X)+ . (b) Notemos que si Y es un espacio infinito, existe un subconjunto abierto U no vacío de Y tal que |Y \ U| ≥ ℵ0 ; U es la cerradura de U. Recursivamente definimos una sucesión {Un : n < ω} tal que Un es S S un subconjunto abierto no vacío de X \ k<n U k y |X \ k≤n U k | ≥ ℵ0 para n ∈ ω. Entonces {Un : n < ω} es una familia celular en X y ℵ0 ≤ S(X). 501 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 502 ✐ ✐ 7. Combinatoria infinita Si el número de Souslin de un espacio X es a lo sumo ℵ1 (de modo equivalente, si c(X) = ℵ0 ), decimos que X satisface la condición de cadena numerable, que usualmente se denota ccc. Recordemos la definición de la topología κ-producto en un producto de espacios. Definición 9.12. Sean {Xi : i ∈ I} una familia de espacios, X el conjunto Q X y κ un cardinal infinito. La topología κ-producto en X es la topología i i∈I que tiene como base (canónica) la familia de todos los subconjuntos U de X de la forma U= Y Ui , i∈I Ui es abierto en Xi para i ∈ I, |R(U)| < κ, donde R(U) = {i ∈ I : Ui 6= Xi }. Con espacio producto con la κ-topología. Q i∈I Xi  (κ) o X(κ) denotamos al Lema 9.13. Sean κ ≥ ℵ0 , {Xi : i ∈ I} una familia de espacios, U y V subconjuntos abiertos básicos de X(κ) y J un conjunto tal que R(U) ∩ R(V ) ⊆ J ⊆ I. Las siguientes afirmaciones son equivalentes: (a) U ∩ V = ∅; (b) existe i ∈ J tal que Ui ∩ Vi = ∅; (c) J = 6 Q∅ ∧ pJ (U)Q∩ pJ (V ) = ∅, donde pJ es la proyección, es decir, → j∈J Xj . pJ : i∈I Xi − Demostración. (a) ⇒ (b). Suponga que (b) es falso y sea X un elemento de X(κ) tal que xi ∈ Ui ∩ Vi si i ∈ J, xi ∈ Ui si i ∈ R(U) \ J, xi ∈ Vi si i ∈ R(V ) \ J. Entonces x = {xi : i ∈ I} ∈ U ∩ V y (a) es falso. (b) ⇒ (c). Es obvio. (c) ⇒ (a). Si x ∈ U ∩ V y J 6= ∅ entonces xJ ∈ pJ [U] ∩ pJ [V ]. 502 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 503 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 9.14. Supongamos que ℵ0 ≤ κ < µ con µ como un cardinal regular y κ-inaccesible, y sea {Xi : i ∈ I} una familia de espacios no vacíos. Entonces, Q S( i∈I Xi ) ≤ µ si y sólo si S((XJ )(κ) ) ≤ µ para J ∈ [I]<κ . Demostración. ( ⇒ ). Es claro, pues si para algún J ∈ [I]<κ la familia C es una familia celular en (XJ )(κ) , entonces {p−1 J (U) : U ∈ C} es una familia celular en (XI )(κ) . Para el recíproco, suponga que {U ξ : ξ < µ} es una familia celular de conjuntos básicos en (XI )(κ) . De acuerdo con el teorema de Erdös-Rado 9.10, aplicándolo a la familia {R(U ξ ) : ξ < µ}, existe un conjunto J y un subconjunto A de µ con |A| = µ tal que R(U ξ ) ∩ R(U ξ ) = J si ξ, ξ ′ son elementos distintos de A. El lema 9.13 implica que J 6= ∅ y que {πJ [U ξ ] : ξ ∈ A} es una familia celular en (XJ )(κ) . Teorema 9.15. Si ℵ0 ≤ κ < µ y µ es regular, entonces las siguientes afirmaciones son equivalentes: (a) µ es κ-inaccesible. (b) Si {Xi : i ∈ I} es una familia de espacios con d(Xi ) < µ para i ∈ I, entonces S((X)(κ) ) ≤ µ. Demostración. (a) ⇒ (b). Sea J ⊆ IQcon |J| < κ y para i ∈ J sea Di denso en Xi con |Di | < µ. Hacemos D = i∈J Di y notamos que D es denso en (XJ )(κ) y que |D| < µ por (a). Así S((XJ )(κ) ) ≤ µ por el lema 9.11(a), por lo que el teorema 9.14 implica (b). (b) ⇒ (a). Sea β < µ y λ < κ. Puesto que λ < κ, se sigue que el espacio (βλ )(κ) es discreto. Para cualquier espacio discreto X se cumple que S(X) = |X|+ ; por consiguiente, de la condición (b) se deduce que |βλ |+ ≤ µ, es decir βλ < µ. Teorema 9.16. Si µ ≥ ℵ0 y {Xi : i ∈ I} es una familia de espacios tales que S(Xi ) ≤ µ+ para i ∈ I, entonces S((X)(µ+ ) ) ≤ (2µ )+ . Demostración. Supongamos que existe una familia celular {U ξ : ξ < de subconjuntos básicos de (X)(µ+ ) ≤ (2µ )+ y usemos el lema 9.13. (2µ )+ } 503 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 504 ✐ ✐ 7. Combinatoria infinita ′ ξ ξ Sea i(ξ, ξ ′ ) ∈ I tal que para {ξ, ξ ′ } ∈ [(2µ )+ ]2 , Ui(ξ,ξ ′ ) ∩Ui(ξ,ξ ′ ) = ∅. Definamos I(ξ) = {i(ξ, ξ ′ ) : ξ ′ < (2µ )+ , ξ ′ 6= ξ}, para ξ < (2µ )+ . Como ′ i(ξ, ξ ′ ) ∈ R(U ξ ) ∩ R(U ξ ) para {ξ, ξ ′ } ∈ [(2µ )+ ]2 , tenemos |I(ξ)| ≤ |R(U ξ )| ≤ µ para ξ < (2µ )+ . Sea {iξ,η : η < µ} un buen orden de I(ξ) para ξ < (2µ )+ y hagamos Pη,η′ = {{ξ, ξ ′ } ∈ [(2µ )+ ]2 : ξ < ξ ′ , iξ,η = iξ ′ ,η′ } para (η, η′ ) ∈ µ × µ. Dado que  (2µ )+ 2 [ = Pη,η′ , (η,η′ )∈µ×µ podemos concluir del caso particular (2µ )+ − → (µ+ )2µ del teorema de ErdösRado 9.10, que existe un subconjunto A de (2µ )+ y (η̄, η̄′ ) ∈ µ × µ tal que |A| = µ+ [A]2 ⊆ Pη̄,η̄′ . Así que existe ī ∈ I tal que si {ξ, ξ ′ } ∈ [A]2 y ξ < ξ ′ , entonces I(ξ, ξ ′ ) = iξ,η̄ = iξ ′ ,η̄′ = ī, y, por lo tanto, ′ Uīξ ∩ Uīξ = ∅. En consecuencia, µ+ = |A| < S(Xī ), una contradicción que completa la prueba. 10. Cardinales débilmente compactos Como se recordará, los cardinales regulares, límite y no numerables se conocen como débilmente inaccesibles, y aquellos cardinales κ que además cumplen con 2µ < κ para todo µ < κ son cardinales (fuertemente) inaccesibles. Mediante la relación flecha, podemos introducir un nuevo tipo de cardinales. 504 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 505 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 10.1. Un cardinal no numerable κ es débilmente compacto si κ −→ (κ)22 . Lema 10.2. Los cardinales débilmente compactos son (fuertemente) inaccesibles. Demostración. Sea κ un cardinal débilmente compacto. Supongamos que κ es la unión ajena de cf (κ) conjuntos Aα (α < cf (κ)), cada uno con cardinalidad menor que κ. Definimos f : [κ]2 − → 2 mediante f ({β, γ}) = 0 si β y γ están en el mismo Aα , y f ({β, γ}) = 1 en otro caso. Sea B homogéneo de cardinalidad κ. Como B no puede estar contenido en uno de los conjuntos Aα , los elementos de B pertenecen a distintos Aα . Por lo tanto, κ = |B| ≤ cf (κ), lo que demuestra la regularidad. Si κ no es fuertemente inaccesible, existe µ < κ con 2µ ≥ κ. Escogemos µ como el mínimo con esta propiedad y tenemos 2ν < κ para toda ν < µ. Ya que µ κ es regular, existe λ < κ con 2ν ≤ λ para toda ν < µ, así que 2⌣ ≤ λ. En el lema 10.3 construiremos un conjunto de cardinalidad 2µ linealmente ordenado que tiene un subconjunto denso de cardinalidad λ. Con una demostración → (λ+ )22 . De esto se análoga a la de la proposición 9.3 se muestra que 2µ 6− 2 sigue que κ 6− → (κ)2 . Lema 10.3. Para todo cardinal µ infinito existe un conjunto linealmente µ ordenado de cardinalidad 2µ con un subconjunto denso de cardinalidad 2⌣ . µ+ Demostración. Consideremos el árbol T = 2 ⌣ . Introducimos en T un orden lineal mediante f ≤ g ⇔ (f ⊆ g ∨ (f (α) < g(α) ∧ f ↾ α = g ↾ α, para alguna α ∈ dom(f ) ∩ dom(g))). µ+ Sean f < g en 2 ⌣ y α < µ maximal con f ↾ α = g ↾ α = h. Entonces µ h∪{(α, 1)} está entre f y g. Por lo tanto, 2⌣ es denso en T . T tiene cardinalidad 2µ . Teorema 10.4. Para un cardinal no numerable κ las siguientes condiciones son equivalentes: 1. κ es débilmente compacto. 505 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 506 ✐ ✐ 7. Combinatoria infinita 2. κ −→ (κ)nν para todo n ∈ ω y ν < κ. 3. κ es fuertemente inaccesible y no existe un κ-árbol de Aronszajn. Se dice que un cardinal κ para el que no exista un κ-árbol de Aronszajn tiene la propiedad del árbol. Demostración. (2) ⇒ (1) es evidente. (1) ⇒ (3). Sea (T, <) un árbol de altura κ cuyos niveles tienen cardinalidad menor que κ. Escogemos para cada rama b un orden lineal ≺′ del conjunto de sucesores N(b). Entonces podemos ordenar linealmente T como en la demostración del lema 10.3, mediante x ≺ y ⇔ ((x < y) ∨ (x ↾ α ≺′ y ↾ α ∧ T(x↾α) = T(y↾α) para algún α < mín{h(x), h(y)})). Este orden lineal tiene la siguiente propiedad: para cualesquier x, y ∈ Tα , x < x′ , y < y ′ , x ≺ y ⇒ x′ ≺ y ′ . Como κ es débilmente compacto, T tiene un subconjunto bien ordenado por ≺ o por ≺−1 de cardinalidad κ. Ambos casos son simétricos. Supongamos que hxβ : β < κi es una sucesión propia ≺-creciente. Mantengamos un α < κ fijo. Ya que κ es regular (10.2), existen menos que κ elementos xβ con altura a lo sumo α y, por lo tanto, para β suficientemente grande la altura de xβ es mayor que α. Por las propiedades especiales de ≺, la sucesión xβ ↾ α es monótona creciente para β suficientemente grande. Otra vez, de la regularidad de κ podemos concluir que la sucesión de los xβ ↾ α es finalmente constante. Sea yα ∈ Tα este valor constante. El conjunto de los yα (α < κ) es una rama de longitud κ. (3) ⇒ (2). Probaremos que κ −→ (κ)nν para toda n ∈ ω y ν < κ por inducción sobre n. Claramente, κ −→ (κ)1ν es válido para todo cardinal regular. La demostración de la etapa inductiva de n a n + 1 se sigue de la demostración del teorema 9.6: sean A un conjunto de cardinalidad κ, bien ordenado por ≺. Sea f : [A]n+1 − → ν dada, B un subconjunto de A y a un elemento de A\B. El tipo t(a/B) de a sobre B se define como en la demostración mencionada. Para cada a ∈ A, definimos ga : (δa + 1) − → A recursivamente: 1. ga (α) es el menor elemento de A \ ga [α] con el mismo tipo sobre ga [α] que a. 2. ga (δa ) = a. 506 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 507 ✐ ✐ Conjuntos y modelos. Curso avanzado Mediante a ≤ b ⇔ ga ⊆ gb se obtiene un orden sobre A que lo convierte en un árbol con Alt(a) = δa . Afirmamos que A tiene una rama b′ de longitud κ: si Alt(A) > κ, hacemos b′ = A(a) para un elemento a de altura κ. Supongamos entonces que Alt(A) ≤ κ y fijemos α < κ. Entonces existe para toda α con Alt(a) < α a lo sumo máx{ω, ν|δa | } (≤ máx{ω, ν|α| }) tipos sobre ga [δa ] (máx{ω, ν|δa | } ≤ máx{ω, ν|α| }). Del lema 9.5 se sigue que |Aα | ≤ máx{ω, ν|α| } < κ. Debemos tener entonces Alt(A) = κ, y, como no existe un κ-árbol de Aronszajn, debe existir una rama b′ de longitud κ. De κ −→ (κ)nν se sigue que b′ tiene un subconjunto b de cardinalidad κ, de tal forma que t(a/b) es una función constante. Entonces b es f -homogéneo. Note que en la demostración de (3) ⇒ (2) no utilizamos la regularidad de κ (véase el Ejer. 26). El siguiente teorema muestra que debajo de cada cardinal débilmente compacto existe una cantidad cofinal de cardinales fuertemente inaccesibles. Recuerde que un cardinal κ límite es un límite fuerte si 2µ < κ para todo µ < κ. Teorema 10.5. Todo cardinal κ débilmente compacto es un cardinal Mahlo. Es decir, el conjunto de todos los cardinales fuertemente inaccesibles menores que κ es estacionario en κ. Demostración. Sea κ fuertemente inaccesible y supongamos que el conjunto de cardinales fuertemente inaccesibles menores que κ no es estacionario. Entonces, dado que el conjunto de todos los cardinales límites fuertes es un club en κ, el conjunto de los cardinales regulares menores que κ no es estacionario. Así que existe un club C de cardinales singulares (no numerables) en κ. Como κ es regular, C tiene tipo ordinal κ. Sea T el conjunto de todas las funciones definidas en segmentos iniciales propios de C. Mediante inclusión podemos ordenar T y convertirlo en un árbol. Demostraremos que T es un κ-árbol de Aronszajn. Tα consiste en todas las funciones de T con dominio µ ∩ C, donde µ es el α-ésimo elemento de T . Tenemos entonces |Tα | ≤ µµ < κ. Una rama de longitud κ propiciaría una función inyectiva y regresiva sobre C. Pero esto es imposible de acuerdo con el teorema de Fodor (κ es regular). 507 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 508 ✐ ✐ 7. Combinatoria infinita Para mostrar que T tiene altura κ, debemos probar que para cada µ ∈ C existe una función regresiva inyectiva fµ : µ ∩ C − → µ. Demostraremos esto por inducción sobre µ. Si µ ∩ C tiene un máximo ν, reemplazamos fν por fν′ (β) = fν (β) + 1. La función fν′ sigue siendo regresiva, pero nunca toma el valor cero. La función fµ = fν′ ∪ {(ν, 0)} es la función buscada, de lo contrario µ ∩ C sería un club en µ y existiría una función normal α 7→ κα de λ = cf (µ) a µ ∩ C cuya imagen sería cofinal en µ. Supongamos que λ < κ0 y utilicemos la abreviación gα = fκα . Para ν ∈ µ ∩ C definimos fµ (ν) =    αα + gα+1 (ν), ω , g0 (ν)   α + 1, si κα < ν < κα+1 si ν < κ0 si ν = κα . Entonces fµ es regresiva e inyectiva. Hemos obtenido resultados del tipo κ − → (λ)ρσ para λ arbitrariamente grande. La pregunta natural es si ρ puede ser infinito. La respuesta es no: Teorema 10.6. Para cada cardinal infinito κ, κ 9 (ℵ0 )ℵ2 0 . Demostración. Sea ≺ un buen orden en [κ]ℵ0 . Definamos una función f : [κ]ℵ0 − → 2 mediante f (X) = 0 ⇔ ∀ Y ∈ [X]ℵ0 , X ≺ Y. Mostraremos que f no tiene un conjunto homogéneo. Suponga que X es un conjunto infinito homogéneo para f . Sea X∗ el elemento ≺ -mínimo de [X]ℵ0 . Entonces f (X∗ ) = 0, y la homogeneidad de X implica que f (Y ) = 0 para todo Y ∈ [X]ℵ0 . Considere una sucesión hYi : i < ωi de conjuntos numerables de X tales que Yi es un subconjunto propio de Yi+1 para cada i < ω. Como f (Yi ) = 0, la elección de f implica que Yi+1 ≺ Yi para todo i < ω. Por lo tanto, hYi : i < ωi es una sucesión estrictamente decreciente en ([κ]ℵ0 , ≺ ), lo que contradice que este conjunto esté bien ordenado. En vista de que no obtuvimos nada con superíndices infinitos, trataremos de averiguar qué podemos lograr con superíndices de la forma < ω. es la Definición 10.7. Sean κ, λ, σ cardinales. El símbolo κ − → (λ)<ω σ afirmación: siempre que {fn : n ∈ ω \ {0}} es una familia de funciones 508 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 509 ✐ ✐ Conjuntos y modelos. Curso avanzado tales que fn : [κ]n − → σ, existe un conjunto A ⊆ κ de cardinalidad λ que es simultáneamente homogéneo para todas las fn . Por la exigencia de “simultaneidad”, la relación κ − → (λ)<ω σ es mucho más n fuerte que la afirmación ∀ n ∈ ω \ {0} (κ − → (λ)σ ). Sea λ un cardinal infinito. El menor κ tal que κ − → (λ)<ω 2 se conoce co<ω mo cardinal Erdös, y se denota κ(λ). Si κ − → (κ)2 , entonces κ se conoce como cardinal Ramsey. Se puede demostrar [Kan94] que κ(ω) (si existe) es mayor que el primer cardinal débilmente compacto, y que λ < µ implica κ(λ) < κ(µ), por lo que el primer cardinal Ramsey es mayor que cualquier miembro de la sucesión κ(ω), κ(ω1 ), . . . , κ(ωω ), . . . . Si P = {Pi : i < σ} es una partición del conjunto [X]n , decimos que un conjunto A ⊆ X es homogéneo de color i, o i-homogéneo si [A]n ⊆ Pi , es decir, si la coloración inducida toma el valor i para todo a ∈ [A]n . Requerimos la siguiente notación: Definición 10.8. Sean n ∈ (ω \ {0}), σ ∈ OR, κ, λi cardinales para i < σ. El símbolo κ − → (λi )ni<σ significa: para toda partición P = {Pi : i < σ} de [κ]n existe un i < σ y un conjunto homogéneo A de color i y cardinalidad λi . Hemos visto que ℵ1 6− → (ℵ1 )22 . Del teorema de Ramsey se deduce que toda partición {P0 , P1 } de [ℵ1 ]2 tiene un conjunto homogéneo. Sin embargo, ¿puede ocurrir que no exista un conjunto homogéneo no numerable de color 1 ni un conjunto homogéneo de color 0? Con nuestra nueva simbología, el problema es: ¿es cierto que ℵ1 6− → (ω1 , ω)2 ? El siguiente teorema da respuesta a esta pregunta, pero no sólo por esto es útil. Es uno de los teoremas del cálculo de particiones que más trascendencia ha tenido en la topología general (véase p. ej. [TVHR97]). Teorema 10.9 (Erdös-Dushnik-Miller). Sea κ un cardinal infinito. Entonces κ− → (κ, ℵ0 )2 . Demostración. Sean κ un cardinal infinito y P = {P0 , P1 } una partición de κ. Para α ∈ κ definimos B(α) = {β < κ : {α, β} ∈ P1 }. Afirmación 1. Si para todo A ∈ [κ]κ existe α ∈ A tal que |B(α) ∩ A| = κ, entonces existe un conjunto homogéneo para P de color 1. 509 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 510 ✐ ✐ 7. Combinatoria infinita Demostración de la afirmación 1. Sea F : [κ]κ − → κ una función tal que |B(F (A)) ∩ A| = κ para cada A ∈ dom(F ). Definimos recursivamente C0 = κ; Cn+1 = {α ∈ Cn : F (Cn ) < α, {F (Cn ), α} ∈ P1 }. El conjunto {F (Cn ) : n ∈ ω} es infinito y homogéneo de color 1. ◭ Supongamos que no hay un conjunto homogéneo de color 1, y encontraremos que debe existir un conjunto homogéneo de color 0 y tamaño κ. La afirmación 1 nos permite encontrar un A ∈ [κ]κ tal que |B(α) ∩ A| < κ para toda α ∈ A. Fijemos tal A para el resto de la demostración. Caso 1. κ es regular. Es fácil verificar que existe una sucesión estrictamente S creciente hγα : α < κi de elementos de A tales que γα > sup β<α B(γβ ) para toda α < κ, y el resultado se obtiene inmediatamente. Caso 2. κ es singular. Sean λ = cf (κ) y hκξ : ξ < λi una sucesión creciente cofinal en κ. Trataremos de reducir este caso al anterior. Escogemos la sucesión mencionada de tal forma que cada κξ es regular y κ0 > λ. Sea {Xξ : ξ < λ} una partición de A tal que |Xξ | = κξ para toda ξ < λ. De acuerdo con el caso 1, para cada ξ podemos elegir Cξ ∈ [Xξ ]κξ que sea homogéneo de color 0 para P. S Sea C = ξ<λ Cξ . Éste es un conjunto de tamaño κ, y C ∩ Xξ es 0homogéneo para cada ξ. Más aún, |B(α) ∩ C| < κ para todo α ∈ C. Sin embargo, los conjuntos B(α) pueden ser realmente extraños; en particular, podría ocurrir que B(α) ∩ Cξ 6= ∅ para toda ξ 6= α. Lo único que sabemos es que para ξ suficientemente grande, el conjunto B(α) ∩ Cξ tendrá un tamaño menor que el de Cξ . Por desgracia, la condición “suficientemente grande” puede diferir para distintas α, incluso para α del mismo Cξ . Para ξ, η ∈ λ definimos S Cξ,η = {α ∈ Cξ : |B(α) ∩ C| < κη }. Note que Cξ = η<λ Cξ,η . Como κξ es regular y mayor que λ, existe algún δ(ξ) con |Cξ,δ(ξ) | = κξ . Más aún, existe un conjunto L ∈ [λ]λ tal que ∀ ξ, η ∈ L(ξ < η ⇒ δ(ξ) ≤ η). Observe que el conjunto mente E= [ η∈L S (Cη,δ(η) \ ξ∈C [ Cξ,δ(ξ) tiene cardinalidad κ. Definimos final- {B(α) : ∃ ξ < η(ξ ∈ L ∧ α ∈ Cξ,δ(ξ) )}). 510 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 511 ✐ ✐ Conjuntos y modelos. Curso avanzado Es fácil demostrar que E tiene cardinalidad κ y es 0-homogéneo para P. 11. Aplicaciones al álgebra A continuación presentamos varias aplicaciones de los principios combinatorios recién introducidos al álgebra. El lector puede consultar alguna de las siguientes referencias para revisar los conceptos involucrados: [Pre88], [JenLen89], [Wis91], [Ka82] y [EkMe90]. Para nuestras aplicaciones requerimos una serie de definiciones previas. Definición 11.1. Sea κ un cardinal infinito. Un grupo G es κ-separable si todo subconjunto de G de cardinalidad < κ está contenido en un sumando directo libre de G. Un grupo ℵ0 -separable se conoce en ocasiones como localmente libre o simplemente separable. Un grupo es hereditariamente separable si todos sus subgrupos son separables (él incluido). Un grupo G es κ-libre si todo subgrupo de G de cardinalidad < κ es libre. No podemos extender la definición de grupo κ-libre automáticamente a módulos, pues encontramos dos dificultades. Primero, κ puede ser más pequeño que la cardinalidad del anillo R, por lo que puede no existir ningún submódulo distinto de cero de cardinalidad menor que κ; esto se puede remediar fácilmente considerando el tamaño de los conjuntos generadores de submódulos, en lugar del tamaño de los submódulos mismos. El segundo problema es más serio: puede ocurrir que incluso un módulo libre no sea κ-libre si requerimos que todo submódulo de tamaño menor que κ sea libre. Por ello recurrimos a las siguientes definiciones. Decimos que un submódulo N de M es <κ -generado (respectivamente ≤κ -generado) si está generado por algún X ⊆ M (es decir, N = hXi) de cardinalidad < κ (respectivamente ≤ κ). Definición 11.2. Sea κ es un cardinal regular no numerable. Diremos que un módulo M es κ-libre si existe un subconjunto C ⊆ Pot(M) que satisface: (1) Todo elemento de C es un submódulo libre de M <κ -generado. (2) Todo subconjunto de M de cardinalidad menor que κ está contenido en un elemento de C. (3) C es cerrado respecto a uniones de cadenas ⊆-bien ordenadas de longitud menor que κ. 511 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 512 ✐ ✐ 7. Combinatoria infinita Note que se requiere la regularidad de κ para que la definición sea aceptable: si κ fuera singular, podríamos tener un submódulo que no fuera <κ -generado, pero sí la unión de una cadena de longitud menor que κ de módulos <κ generados. Si λ es singular, decimos que el módulo M es λ-libre si M es κ-libre para todo cardinal κ < λ regular. Definición 11.3. Un R-módulo M es fuertemente κ-libre si existe un conjunto M de submódulos libres de M <κ -generados que contienen a {0} y tales que: para todo subconjunto S de M de cardinalidad menor que κ y cualquier N ∈ M, existe N ′ ∈ M tal que N ∪ S ⊆ N ′ y N ′ /N es libre. Dado un grupo libre de torsión M y un subgrupo N de M, sea N∗ = {a ∈ M : ra ∈ N para algún r 6= 0 ∈ Z}; N∗ es la cerradura pura de N, que es el subgrupo más pequeño puro de M que contiene a N. Si S es un subconjunto de M, hSi∗ es la cerradura pura de hSi, el subgrupo generado por S; en ocasiones se le refiere como la cerradura pura de S. El siguiente criterio de Pontryagin es de gran utilidad. Teorema 11.4 (Criterio de Pontryagin). Para todo grupo M, las siguientes afirmaciones son equivalentes: (a) M es ℵ1 -libre. (b) M es libre de torsión y todo subconjunto finito de M está contenido en un subgrupo finito-generado de M. (c) Todo subconjunto finito de M está contenido en un subgrupo puro y libre de M. Demostración. (a) ⇒ (b). M es libre de torsión, pues en caso contrario M contendría un grupo finito de torsión y no podría ser ℵ1 -libre. Sea S un subconjunto de M. Si hSi∗ no es finito generado, entonces existe un subgrupo N de hSi∗ que contiene a S, generado por un subconjunto numerable y que no es finito generado. En tal caso N no es libre, ya que tiene rango finito pero no es finito generado. Esto contradice (a). (b) ⇒ (c). Esto es obvio, en vista del teorema fundamental de los grupos abelianos finito generados que afirma que todo grupo sin torsión finito generado es libre. (c) ⇒ (d). Si N es un subgrupo de M de rango finito y S es un subconjunto máximo independiente de N, entonces N está contenido en todo subgrupo puro que contenga a S, y por (c) en un subgrupo libre, por lo que N es libre. 512 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 513 ✐ ✐ Conjuntos y modelos. Curso avanzado (d) ⇒ (a). Dado un subgrupo A de M generado por un subconjunto numerable, debemos mostrar que A es libre. Sea {an : n ∈ ω} un conjunto de generadores de A, y para cada n sea NS n = h{am : m < n}i∗ . Entonces S A ⊆ n∈ω Nn , por lo que basta probar que n∈ω Nn es libre. Pero por (d) cada Nn es libre y por lo tanto, finito generado; entonces Nn+1 /Nn es finito generado. Nn+1 /N no tiene torsión pues Nn es puro en M, y por lo tanto es libre. Se Sn sigue que n∈ω Nn es libre: cada Nn+1 /Nn es libre, así que podemos construir, paraScada n, una base Bn de M de tal suerte que Bn ⊆ Bn+1 , de donde resulta Sn que n∈ω Bn es una base de n∈ω Nn . En consecuencia, un grupo separable es ℵ1 -libre, y un grupo libre es κseparable para toda κ. Dado un grupo libre de torsión M y un subgrupo N de M, sea N∗ = {a ∈ M : ra ∈ N para algún r 6= 0 ∈ Z}; N∗ es la cerradura pura de N, que es el subgrupo más pequeño puro de M que contiene a N. Si S es un subconjunto de M, hSi∗ es la cerradura pura de hSi, el subgrupo generado por S; en ocasiones se le denomina como la cerradura pura de S. Una filtración de un grupo ℵ1 -separable A es una cadena continua {Aν : S ν < ω1 } tal que A0 = 0 (0 es el elemento neutro), A = ν<ω1 Aν , y para toda ν < ω1 , Aν+1 es un sumando directo libre y numerable de A. En consecuencia, una filtración es una clase especial de ℵ1 -filtración. Note que si Def E = {ν < ω1 : lím(ν), Aν+1 /Aν no es libre}, entonces Γ(A) = Ẽ (véase el Ejer. 35): para cualquier µ > ν Aµ /Aν ∼ = Aµ /Aν+1 ⊕ Aν+1 /Aν ya que Aµ /Aν+1 es libre; así, Aµ /Aν no es libre si y sólo si Aν+1 /Aν no es libre. Recuerde que si B es un subgrupo de A, una proyección de A en B es un homomorfismo que es la identidad en B; tal proyección existe si y sólo si B es un sumando directo de A. La mayoría de los ejemplos que construiremos serán subgrupos A de un Qmódulo D de dimensión ℵ1 . Fijamos este módulo D que supondremos con base X∪Y , donde X = {xν,n : ν ∈ ω1 , n ∈ ω} y Y = {yδ,n : δ < ω1 , lím(δ), n ∈ ω}. La filtración estándar de A se define como: Aν , la cerradura pura en A de la intersección de A con {xµ,n : µ < ν, n ∈ ω} ∪ {yδ,n : δ < ν, δ < ω1 , Lím(ν), n ∈ ω}. 513 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 514 ✐ ✐ 7. Combinatoria infinita En ocasiones construiremos un segundo grupo A′ dentro de un Q-módulo D′ , ′ y y′ . cuya base consiste en elementos xν,n δ,n Lema 11.5. Sea κ un cardinal regular no numerable. Un módulo ≤κ -generado es κ-libre si y sólo si tiene una κ-filtración {Mν : ν < κ} consistente en módulos libres. Def Demostración. Si M tiene tal filtración, entonces C = {Mν : ν < κ} satisface las propiedades (1)–(3) de la definición de κ-filtración. Recíprocamente, dada C como en la definición, sea X como en la demostración del lema 4.22(i); entonces elija, para cada ordinal sucesor ν, un elemento Mν de C que contenga a {xµ : µ < ν}, S el cual existe por la definición de módulo κ-libre. Para ν límite, sea Mν = µ<ν Mµ , que pertenece a C. Como todo elemento de C es libre, la demostración ha concluido. Para la siguiente proposición usaremos el invariante Γ definido en el ejercicio 35. Proposición 11.6. Sea κ un cardinal regular inumerable. Si M es un módulo ˜ la clase κ-libre ≤ κ-generado, entonces M es libre si y sólo si Γ(M) = 0 (= ∅, de equivalencia del conjunto vacío). Demostración. Supongamos primero que M es libre. Sea B = hbν : ν < αi una base (donde α ≤ κ), y sea Mν = hbµ : µ < νi para cada ν < κ. Entonces {Mν : ν < κ} es una κ-filtración tal que cada Mν es un sumando libre de M. Para esta filtración, E (véase el Ejer. 35) es claramente vacío. Recíprocamente, suponga que Γ(M) = 0. Fijemos una κ-filtración {Mν : ν < κ} de M que consiste en módulos libres, y sea E como en el ejercicio 35. Entonces, para cada ν en C, {µ > ν : Mµ /Mν no es libre} no es estacionario, es decir, existe un club Cν que tiene intersección vacía con el conjunto. Sea D la intersección de C con la intersección diagonal de los Cν : Note que D = C ∩ {µ < κ : µ ∈ ∩{Cν : ν < µ}}. Para cualquier ν < µ, si µ, ν ∈ D, entonces Mµ /Mν es libre, (*) ya que µ ∈ Cν . D es un club, por lo que {Mν : ν ∈ D} es una cadena continua. Usamos (*) para construir inductivamente una base BSν ∈ Mν para cada ν ∈ D, de tal forma que para ν ≤ µ, Bν ⊆ Bµ . Entonces, ν<κ Bν será una base de M. 514 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 515 ✐ ✐ Conjuntos y modelos. Curso avanzado Usaremos frecuentemente el hecho, probado al final de la demostración de la proposición 11.6, que si {Mν : ν < α} es una cadenaScontinua de módulos libres tales que Mν+1 /Mν es libre para toda ν, entonces ν<α Mν es libre. Sean M un módulo y N un submódulo de M. Decimos que N es κ-puro en M si L/N es libre siempre que L es un submódulo de M que contiene a N tal que L/N es <κ -generado, o de manera equivalente, M/N es κ-libre. Proposición 11.7. Sean R un dominio ideal principal y M un R-módulo. Entonces M es κ-libre fuerte si y sólo si M es κ-libre y todo subconjunto de M de cardinalidad < κ está contenido en un submódulo de M κ-puro y <κ -generado. Demostración. El que la condición es suficiente es claro pues podemos tomar como M, de la definición de módulo λ-libre fuerte, la familia de todos los submódulos de M <κ -generados y κ-puros. Para el recíproco, sea M como en la definición de módulo κ-libre fuerte. Como todo submódulo <κ -generado está contenido en algun miembro de M, y todo miembro de M es libre, se deduce que todo submódulo <κ -generado es libre. Para completar esta disertación es suficiente mostrar que todo elemento de M es κ-puro. Sea N ⊆ L tal que N ∈ M y L está <κ -generado. Entonces existe N ′ ∈ M que contiene a N ∪ L tal que N ′ /N es libre. Pero entonces L/N es libre pues es un submódulo de N ′ /N. Sea J un conjunto y κ un cardinal regular ≤ |J|. Para cada Y ∈ [J]<κ , sean UY = {X ∈ [J]<κ } y Fκ (J) el filtro en [J]<κ generado por {UY : Y ∈ [J]<κ }. Entonces Fκ (J) es un filtro κ-completo, puesTpara cualquier cardinal λ < κSy cualesquier conjuntos Yν (ν < λ) en [J]<κ , ν<λ UYν ⊇ UW donde W = ν<λ Yν que tiene cardinalidad < κ. Ejemplo 11.8. Sean R un dominio entero en el que todo ideal es principal, λ un cardinal no numerable y κ un cardinal Lλω -compacto (definición en pág. 699). Si M es un R-módulo κ-libre (de cardinalidad arbitraria), entonces M es libre. En efecto, primero note que κ ≥ λ. Sea J el universo de M, I = [J]<κ y F = Fκ (J) (véase la notación previa). Para toda Y ∈ I, hY i es un submódulo de M de cardinalidad < κ, así que es libre. Por la hipótesis en κ, Q F está contenida en un ultrafiltro λ-completo U. Formamos el ultraproducto Y ∈I hY i/U que denotamos M ∗ . Entonces, por el ejemplo 6.4.9 M ∗ es libre. Defina una función 515 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 516 ✐ ✐ 7. Combinatoria infinita ϕ:M− → M ∗ como sigue: para cualquier a ∈ M, sea ϕ(a) = aU , donde a(Y ) = ( a, 0, si a ∈ Y , en otro caso. Sea a ∈ Y para alguna Y ∈ I, por lo que a(Z) = a para todo Z ∈ UY . Por lo tanto, ϕ es un encaje. Como M ∗ es libre, M es isomorfo a un submódulo de M ∗ y por las hipótesis sobre R, M es libre. Del ejemplo 11.8 se sigue que si κ es un cardinal Lω1 ω - compacto, entonces todo grupo abeliano κ-libre (de cardinalidad arbitraria) es libre. Un cardinal κ tiene la propiedad de compacidad, para R, si todo R-módulo ≤κ -generado y κ-libre es libre. De acuerdo con el ejercicio 74, el siguiente lema es cierto: Lema 11.9. Sean κ un cardinal débilmente compacto y {Sν : ν < κ} un conjunto de subconjuntos estacionarios de κ. Entonces existe un conjunto estacionario T conformado por cardinales regulares < κ tal que para toda λ ∈ T y toda ν < λ, Sν ∩ λ es estacionario en λ. Con ayuda de este lema podemos mostrar: Teorema 11.10. Sea κ un cardinal compacto débil. Si M es un módulo ≤κ generado que es κ- libre, entonces M es libre. Demostración. Suponga que el resultado es falso y que M es un contraejemplo. Sea {Mν : ν < κ} una κ-filtración como en el lema 11.5. Sin pérdida de generalidad podemos suponer que M0 = {0}. Más aun, podemos suponer que Mν es ≤|ν|+ℵ0 -generado para toda ν. Esto se puede lograr, por ejemplo, construyendo nuevas filtraciones, esta vez con los mismos submódulos pero con segmentos más largos en los que la filtración permanece fija en un submódulo dado hasta que la cardinalidad del índice alcanza el tamaño del siguiente miembro de la filtración original. Para esta filtración, sea E ⊆ κ como en el ejercicio 35. Por el ejercicio mencionado, E es estacionario en κ. Para cada ν ∈ E, sea Sν = {µ > ν : µ < λ, Mµ /Mν no es libre}, un conjunto estacionario en λ. E ∩ λ también es estacionario en λ. El ejercicio 35 implica que Mλ no es libre, una contradicción. 516 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 517 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 11.11. Sean λ un cardinal singular y M un módulo ≤κ -generado tal que existe un cardinal µ < λ con la propiedad de que para todo µ < κ < λ, M es κ+ -libre fuerte. Entonces M es libre. Demostración. Escogemos una sucesión creciente {κi : i < cf (λ)} de cardinales con límite λ y de tal forma que κ0 ≥ máx{µ, cf (λ)}. Elijamos también un conjunto G generador de M de cardinalidad λ, que podemos escribir como la unión de una cadena continua de subconjuntos Gi (i < cf (λ)), donde |Gi | = κi . Definimos subconjuntos Cin , Xin de M para i < cf (λ), n < ω por inducción en n (simultáneamente para toda i). Si Bin es el submódulo generado por Xin , podemos requerir que para toda i y n: 1. 2. 3. 4. 5. Gi ⊆ Bin ⊆ hCin i ⊆ Bin+1 ; Xin es una base de Bin , y Xin+1 ⊇ Xin ; |Cin |, |Xin | ≤ κi y Cin+1 ⊇ Cjn para toda j ≤ i; n+3 n+2 n i; y hCS ∩ Xi+1 i i ⊆ hCi n {h n∈ω Ci i : i < cf (λ)} es una cadena continua. Suponga por el momento que ya efectuamos la construcción. Para cada S n . Por 5 los hC i forman una cadena continua. i < cf (λ), sea Ci = n∈ω C i S Si Más aún, por 1 y 2, hCi i = n∈ω Bin tiene una base Xi = n∈ω Xin ; y por 4, así que hCi+1 i/hCi i es libre. Por lo tanto, hC i está generado por Ci ∩ Xi+1 , S S Si i<cf (λ) hCi i es libre. Pero por 1, i<cf (λ) hCi i contiene a i<cf (λ) Gi , por lo que es igual a M. Resta llevar a cabo la construcción. Como M es κ+ i -libre fuerte, existe un conjunto Mi que cumple la definición de κi -libre fuerte: cada N ∈ Mi es ≤i - generado y libre, y para todo subconjunto X de cardinalidad κi existe un N ′ ∈ Mi tal que N ′ ⊇ N ∪ X y N ′ /N es libre. Efectuamos nuestra construcción de tal forma que cada Bin pertenezca a Mi . Para comenzar, sean 0 :α<κ} Bi0 un elemento de Mi que contiene a Gi , Xi0 una base de Bi0 y {bi,α i 0 una enumeración de Xi . Supongamos que para alguna n y cualquier i se ha definido Xik para toda k ≤ n y Cik se ha definido también para toda k < n. k Supongamos también que fijamos la enumeración {bi,α : α < κi } de Xik . n−1 n−1 Escogemos Yin ⊆ Xi+1 de tal suerte que hYin i ⊇ Bi+1 ∩ Cin−1 y |Yin | ≤ κ. S n : j < cf (λ), α < κ }. Note que Sea Cin = Xin ∪ Yin ∪ j≤i Cjn−1 ∪ {bj,α i n hay solamente κi elementos bj,α ya que κi ≥ cf (λ); aquí entra en acción la singularidad de λ. Finalmente escogemos Bin+1 ∈ Mi de forma que se satisfaga 517 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 518 ✐ ✐ 7. Combinatoria infinita 1 y Bin+1 /Bin es libre; esto es posible por las propiedades de Mi . Entonces podemos elegir una base Xin+1 de Bin+1 que extiende a Xin , y la enumeramos. Esto completa la etapa inductiva de la construcción. Falta corroborar 4 y 5. n+1 n+2 n+2 Para 4, Cin ⊆ Ci+1 ⊆ Bi+1 , por lo que Ci ⊆ Bi+1 ∩ Cin+2 ⊆ hYin+3 i y n+3 n+3 n+2 Yi ⊆ Ci ∩ Xi+1 . Además, 5 es cierta pues para todo límite j < cf (λ), h [ n∈ω Cjn i = = [ Bjn = n∈ω [ [ n∈ω i<j [ n h{bj,α : α < κj }i n∈ω n h{bj,α : α < κi }i ⊆ [ [ h i<j n∈ω Cin i. Nuestra tarea siguiente es deducir que todo módulo λ-libre es libre mediante el teorema 11.11. Recuerde que un módulo M es λ-libre si y sólo si M es κ-libre para todo cardinal regular κ < λ. Necesitaremos el hecho de que un módulo κ+ -libre es κ-libre fuerte. Para ello recurriremos a un juego. Fijemos un cardinal regular κ y un módulo M. Definimos el κ-juego de Shelah en M. Los jugadores I y II mueven en forma alternada guiándose por los elementos de ω, empezando I. El jugador I tira Pn un subconjunto de M de cardinalidad < κ; el jugador II mueve Nn un submódulo <κ -generado de M; requerimos que para toda n ∈ ω, Nn−1 ∪ Pn ⊆ Nn (N−1 = {0}). El jugador II gana el juego si y sólo si para toda n, Nn y Nn /Nn−1 son libres; en otro caso, I gana. Es inmediato que M es κ-libre fuerte si y sólo si II tiene una estrategia ganadora en este juego. En efecto, si M es κ-libre fuerte y M como en la definición respectiva, entonces la estrategia ganadora de II es escoger los Nn de M de tal forma que Nn /Nn−1 es libre. Recíprocamente, si II tiene una estrategia ganadora podemos definir M como el conjunto de todos los movimientos de II en la partida que transcurre de acuerdo con la estrategia ganadora. El κ-juego de Shelah es claramente abierto, por lo que este juego está determinado. Proposición 11.12. Sea κ un cardinal regular y M un módulo que es κ+ -libre. Entonces M es κ- libre fuerte. 518 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 519 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Por lo visto antes, es suficiente mostrar que I no tiene una estrategia ganadora en el κ-juego de Shelah en M. Fijemos una estrategia s para I, es decir, s es una función que propicia una sucesión finita: P0 , N0 , P1 , N1 , . . . , Pk , Nk de tiradas, donde P0 = s(∅) y Pi = s(N0 , . . . , Ni−1 ) para 0 < i ≤ k, s escoge el siguiente movimiento de I, s(N0 , . . . , Nk ). Debemos mostrar que II le gana a s. Sea C como en la definición 11.2. Construiremos, por inducción en ν, una κ-filtración {Nν : ν < κ} conformada por submódulos de M. En cada etapa elegimos un elemento Aν de C que contenga a Nν y un conjunto {aτµ : τ < κ} de generadores de Aν . Es tiempo de efectuar la construcción. Fijemos una biyección ϕ de κ − {0} a κ × κ tal que para toda ν, si ϕ(ν) = (µ, τ) entonces µ < ν. Supongamos que Nµ , Aµ , y {aτµ : τ < κ} se han elegido para cada µ < ν para alguna ν. Si ν es límite simplemente tomamos uniones. En otro caso, escogemos Nν de manera que contenga a aτµ , donde ϕ(ν − 1) = (µ, τ), y de tal forma que también contenga a s(∅) y a s(Nµ0 , . . . , Nµk ) siempre que µ0 < · · · < µk < ν . Esto es posible ya que hay menos que κ de tales sucesiones. Elegimos Aν ∈ C que contenga Nν . Esto completa la etapa inductiva. S S Sea N = ν<κ Nν = ν<κ Aν . Entonces N ∈ C, por lo que N es libre; sea B una base de N. Existe un club C ⊆ κ tal que para ν ∈ C, Nν está generado por Nν ∩ B, así que Nν es libre. La estrategia de II para vencer a s es mover Nν con ν ∈ C: si ν0 < ν1 < · · · es una sucesión de elementos de C, entonces s(∅), Nν0 , s(Nν0 ), Nν1 , s(Nν0 , Nν1 ), . . . es una partida ganadora para II. Por consiguiente, s no es una estrategia ganadora para I. Una consecuencia inmediata de la proposición 11.12 es: Teorema 11.13. Sean λ un cardinal singular y M un módulo ≤λ generado que además es λ- libre. Entonces M es libre. Apéndice En este apéndice presentamos, en forma muy breve, las principales definiciones y resultados principales relativos al estudio de ideales. 519 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 520 ✐ ✐ 7. Combinatoria infinita Definición 11.14. Un ideal es un conjunto S es una familia I de subconjuntos de S tal que (i) ∅ ∈ I; (ii) si X, Y ∈ I, X ∪ Y ∈ I; (iii) si X, Y ⊆ S, X ∈ I, Y ⊆ Y , entonces Y ∈ I. Consideraremos sólo ideales propios: (iv) S ∈ / I. Un ideal I en S es primo si para todo X ⊆ S, X ∈ I o S − X ∈ I. Si I es un ideal en S, F = {X : S − X ∈ I} es un filtro, el filtro dual a I. Un ideal numerablemente completo (σ-ideal) es un ideal I para el cual, si Xn ∈ I S para toda n ∈ ω, n∈ω Xn ∈ I. Más generalmente, si κ es un cardinal regular e I un ideal en S, entonces I es un ideal κ-completo si siempre que {Xα : α < γ} es una familia de subconjuntos de S, γ < κ, Xα ∈ I para toda α < γ; entonces [ α<γ Xα ∈ I. Si S es un conjunto no numerable, {X ⊆ S : |X| ≤ ℵ0 } es un σ-ideal en S. De manera similar, si κ > ω es regular y |S| ≥ κ, entonces {X ⊆ S : |X| < κ} es el ideal κ-completo más pequeño en S que contiene todos los singuletes {a}. Un filtro F en un cardinal κ es normal si es cerrado respecto a intersecciones diagonales, es decir, Xα ∈ F, α < κ ⇒ △α<κ Xα ∈ F. Un ideal I en κ es normal si el filtro dual es normal. Un ideal I σ-completo es σ-saturado si: (i) {x} ∈ I para toda x ∈ S. (ii) Toda familia mutuamente ajena de subconjuntos X ⊆ S que no pertenecen a I es a lo sumo numerable. En forma análoga definimos un ideal κ-saturado. 520 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 521 ✐ ✐ Conjuntos y modelos. Curso avanzado 12. Ejercicios 1. Sea B un conjunto no numerable de subconjuntos finitos de ω1 . Muestre que existe un subconjunto numerable N ⊆ ω1 tal que todo b ∈ B que no sea subconjunto de N es un miembro de algún ∆-sistema no numerable A ⊆ B con raíz r ⊆ N. 2. Encuentre otra demostración al teorema 3.2. Proceda como se indica a continuación: sin pérdida de generalidad, podemos suponer que la familia no numerable de conjuntos finitos es B = {Bα : α < ω1 } y Bα ⊆ ω1 para todo α < ω1 . Sea C el conjunto de los α < ω1 tales que máx Bξ < α siempre que ξ < α. Pruebe que C es un club en ω1 . Para cada k ≤ n, sea Sk = {α ∈ C : |Bα ∩ α| = k}; muestre que existe al menos un Sk estacionario. Para cada m = 1, . . . , k, sea fm (α) = el m-ésimo elemento de Aα ; se cumple fm (α) en Sk . Use el teorema de Fodor para encontrar un subconjunto estacionario T ⊆ Sk y un conjunto A (de tamaño k) tal que Bα ∩ α = A para toda α ∈ T . Demuestre que {Bα : α ∈ T } es un ∆-sistema. (**) ¿Se puede generalizar la construcción recién mencionada para dar otra prueba al teorema 3.3? 3. Suponga la HC y sea S = {sα : α < ω2 } una familia de ℵ2 conjuntos numerables. Pruebe que existe un ∆-sistema A ⊆ S tal que |A| = ℵ2 . 4. (**) Muestre que existe una familia A de ωω -subconjuntos finitos tal que ninguna subfamilia B ⊆ A de cardinalidad ωω forma un ∆-sistema. 5. Para un subconjunto A de κ definimos A(α) mediante recursión sobre α: T A(0) = A, A(α+1) = (A(α) )′ (véase la pág. 427) y A(λ) = α<λ A(α) para λ límite. Por el lema 4.8, todos lo C(α) son clubes para cada club C y α < cf (κ). Demuestre que κ(α) = {ωα β : β < κ} para toda α < κ. 6. Dados dos subconjuntos A, B de κ un cardinal regular, decimos que A ≡ B si A ∩ C = B ∩ C para algún club C. Muestre que la relación ≡ es de equivalencia en Pot(κ). En las relaciones A ⊆ B, A ∩ B ≡ C, A ∪ B ≡ C, y κ \ A ≡ B podemos sustituir A, B y C por conjuntos ≡-equivalentes. Demuestre que Pot(κ)/ ≡ es un álgebra booleana. La intersección diagonal D de una familia {Aα } está caracterizada (módulo ≡) por: 1. (D/ ≡) ⊆ (Aα / ≡) para toda α. 521 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 522 ✐ ✐ 7. Combinatoria infinita 2. De (E/ ≡) ⊆ (Aα / ≡) para toda α, se sigue que (E/ ≡) ⊆ (D/ ≡). En consecuencia, la intersección diagonal sólo depende (módulo ≡) del conjunto {Aα / ≡: α < κ}, que es el ínfimo de los Aα / ≡ en el álgebra booleana Pot(κ)/ ≡. 7. Sea λ un cardinal regular no numerable. La asignación α 7→ κα propicia una función normal de λ a la clase de los cardinales con supremo κ. Suponga κ que λ < κ = 2⌣ . Además, para cada α elemento de un subconjunto estacionario S0 de λ, se tiene un conjunto Aα deQcardinalidad no mayor que κ++ . Entonces cada subconjunto casi ajeno de α∈S0 Aα tiene cardinalidad no mayor que κ++ . 8. Sea κ un cardinal singular de cofinalidad no numerable. Si 2µ = µ++ para algún conjunto estacionario de cardinales µ menores que κ, entonces también ocurre 2κ ≤ κ++ . 9. Un orden parcial (P, <) es un buen orden parcial si < está bien fundada y no existe un conjunto infinito de elementos incomparables. Muestre que un orden parcial es un buen orden parcial si y sólo si para cada sucesión hpi : i < ωi existen índices i < j con pi ≤ pj . 10. Una partición de [A]n es una pareja de conjuntos ajenos P1 y P2 tales que [A]n = P1 ∪ P2 . Un conjunto H ⊆ A es homogéneo para una partición {P1 , P2 } de [A]n si [H]n ⊆ P1 o [H]n ⊆ P2 . Demuestre la siguiente versión del teorema de Ramsey: si S es un conjunto infinito, entonces toda partición de [S]2 tiene un conjunto infinito homogéneo. [Sugerencia: Sea U un ultrafiltro libre en S y P1 , P2 una partición de [S]2 . Para cada a ∈ S, sea Sa1 = {b ∈ S : b 6= a ∧ {a, b} ∈ P1 }; Sa2 = {b ∈ S : b 6= a ∧ {a, b} ∈ P2 }. Muestre que exactamente uno de estos conjuntos pertenece a U. Sean Z1 = {a ∈ S : Sa1 ∈ U}, Z2 = {a ∈ S : Sa2 ∈ U}. Demuestre que alguno de los conjuntos Z1 , Z2 pertenece a U, digamos Z1 . Encuentre un conjunto infinito H ⊆ S tal que [H]2 ⊆ P1 . Para construir H, suponga que tenemos ya n elementos en H; considere el conjunto 522 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 523 ✐ ✐ Conjuntos y modelos. Curso avanzado Xn = Z1 ∩ Sa10 ∩ · · · ∩ Sa1n−1 . Pruebe que Xn ∈ U y que es infinito. Escoja an ∈ Xn distinto de los a0 , . . . , an−1 . Demuestre finalmente que [H]2 ⊆ P1 .] 11. Muestre que si κ > 2ω , el espacio 2κ (donde 2 = {0, 1} tiene la topología discreta) no es separable. [Sugerencia: Si D ⊆ 2κ es numerable, muestre que existen α < β tales que ∀ f ∈ D(f (α) = f (β))]. 12. Si en el ordinal ω1 + 1 se introduce la topología del orden, muestre que el producto (ω1 + 1)ω es un ejemplo de espacio compacto Hausdorff, que es la unión de ω1 conjuntos cerrados densos en ninguna parte. Muestre que la bola unitaria en un espacio de Hilbert no separable con la topología débil es otro ejemplo de tales espacios. [Sugerencia: Para (ω1 + 1)ω , considere el conjunto {f : ∀ n(f (x) 6= ω1 ⇒ f (n) ≤ α)}.] 13. (Hausdorff) Muestre que existe un (ω1 , ω1∗ )-hueco en Pot(ω)/Fin, es decir, encuentre aα , bα ∈ Pot(ω) para α < ω1 tales que aα ⊂∗ bα , α < β ⇒ (aα ⊂∗ aβ ∧bβ ⊂∗ bα ), y ¬∃ c∀ α(aα ⊂∗ c ⊂∗ bα ), donde a ⊂∗ b si |a\b| < ℵ0 y |b\a| = ℵ0 . [Sugerencia: Encuentre aα , bα recursivamente tales que para cada α < ω1 y n < ω, |{ξ < α : (aα \ bξ ) ⊆ n}| < ω.] 14. Considere ω1 con la topología del orden, y sea f : ω1 − → R continua. Muestre que ∃ α < ω1 ∀ β > α(f (β) = f (α)). [Sugerencia: Para ε > 0 fijo, y cada α límite, existe una g(α) < α tal que f varía menos que ε en (g(α), α].] 15. Sea κ > ℵ0 regular. Muestre que existen subconjuntos estacionarios Sα ⊆ κ para α < κ tales que α < β ⇒ Sβ ⊆ Sα si la intersección diagonal de los Sα es {0}. 16. Sea A un conjunto de cardinales infinitos tales que para todo cardinal regular λ, A ∩ λ no es estacionario en λ. Muestre que existe una función inyectiva g en A tal que ∀ α ∈ A(g(α) < α). 17. El cardinal κ es Mahlo fuerte si κ es fuertemente inaccesible y {α < κ : α es regular} es estacionario en κ. Muestre que para tal κ, {α < κ : α es fuertemente inaccesible} es estacionario en κ. 523 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 524 ✐ ✐ 7. Combinatoria infinita 18. (**) Suponga que κ es fuertemente inaccesible y no existen árboles κAronszajn. Muestre que si S es un subconjunto estacionario de κ, existe un cardinal regular λ < κ tal que S ∩ λ es estacionario en λ. [Sugerencia: Si no es así, encuentre un κ-árbol T en el que una trayectoria en T genera una función inyectiva g en S tal que ∀ α ∈ S(g(α) < α).] 19. El cardinal κ es hipermahlo fuerte si κ es Mahlo fuerte y {α < κ : α es Mahlo fuerte} 20. 21. 22. 23. 24. 25. 26. 27. es estacionario en κ. De la misma manera definimos hiper-hipermahlo, etc. Muestre que si κ es débilmente compacto, entonces κ es Mahlo fuerte, hipermahlo, hiper-hipermahlo, etc. [Sugerencia: Use el Ejer. 18.] Muestre que la siguiente versión de ♦ es inconsistente con ZFE : existen Aα ⊆ α para α < ω1 tales que para todo conjunto estacionario A ⊆ ω1 , ∃ α ∈ A(A ∩ α = Aα ). Demuestre que ♦ implica ⊛. [Sugerencia: Si hfα : α < ω1 i es una ♦-sucesión, dada F defina g(α) = F (fα ).] Demuestre que si ⊛(S) es cierto, S debe ser estacionario. Sea C(S) el principio: si para cada ordinal límite δ ∈ S existe una sucesión hηαδ : α < ωi que converge a δ, y si kα ∈ 2ω , entonces para alguna k ∈ 2ω1 ocurre que para toda δ ∈ S, k(ηα (n)) = kδ (n) para todas las n excepto un número finito. Muestre que ¬C(ω1 ) es una consecuencia de ♦(S). (***) Muestre que HC implica ¬C(ω1 ). Sea F el filtro en ω1 generado por los clubes en ω1 e I el ideal dual a F. Demuestre que tanto F como I son normales. En particular, F e I son numerablemente completos. Suponga que λ es un cardinal y que λℵ0 < 2ℵ1 . Demuestre que para toda ω1 → 2 existe una función g ∈ 2ω1 tal que para toda f ∈ λω1 , F : λ⌣ − {α < ω1 : F (f ↾ α)} es estacionario. [Sugerencia: La prueba es absolutamente similar a la demostración del teorema 7.3]. (**) Si no existe un κ-árbol de Aronszajn, entonces κ es regular. El espacio del ejemplo 3.6 no es compacto, pero el método de prueba nos permite construir, para un cardinal débilmente inaccesible, un espacio compacto Hausdorff para el cual c(Y ) = µ y c(Y ) no se alcanza. Encuentre el espacio Y mencionado. [Sugerencia: Tome como Xκ la compactificación Yκ de Xκ .] 524 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 525 ✐ ✐ Conjuntos y modelos. Curso avanzado 28. Demuestre que si un espacio X es separable, c(X) = ℵ0 . 29. Demuestre que si Xi (i ∈ I) son espacios tales que para todo J ⊆ I finito, Q Q X tiene celularidad ℵ , entonces 0 i∈I Xi también tiene celularidad i∈J i numerable. 30. Muestre que si κ ≤ 2ℵ0 y Xα son separables para α < κ, entonces es separable. Q α<κ Xα 31. Muestre que el espacio 2ℵ1 tiene celularidad ℵ0 y existe una sucesión de abiertos hUα : α < ω1 i tal que si α < β, Uα ⊂ Uβ . 32. (**) Demuestre que un subgrupo puro de un grupo separable es separable. 33. Demuestre que el grupo G es separable si y sólo si todo elemento de G es miembro de un sumando cíclico de G. 34. Pruebe que un grupo separable es libre de torsión y que un grupo libre de torsión es ℵ1 -libre. 35. Sea κ un cardinal regular y M un módulo κ-libre ≤κ -generado. Sea {Mν : ν < κ} una κ-filtración de M. Sea E = {ν < κ : {µ > ν : Mµ /Mν no es libre } es estacionario en κ}. Defina Γκ (M) como Ẽ, la clase de equivalencia de E, es decir: Γκ (M) = {X ⊆ κ : ∃ un club C ⊆ κ, X ∩ C = E ∩ C}. Pruebe que Γκ (M) no depende de la elección de la κ-filtración. Demuestre que si κ es un cardinal regular no numerable y M es un módulo κ-libre ≤κ -generado, entonces M es libre si y sólo Γκ (M) = 0 (= ∅ la clase de equivalencia del conjunto vacío). Si κ es claro en el contexto, escribimos Γ(M). [Sugerencia: Si M es libre, sean B = {bν : ν < α} una base (α ≤ κ) y Mν = hbµ : µ < νi para cada ν < κ. {Mν : ν < κ} es una κ-filtración, y E = ∅. Recíprocamente, Γκ (M) = 0. Fije una κ-filtración {Mν : ν < κ} de M consistente en módulos libres. E no es estacionario, y sea C el club contraejemplo. Para cada ν ∈ C, {µ > ν : Mµ /Mν no es libre} no es estacionario. Sean Cν el club contraejemplo y D la intersección de C con la intersección diagonal de los Cν . Note que para cualquier ν < µ, si µ, ν ∈ D, Mµ /Mν es libre , (*) 525 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 526 ✐ ✐ 7. Combinatoria infinita pues µ ∈ Cν . Muestre que {Mν : ν ∈ D} es una cadena continua. Usando (*) construya recursivamente una base Bν de Mν para cada ν ∈ D tal que S si ν ≤ µ, Bν ⊆ Bµ . Entonces ν<κ Bν es una base para M.] 36. Si {Aν : ν < κ} es una κ-filtración en un conjunto A de cardinalidad κ (un cardinal regular), demuestre que existe un club C en κ tal que para toda ν ∈ C, |Aµ \ Aν | = |µ \ ν| (donde µ representa al ínf{α ∈ C : α > ν}). 37. Sean κ un cardinal regular y {Aν : ν < κ} una κ-filtración en un conjunto A de cardinalidad κ. Pruebe que si S es un conjunto estacionario en κ y Θ : S − → A es tal que para toda α, Θ(α) ∈ Aα , entonces existe un subconjunto estacionario S ′ ⊆ S tal que Θ ↾ S ′ es constante. 38. Para un sistema de escalas η en un conjunto estacionario E ⊆ ω1 , si c es la coloración en η definida por cδ (n) = ηδ (n + 1), entonces c no se puede uniformar. [Sugerencia: Si (f, f ∗ ) es una uniformación, aplique el Def ejercicio 37 a Θ(δ) = (f ∗ (δ), ηδ (f ∗ (δ))).] 39. Si E es un subconjunto estacionario de un cardinal regular κ, f, g son funciones de E en κ tales que para toda ν ∈ E, f (ν) 6= g(ν), entonces existe un subconjunto estacionario E′ de E tal que {f (ν) : ν ∈ E′ } ∩ {g(ν) : ν ∈ E′ } = ∅. [Sugerencia: Existe un conjunto estacionario E1 ⊆ E tal que para toda µ, ν ∈ E1 , f (µ) < µ ⇔ f (ν) < ν y g(µ) < µ ⇔ g(ν) < ν; por el teorema de Fodor, existe un subconjunto estacionario E2 ⊆ E1 tal que si f (ν) < ν para toda ν ∈ E1 entonces f ↾ E2 es constante, y en forma similar para g; existe un club C tal que para toda α ∈ C y toda ν < α, f (ν) < α y g(ν) < α; sea E′ = E2 ∩ C.] 40. Para cualesquier dos árboles T1 y T2 , defina un juego J(T1 , T2 ) como sigue: el jugador I elige elementos de T1 formando una sucesión estrictamente creciente en T1 , y II lo hace de modo similar en T2 . El primer jugador que no pueda mover pierde. Sea T un árbol, el árbol T ′ conformado por los segmentos iniciales de ramas de T , ordenadas parcialmente por inclusión. Demuestre que II tiene una estrategia ganadora en el juego G(T, T ′ ). 41. Si E ⊆ κ es un subconjunto estacionario de ordinales límite y X es un subconjunto no estacionario de E, podemos elegir, para toda γ ∈ X, un club Cγ en γ tal que para toda β 6= γ en X, Cβ ∩ Cγ = ∅. [Sugerencia: Demuestre por inducción sobre sup X que podemos elegir los Cγ tales que ínf Cγ es mayor que cualquier ν < ínf X fijo.] 526 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 527 ✐ ✐ Conjuntos y modelos. Curso avanzado 42. Con la notación del ejercicio 35, sean M, Mν , E, E′ , y C. Pruebe que si ν ∈ C ∩ E, entonces ν ∈ E′ . [Sugerencia: Para mostrar que {µ > ν : Mµ′ /Mν′ no es libre} es estacionario, considere cualquier club C′ , y note que C ∩ C′ ∩ {µ > ν : Mµ /Mν no es libre } = 6 ∅.] 43. (**) Demuestre que todo grupo numerable A se puede escribir como una suma directa: A = N ⊕ F , donde F es libre y N ∗ (= Hom(N, Z)) = 0. N es único. [Sugerencia: N = ∩{Núcleo g : g ∈ A∗ }.] 44. Demuestre que el producto de grupos ℵ1 -libres es ℵ1 -libre. 45. Suponga que κ es un cardinal regular límite. Suponga que M es un módulo ≤κ -generado, que no es <κ -generado, y M es λ-libre para todo λ < κ. (i) Para toda λ < κ existe un conjunto X de cardinalidad λ++ que no esta contenido en ningún submódulo ≤λ -generado. [Sugerencia: Suponga lo contrario. Escoja una cadena estrictamente creciente Ni (i < λ++ ) de submódulos ≤λ++ -generados tales que para toda i impar, Ni es ≤λ -generado Def y N = ∪ Ni es libre (tal cadena existe pues M es λ+++ -libre). Como N es un módulo libre tal que todo subconjunto de cardinalidad λ+ está contenido en un submódulo ≤λ -generado, N es ≤λ -generado.] 46. Si β es tal que 2ℵα = ℵα+β para toda α, entonces β < ω. [Sugerencia: Sean β ≥ ℵ0 y α el menor con α + β > β. Si 0 < α ≤ β, y α es límite, sea κ = ℵα+α ; como cf (κ) = cf (α) ≤ α < κ, κ es singular. Para cada ξ < α, ξ + β = β1 , y así 2ℵα+ξ = ℵα+ξ+β = ℵα+β . Pruebe que 2κ = ℵα+β , una contradicción ya que ℵα+β < ℵα+α+β .] 47. Si κ es un cardinal singular, ‫(ג‬κ) es 2cf (κ) o ‫(ג‬λ), donde λ es el menor cardinal tal que λ ≥ cf (κ) que satisface λcf (κ) ≥ κ. 48. Demuestre que si 2ℵ0 > ℵω , ℵℵω0 = 2ℵ0 . 49. Pruebe que si 2ℵ1 = ℵ2 y ℵωℵ0 > ℵω1 , ℵℵω01 = ℵℵω0 . 50. Muestre que si 2ℵ0 ≥ ℵω1 , entonces ‫(ג‬ℵω ) = 2ℵ0 y ‫(ג‬ℵω1 ) = 2ℵ1 . 51. Si κ es singular y no acotado, pruebe que cf (‫(ג‬κ)) ≥ que el menor β tal que λβ > κ, para alguna λ < κ. En particular, si κ es límite fuerte, cf (‫(ג‬κ)) > κ. [Sugerencia: Como κ no es acotado, β > cf (κ) si cf (κ) ≤ γ < β. Puesto que λγ < κ para todo λ < κ, tenemos que κγ = κcf (γ) . Sin embargo, cf (κγ ) > γ.] 52. Muestre que si 2ℵ1 = ℵ2 , ℵℵω0 6= ℵω1 . 527 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 528 ✐ ✐ 7. Combinatoria infinita 53. (***) Demuestre la siguiente generalización del teorema de Silver: sea κ un cardinal singular, sea cf (κ) ≥ ω1 y suponga que λcf (κ) < κ para toda λ < κ. Si hαα : α < cf (κ)i es una sucesión normal de cardinales tales que supα<cf (κ) κα = κ, y si el conjunto (κα ) {α < cf (κ) : κcf = κ+ α α} es estacionario, entonces κcf (κ) = κ+ . [Sugerencia: Demuestre primero la siguiente afirmación: suponga que ℵℵα1 < ℵω1 para toda α < ω1 . Sea F una familia casi ajena de funciones F⊆ tales que el conjunto Y Aα α<ω1 {α < ω1 : |Aα | ≤ ℵα+1 } es estacionario. Entonces |F| ≤ ℵω1 +1 . Con esta afirmación, suponga (ℵα ) que ℵℵα1 < ℵω y que ℵcf = ℵα+1 para un conjunto estacionario de α elementos α; se debe mostrar que ℵℵω11 = ℵω1 +1 . Para toda h : ω1 − → ℵω1 , sea fh = hhα : α < ω1 i, donde dom(hα ) = ω1 y hα (ξ) = ( h(ξ), 0, si h(ξ) < ℵα en otro caso, y sea F = {fh : h ∈ ℵωω11 }. Pruebe que si h 6= g, fh y fg son casi ajenas y que Y F⊆ ℵωα 1 . α<ω1 Así, |F| ≤ ℵω+1 y, por lo tanto, |ℵωω11 | = ℵω1 +1 . Para el caso general, se debe mostrar que (κ) {α < cf (κ) : κcf = κ+ α α} es estacionario. Note que el conjunto C = {α : α es límite, (∀ λ < κα )λcf (κ) < κα } es cerrado y no acotado en cf (κ); si α ∈ C, entonces cf (κα ) < cf (κ). (κ) Concluya que κcf = κ+ .] α 54. Si β < ω1 , si 2ℵ1 < ℵω1 y si ℵℵα0 ≤ ℵα+β para un conjunto estacionario de elementos α, entonces ℵℵω11 ≤ ℵω1 +β . 528 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 529 ✐ ✐ Conjuntos y modelos. Curso avanzado 55. Si 2ℵ0 ≤ ℵα+2 es cierta para todo cardinal de cofinalidad ω, entonces también se cumple para todo cardinal singular. 56. Si ℵ1 ≤ cf (ℵη ) < ℵη , si β < cf (ℵη ) y si 2ℵα ≤ ℵα+β para toda α < η, entonces 2ℵη ≤ ℵη+β . 57. Si 2ℵω1 +α < ℵω1 +α+α para toda α < ω1 , entonces 2ℵω1 +ω1 < ℵω1 +ω1 +ω1 .] 58. Si ℵ1 ≤ cf (κ) < κ y si λcf (κ) < κ para toda λ < κ, entonces κcf (κ) < ℵγ , donde γ = (|η|cf (κ) )+ . 59. Con ♦′ (E) denotamos el siguiente principio: existe una familia {Sα : α ∈ E} tal que para cada α ∈ E, Sα es un subconjunto numerable de α, y para todo X ⊆ ω1 , {α ∈ E : X ∩ α ∈ Sα } es estacionario en ω1 . Pruebe que ♦′ (E) es equivalente a ♦(E) (en ZFE ). [Sugerencia: Suponga ♦′ y muestre que existen subconjuntos Yα,n de α×ω tales que para todo X ⊆ ω1 ×ω, {α ∈ E : X∩(α ×ω) ∈ {Yα,n : n ∈ ω}} es estacionario. Entonces muestre que para alguna n, {{ν ∈ α : (ν, n) ∈ Yα,n } : α ∈ E} es una ♦-sucesión.] 60. Si ♦S κ (E) es cierto y κ es sucesor, existe una descomposición de E, E = β∈κ Eβ , en κ subconjuntos ajenos tales que para todo β ∈ κ, ♦κ (Eβ ). 61. Use ♦(E) para demostrar que existe un sistema de escalas η en E tal que para todo club C existe δ ∈ C ∩ E con ηδ (n) ∈ C ∩ E para una cantidad infinita de n ∈ ω. 62. Demuestre el corolario 7.2. 63. Sean κ, λ, ρ, κ′ , ρ ′ , σ ′ cardinales tales que κ′ ≥ κ, λ′ ≤ λ, ρ ′ ≤ ρ y σ ′ ≤ σ. ′ Muestre que si κ − → (λ)ρσ , entonces κ′ − → (λ′ )ρσ ′ . 64. Muestre que 6 − → (3)22 . 65. Construya una partición adecuada para mostrar que 5 6− → (3)22 . 66. Un subconjunto A ⊆ ω es relativamente grande si |A| ≥ mín A. Es∗ cribimos n − → (m)kl si para toda coloración f : [n]k − → l existe un conjunto homogéneo relativamente grande de tamaño al menos m. Demuestre que [Harrington-Paris] para toda m, k, l ∈ N \ {0} existe n ∈ N tal que ∗ n− → (m)kl . 67. Si µ ≥ ℵ0 y X = d(X) > µ. Q i∈I Xi con |Xi | ≥ 2 para i ∈ I, |I| > 2µ , muestre que 529 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 530 ✐ ✐ 7. Combinatoria infinita 68. Para un cardinal infinito µ, el logaritmo de µ, log µ, es el menor cardinal β tal que µ < 2β . Demuestre que si {Xi : i ∈ I} es una familia de espacios con |Xi | ≥ 2 para i ∈ I, |I| ≥ ℵ0 , entonces d( Y i∈I Xi ) = máx{log |I|, sup{d(Xi ) : i ∈ I}}. 69. Muestre que ω 6− → (ω)<ω 2 . 70. Sea κ un cardinal infinito, f : κ − → κ. (a) Muestre que existe X ∈ [κ]κ tal que f (α) ≤ f (β) siempre que α, β ∈ X cumplan con α < β. (b) Muestre que si κ es regular, existe Y ∈ [κ]κ tal que f ↾ Y es constante o estrictamente creciente. 71. Sean T un ℵ1 -árbol y P un conjunto linealmente ordenado. T es Pencajable si y sólo si existe una función f : T − → P que preserva el orden. Casos importantes son cuando P = Q o P = R. (a) Muestre que un ℵ1 -árbol T es Q-encajable si y sólo si existen anticadenas An , n < ω, de T tales que T = [ An . n<ω (b) Muestre que si un ℵ1 -árbol T es R-encajable, T es un árbol de Aronszajn pero no de Souslin. [Sugerencia: Use el inciso (a).] (c) Construya un ℵ1 -árbol Q-encajable. [Sugerencia: Use el árbol construido en el teorema 8.7]. (d) Muestre que ♦ implica la existencia de un árbol R-encajable que no es Q-encajable. 72. Dado un cardinal singular κ, construya un κ-árbol sin ramas cofinales. 73. Sea δ un ordinal límite. Una coloración de [δ]2 es una función de [δ]2 a algún conjunto finito C “de colores”. La coloración es aditiva si existe una función π : C × C − → C tal que si a < b < c en δ entonces f (a, c) = π(f (a, b), f (b, c)). Muestre que si f es una coloración aditiva de [δ]2 , entonces existe un subconjunto cofinal de δ que es f -indiscernible. 74. Demuestre el lema 11.9. [Sugerencia: Utilice la proposición 9.10.11]. 530 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 531 ✐ ✐ CAPÍTULO 8 Relativización y absolutez 531 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 532 ✐ ✐ 8. Relativización y absolutez En este capítulo trabajaremos principalmente con el lenguaje LTC. Primero estudiaremos las fórmulas del lenguaje desde el punto de vista de su validez en diversos modelos de la teoría. Para ello debemos describir cómo relativizar una fórmula a un modelo, con lo que podemos establecer la validez de la fórmula en diversas estructuras. Este proceso es necesario pues los modelos de ZFE generalmente no son conjuntos sino clases propias. Como aplicación, estudiamos la relativización de nociones como cardinalidad, cofinalidad, etc. También se estudia la relativización de los axiomas de ZFE, lo que nos permitirá demostrar resultados de consistencia relativa. Posteriormente introducimos ciertas clases (H(κ), OD, HOD) que sirven como modelos de ZFE o de fragmentos suyos. Posteriormente describiremos una clasificación de todas las fórmulas de LTC en términos de cuantificadores, la llamada jerarquía de Levy. 1. Relativización de una fórmula respecto a un ∈-término Un concepto importante de la teoría axiomática de conjuntos es el de relativización de LTC-una fórmula. Con ayuda de este concepto podemos definir “modelos” de la teoría de conjuntos cuyo universo sea un término clase y no un conjunto. Además, podemos determinar (en algunos casos) qué propiedades se preservan al pasar de un modelo a otro. Recuerde que un término clase es una clase de la forma {x : φ(x)}, donde φ(x) es una LTC-fórmula. Definición 1.1. Un ∈-término es una variable o un término clase. Definición 1.2. Sean W un ∈-término y ϕ una fórmula de LTC tales que ϕ y W no tienen variables libres en común. Definimos la relativización de ϕ con respecto a W, denotada por ϕW , mediante recursión sobre la construcción de fórmulas de LTC como sigue: Def ˙ j )W = vi =v ˙ j 1. (vi =v Def 2. (vi ∈ vj )W = vi ∈ vj 3. 4. 5. 6. Def (¬ψ)W = ¬ψ W Def (ψ ∧ χ)W = ψ W ∧ χ W Def (ψ ∨ χ)W = ψ W ∨ χ W Def (ψ ⇒ χ)W = ψ W ⇒ χ W 532 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 533 ✐ ✐ Conjuntos y modelos. Curso avanzado Def 7. (∀vi ψ)W = ∀vi (vi ∈ W ⇒ ψ W ) Def 8. (∃vi ψ)W = ∃vi (vi ∈ W ∧ ψ W ). Si Φ es un conjunto de fórmulas, entonces ΦW denota al conjunto {ϕW |ϕ ∈ Φ}. 1.1. Lema del modelo. La validez de una fórmula ϕ relativizada al término W puede interpretarse como la validez de la fórmula ϕ en el “modelo” (W, ∈), aunque W no es en general un conjunto; con el siguiente lema demostraremos que si bien W no es un modelo en el sentido estricto, puesto que no es un conjunto, se comporta como si lo fuera. Este lema será de gran relevancia en toda la teoría posterior, y el lector debe estar seguro de entenderlo antes de proseguir. Lema 1.3 (Lema del modelo). Sean Φ(x1 , . . . , xn ) un conjunto finito de fórmulas de LTC y ϕ(x1 , . . . , xn ) una fórmula de LTC tales que Φ ⊢ ϕ. Si W es un término que no tiene variables en común con Φ ni con ϕ, entonces ZF ⊢ W 6= ∅ ⇒ ∀x1 ∈ W . . . ∀xn ∈ W ( ^ ΦW ⇒ ϕW ). Demostración. Como Φ ⊢ ϕ, nuestra definición de derivación asegura que existen conjuntos de fórmulas Φ0 , . . . , Φn−1 y fórmulas ϕ0 , . . . , ϕn−1 tales que Φn−1 = Φ, ϕn−1 = ϕ y para 1 ≤ i ≤ n − 1, Φi ⊢ ϕi . Supongamos que Φi = Φi (yi0 , . . . , yimi ) y ϕi = ϕi (zi0 , . . . , zini ). Podemos suponer, sin perder generalidad, que W no tiene variables en común con Φi ni con ϕi . Vamos a demostrar por inducción fuerte sobre i que ZF ⊢ W 6= ∅ ⇒ ∀yi1 ∈ W . . . ∀yimi ∈ W∀zi1 ∈ W, . . . ∀zini ∈ W ( ^ W ΦW i ⇒ ϕi ). La hipótesis de inducción es para toda j < i. Hay que analizar varios casos de acuerdo con la manera en que se obtuvo Φi ⊢ ϕi . • Φi ⊢ ϕi es instancia de la regla de inicio (RI), es decir, ϕi pertenece a Φi o ϕi ≡ vk =v ˙ k . En cualquier caso la prueba es trivial, pues (vk =v ˙ k )W = vk =v ˙ k W W o ϕi pertenece a Φ . • Φi ⊢ ϕi es instancia de alguna de las reglas ∧1, ∧2, ∧3, ¬1, ¬2 o =. Como ejemplo veamos el caso de la regla ¬1. En tal caso existen j, k < i tales que ϕk = ¬ϕj y Φi ⊢ ϕj , Φi ⊢ ¬ϕj . La hipótesis de inducción nos permite V V W W concluir que ΦW Φ ⇒ ¬ϕjW , y como ϕjW ∧ ¬ϕjW ⇒ ϕkW , i ⇒ ϕj y V W i W entonces deducimos que Φi ⇒ ϕk . 533 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 534 ✐ ✐ 8. Relativización y absolutez • Φi ⊢ ϕi es instancia de alguna de las reglas ∀1, ∀2. Observemos primero que si tenemos dos fórmulas ψ(v1 , . . . , vr ), χ(u, u1 , . . . , uk ), entonces ∀v1 ∈ W . . . ∀vr ∈ W∀u1 ∈ W . . . ∀uk ∈ W (ψ ⇒ ∀u ∈ W χ) implica que ∀v1 ∈ W . . . ∀vr ∈ W∀u1 ∈ W . . . ∀uk ∈ W∀u ∈ W (ψ ⇒ χ), puesto que u no está libre en ψ. Analicemos el caso de la regla ∀1. Existen j < i y χ ≡ χ(zi1 , . . . , zi(ni −1) , z) tales que ϕj = ∀zχ y ϕi = χ{z/zin1 }, donde zini no figura acotada en χ. Por la hipótesis de inducción podemos concluir que V W ∀yi1 ∈ W . . . ∀yimi ∈ W∀zi1 ∈ W, . . . ∀zi(ni −1) ∈ W ( Φi ⇒ (∀zχ)W ) y como (∀zχ)W ≡ ∀z ∈ Wχ W , utilizando la observación anterior concluimos que ∀yi1 ∈ W . . . ∀yimi ∈ W∀zi1 ∈ W, . . . ∀zi(ni −1) ∈ W ∀z ∈ V W W ( ΦW i ⇒ χ ), lo cual es claramente equivalente a ∀yi1 ∈ W . . . ∀yimi ∈ W∀zi1 ∈ W, . . . ∀zi(ni −1) ∈ W∀zini ∈ W ( ^ W ΦW i ⇒ χ {z/zini }), que es lo que se quiere demostrar. Los casos restantes se dejan al lector. En presencia del lema del modelo podemos abusar de la notación y escribir hW, ∈i |= ϕ en lugar de ϕW . Puesto que W se comporta como un modelo de la lógica de primer orden, podemos demostrar una afirmación del tipo ϕW mostrando “dentro de W” la afirmación ϕ. Expliquemos esto formalmente. Lema 1.4. Sean W un término transitivo, χ(~x) una fórmula y ~y ∈ W. Si existe un conjunto T de enunciados y un conjunto finito Φ(~x) de fórmulas tales que T W , Φ(~y)W y T ∪ Φ(~x) ⊢ χ(~x), entonces χ(~y)W . Demostración. Sea T0 ⊆ T unVsubconjunto finito tal que T0 ∪ Φ(~x) ⊢ χ(~x). El lema del modelo implica que (T0 ∪Φ(~x))W ⇒ χ(~x)W para toda ~x ∈ W V W y como T0 , entonces tenemos Φ(~x)W ⇒ χ(~x)W para toda ~x ∈ W. Además, como Φ(~y)W , podemos concluir que χ(~y)W . 1.2. Relativización de los axiomas de ZFE. En esta sección investigamos en qué condiciones se cumplen los axiomas de ZFE en los “modelos” hW, ∈i. Estamos interesados en términos clase transitivos. Lema 1.5. Sean W 6= ∅ un término clase transitivo, x ∈ W y ϕ, ψ LTCfórmulas. Entonces 534 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 535 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) x ∩ W = x; (b) ∀y ((y ∈ x ∧ ϕ) ⇒ ψ) ⇔ ∀y ∈ W ((y ∈ x ∧ ϕ) ⇒ ψ); (c) ∃y (y ∈ x ∧ ϕ) ⇔ ∃y ∈ W (y ∈ x ∧ ϕ). Demostración. (a) Como W es transitivo, se sigue que para x ∈ W, x ⊆ W, lo cual implica x ∩ W = x. (b) es consecuencia inmediata de (a), ya que y ∈ x ⇔ y ∈ W ∧ y ∈ x. (c) es análogo a (b). Las condiciones necesarias y suficientes para la validez de los axiomas de ZFE en un término clase transitivo se exponen en el siguiente teorema: Teorema 1.6 (ZF ). Sea W 6= ∅ un término clase transitivo. Entonces (a) (b) (c) (d) (e) ExW . ExtW . ParW ⇔ ∀a ∈ W ∀b ∈SW {a, b} ∈ W. (Unión)W ⇔ ∀a ∈ W a ∈ W. ~ ), entonces Si ψ es la instancia de Comp construida con la fórmula ϕ(x, w ~ )} ∈ W ψ W ⇔ ∀~ w ∈ W ∀a ∈ W {x ∈ a | ϕW (x, w (f) PotW ⇔ ∀a ∈ W Pot(a) ∩ W ∈ W. (g) Inf W ⇔ ∃a ∈ W (∅ ∈ a ∧ ∀x ∈ a (x + 1 ∈ a)) En particular: ω ∈ W ⇒ Inf W e [(Inf W ∧ CompW ) ⇒ ω ∈ W]. ~ ) se tiene (h) ReempW se cumple si y sólo si para cada LTC-fórmula ϕ(x, y, w que: ∀~ w∈W ~ ) ∧ ϕW (x, y′ , w ~ ) ⇒ y = y′ ) (∀x, y, y′ ∈ W (ϕW (x, y, w ~ )} ∩ W ∈ W). ⇒ ∀a ∈ W {y | ∃x ∈ a ϕW (x, y, w (i) FundW . Es decir, si ψ es una instancia de Fund, entonces ψ W . (j) Axioma de elección: AE W ⇔ ∀a ∈ W (∅ ∈ / a ∧ ∀x, y ∈ a (x 6= y ⇒ x ∩ y = ∅)) ⇒ ∃b ∈ W ∀x ∈ a ∃z (b ∩ x = {z}). Demostración. (a) Tenemos que ExW ⇔ ∃x ∈ W ∀y ∈ W (y ∈ / x); usando el lema 1.5(a) podemos escribir ∀y ∈ W y ∈ / x ⇔ ∀y y ∈ / x, es decir, 535 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 536 ✐ ✐ 8. Relativización y absolutez ∀y ∈ W y ∈ / x ⇔ x = ∅; por lo tanto, tenemos ExW ⇔ ∃x ∈ W (x = ∅), así que basta demostrar que ∅ ∈ W. Para esto demostraremos antes que (1) x 6= ∅ ⇒ ∅ ∈ CT (x).1 demostraremos (1) mediante ∈-inducción. Sea x ∈ V ; si x = ∅, no hay nada que demostrar. Si no, sea y ∈ x. Si y = ∅, (1) queda demostrado; en otro caso, como y 6= ∅ entonces, por hipótesis de inducción, ∅ ∈ TC(y) y como TC(y) ⊆ TC(x), (1) queda demostrado. Tomemos ahora x ∈ W; si x = ∅, ya acabamos; si x 6= ∅ , por (1), ∅ ∈ TC(x) ⊆ W, de donde ∅ ∈ W y (a) queda demostrado. (b) Tenemos ExtW ⇔ ∀a, b ∈ W (a = b ⇔ ∀x ∈ W (x ∈ a ⇔ x ∈ b)) y por el lema 1.5(b), se sigue que, para a, b ∈ W ∀x ∈ W (x ∈ a ⇔ x ∈ b) ⇔ ∀x (x ∈ a ⇔ x ∈ b) de donde deducimos ExtW ⇔ ∀a, b ∈ W (a = b ⇔ a ⊆ b ∧ b ⊆ a); como estamos en presencia de ZF , esto último se satisface por Ext, por lo que (b) queda demostrado. (c) ParW ⇔ ∀a, b ∈ W ∃c ∈ W ∀x ∈ W (x ∈ c ⇔ x = a ∨ x = b). Del lema 1.5(b) se sigue ∀x ∈ W (x ∈ c ⇔ x = a ∨ x = b) ⇔ ∀x (x ∈ c ⇔ x = a ∨ x = b), para a, b, c ∈ W. Además, el lado izquierdo de esta equivalencia significa que c = {a, b}; por lo tanto, ParW ⇔ ∀a ∈ W ∀b ∈ W {a, b} ∈ W y (c) queda demostrado. (d) Se tiene (Unión)W ⇔ ∀a ∈ W ∃b ∈ W ∀x ∈ W (x ∈ b ⇔ ∃y ∈ W (y ∈ a ∧ x ∈ y)). Con ayuda del lema 1.5, se sigue que para a, b ∈ W: ∀x ∈ W (x ∈ b ⇔ ∃y ∈ W (y ∈ a ∧ x ∈ y)) ⇔ ∀x (x ∈ b ⇔ ∃y (y ∈ a ∧ x ∈ y)) y el lado izquierdo de esta bicondicional es equivalente a b = (Unión) W ⇔ ∀a ∈ W 1 [ a∈W S a. Por lo tanto, Recuerde que la cerradura transitiva CT (x) de x es el mínimo conjunto transitivo que contiene a x. 536 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 537 ✐ ✐ Conjuntos y modelos. Curso avanzado y (d) queda demostrado. (e) De la definición de ψ se sigue que ~ )), ψ ⇔ ∀~ w∀a∃b∀x (x ∈ b ⇔ x ∈ a ∧ ϕ(x, w de manera que si relativizamos, obtenemos ~ )) ψ W ⇔ ∀~ w ∈ W∀a ∈ W∃b ∈ W∀x ∈ W (x ∈ b ⇔ x ∈ a ∧ ϕW (x, w y en vista del lema 1.5(b), en el lado derecho de esta equivalencia se tiene ∀x (x ∈ b ⇔ ψ), que significa precisamente b = {x | ψ} = {x ∈ a | ~ )}, por lo que (e) queda demostrado. ϕW (x, w (f) Es análogo a (e), con la equivalencia PotW ⇔ ∀a ∈ W∃b ∈ W∀x ∈ W (x ∈ b ⇔ ∀y ∈ W (y ∈ x ⇒ y ∈ a)). (g) Inf W es equivalente a ∃a ∈ W(∃x ∈ W (x ∈ a ∧ ∀y ∈ W y ∈ / x) ∧ ∀x ∈ W(x ∈ a ⇒ ∃y ∈ W (y ∈ a ∧ ∀z ∈ W (z ∈ y ⇔ z = x ∨ z ∈ x))); además, mediante el lema 1.5(c) y lo que probamos para ExW , concluimos que ∃x ∈ W (x ∈ a ∧ ∀y ∈ W y ∈ / x) ⇔ ∃x (x ∈ a ∧ x = ∅), es decir, ∅ ∈ a. Aplicamos de nuevo el lema 1.5(b) y (c), para deducir que si a ∈ W entonces ∀x ∈ W (x ∈ a ⇒ ∃y ∈ W (y ∈ a ∧ ∀z ∈ W (z ∈ y ⇔ z = x ∨ z ∈ x))) ⇔ ∀x (x ∈ a ⇒ ∃y (y ∈ a ∧ ∀z (z ∈ y ⇔ z = x ∨ z ∈ x))); pero el lado izquierdo de la bicondicional equivale a ∀x ∈ a (x + 1 ∈ a); por lo tanto, Inf W ⇔ ∃a ∈ W (∅ ∈ a ∧ ∀x ∈ a (x + 1 ∈ a)). De aquí resulta inmediato que ω ∈ W implica Inf W . Supongamos ahora que Inf W + CompW . Sea a ∈ W tal que ∅ ∈ a y a es cerrado bajo la función sucesor x + 1. Sea s(x) ≡ ∃y ∈ x ∀z ∈ x (z ∈ y ∨ z = y) la fórmula que afirma que x es un sucesor; con ayuda de 1.5(a) tenemos que s(x)W ⇔ s(x) para cualquier x ∈ W. Sea ψ(x) ≡ x=∅ ˙ ∨ (s(x) ∧ ∀y ∈ x (y 6= ∅ ⇒ s(y)), a partir de que sW ⇔ s y del lema 1.5(a) deducimos que ψ(x)W ⇔ ψ(x) para cualquier x ∈ W, por lo que ω = {n | ψ(n)} = {n ∈ a | ψ(n)} = {n ∈ a | ψ W (n)} ∈ W, 537 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 538 ✐ ✐ 8. Relativización y absolutez donde la última afirmación de pertenencia se debe a que CompW . Así, (g) queda demostrado. ~ ) una LTC-fórmula y ψ la instancia de Reemp construida (h) Sea ϕ(x, y, w con ϕ. Al relativizar obtenemos lo siguiente: ~ ) ∧ ϕW (x, y′ , w ~ ) ⇒ y = y′ ) ψ W ⇔ ∀~ w ∈ W(∀x, y, y′ ∈ W (ϕW (x, y, w ~ ))). ⇒ ∀a ∈ W ∃b ∈ W ∀y ∈ W (y ∈ b ⇔ ∃x ∈ a ∩ W ϕW (x, y, w En vista del lema 1.5(a) tenemos a ∩ W = a; además, con la definición de b en el consecuente de la implicación principal del lado derecho de la equivalencia, obtenemos ~ ) ∧ ϕW (x, y′ , w ~ ) ⇒ y = y′ ) w ∈ W(∀x, y, y′ ∈ W (ϕW (x, y, w ψ W ⇔ ∀~ ~ )} ∩ W ∈ W), ⇒ ∀a ∈ W {y | ∃x ∈ a ϕW (x, y, w por lo que (h) queda demostrado. ~ ), es decir, (i) Sea ψ la instancia de Fund obtenida con ϕ(x, w ~ ) ⇒ ∃x (ϕ(x, w ~ ) ∧ ∀y ∈ x ¬ϕ(y, w ~ ))). ψ ⇔ ∀~ w (∃x ϕ(x, w ~ ∈ Sea ψ0 la instancia de Fund construida con la fórmula x ∈ W ∧ w ~ ). Observe que para y ∈ x ∈ W y w ~ ∈ W se cumple que W ∧ ϕW (x, w ~ )) ⇔ ¬ϕW (y, w ~ ). Ahora utilizamos lo anterior ~ ∈ W ∧ ϕW (x, w ¬(x ∈ W ∧ w en la definición de ψ0 para concluir que ~) ψ0 ⇔ ∀~ w ∈ W (∃x ∈ W ϕW (x, w ~ ) ∧ ∀y ∈ x ¬ϕW (y, w ~ )))); ⇒ ∃x ∈ W (ϕW (x, w pero el lado derecho de la equivalencia es precisamente ψ W , de modo que ψ W ⇔ ψ0 y como ψ0 es válida por Fund, (i) queda demostrado. (j) AE W es equivalente a ∀a ∈ W ∃b ∈ W((∀x ∈ W (x ∈ a ⇒ ∃y ∈ W y ∈ x) ∧ ∀x ∈ W∀y ∈ W ((x ∈ a ∧ y ∈ a ∧ x 6= y) ⇒ ¬∃z ∈ W (z ∈ x ∧ z ∈ y))) ⇒ ∀x ∈ W (x ∈ a ⇒ ∃y ∈ W (y ∈ x ∧ y ∈ b ∧ ∀z ∈ W ((z ∈ x ∧ z ∈ b) ⇒ z = y)))). 538 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 539 ✐ ✐ Conjuntos y modelos. Curso avanzado A través de múltiples aplicaciones del lema 1.5(b) y (c) se sigue de manera análoga al análisis para Inf W que la fórmula anterior es equivalente a ∀a ∈ W ∃b ∈ W((∀x (x ∈ a ⇒ ∃y y ∈ x) ∧ ∀x∀y ((x ∈ a ∧ y ∈ a ∧ x 6= y) ⇒ ¬∃z (z ∈ x ∧ z ∈ y))) ⇒ ∀x (x ∈ a ⇒ ∃y (y ∈ x ∧ y ∈ b ∧ ∀z ((z ∈ x ∧ z ∈ b) ⇒ z = y)))). Pero esto último es válido por AE , de manera que (j) queda demostrado. Con lo cual el teorema queda probado. A continuación analizaremos la jerarquía de von Neumann con ayuda del teorema 1.6, es decir, veremos qué se necesita para que un estrato de la jerarquía sea modelo de algunos axiomas de ZFE. Por ejemplo, se sabe que Vω es modelo de ZFE −Inf, de manera que el razonamiento ingenuo diría que basta subir un estrato y habremos conseguido un modelo de ZFE. El problema es que Vω+1 no valida Reemp; es más, como veremos más adelante, la condición para que un estrato sea modelo de Reemp es que su índice sea un cardinal (fuertemente) inaccesible, pero si I es la afirmación “existe un cardinal (fuertemente) inaccesible”, entonces demostraremos Con(ZFE) ⇒ Con(ZFE +¬I), donde Con(T) significa que T es consistente. Así que el problema no es nada trivial. Para demostrar la validez de Reemp en la jerarquía de von Neumman, necesitaremos el siguiente lema. Lema 1.7. Sea κ un cardinal fuertemente inaccesible. Entonces ∀β < κ (|Vβ | < κ). Demostración. Por inducción transfinita hasta κ. β = 0. Es trivial, |V0 | = 0 < κ β = γ + 1. Sea λ = |Vγ |. Por la hipótesis de inducción se sigue que λ < κ, lo que junto con la inaccesibilidad de κ propicia 2λ < κ. En consecuencia, |Vβ | = |Pot(Vγ )| = 2λ < κ. Def Lím(β). Para γ < β, hacemos λγ = |Vγ | y como β < κ, entonces λγ < κ (por HI). Además, κ es regular, por lo que Σγ<β λγ = |β| · supγ<β λγ < κ. Por 539 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 540 ✐ ✐ 8. Relativización y absolutez consiguiente, |Vβ | = | [ γ<β con lo que el lema queda demostrado. λγ | < κ, Pasamos ahora al análisis anunciado. Teorema 1.8 (ZFE ). Sea α ∈ OR, α > 0. Entonces: (a) ExVα , ExtVα , (Unión)Vα , CompVα , FundVα y AE Vα (b) Si α > ω, entonces Inf Vα . (c) Si lím(α), entonces ParVα y PotVα . (d) Si α = ω o α es un cardinal inaccesible, entonces ReempVα . Demostración. Nos serviremos del teorema 1.6. (a) Por la transitividad de Vα se sigue inmediatamenteSExVα , ExtVα y FundVα . Para demostrar (Unión)Vα fijemos α ∈ Vα . Si y ∈ a, existe x ∈ a tal que y ∈ x, por lo que rg(y) < rg(x) < rg(a) y esto implica rg(y) + 1 ≤ rg(a). Podemos entonces afirmar que rg( [ S a) = sup {rg(y) + 1 | y ∈ S [ a} ≤ rg(a) < α, por lo que rg( a) < α, es decir, a ∈ Vα . Por lo tanto, (Unión)Vα , debido al teorema 1.6. ~ ∈ Vα y ϕ(x, w ~ ) una fórmula La validez de CompVα se obtiene así: sean a, w V α ~ )} ⊆ a, entonces rg({x ∈ a | ϕVα (x, w ~ )}) ≤ de LTC. Como {x ∈ a | ϕ (x, w V α ~ )} ∈ Vα . rg(a) < α, es decir, {x ∈ a | ϕ (x, w Para demostrar AE Vα fijemos a ∈ Vα como un conjunto no vacío de conjuntos ajenos. Por AE existe un b ∈ V tal que b tiene, con cada elemento de a, uno y sólo un elemento en común. Para eliminar de b todos los elementos Def S “inútiles” ( aquellos que no son elementos de a) hacemos b′ = {x∩b | x ∈ a}. Entonces b′ es un conjunto que tiene exactamente un elemento en común con S S cada elemento de a; además b′ ⊆ a, de lo cual se sigue rg(b′ ) ≤ rg( a) ≤ rg(a) < α. Así que b′ ∈ Vα y AE Vα queda demostrado. (b) Si α > ω entonces ω ∈ Vα , pues ω ∈ Vω+1 ⊆ Vα , por lo que Inf Vα . (c) Supongamos que lím(α). Sean a, b ∈ Vα , por lo que rg(a), rg(b) < α; esto implica que rg(a) + 1, rg(b) + 1 < α, por ser α límite. Así que rg({a, b}) = máx {rg(a) + 1, rg(b) + 1} < α y con esto {a, b} ∈ Vα , es decir, ParVα . 540 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 541 ✐ ✐ Conjuntos y modelos. Curso avanzado Por otra parte, rg(Pot(a) ∩ Vα ) ≤ rg({x | x ⊆ a}) = sup {rg(x) + 1 | x ⊆ a} < rg(a) + 1 < α, donde la penúltima desigualdad se debe a que rg(x) ≤ rg(a). De este modo, Pot(a) ∩ Vα ∈ Vα . Por lo tanto, PotVα . (d) Supongamos ahora que α es un cardinal fuertemente inaccesible. ~ ) de LTC y w ~ ∈ Vα tal que Fijemos una fórmula ϕ(x, y, w ~ ) ⇒ y = y′ ). ~ ) ∧ ϕVα (x, y′ , w ∀x, y, y′ (ϕVα (x, y, w Sea a ∈ Vα . Entonces existe β < α con a ∈ Vβ . Puesto que ϕVα se comporta como función, existe para cada x ∈ a a lo sumo un y(x) ∈ Vα ~ ); en caso de que para alguna x no exista tal y hacemos tal que ϕVα (x, y(x), w y(x) = ∅. Sea τ(x) = rg(y(x)). Se tiene τ(x) < α y se sigue que ~ )} ∩ Vα ) ≤ rg({y(x) | x ∈ a}) rg({y | ∃x ∈ a ϕVα (x, y, w = sup {τ(x) + 1 | x ∈ a}. Ahora utilizamos el lema 1.7: dado que a ⊆ Vβ , se concluye |a| < α y por la regularidad de α se sigue que sup {τ(x) + 1 | x ∈ a} < α. ~ )} ∩ Vα ∈ Vα , lo cual valida ReempVα . Por lo tanto, {y | ∃x ∈ a ϕVα (x, y, w Para el caso α = ω se argumenta de manera análoga. Corolario 1.9. Es válido (ZFE − Inf)Vω . Si κ es un cardinal fuertemente inaccesible, entonces ZFEVκ . A continuación obtenemos el resultado anunciado acerca de cardinales fuertemente inaccesibles. Teorema 1.10. La existencia de cardinales fuertemente inaccesibles no es demostrable en ZFE . Más aún, no es posible mostrar que la existencia de cardinales fuertemente inaccesibles sea consistente con ZFE . Esto es, si Def I = ∃κ (κ fuertemente inaccesible), entonces: (a) ZFE 0 I. (b) Con(ZFE) ⇒ Con(ZFE + ¬I). (c) ZFE 0 Con(ZFE) ⇒ Con(ZFE + I). 541 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 542 ✐ ✐ 8. Relativización y absolutez Demostración. Probaremos esto con ayuda del segundo teorema de incompletud de Gödel. (a) Se tiene ZFE ⊢ ∀κ (κ fuertemente inaccesible ⇒ ZFEVκ ). Supongamos que ZFE ⊢ I. Sea κ0 = mín {κ | κ es fuertemente inaccesible}; entonces ZFE ⊢ κ0 es fuertemente inaccesible, por lo que se concluye ZFE ⊢ ZFEVκ0 , es decir, ZFE ⊢ Con(ZFE), lo que contradice el teorema de incompletud de Gödel. (b) Es inmediato de (a). (c) Supongamos lo contrario. En tal caso, del corolario 1.9 se concluye que ZFE + I ⊢ ZFEVκ . Por lo tanto, ZFE + I ⊢ Con(ZFE), lo cual, junto con la hipótesis de que nos lleva a ZFE ⊢ [Con(ZFE) ⇒ Con(ZFE + I)], ZFE + I ⊢ Con(ZFE + I), contradiciendo nuevamente el segundo teorema de incompletud de Gödel. Observe que de (c) se sigue que es desconocido (y esperamos que así permanezca) si ZFE + I es consistente. 2. Absolutez de fórmulas Para transmitir el concepto de subestructura elemental a modelos clase de LTCteorías, introducimos el concepto de fórmula absoluta. Intuitivamente, una fórmula es absoluta si lo que expresa no cambia de significado al interpretarla en diferentes modelos. Considere por ejemplo la siguiente versión del axioma de infinito: ∃x (0 ∈ x ∧ ∀y ∈ x(s(y) ∈ x)). En él tenemos dos nociones previamente definidas que son 0 y s(x). La intuición nos dice que el axioma es cierto en Vω+1 (si tomamos x = ω) y es falso en Vω , pero la prueba rigurosa requiere que nos cercioremos si 0 y s(x) significan lo mismo en Vω+1 y Vω que en V . Si esto sucede diremos que 0 y s(x) son nociones absolutas. En esta sección desarrollamos este concepto de manera formal. 542 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 543 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 2.1. Sean W, W ′ ∈-términos y ϕ(x1 , . . . , xn ) una LTC-fórmula que no tiene variables en común con W ni con W ′ . Decimos que ϕ es W − W ′ absoluta si ′ ∀x1 . . . ∀xn (ϕW (x1 , . . . , xn ) ⇔ ϕW (x1 , . . . , xn )). En particular, a las fórmulas W − V -absolutas las llamamos simplemente Wabsolutas. Observe que una fórmula ϕ(x1 , . . . , xn ) de LTC es W-absoluta si y sólo si ∀x1 , . . . , xn ∈ W (ϕW ⇔ ϕ). Si W ⊆ W ′ y sustituimos las variables libres de ϕ con parámetros x1 , . . . , xn de W, entonces la W − W ′ -absolutez de ϕ significa precisamente que hW, ∈i |= ϕ[x1 , . . . , xn ] ⇔ hW ′ , ∈i |= ϕ[x1 , . . . , xn ]. Como primer resultado concerniente al concepto de absolutez, enunciamos el siguiente lema, cuya demostración queda al lector. Lema 2.2. Sean W, W ′ términos clase tales que W ⊆ W ′ , Γ un conjunto de enunciados de LTC y φ, ψ fórmulas de LTC tales que M, N son modelos de Γ y Γ ⊢ ∀~x(φ(~x) ↔ ψ(~x)). Con estas hipótesis, φ es W − W ′ -absoluta si y sólo si ψ lo es. Demostración. Ejercicio. ¿Qué fórmulas son absolutas? La primera respuesta la proporciona el siguiente lema Lema 2.3. Sean ∅ 6= W ⊆ W ′ ∈-términos. Entonces: (a) Las fórmulas atómicas son W − W ′ -absolutas. (b) Si ϕ, ψ son W − W ′ -absolutas, entonces ¬ϕ y ϕ ∧ ψ también lo son, por lo que ϕ ∨ ψ, ϕ ⇒ ψ y ϕ ⇔ ψ son W − W ′ -absolutas. (c) Si W es transitivo y ϕ es W − W ′ -absoluta, también lo es ∀x ∈ y ϕ; por consiguiente, ∃x ∈ y ϕ es W − W ′ -absoluta. ′ Demostración. (a) Es claro, pues ϕW ≡ ϕ ≡ ϕW . ′ (b) De las hipótesis se sigue que ∀x1 , . . . , xn ∈ W (¬(ϕW ) ⇔ ¬(ϕW )), lo cual, por definición de relativización, equivale a ∀x1 , . . . , xn ∈ W ((¬ϕ)W ⇔ 543 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 544 ✐ ✐ 8. Relativización y absolutez ′ ′ ′ (¬ϕ)W ). Análogamente, tenemos ∀x1 , . . . , xn ∈ W (ϕW ∧ ψ W ⇔ ϕW ∧ ψ W ), ′ es decir, ∀x1 , . . . , xn ∈ W ((ϕ ∧ ψ)W ⇔ (ϕ ∧ ψ)W ). (c) Primero observe que, debido a la transitividad de W, se cumple y ∈ W ⇒ y ∩ W = y ∩ W ′. (1) Sean ϕ ≡ ϕ(x, y, ~z) y y, ~z ∈ W. Entonces (∀x ∈ y ϕ(x, y, ~z))W ⇔ ∀x ∈ y ∩ W ϕ(x, y, ~z)W ⇔ ∀x ∈ y ∩ W ϕ(x, y, ~z)W ′ (por la W − W ′ -absolutez de ϕ) ′ ⇔ ∀x ∈ y ∩ W ′ ϕ(x, y, ~z)W (por (1)) ′ ⇔ (∀x ∈ y ϕ(x, y, ~z))W . El lema muestra que, respecto a la absolutez, las fórmulas de LTC que juegan un papel importante son aquellas cuyos cuantificadores están acotados por conjuntos, es decir, las fórmulas Σ0 que pronto se definirán formalmente (véase la Sec. 8); por el momento tenemos el siguiente corolario: Corolario 2.4. Sean W, W ′ términos, W 6= ∅, W ⊆ W ′ y W transitivo. Entonces cada fórmula Σ0 que no tiene variables en común con W ni con W ′ es W − W ′ -absoluta. En realidad podemos debilitar este último resultado a fórmulas ΣT0 , es decir, fórmulas ϕ equivalentes a fórmulas Σ0 según T; esto es, fórmulas tales que T ⊢ ∀~x (ϕ ⇔ ψ), donde ψ es una fórmula Σ0 . Esto lo asegura el siguiente teorema. Teorema 2.5 (TEC ). Sean W, W ′ , ∈-términos, W ⊂ W ′ , W 6= ∅, W ′ transitivo y T un conjunto de fórmulas que contiene a TEC tal que T W , T W . Entonces, cada ΣT0 -fórmula que no comparte variables con W ni con W ′ es W − W ′ absoluta. Demostración. Sean ϕ(~x) una ΣT0 -fórmula, ψ(~x) una Σ0 -fórmula tales que T ⊢ ∀~x (ϕ ⇔ ψ) y Ψ un subconjunto finito de T tal que Ψ ⊢ ∀~x (ϕ ⇔ ψ). Aplicamos el lema del modelo para lograr ^ (ΨW ) ⇒ ∀~x ∈ W (ϕW ⇔ ψ W ) 544 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 545 ✐ ✐ Conjuntos y modelos. Curso avanzado así como ^ ′ ′ ′ (ΨW ) ⇒ ∀~x ∈ W ′ (ϕW ⇔ ψ W ). V ′ V Puesto que por hipótesis (ΨW ), (ΨW ) son válidas para ~x ∈ W, se cumple ′ ′ ϕW (~x) ⇔ ψ W (~x) y ϕW (~x) ⇔ ψ W (~x), de manera que ′ ′ (ϕW (~x) ⇔ ψ W (~x)) ⇔ (ψ W (~x) ⇔ ϕW (~x)), (ψ∈Σ0 ) que es lo que se quería demostrar. Muchas fórmulas usadas frecuentemente en el lenguaje de la teoría de conjuntos son Σ0 -fórmulas. En el lema 8.4 se dan algunos ejemplos importantes. 3. Relativización de términos respecto a términos En un modelo clase W cada término t da lugar a un término t W , al que llamamos interpretación de t en W. Definición 3.1. Sea t(~x) un término y W un ∈-término tales que t y W no tienen variables en común. Definimos la relativización t W de t a W como sigue: (a) Si t es una variable, entonces t W = t. (b) Si t = {v : ϕ(v, ~x)}, entonces t W = {v ∈ W : ϕW (v, ~x)}. El siguiente lema es de gran utilidad cuando se necesita relativizar una fórmula, y muestra que esta relativización funciona de manera adecuada. Lema 3.2 (Lema de relativización). Sean ϕ(u0 , . . . , un−1 , ~y) una fórmula de LTC y t0 (~x), . . . , tn−1 (~x) términos clase. Sea W un término transitivo. Además, supongamos que ti y ϕ no tienen variables en común con W. Entonces W ∀~x ∀~y ∈ W (ϕ(t0 , . . . , tn−1 , ~y)W ⇔ ϕW (t0W , . . . , tn−1 , ~y)). Demostración. Por inducción sobre la construcción de términos. Sea ti = {v : ψi (v, ~x)}. - Base de la inducción. Hay que analizar 5 casos: (a) ϕ ≡ y ∈ u0 . ϕ(t0 , y)W ⇔ (y ∈ t0 )W ⇔ ψ0 (y, ~x)W ⇔ y ∈ W ∧ ψ0W (y, ~x) (observe que y ∈ W por hipótesis) ⇔ y ∈ t0W ⇔ ϕW (t0W , y). 545 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 546 ✐ ✐ 8. Relativización y absolutez (b) ϕ ≡ y=u ˙ 0. ϕ(t0 , y)W ⇔ (y = t0 )W ⇔ (∀z (z ∈ y ⇔ z ∈ t0 ))W ⇔ ∀z ∈ W ((z ∈ y)W ⇔ (z ∈ t0 )W ) ⇔ ∀z ∈ W (z ∈ y ⇔ z ∈ t0W ) (por el caso (a)) ⇔ ∀z (z ∈ y ⇔ z ∈ t0W ) (pues t0W , y ⊆ W) ⇔ ϕW (t0W , y). (c) ϕ ≡ u0 ∈ y. Para y ∈ W se deduce ϕ(t0 , y)W ⇔ (t0 ∈ y)W ⇔ (∃z (z = t0 ∧ z ∈ y))W ⇔ ∃z ∈ W ((z = t0 )W ∧ z ∈ y) ⇔ ∃z ∈ W (z = t0W ∧ z ∈ y) (por el caso (b)) ⇔ ∃z (z = t0W ∧ z ∈ y) (pues y ⊆ W) ⇔ ϕW (t0W , y). (d) ϕ ≡ u0 ∈ u1 . ϕ(t0 , t1 )W ⇔ (t0 ∈ t1 )W ⇔ (∃z (z = t0 ∧ z ∈ t1 ))W ⇔ ∃z ∈ W ((z = t0 )W ∧ (z ∈ t1 )W ) ⇔ ∃z ∈ W (z = t0W ∧ z ∈ t1W ) (por los casos (a) y (b)) ⇔ ∃z (z = t0W ∧ z ∈ t1W ) (pues t1 ⊆ W) ⇔ ϕW (t0W , t1W ). (e) ϕ ≡ u0 =u ˙ 1. ϕ(t0 , t1 )W ⇔ (t0 = t1 )W ⇔ (∀z (z ∈ t0 ⇔ z ∈ t1 ))W ⇔ ∀z ∈ W ((z ∈ t0 )W ⇔ (z ∈ t1 )W ) ⇔ ∀z ∈ W (z ∈ t0W ⇔ z ∈ t1W ) (por el caso (a)) ⇔ ∀z (z ∈ t0W ⇔ z ∈ t1W ) (pues tiW ⊆ W) - Paso inductivo. ⇔ ϕW (t0W , t1W ). 546 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 547 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) ϕ ≡ ¬ϕ0 . ϕ(t0 , . . . , tn−1 , ~y)W ⇔ ¬(ϕ0 (t0 , . . . , tn−1 , ~y)W ) W ,~ ⇔ ¬(ϕ0W (t0W , . . . , tn−1 y)) (por H.I.) W W W ⇔ ϕ (t0 , . . . , tn−1 , ~y). (b) ϕ ≡ ϕ0 ∧ ϕ1 . Es análogo al caso anterior. (c) ϕ ≡ ∃zϕ0 (u0 , . . . , un−1 , z, ~y). Entonces para ~y ∈ W se tiene ϕ(t0 , . . . , tn−1 , ~y)W ⇔ ∃z ∈ W (ϕ0 (t0 , . . . , tn−1 , z, ~y))W W , z, ~ ⇔ ∃z ∈ W ϕ0W (t0W , . . . , tn−1 y) (por H.I.) W W W ⇔ ϕ (t0 , . . . , tn−1 , ~y), con lo cual queda demostrado el teorema. El siguiente corolario muestra que t W juega el mismo papel en W que t en V . Corolario 3.3. Sean Φ(~x, ~y) un conjunto de fórmulas de LTC, ϕ(u0 , . . . , un−1 , ~y) una LTC-fórmula y t0 (~x), . . . , tn−1 (~x) términos clase. Sea W 6= ∅ un término transitivo que no tiene variables en común con ti , Φ y ϕ. Suponga además ΦW y Φ ⊢ ϕ(t0 (~x), . . . , tn−1 (~x), ~y). Entonces W ∀~x ∈ W ∀~y ∈ W ϕW (t0W , . . . , tn−1 , ~y). Demostración. Usando el teorema de compacidad, podemos suponer que Φ es finita. Mediante el lema del modelo obtenemos ∀~x ∈ W∀~y ∈ W ( ^ ΦW ⇒ ϕ(t0 , . . . , tn−1 , ~y)W ). Como ΦW , entonces el consecuente de la implicación es válido y, mediante el W ,~ lema de relativización, es igual a ϕW (t0W , . . . , tn−1 y). Para terminar esta sección, obtenemos la relativización de algunos términos de interés. Lema 3.4. Sean W transitivo y x, x1 , . . . , xn , y ∈ W. Entonces: W = W. (a) ∅SW = ∅, V S (b) ( x)W = x. (c) Pot(x)W = Pot(x) ∩ W. (d) {x1 , . . . , xn }W = {x1 , . . . , xn }. 547 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 548 ✐ ✐ 8. Relativización y absolutez (e) (f) (g) (h) (x, y)W = (x, y) ∩ W. Si ParW entonces (x, y)W = (x, y). (x + 1)W = x + 1. ORW = OR ∩ W. Si ω ∈ W entonces ωW = ω. Demostración. (a) ∅W = {x ∈ W : x 6= x} = ∅ y V W = {x ∈ W : x = x} = W . (b) ( [ x)W = {z : ∃y (y ∈ x ∧ z ∈ y)}W = {z ∈ W : ∃y ∈ W (y ∈ x ∧ z ∈ y)} = {z ∈ W : ∃y (y ∈ x ∩ W ∧ z ∈ y)} = {z : ∃y (y ∈ x ∩ W ∧ z ∈ y)} (porque z ∈ y ∈ W ⇒ z ∈ W) = (c) [ (x ∩ W) = [ x. Pot(x)W = {z : ∀y (y ∈ z ⇒ y ∈ x)}W = {z ∈ W : ∀y ∈ W (y ∈ z ⇒ y ∈ x)} = {z ∈ W : ∀y (y ∈ z ⇒ y ∈ x)} (porque y ∈ z ∧ z ∈ W ⇒ y ∈ W) = Pot(x) ∩ W. (d) {x1 , . . . , xn }W = {z ∈ W : z = x1 ∨ . . . ∨ z = xn } = {x1 , . . . , xn }. (e) (x, y)W = {z : z = {x} ∨ z = {x, y}}W = {z ∈ W : (z = {x} ∨ z = {x, y})W } = {z ∈ W : z = {x}W ∨ z = {x, y}W } (por el lema de relativización) = {z ∈ W : z = {x} ∨ z = {x, y}} (por (d)) = (x, y) ∩ W. Además, si ParW entonces {x}, {x, y} ∈ W, lo cual conduce a (x, y) ∩ W = (x, y). (f) (x + 1)W = {z ∈ W : z ∈ x ∨ z = x} = {z : z ∈ x ∨ z = x} = x + 1. 548 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 549 ✐ ✐ Conjuntos y modelos. Curso avanzado (g) Es fácil ver que la fórmula Trans(x) ∧ OLE(x, ∈↾ x) es Σ0 y, por lo tanto, es W − V -absoluta. Se sigue que ORW = {x : Trans(x) ∧ OLE(x, ∈↾ x)}W = {x ∈ W : (Trans(x) ∧ OLE(x, ∈↾ x))W } = {x ∈ W : (Trans(x) ∧ OLE(x, ∈↾ x))} (por la absolutez de la fórmula que lo define) = OR ∩ W. (h) Sea Ind(x) la fórmula que expresa que x es inductivo. Para x ∈ W se tiene Ind(x)W ⇔ (∅ ∈ x ∧ ∀y (y ∈ x ⇒ y + 1 ∈ x))W ⇔ ∅W ∈ x ∧ ∀y ∈ W (y ∈ x ⇒ (y + 1)W ∈ x) (lema de relativización) ⇔ ∅ ∈ x ∧ ∀y ∈ W (y ∈ x ⇒ y + 1 ∈ x) (por (a) y (f)) ⇔ ∅ ∈ x ∧ ∀y (y ∈ x ⇒ y + 1 ∈ x) (por la transitividad de W) ⇔ Ind(x). lo cual conduce a ωW = {x : ∀y (Ind(y) ⇒ x ∈ y)}W = {x ∈ W : ∀y ∈ W (Ind(y) ⇒ x ∈ y)}. Si en esta última igualdad escogemos y = ω, obtenemos ωW ⊆ ω. Además, de la definición de ω, (ω ⊆ W) pues ω ∈ W, se sigue inmediatamente que ω ⊆ ωW . Lema 3.5. Sea W transitivo tal que ParW . Sean A, B, F ∈-términos tales que si alguno es una variable, entonces pertenece a W. Entonces, (a) (A × B)W = AW × BW . (b) dom(F )W = dom(F W ). (c) ran(F )W = ran(F W ) 549 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 550 ✐ ✐ 8. Relativización y absolutez Demostración. (a) Tenemos que A × B = {z : ∃x, y (x ∈ A ∧ y ∈ B ∧ z = (x, y))}. Aplicamos el lema de relativización para obtener lo siguiente: z ∈ (A × B)W ⇔ z ∈ W ∧ ∃x, y ∈ W (x ∈ AW ∧ y ∈ BW ∧ z = (x, y)W ) ⇔ z ∈ W ∧ ∃x, y ∈ W (x ∈ AW ∧ y ∈ BW ∧ z = (x, y)) (pues ParW ). ⇔ ∃x, y ∈ W (x ∈ AW ∧ y ∈ BW ∧ z = (x, y)) (pues ParW ). ⇔ ∃x, y (x ∈ AW ∧ y ∈ BW ∧ z = (x, y)) (ya que AW , BW ⊆ W) ⇔ z ∈ AW × B W . (b) Como ParW , entonces (x, y)W = (x, y) para x, y ∈ W. Así que tenemos dom(F )W = {x : ∃y (x, y) ∈ F }W = {x ∈ W : (∃y (x, y) ∈ F )W } = {x ∈ W : ∃y ∈ W ((x, y)W ∈ F W )} (lema de relativización) = {x ∈ W : ∃y ∈ W (x.y) ∈ F W } (porque x, y ∈ {x, y} ∈ (x, y) ∈ F W ⊆ W, implica x, y ∈ W ) = {x : ∃y (x, y) ∈ F W } = dom(F W ). (c) Es análogo a (b). Corolario 3.6. Sean W, A, B, F como en el lema 3.5 y TEC W . Entonces Rel(F )W ⇔ Rel(F W ). Fun(F )W ⇔ Fun(F W ). (dom(F ) = A)W ⇔ dom(F W ) = AW . (ran(F ) ⊆ B)W ⇔ ran(F W ) ⊆ BW . (F : A −→ B)W ⇔ F W : AW −→ BW . En particular, se cumple W (A B)W = (A )(BW ) ∩ W. 6. Si F W : AW −→ BW , entonces F (x)W = F W (x) para cualquier x ∈ AW . 1. 2. 3. 4. 5. 550 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 551 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. (a) Rel(F )W ⇔ (∀z (z ∈ F ⇒ ∃x, y (z = (x, y))))W ⇔ ∀z ∈ W (z ∈ F W ⇒ ∃x, y ∈ W (z = (x, y)W )) ⇔ ∀z ∈ W (z ∈ F W ⇒ ∃x, y ∈ W (z = (x, y))) (pues ParW ) ⇔ ∀z ∈ W (z ∈ F W ⇒ ∃x, y (z = (x, y))) (porque x, y ∈ {x, y} ∈ z ∈ W implica x, y ∈ W ) ⇔ ∀z (z ∈ F W ⇒ ∃x, y z = (x, y)) (ya que F W ⊆ W ) ⇔ Rel(F W ). (b) Análogo a (a) a partir de Fun(F ) ⇔ Rel(F ) ∧ ∀x, y, y′ ((x, y) ∈ F ∧ (x, y′ ) ∈ F ⇒ y = y′ ). (c) De la misma manera, a partir de dom(F ) = A ⇔ ∀x (x ∈ A ⇔ ∃y (x, y) ∈ F ). (d) Análogo a (c). (e) La primera afirmación se sigue de F : A −→ B ≡ Fun(F ) ∧ dom(F ) = A ∧ ran(F ) ⊆ B y de lo ya demostrado. La segunda afirmación se obtiene como sigue: (BA )W = {f ∈ W : (f : A −→ B)W } = {f ∈ W : f W : AW −→ BW } = {f ∈ W : f : A = (AW ) (BW ) ∩ W W W −→ B } (por la primera afirmación) (relativización de la variable f ) (f) Sabemos que TEC ⊢ (F : A −→ V ) ⇒ ∀x (x ∈ dom(F ) ⇒ ∀y ((x, y) ∈ F ⇔ y = F (x))) (1) ∀x ∈ W (x ∈ dom(F W ) ⇒ ∀y ∈ W ((x, y) ∈ F W ⇔ y = F (x)W )). (2) y usando TEC W concluimos que tal afirmación sigue siendo cierta al relativizarla a W. Como (F : A −→ V )W es válida, por (e) y el lema de relativización tenemos que 551 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 552 ✐ ✐ 8. Relativización y absolutez Tomemos x ∈ AW = dom(F W ) y sea y = F W (x), entonces por (1), con F W en lugar de F y AW en lugar de A, se cumple que (x, y) ∈ F W . Esto implica, usando (2), que y = F (x)W ; por lo tanto, F (x)W = F W (x). Con lo cual se concluye la demostración. Para terminar la sección enunciaremos un último corolario con resultados conocidos. Corolario 3.7. Sea W un término transitivo no vacío tal que TEC W . Entonces, para x, y ∈ W se cumple (a) (b) (c) (D) (e) (f) ∅ ∈ W. S y ∈ W. {x, y} ∈ W. (x, y) ∈ W. x + 1 ∈ W. Si además ReempW y f ∈ W, entonces dom(f ) ∈ W y ran(f ) ∈ W. Demostración. Se deja como ejercicio al lector. 4. Absolutez de LTC-términos Considere dos términos transitivos W, W ′ tales que W ⊆ W ′ . Si t(~x) es cualquier otro término, entonces t(~x) define un objeto matemático conocido al “evaluar” en el valor ~x. ′ Para ~x ∈ W también tenemos dos objetos matemáticos, t W (~x) y t W (~x). Si para cada elección de ~x ∈ W estos dos objetos se comportan de igual forma, diremos que el término t es W −W ′ -absoluto, donde comportarse igual respecto a W y W ′ significa ′ (a) t W (~x) ∈ W ⇔ t W (~x) ∈ W ′ . ′ (b) t W (~x) ∈ W ⇒ t W (~x) = t W (~x). Formalicemos este criterio: Definición 4.1. Sean W, W ′ términos y t W (~x) un término que no tiene variables en común con W ni con W ′ . Decimos que t es W − W ′ -absoluto si (i) ∃y (y = t(~x)) es W − W ′ -absoluta. (ii) y = t(~x) es W − W ′ -absoluta. Suponemos que y no figura en W, en W ′ ni en t. 552 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 553 ✐ ✐ Conjuntos y modelos. Curso avanzado Esta definición coincide con la motivación, como lo asegura el siguiente lema: Lema 4.2. Sean W, W ′ términos transitivos, con W ⊆ W ′ , entonces t es W − W ′ -absoluto si y sólo si para todo ~x ∈ W se cumplen (a) y (b). Demostración. ⇒ ) Sea U un término transitivo cualquiera que no comparta variables con t; entonces t U (~x) ∈ U ⇔ ∃y ∈ U (y = t(~x)) ⇔ (∃y (y = t(~x)))U . Utilizamos (i), con W y W ′ en lugar de U, para lograr ′ ′ t W (~x) ∈ W ⇔ (∃y (y = t(~x)))W ⇔ (∃y (y = t(~x)))W ⇔ t W (~x) ∈ W ′ . (i) Así hemos demostrado (a). Para (b) sean ~x ∈ W y t W (~x) ∈ W. En vista de que tenemos t W (~x) ∈ W, podemos concluir (∃y (y = t(~x)))W . Sea y = t W (~x) y observe que, por (ii), la siguiente fórmula es válida: ′ y = t W (~x) ⇔ y = t W (~x). Dado que se cumple el lado izquierdo de esta equivalencia, necesariamente ′ ′ y = t W (~x), lo cual implica que t W (~x) = t W (~x). ⇐ ) Supongamos (a) y (b). Sean ~x ∈ W, y lo siguiente es válido usando el lema de relativización y (a): (∃y (y = t(~x)))W ⇔ ∃y ∈ W (y = t W (~x))) ⇔ t W (~x) ∈ W ′ ′ ⇔ t W (~x) ∈ W ′ ⇔ . . . ⇔ (∃y (y = t(~x))))W , (a) por lo que se cumple (i). Tomemos ahora y ∈ W y supongamos que (y = t(~x))W o, lo que es ′ equivalente, t W (~x) = y ∈ W. Mediante (b) deducimos t W (~x) = t W (~x) = y ∈ ′ W. Por lo tanto, (y = t(~x))W , de acuerdo con el lema de relativización. Así ′ que (y = t(~x))W ⇒ (y = t(~x))W . ′ ′ Supongamos ahora que (y = t(~x))W . Como t W (~x) = y ∈ W ⊆ W ′ , por (a) concluimos que t W (~x) ∈ W, de manera que, utilizando (b), obtenemos ′ t W (~x) = y, es decir, (y = t(~x))W . Por lo tanto, (y = t(~x))W ⇒ (y = t(~x))W y (ii) queda demostrado. 553 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 554 ✐ ✐ 8. Relativización y absolutez A continuación ejemplificamos los conceptos anteriores. Ya mostramos que ωU = ω para cualquier término transitivo U tal que ω ∈ U, utilizando la siguiente definición: ω = {x : ∀y (Ind(y) ⇒ x ∈ y)}. Ahora bien, para los términos transitivos Vα con α ∈ OR, se tiene que ω Vα =   Vα  ω si α ≤ ω; si α > ω. Puesto que si α ≤ ω, la inexistencia de elementos inductivos en Vα obliga a que la fórmula sea válida para cualquier elemento de Vα y si α > ω, entonces, como ω ∈ Vω+1 , concluimos que ω ∈ Vα . En resumen: (a) Si m ≤ n ≤ ω, entonces el término ω es Vm − Vn -absoluto ya que ωVm ∈ / Vm , ω Vn ∈ / Vn . (b) Si m ≤ ω < α, entonces el término ω no es Vm − Vα -absoluto pues ωVm ∈ / Vm pero ωVα ∈ Vα , lo que contradice al inciso (a) de la definición. (c) Si ω < α < β, entonces el término ω es Vα − Vβ -absoluto debido a que V α ω ∈ Vα , ωVβ ∈ Vβ y ωVα = ωVβ . El siguiente lema proporciona algunos términos absolutos: Lema 4.3. Sean W, W ′ términos transitivos no vacíos, con W ⊆ W ′ , tales que ′ TEC W y TEC W . Entonces los siguientes términos son W − W ′ -absolutos: (a) (b) (c) (d) (e) (f) (g) ∅, V S y {x, y} (x, y) x+1 Si además CompW , entonces dom(f ) y ran(f ) son W − W ′ -absolutos. Si además ω ∈ W o Inf W + SubW , entonces ω es W − W ′ -absoluto. Demostración. Se deja como ejercicio al lector. 4.1. Absolutez de términos definidos por recursión. En esta sección investigamos la absolutez de términos definidos con ayuda del esquema general de recursión, y para ello necesitaremos del siguiente lema. 554 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 555 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 4.4 (ZF − ). Sea U un término clase transitivo no vacío tal que (ZF − )U . Sean A, R, G términos clase y F el término canónico obtenido mediante G por R-recursión sobre A. Si (BF (A, R) ∧ G : A × V ⇒ V )U entonces BF (AU , RU ), GU : AU × U ⇒ U y F U : AU ⇒ U. Además, para cualquier a ∈ AU se cumple que {F U (b) : bRU a} ∈ U y F (a)U = F U (a) = GU (a, {F U (b) : bRU a}) y en el caso de que a ∈ U \ AU , F (a)U = U ∈ / U. Demostración. (a) Por demostrar BF (AU , RU ). (BF1) RU ⊆ AU × AU . Por hipótesis tenemos que (R ⊆ A × A)U debido a BF (A, R)U , de manera que con ayuda de los lemas del modelo y de relativización suceden las siguientes equivalencias: (R ⊆ A × A)U ⇔ ⇔ ⇔ ⇔ (∀z (z ∈ R ⇒ z ∈ A × A))U ∀z ∈ U (z ∈ RU ⇒ z ∈ AU × AU ) ∀z (z ∈ RU ⇒ z ∈ AU × AU ) (pues RU ⊆ U) RU ⊆ AU × AU . Por lo tanto, RU ⊆ AU × AU . (BF2) ∀u (u 6= ∅ ⇒ ∃x (x ∈ u∧∀y (y ∈ u ⇒ ¬yRx))). Sea u ∈ V, u 6= ∅, y consideramos dos casos: 1. u \ AU 6= ∅. Sea x ∈ u \ AU y entonces x es un elemento RU -mínimo de U puesto que yRU x implica x ∈ ran(RU ) ⊆ AU , de donde x ∈ AU , lo cual es absurdo. 2. u ⊆ AU . Sea χ el término canónico definido mediante H por R-recursión sobre A, donde H = {((x, f ), sup ran(f )) : x ∈ A ∧ f : x −→ OR} ∪ {((x, f ), ∅) : x ∈ A ∧ ¬(f : x −→ OR)}. Puesto que BF(A,R), entonces, por el esquema general de recursión se cumple, en presencia de ZF − : χ : A −→ OR y χ(x) = sup{χ(y) : yRx} para toda x ∈ A. Además, es cierto que ZF − ⊢ BF (A, R) ⇒ (χ : A −→ OR ∧ ∀x, y ∈ A (yRx ⇒ χ(y) ∈ χ(x))). 555 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 556 ✐ ✐ 8. Relativización y absolutez Ahora bien, como (ZF − )U y BF (A, R)U tenemos que χ U : AU −→ OR ∩ U ∧ ∀x, y ∈ AU (yRU x ⇒ χ U (y) ∈ χ U (x))). Consideremos una x ∈ U de tal manera que χ U (x) = mín {χ U (y) : y ∈ u}. Afirmamos que x es un elemento RU -mínimo de u. De lo contrario, si y ∈ u y yRU x entonces χ U (y) ∈ χ U (x), contradiciendo la minimalidad de χ U (x). Por lo tanto, x es el elemento mínimo requerido. (BF3) ∀x ({z : zRU x} ∈ V ). Como BF (A, R)U , en particular se cumple (∀x {z : zRx} ∈ V )U y tenemos las siguientes equivalencias: (∀x {z : zRx} ∈ V )U ⇔ ∀x ∈ U ({z : zRU x} ∈ U) ⇔ (z ∈ {z} ∈ (z, x) ∈ RU ⊆ U)) ∀x ({z : zRU x} ∈ U) (pues U ⊆ V ) ⇔ ∀x ({z : zRU x} ∈ V ). Así que BF 3 se cumple. Por lo tanto, hemos demostrado BF (AU , RU ). (b) Queremos demostrar GU : AU × U −→ U. Es trivial, a partir de la hipótesis (G : A × V −→ V )U , ya que (G : A × V −→ V )U ⇒ GU : (A × V )U −→ V U ⇒ GU : AU × U −→ U. (c) Por demostrar F U : AU −→ U. A partir del esquema general de recursión y de la definición del término F (a), lo siguiente es válido: ZF − ⊢ (BF (A, R) ∧ G : A × V −→ V ) ⇒ (F : A −→ V ∧ ∀a ∈ A ∃y (y = (F (b) | bRa) ∧ F (a) = G(a, y)) ∧ ∀a (a ∈ / A ⇒ F (a) = V )). De esta manera, utilizando las hipótesis (ZF − )U y ( BF (A, R) ∧ G : A × V ⇒ V )U , concluimos que [F : A −→ V ∧ ∀a ∈ A ∃y (y = (F (b) | bRa) ∧ F (a) = G(a, y)) ∧ ∀a (a ∈ / A ⇒ F (a) = V )]U . 556 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 557 ✐ ✐ Conjuntos y modelos. Curso avanzado Con ayuda del lema de relativización llegamos a F U : AU −→ U∧ ∀a ∈ AU ∃y ∈ U (y = (F (b) | bRa)U ∧ F U (a) = GU (a, y))∧ ∀a ∈ U (a ∈ / AU ⇒ F (a)U = U). En particular, tenemos que F U : AU −→ U. (d) Debemos mostrar que si a ∈ U, entonces (F (b) | bRa)U = (F U (b) | bRU a). Sea a ∈ U, y se cumplen las siguientes igualdades: (F (b) | bRa)U = {z : ∃b, y ((bRa ∧ y = F (b) ∧ z = (b, y))}U = {z ∈ U : ∃b, y ∈ U (bRU a ∧ y = F (b)U ∧ z = (b, y))} (b ∈ dom(RU ) ⊆ AU = dom(F U ), por lo que F (b)U = F U (b)) = {z ∈ U : ∃b, y ∈ U (bRU a ∧ y = F U (b) ∧ z = (b, y))} (z = (b, y) ∈ U, pues b, y ∈ U y ParU ) = {z : ∃b, y ∈ U (bRU a ∧ y = F U (b) ∧ z = (b, y))} (pues b, y ∈ AU ⊆ U, porque (b, y) ∈ RU ⊆ AU × AU ) = {z : ∃b, y (bRU a ∧ y = F U (b) ∧ z = (b, y))} = (F U (b) | bRU a). Por lo tanto, hemos demostrado lo deseado. (e) Debemos mostrar que (F U (b) | bRU a) ∈ U. Es inmediato, usando lo demostrado en (c) y (d). (f) Por demostrar que si a ∈ U, entonces F (a)U = F U (a) = GU (a, (F U (b) | U bR a)). Pero F (a)U = F U (a) = GU (a, (F (b) | bRa)U ) = GU (a, (F U (b) | bRU a)). (c) (d) AU (g) Queremos demostrar que si a ∈ / entonces F (a)U = U ∈ / U, lo que es inmediato a partir de (c). Con lo cual queda demostrado el lema. Ahora ya podemos demostrar el resultado anunciado sobre absolutez de términos definidos recursivamente. Teorema 4.5 (ZF − ). Sean W, W ′ términos transitivos no vacíos, con W ⊆ ′ W ′ , tales que (ZF − )W y (ZF − )W . Sean A, R, G términos clase tales que 557 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 558 ✐ ✐ 8. Relativización y absolutez (*) (BF (A, R) ∧ G : A × V −→ V )W . ′ (**) (BF (A, R) ∧ G : A × V −→ V )W . Sea F el término canónico obtenido mediante G por R-recursión sobre A. Si lo siguiente es válido: (a) Las fórmulas x ∈ A, yRx son W − W ′ -absolutas. ′ (b) ∀a ∈ A ∀y ∈ W (GW (a, y) = GW (a, y)). (c) W es cerrado respecto a R-predecesores, según W ′ ; es decir, ′ ∀x ∈ W ∀y ∈ W ′ ((yRx)W ⇒ y ∈ W), entonces el término F (a) es W − W ′ -absoluto. Demostración. Con las hipótesis del teorema se cumplen las afirmaciones del lema 4.4. Primero vamos a demostrar, mediante RW -inducción, que ′ a ∈ AW ⇒ F W (a) = F W (a). (i) Sea a ∈ AW . Como la fórmula x ∈ A es W − W ′ -absoluta, se tiene que ′ a ∈ AW y por el lema 4.4 obtenemos ′ ′ ′ ′ F W (a) = GW (a, y) con y = (F W (b) | bRW a), ′ con lo cual se concluye que y ∈ W ′ , puesto que W ′ |= ZF − y F W (b) ∈ W ′ ′ ′ ′ para toda bRW a. Si bRW a, entonces (bRa)W ; así, utilizando la hipótesis (c), concluimos que b ∈ W ya que a ∈ W. ′ Como a, b ∈ W y (bRa)W , se sigue que (bRa)W , es decir, bRW a por la absolutez de yRx. En consecuencia, ′ y = (F W (b) | bRW a) ′ (H.I. F W (b) = F W (b)) = (F W (b) | bRW a) de donde, por el lema 4.4, y ∈ W y ′ ′ F W (a) = GW (a, y) = GW (a, y) = F W (a). (b) Por lo tanto, (i) queda demostrado. ′ Ahora bien, si a ∈ W \ AW entonces, como W ⊆ W ′ y a ∈ / AW (por la ′ W − W ′ -absolutez de x ∈ A ) a ∈ W ′ \ AW , y el lema 4.4 nos permite concluir que ′ F (a)W = W ∈ / W y F (a)W = W ′ ∈ / W ′. 558 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 559 ✐ ✐ Conjuntos y modelos. Curso avanzado En conclusión, hemos demostrado que ′ (a) para todo a ∈ W (F (a)W ∈ W ⇔ F (a)W ∈ W ′ ); ′ (b) para todo a ∈ W (F (a)W ∈ W ⇒ F (a)W = F (a)W ). Así que, por el lema 4.2, el término F (a) es W − W ′ -absoluto. Corolario 4.6 (ZF − ). Sean W, W ′ términos transitivos no vacíos, con W ⊆ ′ W ′ , tales que (ZF − )W y (ZF − )W . (a) Sea G un término clase tal que (G : OR × V −→ V )W y (G : OR × V −→ ′ V )W . Sea F el término canónico obtenido mediante G por <-recursión sobre OR. Si se cumple que ′ ∀α ∈ OR ∩ W ∀y ∈ W (GW (a, y) = GW (a, y)), entonces F (a) es W − W ′ -absoluto. (b) Sea G un término clase tal que (G : OR × V −→ V )W y (G : OR × V −→ ′ V )W . Sea F el término canónico obtenido mediante G por ∈-recursión sobre V . Si se cumple que ′ ∀a, y ∈ W (GW (a, y) = GW (a, y)), entonces F (a) es W − W ′ -absoluto. Demostración. Basta ver que se cumplen las hipótesis del teorema 4.5. ′ (a) Como (ZF − )W , (ZF − )W y ZF − ⊢ BF (OR, <), entonces las hipótesis (*) y (**) del teorema 4.5 se cumplen. Como la fórmula x ∈ OR es ΣTec 0 , la fórmula x < y ≡ x ∈ OR ∧ y ∈ OR ∧ x ∈ y es ΣTec y, por lo tanto, es 0 ′ W − W -absoluta, es decir, se cumple la hipótesis (a) del teorema. Debido a que ORW = OR ∩ W, también es cierta la hipótesis (b) del teorema. ′ Además, si x ∈ W, y ∈ W ′ entonces (y < x)W , lo que conlleva a y ∈ x ∈ W; por lo tanto, y ∈ W en vista de la transitividad de W. La hipótesis (c) se cumple. (b) Es análogo. Como una aplicación del teorema 4.5 demostramos que la función rango es W − W ′ -absoluta. Teorema 4.7 (ZF − ). Sean W, W ′ términos transitivos no vacíos, con W ⊆ ′ W ′ , tales que (ZF − )W y (ZF − )W . Entonces el término rg(a) es W − W ′ absoluto. En particular, se tiene que rg(a) = rgW (a) ∈ W para cualquier a ∈ W. 559 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 560 ✐ ✐ 8. Relativización y absolutez Demostración. rg es el término canónico obtenido mediante G por ∈recursión sobre V , donde Def G = {((x, f ), sup ran(f )) : f : x −→ OR} ∪ {((x, f ), ∅) : ¬ (f : x −→ OR)}. ′ Puesto que (ZF − )W , (ZF − )W y ZF − ⊢ G : V × V −→ V , se tiene que ′ (G : V × V ∈ V )W y (G : V × V ∈ V )W . En particular, GW : W × W −→ W. Puesto que ZF − ⊢ y = G(x, f ) ⇔ y ∈ OR ∧ ((f : x −→ y ∧ ∀z ∈ y ¬(f : x −→ z)) ∨ (¬(f : x −→ y) ∧ y = ∅)) ′ y (ZF − )W,W , mediante la relativización de las fórmulas arriba citadas, para x, f, y ∈ W obtenemos2 y y = GW (x, f ) ⇔ y ∈ OR ∩ W ∧ ((f : x −→ y ∧ ∀z ∈ y ¬(f : x −→ z)) ∨ (¬(f : x −→ y) ∧ y = ∅)) ′ y = GW (x, f ) ⇔ y ∈ OR ∩ W ′ ∧ ((f : x −→ y ∧ ∀z ∈ y ¬(f : x −→ z)) ∨ (¬(f : x −→ y) ∧ y = ∅)). Por lo tanto, para x, f, y ∈ W se cumple que ′ y = GW (x, f ) ⇔ y = GW (x, f ). Dado que GW (x, f ) ∈ W, podemos fijar y = GW (x, f ) para obtener ′ GW (x, f ) = GW (x, f ). Por último, mediante el corolario 4.6(b) obtenemos que rg(a) es W − W ′ -absoluto. Corolario 4.8 (ZF − ). Sea W un término transitivo no vacío, con (ZF − )W . Entonces, ∀α ∈ OR ∩ W (VαW = Vα ∩ W). Demostración. VαW = {x : rg(x) < α}W = {x ∈ W : rg(x)W } = Vα ∩ W. La última igualdad se justifica porque rg(x)W = rg(x). 2 Nótese que la fórmula h : u −→ v es W − W ′ -absoluta. 560 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 561 ✐ ✐ Conjuntos y modelos. Curso avanzado 5. Relativización y absolutez de cardinales En esta sección investigamos el comportamiento de números cardinales respecto a la relativización. CARD es la clase de todos los cardinales y CAR la clase de todos los cardinales infinitos. Teorema 5.1. Sea W un término transitivo no vacío tal que ZFEW y x ∈ W. Entonces (a) (b) (c) (d) (e) (f) biy |x|W = mı́n {α ∈ OR : ∃f ∈ W (f : x −→ α)}. ∀α ∈ OR ∩ W (ω ≤ α ⇒ ω ≤ |α|W ≤ α). CARW = {|z|W : z ∈ W ∧ |z|W ≥ ω} = {ℵW α : α ∈ OR ∩ W}. W W CARD = ω ∪ CAR . ∀α ∈ OR ∩ W, (α+ )W = mı́n {κ ∈ CARW : κ > α}. + W W ∀α ∈ OR ∩ W ∀κ ∈ CARW (κ = ℵW α ⇔ (κ ) = ℵα+1 ). Demostración. biy (a) |x| = {β : β ∈ OR ∧ ∀α ((α ∈ OR ∧ ∃f, f : x −→ α) ⇒ β ∈ α)}. Entonces |x|W = {β ∈ W : β ∈ ORW ∧ ∀α ∈ W ((α ∈ ORW ∧ ∃f ∈ W, biy f : x −→ α) ⇒ β ∈ α)} = {β : β ∈ OR ∩ W ∧ ∀α ((α ∈ OR ∩ W ∧ ∃f ∈ W, biy f : x −→ α) ⇒ β ∈ α)} biy = mı́n {α ∈ OR ∩ W : ∃f ∈ W f : x −→ α}. La primera igualdad se debe a la absolutez de la biyección y la segunda a que α ∈ OR ∩ W implica α ∈ W. Finalmente, como f ∈ W conduce a que ran(f ) ∈ W, necesariamente α ∈ W, por lo que biy |x|W = mı́n {α ∈ OR : ∃f ∈ W (f : x −→ α)}. (b) Como ZFE ⊢ ∀α ∈ OR (ω ≤ α ⇒ ω ≤ |α| ≤ α), utilizamos los lemas de relativización y del modelo para obtener ∀α ∈ ORW (ωW ≤ α ⇒ ωW ≤ |α|W ≤ α), es decir, ∀α ∈ OR ∩ W (ω ≤ α ⇒ ω ≤ |α|W ≤ α). (c) El hecho de que si α ∈ CAR entonces ZFE ⊢ ∃x (|x| = α) implica que |x|W ∈ W para toda x ∈ W. 561 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 562 ✐ ✐ 8. Relativización y absolutez De la definición CAR = {α : ω ≤ α, ∃z (α = |z|)} obtenemos CARW = {α ∈ W : ωW ≤ α ∧ ∃z ∈ W (α = |z|W )} = {α : ω ≤ α ∧ ∃z ∈ W (α = |z|W )} = { |z|W : z ∈ W ∧ ω ≤ |z|W }. W Para demostrar que CARW = {ℵW α : α ∈ OR ∩ W}, usamos que ZFE y que ZFE ⊢ ∀κ (κ ∈ CAR ⇔ ∃α ∈ OR (κ = ℵα )). Como ZFEW entonces, relativizando, obtenemos que ∀κ ∈ W (κ ∈ CARW ⇔ ∃α ∈ ORW (κ = ℵW α )), de donde se concluye inmediatamente lo deseado. (d) El resultado se obtiene inmediatamente al relativizar la siguiente afirmación: ZFE ⊢ ∀κ (κ ∈ CARD ⇔ κ < ω ∨ κ ∈ CAR). (e) De ZFE ⊢ ∀α ∈ OR (α+ ∈ CAR ∧ α < α+ ∧ ∀κ ∈ CAR (α < κ ≤ = α+ )) se sigue, con ayuda de los lemas del modelo y relativización, α+ ⇒ κ que ∀α ∈ OR ∩ W es decir, ((α+ )W ∈ CARW ∧ α < (α+ )W ∧ ∀κ ∈ CARW ((α < κ ≤ (α+ )W ) ⇒ κ = (α+ )W ), ∀α ∈ OR ∩ W ((α+ )W = mı́n {κ ∈ CARW : κ > α}). κ+ (f) En forma similar, a partir de ZFE ⊢ ∀α ∈ OR ∀κ ∈ CAR (κ = ℵα ⇔ = ℵα+1 ). Con lo cual queda todo demostrado. En lo que respecta a las relaciones entre los cardinales de dos modelos, tenemos lo siguiente. Teorema 5.2. Sean W, W ′ términos transitivos no vacíos, con W ⊆ W ′ , tales ′ que ZFEW y ZFEW . Sea x ∈ W y entonces ′ (a) |x| ≤ |x|W ≤ |x|W . ′ (b) x ∈ CARW ⇒ x ∈ CARW . (c) La LTC-fórmula “x es finito” es W − W ′ -absoluta. W′ (d) ℵW 0 = ℵ0 . 562 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 563 ✐ ✐ Conjuntos y modelos. Curso avanzado biy (a) Sean A = {α ∈ OR : ∃f ∈ W, f : x −→ α}, B = Demostración. biy biy {α ∈ OR : ∃f ∈ W ′ , f : x −→ α}, C = {α ∈ OR : ∃f, f : x −→ α}. Como W ⊆ W ′ ⊆ V , tenemos que A ⊆ B ⊆ C, lo cual implica que mı́n C ≤ mı́n B ≤ mı́n A, pero esto indica precisamente que (utilizando el ′ Teorema 5.1[a]) |x| ≤ |x|W ≤ |x|W . ′ (b) Sea x ∈ CARW ∩ W (recuerde que por hipótesis x ∈ W); como ZFE ⊢ ∀α ∈ CAR (|α| = α), W′ ′ entonces |x| = x, así que, utilizando (a), obtenemos x = |x|W ≤ |x|W ≤ x. Por lo tanto, |x|W = x y, con ayuda del teorema 5.1(c), concluimos que x ∈ CARW . (c) Es suficiente considerar el caso W ′ = V (¿Por qué?). Como ZFEW , ZFE ⊢ (x es finito ⇔ |x| < ω) y ωW = ω, entonces ∀x ∈ W ( (x es finito )W ⇔ |x|W < ω), así que basta demostrar ∀x ∈ W (|x|W < ω ⇔ |x| < ω). ⇒ ) Es inmediato a partir de (a): |x| < |x|W < ω. ⇐ ) Por contrapositiva. Sean x ∈ W y κ = |x|W biy ≥ ω. Queremos demostrar que |x| ≥ ω. Tomemos f ∈ W, f : x −→ κ y supongamos que biy |x| < ω; entonces existen n ∈ ω y g ∈ V tales que g : n −→ x, pero en tal caso biy f ◦ g : n −→ κ, lo cual es absurdo, por la elección de κ. Por lo tanto, |x| ≥ ω. (d) Es trivial pues ZFE ⊢ ℵ0 = ω y ω es un término absoluto. Así queda todo demostrado. En el siguiente lema observamos el comportamiento de algunos enunciados de LTC que involucran cardinales. Lema 5.3. Sea W un término transitivo no vacío tal que ZFEW . Entonces: (a) ∀κ ∈ CARDW ∀µ(µ = (κ+ )W ⇒ (cf (µ)W = µ ∧ (µ es regular)W )). W (b) Sea κ = ℵW α y entonces, para cualquier α ∈ OR , se cumple lo siguiente: ℵ W κ W α (i) (2 ) = (2 ) . (ii) (ωℵα )W = (ωκ )W . (iii) (ORℵα )W = (ORκ )WS . W W ). (c) ∀x ∈ W (x ⊆ CARD ⇒ x ∈ CARD S W (d) ∀x ∈ W (x ⊆ CAR ∧ x 6= ∅ ⇒ x ∈ CARW ). 563 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 564 ✐ ✐ 8. Relativización y absolutez Demostración. (a) Se obtiene de manera análoga a la demostración del teorema 5.1(e), con ayuda de ZFE ⊢ ∀κ ∈ CARD ∀µ (µ = κ+ ⇒ cf (µ) = µ ∧ µ es regular). (b) Como ejemplo demostraremos (iii): (ORℵα )W W = (ORW )(ℵα ) (cor. 3.6) = (ORW )κ ∩ W = (ORW )(κ = (ORκ )W (cor. 3.6) W) (por la definición de relativización de variables κ = κW ) ∩W (c) Es inmediato, tomando en cuenta que el término utilizando nuestro ya conocido truco con ZFE ⊢ ∀x (x ⊆ CARD ⇒ [ S x es W-absoluto y x ∈ CARD). (d) De manera análoga a (c), mediante la absolutez de ∅ y ZFE ⊢ ∀x (x ⊆ CAR ∧ x 6= ∅ ⇒ Con ello queda todo demostrado. [ x ∈ CAR). A continuación presentamos un par de resultados concernientes al comportamiento de la cofinalidad al relativizarla. Teorema 5.4. Sea W un término transitivo no vacío tal que ZFEW . Sea γ ∈ ORW tal que lím(γ).3 Entonces (a) cf (γ) = mı́n { |z|W : z ∈ W ∧ z es no acotado en γ}; (b) ω ≤ cf (γ)W ≤ γ. Demostración. (a) Sabemos que cf (γ) = {β ∈ OR : ∀z (z ⊆ γ ∧ z es no acotado en γ ⇒ β ∈ |z| )}, 3 Por lo tanto, lím(γ)W . 564 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 565 ✐ ✐ Conjuntos y modelos. Curso avanzado de donde, utilizando la absolutez de las fórmulas z ⊆ γ y “z es no acotado en γ”, se sigue que cf (γ)W = {β ∈ ORW : ∀z ∈ W (z ⊆ γ ∧ z es no acotado en γ ⇒ β ∈ |z|W )} = {β : β ∈ OR ∩ W ∧ ∀z ∈ W (z ⊆ γ ∧ z es no acotado en γ ⇒ β ∈ |z|W } = mín { |z|W : z ∈ W ∧ z es no acotado en γ}. (b) Se demuestra de la manera usual a partir de ZFE ⊢ ∀γ (Lím(γ) ⇒ ω ≤ cf (γ) ≤ γ). Para terminar la sección, exponemos el siguiente teorema sobre la cofinalidad de ordinales. ′ Teorema 5.5. Sean W, W ′ términos transitivos no vacíos con ZFEW , ZFEW . Sea γ ∈ ORW un ordinal límite. Entonces ′ (a) cf (γ) ≤ cf (γ)W ≤ cf (γ)W ; ′ (b) (γ es regular )W ⇒ (γ es regular )W . Demostración. (a) Se procede de manera análoga a la demostración del teorema 5.2(a), con ′ ′ las desigualdades |z| ≤ |z|W , para z ∈ W ′ y |z|W ≤ |z|W , z ∈ W. Además, se utiliza la absolutez de “z es no acotado en γ”: cf (γ) = mín{|z| : z ∈ V ∧ z es no acotado en γ} ≤ mín{ |z| : z ∈ W ′ ∧ z es no acotado en γ} ′ ≤ mín{ |z|W : z ∈ W ′ ∧ z es no acotado en γ} = cf (γ)W ′ ′ ≤ mín{ |z|W : z ∈ W ∧ z es no acotado en γ} ≤ mín{ |z|W : z ∈ W ∧ z es no acotado en γ} = cf (γ)W . 565 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 566 ✐ ✐ 8. Relativización y absolutez ′ ′ ′ (b) (γ es regular )W implica (cf (γ) = γ)W , de donde cf (γ)W = γ. De esto se sigue, mediante (a) y el teorema 5.4(b), que ′ γ = cf (γ)W ≤ cf (γ)W ≤ γ. Por lo tanto, γ = cf (γ)W . Es decir, (γ = cf (γ))W o, de manera equivalente, (γ es regular )W . Así queda todo demostrado. 6. Pruebas de consistencia relativa Una teoría axiomática es consistente si sus axiomas no son contradictorios, es decir, si dentro de la teoría no se pueden probar contradicciones. El teorema de incompletud de Gödel afirma que ninguna teoría axiomática, al menos tan poderosa como la aritmética de Peano, puede probar su consistencia. Esto es, si existe una prueba de consistencia de la teoría en cuestión, necesariamente utiliza métodos que no son formalizables dentro de ella; por ejemplo, la aritmética de Peano AP es consistente pero tal prueba utiliza, además de los axiomas de AP, el axioma de inducción transfinita IT (ε0 ) hasta un ordinal muy especial llamado ε0 ; dichos axiomas obviamente conforman una teoría más fuerte, de manera que lo que realmente se tiene es una prueba de consistencia relativa de la forma Con(AP + IT (ε0 )) ⇒ Con(AP). Para un detallado estudio de esta prueba de consistencia relativa, véase [Mi97]. Las pruebas de consistencia relativa en teoría de conjuntos siempre se basan en una teoría que por lo general es ZF o ZFE. En este sentido, tales pruebas difieren de la prueba de consistencia de la aritmética en que se supone la consistencia de una teoría más debil, es decir, se está trabajando dentro de cierta teoría para probar la consistencia de la misma junto con algún axioma adicional. Es imposible mostrar la consistencia absoluta de ZF o teorías relacionadas teniendo como única herramienta a ZF. Por otra parte, si asumimos que ZF o ZFE es consistente, podríamos preguntarnos si la teoría sigue siendo consistente al agregar un axioma. Sea T una teoría matemática —en nuestro caso T es ZF o ZFE— y sea A un axioma adicional. Decimos que T + A es relativamente consistente con respecto a T o que A es consistente con T si se cumple la siguiente implicación: Con(T) ⇒ Con(T + A). 566 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 567 ✐ ✐ Conjuntos y modelos. Curso avanzado Si A y ¬A son consistentes con T, entonces decimos que A es independiente de T. La pregunta ¿es A consistente con T? es equivalente a preguntarnos si T ⊢ ¬A, siempre y cuando T sea consistente. 6.1. El método de modelos internos. Definición 6.1. Sea W un término clase. Decimos que W es un modelo interno de ZF si W 6= ∅, W es transitivo y para cada axioma ϕ de ZF se cumple ϕW . Los modelos internos permiten construir pruebas de consistencia relativa como lo establece el siguiente teorema, comúnmente llamado lema fundamental de modelos internos. En particular, estaremos trabajando con un modelo interno de alguna extensión de ZF . Bajo la construcción de modelos internos, es decir, la definición en LTC de la clase transitiva que resultará ser dicho modelo interno, subyace un método para obtener resultados de consistencia relativa. Teorema 6.2 (Lema fundamental de modelos internos). Sean Γ, Σ conjuntos de enunciados de LTC, φ un LTC-enunciado y W un término clase tal que (i) Γ ⊢ ∃x(x ∈ W); (ii) Γ ⊢ σ W , para todo σ ∈ Σ. Con estas hipótesis, se tiene que (a) si Σ ⊢ φ, entonces Γ ⊢ φW ; (b) Con(Γ) implica Con(Σ). Demostración. (a) Sea φ un enunciado de LTC tal que Σ ⊢ φ, y sea h(Φ0 , φ0 ), . . . , (Φn , φn )i una derivación de φ a partir de Σ, es decir, Φn = Σ, φn = φ y para cada i = 0, . . . , n, (Φi , φi ) se obtuvo por la regla (RI) o se obtuvo de anteriores aplicando una regla del cálculo de secuencias. Así, si se considera la sucesión φ0W , . . . , φnW de fórmulas relativizadas, es claro que si φi ∈ Σ o φi ≡ t =t, ˙ entonces Γ ⊢ φiW , por (ii) en el primer caso y por (RI) en el segundo. De igual manera, si φi se obtuvo a partir de φ0 , . . . , φi−1 aplicando una regla del cálculo de secuencias, entonces φiW se obtiene a partir de W aplicando la misma regla. Así, el argumento inductivo garantiza φ0W , . . . , φi−1 que φnW = φW es un teorema de Γ. (b) Si Σ es inconsistente, entonces existe φ un enunciado de LTC tal que de Σ se deriva φ ∧ ¬φ; luego, aplicando (a), se tiene que en Γ es teorema (φ ∧ ¬φ))W , pero según la definición de relativización, se tiene que Γ ⊢ φW ∧ ¬(φW ). 567 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 568 ✐ ✐ 8. Relativización y absolutez Es decir, Γ es inconsistente. Según la notación de este teorema, para Σ = Γ ∪ {σ} (donde σ es algún enunciado de LTC) se tiene que la consistencia de Γ implica la consistencia de Γ ∪ {σ} y, por lo tanto, que Γ 0 ¬σ siempre y cuando Γ sea consistente. Es así como se relacionan las nociones de modelo interno y de consistencia relativa. El siguiente corolario es de gran utilidad: Corolario 6.3 (ZF ). Sea W un modelo interno de ZF y φ un LTC-enunciado tal que ZF ⊢ φW . Entonces Con(ZF ) ⇒ Con(ZF + ϕ). Demostración. Sean Γ = ZF y Σ = ZF + φ en el teorema 6.2. Utilizando este corolario podemos construir pruebas de consistencia relativa con ayuda del método de modelos internos, como sigue: sea ϕ un enunciado para el que se quiere demostrar su consistencia con ZF; ejemplos importantes del enunciado ϕ son: el axioma de elección AE , la hipótesis del continuo HC , la hipótesis generalizada del continuo HGC , el axioma de Martin AM, la hipótesis de Souslin HS y el axioma de constructibilidad V = L. El método consiste en construir, en presencia de ZF, un término transitivo no vacío W que sea modelo interno de ZF y tal que ZF ⊢ ϕW . De esta manera tenemos Con(ZF) y, por el corolario 6.3, podemos concluir Con(ZF + ϕ). A continuación desarrollamos un criterio para determinar si un término clase dado es un modelo interno de ZF , para lo cual necesitamos los siguientes conceptos. Definición 6.4. Sea W un término clase. (a) W es casi universal si y sólo si ∀x (x ⊆ W ⇒ ∃y ∈ W x ⊆ y). (b) W es Σ0 -cerrado si y sólo si para cada fórmula Σ0 , ϕ(x, ~y) se tiene que ∀a, ~y ∈ W ({x : x ∈ a ∧ ϕ(x, ~y)} ∈ W). Definición 6.5. Para cada LTC-fórmula ϕ definimos una fórmula Σ0 , denotada como ϕ, sustituyendo en ϕ cada cuantificador ∃x por ∃x ∈ vj , donde para cada cuantificador se elige una nueva variable vj . Formalmente, (a) x = y ≡ x = y. (b) x ∈ y ≡ x ∈ y. 568 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 569 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) ¬ψ ≡ ¬ψ. (d) ψ ∧ χ ≡ ψ ∧ χ. (e) ∃xψ ≡ ∃x ∈ vj ψ (donde vj no figura en ψ). El siguiente lema es necesario para verificar el axioma (Reemp). Lema 6.6 (ZF ). Sean W un término clase transitivo y casi universal, ϕ(x1 , . . . , xm ) una LTC-fórmula y ϕ(x1 , . . . , xm , y1 , . . . , yn ) su Σ0 -fórmula correspondiente. Entonces ∀x ∈ W ∃y1 , . . . , yn ∈ W ∀x1 , . . . , xm ∈ x (ϕW (x1 , . . . , xm ) ⇔ ϕ(x1 , . . . , xm , y1 , . . . , yn )). Demostración. Por inducción sobre la construcción de fórmulas. Los casos ϕ atómica, negación y conjunción son simples y se dejan al lector. Procedemos a demostrar el caso ϕ ≡ ∃v ψ(v, x1 , . . . , xm ). Para fijar la designación de las variables, sean ψ = ψ(v, x1 , . . . , xm , y1 , . . . , yn−1 ) y ϕ = ∃v ∈ yn ψ(v, x1 , . . . , xm , y1 , . . . , yn−1 ). Sea x ∈ W. Definimos para x1 , . . . , xm ∈ x el siguiente ordinal, Def α(x1 , . . . , xm ) = mín ({rg(v) : v ∈ W ∧ ψ W (v, x1 , . . . , xm )}) + 1, donde mín ∅ = 0, y Def F (x1 , . . . , xm ) = {v : v ∈ W ∧ ψ W (v, x1 , . . . , xm )} ∩ Vα(x1 ,...,xm ) .4 Se cumple que F (x1 , . . . , xm ) ⊆ W, F (x1 , . . . , xm ) ∈ V y F : xm −→ V . S Fijemos x′ = x ∪ F [xm ]. Debido a la transitividad de W se sigue que x′ ⊆ W, pues x ∈ W implica x ⊆ W. Por la casi universalidad de W, existe x0 ∈ W tal que x′ ⊆ x0 y de la definición de x′ se sigue que ∀x1 , . . . , xm ∈ x (∃v ∈ Wψ W (v, x1 , . . . , xm ) ⇔ ∃v ∈ x0 ψ W (v, x1 , . . . , xm )). (1) 4 De esta manera obligamos a que F (x1 , . . . , xm ) ∈ V . Este procedimiento se conoce como el truco de Scott. 569 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 570 ✐ ✐ 8. Relativización y absolutez Mediante la hipótesis de inducción para x0 ∈ W, elijamos y1 , . . . , yn−1 ∈ W tales que ∀v, x1 , . . . , xm ∈ x0 (ψ W (v, x1 , . . . , xm ) ⇔ ψ(v, x1 , . . . , xm , y1 , . . . , yn−1 )). (2) Fijemos yn = x0 ; entonces, para x1 , . . . , xm ∈ x0 se sigue ϕW (x1 , . . . , xm ) ⇔ ⇔ por (1) ⇔ por (2) ⇔ ∃v ∈ W ψ W (v, x1 , . . . , xm ) ∃v ∈ x0 ψ W (v, x1 , . . . , xm ) ∃v ∈ yn ψ(v, x1 , . . . , xm , y1 , . . . , yn−1 ) ϕ(x1 , . . . , xm , y1 , . . . , yn ). Así queda todo demostrado. Ahora podemos enunciar el criterio anticipado. Teorema 6.7 (ZF ). Sea W un término clase. Si W es transitivo, casi universal y Σ0 -cerrado, entonces W es un modelo interno de ZF . Demostración. (1) W es transitivo por hipótesis. (2) Por demostrar W 6= ∅. Como ∅ ⊆ W y W es casi universal, entonces ∃y ∈ W (∅ ⊆ y). Por lo tanto, W 6= ∅. (3) Por demostrar ZF W . Para este propósito nos serviremos del teorema 1.6. ExW . Trivial a partir de la transitividad de W 6= ∅ ExtW . Inmediato por la transitividad de W. FundW . Es claro, pues W 6= ∅ y es transitivo. ParW . Sean a, b ∈ W; como {a, b} ⊆ W y W es casi universal, existe z ∈ W con {a, b} ⊆ z, por lo que {a, b} = {x ∈ z : x = a ∨ x = b}, que claramente pertenece a W porque W es Σ0 -cerrado. S (Unión)W . Sea aS∈ W; por la transitividad de W tenemos que a ⊆ W. Sea z ∈ W tal que a ⊆ z (talSz lo proporciona la casi universalidad de W), entonces podemos escribir a = {y ∈ z : ∃x ∈ a (y ∈ x)} de donde, por la Σ0 -cerradura de W, puesto que la fórmula que define al término clase S de la derecha de la igualdad es Σ0 , tenemos que a ∈ W. 570 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 571 ✐ ✐ Conjuntos y modelos. Curso avanzado ~ ∈ W. CompW . Sean a, w y1 , . . . , yn ∈ W tales que En vista del lema 6.6 encontramos ~ , y1 , . . . , yn )}, ~ )} = {x ∈ a : ϕ(x, w {x ∈ a : ϕW (x, w y como ϕ es Σ0 , el conjunto del lado derecho de la igualdad pertenece a W, por lo que ~ )} ∈ W. {x ∈ a : ϕW (x, w W Pot . Sea a ∈ W. Tenemos Pot(a) ∩ W ∈ V y Pot(a) ∩ W ⊆ W. Como W es casi universal, tomemos z ∈ W tal que Pot(a) ∩ W ⊆ z; así, Pot(a) ∩ W = {x ∈ z : ∀y ∈ x (y ∈ a)}, de manera que la Σ0 -cerradura de W asegura que Pot(a) ∩ W ∈ W. Inf W . Se demostrará algo más fuerte que es OR ⊆ W, de manera que ω ∈ W, e Inf W . Se procede por contradicción. Supongamos que OR 6⊆ W y sea Def α = OR ∩ W, por lo que α ∈ OR, puesto que α es un conjunto transitivo de ordinales, debido a la transitividad de W. Como W es casi universal, tomemos z ∈ W tal que α ⊆ z. Así, tenemos que α = z ∩ OR. Sea ψ(x) una ΣTEC -fórmula equivalente a la fórmula x ∈ OR dada por el lema 8.4; 0 entonces se sigue que α = {x ∈ z : ψ(x)} y la Σ0 -cerradura de W permite concluir α ∈ W. Por otra parte, de la definición de α se sigue que α ∈ / OR ∩ W puesto que α ∈ / α y, como α ∈ OR, se concluye que α ∈ / W, lo cual es absurdo. Por lo tanto, OR ⊆ W. ReempW . ~ ) una LTC-fórmula. Sean a, w ~ ∈ W de manera que Sea ϕ(x, y, w ~ ) ∧ ϕW (x, y′ , w ~ ) ⇒ y = y′ ). ∀x, y, y′ (ϕW (x, y, w ~ ) tenemos que Aplicando Reemp a la fórmula y ∈ W ∧ ϕW (x, y, w ~ )))} ∈ V b = {y : ∃x (x ∈ a ∧ (y ∈ W ∧ ϕW (x, y, w y como b ⊆ W, la casi universalidad de W nos permite tomar z ∈ W tal que b ⊆ z, de donde, utilizando que CompW , se sigue que ~ )))} ∈ W b = {y ∈ z : ∃x (x ∈ a ∧ (y ∈ W ∧ ϕW (x, y, w ~ )} ∈ W. o en forma equivalente {y ∈ W : ∃x ∈ a ϕW (x, y, w W Con ello queda demostrado que ZF . 571 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 572 ✐ ✐ 8. Relativización y absolutez 6.2. El colapso de Mostowski. Ya hemos visto que un término transitivo es de gran ayuda en cuestiones de relativización y absolutez. En esta sección veremos cómo en ciertos casos podemos obtener, a partir de un término dado, un término transitivo isomorfo al original. Definición 6.8. Sean R1 , R2 relaciones en los términos clase A y B, respectivamente. Una función F : A − → B es un R1 -R2 -homomorfismo de A en B, si (∀x ∈ A)(∀y ∈ A)[xR1 y ⇒ F (x)R2 F (y)]. Una “biyección” F : A − → B es un R1 -R2 -isomorfismo de A sobre B si F es un R1 -R2 -homomorfismo de A sobre B y F −1 es un R2 − R1 -homomorfismo de B sobre A. Nuestra intención es establecer isomorfismos entre clases, con una cierta relación R cualquiera y una clase transitiva con la relación de pertenencia ∈. Empezamos con dos teoremas sencillos pero de gran utilidad. Teorema 6.9 (Primer teorema del isomorfismo). Sean hM1 , ∈i, hM2 , ∈i dos estructuras isomorfas y π el isomorfismo; entonces, para cualquier fórmula φ(x0 . . . , xn ) y cualesquier a0 . . . , an ∈ M1 se cumple que hM1 , ∈i |= φ[a0 , . . . , an ] ⇔ hM2 , ∈i |= φ[π(a0 ), . . . , π(an )]. Demostración. Ejercicio. Teorema 6.10 (Segundo teorema del isomorfismo). Si hM1 , ∈i, hM2 , ∈i son dos estructuras transitivas isomorfas mediante π, entonces M1 = M2 y π = idM1 . Demostración. Ejercicio. Definición 6.11. Sea R una relación bien fundada en V . Mediante R-recursión obtenemos una función πR dada por πR (x) ≡ {πR (y) : yRx}. (Note que en πR (x) tenemos definida una ∈-relación). La función πR es la función colapso de R. En seguida encontramos las propiedades más importantes de la función colapso. 572 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 573 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 6.12. Sea R una relación sobre un término clase A. Decimos que A es R-transitivo si sucede lo siguiente: ∀x∀y(x ∈ A ∧ yRx ⇒ y ∈ A). R es extensional en A si ∀x∀y((x ∈ A ∧ y ∈ A) ⇒ ({z : zRx} = {z : zRy} ⇒ x = y)). Lema 6.13. Sea R una relación bien fundada en A. Entonces: (i) πR : A − → πR [A] es un R-∈-homomorfismo de A sobre πR [A]. (ii) Si A es transitivo, entonces πR [A] ∈ OR o πR [A] = OR. (iii) Si B es transitivo y τ : A − → B es un R-∈-isomorfismo, entonces τ = πR . (iv) Si R es extensional, entonces πR es un R-∈-isomorfismo. Demostración. (i) Por definición de πR sucede πR (x) ∈ πR (y) para xRy. Así que tenemos un R− ∈-homomorfismo que por definición es sobre. Mostraremos que πR [A] es transitivo. Si u ∈ v ∈ πR [A], entonces existe x ∈ A con u ∈ v = πR (x) = {πR (y) : yRx}. Por lo tanto, u ∈ πR [A]. (ii) Demostraremos a ∈ A ⇒ π(a) ∈ OR, (**) por R-inducción. Por hipótesis de inducción tenemos πR [â] ⊆ OR, donde â = {y : yRa}. Si u ∈ v ∈ πR [â], entonces existe algún y con yRa tal que v = πR (y) y por ello u ∈ πR (y) = {πR (z) : zRy}. Así que u = πR (z) para algún z tal que zRa y, en consecuencia, u ∈ πR [â]. Por lo tanto, πR [â] es transitivo y bien ordenado por ∈, de donde πR [â] ∈ OR. Dado que πR (a) = πR [â], entonces πR (a) ∈ OR. (iii) Sea a ∈ A y x ∈ τ(a). Puesto que B es transitivo, x ∈ B y por ello existe un u ∈ A tal que τ(u) = x ∈ τ(a). Ya que τ −1 es un ∈-R-homomorfismo, deducimos que uRa. De lo último obtenemos τ(a) ⊆ τ[â]. Si x ∈ τ[â], existe v con vRa y x = τ(v). Pero entonces x = τ(v) ∈ τ(a). Así, τ(a) = τ[â] y τ satisface la ecuación recursiva para πR . (iv) πR : A − → πR [A] es un R-∈-homomorfismo suprayectivo por (i). Para obtener la inyectividad mostramos que πR (a) = πR (b) ⇒ a = b por R-inducción. Tenemos πR (a) = πR (b) ⇔ πR [â] = πR [b̂]. De la hipótesis de inducción se deduce â = b̂, y por la extensionalidad de R obtenemos que 573 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 574 ✐ ✐ 8. Relativización y absolutez a = b. Por consiguiente, πR es una biyección y resta probar que πR−1 es un ∈R-homomorfismo. Tenemos πR (u) ∈ πR (v); entonces existe una a tal que aRv y πR (u) = πR (a). Por el carácter inyectivo de iR se concluye que u = a y, por lo tanto, uRv. La aplicación más importante para la función colapso se alcanza cuando la ∈-relación es bien fundada y extensional en un término clase A, pues en este caso, según el inciso (iv) del lema anterior, tenemos un isomorfismo entre la clase original y una clase transitiva con la relación de pertenencia. Aquí usamos Def por brevedad πA en lugar de π∈∩(A×A) y llamamos a π[A] = πA [A] el colapso de Mostowski de la clase A. El lector puede demostrar a partir del lema 6.13 el siguiente teorema fundamental: Teorema 6.14 (El colapso de Mostowski). Sean A y R términos clase. Existen términos clase B y π tales que: (a) Si R es estrictamente bien fundada y extensional en A, entonces B es transitivo, π : A − → B es una “biyección” y para cualesquier x, y: (X ∈ A ∧ y ∈ B) ⇒ (xRy ⇔ π(x) ∈ π(y)). (b) Si R es estrictamente bien fundada y extensional en A, B′ , π ′ son términos clase tales que B′ es transitivo y π ′ es un R− ∈-isomorfismo de A sobre B′ ; entonces B = B′ y π = π ′ . Corolario 6.15. Sean A, B y π-términos clase, A y B transitivos, π : A − →B un ∈ − ∈-isomorfismo. Entonces B = A y π es la identidad en A, π(x) = x para toda x ∈ A. Demostración. Por la unicidad en el teorema 6.14(b) obtenemos B = A y π = id ↾ A. Note que si tenemos dos términos clase distintos A y B, entonces no puede existir un ∈ − ∈-isomorfismo entre ellos. En particular, para números ordinales se cumple lo siguiente. Corolario 6.16. Si α y β son números ordinales distintos, entonces no existe una biyección entre ellos que preserve el orden. Si en el corolario 6.15 hacemos B = A, entonces todo término clase tiene exactamente un ∈ − ∈-isomorfismo definible (es decir, representable mediante 574 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 575 ✐ ✐ Conjuntos y modelos. Curso avanzado un término clase {x : ϕ(x)}), a saber, la identidad. Como V es transitivo, podemos concluir que no hay un ∈ − ∈-automorfismo de V en V , excepto la identidad. Si R es un buen orden y x̂ = ŷ, se sigue que x = y porque tanto xRy como yRx conducen a la contradicción x ∈ ŷ = x̂, es decir, xRx o, respectivamente, y ∈ x̂ = ŷ, es decir, yRy. Así que todo buen orden siempre es extensional, y del lema 6.13 obtenemos el siguiente teorema: Teorema 6.17. Si R es un buen orden en A, entonces πR es un R-∈isomorfismo y tenemos πR [A] = OR o πR [A] ∈ OR. Se concluye πR [A] ∈ OR si y sólo si A es un conjunto. 7. Principios de reflexión Los principios de reflexión son, en cierta forma, la contraparte del teorema de Löwenheim-Skolem. Mientras que este teorema afirma que cualquier modelo tiene un submodelo elemental más pequeño, el principio de reflexión de LévyMontague proporciona, para un número finito de fórmulas de LTC, un conjunto M que se comporta como un submodelo elemental del universo respecto a las fórmulas dadas. Esto es, en ZFE es demostrable que dado un conjunto finito de fórmulas de LTC ϕ1 , . . . , ϕn , existe un conjunto transitivo M tal que M |= ϕ1 , . . . , ϕn . La idea consiste en encontrar un conjunto M tal que cada fórmula es absoluta para M. En particular, si ϕ es un enunciado de LTC entonces ϕM ⇔ ϕ, así que si ϕ es un axioma de ZFE tendremos ϕM . Los principios de reflexión se dan para cualquier jerarquía acumulativa, noción que definimos en seguida. Definición 7.1. Una clase {Hα : α ∈ OR} es una jerarquía acumulativa si se cumplen las siguientes condiciones: (H1 ) [Hα ⊆ S Hα+1 ⊆ Pot(Hα )] para todo α ∈ OR. (H2 ) [Hα = ξ<α Hξ ], para todo ordinal límite α. S Sea H = ξ∈OR Hξ . Como ejemplo de jerarquía acumulativa tenemos, por supuesto, la jerarquía de von Neumann. Lema 7.2. Si {Hα : α ∈ OR} es una jerarquía acumulativa, entonces (i) α ≤ β ⇒ Hα ⊆ Hβ . (ii) Hα es transitivo para todo α ∈ OR, por lo que también H es transitiva. 575 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 576 ✐ ✐ 8. Relativización y absolutez (iii) K ∈ V ∧ K ⊆ H ⇒ (∃α ∈ OR)[K ⊆ Hα ]. Demostración. (i) Se sigue por inducción sobre β. (ii) Si x ∈ Hα ⊆ Hα+1 ⊆ Pot(Hα ), entonces x ∈ Pot(Hα ), es decir, x ⊆ Hα , lo que demuestra la transitividad de Hα . La transitividad de H es entonces evidente por ser la unión de clases transitivas. (iii) Para x ∈ H definimos Def Def rgH = ínf{α : x ∈ Hα }. (80) Sea α = sup{rgH (x) : x ∈ K}. Dado que K ∈ V , se tiene α ∈ OR y por (i), K ⊆ Hα . El siguiente lema es de utilidad para demostrar el primer principio de reflexión. Lema 7.3. Sea {Hα : α ∈ OR} una jerarquía acumulativa y φ(x, u1 , . . . , un ) una fórmula de LTC. Definimos Kφ Def = {α ∈ OR : (∀a1 ∈ Hα ) . . . (∀an ∈ Hα ) [H |= ∃yφ[y, a1 , . . . , an ] ⇔ (∃b ∈ Hα )H |= φ(b, a1 , . . . , an )]}; entonces Kφ es un club. Demostración. Para ~a ∈ Hn sea k(~a) = ( inf{α : (∃b ∈ Hα )[H |= φ[b,~a]]}, 0, cuando éste existe en otro caso. Entonces ~a ∈ Hn ∧ H |= ∃yφ(y,~a) ⇒ (∃b ∈ Hk(~a) )[H |= φ[b,~a]]. (i) Primero mostramos que la clase Kφ no está acotada. Para ello, sea β ∈ OR. Definimos y α0 = β αm+1 = sup{αm + 1, sup{k(~a) : ~a ∈ Hαn m }} α = sup αm . m<ω 576 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 577 ✐ ✐ Conjuntos y modelos. Curso avanzado Entonces, por definición, αm < αm+1 (ii) ~a ∈ Hαn ⇒ k(~a) < α, (iii) y S pues para ~a ∈ Hαn = m<ω Hαn m existe un m < ω con ~a ∈ Hαn m . Así, k(~a) ≤ αm+1 < α. De (iii) y (i) obtenemos ~a ∈ Hαn ∧ H |= ∃yφ(y,~a) ⇒ (∃b ∈ Hα )[H |= φ[b,~a]]. (iv) En vista de que podemos deducir H |= ∃yφ(y,~a) de H |= φ[b,~a] para b ∈ Hα ⊆ H, de (iv) se desprende que (v) α ∈ Kφ . Por lo tanto, Kφ no está acotado. Para probar que Kφ es cerrado, sea U ⊆ Kφ un conjunto acotado en Kφ . Sea α = sup U. Habremos terminado si mostramos α ∈ U. Supongamos que no; entonces es fácil probar (¡el lector debe hacerlo!) que α es un ordinal límite. Si ~a ∈ Hαn , existe β ∈ α ∩ U con ~a ∈ Hβn . Si H |= ∃yφ(y,~a), sabiendo que β ∈ U ⊆ Kφ , se deduce la existencia de b ∈ Hβ ⊆ Hα con H |= φ[b,~a]. Ya que H |= ∃yφ(y,~a), se concluye inmediatamente de H |= φ[b,~a] (para b ∈ Hα ), que α ∈ Kφ . Teorema 7.4 (Principio de reflexión para fórmulas de LTC). Sea {Hα : α ∈ OR} una jerarquía acumulativa. Para cada fórmula φ(x1 , . . . , xn ) de LTC, existe una clase Ref (φ) no acotada y cerrada en OR, para la que se cumple (∀α ∈ Ref (φ))(∀~a ∈ Hα )[H |= φ[~a] ⇔ Hα |= φ[~a]]. Ref (φ) es la clase reflejo de φ. Demostración. Elaboramos la demostración mediante inducción en la construcción de la fórmula φ(~x), restringiéndonos a los conectivos ¬, ∧ y ∃. Def Si φ(~x) ≡ (xi ∈ xj ) o φ(~x) ≡ (xi = xj ), hacemos Ref (φ) = OR. 577 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 578 ✐ ✐ 8. Relativización y absolutez Si φ(~x) ≡ ¬χ(~x) y α ∈ Ref (χ), entonces para ~a ∈ Hα : H |= φ[~a] ⇔ H 6|= χ[~a] ⇔ Hα 6|= χ[~a] ⇔ Hα |= ¬χ[~a] ⇔ Hα |= φ[~a] Def y definimos Ref (φ) = Ref (χ). Por hipótesis de inducción, Ref (χ) es un club. Def Si φ(~x) ≡ φ1 (~x) ∧ φ2 (~x), hacemos Ref (φ) = Ref (φ1 ) ∩ Ref (φ2 ). Por hipótesis de inducción tanto Ref (φ1 ) como Ref (φ2 ) son clubes y la intersección de clubes es un club, así que Ref (φ) es un club. Si φ(~x) ≡ ∃yχ(y, ~x) y α ∈ Ref (χ) ∩ Kχ , entonces para ~a ∈ Hα : H |= ∃yχ(y,~a) ⇔ (∃b ∈ Hα )[H |= χ[b,~a]] ⇔ (∃b ∈ Hα )[Hα |= χ[b,~a]] ⇔ Hα |= ∃yχ[y,~a]. Por hipótesis de inducción, Ref (χ) es un club y Kχ es un club por el lema Def 7.3. Hacemos Ref (φ) = Ref (χ) ∩ Kχ , que es un club. La jerarquía de von Neumann conforma una jerarquía acumulativa. Por lo tanto, podemos formular el principio de reflexión para V . Corolario 7.5 (Principio de reflexión de Lévy-Montague). Sean ϕ1 , . . . , ϕn fórmulas de LTC. Entonces la siguiente afirmación se puede probar en ZF : (∀α ∈ OR)(∃β ∈ OR, β > α) [lím(β) ∧ (∀~v ∈ Vβ )[ϕ1 , . . . , ϕn son Vβ absolutas]]. En cuanto a cualquier jerarquía acumulativa, tenemos el siguiente resultado: Lema 7.6. Si {Hα : α ∈ OR} es una jerarquía acumulativa con la propiedad α < β ⇒ Hα ∈ Hβ ; entonces H |= (Reemp)loc , donde (Reemp)loc es el axioma de reemplazo local: ∀~u∀a{∀x[x ∈ a ⇒ ∃yφ(x, y, ~u)] ⇒ ∃a∀x[x ∈ a ⇒ ∃y(y ∈ a ∧ φ(x, y, ~u))]}. 578 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 579 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Sean φ(x, y, ~u) una fórmula de LTC, ~a ∈ Hn , y b ∈ H tales que H |= (∀x ∈ b)∃yφ(x, y,~a). Def Si α = sup{rgH (b), rgH (a1 ), . . . , rgH (an )} entonces existe, de acuerdo con el teorema 7.4, un β ≥ α tal que Hβ |= (∀x ∈ b)∃yφ(x, y,~a). Dado que Hα ∈ H se desprende, otra vez por el teorema 7.4, que H |= (∃z)(∀x ∈ b)(∃y ∈ z)φ(x, y,~a). Como corolario obtenemos el siguiente: Corolario 7.7. En la jerarquía de von Neumann se cumple el axioma (Reemp)loc . Ahora podemos derivar un principio de reflexión que es independiente de las jerarquías acumulativas, usando el hecho de que V es modelo de ZF . Conseguiremos este principio de reflexión mediante el siguiente lema. Lema 7.8 (AE ). Sean φ1 , . . . , φm fórmulas de LTC. Para cada conjunto M0 existe un supraconjunto M ⊇ M0 con |M| ≤ ℵ0 · |M0 |, de manera que para i = 1, . . . , m es verdadera. (∀~a ∈ M)[(∃b ∈ M)φi (~a, b) ⇔ ∃bφi (~a, b)] S Demostración. Argumentamos en V = α∈OR Vα . Como ya se ha observado, {Vα : α ∈ OR} es una jerarquía acumulativa. Por el lema 7.3 existen clubes Kφi para i = 1, . . . , m. Entonces Def K = Kφ1 ∩ · · · ∩ Kφm es también un club. Ya que M0 es un conjunto, existe α ∈ K con M0 ∈ Vα . En consecuencia, del lema 7.3 obtenemos que (∀~a ∈ Vα )[∃yφi (~a, y) ⇔ (∃y ∈ Vα )φi (~a, y)]. (i) 579 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 580 ✐ ✐ 8. Relativización y absolutez Sea f una función de elección5 para Vα+1 . Para ~a ∈ Vαn sea gi (~a) = {b ∈ Vα : φi (~a, b)} ∈ Vα+1 . Ahora definimos una familia {Mk : k < ω} por recursión sobre k. M0 está dado. Mk+1 = Mk ∪ Además, sea m [ {f (gi (~a)) : ~a ∈ Mkn ∧ gi (~a) 6= ∅}. i=1 M≡ [ Mk . k∈ω Por inducción sobre k se obtiene inmediatamente También sucede que Mk ⊆ Mk+1 ⊆ Vα . (ii) M ⊆ Vα . (iii) De la definición de Mk se deduce ~a ∈ Mkn ∧ (∃y ∈ Vα )φi (~a, y) ⇒ f (gi (~a)) ∈ Mk+1 ∧ φi (~a, f (gi (~a))), de donde podemos concluir ~a ∈ Mkn ∧ (∃y ∈ Vα )φi (~a, y) ⇒ (∃y ∈ M)φi (~a, y). (iv) (∀~a ∈ M n )[∃yφi (~a, y) ⇒ (∃y ∈ M)φi (~a, y)]. (v) De (i) y (iv) obtenemos Ya que la dirección recíproca en (v) es trivialmente cierta, resta sólo calcular la cardinalidad de M. Tenemos |M| = | [ k<ω Mk | ≤ X k<ω |Mk | = ℵ0 · sup(|Mk |). k<ω Mostraremos por inducción sobre k que |Mk | ≤ ℵ0 |M0 |. 5 Es decir, una función que a cada subconjunto de Vα+1 le asocia un elemento de Vα+1 . 580 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 581 ✐ ✐ Conjuntos y modelos. Curso avanzado Para k = 0 es claro, y de la hipótesis de inducción se obtiene |Mk+1 | ≤ |Mk | + m X i=1 |{f (gi (~a)) : ~a ∈ Mkn }| ≤ |Mk | + (m · |Mk |) ≤ ℵ0 · |M0 |. Del lema 7.8 se desprende que cada conjunción finita de fórmulas, que se satisface en el universo, se refleja a un conjunto, es decir, es válida en un conjunto. Profundizamos este hecho en el siguiente teorema. Teorema 7.9 (Principio de reflexión restringido). Sea m > 0. Para cada conjunto M0 existe un supraconjunto M ⊇ M0 con |M| = ℵ0 · |M0 | tal que (∀~a ∈ M n )[φ[~a] ⇔ M |= φ[~a]] para todas las fórmulas φ de complejidad ≤ m (es decir, φ contiene a lo sumo m símbolos lógicos) en las que figuran libres a lo sumo las variables x1 , x2 , . . . , x n . Demostración. Ya que tratamos con un conjunto finito de fórmulas de complejidad restringida, podemos utilizar el lema 7.8. Por ello existe un conjunto M ⊇ M0 con |M| ≤ ℵ0 · |M0 | tal que ∃yψ(~a, y) ⇔ (∃y ∈ M)ψ(~a, y) (i) es cierta para cada n-ada ~a de elementos de M y cada fórmula ψ(~x, y) de complejidad ≤ m. Entonces también φ(~a) ⇔ φ(~a)M para toda n-ada ~a y cualesquier fórmulas φ(x1 , . . . , xn ) de complejidad ≤ m, por inducción sobre la complejidad de φ. Esto es claro para fórmulas atómicas. Los casos φ ≡ φ1 ∧ φ2 y φ ≡ ¬φ1 se obtienen, como es usual, de la hipótesis de inducción. Sea φ ≡ ∃yψ(~x, y). Por (i) y la hipótesis de inducción, podemos derivar ∃yψ(~a, y) ⇔ (∃y ∈ M)ψ(~a, y) ⇔ (∃y ∈ M)ψ(~a, y)M ⇔ (∃yψ(~a, y))M . ✷ 581 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 582 ✐ ✐ 8. Relativización y absolutez El siguiente teorema es una consecuencia del teorema de reflexión: Teorema 7.10. ZF no es finitamente axiomatizable, es decir, no existe un conjunto finito de teoremas Σ tal que ZF ⊢ ϕ ⇔ Σ ⊢ ϕ. Demostración. Supongamos que existe una cantidad finita de axiomas ϕ0 , . . . , ϕn tales que ϕ0 , . . . , . . .n ⊢ ZF . Entonces existe un ordinal α para el cual ϕiVα para i ≤ n. Sea α el mínimo con esta propiedad. De acuerdo con el teorema de reflexión de Levy-Montague, se cumple ZF ⊢ ∃ κ ∈ OR∃ x(x = Vκ ∧ (ϕ0 ∧ · · · ∧ ϕn−1 )x ). Puesto que ϕ0 ∧ · · · ∧ ϕn ⊢ ZF , se deduce que ϕ0 ∧ · · · ∧ ϕn ⊢ ∃ κ ∈ OR∃ x(x = Vκ ∧ (ϕ0 ∧ · · · ϕn )x ). Ya que (ϕ0 ∧ · · · ∧ ϕn )Vα , del lema del modelo se sigue (∃ κ ∈ OR∃ x(x = Vκ ∧ (ϕ0 ∧ · · · ∧ ϕn )x ))Vα , que después de relativizar queda como ∃ κ ∈ OR ∩ Vα ∃ x ∈ Vα (x = (Vκ )Vα ∧ (ϕ0 ∧ · · · ∧ ϕn )x ). (81) (Observe que (ϕ0 ∧ · · · ∧ ϕn )x es una Σ0 -fórmula). Por el corolario 4.8, (Vκ )Vα = Vκ ∩ Vα = Vmín{κ,α} . Podemos lograr este resultado porque ZF Vα es cierto, pues ϕ0 , . . . , ϕn ⊢ ZF y (ϕ0 ∧ · · · ∧ ϕn )Vα . Como κ ∈ Vα ∩ OR = α, se deduce que κ < α, así (Vκ )Vα = Vκ . De la ecuación 81 se deduce (ϕ0 ∧ · · · ∧ ϕn )Vκ , y puesto que κ < α, se contradice la minimalidad de α. Queda demostrado el teorema. Terminamos la sección con un teorema que será de gran utilidad para la siguiente sección: Teorema 7.11 (ZFE ). Sean ϕ0 (x1 . . . , xr ), . . . , ϕn−1 (x1 . . . , xr ) LTC-fórmulas. Entonces existe W ∈ V tal que W es numerable y ϕ0 , . . . , ϕn−1 son W-absolutas. 582 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 583 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Podemos suponer, sin perder generalidad, que el conjunto de fórmulas es cerrado respecto a subfórmulas. El teorema de reflexión garantiza la existencia de α ≥ ω tal que cada ϕi es Vα -absoluta. Tomemos un buen orden <α de Vα (mediante el axioma de elección). Definimos para i < n la función fi : Vαr −→ Vα como sigue: fi (x1 , . . . , xr ) =  ′ ′ ′   {v ∈ Vα : ψ(~x){xj /v} ∧ ∀v (v <α v ⇒ ¬ψ(~x){xj /v })}, si ϕi ≡ ∃xj ψ(~x); en otro caso.   ∅, fi (~x) contiene a lo sumo un elemento y para el caso en que ϕi ≡ ∃xj ψ para ~x ∈ Vα , se cumple lo siguiente: ∃xj ψ(~x) ⇔ ∃xj ∈ fi (~x)ψ(~x). (82) ⇒ ) Como el conjunto es cerrado respecto a subfórmulas, entonces ψ = ϕk para alguna k < i. De la Vα -absolutez de ϕi y ϕk se sigue que ∃xj ψ(~x) ⇒ (∃xj ϕk (~x))Vα ⇒ ∃xj ∈ Vα ϕkVα (~x) ⇒ ∃xj ∈ fi (~x) ϕk (~x). ⇐ ) Es inmediato. Definamos ahora una sucesión creciente de conjuntos como sigue: W0 = {∅} Wm+1 = {m} ∪ Wm ∪ Por último, sea W = S m∈ω S f0 [Wmr ] ∪ . . . ∪ S fn−1 [Wmr ]. Wm ; claramente, W es un subconjunto numerable de Vα . Con ayuda de (82) se demuestra fácilmente que cada ϕi es W-absoluta. 7.1. Consistencia relativa del axioma de fundación. Como primera aplicación del método de modelos internos, mostraremos que el axioma de fundación Fund es consistente con ZF − Fund . El modelo interno será la clase S V = α∈OR Vα , que es la unión de la jerarquía de Von Neumann. Recordemos que en la construcción de esta clase no utilizamos el axioma de fundación; éste se usó para probar que V = V. Sin embargo, al no tener el axioma de fundación disponible, solamente sabemos que V ⊆ V . Lema 7.12. ∀x (x ∈ V ⇔ x ⊂ V) 583 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 584 ✐ ✐ 8. Relativización y absolutez Demostración. ⇒ ) Esto es inmediato pues V es transitiva. ⇐ ) Sean x ⊂ V y α = sup{rg(y) + 1 : y ∈ x}; entonces x ⊂ Vα , por lo que x ∈ Vα+1 . Por lo tanto, x ∈ V. Teorema 7.13 (ZF −Fund ). V es modelo de ZF . Demostración. Nos serviremos del teorema 6.7. Así que basta probar que V es casi universal y Σ0 -cerrado. V es casi universal. Sea x ⊆ V. Por el lema 7.12, tenemos que x ∈ V y claramente x ⊆ x. Por lo tanto, V es casi universal. Demostremos que V es Σ0 -cerrado. Sean ϕ(x, ~y) una Σ0 -fórmula y a, ~y ∈ V. Entonces {x ∈ a : ϕ(x, ~y)} ⊆ a ∈ V, por lo que {x ∈ a : ϕ(x, ~y)} ∈ V. Así que V es Σ0 -cerrado. Observe que en sentido estricto no podíamos utilizar el teorema 6.7 pues éste se prueba en presencia de ZF , pero como en su demostración Fund sólo se utiliza para probar FundW , entonces podemos restringirnos a ZF − Fund. Debido a ello, tenemos que probar Fund directamente. Para esto basta demostrar que para cualquier término clase W, (W 6= ∅ ⇒ ∃x ∈ W (W ∩ x = ∅))V , que es equivalente a probar que si W ∩ V 6= ∅ ⇒ ∃x ∈ W ∩ V (W ∩ x = ∅), por la absolutez de ∩. Así que sea W tal que W ∩ V 6= ∅ y tomemos x ∈ W ∩ V de rango mínimo, y es claro entonces que W ∩ x = ∅. Por lo tanto, FundV . Hemos conseguido el primer modelo interno; ahora veamos más ejemplos. 7.2. Consistencia relativa de ZF − . En esta sección desarrollamos en ZFE modelos internos de ZFE − . Definición 7.14. Sea κ un cardinal infinito y definamos el término clase H(κ) como H(κ) = {x : |CT (x)| < κ}. Los elementos de H(κ) son los conjuntos hereditarios de cardinal < κ o κ-hereditarios. H(ω) es el conjunto de conjuntos hereditariamente finitos, y H(ω1 ) es el conjunto de conjuntos hereditariamente numerables. Cada H(κ) es un conjunto de acuerdo con el siguiente lema. Lema 7.15. Para cualquier κ ∈ CAR. H(κ) ⊆ Vκ . Demostración. Sea x ∈ H(κ) . Vamos a mostrar que rg(x) < κ. Sean t = CT (x) y S = {rg(y) : y ∈ t}. Afirmamos que S es un ordinal. Supongamos que no y sea α el mínimo ordinal que no está en S; en tal caso se 584 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 585 ✐ ✐ Conjuntos y modelos. Curso avanzado tiene α ⊆ S. Si α 6= S, sean β el mínimo ordinal de S mayor que α y y ∈ t con rg(y) = β. Como t es transitivo se cumple ∀z ∈ y (rg(z) < α), por lo que β = rg(y) = sup{rg(z) + 1 : z ∈ y} ≤ α, lo cual es una contradicción. Por lo tanto, α = S. Observe que α = rg(x) = {rg(y) : y ∈ CT (x)}. Puesto que |t| < κ, α < κ; además x ⊆ t ⊆ Vα , por lo que rg(x) ≤ α < κ. Es decir, x ∈ Vκ . En la mayoría de los casos la contención es propia, por ejemplo Pot(ω) ∈ Vω1 \ H(ω1 ). A continuación mostramos algunas propiedades de H(κ) . Lema 7.16. Sea κ ∈ CAR. (a) (b) (c) (d) (e) (f) H(κ) es transitivo. H(κ) ∩ OR = κ. Si x, y ∈ H(κ) , entonces {x, y} ∈ H(κ) . S Si x ∈ H(κ) , entonces x ∈ H(κ) . Si x ∈ H(κ) y y ⊆ x, entonces y ∈ H(κ) . (AE ) Si κ es regular, entonces ∀x (x ∈ H(κ) ⇔ x ⊆ H(κ) ∧ |x| < κ). Demostración. (a) Si x ∈ H(κ) , para cualquier y ∈ x se tiene CT (y) ⊆ CT (x). Por lo tanto, x ⊆ H(κ) . (b) Si α ∈ κ entonces CT (α) = α ⊂ κ, por lo que α ∈ H(κ); además, es claro que α ∈ OR. Recíprocamente, si α ∈ H(κ) ∩ OR entonces |α| = |CT (α)| < κ. Por lo tanto, α ∈ κ. (c) Es inmediato a partir de CT ({x, y}) = {x, y} ∪ CT (x) ∪ CT (y). S S (d) Como x ⊆ CT (x), entonces CT ( x) ⊆ CT (x). En consecuencia, S x ∈ H(κ) . (e) Resulta inmediato pues si y ⊆ x, entonces CT (y) ⊆ CT (x). (f) Supongamos que κ es regular. ⇒ ) Es obvio. S ⇐ ) Como CT (x) = x ∪ {CT (y) : y ∈ x}, entonces CT (x) es la unión de menos que κ conjuntos de cardinalidad menor que κ, así que CT (x) tiene cardinalidad menor que κ (por AE ) pues κ es regular. Si κ es regular, entonces conseguimos un modelo interno de ZFE− de acuerdo con el siguiente teorema. 585 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 586 ✐ ✐ 8. Relativización y absolutez Teorema 7.17 (ZFE ). Si κ ∈ CAR es un cardinal regular, entonces H(κ) es modelo de ZFE− . Demostración. Como H(κ) es transitivo (por el Lema 7.16[a]), nos serviremos del teorema 1.6. ExH(κ) ya que H(κ) es transitivo. ExtH(κ) pues H(κ) es transitivo. ParH(κ) se demostró mediante el lema 7.16(c). UniónH(κ) se demostró en el lema 7.16(d). ~ ∈ H(κ) y {x ∈ a : ϕH(κ) (x, w ~ )} ⊆ a. Aplicamos CompH(κ) : sean a, w ~ )} ∈ H(κ) . Por lo tanto, el lema 7.16(e) para obtener {x ∈ a : ϕH(κ) (x, w CompH(κ) . Inf H(κ) , ya que ω ∈ H(κ) . ~) ReempH(κ) : de acuerdo con el lema 7.16(f), basta verificar que si ϕ(x, y, w ~ ∈ W, entonces {y : ∃x ∈ es una fórmula que se comporta como función y a, w ~ )} ∩ H(κ) ⊆ H(κ) y |{y : ∃x ∈ a ϕH(κ) (x, y, w ~ )} ∩ H(κ) | < a ϕH(κ) (x, y, w κ. Pero esto es claro. FundH(κ) pues H(κ) es transitivo. AE H(κ) : como ya demostramos que (ZF − )H(κ) y la fórmula BO(y, x) es absoluta para modelos transitivos de ZF − (el lector debe cerciorarse de esta afirmación), entonces basta mostrar que ∀x ∈ H(κ) ∃y ∈ H(κ) BO(y, x). Sea x ∈ H(κ) , y por AE existe y ⊆ x × x tal que BO(y, x). Entonces y ⊆ H(κ) por 7.16(c). Así que y ∈ H(κ) por 7.16(f). ¿Cuándo es H(κ) un modelo interno de ZFE? El siguiente teorema proporciona una respuesta. Teorema 7.18. (ZFE) Si κ > ω es regular, entonces las siguientes condiciones son equivalentes. (a) ZFEH(κ) . (b) H(κ) = Vκ . (c) κ es fuertemente inaccesible. Demostración. (b) ⇔ (c). ⇒ ) Por contrapositiva. Si κ no es fuertemente inaccesible, entonces existe λ < κ tal que 2λ ≥ κ. Esto implica que Pot(λ) ∈ Vκ \ H(κ) . Por lo tanto, H(κ) 6= Vκ . ⇐ ) Basta ver que Vκ ⊆ H(κ) . Sea x ∈ Vκ , es decir, rg(x) = α < κ. Esto 586 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 587 ✐ ✐ Conjuntos y modelos. Curso avanzado implica que CT (x) ⊆ Vα , por lo que |CT (x)| ≤ |Vα | < κ. Aquí la desigualdad estricta se debe a que κ es fuertemente inaccesible, por lo que utilizamos el lema 1.7. (b) ⇒ (a). Usaremos el teorema 1.6(f). Basta ver que PotH(κ), es decir que ∀a ∈ H(κ) (Pot(a) ∩ H(κ) ) ∈ H(κ) . Pero esto es obvio, pues H(κ) = Vκ . (a) ⇒ (c). Usando el lema 7.16(e) y CompH(κ) podemos debilitar la condición de que se cumpla PotH(κ) a ∀x ∈ H(κ) (Pot(x) ∈ H(κ) ). Si κ no es fuertemente inaccesible, entonces existe λ < κ tal que 2λ ≥ κ. Así que Pot(λ) ∈ Vκ \ H(κ) . Por consiguiente, H(κ) 6|= Pot. Si tomamos un cardinal regular κ que no sea fuertemente inaccesible (es decir, cualquier cardinal regular conocido), podemos concluir que Con(ZFE) ⇒ Con(ZFE− + ¬Pot). De esta manera, el axioma de potencia es independiente de los otros axiomas de ZFE . De hecho, tomando κ = ω1 obtenemos una afirmación más fuerte. Corolario 7.19. Con(ZFE) ⇒ Con(ZFE− + ∀x(|x| ≤ ℵ0 )). Demostración. Consideramos el modelo H(ω1 ) de ZFE− . Si x ∈ H(ω1 ), entonces x es numerable y cualquier función suprayectiva f : ω −→ x pertenece a H(ω1 ). Por lo tanto, (|x| ≤ ℵ0 )H(ω1 ) . 7.3. Consistencia relativa de ZFE. Es esta sección presentamos como un modelo interno para ZFE la clase HOD de los conjuntos hereditarios definibles por ordinales. Obviamente, sólo trabajaremos con ZF . Informalmente, un conjunto A es definible por ordinales si y sólo si es definible a partir de una sucesión finita de ordinales; es decir, si y sólo si existen α1 , . . . , αn ∈ OR y una LTC-fórmula ϕ(y, ~x) tales que ∀y (y ∈ A ⇔ ϕ(y, α1 , . . . , αn )). Sea OD la clase de conjuntos definibles por ordinales. OR ⊆ OD pues cada ordinal es definible por la fórmula y=x. ˙ Observe que La definición que acabamos de enunciar no está dentro de ZF . Para evadir esta dificultad OD se define como el siguiente término clase. OD = {x : ∃α ∈ OR ∃ϕ ∈ Fml2 (LTC) ∃β < α (x ∈ Vα ∧ ∀y ∈ Vα (y = x ⇔ hVα , ∈i |= ϕ[y, β]))}. 587 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 588 ✐ ✐ 8. Relativización y absolutez El siguiente teorema garantiza que la definición formal coincida con la definición intuitiva. Definición 7.20. Sean {ϕi : i ∈ ω} una enumeración del conjunto Fml2 (LTC). Definimos la fórmula Defi(v0 , ϑ, i, α) como Defi(v0 , ϑ, i, α) ≡ v0 ∈ Vϑ ∧ ∀v1 ∈ Vϑ (v1 = v0 ⇔ hVϑ , ∈i |= ϕi [v1 , α]). Teorema 7.21. (a) Si x ∈ OD , entonces existen ϑ ∈ OR, i < ω y α < ϑ tales que ∀v0 (v0 = x ⇔ Defi(v0 , ϑ, i, α)). En tal caso decimos que (ϑ, i, α) define a x. (b) Si x es definible mediante α1 , . . . , αn ∈ OR por la fórmula ϕ(v0 , . . . , vn ), entonces x ∈ OD . Demostración. (a) Por la definición formal de OD existen ϑ ∈ OR, i < ω y α < ϑ tales que Defi(x, ϑ, i, α). En particular tenemos que x ∈ Vϑ , y como también se cumple que ∀v1 ∈ Vϑ (v1 = v0 ⇔ hVϑ , ∈i |= ϕi [v1 , α]), entonces, al reemplazar v1 por x obtenemos que hVϑ , ∈i |= ϕi [x, α], pues obviamente x = x. Ahora bien, si v0 es tal que Defi(v0 , ϑ, i, α), sustituimos nuevamente v1 por x para obtener x = v0 ⇔ hVϑ , ∈i |= ϕi [x, α], y como el lado derecho de esta equivalencia es válido, podemos concluir que x = v0 . (b) Basta con obtener una fórmula χ y ϑ, α ∈ OR tales que ∀y ∈ Vϑ (y = x ⇔ hVϑ , ∈i |= χ[y, α]). Consideremos el término clase OR<ω = {s : ∃n < ω, s : n −→ OR}. Definimos un buen orden para OR<ω mediante s0 ≺ s1 si y sólo si (s0 ⊆ s1 ∧ s0 6= s1 ) ∨ (dom(s0 ) = dom(s1 ) ∧ ∃i < dom(s0 ) (s0 ↾ i = s1 ↾ i ∧ s0 (i) < s1 (i))). Sea g el isomorfismo de Mostowski para ≺. Por el teorema 6.17 se tiene que g[OR<ω ] = OR. Sea h : OR −→ OR<ω el inverso del isomorfismo de Mostowski. Considere la siguiente fórmula: χ(V0 , α) ≡ ∃v1 , . . . , ∃vn (v1 = h(α)(0) ∧ . . . ∧ vn = h(α)(n − 1) ∧ ϕ(v0 , . . . , vn )). Sea α ∈ OR tal que h(α) : n −→ OR; para 1 ≤ i ≤ n se cumple h(α)(i) = αi+1 (recuerde que α1 , . . . , αn están fijos). Mediante el principio de 588 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 589 ✐ ✐ Conjuntos y modelos. Curso avanzado reflexión de Lévy-Montague 7.5, tomamos un ordinal ϑ tal que x, α ∈ Vϑ y ∀y(y = x ⇔ χ(v0 , vn+1 )) es Vϑ -absoluta. Como se sabe que ∀y(y = x ⇔ χ(v0 , α)), podemos deducir que ∀y ∈ Vϑ (y = x ⇔ χ Vϑ (v0 , α)). Pero esto es equivalente a ∀y ∈ Vϑ (y = x ⇔ hVϑ , ∈ i |= χ[y, α]). Por lo tanto, x ∈ OD . El siguiente lema nos será de utilidad posteriormente. Lema 7.22. Si x se define mediante la LTC fórmula ϕ(v0 , . . . , vn ) con parámetros ~x ∈ OD , entonces x ∈ OD . ~ ) define a xi mediante α ~ ∈ OR, Demostración. Supongamos que ϕi (vi , α ~ ). Entonces la fórmula es decir, vi = xi ⇔ ϕi (vi , α ~ ) ∧ . . . ∧ ϕn (vn , α ~ ) ∧ ϕ(v0 , . . . , vn )) ∃v1 , . . . , vn (ϕ1 (v1 , α ~. define a x mediante α Podría conjeturarse que OD es un modelo interno de ZF ; de hecho, ya obtuvimos que ParOD , UniónOD y PotOD . Para nuestra desgracia, OD no tiene por qué ser transitivo, así que ninguna de las herramientas que hemos desarrollado sirve en este caso. De hecho, el axioma de extensionalidad es falso en OD a menos que V = OD , situación que, aunque consistente, es poco probable. Para obtener un modelo no sólo de ZF sino también de ZFE, construimos la clase de conjuntos hereditarios definibles por ordinales que son aquellos conjuntos x ∈ OD tales que los elementos de x, los elementos de los elementos de x, etc., pertenecen a OD . Definición 7.23. La colección de los conjuntos hereditarios definibles por ordinales, denotada como HOD, se define mediante el siguiente término clase: HOD = {x : CT({x}) ⊆ OD }. Observe que se cumple OR ⊆ HOD ⊆ OD . Veamos que HOD es un modelo interno de ZF , para lo cual nos serviremos del teorema 6.7. Teorema 7.24. (ZF ) HOD es un modelo interno de ZF . Demostración. HOD es transitivo. Sean x ∈ y ∈ HOD . Como y ∈ CT ({y}), entonces y ⊆ CT ({y}) pues CT ({y}) es transitivo; además, puesto que x ∈ y, {x} ⊆ CT ({y}), por lo que CT ({x}) ⊆ CT ({y}). Ahora 589 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 590 ✐ ✐ 8. Relativización y absolutez bien, como y ∈ HOD entonces CT ({y}) ⊆ OD , así que CT ({x}) ⊆ OD, es decir, x ∈ HOD . HOD es Σ0 -cerrado. Sean ϕ(u, v1 , . . . , vn ) una fórmula Σ0 y x, x1 , . . . , xn ∈ HOD . En esta situación tenemos que z = {u ∈ x : ϕ(u, x1 , . . . , xn )} se define a partir de x, x1 , . . . , xn mediante la fórmula ψ(v0 , v, v1 , . . . , vn ) ≡ ∀u (u ∈ v0 ⇔ u ∈ v ∧ ϕ(u, v1 , . . . , vn )). Así que por el lema 7.22, podemos concluir que z ∈ OD . Como por hipótesis x ∈ HOD , entonces CT ({x}) ⊆ OD y se cumple CT ({z}) = {z} ∪ CT (z) ⊆ {z} ∪ CT (x) ⊆ {z} ∪ CT ({x}) ⊆ OD . Por lo tanto, HOD es Σ0 -cerrado. HOD es casi universal. Sea x ⊆ HOD ; tenemos que mostrar que existe y ∈ HOD tal que x ⊆ y. Como V = V, por el axioma de fundación existe α ∈ OR tal que x ⊆ Vα ∩HOD . Así que basta demostrar que Vα ∩HOD ∈ HOD . Puesto que CT ({Vα ∩ HOD }) = {Vα ∩ HOD } ∪ (Vα ∩ HOD ), por la transitividad de Vα , y Vα ∩ HOD ⊆ HOD ⊆ OD basta mostrar que Vα ∩ HOD ∈ OD , pero esto último resulta de la fórmula ϕ(v0 , v1 ) ≡ ∀u(u ∈ v0 ⇔ u ∈ Vv1 ∧ CT ({u}) ⊆ OD ). Por lo tanto, HOD es un modelo interno de ZF . Para terminar con lo planeado, basta ver que AE HOD . Teorema 7.25. Se cumple que AE HOD . Demostración. Primero vamos a definir un buen orden <T para OD . Sea T = {(ϑ, i, α) : ϑ ∈ OR ∧ i ∈ ω ∧ α ∈ ϑ}. Definimos un buen orden en T mediante el orden lexicográfico: (ϑ, i, α) <T (ϑ′ , j, α′ ) si y sólo si ϑ < ϑ′ ∨ (ϑ = ϑ′ ∧ i < j) ∨ (ϑ = ϑ′ ∧ i = j ∧ α < α′ ). A partir de <T definimos un orden para OD como sigue. Sean x, x′ ∈ OD . x <OD x′ si y sólo si ∃t ∈ T (t define a x ∧ ∀t ′ ∈ T (t ′ define a x′ ⇒ t <T t ′ )). Es fácil ver que <OD define un buen orden sobre OD (véase el Ejer. 29). Tomemos a ∈ HOD tal que a es un conjunto no vacío de conjuntos no vacíos Def ajenos entre sí. Sea b = {y : ∃x ∈ a(y es un elemento <OD −mínimo de x)}; 590 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 591 ✐ ✐ Conjuntos y modelos. Curso avanzado b se eligió de tal forma que sus elementos son los mínimos de los elementos de a. Para demostrar que AE HOD , basta ver que b ∈ HOD . Como b se definió mediante a ∈ OD , tenemos que b ∈ OD por el lema 7.22. Dado que a ∈ HOD S S y UniónHOD seSsigue que S a ∈ HOD, es decir, CT ({ a}) ⊆ OD . Así que de CT (b) ⊆ CT ( a) ⊆ CT ({ a}) se concluye que CT (b) ⊆ OD . Finalmente, como CT ({b}) = {b} ∪ CT (b), deducimos que CT ({b}) ⊆ OD, es decir, b ∈ HOD . Por lo tanto, AE HOD . Con ayuda del método de modelos internos logramos el siguiente corolario. Corolario 7.26 (Gödel). Con(ZF ) ⇒ Con(ZFE). Debemos aclarar que Gödel obtuvo el resultado mediante el modelo interno L conocido como universo constructivo, que estudiaremos ampliamente en el capítulo de constructibilidad. 7.4. Método de los modelos transitivos numerables. Mediante el colapso de Mostowski obtenemos el siguiente resultado, que es el fundamento para el método de los modelos transitivos numerables. Teorema 7.27. Sea T un conjunto infinito de LTC-enunciados que contiene a ZFE. Sea T0 un subconjunto finito de T . Entonces T ⊢ ∃M (|M| = ℵ0 ∧ Trans(M) ∧ T0M ). Demostración. Supongamos T , por lo que se tiene ZFE. Sin pérdida de generalidad, podemos suponer que Ext pertenece a T0 . Mediante el teorema 7.11 podemos tomar un conjunto numerable W tal que cada ϕ ∈ T0 es Wabsoluta. Tomemos R = ∈↾ W. Como R es bien fundada en W, para cada x se cumple que {y : yRx} = x ∩ W ∈ V y no hay una R-sucesión infinita decreciente que pueda inducir una ∈-sucesión del mismo tipo, puesto que las últimas no existen. Por lo tanto, se cumple Ext y, por la manera en que se eligió W, Ext es W-absoluta. Entonces ExtW y esto implica que R es extensional, de manera que podemos utilizar el teorema del colapso de Mostowski. Sea M el colapso de Mostowski de W y π : W −→ M el isomorfismo de Mostowski para (W, R). Mediante inducción sobre las fórmulas en el metalenguaje, es fácil demostrar que ∀~x ∈ W (ϕW (~x) ⇔ ϕM (π(~x))). 591 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 592 ✐ ✐ 8. Relativización y absolutez En particular, para cada LTC-enunciado ϕ se cumple ϕW ⇔ ϕM . Además, de la suposición de que cada enunciado ϕ de T0 se cumple y es W-absoluto, se sigue que ϕM . Esto era lo que se quería demostrar. Para que este resultado sea útil en pruebas de consistencia relativa, se introduce una constante nueva M que es testigo de la fórmula ∃M (|M| = ℵ0 ∧ Trans(M) ∧ T0M ) y dado un conjunto T de LTC-enunciados tal que ZFE ⊆ T , denotamos con TM a la lista T + |M| = ℵ0 + Trans(M) + T M ; con esto obtenemos el siguiente corolario. Corolario 7.28. Si Con(T ), entonces Con(TM ). Demostración. Supongamos que TM es inconsistente. Por el teorema de compacidad existe un subconjunto finito T0 ⊆ T tal que (T0 )M es inconsistente. Por lo tanto, T0 ⊢ ¬ (|M| = ℵ0 ∧ Trans(M) ∧ T0M ). Mediante el lema de eliminación de constantes para la lógica 12.20 obtenemos T0 ⊢ ¬ (|x| = ℵ0 ∧ Trans(x) ∧ T0x ) de donde, por la regla de generalización concluimos que T0 ⊢ ∀x¬ (|x| = ℵ0 ∧ Trans(x) ∧ T0x ). Por consiguiente, T ⊢ ¬∃x (|x| = ℵ0 ∧ Trans(x) ∧ T0x ), lo cual contradice el teorema 7.27. Así que TM es consistente. Terminamos la sección con un principio para pruebas de consistencia relativa. Teorema 7.29. Sea T un conjunto de LTC-enunciados tal que ZFE ⊆ T . Sea T ′ otro conjunto de LTC-enunciados tal que para cada lista finita T0′ ⊆ T ′ es ′ cierto que TM ⊢ ∃M ′ ((T0′ )M ∧ M ′ 6= ∅). Si Con(T ), entonces Con(T ′ ). Demostración. Supongamos que T ′ es inconsistente. Entonces existe un subconjunto finito T0′ de T ′ que es inconsistente. Por lo tanto, T0′ ⊢ x 6= x. El V ′ ′ lema del modelo nos dice que ZF ⊢ M ′ 6= ∅ ⇒ ( (T0′ )M ⇒ (∀x (x 6= x))M ) ′ y, por hipótesis, TM ⊢ ∃M ′ ((T0′ )M ∧ M ′ 6= ∅). En consecuencia, para tal M ′ , TM ⊢ M ′ 6= ∅ ∧ ∀x ∈ M ′ (x 6= x), por lo que TM es inconsistente y, por el corolario 7.28, T es inconsistente. 8. Jerarquía de Lévy En secciones anteriores se ha establecido que para ciertas estructuras, algunas fórmulas del lenguaje LTC son absolutas; por ejemplo, las fórmulas primitivas de LTC son absolutas para las estructuras estándar. 592 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 593 ✐ ✐ Conjuntos y modelos. Curso avanzado La noción de absolutez está relacionada con la estructura lógica de las fórmulas de LTC. A. Lévy dio una clasificación de las fórmulas de LTC en la cual se establece esta relación. Definición 8.1. (Por recursión sobre ω): (a) Una LTC-fórmula es Σ0 y Π0 si todos sus cuantificadores son acotados. (b) Una LTC-fórmula Φ es Σn+1 (Πn+1 ) si es de la forma ∃~xΨ(~x) (∀~xΨ(~x)), donde Ψ es una fórmula Πn (Σn ). Para establecer la conexión entre la clasificación anterior y la noción de absolutez, es necesario definir una contraparte semántica de dicha clasificación. Definición 8.2. Sea T una subteoría de ZF (que en particular puede ser ZF ) y sea Φ una LTC-fórmula. (a) Φ es ΣTn (ΠTn ) si existe una LTC-fórmula Ψ en Σn (Πn ) tal que T ⊢ Φ ⇔ Ψ. (b) Φ es ∆Tn si es ambas, ΣTn y ΠTn . El siguiente teorema relaciona la jerarquía de Lévy con la noción de absolutez. Teorema 8.3. Sean T una subteoría de ZF (posiblemente ZF ), M una clase transitiva tal que ΘM para todo axioma Θ de T, y Φ una fórmula cualquiera de LTC. Con estas hipótesis, se puede afirmar lo siguiente: (a) (b) (c) (d) Si Φ es ΣT0 , entonces Φ es absoluta (para M). Si Φ es ΣT1 , entonces Φ es U-absoluta. Si Φ es ΠT1 , entonces Φ es D-absoluta. Si Φ es ∆T1 , entonces Φ es absoluta, donde U-absoluta significa que si Φ es válida una clase transitiva M, entonces es cirto en el universo. La fórmula Φ es D-absoluta si siempre que es válida O el universo, también lo es en M. Demostración. (a) Supongamos que las variables libres de Φ están entre las variables de ~v y sea Ψ(~v) una fórmula Σ0 tal que T ⊢ Φ ⇔ Ψ. 593 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 594 ✐ ✐ 8. Relativización y absolutez Ya que T es una subteoría de ZF , por generalización se cumple que T ⊢ ∀~v(Φ ⇔ Ψ). Además, puesto que ΘM para todo Θ en T, aplicando la parte (1) del lema fundamental de modelos internos 6.2 concluimos T ⊢ (∀~v(Φ ⇔ Ψ))M . (Con la notación del teorema 6.2, se aplica a T = Γ = Σ.) Esto significa que T ⊢ (∀~v ∈ M)(ΦM ⇔ ΨM ). Ahora, para demostrar que (∀~v ∈ M)(ΦM ⇔ Φ) (es decir, que Φ es absoluta), podemos suponer, sin pérdida de generalidad, que Φ es una fórmula Σ0 . Del lema 2.2 (aplicado al hecho de que T ⊢ ∀~v(Φ ⇔ Ψ)) se sigue que Ψ es absoluta si y sólo si Φ lo es. Continuamos la demostración por inducción sobre la construcción de Φ: si Φ es una fórmula primitiva, la demostración es trivial pues sabemos que las fórmulas primitivas de LTC son absolutas para estructuras estándar. Si Φ es de la forma Φ1 ∧ Φ2 o de la forma ¬Φ0 , también se sigue trivialmente que Φ es absoluta haciendo uso de la hipótesis de inducción y aplicando la definición de relativización para la negación y la conjunción. Para el caso en que Φ es de la forma (∃x ∈ y)Φ0 (x, y,~v) , se tiene que (Φ(y,~v))M es de la forma ∃x ∈ M(x ∈ y ∧ (Φ0 (x, y,~v))M ). De aquí que dadas y y ~v en M, si (Φ(y,~v))M entonces (∃x ∈ y)(Φ0 (x, y,~v))M . Así, para alguna x ∈ y se cumple (Φ0 (x, y,~v))M , que por hipótesis de inducción es equivalente a Φ0 (x, y,~v). Por lo tanto, (∃x ∈ y)Φ0 (x, y,~v), que es equivalente a Φ(y,~v). Luego, dadas y y ~v en M, si Φ(y,~v), entonces (∃x ∈ y)Φ0 (x, y,~v); así, para algún x ∈ y se cumple que Φ0 (x, y,~v), pero como M es transitiva, y ∈ M y x ∈ y se tiene que x ∈ M. Por lo tanto, haciendo uso de la hipótesis de inducción (Φ0 (x, y,~v))M , lo cual implica (∃x ∈ y)(Φ0 (x, y,~v))M , que es equivalente a (Φ(y,~v))M . 594 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 595 ✐ ✐ Conjuntos y modelos. Curso avanzado (b) Por el mismo argumento que en la parte (a), podemos suponer, sin pérdida de generalidad, que Φ es Σ1 . Sea Φ(~v) la fórmula (∃~u)Φ0 (~u,~v), donde Φ0 es una fórmula Σ0 . Ahora, si se supone que para algún v ∈ M, se cumple (Φ(~v))M y para algún ~u ∈ M, (Φ0 (~u,~v))M . Luego, aplicando la parte (a) a la fórmula anterior (que es Σ0 ), se concluye Φ0 (~u,~v). Por lo tanto, (∃~u)Φ0 (~u,~v), es decir, Φ(~v). (c) Como antes, supondremos que Φ es Π1 . Sea Φ(~v) la fórmula (∀~u)Φ0 (~u,~v), donde Φ0 es Σ0 . Supongamos que Φ(~v) para algún ~v ∈ M. En particular, se tiene que para todo ~u ∈ M se cumple Φ0 (~u,~v), y aplicando el resultado (a) a esta fórmula, se concluye (Φ0 (~u,~v))M . De lo anterior se sigue (∀~u ∈ M)Φ0 (~u,~v)M , que es equivalente a Φ(~v)M . (d) Se deduce de los anteriores. A continuación ofrecemos una lista de fórmulas Σ0 . Teorema 8.4. Las siguientes fórmulas (escritas formalmente en LTC) son Σ0 (y por lo tanto absolutas para modelos transitivos): (a) (c) (e) (g) (i) (k) (m) (o) (q) (s) (u) (w) (y) (aa) (cc) (ee) (gg) x = y, (b) x ∈ y, x ⊆ y, (d) y = {x}, y = {x1 , x2 }, (f) y = {x1 , ..., xn }, y = (x1 , x2 ), (h) y = (x1 , ..., xn ), y = (x)ni (para toda i = 1, ...n), (j) z = xS∩ y, z = xT∪ y, (l) y = x, y = x, (n) y = x \ z, y = x ∪ {x}, (p) “x es una pareja ordenada”, “x es una n-ada” (r) “x es una relación sobre y”, “x es una función”, (t) y = dom(x), y = ran(x), (v) y = x(z), y = x[z], (x) y = x|z, y = x × z, (z) y = x−1 , Or(x), (bb) lím(x), sucesor(x), (dd) “x es un número natural”, “x es una sucesión”, (ff) x : y → z, x : y ⇔ z. Demostración. Demostraremos el teorema para algunas de las fórmulas; las restantes se dejan como ejercicio. Para (a) y (b), el teorema es trivial. Para 595 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 596 ✐ ✐ 8. Relativización y absolutez (c), considere la fórmula (∀z ∈ x)[z ∈ y]. Para (e), considere la fórmula (∀x ∈ y)(x = x1 ∨ x = x2 ) ∧ (x1 ∈ y ∧ x2 ∈ y). Para (g), considere la fórmula (∃z ∈ y)(z = {x1 }) ∧ (∃z ∈ y)(z = {x1 , x2 }) ∧ (∀z ∈ y)(z = {x1 } ∨ z = {x1 , x2 }). Para (k), (l) y (o), las fórmulas (∀w ∈ z)(w ∈ x ∨ w ∈ y) ∧ (x ⊆ z ∧ y ⊆ z); (∀w ∈ x)(w ⊆ y) ∧ (∀z ∈ y)(∃w ∈ x)(z ∈ w); (x ∈ y) ∧ (x ⊆ y) ∧ (∀w ∈ y)(w ∈ x ∨ w = x). Para (p), la fórmula (∃z ∈ w)(∃y ∈ w)(w = Para (r), la fórmula S x ∧ x = (y, z)). (∀w ∈ x)(∃v ∈ y)(∃u ∈ y)[w = (u, v)]. Para (t), la fórmula (∀u ∈ y)(∃v ∈ [[ x)[(u, v) ∈ x] ∧ (∀u ∈ [[ x)(∀v ∈ [[ x)[(u, v) ∈ x ⇒ u ∈ y]. Para (y), la fórmula (∀u ∈ y)(∀v ∈ z)[(u, v) ∈ x] ∧ (∀w ∈ x)(∃u ∈ y)(∃v ∈ z)[w = (u, v)]. Por último, para (aa) y (cc) considere las fórmulas (∀z ∈ x)(∀y ∈ z)(y ∈ x) ∧ (∀z ∈ x)(∀y ∈ x)(z = y ∨ z ∈ y ∨ y ∈ z); OR(x) ∧ (∃y ∈ x)(∀z ∈ x)(z ∈ y ∨ z = y). Corolario 8.5. La fórmula “x es un conjunto finito” es Σ1 . Demostración. Observe que la relación “x es finito” se define con la fórmula biy ∃n∃f (Nat(n) ∧ f : x − → n), donde Nat(n) es la Σ0 -fórmula que define la relación de ser número natural y biy f :x− → n define la relación “f es una función biyectiva de x en n”. Luego, por 596 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 597 ✐ ✐ Conjuntos y modelos. Curso avanzado biy el teorema anterior, se tiene que tanto Nat(n) como f : x − → n son Σ0 y, por lo tanto, la fórmula deseada es Σ0 . El siguiente teorema ofrece varias propiedades de cerradura para los niveles de la jerarquía de Lévy, propiedades que se usarán bastante en lo sucesivo. Teorema 8.6. Sea T una teoría para el lenguaje de la teoría de conjuntos. Sean Φ, Ψ fórmulas de LTC. (1) Si Φ, Ψ son ΣT0 ; también lo son Φ ∧ Ψ, Φ ∨ Ψ, ¬Φ. (2) Si Φ es ΣTn (ΠTn ), entonces ¬Φ es ΠTn (ΣTn ). (3) Φ es ∆Tn si y sólo si Φ y ¬Φ son ΣTn . (4) Si Φ, Ψ son ΣTn ; también lo son Φ ∧ Ψ, Φ ∨ Ψ, ∃xΦ, (∃x ∈ y)Φ. (5) Si Φ, Ψ son ΠTn ; también lo son Φ ∧ Ψ, Φ ∨ Ψ, ∀xΦ, (∀x ∈ y)Φ. (6) Si Φ, Ψ son ∆Tn ; también lo son Φ ∧ Ψ, Φ ∨ Ψ, ¬Φ. (7) Si m < n, entonces ΣTm ∪ ΠTm ⊆ ∆Tn . Demostración. (1) Se sigue trivialmente. Los siguientes incisos del teorema se demostrarán por inducción sobre n: (2) Suponiendo que Φ es ΣT1 , existe Φ0 (x) en Σ0 tal que T ⊢ Φ ⇔ ∃xΦ0 (x). Así, T ⊢ ¬Φ ⇔ ∀x¬Φ0 (x), donde (por el inciso 1) ¬Φ0 (x) es Σ0 . Por lo tanto, ¬Φ es Π1 . En general, si T ⊢ Φ ⇔ ∃xΦ0 (x), con Φ0 una fórmula Πn−1 , entonces T ⊢ Φ ⇔ ∀x¬Φ0 (x). Pero por hipótesis inductiva, ¬Φ0 es Σn−1 , por lo que Φ es Πn . El caso en que Φ es Πn es totalmente análogo. (3) Se sigue directamente del inciso anterior. (4), (5) Sean Φ0 (z, x) y Ψ0 (u) fórmula Σ0 , tales que T ⊢ Φ ⇔ ∃zΦ0 (z, x), Así, T ⊢ Ψ ⇔ ∃uΨ0 (u). 597 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 598 ✐ ✐ 8. Relativización y absolutez T ⊢ Φ ∧ Ψ ⇔ ∃z∃u(Φ0 (z, x) ∧ Ψ0 (u)), T ⊢ Φ ∨ Ψ ⇔ ∃z∃u(Φ0 (z, x) ∨ Ψ0 (u)), T ⊢ ∃xΦ ⇔ ∃z∃x(Φ0 (z, x)), T ⊢ (∃x ∈ y)Φ ⇔ ∃z∃x(x ∈ y ∧ Φ0 (z, x)). En los cuatro casos, las fórmulas de la derecha del bicondicional, son (por 1) Σ0 . Por lo tanto, las cuatro fórmulas del lado izquierdo del condicional son Σ1 . De aquí se sigue también el caso n = 1 del inciso 5, aplicando el inciso 2; por ejemplo, si Φ y Ψ son Π1 , entonces ¬Φ y ¬Ψ son Σ1 . Tomando en cuenta lo recién demostrado, se sigue que Φ ∧ Ψ es Σ1 , y al tomar la negación de esta última fórmula se obtiene la fórmula equivalente Φ ∨ Ψ, que por 2 es Π1 . En el caso general de inducción, para demostrar 4 se hace uso de la hipótesis de inducción de 5 (y viceversa), y la conclusión se sigue de igual manera que en el caso n = 1. (6) Esta propiedad se sigue directamente de 3, 4 y 5. (7) Para demostrar esta propiedad, se debe observar que es suficiente con agregar cuantificadores (ya sea ∃ o ∀ según sea necesario) que cuantifiquen una variable nueva que no aparezca en la fórmula equivalente, ya sea al inicio de la cadena de cuantificadores no acotados o al final de ésta. Lema 8.7. La fórmula es ∆ZF 1 . BF(x, y) ≡ “x es una relación bien fundada sobre y”, Demostración. Recuerde que la definición de que la relación E es bien fundada en X(BF(E, X)) es Φ(E, X) ∧ ∀A[A ⊆ X ∧ A 6= ∅ ⇒ (∃a ∈ A)(∀x ∈ A)¬E(x, a)], donde Φ(E, X) es la fórmula Σ0 (dada por el Teorema 8.4) que define la relación “E es una relación sobre X”. Ahora, con ayuda de los teoremas 8.4 y 8.6, se concluye que esta fórmula es Π1 . Por otro lado, en ZF se puede demostrar que una relación E es bien fundada sobre un conjunto X si y sólo si ∃f [f : X → OR ∧ (∀x ∈ X)(∀y ∈ X)(E(x, y) ⇒ f (x) < f (y))]. 598 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 599 ✐ ✐ Conjuntos y modelos. Curso avanzado De aquí que (por los Teoremas 8.4 y 8.6) la fórmula sea ΣZF 1 y, por lo tanto, . ∆ZF 1 Dada una fórmula Φ de LTC, usaremos la siguiente notación: (a) Φ((x)0 , ~z) para denotar la fórmula (∃u ∈ x)(∃a ∈ u)(∃b ∈ u)[x = (a, b) ∧ Φ(a, ~z)]. (b) Φ((x)1 , ~z) para denotar la fórmula (∃u ∈ x)(∃a ∈ u)(∃b ∈ u)[x = (a, b) ∧ Φ(b, ~z)]. (c) Φ((x)ni , ~z) para denotar la fórmula, (∃u ∈ x)(∃a0 ∈ u)(∃a1 ∈ u) . . . (∃an−1 ∈ u) [x = (a0 , a1 , . . . , an−1 ) ∧ Φ(ai , ~z)]. (En general, para una fórmula de LTC de la forma Φ(x1 , . . . , xn , ~z) se puede definir la fórmula Φ((x)n0 , (x)n1 , . . . (x)nn−1 , ~z)). (d) Φ(x(y), ~z) es la fórmula Fun(x) ∧ [(∃w ∈ x)(∃u ∈ w)(∃v ∈ u)[(v 6= y) ∧ w = (y, v) ∧ Φ(v, ~z)] ∨[(∃w ∈ x)(∀u ∈ w)(∀v ∈ u)((v = y) ∧ W = (y, y) ∧ Φ(y, ~z))]. En términos de las anteriores definiciones establecemos el siguiente lema, cuya demostración es trivial: Lema 8.8. Si Φ(x, ~z) es una fórmula Σ0 , entonces también lo son las fórmulas Φ((x)0 , ~z), Φ((x)1 , ~z), Φ((x)ni , ~z) y Φ(x(y), ~z). En el siguiente teorema se supone en forma tácita la unicidad de las parejas ordenadas, por lo que requerimos extensionalidad. Teorema 8.9. (Contracción de cuantificadores). Sea T una teoría para LTC tal que sus axiomas incluyan los axiomas de vacío, extensionalidad y par. Sea n ≥ 1 y sea Φ(~z) una fórmula de LTC. (a) Si Φ(~z) es Σn , entonces existe una fórmula Ψ(~y, ~z) que es Σ0 y tal que T ⊢ Φ(~z) ⇔ ∃x1 ∀x2 ∃x3 · · · − xn Ψ(y1 , . . . , yn , ~z). (b) Si Φ(~z) es Πn , entonces existe una fórmula Ψ(~y, ~z) Σ0 tal que T ⊢ Φ(~z) ⇔ ∀x1 ∃x2 ∀x3 · · · − xn Ψ(y1 , . . . , yn , ~z). 599 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 600 ✐ ✐ 8. Relativización y absolutez Demostración. forma (a) Como Φ(~z) es una fórmula Σn , entonces es de la ∃x1,1 ∃x1,2 . . . ∃x1,m1 ∀x2,1 ∀x2,2 . . . ∀x2,m2 · · · − xn,1 − xn,2 · · · − xn,mn Θ(~x, ~z). Ahora, sea Ψ(~y, ~z) la siguiente fórmula: (y1 es una m1 -ada)∧(y2 es una m2 -ada)∧ · · · ∧(yn es una mn -ada) m1 m2 m2 mn 1 ∧Θ[(y1 )m z]. 0 , . . . , (y1 )m1 −1 , (y2 )0 , . . . , (y2 )m2 −2 , . . . , (yn )mn −1 , ~ De la proposición anterior se concluye que Ψ es Σ0 . Además, es claro que T ⊢ Φ(~z) ⇔ ∃y1 ∀y2 ∃y3 · · · − yn Ψ(y1 , y2 , . . . , yn , ~z). La demostración del caso (b) es completamente análoga. Las propiedades de clausura para los niveles de la jerarquía de Lévy, establecidas en el terorema 8.6, se pueden extender, para el caso en que T=ZF , a dos propiedades más: Teorema 8.10. 1. Si Φ es una fórmula Σn , entonces (∀x ∈ y)Φ es ΣZF n . 2. Si Φ es una fórmula Πn , entonces (∃x ∈ y)Φ es ΠZF n . Demostración. Demostraremos (a) y (b) simultáneamente por inducción sobre n: si n = 0, en ambos casos no hay nada que demostrar. Luego, sea Φ una fórmula Σn+1 . Por el teorema anterior se sabe que existe una fórmula Ψ que es Πn y tal que ZF ⊢ Φ ⇔ ∃zΨ. Así, por generalización logramos ZF ⊢ (∀x ∈ y)Φ ⇔ (∀x ∈ y)∃zΨ. Ahora quisiéramos acotar la variable z por un conjunto u. Sea f : y → V definida por f (x) = ( {z|Ψ(x, z) ∧ z de rango mínimo}, si ∃zΨ(x, z); ∅, si no existe tal z. Claramente, f (x) ∈ V para toda x ∈ y. Sea u = que S x∈y f (x). Se cumple entonces ZF ⊢ (∀x ∈ y)∃zΨ ⇔ ∃u(∀x ∈ y)(∃z ∈ u)Ψ. 600 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 601 ✐ ✐ Conjuntos y modelos. Curso avanzado Por lo tanto, ZF ⊢ (∀x ∈ y)Φ ⇔ ∃u(∀x ∈ y)(∃z ∈ u)Ψ. Pero, por hipótesis de inducción aplicada a Ψ (que es una fórmula Πn ), (∃z ∈ u)Ψ es una fórmula ΠZF n . Luego, aplicando el teorema 8.6, se tiene que (∀x ∈ y)(∃z ∈ u)Ψ es una fórmula ΠZF n . Por lo tanto, la fórmula ∃u(∀x ∈ y)(∃z ∈ u)Ψ es una fórmula ΣZF , lo cual implica que (∀x ∈ y)Φ es n+1 también una fórmula ΣZF . n+1 Ahora suponga que Φ es Πn+1 . Por el teorema 8.6, ¬Φ es ΣZF n+1 . Aplicando a esta fórmula el inciso anterior tenemos que (∀x ∈ y)¬Φ también es una ZF fórmula ΣZF n+1 . De aquí se tiene que ¬(∃x ∈ y)Φ es Σn+1 . Por último, aplicando de nuevo el teorema, se concluye que (∃x ∈ y)Φ es una fórmula ΠZF n+1 . 9. Ejercicios 1. Investigue qué axiomas de ZF son verdaderos en OR. 2. (AE ). Sea κ un cardinal fuertemente inaccesible. Verifique que los siguientes sean absolutos para Vκ . (a) Pot(x). (b) ωα . (c) iα . (d) Vα . (e) cf (α). (f) α es fuertemente inaccesible. 3. En ZFE − Fund verifique el ejercicio 1 para V y para ∃α (α es fuertemente inaccesible). 4. Si κ es inaccesible, entonces ∃M(|M| = ℵ0 ∧ ZFEM ). [Sugerencia: Como hVκ , ∈i es un modelo de ZFE , por el teorema de Löwenheim-Skolem, existe un modelo numerable de ZFE. Ası́ que existe E ⊆ ω × ω tal que A = hω, Ei es un modelo de ZFE. Verifique que (A es un modelo numerable de ZFE )Vκ ]. 5. Demuestre el lema 2.2. 6. Demuestre el corolario 2.4. 7. Demuestre el corolario 3.7. 601 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 602 ✐ ✐ 8. Relativización y absolutez 8. Demuestre el lema 4.3. 9. Demuestre los teoremas de isomorfismo 6.9 y 6.10. κ 10. (AE ) Muestre que si κ > ω, entonces |H(κ) | = 2⌣ . 11. (AE ) Muestre que si κ > ω, entonces H(κ) = Vκ si y sólo si κ = iκ . 12. Si κ es un cardinal inaccesible, entonces existe un α < κ tal que hVα , ∈i ≺ hVκ , ∈i. Más aún, el conjunto {α < κ : hVα , ∈i ≺ hVκ , ∈i} es un club. [Sugerencia: Construya funciones de Skolem h para Vκ y sea α = lím αn , donde αn+1 < κ cumple que h ↾ Vαn ⊆ Vαn +1 para cada h.] 13. Sea HA = {x ∈ A : x ⊆ HA}. Si A es la clase de los conjuntos finitos, denotamos HA como HF. Pruebe que HF = Vω . Sea HC = H{X : |X| ≤ ℵ0 }. Para cada α ∈ OR, sea Hα = HC ∩ Vα . Pruebe que HS |X| ≤ ℵ0 } y para γ lı́mite, 0 = ∅, Hα+1 = {X ⊆ Hα : Hγ = α<γ Hα . 14. (ZFE ) Muestre que HC = Hω1 . 15. (ZF ) (∗) Muestre que HC = Hω2 . [Sugerencia: Muestre S que para toda A ∈ SHC se cumple |rg(A)| ≤ ℵ1 . Como rg(A) = n<ω {rg(x) : x ∈ n A} basta encontrar de manera uniforme para toda A ∈ HC funciones FnA tales que FnA transforma al conjunto ω1n+1 en el conjunto S {rg(x) : x ∈ n A}. Sean F0A (α) el α-ésimo elemento del conjunA (α , . . . , α to {rg(x) : x ∈ A} y Fn+1 0 n+1 ) el αn+1 -ésimo elemento del X conjunto {Fn (α0 , . . . , αn ) : X ∈ A}.] 16. (ZFE ) Muestre que HC es un modelo transitivo de ZFE − . (AE se necesita para mostrar que UniónHC .) 17. La teorı́a de conjuntos de Zermelo Z es ZF − Reemp. Muestre que si γ > ω es un ordinal lı́mite, entonces Vγ es un modelo para Z; además, si AE entonces AE Vγ . 18. (AE ). Muestre que para toda κ > ω, H(κ) es modelo de Z − Pot. Muestre que Pot es cierto en H(κ) si y sólo si κ = iγ para algún ordinal lı́mite γ. Muestre que Reemp falla en H(iω ). 19. Argumente en Z y muestre que A × B existe para cualesquier conjuntos A, B. [Sugerencia: A × B ⊆ Pot(Pot(A ∪ B)). Muestre que en Z se 602 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 603 ✐ ✐ Conjuntos y modelos. Curso avanzado pueden desarrollar las propiedades básicas de funciones y buenos órdenes, ası́ como las propiedades básicas de ω, R y C.] 20. Encuentre un enunciado ϕ tal que para cualquier β ∈ OR, si ϕ es Vβ absoluta entonces β = ωβ . Después obtenga una fórmula ψ(x) tal que para cualquier conjunto transitivo M 6= ∅, si ψ(x) es absoluta para M entonces M = Vβ para alguna β tal que β = ωβ . [Sugerencia: ϕ será suficiente para garantizar en ZF que ∀α(ωα existe). ψ(x) puede ser ϕ ∧ x = Vα .] 21. Muestre que la relación BF (A, R) es absoluta para modelos tránsitivos de ZF − . 22. Sea F : V −→ V una “función” de V sobre V . Sea E ⊆ V × V tal que xEy si y sólo si x ∈ F (y). Muestre dentro de ZFE que hV, Ei es un modelo de ZFE − Fund. Tenga cuidado con las relativizaciones; recuerde que en este caso ∈ se interpreta como E. 23. Use el ejercicio anterior para mostrar la consistencia de ZFE − Fund + ∃x(x = {x}), asumiendo la consistencia de ZFE. [Sugerencia: Sean F (0) = 1, F (1) = 0. De la misma manera, muestre la consistencia de ZFE − Fund + ∃x∃y(x = {y} ∧ y = {x} ∧ x 6= y).] 24. Suponga Con(ZFE) y demuestre la consistencia de ZFE − Fund más la siguiente versión del teorema del colapso de Mostowski: Si R es extensional en A, entonces hA, Ri ∼ = hM, ∈i para algún conjunto transitivo M. Observe que no se pide que R sea bien fundada. 25. Muestre que no existe un subconjunto finito S ⊆ ZFE − Fund con el que se pueda probar en ZFE − Fund que BO(A, R) es absoluta para modelos transitivos de S. [Sugerencia: Use el ejercicio anterior y algo de teorı́a de modelos.] 26. Para cualquier conjunto A, definimos la jerarquı́a acumulativa V (α, A) como sigue: S V (0, A) = {A} ∪ CT (A) V (α + 1, A) = S Pot((V (α, A)) V (γ, A) = α<γ V (α, A). Sea BF (A) = α∈OR V (α, A). Muestre que, en ZF − Fund, BF (A) es un modelo transitivo de ZF − Fund y que AE implica AE BF (A) . 603 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 604 ✐ ✐ 8. Relativización y absolutez 27. Muestre que Con(ZF − Fund) ⇒ Con(V = BF (U)), donde U es un conjunto infinito tal que ∀x ∈ U (x = {x}). 28. (Fraenkel-Mostowski). Muestre que Con(ZF − Fund) ⇒ Con(ZF −Fund + ¬AE ). [Sugerencia: Suponga que V = BF (U) como en el ejercicio 27. Sea G el grupo de permutaciones de U y para B ⊆ U sea GB = {π ∈ G : ∀x ∈ B(π(x) = x)}. Para π ∈ G defina un “automorfismo” π⋆ : V −→ V tal que π⋆ (x) = π(x) para x ∈ U y para toda y, π⋆ (y) = {π⋆ (z) : z ∈ y}. Sean A = {y : ∃B ⊆ U(|B| < ℵ0 ∧ ∀π ∈ GB (π⋆ (y) = y))} 29. 30. 31. 32. 33. 34. 35. y HA = {y ∈ A : CT (y) ⊆ A}. Muestre que HA es un modelo transitivo de ZF − Fund + ′′ U no puede bien ordenarse ′′ .] Demuestre que <OD define un buen orden sobre OD . Muestre que las siguientes condiciones son equivalentes: (a) V = OD . (b) V = HOD . (c) OD es transitivo. (d) ExtOD . [Sugerencia: para cualquier α, se cumple Vα ∈ OD y Vα ∩ OD ∈ OD .] Si F es una función definible en OR, entonces ran(F ) ⊆ OD . Ası́ que OD es la máxima clase para la que existe un correspondencia definible e inyectiva con OR. Use el ejercicio anterior para mostrar que HOD es la máxima clase transitiva modelo de ZF para la que existe una correspondencia definible e inyectiva con OR. Muestre que existe una conjunción finita φ de axiomas de ZF que cumple lo siguiente: si M es una clase propia transitiva tal que φM , entonces ZF M . [Sugerencia: Utilice algún principio de reflexión con M ∩ Vα .] Encuentre una fórmula ϕ(x) tal que cualquier clase transitiva no vacı́a que refleje a ϕ(x) sea no numerable. Para M transitivo definimos OD (M) como la clase de conjuntos definibles mediante un número finito de elementos de OR∪M ∪{M}. Defina OD (M) y HOD (M) y muestre que ZF HOD (M) . Muestre que AE HOD (M) si y sólo si M tiene un buen orden en HOD (M). 604 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 605 ✐ ✐ Conjuntos y modelos. Curso avanzado 36. Demuestre que las fórmulas que definen a las relaciones: (d), (f), (h), (i), (j), (m), (n), (q), (s), (u),(v), (w), (x), (z), (bb), (dd), (ee), (ff) y (gg), del teorema 8.4 son Σ0 . 37. Demuestre que ω es ∆ZF 0 . 38. Demuestre que |X| ≤ |Y |, |X| = |Y | y α = cf(β) son ΣZF 1 . 39. Demuestre que las funciones α + β y α · β son ∆ZF 1 . 40. Demuestre que CT(x), Ar (para r < ω) y Vω son ∆ZF 1 . 41. Demuestre que las fórmulas Lím(κ), Reg(κ) e Inacc(κ) son ΠZF 1 , donde Lím(κ), Reg(κ) e Inacc(κ) denotan las relaciones: “κ es un cardinal lı́mite”, “κ es un cardinal regular” y “κ es un cardinal inaccesible”, respectivamente. 42. Demuestre que las siguientes formulaciones son ∆ZF 0 : • Trans(x) ≡ “x es transitivo”. • S(x) “el sucesor de x”. • x “es un conjunto ordenado”. • x “es un conjunto linealmente ordenado”. 43. Demuestre que “x es numerable” es Σ1 . 44. Demuestre que |x| ≤ |y|, |x| = |y| son Σ1 . 45. Demuestre que la suma y el producto ordinal son ∆1 . 46. Muestre que si G es una Σn -función (n ≥ 1) y F está definida por ∈recursión usando G, entonces F es una Σn -función. 47. Demuestre que la función rg(x) es ∆1 . 48. Decimos que un conjunto X es definible en un conjunto Y si ◦ X = {x ∈ Y : ϕ(x)} para alguna LTC-fórmula. Suponga que no todo ordinal es definible y muestre que “X es definible” no se puede expresar en LTC. 49. Si X ∈ OD, muestre que existe un ordinal γ tal que X es un subconjunto definible en hVγ , ∈i. Por lo tanto, OD es la clase de todos los X definibles en algún Vγ . 50. Pruebe que si F es una función definible en OR, entonces ran(F ) ⊆ OD. En consecuencia, OD es la clase más grande para la que existe una correspondencia inyectiva definible con OR. 605 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 606 ✐ ✐ 8. Relativización y absolutez 51. Demuestre que HOD es el modelo transitivo más grande de ZF para el que existe una correspondencia inyectiva con OR. 606 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 607 ✐ ✐ CAPÍTULO 9 El universo construible 607 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 608 ✐ ✐ 9. El universo construible En este capítulo examinaremos una de las más grandes contribuciones a la teoría de conjuntos dada por el extraordinario matemático K. Gödel, contribución que generó una revolución en la teoría y motivó también importantes aportaciones de otros investigadores. Podríamos aventurarnos a afirmar que después del origen de la teoría, desarrollada por Cantor, y de su axiomatización, desarrollada por Zermelo, Fraenkel y Skolem, el universo construible de Gödel (más generalmente, el método de modelos internos originado por Gödel) y el método de forcing han sido las dos aportaciones más importantes en el siglo xx. En octubre de 1935 Gödel informa a von Neumann que ha logrado demostrar la consistencia relativa del axioma de elección más los axiomas de ZF haciendo uso de un modelo interno L (del inglés Law) de ZF y verificando que el axioma de elección es válido en él. De inmediato, Gödel conjeturó que también la HC sería válida en L, pero pronto enfermó y pudo dar la demostración hasta dos años después, probando de hecho que la HGC es cierta en L. Además, Gödel observó que L era una rica fuente de ejemplos para la teoría descriptiva de conjuntos. El resultado de Gödel representa un desarrollo intelectual continuo que se inicia con su célebre teorema de incompletud que lo motivó a hacer especulaciones posteriores sobre grandes cardinales. Gödel escribía [Göd31]: La verdadera razón para la incompletud inherente en todo sistema formal de las matemáticas es que la formación de tipos superiores se puede continuar en forma infinita... mientras que en cualquier sistema formal está disponible sólo una cantidad numerable de ellos. Por esto se puede mostrar que la proposición indecidible aquí construida se vuelve decidible siempre que se añadan tipos superiores apropiados (por ejemplo, el tipo ω al sistema de la aritmética de Peano). Una situación análoga prevalece para el sistema axiomático de la teoría de conjuntos. La primera descripción que Gödel dio de L en [Göd38] muestra la idea original de su construcción: Este modelo, hablando informalmente, consiste en todos los conjuntos “matemáticamente construibles”, donde construible se debe entender en sentido semiintuicionista que excluye procedimientos impredicativos. Esto significa que los conjuntos construibles se definen como aquellos conjuntos que se pueden obtener mediante la jerarquía ramificada de Russell, si ésta se extiende para incluir ordenes transfinitos. La extensión a órdenes transfinitos tiene como consecuencia que el modelo satisfaga los 608 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 609 ✐ ✐ Conjuntos y modelos. Curso avanzado axiomas impredicativos de la teoría de conjuntos, puesto que el axioma de reducibilidad se puede probar para órdenes suficientemente grandes. Gödel consideró su jerarquía como una extensión transfinita de la de Russell, que se puede construir formalmente en el lenguaje Lωω . Aunque ésta es una jerarquía de definiciones impredicativas (es decir, se cuantifica sobre dominios de objetos previamente formados), la idea de Gödel fue extender la indización de tipos superiores mediante ordinales, lo cual permite que se satisfagan los axiomas de ZFE . Gödel hace hincapié en la continuidad histórica: la alusión al axioma fallido de Russell de reducibilidad es una referencia clara a la rectificación: si x ∈ Lλ y λ es un cardinal en L, entonces para cualquier y ⊆ x en L existe γ < λ con x ∈ Lγ . Así se reduce en L el impacto de la operación impredicativa potencia de un conjunto, dando lugar a la consistencia de la HGC . En otra ocasión Gödel comenta acerca de su resultado sobre la HC : [...] había un obstáculo especial que realmente hacía imposible para los constructivistas descubrir mi prueba de consistencia. Es el hecho de que la jerarquía ramificada, que ha sido inventada específicamente para propósitos constructivos, se usa en una forma enteramente no constructiva. En su monografía [Göd40], basada en conferencias impartidas en Princeton durante el invierno de 1938-39, Gödel da otra presentación de L. Esta vez, L se genera conjunto por conjunto con recursión transfinita en términos de 8 conjuntos elementales de generadores, una especie de números de Gödel. Estos generadores se basan en una axiomatización de segundo orden del esquema de separación de Bernays [Bern37]. Dando una rigurosa formalización de su construcción metamatemática, Gödel enfatizó cómo ésta da lugar a un modelo interno y a pruebas de consistencia relativa finitarias. En particular, no fue necesaria una apelación externa a cardinales inaccesibles. Más aún, la nueva presentación hace aparente el fuerte constraste entre la formación elemental de conjuntos y la extensión de los ordinales. Sin embargo, Gödel mismo consideraba a L solamente como un artefacto para dar demostraciones de consistencia relativa, pero en los años sesenta, R. Jensen desarrolla la teoría de estructura fina para L de interés intrínseco, motivando una nueva rama de la teoría de conjuntos estrechamente relacionada con la teoría de modelos: la teoría de modelos núcleo. Desde entonces, el estudio de la constructibilidad y sus generalizaciones se ha convertido en una de las principales corrientes de investigación de la teoría de conjuntos. Es 609 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 610 ✐ ✐ 9. El universo construible importante hacer patente que esta nueva corriente de investigación, lejos de pretender imponer el axioma de constructibilidad, lo que intenta es la creación de nuevos modelos de ZFE que permitan probar la consistencia relativa de enunciados que se originan en forma natural en diversas áreas y el aislamiento de nuevos principios combinatorios. 1. Lenguaje LV En esta sección desarrollaremos, desde la teoría de conjuntos, un lenguaje formal para la propia teoría de conjuntos. Este lenguaje permitirá expresar ciertas nociones metaconjuntistas dentro de la teoría de conjuntos. En rigor, lo que nos interesa es expresar la noción de “conjunto X-definible” (para ciertos conjuntos X) en el lenguaje de la teorı́a de los conjuntos (LTC). Metamatemáticamente, dado un conjunto X, se dice que un subconjunto Y de X es X-definible si existen una fórmula φ(v0 , v1 , . . . , vn ) de LTC y elementos x1 , . . . , xn de X tales que Y = {u ∈ X|hX, ∈i |= φ[u, x1 , . . . , xn ]}. Ası́, para lograr definir esta noción metateórica en LTC es necesario definir relaciones tales como: “ser fórmula de LTC con parámetros en X”, “ser satisfacible en hX, ∈i”, etc. La idea del método en cuestión es, por un lado, construir un lenguaje análogo a LTC, de tal manera que los sı́mbolos de este lenguaje sean a su vez conjuntos, para que nociones metateóricas como las mencionadas correspondan a relaciones entre conjuntos. Y por otro lado, demostrar que algunas de estas relaciones (involucradas en la definición de Xdefinible) son relaciones definidas por ciertas fórmulas de la jerarquı́a de Lévy que poseen ciertas caracterı́sticas de absolutez. Iniciamos pues con la notación que usaremos para definir los lenguajes LX : 1. La sucesión s con dominio {0} y rango {x} se denota con hxi. 2. La sucesión s con dominio {0, 1, . . . , n − 1} y valores s(i) = xi (i = 0, . . . , n − 1) se denota con hx0 , . . . , xn−1 i. 3. Si s = hx0 , . . . , xn−1 i, r = hy0 , . . . , ym−1 i son sucesiones finitas, entonces la concatenación de las sucesiones s, r: se denota con s⌢ r. hx0 , . . . , xn−1 , y0 , . . . , ym−1 i, 610 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 611 ✐ ✐ Conjuntos y modelos. Curso avanzado 4. Si s es una sucesión finita, entonces ksk denota el máximo elemento del dominio de s. Observe que en este caso se tiene que ksk = dom(s) − 1 donde, por supuesto, dom(s) es un ordinal. A continuación damos la definición del lenguaje LV y posteriormente definiremos un “sublenguaje” de éste. Definición 1.1 (Lenguaje LV ). 1. Variables: para cada n ∈ ω, el conjunto (2, n) es una variable, que será denotada por vn . 2. Sı́mbolos de constante: para cada conjunto x, el conjunto (3, x) es un ◦ sı́mbolo de constante que se denota por x. 3. Fórmulas primitivas o atómicas: las fórmulas primitivas o atómicas son las sucesiones de la forma h0, 4, x, y, 1i y h0, 5, x, y, 1i, donde x y y son variables o sı́mbolos de constante de LV . Estas fórmulas serán denotadas por (x ∈ y) y (x=y) ˙ respectivamente. 4. Las fórmulas del lenguaje se construyen por recursión a partir de las primitivas, haciendo uso de las siguientes reglas: (a) Si φ y ψ son fórmulas de LV , entonces también lo es la siguiente sucesión: h0, 6i⌢ φ⌢ ψ ⌢ h1i que será denotada por (φ ∧ ψ). (b) Si φ es una fórmula de LV , entonces también lo es la siguiente sucesión: h0, 7i⌢ φ⌢ h1i que será denotada por (¬φ). (c) Si φ es una fórmula y u es una variable de LV , entonces también lo es la siguiente sucesión: h0, 8, ui⌢ φ⌢ h1i, que será denotada por (∃uφ). Observe que, informalmente, a los sı́mbolos de relación ∈, = ˙ corresponden los conjuntos 4, 5 respectivamente, a los sı́mbolos de puntuación (, ) los conjuntos 0, 1 y a los sı́mbolos lógicos ∧, ¬ y ∃ los conjuntos 6, 7 y 8 respectivamente. En este lenguaje, a diferencia de LTC, tenemos un conjunto de 611 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 612 ✐ ✐ 9. El universo construible sı́mbolos de constante que por cierto es muy grande: uno por cada conjunto. Conforme avancemos en esta sección incluiremos, para cada conjunto X, un sublenguaje LX de LV para el cual habrá solamente un sı́mbolo de constante por cada elemento de X. De la definición anterior se sigue directamente el siguiente lema, que establece la expresabilidad en LTC de las relaciones metateóricas básicas: Lema 1.2. Las propiedades de LV : “ser variable de LV ”, “ser sı́mbolo de constante de LV ” y “ser fórmula primitiva de LV ”. se definen (respectivamente) con las siguientes Σ0 fórmulas de LTC: Def 1. Var(x) = [x es un par ordenado]∧[(x)0 = 2]∧[(x)1 es un número natural]. Def 2. Cte(x) = [x es un par ordenado] ∧ [(x)0 = 3]. Def 3. Prim(x) = [x es una función] ∧ [dom(x) = 5] ∧ [x(0) = 0] ∧ [x(1) = 4 ∨ x(1) = 5] ∧[Var(x(2)) ∨ Cte(x(2))] ∧ [Var(x(3)) ∨ Cte(x(3))] ∧ [x(4) = 1]. (Observe que en realidad las fórmulas del lema anterior son Σ0 .) El siguiente paso es construir una fórmula de LTC que defina la propiedad metateórica de “ser fórmula de LV ”. Para lograrlo, es necesario demostrar que las nociones que intervienen en su definición son expresables en LTC y que de hecho son absolutas para ciertas estructuras. Para conseguirlo, hace falta demostrar que las fórmulas que definen dichas nociones están en aquellos estratos de la jerarquı́a de Lévy que dan ciertas garantías de absolutez. Lema 1.3. La propiedad “ser una sucesión finita” es definible por una fórmula Σ0 de LTC (que llamaremos Sucefin(x)). Demostración. Sea Sucefin(x) la siguiente fórmula de LTC, [x es una sucesión] ∧ (∀u ∈ dom(x))[u es un número natural] ∧(∃v ∈ dom(x))(∀u ∈ dom(x))[u ∈ v ∨ u = v]. Claramente, esta fórmula define la propiedad mencionada. Ahora, para demostrar que Sucefin(x) es Σ0 , observe que las subfórmulas: [x es una sucesión], [u es un número natural] y [u ∈ v ∨ u = v] son Σ0 y que expresiones tales como (∀u ∈ dom(x))Φ(u) pueden ser reemplazadas por expresiones de la forma (∀z ∈ x)Φ((z)0 ), 612 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 613 ✐ ✐ Conjuntos y modelos. Curso avanzado que son Σ0 , pues por el lema 8.8.8 sabemos que si Φ(z) es Σ0 , entonces Φ((z)0 ) también lo es. Ası́, se concluye que la fórmula Sucefin(x) puede escribirse en LTC como una fórmula Σ0 . A continuación definimos algunas fórmulas de LTC que describen la forma en la que se construyen las fórmulas de LV . Con ||Θ|| denotamos la longitud (dominio) de la sucesión Θ. Sea F∈ (θ, x, y) la siguiente fórmula de LTC, Sucefin(θ) ∧ [dom(θ) = 5] ∧ [θ(0) = 0] ∧ [θ(1) = 4] ∧[θ(2) = x] ∧ [θ(3) = y] ∧ [θ(4) = 1]. Sea F= (θ, x, y) la siguiente fórmula de LTC, Sucefin(θ) ∧ [dom(θ) = 5] ∧ [θ(0) = 0] ∧ [θ(1) = 5] ∧[θ(2) = x] ∧ [θ(3) = y] ∧ [θ(4) = 1]. Sea F∧ (θ, φ, ψ) la siguiente fórmula de LTC, Sucefin(θ) ∧ Sucefin(φ) ∧ Sucefin(ψ) ∧[dom(θ) = dom(φ) + dom(ψ) + 3] ∧ [θ(0) = 1] ∧ [θ(1) = 6] ∧[θ(||θ||) = 1] ∧ (∀i ∈ dom(φ))[φ(i) = θ(i + 2)] ∧(∀i ∈ dom(ψ))[ψ(i) = θ(i + dom(φ) + 2)]. Sea F¬ (θ, φ) la siguiente fórmula de LTC, Sucefin(θ) ∧ Sucefin(φ) ∧ [dom(θ) = dom(φ + 3)] ∧[θ(0) = 0] ∧ [θ(1) = 7] ∧ [θ(||θ||) = 1] ∧(∀i ∈ dom(φ))[φ(i) = θ(i + 2)]. Sea F∃ (θ, φ, u) la siguiente fórmula de LTC, Sucefin(θ) ∧ Sucefin(φ) ∧ [dom(θ) = dom(φ) + 4] ∧[θ(0) = 0] ∧ [θ(1) = 8] ∧ [θ(2) = u] ∧[θ(||θ||) = 1] ∧ (∀i ∈ dom(φ))[φ(i) = θ(i + 3)]. Observación 1.4. De las definiciones de las fórmulas anteriores, se deduce que si x, y son variables o sı́mbolos de constante de LV , φ y ψ fórmulas de LV y u una variable de LV , entonces: F∈ (θ, x, y) ⇔ θ es la LV − f órmula (x ∈ y). F= (θ, x, y) ⇔ θ es la LV − f órmula (x = y). F∧ (θ, φ, ψ) ⇔ θ es la LV − f órmula (φ ∧ ψ). 613 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 614 ✐ ✐ 9. El universo construible F¬ (θ, φ) ⇔ θ es la LV − f órmula (¬φ). F∃ (θ, u, φ) ⇔ θ es la LV − f órmula (∃uφ). Lema 1.5 (ZF ). Las LTC-fórmulas F∈ , F= , F∧ , F¬ , F∃ son Σ0 . Demostración. Dado que todas las subfórmulas que aparecen en las definiciones de estas fórmulas son Σ0 , al aplicar el mismo razonamiento de la demostración del lema anterior (para acotar con un conjunto a los cuantificadores que aparecen en la forma (∀i ∈ dom(φ))(∃i ∈ dom(φ))), se concluye que las fórmulas son Σ0 . Si φ es una fórmula de LV , debe existir una sucesión finita f de n + 1 en el conjunto de fórmulas de LV definida por f (i) = ψi , donde ψn = φ y para cada i, ψi es una fórmula primitiva o se obtuvo por una o dos fórmulas de la lista ψ1 , . . . ψi−1 aplicando alguna de las reglas de generación de fórmulas. Ası́, la sucesión f describe la forma en que se construyó φ. A continuación escribiremos una fórmula Const(φ, f ) de LTC que dice que φ se construyó a partir de la sucesión de fórmulas f . Sea Const(φ, f ) la siguiente fórmula: Sucefin(f ) ∧ [ψ||f || = φ] ∧ (∀i ∈ dom(f ))[Prim(ψi ) ∨ (∃j, k ∈ i)F∧ (ψi , ψj , ψk ) ∨(∃j ∈ i)F¬ (ψi , ψj ) ∨ (∃j ∈ i)(∃u ∈ ran(φ)(Var(u)) ∧ F∃ (ψi , u, ψj ))]. Lema 1.6. La fórmula Const(φ, f ) es Σ0 . Demostración. Sólo es necesario revisar que expresiones de la forma (∀i ∈ dom(ψ))(∃j, k ∈ i)F∧ (ψi , ψj , ψk ) son Σ0 . Esta expresión se puede escribir como (∀i ∈ dom(ψ))(∃j, k ∈ i)(∃a, b, c ∈ ran(ψ)) [(a = ψi ) ∧ (b = ψj ) ∧ (c = ψk ) ∧ F∧ (a, b, c)], que al aplicar las demostraciones anteriores, claramente se reconoce como una fórmula Σ0 . Observe que a partir de la definición de Const(φ, f ) se tiene que φ es una f órmula de LV ⇔ (∃f )Const(φ, f ). De aquı́ que exista una fórmula Σ1 , a saber: ∃f Const(φ, f ), que define la noción de ser fórmula de LV . 614 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 615 ✐ ✐ Conjuntos y modelos. Curso avanzado Ahora, al analizar la complejidad lógica de las nociones sintácticas de LV , nos interesa fundamentalmente demostrar varios resultados de absolutez referidos a estas nociones. En el caso de las nociones que hemos demostrado son Σ0 no hay problema (esto debido al Teorema 8.8.3). Pero para nociones que no son Σ0 , tales como la de ser fórmula de LV , no es suficiente con saber que el concepto es Σ1 , pues esto sólo garantiza la U-absolutez (véase el Teorema 8.8.3). Para poder asegurar la absolutez completa se requiere, según el teorema 8.8.3, de una definición Π1 equivalente. A continuación escribiremos una fórmula de LTC, Suc(u, a, n) que define la relación: “u es el conjunto de todas las m-sucesiones de elementos de a para toda m < n”. Buscamos una definición Σ1 , de tal manera que sea posible demostrar que esta definición Σ1 sea equivalente, en ZF , a una definición Π1 , para ası́ concluir que dicha definición es ∆ZF 1 , y por lo tanto, absoluta para todos los modelos transitivos de ZF . Obtendremos la definición Σ1 deseada, al hacer que los elementos de u se construyan por etapas, generando primero las 1-sucesiones, luego las 2sucesiones, etc. (La función f que aparece en la siguiente fórmula enumera estos conjuntos de sucesiones finitas.) Sea Suc(u, a, n) la siguiente fórmula de LTC: (∃f )[Sucefin(f ) ∧ (n es un número natural) ∧ (dom(f ) = n) ∧ (u = [ ran(f )) ∧ (∀i ∈ dom(f ))(∀x ∈ f (i))(Sucefin(x) ∧ (dom(x) = i) ∧ (∀j ∈ i)(x(j) ∈ a)) ∧ (∀i ∈ dom(f ))(∀j ∈ i)(∀x ∈ f (j))(∀p ∈ a) (i = j + 1 ⇒ x ∪ {(p, i)} ∈ f (i))]. Es claro que esta fórmula es Σ1 . Además, en el siguiente lema demostraremos que Suc(u, a, n) es equivalente a una fórmula Π1 según ZF . Antes de pasar a este lema, es prudente revisar la estructura sintáctica de esta fórmula: lo que dicen las tres primeras líneas es que existe una enumeración f de algunos conjuntos de m-sucesiones de elementos de a (con m < n), y dado S el hecho de que u = ran(f ), todos los elementos de u son m sucesiones de elementos de a (con m < n). Sólo falta ver que toda m-sucesión de a (m < n) es un elemento de u, es decir, si r es una m-sucesión de elementos de a, entonces r ∈ f (i) para algún i < n (por cierto i = m). En las últimas dos líneas de 615 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 616 ✐ ✐ 9. El universo construible la fórmula se garantiza que f enumera a exactamente todas las m-sucesiones de elementos de a (m < n), y que cada m-sucesión de elementos de a está justamente en f (m). Lema 1.7. La fórmula de LTC Suc(u, a, n) es ∆ZF 1 . Demostración. Observe que ZF ⊢ (∀a)(∀n ∈ ω)(∃u)Suc(u, a, n), y obviamente también se tiene que ZF ⊢ (∀a)(∀n)(∀u)(∀v)[Suc(u, a, n) ∧ Suc(v, a, n) ⇒ u = v]. Por lo tanto, ZF ⊢ Suc(u, a, n) ⇔ [(n es un número natural) ∧ ∀z[(¬Suc(z, a, n)) ∨ z = u]]. Haciendo uso del teorema 8.8.6, se sigue que la expresión a la derecha del bicondicional es Π1 . Ahora ya estamos listos para escribir una fórmula de LTC Fml(x) tal que Fml(x) ⇔ x es una f órmula de LV . Como mencionamos antes, la forma más obvia de hacer esto es a partir de la fórmula (∃f )Const(x, f ). Tomémosla como la fórmula Fml(x) deseada. En el lema 1.6 se vio que Const(x, f ) es Σ0 , por lo que la fórmula Fml(x) es Σ1 . Ahora demostraremos que además esta fórmula es equivalente, según ZF , a una fórmula Π1 . Lema 1.8. La fórmula Fml(x) de LTC es ∆ZF 1 . Demostración. Primero, daremos un conjunto A(x) que acote al cuantificador ∃f . Sea A(x) el siguiente conjunto: [ [ [ ran(x)m+1 ]n+1 . n∈dom(x) m∈dom(x) Por un lado sabemos que ((∃f ∈ A(x))Const(x, f )) ⇒ ∃f Const(x, f ), 616 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 617 ✐ ✐ Conjuntos y modelos. Curso avanzado pero además, si x ∈ LV y existe f tal que Const(x, f ), entonces f : r −→ ran(f ), (r < dom(x)) tal que para cada k < r se cumple f (k) = ψk , donde ψk es una fórmula en la construcción de x, lo cual implica que ası́, ψk : s −→ ran(x), (s < dom(x)); f : r −→ [ [ m+1 ran(x)], m∈dom(x) por lo que dicha f debe ser un elemento de A(x). Por consiguiente, ∃f Const(x, f ) ⇔ (∃f ∈ A(x))Const(x, f ). Por otro lado, en ZF se puede demostrar que existe dicho conjunto, es decir, De aquı́ se sigue que ZF ⊢ ∀x∃y[y = A(x)]. ZF ⊢ Fml(x) ⇔ Sucefin(x) ∧ ∀u∀v[Suc(u, ran(x), dom(x) + 2) ∧Suc(v, u, dom(x) + 2) ⇒ (∃f ∈ v)Const(x, f )]. Con lo que se concluye que Fml(x) es equivalente, según ZF, a una fórmula Π1 . A continuación se define la restricción del lenguaje LV a una clase X cualquiera: Definición 1.9. Dada una clase X, LX es el sublenguaje de LV que se obtiene ◦ al eliminar todos los sı́mbolos de constante z tales que z ∈ / X. Como caso particular, se define Lu cuando u es un conjunto. En el caso del conjunto vacı́o, L∅ se denota con L. Ası́, L es un lenguaje formal análogo a LTC dentro de la misma teorı́a de conjuntos. En lo que resta de esta sección estaremos particularmente interesados en los lenguajes Lu , donde u es un conjunto. Definición 1.10. Dado un conjunto u, la fórmula de LTC Cte(x, u) se define como la fórmula Cte(x) ∧ ((x)1 ∈ u). 617 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 618 ✐ ✐ 9. El universo construible Las fórmulas Prim(x, u) y Fml(x, u) se definen de la misma manera que Prim(x) y Fml(x), excepto que donde aparece la fórmula Cte(x) se reemplaza por Cte(x, u). Claramente, de esta definición se sigue que Fml(x, u) ⇔ x es una f órmula de Lu . A continuación enunciamos un lema que establece el carácter absoluto (para modelos transitivos de ZF ) de las fórmulas anteriores: Lema 1.11. (i) Las fórmulas Cte(x, u) y Prim(x, u) son Σ0 . (ii) La fórmula Fml(x, u) es ∆ZF 1 . Demostración. (i) La demostración es directa, pues en el primer caso tanto Cte(x) como (x)1 ∈ u son Σ0 , y en el segundo caso se reemplaza una subfórmula Σ0 de un fórmula Σ0 por una subfórmula Σ0 . (ii) Observe que el único cambio (con respecto a Fml(x)) que se hace es reemplazar la subfórmula Prim(x) de Const(φ, f ) por la subfórmula Prim(x, u), que es Σ0 ; así, la fórmula Const(φ, f ) es Σ0 . Por lo tanto, Fml(x, u) es Σ1 . El proceso que llevamos a cabo para acotar el cuantificador ∃f por A(x) se puede efectuar de la misma manera. Concluimos que Fml(x, u) es ∆1 . El proṕosito siguiente es definir una fórmula (que llamaremos Lib(φ, x)) de LTC tal que Lib(φ, x) ⇔ “φ es una fórmula de LV y x es el conjunto de todas las variables que aparecen libres en φ”. Escribimos dicha fórmula para posteriormente estudiar su estructura sintáctica. Sea Lib(φ, x) la siguiente fórmula de LTC: ∃ψ∃f [Const(φ, ψ) ∧ Sucefin(f ) ∧ (dom(f ) = dom(ψ) ∧ (x = f (||f ||)) ∧ (∀i ∈ dom(f ))[(∃j, k ∈ i)[F∧ (ψi , ψj , ψk ) ∧ (f (i) = f (j) ∪ f (k))] 618 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 619 ✐ ✐ Conjuntos y modelos. Curso avanzado ∨ (∃j ∈ i)[F¬ (ψi , ψj ) ∧ (f (i) = f (j))] ∨ (∃j ∈ i)(∃u ∈ ran(φ))[Var(u) ∧ F∃ (ψi , u, ψj ) ∧ (f (i) = f (j) \ {u})] ∨ [Prim(ψi ) ∧ [[Var((ψi )2 ) ∧ Var((ψi )3 ) ∧ (f (i) = {(ψi )2 , (ψi )3 })] ∨ [Var((ψi )2 ) ∧ Cte((ψi )3 ) ∧ (f (i) = {(ψi )2 })] ∨ [Cte((ψi )2 ) ∧ Var((ψi )3 ) ∧ (f (i) = {(ψi )3 })] ∨ [Cte((ψi )2 ) ∧ Cte((ψi )3 ) ∧ (f (i) = ∅)]. Ahora revisaremos la estructura sintáctica de esta fórmula. En primer término, la sucesión ψ que aparece es la que enumera las fórmulas de la construcción de φ. La sucesión f es la que va acumulando, en cada i, el conjunto de variables libres que aparecen en la fórmula ψi de la construcción de φ. Revisando con cuidado la estructura sintáctica de la fórmula Lib(φ, x), se observa que dicha fórmula es Σ1 . (Sólo hace falta observar que cada una de las subfórmulas de Lib(φ, x) es Σ0 o Σ1 .) En el siguiente lema veremos que Lib(φ, x) es, además, equivalente, en ZF , a una fórmula Π1 de LTC. Lema 1.12. La fórmula Lib(φ, x) es ∆ZF 1 . Demostración. Claramente, ZF ⊢ Lib(φ, x) ⇔ [Fml(φ) ∧ ∀z[(¬Lib(φ, z)) ∨ z = x]]. Ahora, la segunda parte de la conjunción es claramente Π1 y la primera es equivalente a una fórmula Π1 en ZF . Por lo tanto, Lib(φ, x) es equivalente, en ZF , a una fórmula Π1 . A continuación definiremos una fórmula de LTC (Sust(φ′ , φ, v, t)) que establece la relación: “φ′ es la fórmula (de LV ) que se obtiene al sustituir en la fórmula φ (de LV ) todas las ocurrencias de la variable libre v (de LV ) en la fórmula φ, por la constante t (de LV )”. Para llegar a la definición de esta fórmula, necesitamos adoptar un procedimiento similar al usado en la definición de la fórmula Lib(φ, x): tomar la sucesión ψ tal que Const(φ, ψ) (que enumera las fórmulas de la construcción de φ). A partir de esta sucesión, se sustituye cada aparición libre de la variable v por la constante t. Si aparece un cuantificador sobre v en alguna etapa 619 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 620 ✐ ✐ 9. El universo construible de la construcción, se deben eliminar todas las sustituciones hechas sobre las apariciones de v que ahora están al alcance del cuantificador. Para hacer más fácil la definición de esta fórmula, es recomendable considerar primero la restrición de Sust(φ′ , φ, v, t) a fórmulas primitivas φ. Sea S(φ′ , φ, v, t) la restricción mencionada, definida por Prim(φ′ ) ∧ Prim(φ) ∧ Var(v) ∧ Cte(t) ∧ [[F= (φ, (φ)2 , (φ)3 ) ∧ [[(φ)2 6= v ∧ (φ)3 6= v ∧ (φ′ = φ)] ∨ [(φ)2 = v ∧ (φ)3 6= v ∧ F= (φ′ , t, (φ)3 )] ∨ [(φ)2 6= v ∧ (φ)3 = v ∧ F= (φ′ , (φ)2 , t)] ∨ [(φ)2 = v ∧ (φ)3 = v ∧ F= (φ′ , t, t)]]] ∨ [F∈ (φ, (φ)2 , (φ)3 ) ∧ [(φ)2 6= v ∧ (φ)3 6= v ∧ (φ′ = φ)] ∨ [(φ)2 = v ∧ (φ)3 6= v ∧ F∈ (φ′ , t, (φ)3 )] ∨ [(φ)2 6= v ∧ (φ)3 = v ∧ F∈ (φ′ , (φ)2 , t)] ∨ [(φ)2 = v ∧ (φ)3 = v ∧ F∈ (φ′ , t, t)]]]. Note que la fórmula S(φ′ , φ, v, t) es Σ0 . Ahora, con ayuda de ésta, definimos la fórmula Sust(φ′ , φ, v, t) deseada: Fml(φ′ ) ∧ Fml(φ) ∧ Var(v) ∧ Const(t) ∧ ∃ψ∃θ[Const(φ, ψ) ∧ Sucefin(θ) ∧ (dom(θ) = dom(ψ)) ∧ (θ||θ|| = φ′ ) ∧ (∀i ∈ dom(ψ))[(∃j, k ∈ i)(F∧ (ψi , ψj , ψk ) ∧ (F∧ (θi , θj , θk )) ∨ (∃j ∈ i)(F¬ (ψi , ψj ) ∧ F¬ (θi , θj )) ∨ (∃j ∈ i)(∃u ∈ rang(φ))(Var(u) ∧ (u 6= v) ∧ (F∃ (ψi , u, ψj ) ∧ F∃ (θi , u, θj )) ∨ (∃j ∈ i)(F∃ (ψi , v, ψj ) ∧ (θi = ψi )) ∨ S(θi , ψi , v, t)]]. En esta fórmula, la sucesión θ realiza el proceso de sustitución en cada fórmula de la construcción de φ, dejando sin sustituir la variable cuando ésta es acotada. Observe que en esta definición todos los cuantificadores que aparecen, excepto los dos primeros existenciales, son acotados, y además, todas las 620 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 621 ✐ ✐ Conjuntos y modelos. Curso avanzado subfórmulas son Σ0 , de donde se sigue que la fórmula Sust(φ′ , φ, v, t) es Σ1 . Más aún: Lema 1.13. La fórmula Sust(φ′ , φ, v, t) de LTC es ∆ZF 1 . Demostración. De nuevo es claro que ZF ⊢ Sust(φ′ , φ, v, t) ⇔ Fml(φ) ∧ Var(v) ∧ Const(t) ∧ ∀ψ[(¬Sust(ψ, φ, v, t)) ∨ ψ = φ′ ]. Puesto que la expresión del lado derecho del bicondicional es Π1 , queda demostrado el lema. Con ayuda de las fórmulas que hasta el momento hemos definido, es posible definir (en LTC) la noción de satisfacción (verdad) para los lenguajes Lu . Esto es, definiremos una fórmula Sat(u, φ) tal que Sat(u, φ) ⇔ “φ es un enunciado de Lu que es verdadero en la estructura hu, ∈icon la interpretación canónica.” La idea que motiva la definición de esta fórmula es la siguiente: sea f : ω −→ Pot(Lu ) tal que f (0) es el conjunto de todas las fórmulas primitivas de Lu , y en general sea f (i + 1) el conjunto de las fórmulas de Lu que están en f (i) más aquellas que se pueden obtener a partir de las fórmulas de f (i) por una aplicación de alguno de los tres esquemas de construcción. Luego, sea g : ω −→ Pot(Lu ) la función tal que g(i) es el conjunto de las fórmulas de f (i) que no tienen variables libres y que son verdaderas en hu, ∈i. Ası́, g proporcionará todos los enunciados de Lu que son verdaderos en hu, ∈i. La fórmula Sat(u, φ) se obtendrá considerando el proceso descrito, de tal manera que se pueda verificar si φ está o no en g(i) (cuando φ esté en f (i)). Para definir Sat(u, φ), primero definiremos la restricción de la fórmula para las fórmulas φ (de Lu ) primitivas. Sea E(u, φ) la siguiente fórmula: ◦ ◦ ◦ ◦ (∃x, y ∈ u)[(x ∈ y) ∧ F∈ (φ, x, y)] ∨ [(∃x ∈ u)F= (φ, x, x)]. Claramente se tiene que E(u, φ) ⇔ Prim(φ, u)∧ [“φ es verdadera en la estructura hu, ∈i′′ ]. 621 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 622 ✐ ✐ 9. El universo construible Por otro lado, es fácil verificar que la fórmula E(u, φ) es Σ0 : es suficiente ◦ ◦ con observar que expresiones de la forma (∃x ∈ u)F= (φ, x, x) se deben sustituir por ◦ (∃x ∈ u)(∃y ∈ ran(φ))(y = x ∧ F= (φ, y, y)). Finalmente definimos una fórmula, S(u, φ), que expresa, en LTC, la noción de que φ es un enunciado de Lu verdadero en hu, ∈i. Dado que esta fórmula no será Σ1 , no la consideraremos como la fórmula buscada (pues queremos que ésta sea ∆ZF 1 ) pero sı́ como una precursora. Sea S(u, φ) la siguiente fórmula: (u 6= ∅) ∧ Fml(φ, u) ∧ ∃f ∃g[Sucefin(f ) ∧ Sucefin(g) ∧ (dom(f ) = dom(g)) ∧ (φ ∈ g(||g||)) ∧ ∀ψ(ψ ∈ f (0) ⇔ Prim(ψ, u)) ∧ ∀ψ(ψ ∈ g(0) ⇔ E(u, ψ)) ∧ (∀j ∈ dom(f ))(∀i ∈ j)∀ψ[ψ ∈ f (i + 1) ⇔ (ψ ∈ f (i)) ∨ (∃θ ′ , θ ∈ f (i))F∧ (ψ, θ ′ , θ) ∨ (∃θ ∈ f (i))F¬ (ψ, θ) ∨ (∃θ ∈ f (i))(∃v ∈ ran(ψ))(Var(v) ∧ F∃ (ψ, v, θ))] ∧ (∀j ∈ dom(g))(∀i ∈ j)∀ψ[ψ ∈ g(i + 1) ⇔ (ψ ∈ g(i)) ∨ (∃θ ′ , θ ∈ g(i))F∧ (ψ, θ ′ , θ) ∨ (∃θ ∈ f (i))(θ ∈ / g(i) ∧ F¬ (ψ, θ)) ∨ (∃θ ∈ f (i))(∃v ∈ ran(ψ))(∃x ∈ u)(∃θ ′ ∈ g(i)) ◦ [Var(v) ∧ F∃ (ψ, v, θ) ∧ Sust(θ ′ , θ, v, x)]]]. Esta fórmula S(u, φ) define claramente la relación de satisfacción requerida, pero tal como mencionamos, dicha fórmula no es Σ1 (en realidad es Π2 ). El problema es el cuantificador ∀ψ que aparece cuatro veces y los cuantificadores no acotados (∃f, ∃g) que aparecen en la subfórmula ◦ Sust(θ ′ , θ, v, x). Como quiera que sea, este problema se puede solucionar acotando todos estos cuantificadores, de tal manera que no se pierda la expresabilidad de la noción de verdad. A continuación definiremos, por pasos, el conjunto que acotará los cuantificadores no acotados de la fórmula S(u, φ): 622 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 623 ✐ ✐ Conjuntos y modelos. Curso avanzado 1. Sea w1 (u, φ) el siguiente conjunto: [ m∈ dom(φ) ◦ [9 ∪ {vi |i ∈ w} ∪ {x|x ∈ u}]n+1 2. Sea w2 (u, φ) el siguiente conjunto: [ [w1 (u, φ)]n+1 n∈ dom(φ) 3. Sea w(u, φ) = w1 (u, φ) ∪ w2 (u, φ). Observe que w1 (u, φ) contiene todas las fórmulas (de Lu ) de la misma longitud que φ, es decir, todas las fórmulas ψ de Lu tales que dom(ψ) = dom(φ), y el conjunto w2 (u, φ) contiene todas las sucesiones finitas de fórmulas de w1 (u, φ) con dominio menor o igual que el dominio de φ. Ası́, es posible acotar con w(u, φ) los cuantificadores anteriormente mencionados sin alterar la expresabilidad de la fórmula S(u, φ), pues las variables cuantificadas por estos cuantificadores (f, g, ψ) son sucesiones de fórmulas de longitud menor o igual que la de φ, o bien son fórmulas de longitud menor o igual que la de φ. Sea S ′ (u, φ, w) la fórmula que se obtiene de S(u, φ) al acotar todos los cuantificadores no acotados por el conjunto w(u, φ). Después de esto, ya estamos listos para definir la fórmula Sat(u, φ) deseada. Sea Sat(u, φ) la siguiente fórmula: ◦ ∃w∃x∃y∃a∃b∃t[(a = {x|x ∈ u}) ∧ (t = ω) ∧ (b = {vi |i ∈ t}) ∧ Suc(x, 9 ∪ a ∪ b, dom(φ) + 1) ∧ Suc(y, x, dom(φ) + 1) ∧ (w = x ∪ y) ∧ S ′ (u, φ, w)], donde la subfórmula t = ω debe ser reemplazada por la fórmula Or(t) ∧ lím(t) ∧ (∀i ∈ t)[(∃j ∈ i)(i = j + 1) ∨ (∀j ∈ i)(j 6= i)]. Luego, por las observaciones hechas antes acerca del conjunto w(u, φ), es claro que Sat(u, φ) ⇔ φ es un enunciado de Lu que es verdadero en hu, ∈i. Además, se tiene que Sat(u, φ) es Σ1 , y más aún: Lema 1.14. La fórmula Sat(u, φ) de LTC es ∆ZF 1 . 623 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 624 ✐ ✐ 9. El universo construible Demostración. De las observaciones anteriores, concluimos que ZF ⊢ ¬Sat(u, φ) ⇔ ¬[Fml(φ, u) ∧ Lib(φ, ∅)] ∨ ∃θ[F¬ (θ, φ) ∧ Sat(u, θ)]. La primera subfórmula del lado derecho de la equivalencia es ∆ZF 1 y la segunda ZF es Σ1 , de donde se tiene que ¬Sat(u, φ) es Σ1 , hecho que implica que Sat(u, φ) ZF es ΠZF 1 . Por lo tanto, la Σ1 -fórmula Sat(u, φ) es ∆1 . Observación 1.15. Con frecuencia nos referiremos al enunciado Sat(u, φ) con la expresión: |=u φ. Como lo hemos señalado, la colección de conjuntos que constituyen “las fórmulas” de L proporcionan un análogo de las fórmulas del lenguaje LTC. Dada una fórmula Φ de LTC podemos construir un conjunto φ tal que, de acuerdo con la “sintaxis” de L (desarrollada hasta el momento), tiene la misma estructura lógica que tiene Φ. En este contexto, el siguiente resultado indica cómo es que la noción formal de satisfacción, recién definida, corresponde a la genuina noción de verdad. Teorema 1.16. Sean Φ(v0 , . . . , vn ) una fórmula de LTC y φ(v0 , . . . , vn ) su contraparte en L (en el sentido recién descrito). Ası́, ◦ ◦ ZF ⊢ ∀u(∀x0 ∈ u) . . . (∀xn ∈ u)[Φu (x0 , . . . , xn ) ⇔ Sat(u, φ(x0 , . . . , xn ))]. Demostración. La demostración se hará por inducción sobre la construcción de Φ (y, por lo tanto, de φ). Sea u un conjunto y sean x0 , x1 , . . . , xn ∈ u. 1. 2. (a) Φ(x, y) = x ∈ y, ası́, Φu (x, y) ⇔ (x ∈ y)u ⇔ x ∈ y ◦ ◦ ◦ ◦ ⇔ E(u, φ(x, y)) ⇔ Sat(u, φ(x, y) (b) Φ(x, y) = x=y. ˙ Este caso es análogo al anterior. (a) Φ(x0 , . . . , xn ) = Φ0 (x0 , . . . , xn ) ∧ Φ1 (x0 , . . . , xn ). En este caso se tiene que Φu (x0 , . . . , xn ) ⇔ Φu0 (x0 , . . . , xn ) ∧ Φu1 (x0 , . . . , xn ) ◦ ◦ ◦ ◦ ⇔ Sat(u, φ0 (x0 , . . . , xn )) ∧ Sat(u, φ1 (x0 , . . . , xn )) ◦ ◦ ⇔ Sat(u, φ(x0 , . . . , xn )). (b) Φ(x0 , . . . , xn ) = ¬Φ0 (x0 , . . . , xn ). Este caso se resuelve de manera similar al anterior. 624 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 625 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) Φ(x0 , . . . , xn ) = ∃zΦ0 (z, x0 , . . . , xn ), ası́, (∃zΦ0 (z, x0 , . . . , xn ))u ⇔ (∃z ∈ u)Φu0 (z, x0 , . . . , xn ) ◦ ◦ ◦ ⇔ Φu0 (z, x0 , . . . , xn ) ⇔ Sat(u, φ(z, x0 , . . . , xn )) ◦ ◦ ⇔ Sat(u, ∃zφ(z, x0 , . . . , xn )). Observe que este resultado es un esquema de teoremas para LTC y establece la equivalencia entre la genuina noción de verdad para una fórmula Φ de LTC y la noción matemática de satisfacibilidad para una “fórmula” φ de L. En analogı́a con LTC definiremos la “jerarquı́a de Lévy” para las fórmulas de LV . Por razones de conveniencia técnica, sólo se admitirá, en cada etapa de la jerarquı́a, un solo cuantificador en lugar de bloques de cuantificadores, como lo hicimos para LTC. Definición 1.17. (Por recursión sobre ω): 1. Una fórmula φ de LV es Σ0 (o Π0 ) si todos los cuantificadores están acotados, ya sea por una variable o por una constante de LV . 2. Una fórmula φ de LV es Σn+1 (Πn+1 ) si es de la forma ∃vm ψ (¬∃vm ψ), donde ψ es una fórmula Πn (Σn ). A continuación definimos una fórmula de LTC, FmlΣ0 (φ), que define la relación: “φ es una fórmula de LV que es Σ0 ”. Sea FmlΣ0 (φ) la siguiente fórmula: Fml(φ) ∧ (∀i ∈ dom(φ))[(φi = 0 ∧ φi+1 = 8 ∧ Var(φi+2 )) ⇒ (φi+3 = 0 ∧ φi+4 = 6 ∧ φi+5 = 0 ∧ φi+6 = 4 ∧φi+7 = φi+2 ∧ (Cte(φi+8 ) ∨ Var(φi+8 )) ∧ φi+9 = 1)]. De igual manera, definimos FmlΣ0 (φ, u) sustituyendo las apariciones de la subfórmula Cte(φ) por Cte(φ, u). Observe que estas dos fórmulas son Σ1 . Pero además Lema 1.18. Las fórmulas FmlΣ0 (φ) y FmlΣ0 (φ, u) son ∆ZF 1 . Demostración. La demostración es inmediata a partir del hecho de que la subfórmula Fml(φ) es ∆ZF 1 y de que todas las demás subfórmulas son Σ0 . El mismo razonamiento se aplica a la fórmula FmlΣ0 (φ, u). El siguiente resultado afirma que también existen fórmulas que definen la relación de “ser una fórmula Σn (Πn ) de LV o de L′′u : 625 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 626 ✐ ✐ 9. El universo construible Σn Πn Lema 1.19. Dado n ≥ 1, existen fórmulas ∆ZF 1 : Fml (φ), Fml (φ), Πn Σn Fml (φ, u) y Fml (φ, u) tales que FmlΣn (φ) ⇔ φ es una fórmula Σn de LV . FmlΠn (φ) ⇔ φ es una fórmula Πn de LV . FmlΣn (φ, u) ⇔ φ es una fórmula Σn de Lu . FmlΠn (φ, u) ⇔ φ es una fórmula Πn de Lu . Demostración. Sea Φ0 la fórmula que sigue del único cuantificador acotado en la fórmula FmlΣ0 (φ). Sea FmlΣ1 (φ) la fórmula Fml(φ) ∧ [φ(0) = 0 ∧ φ(1) = 8 ∧ Var(φ(2))] ∧ (∀i ∈ dom(φ))(i > 2 ⇒ Φ0 ) y sea FmlΠ1 (φ) la fórmula Fml(φ) ∧ [φ(0) = 0 ∧ φ(1) = 7 ∧ φ(2) = 0 ∧ φ(3) = 8 ∧ Var(φ(4))] ∧(∀i ∈ dom(φ))(i > 2 ⇒ Φ0 ). Claramente estas fórmulas son, al igual que FmlΣ0 (φ), ∆ZF 1 . Ası́, para cada n se puede construir FmlΣn a partir de las anteriores. A continuación se establece una relación entre los lenguajes L y LTC muy importante y que se usará mucho en las siguientes secciones. Lema 1.20. Sean Φ(~x) una fórmula Σ0 de LTC y φ(~x) su contraparte en L. ~◦ ZF ⊢ ∀M(∀~x ∈ M)[Trans(M) ⇒ (Φ(~x) ⇔ Sat(M, φ(x)))]. Demostración. Sean Φ(~x) una fórmula Σ0 , M un conjunto transitivo y x1 , . . . , xn ∈ M. Como Φ es Σ0 y M es transitivo, Φ es absoluta para M, es decir, (∀~z ∈ M)(Φ(~z) ⇔ ΦM (~z)), en particular, para x1 , . . . , xn se tiene que (Φ(x1 , . . . , xn ) ⇔ ΦM (x1 , . . . , xn )). Entonces logramos la equivalencia ◦ ◦ Φ(x1 , . . . , xn ) ⇔ ΦM (x1 , . . . , xn ) ⇔ Sat(M, φ(x1 , . . . , xn )), lo que se querı́a demostrar. Terminamos esta sección estableciendo que el conjunto Def(X) es definible en LTC. Más adelante se demostrarán los resultados de absolutez involucrados en la definición de este conjunto. Primero recordamos su definición metateórica: 626 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 627 ✐ ✐ Conjuntos y modelos. Curso avanzado Definición 1.21. Sean X un conjunto y Y ⊆ X. Se dice que Y es X-definible si y sólo si existe una fórmula Φ(v0 , v1 , . . . , vn ) de LTC, y existen x1 , . . . , xn elementos de X tales que Y = {a ∈ X|hX, ∈i |= Φ(a, x1 , . . . , xn )}. En vista de los resultados establecidos hasta el momento, en particular el teorema 1.16, la definición de “ser X-definible” se puede reescribir de la siguiente manera: Definición 1.22. Sean X un conjunto y Y un subconjunto de X; se dice que Y es X-definible si existe una fórmula φ(v0 ) de LX tal que ◦ Y = {a ∈ X|Sat(X, φ(a))}. En forma equivalente, si ◦ Y = {a ∈ X| |=X φ(a)}. Ahora sı́ podemos definir el conjunto Def(X): Definición 1.23. Sea X un conjunto; el conjunto Def(X) se define de la siguiente manera: Def(X) = {Y ⊆ X|Y es X − definible}. Por último se establece la expresabilidad de dicha noción en LTC: Lema 1.24. La función Def(X) está bien definida, y su definición es la siguiente: Z = Def(X) ⇔ (∀Y ∈ Z)(∃φ)[Fml(φ, X) ∧ Lib(φ, {v0 }) ◦ ∧ (Y = {a ∈ X|∃ψ(Sust(ψ, φ, v0 , a) ∧ Sat(X, ψ))})] ∧ ∀Y ((∃φ)[Fml(φ, X) ∧ Lib(φ, {v0 }) ◦ ∧ (Y = {a ∈ X|∃ψ(Sust(ψ, φ, v0 , a) ∧ Sat(X, ψ))}) ⇒ (Y ∈ Z)]. Demostración. Es directa; las primeras dos líneas aseguran que Z ⊆ Def(X) y las restantes que Def(X) ⊆ Z. 627 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 628 ✐ ✐ 9. El universo construible 2. El universo construible En esta sección llevaremos a cabo un segundo paso para establecer la consistencia relativa de la hipótesis generalizada del continuo y del axioma de elección con respecto a los axiomas de ZF . Esto es, definiremos la estructura jerárquica L mencionada en la introducción del capı́tulo y demostraremos que dicha estructura es modelo de los axiomas de ZF . En primer lugar, debemos definir la jerarquı́a de los conjuntos construibles hLα |α ∈ ORi, en forma rigurosa, haciendo uso de los conceptos definidos en la sección anterior; en segundo lugar estableceremos las propiedades básicas de dicha jerarquı́a. Por último demostraremos que el universo construible L, definido en términos de la jerarquı́a construible, es un modelo interno de ZF . Comenzamos con la definición de la jerarquı́a construible hLα |α ∈ ORi: Definición 2.1. (Por recursión sobre α ∈ OR) jerarquı́a construible. 1. L0 = ∅, 2. Lα+1 = Def(Lα ), S 3. Lα = γ<α Lγ para α lı́mite. Esta jerarquı́a es una función bien definida (en el sentido de clases) de la teorı́a de ZF . Por lo tanto, la clase L definida por L= [ Lα α∈OR es una clase bien definida. A esta clase se le llama universo construible (de Gödel). Los elementos de L son los conjuntos construibles. Con el siguiente lema establecemos los resultados básicos de la jerarquı́a construible. Entre otras cosas, estas propiedades facilitarán la demostración de que L es modelo interno de ZF . En secciones posteriores se establecerán algunas otras propiedades interesantes de la jerarquı́a construible. Lema 2.2. Sean α, γ y β ordinales. Los siguientes son teoremas de ZF : 1. Si γ ≤ α, entonces Lγ ⊆ Lα . 2. Lα es transitivo. 3. L es transitiva. 4. Lα ⊆ Vα . 5. L ∩ α = Lα ∩ OR = α. 6. Si α < β, entonces α, Lα ∈ Lβ . 628 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 629 ✐ ✐ Conjuntos y modelos. Curso avanzado 7. OR ⊆ L. 8. Si α ≤ ω, entonces Lα = Vα . 9. Si ω ≤ α, entonces |Lα | = |α|. Demostración. Demostraremos 1 y 2 simultáneamente por inducción sobre α. 1 y 2. (a) Para α = 0 el caso es trivial. (b) Para α lı́mite, 1 es directo y 2 se sigue de la hipótesis de que Lγ es transitivo para toda γ < α, pues la unión arbitraria de conjuntos transitivos es transitivo. (c) Para α = β + 1, suponemos que 1 y 2 se cumplen para β. Para demostrar que 1 se cumple para α, es suficiente con demostrar que Lβ ⊆ Lα , pues si γ < α entonces γ ≤ β y por la hipótesis de inducción, habremos terminado. Sea x ∈ Lβ ; entonces, por la hipótesis de inducción para 2, se tiene que como Lβ es transitivo, entonces x ⊆ Lβ . Luego, x = {y ∈ Lβ |(y ∈ x)}, pero como la fórmula y ∈ x es Σ0 y como (por hipótesis de inducción) Lβ es transitivo, el lema 1.20 implica que ◦ ◦ x = {y ∈ Lβ | |=Lβ y ∈ x}. Ası́, se cumple que x ∈ Def(Lβ ) = Lα . Para demostrar 2 en este último caso, sea y ∈ x ∈ Lα ; dado que x ∈ Lα = Def(Lβ ) ⊆ Pot(Lβ ), se deduce x ⊆ Lβ y y ∈ Lβ , luego, por 1, concluimos que y ∈ Lα . 3. Directo de 2. 4. (Por inducción sobre α). (a) Para α = 0 se tiene que L0 = V0 = ∅. (b) Para α lı́mite, se cumple que Lα = [ Lγ y que Vα = [ Vγ . γ<α γ<α Pero, por hipótesis de inducción, se sabe que Lγ ⊆ Vγ para toda γ < α; por lo tanto, Lα ⊆ V α . 629 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 630 ✐ ✐ 9. El universo construible (c) Para α = β + 1, observe que si Lβ ⊆ Vβ , entonces Lα = Def(Lβ ) ⊆ Pot(Lβ ) ⊆ Pot(Vβ ) = Vα . 5. Por inducción sobre α demostraremos que Lα ∩OR = α; la otra igualdad se sigue directamente de ésta. Para α = 0, es trivial el hecho de que L0 ∩ OR = 0 = L ∩ 0. Para α lı́mite, Lα ∩ OR = [ [ γ∈α Lγ ] ∩ OR = S [ γ∈α [Lγ ∩ OR], que, por hipótesis de inducción, es igual a γ∈α γ, que es justamente α. Para el caso sucesor, α = β + 1, suponemos que Lβ ∩ OR = β. Ahora, como Lβ ⊆ Lα ⊆ Pot(Lβ ), se cumple que β ⊆ Lα ∩ OR ⊆ Pot(Lβ ) ∩ OR. De acuerdo con la hipótesis de inducción sabemos que Pot(Lβ ) ∩ OR ⊆ α, pues si γ ∈ Pot(Lβ ) ∩ OR, entonces γ ≤ β ∈ α. De aquí se concluye que Lα ∩ OR ⊆ α. Para demostrar la otra contención, es suficiente con mostrar que β ∈ Lα , pues si γ < α entonces γ ≤ β, lo que conducirı́a a que γ ∈ Lα ∩ OR (esto último porque Lα es transitivo y γ ∈ OR). Por hipótesis de inducción: β = Lβ ∩ OR = {x ∈ Lβ |Or(x)}, pero dado que la fórmula “Or(x)” es Σ0 y que Lβ es transitivo, podemos aplicar el lema 1.20, para concluir que ◦ β = {x ∈ Lβ | |=Lβ Or(x)}. Ası́, β ∈ Def(Lβ ) = Lα . La otra igualdad se sigue directamente del hecho de que para cualquier α, α ⊆ Lα ⊆ L. 6. Por 1 es suficiente con demostrar que α, Lα ∈ Lα+1 , pues si α < β entonces α + 1 ≤ β y por 1 se tendrı́a que Lα+1 ⊆ Lβ . Ası́, para demostrar que Lα ∈ Lα+1 , considere el siguiente hecho: Lα = {x ∈ Lα |x = x}; 630 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 631 ✐ ✐ Conjuntos y modelos. Curso avanzado entonces, por el lema 1.20, se tiene que ◦ ◦ Lα = {x ∈ Lα | |=Lα x = x} (pues “x = x” es Σ0 y Lα transitivo). Ası́, Lα ∈ Def(Lα ) = Lα+1 . La demostración de que α ∈ Lα+1 ya se hizo durante la demostración del inciso anterior: ◦ (Lα ∩ OR = α) ⇒ (α = {x ∈ Lα | |=Lα Or(x)}), de donde se deduce que α ∈ Def(Lα ) = Lα+1 . 7. Es directo de 6: (α ∈ OR) ⇒ (α ∈ Lα+1 ⊆ L). 8. El caso α < ω se demostrará por inducción finita. Para α = 0 es trivial, pues L0 = 0 = V0 . Sea α = n + 1 y supondremos que Ln = Vn ; entonces Ln+1 = Def(Ln ) = Def(Vn ) ⊆ Pot(Vn ) = Vn+1 . Ahora, para demostrar que Vn+1 ⊆ Ln+1 , sea x ∈ Vn+1 , y entonces x ⊆ Vn = Ln . Por lo tanto, existen a1 , . . . , am ∈ Ln tales que x = {a1 , . . . , am } y en consecuencia: x = {z ∈ Ln |z = a1 ∨ · · · ∨ z = am }, que por el lema 1.20 implica que ◦ ◦ ◦ ◦ x = {z ∈ Ln | |=Ln z = a1 ∨ · · · ∨ z = am }. Por consiguiente, x ∈ Ln+1 , concluyendo ası́ que Ln+1 = Vn+1 . Para el caso α = ω, observe que Vω = [ Vn = n<ω [ Ln = Lω . n<ω 9. Por el inciso 5 deducimos de α ⊆ Lα que |α| ≤ |Lα | para toda α. Demostraremos, por inducción sobre α ≥ ω, que |Lα | ≤ |α|: para α = ω se tiene que |Lω | = |Vω | = ω. En el caso en que α es lı́mite, bajo la suposición de que |Lγ | ≤ |γ| se deduce |Lα | = | [ γ<α Lγ | ≤ X γ<α |Lγ | ≤ X γ<α |γ| = |α|. 631 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 632 ✐ ✐ 9. El universo construible Finalmente, para el caso en que α = β + 1, supondremos que |Lβ | = |β|, de donde concluimos que |Lα | = |Def(Lβ )| ≤ |Lβ | · ω = |β| · ω = |β| = |β + 1|. Finalizamos la sección demostrando que L es un modelo interno de ZF . Es decir, dado cualquier axioma Φ de ZF , en ZF se demuestra ΦL . Teorema 2.3. La clase L es un modelo interno de ZF . Demostración. Para cada axioma Φ de ZF demostraremos, desde ZF , ΦL . (Ex)L , (Ext)L y (Fund)L se siguen del teorema 8.1.6 (Unión)L . Se debe demostrar que [∀x∃y∀z(z ∈ y ⇔ (∃u ∈ x)(z ∈ u))]L . Esto es, dado x ∈ L debemos encontrar y ∈ L tal que (∀z ∈ L)(z ∈ y ⇔ (∃u ∈ x)(z ∈ u)). Pues si se demuestra que para cada z ∈ L existe u ∈ x con las caracterı́sticas descritas, dicha u debe estar en L puesto que L es transitiva. Ahora, por el S axioma de unión, sabemos que existe y tal que y = x. Luego, dado que x ∈ L, existe un ordinal α tal que x ∈ Lα . Puesto que Lα es transitivo, y ⊆ Lα , y por lo tanto, y = {z ∈ Lα : (∃v1 ∈ x)(z ∈ v1 )}; más aún, dado que Lα es transitivo y que la fórmula que define a y en la ecuación anterior es Σ0 , se puede aplicar el lema 1.20 para obtener la siguiente igualdad: ◦ ◦ y = {z ∈ Lα :|=Lα (∃v1 ∈ x)(z ∈ v1 )}, concluyendo ası́ que y ∈ Def(Lα ) = Lα+1 ⊆ L. Sin embargo, puesto que y = En particular, S x, es cierta la siguiente afirmación: ∀z(z ∈ y ⇔ (∃u ∈ x)(z ∈ u)). (∀z ∈ L)(z ∈ y ⇔ (∃u ∈ x)(z ∈ u)). 632 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 633 ✐ ✐ Conjuntos y modelos. Curso avanzado (Par)L se debe demostrar que L [∀x∀y∃z∀u((u ∈ z) ⇔ ((u=x) ˙ ∨ (u=y)))] ˙ . Dados x, y ∈ L, buscamos encontrar z ∈ L tal que (∀u ∈ L)[((u ∈ z) ⇔ (u = x) ∨ (u = y))]L . Pero como las fórmulas primitivas son absolutas, lo que debemos demostrar para dicha z es (∀u ∈ L)((u ∈ z) ⇔ (u = x) ∨ (u = y)). Ahora sabemos (por el axioma de par) que existe z tal que ∀u((u ∈ z) ⇔ (u = x) ∨ (u = y)). Para demostrar que z ∈ L, observe que z es un subconjunto de Lα ; ası́, z = {u ∈ Lα : (u = x) ∨ (u = y)}, y aplicando el lema 1.20 se deduce ◦ ◦ que z = {u ∈ Lα :|=Lα u = x ∨ u = y}, de donde concluimos que z ∈ Def(Lα ) = Lα+1 ⊆ L. (Inf )L se deduce del teorema 8.1.6(g), pues por el lema 2.2(6) sabemos que ω ∈ Lω+1 ⊆ L. (Pot)L . Se debe demostrar que [∀x∃y∀z[z ∈ y ⇔ z ⊆ x]]L . Esto es, dado x ∈ L debemos encontrar y ∈ L tal que (∀z ∈ L)(z ∈ y ⇔ z ⊆ x). Por el axioma de potencia sabemos que existe y1 tal que y1 = Pot(x). Luego, por el axioma de comprensión aplicado a la fórmula z ∈ L y al conjunto y1 , existe un conjunto y tal que y = {z ∈ y1 : z ∈ L}. Ahora, para demostrar que y ∈ L, sea f : y −→ OR definida por f (z) = mín{α ∈ OR : z ∈ Lα }. Por el axiomaSde reemplazo, f [y] es un conjunto (de ordinales), y por el axioma de unión, f [y] = α es un conjunto y por lo tanto un ordinal. Ası́, por el lema 2.2 (5) sabemos que y ⊆ Lα . 633 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 634 ✐ ✐ 9. El universo construible Por lo tanto, según la definición de y y = {z ∈ Lα : z ⊆ x}, y al aplicar el lema 1.20 llegamos a ◦ ◦ y = {z ∈ Lα :|=Lα z ⊆ x} ∈ Def(Lα ) = Lα+1 . Por lo tanto, y ∈ L y claramente (Comp)L . (∀z ∈ L)(z ∈ y ⇔ z ⊆ x). Sea Φ(v0 , . . . , vn ) en LTC; se debe demostrar que [∀x∀v1 . . . ∀vn ∃y∀z[(z ∈ y) ⇔ (z ∈ x) ∧ Φ(z, a1 , . . . , an )]]L . Sean x, a1 , . . . , an ∈ L; debemos encontrar y ∈ L tal que (∀z ∈ L)[(z ∈ y) ⇔ (z ∈ x) ∧ ΦL (z, a1 , . . . , an )]. Sea A = {x, a1 , . . . , an } y sea f : A −→ OR definida por f (u) = mín{α ∈ OR : u ∈ Lα }; entonces, por los axiomas de reemplazo y unión, sabemos que α= [ f [A] es un ordinal. Luego, aplicando el principio de reflexión 8.7.4 a la jerarquı́a construible, existe un ordinal lı́mite β tal que β > α y: (∀~z ∈ Lβ )[ΦL (~z) ⇔ ΦLβ (~z)]. Ahora, sea φ la fórmula correspondiente a Φ en L, y sea ◦ ◦ ◦ ◦ ◦ y = {z ∈ Lβ :|=Lβ [φLβ (z, a1 , . . . , an ) ∧ (z ∈ x)]}. Entonces, y ∈ Def(Lβ ) = Lβ+1 ⊆ L y además, por el teorema 1.16: y = {z ∈ Lβ : ΦLβ (z, a1 , . . . , an ) ∧ (z ∈ x)}. Ası́, por la elección de β según el principio de reflexión se cumple que y = {z ∈ x : φL (z, a1 , . . . , an )}. Por lo tanto, dado que y ∈ L, para cualquier z ∈ L, (z ∈ y) ⇔ (z ∈ x) ∧ ΦL (z, a1 , . . . , an ). 634 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 635 ✐ ✐ Conjuntos y modelos. Curso avanzado (Reemp)L Debemos demostrar que dada una fórmula Φ(v0 , . . . , vn ) de LTC, es válida la siguiente afirmación: [∀v2 . . . ∀vn [∀x∃y(Φ(x, y, v2 , . . . , vn ) ∧ ∀z(Φ(x, z, v2 , . . . , vn ) ⇒ y = z)) ⇒ ∀u∃v(∀x ∈ u)(∃y ∈ v)Φ(x, y, v2 , . . . , vn )]]L . Sean a2 , . . . , an ∈ L y supongamos que (∀x ∈ L)(∃y ∈ L) (ΦL (x, y, a2 , . . . , an ) ∧ (∀z ∈ L)ΦL (x, z, a2 , . . . , an ) ⇒ y = z); debemos demostrar que dada u ∈ L, existe v ∈ L tal que (∀x ∈ u)(∃y ∈ v)ΦL (x, y, a2 , . . . , an ). Sean u ∈ L y f : u −→ OR definida por f (x) = mín{α ∈ OR : (∃y ∈ Lα ) ∧ ΦL (x, y, a2 , . . . , an )}. De nuevo, por los axiomas de reemplazo y unión, sabemos que α = un ordinal. Ahora, sea v = Lα ; entonces v ∈ L y además S f [u] es (∀x ∈ u)(∃y ∈ v)ΦL (x, y, a2 , . . . , an ). 3. Operaciones de Gödel En esta sección definiremos el universo construible L desde una perspectiva más cercana a la definición que presenta Gödel en su monografı́a de 1940 [Gödel 1940]. El teorema fundamental de esta sección establece la equivalencia entre las dos definiciones que se ofrecen en el presente capı́tulo. Los resultados de esta sección serán, además, de gran ayuda para demostrar una de las propiedades fundamentales que remite al carácter absoluto de los estratos de la jerarquı́a en algunos casos (Teorema 4.23). Este resultado es fundamental para demostrar (entre otros) el teorema de condensación (Teorema 6.1). Comenzamos con una lista de funciones llamadas operaciones primitivas de Gödel. 635 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 636 ✐ ✐ 9. El universo construible Definición 3.1. Las siguientes funciones se conocen como operaciones primitivas de Gödel: F1 (X, Y ) = {X, Y } F2 (X, Y ) = X × Y F3 (X, Y ) = X \ Y F4 (X, Y ) = X ∩ Y F5 (X, Y ) = {(u, v) : u ∈ X ∧ v ∈ Y ∧ u ∈ v} F6 (X, Y ) = [ X F7 (X, Y ) = dom(X) F8 (X, Y ) = {(u, v) : (v, u) ∈ X} F9 (X, Y ) = {(u, v, w) : (u, w, v) ∈ X} F10 (X, Y ) = {(u, v, w) : (v, w, u) ∈ X}. Una relación R es Σn si {~x : R~x} = {~x : ϕ(~x)}, donde ϕ es una Σn -fórmula. Una función F es una Σn -función si la relación y = F (~x) es una Σn -relación. Observe que, con ayuda del teorema 8.8.4, fácilmente se reconoce que las funciones primitivas de Gödel son Σ0 . A continuación definimos el mı́nimo conjunto que es cerrado respecto las diez operaciones anteriores y que contiene un conjunto dado; más adelante este conjunto se ligará con la noción de definibilidad. Definición 3.2. Sea M un conjunto, y definimos la cerradura de Gödel para M (cl(M)) por recursión sobre ω, de la siguiente manera: cl0 (M) = M, clk+1 (M) = clk (M) ∪ F1 [clk (M) × clk (M)] ∪ · · · ∪ F10 [clk (M) × clk (M)], S cl(M) = k∈ω clk (M). En el discurso que sigue entendemos por operación de Gödel (o G-función) todas aquellas funciones que se obtengan aplicando reiteradamente (un número finito de veces) la operación de composición, iniciando con las operaciones primitivas de Gödel. El siguiente lema establece la relación que existe entre la cerradura de Gödel (para un conjunto dado) y el conjunto de las imágenes de las G-funciones (definidas en dicho conjunto): 636 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 637 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 3.3. Sea M un conjunto. Los conjuntos A = {F(x1 . . . . , xn ) : (x1 , . . . , xn ) ∈ M n ∧ F es una G − función} y cl(M) son iguales. Demostración. Demostraremos por inducción finita que: a ∈ cl(M) ⇒ a ∈ A. Para k = 0, a ∈ M. Pero F6 (F1 (a, a))) = a. Si a ∈ clk+1 (M) y a ∈ clk (M), entonces, por hipótesis de inducción, a ∈ A. Si a ∈ / clk (M), se cumple a ∈ Fi [clk (M) × clk (M)] (para algún i = 1, . . . , 10); es decir, existen s, t ∈ clk (M) tales que a = Fi (s, t). Por hipótesis de inducción, s, t ∈ A, esto es, existen Fs y Ft G-funciones, con s = Fs (~a) y t = Ft (~a). Puesto que, Fi (Fs , Ft ) es una G-función y a = Fi (Fs , Ft )(~a). Deducimos a ∈ A y cl(M) ⊆ A. La otra contención se demostrará por inducción sobre la construcción de las G-funciones. Sea F(~x) ∈ A, si F es primitiva, la definición de cl(M) asegura que F(~x) ∈ cl(M). Si se supone que G1 y G2 son G-funciones (definidas en M) que están en cl(M) y tales que F(~x) = Fi (G1 (x~1 ), G2 (x~2 )), para algún i = 1, . . . , 10, y si G1 (~x1 ) y G2 (~x2 ) están en clk (M) (para algún k < ω), entonces F(~x) está en clk+1 (M) ⊂ cl(M). Por lo tanto, queda demostrada la igualdad entre cl(M) y A. Definición 3.4. Se dice que una fórmula φ(~x) es normal si (i) el sı́mbolo “=” ˙ no aparece en la fórmula; (ii) la presencia del sı́mbolo “∈”, si ocurre, es en la forma xi ∈ xj , donde i 6= j; (iii) la presencia del sı́mbolo “∃” aparece en la forma donde i ≤ m. (∃xm+1 ∈ xi )ψ(x1 , . . . , xm+1 ), A lo que buscamos llegar con los siguientes resultados es a establecer que a todas las Σ0 -fórmulas φ de LTC corresponde una G-función que está definida en términos de φ. Para lograrlo, es necesario establecer ciertos lemas y definiciones previos. 637 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 638 ✐ ✐ 9. El universo construible Lema 3.5. Si φ(~x) es una fórmula Σ0 , entonces existe una fórmula normal φN (~x) tal que ∀x1 . . . ∀xn [φ(~x) ⇔ φN (~x)]. Demostración. Las fórmulas de la forma x=y ˙ pueden reemplazarse con (∀u ∈ x)(u ∈ y) ∧ (∀u ∈ y)(u ∈ x). Las fórmulas de la forma x ∈ x se reemplazan con (∃u ∈ x)(u ≈ x). Por último, se debe observar que las variables que aparecen cuantificadas en φ pueden renombrarse, de tal suerte que la variable con mayor subı́ndice sea la que aparezca cuantificada. A continuación definimos el concepto de G − f órmula, para luego establecer la relación existente entre algunas fórmulas y las operaciones de Gödel: Definición 3.6. Una fórmula φ(x1 , . . . , xn ) G-fórmula si existe una n-operación de Gödel Fφ tal que Fφ (a1 , . . . , an ) = {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ φ(x1 , . . . , xn )}. Teorema 3.7. Si n > 0 y φ(x1 , . . . , xn ) es una fórmula Σ0 , entonces φ es una G-fórmula. Demostración. Haremos uso del lema 3.5 y demostraremos el resultado para fórmulas normales. Sea φ(x1 , . . . , xn ) una fórmula Σ0 y normal. Suponga que el teorema es válido para todas las subfórmulas de φ. Caso 1. φ es atómica y, por lo tanto, de la forma xi ∈ xj . Demostración por inducción para n ≥ 2: (a) Para n = 2, observe que {(x1 , x2 ) : (x1 ∈ a1 )∧(x2 ∈ a2 )∧(x1 ∈ x2 )} = F5 (a1 , a2 ), y {(x1 , x2 ) : (x1 ∈ a1 ) ∧ (x2 ∈ a2 ) ∧ (x2 ∈ x1 )} = F8 (F3 (a1 , a2 )). (b) n > 2 y j, i 6= n. Por hipótesis de inducción, existe F una G-función, tal que {(x1 , . . . , xn−1 ) : [(x1 , . . . , xn−1 ) ∈ (a1 × · · · × an−1 )] ∧ (xi ∈ xj )} = F(a1 , . . . , an−1 ). De aquı́ se sigue que {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ (xi ∈ xj )} = F(a1 , . . . , an−1 ) × an . 638 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 639 ✐ ✐ Conjuntos y modelos. Curso avanzado (c) n > 2 y j, i 6= n − 1. Del inciso anterior sabemos que existe F, una G-función tal que {(x1 , . . . , xn , xn−1 ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ (xi ∈ xj )} = F(a1 , . . . , an ). Observe que como (x1 , . . . , xn , xn−1 ) = ((x1 , . . . , xn−2 ), xn , xn−1 ), entonces {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ (xi ∈ xj )} = F9 (F(a1 , . . . , an )). (d) n > 2, i = n − 1 y j = n. Por el inciso (a) se cumple que {(xn−1 , xn ) : [(xn−1 , xn ) ∈ (an−1 × an )] ∧ (xn−1 ∈ xn )} = F5 (an−1 , an ); por lo tanto, {((xn−1 , xn ), (x1 , . . . , xn−2 )) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ (xn−1 ∈ xn )} = F5 (an−1 , an ) × (a1 × · · · × an−2 ). Sea F la G-función F5 (an−1 , an ) × (a1 × · · · × an−2 ). Observe que ((xn−1 , xn ), (x1 , . . . , xn−2 )) = (xn−1 , xn , (x1 , . . . , xn−2 )), y que (x1 , . . . , xn ) = ((x1 , . . . , xn−2 ), xn−1 , xn ). Podemos entonces concluir que {(x1 , . . . , xn ), : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ (xn−1 ∈ xn )} = F10 (F5 (an−1 , an )). (e) Análogo al anterior. Caso 2. φ(x1 , . . . , xn ) es una negación de la forma ¬ψ(x1 , . . . , xn ). Por hipótesis de inducción, existe F una G-función tal que {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ φ(x1 , . . . , xn )} = F(a1 , . . . , an ). Pero claramente, {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ ψ(x1 , . . . , xn )} = (a1 × · · · × an ) \ F(a1 , . . . , an ). Esta última función es fácilmente reconocible como una G-función. 639 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 640 ✐ ✐ 9. El universo construible Caso 3. φ(x1 , . . . , xn ) es una conjunción de la forma α(x1 , . . . , xn ) ∧ β(x1 , . . . , xn ). Por hipótesis de inducción, sabemos que existen F2 (a1 , . . . , an ) y F2 (a1 , . . . , an ), G-funciones tales que {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ α(x1 , . . . , xn )} = F1 (a1 , . . . , an ) y que {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ β(x1 , . . . , xn )} = F2 (a1 , . . . , an ). Por lo tanto, {(x1 , . . . , xn ) : [(x1 , . . . , xn ) ∈ (a1 × · · · × an )] ∧ φ(x1 , . . . , xn )} = F1 (a1 , . . . , an ) ∩ F2 (a1 , . . . , an ). De nuevo, esta última es fácilmente reconocible como una G-función. Caso 4. φ(x1 , . . . , xn ) es de la forma ∃xn+1 ((xn+1 ∈ xi ) ∧ ψ(x1 , . . . , xn , xn+1 ). Ahora, por hipótesis de inducción, se sabe que existe F(a1 , . . . , an ), una Gfunción tal que {(x1 , . . . , xn ) : (x1 , . . . , xn ) ∈ a1 × · · · × an ∧ (xn+1 ∈ xi ∧ ψ(x1 , . . . , xn+1 ))} = F(a1 , . . . , an+1 ). Afirmamos que {(x1 , . . . , xn ) : (x1 , . . . , xn ) ∈ a1 × · · · × an ∧ φ(x1 , . . . , xn )} = (a1 × · · · × an ) ∩ dom(F(a1 , . . . , an , [ ai )). Veamos: sean x = (x1 , . . . , xn ) y a = a1 × · · · × an . Ası́, para toda x ∈ a se cumplen las siguientes equivalencias: φ(x) ⇔ (∃y ∈ xi )ψ(x, y) ⇔ ∃y(y ∈ xi ∧ ψ(x, y) ∧ y ∈ ⇔ x ∈ dom({(x, y) ∈ a × [ [ ai ) ai : (y ∈ xi ∧ ψ(x, y)}). Queda demostrada la afirmación, y por lo tanto el teorema. 640 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 641 ✐ ✐ Conjuntos y modelos. Curso avanzado Recuerde que Def(M) es el conjunto de todos los subconjuntos de M que se pueden definir a partir de una fórmula relativizada a M y con parámetros en M. A continuación se establece una de las dos implicaciones entre las nociones de definibilidad y de cerradura de Gödel. Lema 3.8. Si M es un conjunto, entonces Def(M) ⊆ cl(M ∪ {M}) ∩ Pot(M). Demostración. Sea a ∈ Def(M). Existen una fórmula φ de LTC y (z1 , . . . , zn ) ∈ M n tales que a = {x ∈ M : φM (z1 , . . . , zn , x)}. Sea ψ(M, z1 , . . . , zn , x) = φM (z1 , . . . , zn , x). Ası́, a = {x ∈ M : ψ(M, z1 , . . . , zn , x)}. Observe que ψ(M, z1 , . . . , zn , x) es una fórmula Σ0 . Por lo tanto, en vista del teorema 3.7, ψ(M, z1 , . . . , zn , x) es una G-fórmula, es decir, existe F(A, B1 , . . . , Bn , C), una G-función tal que F(A, B1 , . . . , Bn , C) = {(M, z1 , . . . , zn , x) : [(M, z1 , . . . , zn , x) ∈ (A × B1 × · · · × Bn × C)] ∧ ψ(M, z1 , . . . , zn , x)}. Sean A = F1 (M, M) = {M} B1 = F1 (z1 , z1 ) = {z1 } .. . Bn = F1 (zn , zn ) = {zn } C = M. Entonces F ′ (z1 , . . . , zn , M) = F(F1 (M, M), F1 (z1 , z1 ), . . . , F1 (zn , zn ), M) = {(M, z1 , . . . , zn , x) : [(M, z1 , . . . , zn , x) ∈ ({M} × {z1 } × · · · × {zn } × M)] ∧ φM (z1 , . . . , zn , x)}. 641 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 642 ✐ ✐ 9. El universo construible Lo anterior implica que F7 (F8 (F ′ (z1 , . . . , zn , M))) = {x ∈ M : φM (z1 , . . . , zn , x)} = a. Por lo tanto, a ∈ (cl(M ∪ {M}) ∩ Pot(M)). La otra contención se cumple para conjuntos transitivos. Sin embargo, para demostrar esto requerimos del siguiente lema. Lema 3.9. 1. Para i = 1, . . . , 10, la relación Fi (X, Y ) = Z es Σ0 . 2. Si F es una operación de Gödel y φ(x) es una fórmula Σ0 de LTC, entonces las relaciones (a) u ∈ F(X1 , . . . , Xn ); (b) (∀u ∈ F)φ(u), (∃u ∈ F)φ(u); (c) Z = F(X1 , . . . , Xn ); (d) φ(F), son Σ0 . Demostración. La parte 1 es directa de la definición 3.1 y (tal como se mencionó) del teorema 8.8.4. La demostración de 2 se hará por inducción simultánea sobre la construcción de F. La base de inducción se sigue directamente de 1. Suponga que F es de la forma Fi (G1 , G2 ) y que tanto G1 como G2 cumplen con las propiedades (a)-(d). Demostraremos, solamente para los casos i = 1, 2, 6, que F cumple las propiedades (a)-(d); los otros casos se demuestran siguiendo el mismo razonamiento: S a) Las relaciones u ∈ {G1 , G2 }, (u ∈ (G1 × G2 )) y (u ∈ G1 ) están definidas, respectivamente, por las fórmulas (u = G1 ) ∨ (u = G2 ), (∃x ∈ G1 )(∃y ∈ G2 )(u = (x, y)), (∃y ∈ G1 )(u ∈ y). La primera fórmula se reconoce como Σ0 si se aplica la hipótesis de inducción de (c). La segunda y la tercera fórmulas también lo son, en vista de la hipótesis de inducción de (b). b) Las fórmulas (∀u ∈ {G1 , G2 })φ(u), (∀u ∈ G1 × G2 )φ(u), y (∀u ∈ S G1 )φ(u) son, respectivamente, equivalentes a las siguientes fórmulas: φ(G1 ) ∧ φ(G2 ), 642 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 643 ✐ ✐ Conjuntos y modelos. Curso avanzado (∀u ∈ y)(Rel(y) ∧ dom(y) = G1 ∧ ran(y) = G2 ⇒ φ(u)), (∀u ∈ y)(y ∈ G1 ⇒ φ(u)). La primera fórmula es Σ0 al aplicar la hipótesis de inducción de (c). La segunda lo es al aplicar la hipótesis de inducción de (d), y la última también lo es por la hipótesis de inducción de (a). c) En este caso, observemos que la relación Z = F se define por la fórmula (∀u ∈ Z)(u ∈ F) ∧ (∀u ∈ F)(u ∈ Z), la cual se reconoce como Σ0 debido a los incisos (a) y (b) ya demostrados. d) En la fórmula φ(F), F aparece en φ en alguna de las siguientes formas: u ∈ F, F ∈ u, Z = F, (∀u ∈ F), (∃u ∈ F). Si se observa que la fórmula (F ∈ u) puede ser reemplazada por la fórmula (∃y ∈ u)(y = F), entonces se afirma que cada una de las apariciones de F en la Σ0 -fórmula φ se reemplaza por fórmulas Σ0 , obteniendo ası́ una Σ0 -fórmula equivalente a φ(F). Es a partir de este lema que se obtiene la igualdad entre los conjuntos Def(M) y cl(M ∪ {M}) ∩ Pot(M), para M transitivo. Dado que el último conjunto es claramente definible en la teorı́a de los conjuntos, se puede establecer la noción de definibilidad en términos de dichos conjuntos; en particular, para el caso que nos interesa, el de la jerarquı́a construible, se puede redefinir de la siguiente manera: L0 = ∅ Lα+1 = cl(Lα ∪ {Lα }) ∩ Pot(Lα ) Lδ = [ Lα si lím(α) α<δ L= [ Lα . α∈OR En vista del siguiente teorema, ambas definiciones de la jerarquı́a construible son equivalentes, por lo que en algunos momentos se usará esta definición, como es el caso de los lemas 4.19 y 4.22 de la siguiente sección. 643 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 644 ✐ ✐ 9. El universo construible Teorema 3.10. Si M es un conjunto transitivo, entonces Def(M) = cl(M ∪ {M}) ∩ Pot(M). Demostración. La contención Def(M) ⊆ cl(M ∪ {M}) ∩ Pot(M) es el lema 3.8. Para demostrar la otra contención procedemos de la siguiente manera: sean F una operación de Gödel, M un conjunto transitivo y w1 , . . . , wn en M tales que F(M, w1 , . . . , wn ) ⊆ M. En esta situación, F(M, w1 , . . . , wn ) se puede escribir de la siguiente forma: F(M, w1 , . . . , wn ) = {u ∈ M : φ(u, M, w1 , . . . , wn )}, donde φ(u, M, w1 , . . . , wn ) es la Σ0 -fórmula (dada por el lema anterior) que define la relación u ∈ F(M, w1 , . . . , wn ). Ahora, como M es transitivo y todas las cotas de los cuantificadores de φ son M o u o wi , entonces todas las cotas de los cuantificadores de φ pueden reemplazarse por M, por lo que F(M, w1 , . . . , wn ) se puede expresar como F(M, w1 , . . . , wn ) = {u ∈ M : φ1M (u, w1 , . . . , wn )}, donde φ1 es la fórmula que se obtuvo al hacer el reemplazo mencionado en φ. Esto implica, según el lema 1.20, que ◦ ◦ ◦ F(M, w1 , . . . , wn ) = {u ∈ M :|=M φ1 (u, w1 , . . . , wn )}. De aquı́ que F(M, w1 , . . . , wn ) ∈ Def(M), y concluimos que cl(M ∪ {M}) ∩ Pot(M) ⊆ Def(M). 4. El axioma de constructibilidad El axioma de constructibilidad es el enunciado que afirma que todo conjunto es construible. En términos metateóricos, este enunciado corresponde a la expresión: “V = L”. Sin embargo, en términos formales el axioma de constructibilidad es el siguiente: ∀x(∃α ∈ OR)(x ∈ Lα ). 644 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 645 ✐ ✐ Conjuntos y modelos. Curso avanzado En esta sección demostraremos que L es un modelo interno de ZF +V = L. Para establecer lo anterior, sólo hace falta demostrar que ZF ⊢ (V = L)L . Ahora, esto sucede si y sólo si ZF ⊢ V L = LL y dado que V L = L (8.3.4), el trabajo que desarrollaremos en esta sección está centrado en la demostración del hecho de que LL = L. Esto se logrará demostrando que L es absoluta para cierta clase de LTC-estructuras M a la que pertenece L, es decir, demostrando que (L ∈ M) ∧ (∀M ∈ M)(LM = L). Para lograrlo, es suficiente mostrar que la propiedad se cumple para todos los estratos de la jerarquı́a constructiva. Para ello demostramos que existe una fórmula H(x, α) de LTC que es ∆ZF 1 y que es la definición, en LTC, del enunciado metateórico “x = Lα ”. En tal situación, L = {y : ∃x∃α(y ∈ x ∧ H(x, α)}. Comencemos con los requisitos para poder definir dicha fórmula. En primer término, es necesario definir una fórmula Sucf(x, y) de LTC tal que Sucf(x, y) ⇔ y es el conjunto de todas las sucesiones finitas de elementos de x. Definición 4.1. Sea Sucf(x, y) la siguiente fórmula de LTC: ∃f [(f es una función ) ∧ (dom(f ) = ω) ∧ (f (0) = ∅) ∧ (y = [ ran(f )) ∧ (∀n ∈ ω)(∀s ∈ f (n + 1))(∃t ∈ f (n))(∃a ∈ x)(s = t ∪ {(n, a)}) ∧ (∀n ∈ ω)(∀s ∈ f (n))(∀a ∈ x)(∃t ∈ f (n + 1))(t = s ∪ {(n, a)})]. Observe que la fórmula Sucf(x, y) sı́ define la propiedad mencionada; f es una función que a cada n asocia el conjunto de todas las n−sucesiones de S elementos de x, ası́ y = ran(f ) es el conjunto de todas las sucesiones finitas de elementos de x. Lema 4.2. La fórmula Sucf(x, y) es ∆ZF 1 . Demostración. La fórmula Sucf(x, y), tal como aparece en la definición, es Σ1 ; para asegurarlo es necesario hacer explı́citas las apariciones de ω, como en “∀n ∈ ω”. Para llevar a cabo esto, agregamos el prefijo ∃w(Omega(w)) 645 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 646 ✐ ✐ 9. El universo construible (donde Omega(w) es la definición en LTC de ω) a la fórmula Sucf(x, y), para después reemplazar cada aparición de ω por w. Ahora se debe encontrar una fórmula Π1 equivalente a Sucf(x, y) en ZF . Mediante el teorema de recursión es fácil construir, para cada conjunto x (desde ZF ), una función f como la que aparece en Sucf(x, y). En consecuencia, ZF ⊢ ∀x∃ySucf(x, y). También del teorema de recursión se desprende que dicha y debe ser la única con esa propiedad, de donde se concluye que ZF ⊢ Sucf(x, y) ⇔ ∀z[Sucf(x, z) ⇒ (z = y)], por lo que Sucf(x, y) es ∆ZF 1 . A continuación se define una fórmula P(x, y) tal que P(x, y) ⇔ y es el conjunto de todos los subconjuntos finitos de x. Definición 4.3. Sea P(x, y) la siguiente fórmula de LTC: ∃z[Sucf(x, z) ∧ y = {ran(u) : u ∈ z}]. Claramente esta definición de P(x, y) tiene la propiedad mencionada. Pero más aún, esta fórmula es ∆ZF 1 : Lema 4.4. La fórmula P(x, y) es ∆ZF 1 . Demostración. Procedemos de manera similar a la demostración del lema anterior. Tal como aparece, la fórmula P(x, y) es Σ1 ; sólo es necesario verificar que el término y = {ran(u) : u ∈ z} escrito en LTC es Σ1 . Por otro lado se cumple ZF ⊢ ∀x∃y P(x, y), y dicha y debe ser única. En consecuencia, ZF ⊢ P(x, y) ⇔ ∀z[P(x, z) ⇒ z = y], por lo que P(x, y) es ∆ZF 1 . 646 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 647 ✐ ✐ Conjuntos y modelos. Curso avanzado Para demostrar que existe la fórmula H(α, x) (mencionada al inicio de la sección) con las propiedades descritas, es necesario demostrar que existe una definición ∆ZF 1 (en LTC) de la relación v = Def(u). Comenzaremos con una primera aproximación a la definición (un poco más explı́cita que la dada en la sección 2). Definición 4.5. Sea A(u, v) la siguiente fórmula de LTC: (∀x ∈ v)∃φ[Fml(φ, u) ∧ Lib(φ, {v0 }) ∧ (x ⊆ u) ◦ ∧ (∀z ∈ u)(z ∈ x ⇔ ∃ψ(Sust(ψ, φ, v0 , z) ∧ Sat(u, ψ)))] ∧ ∀φ[(Fml(φ, u) ∧ Lib(φ, {v0 })) ⇒ (∃x ∈ v)[(x ⊆ u) ∧ (∀z ∈ u)(z ∈ x) ◦ ⇔ ∃ψ(Sust(ψ, φ, v0 , z) ∧ Sat(u, ψ)))]]. Claramente, A(u, v) define la relación que nos interesa, pero también es claro que esta fórmula no es siquiera Σ1 . Es necesario acotar los cuantificadores que aparecen no acotados en la definición anterior por una sola cota. Para encontrar esta cota, es necesario un desarrollo similar al que se llevó a cabo en la sección 1 para construir la fórmula Sat(u, φ); en ese caso se encontró una cota para todos los cuantificadores no acotados de S(u, φ). Pero como esa cota no es suficientemente grande para los cuantificadores de A(u, v), construiremos una extensión, esto es, un conjunto que acote los cuantificadores de A(u, v) y los de S(u, φ). Redefinimos A(u, v) como la fórmula que se obtiene de A(u, v) al sustituir las apariciones de Sat(u, φ) por la fórmula S(u, φ), y ésta se denotará con B(u, v). Ahora, dado que S(u, φ) es equivalente a Sat(u, φ), se tiene que A(u, v) es equivalente a B(u, v). A continuación buscaremos una cota para todos los cuantificadores no acotados de B(u, v). Sea C(u, v, w) la fórmula que se obtiene al acotar todos los cuantificadores no acotados de B(u, v) por el conjunto w incluyendo aquellos que aparecen en las subfórmulas “Sust”, “Lib” y “Fml”. Ası́, si w es un conjunto, entonces C(u, v, w) será Σ0 . Se define K(u) a partir de los conjuntos k0 (u), k1 (u), k2 (u), k3 (u) de la siguiente manera: ◦ 1. k0 (u) = 9 ∪ {vi : i ∈ ω} ∪ {x : x ∈ u}. 647 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 648 ✐ ✐ 9. El universo construible 2. k1 (u) = “el conjunto de sucesiones finitas de miembros de k0 (u).” 3. k2 (u) = “el conjunto de sucesiones finitas de k1 (u).” 4. k3 (u) = “el conjunto de sucesiones finitas de subconjuntos finitos del conjunto {vi : i ∈ ω}.” 5. K(u) = k1 (u) ∪ k2 (u) ∪ k3 (u). Es claro que este conjunto acota los cuantificadores no acotados de B(u, v), incluyendo aquellos que aparecen en las fórmulas S(u, φ), Fml(u, φ), Sust(ψ, φ, x, y) y Lib(φ, x). A continuación definimos una fórmula, K(u, w), que define a este conjunto en LTC: Definición 4.6. Sea K(u, w) la siguiente fórmula: (∃a, b, c, d, e, f )[[(∀z ∈ d)Var(z) ∧ (∀i ∈ ω)(vi ∈ d)] ◦ ∧ (∀z ∈ e)Const(z, u) ∧ (∀z ∈ u)(z ∈ e)] ∧ [Sucf(a, 9 ∪ d ∪ e)] ∧ [Sucf(b, a)] ∧ [Pot(f, d) ∧ Sucf(c, f )] ∧ [w = a ∪ b ∪ c]]. De esta definición deducimos que K(u, w) ⇔ w = K(u). Ahora, sea D(u, v) la fórmula ∃w[K(u, w) ∧ C(u, v, w)]. Esta fórmula expresa la existencia de un conjunto w (precisamente K(u) (y que además, v = Def(u), puesto que dicho w acota todos los cuantificadores de la fórmula B(u, v)) sin perder su significado semántico. Es claro que D(u, v) ⇔ v = Def(u), donde, además, D(u, v) es una fórmula Σ1 (pues C(u, v, w) es Σ0 y K(u, w) es Σ1 ). Más aún, al igual que con las fórmulas anteriores, también se tiene el siguiente lema: Lema 4.7. La fórmula D(u, v) de LTC es ∆ZF 1 . 648 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 649 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Observe que para cualquier conjunto u se puede demostrar (en ZF ) que existen conjuntos w y v tales que w = K(u) y v = Def(u); además, dichos conjuntos son únicos para u. En consecuencia, por lo que logramos ZF ⊢ ∀u∃!v[D(u, v)], ZF ⊢ D(u, v) ⇔ ∀z[D(u, z) ⇒ z = v]. De aquí se concluye que D(u, v) es ∆ZF 1 . A continuación definimos una fórmula, que llamaremos E(α, f ), tal que E(α, f ) ⇔ f = (Lγ : γ ≤ α). Es decir, f es “la función” de OR en V tal que f (α) = Lα . Definición 4.8. Sea E(α, f ) la siguiente fórmula de LTC: Or(α) ∧ (f es una función ) ∧ (dom(f ) = α + 1) ∧ (f (0) = ∅) ∧ (∀γ ∈ dom(f ))[((lím(γ) ∧ γ > 0) ⇒ (f (γ) = [ f (δ))) δ<γ ∧ (sucesor(γ) ⇒ D(f (γ), f (γ − 1)))]. Es claro que esta fórmula expresa el hecho de que f es una función con dominio α + 1 y tal que para cada γ ≤ α, f (γ) = Lγ . Más aún, podemos demostrar lo siguiente: Lema 4.9. La fórmula E(α, f ) es Σ1 y ∆ZF 1 . Demostración. Si sustituimos la aparición de la expresión f (γ) = [ f (δ) δ<γ por la fórmula (∀x ∈ f (γ))(∃δ ∈ γ)(x ∈ f (δ)) ∧ (∀δ ∈ γ)(f (δ) ⊆ f (γ)), es claro que se obtiene una fórmula Σ1 (esto es claro si se sustituye el cuantificador (∀γ ∈ dom(f ))(. . . ) por ∃w(w = dom(f )) ∧ (∀γ ∈ w)(. . . )). 649 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 650 ✐ ✐ 9. El universo construible Para comprobar que E(α, f ) es ∆ZF 1 , es necesario demostrar que ZF ⊢ ∀α∃f [E(α, f )]. Pero, haciendo uso del teorema de recursión, sabemos que para cada ordinal α es posible definir una única función f : α + 1 −→ ran(f ), tal que (∀γ ∈ dom(f ))(f (γ) = Lγ ). En consecuencia, ZF ⊢ E(α, f ) ⇔ ∀g[E(α, g) ⇒ g = f ]. Por lo tanto, E(α, f ) es ∆ZF 1 . Según el lema anterior, en el caso en que M sea un modelo interno de ZF , [E(α, f )]M ⇔ f = (LM γ : α ≤ α). Ahora ya estamos en posibilidad de describir una fórmula de LTC que defina la relación metateórica “x = Lα ”. Definición 4.10. Sea H(α, x) la siguiente fórmula de LTC: ∃f [E(α, f ) ∧ (x = f (α))]. Es claro que esta fórmula es Σ1 y que además define la relación mencionada. Pero también es posible demostrar que esta fórmula es absoluta para modelos (clase) transitivos de ZF, es decir, se tiene el siguiente lema: Lema 4.11. La fórmula H(α, f ) es ∆ZF 1 . Demostración. Es claro que ZF ⊢ ∀α∃!x[H(α, x)]. Usando el mismo argumento que hemos aplicado antes, concluimos que H(α, x) es ∆ZF 1 . Una vez definida esta fórmula, sólo falta mostrar que para cierta clase de modelos de ZF (que incluye a L), el universo construible es absoluto. Esto se condensa en el siguiente lema y su respectivo corolario. Lema 4.12. Sea M la clase de todos los modelos internos de ZF . Entonces, para toda M en M y para todo α ∈ OR, se cumple que [H(α, x)]M ⇒ x = Lα . 650 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 651 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. En la demostración del lema anterior mencionamos que, a partir del teorema de recursión, es posible mostrar que ZF ⊢ ∀α∃x[H(α, x)]. Por consiguiente, dada M ∈ M, el teorema fundamental de modelos internos asegura que ZF ⊢ (∀α ∈ M)(∃x ∈ M)[H(α, x)]M . Ahora, sea α ∈ OR, dado que M es modelo interno de ZF , OR ⊆ M y por lo tanto α ∈ M. Sea x ∈ M tal que H(α, x)M ; entonces, por el lema anterior, ZF ⊢ (∀β ∈ M)(∀y ∈ M)[H(β, y) ⇔ [H(β, y)]M ]; en particular, esto es cierto para α y x. Por lo tanto se cumple H(α, x), lo que implica x = Lα . Corolario 4.13. Si M un modelo interno de ZF (que contenga la clase de los ordinales), entonces para todo α ∈ OR, Lα ∈ M. Demostración. Directa de los lemas previos. Corolario 4.14. La clase L es el mı́nimo modelo interno (que contiene a la clase de los ordinales) de ZF . Demostración. Inmediata del corolario 4.13. Corolario 4.15. Sea M ∈ M y α ∈ OR; entonces (i) LM α = Lα . (ii) LM = L. (iii) LL = L. Demostración. (i) Dado que M ∈ M, α ∈ M; ası́, sabemos que existe x en M tal que [H(α, x)]M y esto, por definición de H(α, x), implica que existe M f = (LM γ : γ ≤ α) en M tal que x = f (α) = Lα , pero por el lema 4.12 sabemos que x = Lα , y concluimos Lα = LM α . (ii) Por (i) sabemos que LM = [ LM α = [ Lα = L. α∈OR α∈OR 651 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 652 ✐ ✐ 9. El universo construible (iii) Éste es el caso particular para L, pues L ∈ M. Teorema 4.16. ZF ⊢ (V = L)L . Demostración. (V = L)L ⇔ V L = LL . Como V L = L, se tiene que (V = L)L ⇔ L = LL , pero por el corolario 4.15, inciso (iii), se sabe que LL = L; ası́, (V = L)L ⇔ L = L. Puesto que en ZF L = L es un teorema, hemos terminado la demostración. Corolario 4.17. Con(ZF ) ⇒ Con(ZF + V = L). Demostración. Aplicar el lema fundamental de modelos internos. A continuación se lleva a cabo el desarrollo necesario para establecer el carácter absoluto de la fórmula H(γ, x) con respecto a los estratos Lα , cuando α es lı́mite y mayor que ω. Este resultado será de gran utilidad en las siguientes secciones, en particular para la demostración del lema de condensación. Iniciamos con la definición de cierto tipo de conjuntos transitivos: Definición 4.18. Se dice que un conjunto transitivo M es adecuado si cumple lo siguiente: (a) M es cerrado respecto a las operaciones de Gödel. (b) Si U ∈ M, entonces {Fi (x, y) : (x, y ∈ U) ∧ i = 1, . . . , 10} ∈ M. (c) α ∈ M ⇒ hLγ : γ < αi ∈ M. (d) ω ∈ M. Es para estos conjuntos que la fórmula H(α, x) es absoluta: Lema 4.19. Si M es un conjunto adecuado, entonces la relación x = Lα es absoluta para M. Demostración. Reescribimos la fórmula H(α, y) que define la relación y = Lα : H(α, y) ⇔ ∃f (E(α, f ) ∧ (α, y) ∈ f ), 652 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 653 ✐ ✐ Conjuntos y modelos. Curso avanzado donde E(f, α) ⇔ Or(α) ∧ Fun(f ) ∧ (dom(f ) = α + 1) ∧ ((∅, ∅) ∈ f ) ∧ (∀γ ≤ α)[lím(γ) ⇒ (γ, [ ran(f ↾ γ) ∈ f ] ∧ (∀γ < α)[(γ + 1, Def(f (γ))) ∈ f ]. Demostramos pues que la fórmula H(α, y) es absoluta para M. Observe que [H(α, y)]M ⇔ (∃f ∈ M)[[OR(α) ∧ Fun(f ) ∧ (dom(f ) = α + 1) ∧ ((0, 0) ∈ f ) ∧ (∀γ ≤ α)[lím(γ) ⇒ (γ, [ [ ran(f ↾γ )]M ) ∈ f ] ∧ (∀γ < α)[(γ + 1, [Def(f (γ))]M ) ∈ f ] ∧ (y, α) ∈ f ]. S Dado que las relaciones X y ran(X) son absolutas para M (pues M es transitivo y ambas relaciones son Σ0 ), será suficiente con demostrar que: 1) La función Def(U) es absoluta para M. 2) Para toda α ∈ M, si γ ≤ α entonces f ↾ γ ∈ M. 3) Para toda α ∈ M, si γ ≤ α entonces f (γ) ∈ M. Para demostrar (1) recordamos la siguiente definición de Def(U) dada en este capı́tulo: Def(U) = cl(U ∪ {U}) ∩ Pot(U), S donde cl(W) = ran(G(W)) y la función G(W) está definida por recursión de la siguiente manera: G0 (W) = W Gn+1 (W) = Gn (W) ∪ {Fi (x, y) : x, y ∈ Gn (W) ∧ i = 1, . . . , 10}. A continuación, demostraremos que la relación x ∈ Def(U) es absoluta para M, de donde concluiremos que la función Def(U) también lo es. Sean x, U ∈ M; ası́: x ∈ Def(U) ⇔ x ⊆ U ∧ (∃n ∈ ω)(x ∈ Gn (U ∪ {U})), y, por lo tanto, (x ∈ Def(U))M ⇔ x ⊆ U ∧ (∃n ∈ ω)([x ∈ Gn (U ∪ {U})]M ). 653 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 654 ✐ ✐ 9. El universo construible Observe que la definición de M garantiza la existencia en M de todos los ordinales finitos. Además, ωM = ω ∈ M. Luego, (x ∈ Def(U))M ⇔ x ⊆ U ∧ (∃n ∈ ω)[∃y(y = Gn (U ∪ {U}) ∧ x ∈ y)]M ⇔ x ⊆ U ∧ (∃n ∈ ω) [(∃y ∈ M)([y = Gn (U ∪ {U})]M ∧ x ∈ y)]. ası́, Mostremos que la función G(W) es absoluta para M: sean W, y, n ∈ M; Gn (W) = y ⇔ ∃f [Fun(f ) ∧ (n ∈ ω) ∧ (dom(f ) = n + 1) ∧ (f (0) = W) ∧ (∀m < n)(f (m + 1) = f (m) ∪ {Fi (x, y) : x, y ∈ f (m) ∧ i = 1, . . . , 10}) ∧ f (n) = y]. En consecuencia, [Gn (W) = y]M ⇔ (∃f ∈ M)[Fun(f ) ∧ (n ∈ ω) ∧ (dom(f ) = n + 1) ∧ (f (0) = V ) ∧ (∀m < n)(f (m + 1) = f (m) ∪ {Fi (x, y) : x, y ∈ f (m) ∧ i = 1, . . . , 10}M ) ∧ f (n) = y]. Pero como para cada m < n, la propiedad (b) de ser adecuado implica (haciendo una sencilla demostración por indución finita), f (m) ∈ M, el conjunto {Fi (x, y) : (x, y ∈ f (m)) ∧ i = 1, . . . , 10} está en M, y en consecuencia, [Gn (W) = y]M ⇔ (∃f ∈ M)[Fun(f ) ∧ (n ∈ ω) ∧ (dom(f ) = n + 1) ∧ (f (0) = W) ∧ (∀m < n)(f (m + 1) = f (m) ∪ {Fi (x, y) : x, y ∈ f (m) ∧ i = 1, . . . , 10}) ∧ f (n) = y]. Por otro lado, dado que f (m) ∈ M (para cada m < n) y M es cerrada repecto a las funciones de Gödel, dicha función f , definida en n + 1, está en M (para cada n ∈ ω). Por lo tanto, [Gn (W) = y]M ⇔ Gn (W) = y, 654 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 655 ✐ ✐ Conjuntos y modelos. Curso avanzado de donde concluimos la absolutez de G(W) para M. Por consiguiente, dado que U ∪ {U} ∈ M para toda U ∈ M, se concluye que si x, U ∈ M, entonces (x ∈ Def(U))M ⇔ x ⊆ U ∧ (∃n ∈ ω)[x ∈ Gn (U ∪ {U})). Es decir, la relación x ∈ Def(u) es absoluta para M. Se sigue que la relación Z = Def(U) es absoluta para M. A continuación, demostraremos (2). Es decir, demostraremos que si α es un elemento de M y γ ≤ α, entonces f ↾ γ ∈ M, donde la función f es la dada en la definición de H(α, y). La propiedad (2) se deduce del hecho de que f ↾ γ = hLν : ν < γi, que por hipótesis está en M. S La propiedad (3) se obtiene de f (γ) = ran(f ↾γ ) = Lγ y de que las S relaciones X, ran(X) son absolutas para M. Por lo tanto, al aplicar (2) se concluye que f (γ) ∈ M. Ası́, hemos demostrado la absolutez de la función x = Lα , para M adecuado. Observe que en el transcurso de la demostración, también hemos probado que la fórmula E(f, α) es absoluta para conjuntos adecuados. Este hecho se usará en la demostración del lema 4.22. Corolario 4.20. Si M es un conjunto adecuado, entonces la relación x ∈ Lα es absoluta para M. Demostración. Sean α, x ∈ M, y entonces x ∈ Lα ⇔ ∃y(H(α, y) ∧ (x ∈ y)) ⇔ (∃y ∈ M)([H(α, y)]M ∧ (x ∈ y)). Esto último se cumple, por un lado, porque H(α, y) es absoluta para M, y por otro lado, porque si existe y tal que y = Lα y α ∈ M, y es un elemento de M. Corolario 4.21. Si M es un conjunto adecuado, entonces M |= (V = L) ⇔ M = Lα , para algún ordinal lı́mite α mayor que ω. 655 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 656 ✐ ✐ 9. El universo construible Demostración. Primero observe que si α = o(M) = OR ∩ M, entonces α es lı́mite y mayor que ω. Ahora, suponga que M |= (V = L), es decir, que (∀x ∈ M)(∃β ∈ M)[x ∈ Lβ ]M . Dado que la relación x ∈ Lγ es absoluta para M, podemos deducir Ası́, (∀x ∈ M)(∃β ∈ M)(x ∈ Lβ ). M= [ {Lβ : β ∈ o(M)} = Lo(M) . Por otro lado, si se supone que M = Lα con α lı́mite mayor que ω, entonces se tiene que (∀x ∈ M)(∃β ∈ M)(x ∈ Lβ ). De nuevo, por la absolutez de la relación x ∈ Lβ (para M), (∀x ∈ M)(∃β ∈ M)[x ∈ Lβ ]M . Es decir, M |= (V = L). Lema 4.22. Sea α un ordinal mayor que ω. Si el ordinal α es lı́mite, entonces el conjunto Lα es adecuado. Demostración. Sea α > ω un ordinal lı́mite. El hecho de que ω ∈ Lα se cumple trivialmente, pues α > ω. Ası́, queda demostrado que Lα cumple con la propiedad (d). Para demostrar (a), observe que si Fi (X, Y ) es una operación primitiva de Gödel, y x, y ∈ Lα , entonces Fi (x, y) ∈ Lβ+4 ∈ Lα , donde β < α es el máximo de los L-rangos de x y y. Para (b), considere U ∈ Lα y Fi (X, Y ) como una operación primitiva de Gödel. Según la demostración anterior, si x, y ∈ U entonces Fi (x, y) ∈ Lβ+4 , donde β es el L- rango de U. De aquı́ que el conjunto Zi = {Fi : x, y ∈ U} = {z : (∃x ∈ U)(∃y ∈ U)(z = Fi (x, y))}, sea un subconjunto de Lβ+4 . Por lo tanto, dado que (para cada i = 1, . . . , 10) la fórmula φi (z), definida por (∃x ∈ U)(∃y ∈ U)(z = Fi (x, y)), es Σ0 (véase el Lema 3.9); se concluye que Z = {z ∈ Lβ+4 : [φ1 (z) ∨ · · · ∨ φ10 (z)]Lβ+4 }, 656 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 657 ✐ ✐ Conjuntos y modelos. Curso avanzado lo cual implica, según el teorema 1.16, que Z ∈ Def(Lβ+4 ) = Lβ+5 ∈ Lα , que es lo que se querı́a demostrar. Por último, para demostrar (c) mostraremos por inducción que para α lı́mite ((β < α) ∧ lím(β)) ⇒ f ↾ β = hLγ : γ < βi ∈ Lα . Observe que si α = ω, entonces para toda n ∈ ω, f ↾ n ∈ Lω , pues Lω es cerrado repecto a par y unión. Ahora, sea β lı́mite tal que ω < β < α; luego: S f ↾ β = A, donde A = {f ↾ γ : γ < β}. Observe que además A = {z ∈ Lβ : (∃g ∈ Lβ )(∃γ < β)(G(g, γ) ∧ z = g)}. Pero según la observación que hicimos al final de la demostración del lema 4.19, se deduce que A = {z ∈ Lβ : (∃g ∈ Lβ )(∃γ < β)(G(g, γ) ∧ z = g)Lβ }, por lo que al aplicar el teorema 1.16, se concluye que A = {z ∈ Lβ :|=Lβ (∃g ∈ Lβ )(∃γ < β)(G(g, γ) ∧ z = g)}, S por lo tanto, A ∈ Lβ+1 y, en consecuencia, f ↾ β = A ∈ Lβ+3 ⊂ Lα . Terminamos así la demostración por inducción. Ahora, si β ∈ Lα y β es sucesor, se sigue de lo recién demostrado y del hecho de que Lα es cerrado bajo las operaciones de par y de unión que f ↾ β ∈ Lα . De este lema y del corolario 4.21 se sigue directamente el siguiente teorema: Teorema 4.23. Si α es un ordinal lı́mite mayor que ω, entonces, para toda γ < α, α LL γ = Lγ . 5. Axioma de elección en L En esta sección demostraremos que L es un modelo interno de ZF +AE , es decir, ZF ⊢ AE L , lo que nos llevará a establecer la consistencia relativa de ZF + AE . Para demostrar que AE L es teorema de ZF , es suficiente con demostrar que ZF ⊢ [∀A∃R[(R ⊆ A × A) ∧ R bien ordena a A]]L . 657 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 658 ✐ ✐ 9. El universo construible La demostración se efectuará usando el teorema fundamental de los modelos internos. Esto es, demostraremos que ZF + V = L ⊢ ∀A∃R[(R ⊆ A × A) ∧ R bien ordena a A], de donde concluimos que AE L es teorema de ZF . En primer término es necesario definir una relación <L que bien ordene L, de tal suerte que para cada α ∈ OR, la restricción de <L a Lα (<Lα ) bien ordene a Lα . Ası́, bajo la hipótesis de que todo conjunto es construible (es decir, ∀x(∃α ∈ OR)(x ∈ Lα )) y del hecho de que los Lα son transitivos, se podrá concluir que todo conjunto es bien ordenable. Para definir la relación de orden <L de una manera directa, es necesario establecer el siguiente lema: Lema 5.1. Sean α ∈ OR y s x ∈ Lα+1 . Existe una fórmula φ(v0 , . . . , vn ) del lenguaje L y existen ordinales γ1 , . . . , γn < α tales que ◦ ◦ ◦ x = {z ∈ Lα :|=Lα φ(z, Lγ1 , . . . , Lγn )}. Demostración. (Por inducción sobre α). (a) Para α = 0 no es necesario demostrar nada, ya que ∅ es el único conjunto x posible. (b) Sea α > 0 y suponga que el lema se cumple para β < α. Ahora, si x ∈ Lα+1 , entonces existe (por definición de Lα+1 ) una fórmula ψ(v0 , . . . , vn ) de L y existen p1 , . . . , pn en Lα tales que ◦ ◦ ◦ x = {z ∈ Lα :|=Lα φ(z, p1 , . . . , pn )}. Sea γ el máximo de los L-rangos de las pi , es decir, sea γ el mínimo ordinal tal que p1 , . . . , pn ∈ Lγ+1 . Ası́, γ < α, y por hipótesis de inducción, para cada i = 1, . . . , n existen una fórmula ψi (v0 , . . . , vk(i) ) de L y ordinales i γ1i , . . . , γk(i) < γ tales que ◦ ◦ ◦ pi = {z ∈ Lγ :|=Lγ ψi (z, Lγ i , . . . , Lγ i )}. 1 k(i) Ahora, para cada i = 1, . . . , n definimos ψ̂i (v0 , . . . , vk(i) , vk(i)+1 ) como la fórmula de L que se obtiene al acotar todos los cuantificadores no acotados de ψi por vk(i)+1 . Luego, se cumple que ◦ ◦ ◦ ◦ ◦ ◦ pi = {z ∈ Lα :|=Lα [(z ∈ Lγ ) ∧ ψ̂i (z, Lγ i , . . . , Lγ i , Lγ )]}. 1 k(i) 658 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 659 ✐ ✐ Conjuntos y modelos. Curso avanzado Para verificar esto último, es necesario hacer uso del teorema 1.16 y del lema 1.20. Se aplica el teorema 1.16 a la fórmula Ψi (v0 , . . . , vn ), que es la correspondiente a ψi (v0 , . . . , vn ) en LTC, para ası́ concluir que L pi = {z ∈ Lγ : Φi γ (z, Lγ i , . . . , Lγ i )}. 1 k(i) Por otro lado, sea Ψ̂i (v0 , . . . , vn , vn+1 ) la fórmula correspondiente a ψ̂i (v0 , . . . , vn , vn+1 ) en LTC. Claramente Ψ̂i es Σ0 ; ası́, y mediante el lema 1.20, llegamos a ◦ ◦ ◦ ◦ Ψ̂i (z, Lγ i , . . . , Lγ i , Lγ ) ⇔|=Lα Ψ̂i (z, Lγ i , . . . , Lγ i , Lγ ). 1 1 k(i) k(i) Pero además, sabemos que la siguiente equivalencia es cierta: L Ψ̂i (z, Lγ i , . . . , Lγ i , Lγ ) ⇔ Ψi γ (z, Lγ i , . . . , Lγ i ). 1 1 k(i) k(i) Por último, al aplicar el lema 1.20 a la fórmula x ∈ y de LTC y al conjunto transitivo Lα se concluye que ◦ ◦ (z ∈ Lγ ) ⇔ [|=Lα (z ∈ Lγ )]. A partir de la afirmación anterior, deducimos ◦ x = {z ∈ Lα :|=Lα ∃p1 . . . ∃pn [ψ(z, p1 , . . . , pn ) ◦ ◦ ◦ ◦ ∧ ∀v[(v ∈ p1 ) ⇔ (v ∈ Lγ ∧ ψˆ1 (v, Lγ 1 , . . . , Lγ 1 , Lγ ))] 1 ∧ ...... ◦ ◦ k(1) ◦ ◦ n , Lγ ))]]}, ∧ ∀v[(v ∈ pn ) ⇔ (v ∈ Lγ ∧ ψˆn (v, Lγ1n , . . . , Lγk(n) por lo que el lema queda demostrado. Con ayuda de este lema podemos establecer un buen orden para L. Primeramente se establecen buenos órdenes para las fórmulas de L y para las sucesiones finitas de ordinales, respectivamente. Esto llevará a la definición de un buen orden para L. Definimos una relación de orden “<• ” para las fórmulas de L, que por cierto son sucesiones finitas de conjuntos. Sea k la función con dominio 659 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 660 ✐ ✐ 9. El universo construible 9 ∪ {vn : n ∈ ω} definida por k(x) = ( n + 9, si x = vn [= (2, n)]; x, si x ∈ 9. Definición 5.2. Sean φ y ψ en L; entonces, φ <• ψ si y sólo si (i) φ es un segmento inicial de ψ, o (ii) k(φ(i)) < k(ψ(i)), donde i = mín{i ∈ dom(φ) ∩ dom(ψ) : φ(i) 6= ψ(i)}. Es fácil verificar que esta relación bien ordena a L. A continuación se define un buen orden (<∗ ) para las sucesiones finitas de ordinales: Definición 5.3. Sean s y t sucesiones finitas de ordinales; entonces, s <∗ t si y sólo si (i) dom(s) < dom(t), o (ii) s(i) < t(i), donde i = mín{j ∈ dom(s) = dom(t) : s(j) 6= t(j)}, cuando dicho conjunto es no vacı́o. Usando el lema anterior y las relaciones recién definidas, estamos en posibilidad de introducir un buen orden para L: Definición 5.4. Sean x, y ∈ L; entonces, x <L y si y sólo si (1) el L-rango de x es menor que el L-rango de y, o (2) existe α tal que x, y ∈ Lα+1 \Lα y sucede alguna de las dos condiciones siguientes: (*) la <• -mı́nima fórmula φ(v0 , . . . , vn ) de L para la cual existen ordinales γ1 , . . . , γn < α tales que ◦ ◦ ◦ x = {z ∈ Lα :|=Lα φ(z, Lγ1 , . . . , Lγn )} <• -precede a la mı́nima fórmula ψ(v0 , . . . , vn ) de L tal que existen ordinales δ1 , . . . , δn < α con ◦ ◦ ◦ y = {z ∈ Lα :|=Lα ψ(z, Lδ1 , . . . , Lδn )}, o (**) las fórmulas φ y ψ de (*) coinciden, pero la <∗ -mı́nima n-sucesión de ordinales hγ1 , . . . , γn i menores que α, tal que ◦ ◦ ◦ x = {z ∈ Lα :|=Lα φ(z, Lγ1 , . . . , Lγn )} 660 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 661 ✐ ✐ Conjuntos y modelos. Curso avanzado <∗ -precede a la mı́nima n-sucesión de ordinales hδ1 , . . . , δn i menores que α con ◦ ◦ ◦ y = {z ∈ Lα :|=Lα φ(z, Lδ1 , . . . , Lδn )}. Al igual que en los otros casos, es fácil verificar que la relación <L en realidad bien ordena la clase L. El trabajo que se desarrolla a continuación se centra en la investigación de la estructura lógica de este buen orden. Para alcanzar una definición de <L en LTC, comenzamos definiendo una fórmula que define la relación metateórica: φ es una fórmula de L, y t es una sucesión finita de ordinales menores que α, n = dom(t); las variables de φ son v0 , . . . , vn y ◦ ◦ ◦ x = {z ∈ Lα :|=Lα φ(z, Lt(0) , . . . , Lt(n−1) )}. Definición 5.5. Sea N(α, x, φ, t) la siguiente fórmula de LTC: ∃u∃f ∃n∃ψ[Fml(φ, ∅) ∧ Sucefin(t) ∧ (dom(t) = n) ∧ Or(α) ∧ (∀i ∈ n)(t(i) ∈ α) ∧ Lib(φ, u) ∧ (f : n + 1 ←→ u) ∧ (∀i ∈ n + 1)(f (i) = vi ) ∧ Sucefin(ψ) ∧ (dom(ψ) = n + 1) ∧ (ψ(0) = φ) ◦ ∧ (∀i ∈ n)Sust(ψ(i + 1), ψ(i), vi+1 , Lt(i) ) ∧ (x ⊆ Lα ) ◦ ∧ (∀z ∈ Lα )(z ∈ x ⇔ ∃θ(Sust(θ, ψ(n), v0 , z) ∧ Sat(Lα , θ)))]. A continuación describimos una fórmula que define, en LTC, el hecho de que φ es la <• -mı́nima fórmula de L tal que para alguna sucesión finita t de ordinales, se tiene que N(α, x, φ, t). Pero antes es necesario definir dos fórmulas <• (φ, ψ) y <∗ (s, t) de LTC, que definan a las relaciones <• y <∗ respectivamente. Definición 5.6. (i) Sea <• (φ, ψ) la siguiente fórmula de LTC: ∃f [[Fml(φ, ∅) ∧ Fml(ψ, ∅) ∧ (∀i ∈ dom(φ))((φ(i) = ψ(i)) ∧ (dom(φ) < dom(ψ)))] ∨ [f : 9 ∪ {vi : i ∈ ω} ←→ ω 661 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 662 ✐ ✐ 9. El universo construible ∧ (∀a ∈ dom(f ))((a ∈ 9) ⇒ (f (a) = a)) ∧ (∀i ∈ ω)((a = vi ) ⇒ (f (a) = 9 + i)) ∧ (∃i ∈ dom(φ) ∩ dom(ψ))(φ(i) 6= ψ(i) ∧ (∀j ∈ dom(φ) ∩ dom(ψ))(φ(j) 6= ψ(j) ⇒ i ≤ j) ∧ f (φ(i)) < f (ψ(i)))]]. (ii) Sea <∗ (s, t) la siguiente fórmula de LTC: Sucefin(s) ∧ Sucefin(t) ∧ (∀i ∈ dom(s))(s(i) ∈ OR) ∧ (∀i ∈ dom(t))(t(i) ∈ OR) ∧ [(dom(s) < dom(t))] ∨ [(dom(s) = dom(t)) ∧ (∃j ∈ dom(s))((∀i ∈ j)(s(i) = t(i)) ∧ (s(j) < t(j)))]. Definición 5.7. Sea M(α, x, φ) la siguiente fórmula de LTC: (∃t)N(α, x, φ, t) ∧ ∀φ̂[(∃tˆ)N(α, x, φ̂, tˆ) ⇒ ((φ <• φ̂) ∨ (φ = φ̂))]. Ahora definimos una fórmula de LTC que dice que t es la <∗ -mı́nima sucesión de ordinales menores que α tal que N(α, x, φ, t). Definición 5.8. Sea P(α, x, φ, t) la siguiente fórmula de LTC: N(α, x, φ, t) ∧ (∀tˆ)[N(α, x, φ, tˆ) ⇒ (t ≤∗ tˆ)]. Definición 5.9. Sea Q(x, y, α) la siguiente fórmula de LTC: [[(x ∈ Lα+1 ) ∧ (y ∈ Lα+1 ) ∧ (x ∈ / Lα ) ∧ (y ∈ / Lα )] ∧ [∃φ, ψ[M(α, x, φ) ∧ M(α, y, ψ) ∧ (φ <• ψ)]] ∨ ∃φ[M(α, x, φ) ∧ M(α, y, φ) ∧ ∃s, t[P(α, x, φ, s) ∧ P(α, y, φ, t) ∧ (s <∗ t)]]. Después de estas últimas definiciones, podemos describir una fórmula de LTC que defina la relación <L : ˆ Definición 5.10. Sea BO(x, y) la siguiente fórmula de LTC: ∃α[(x ∈ Lα ) ∧ (y ∈ / Lα )] ∨ (∃α)Q(x, y, α). 662 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 663 ✐ ✐ Conjuntos y modelos. Curso avanzado Todos los cuantificadores que aparecen no acotados en la fórmula Q(x, y, α) pueden ser acotados por Lmáx{ω,α+4} . Verificar que esto en realidad sucede; puede aparecer como un trabajo verdaderamente exhaustivo, pues se debe ˆ verificar en todas las subfórmulas de BO(x, y) (que por cierto son, en su gran mayorı́a, Σ1 ). Sin embargo, en gran parte de ellas (p. ej., Sucefin(t), Lib(α, u)) es claro que los existenciales pueden ser acotados por Lω . Ahora, sea R(x, y, α, w) la fórmula que se obtiene de Q(x, y, α) al acotar todos los cuantificadores no acotados de Q(x, y, α) por w. Ası́, R(x, y, α, w) ˆ es Σ0 y además obtenemos una fórmula equivalente a BO(x, y) que expresa la relación x <L y: Definición 5.11. Sea BO(x, y) la siguiente fórmula de LTC: ∃α[(x ∈ Lα ) ∧ (y ∈ / Lα )] ∨ (∃α)(∃w)[(w = Lmáx(ω,α+4) ) ∧ R(x, y, α, w)]. Sea bo(x, y) la fórmula de L correspondiente a la LTC-fórmula BO(x, y). Lema 5.12. Sea α > ω, α lı́mite y sean x, y ∈ Lα ; entonces ◦ ◦ BO(x, y) ⇔|=Lα bo(x, y). Demostración. En primer término demostraremos que BO(x, y) ⇔ BOLα (x, y) para que al aplicar el teorema 1.16 se pueda concluir que ◦ ◦ Observe que BO(x, y) ⇔|=Lα bo(x, y). ∃γ[(x ∈ Lγ ) ∧ (y ∈ / Lγ )] ∨ (∃γ)(∃w)[(w = Lmáx(ω,γ+4) ) ∧ R(x, y, γ, w)] es equivalente a (i) (∃γ ∈ Lα )[(x ∈ Lγ ) ∧ (y ∈ / Lγ )] ∨(∃γ ∈ Lα )(∃w ∈ Lα )[(w = Lmáx(ω,γ+4) ) ∧ R(x, y, γ, w)]. Esto se debe a que α es lı́mite y x, y ∈ Lα , por lo que los L-rangos de x y y son menores que α. También se usa el hecho de que α es mayor que ω. Pero más aún, dado que α es lı́mite mayor que ω, al aplicar el teorema 4.23 se deduce que para toda β < α (x = Lβ )Lα ⇔ (x = Lβ ). 663 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 664 ✐ ✐ 9. El universo construible De aquı́ que (i) sea equivalente a / Lγ )Lα ] (∃γ ∈ Lα )[(x ∈ Lγ )Lα ∧ (y ∈ ∨ (∃γ ∈ Lα )(∃w ∈ Lα )[(w = Lmáx(ω,γ+4) )Lα ∧ RLα (x, y, γ, w)], (recuerde que R(x, y, γ, w) es Σ0 ). Concluimos que BO(x, y) ⇔ BOLα (x, y). Por lo tanto, al aplicar el teorema 1.16 queda demostrado el lema. Con ayuda de este lema se puede definir un buen orden para cada Lα donde α es un ordinal lı́mite mayor que ω: Lema 5.13. Si α es un ordinal lı́mite mayor que ω y Bα = {(x, y) ∈ L2α :|=Lα ◦ ◦ bo(x, y)}, entonces ZF ⊢ Bα es un buen orden para Lα . Lema 5.14. ZF + V = L ⊢ ∀A∃R[(R ⊆ A × A) ∧ R bien ordena A]. Demostración. Sea A un conjunto, y entonces existe α lı́mite mayor que ω tal que A ∈ Lα . Luego, Bα ↾ A ⊆ A2 y dado que Lα es transitivo, también se tiene que Rα ↾ A bien ordena a A. Corolario 5.15. ZF + V = L ⊢ AE . Una aplicación más del teorema fundamental de modelos internos propicia el siguiente teorema (y su corolario): Teorema 5.16. ZF ⊢ AE L . Corolario 5.17. Con(ZF ) ⇒ Con(ZF + AE ). 664 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 665 ✐ ✐ Conjuntos y modelos. Curso avanzado 6. La hipótesis generalizada del continuo en L Para demostrar que en ZF es teorema HGC L , haremos uso (igual que en la sección anterior) del teorema fundamental de los modelos internos y demostraremos que HGC es teorema de ZFE +(V = L), es decir, demostraremos (suponiendo V = L) que para todo cardinal infinito κ, se cumple : Pot(κ) :≤ κ+ . Para lograrlo, es suficiente mostrar que dado un cardinal infinito κ, cualquier subconjunto de κ es un elemento de Lκ+ (véase el Lema 6.4). Ahora, la demostración de este lema se presenta sencilla, una vez que se han demostrado el lema de condensación y el lema 6.2. Teorema 6.1. (Lema de condensación). Sea α un ordinal lı́mite. Si X ≺1 Lα , entonces existen únicos π y β tales que β ≤ α y: (i) π : hX, ∈i ∼ = hLβ , ∈i; (ii) si Y ⊆ X y Y es transitivo, entonces π ↾Y = id ↾Y . Demostración. Primero demostraremos que si X es un conjunto que satisface las hipótesis del enunciado del teorema, entonces X es extensional, es decir, satisface el axioma de extensionalidad: Sean x, y ∈ X tales que x 6= y y Φ(v1 , v2 ) la siguiente fórmula Σ1 : Demostraremos que ∃z(z ∈ v1 ⇔ z 6∈ v2 ). ΦX (x, y). Dado que X ≺1 Lα , se cumple la siguiente equivalencia: ΦX (x, y) ⇔ ΦLα (x, y). Pero como Lα es transitivo, ΦLα (x, y), por lo que ΦX (x, y). Hemos demostrado que (∀x, y ∈ X)(x 6= y ⇒ (∃z ∈ X)(z ∈ x ⇔ z ∈ / y)), X que es equivalente a Ext . Una vez demostrado que X es extensional, mostraremos a continuación que se cumple el teorema para el caso en que α = ω: primero observe cómo es que haciendo una simple inducción sobre m ∈ ω, se puede demostrar que (∀m ∈ ω)(Lm ⊆ X). 665 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 666 ✐ ✐ 9. El universo construible Veamos: el caso en que m = 0 es directo (∅ ⊆ X). Ahora, sea x ∈ Lm+1 , entonces existen a1 , . . . , ak ∈ Lm tales que x = {a1 , . . . , ak }, pero por hipótesis de inducción a1 , . . . , ak ∈ X. Ahora, consideremos la fórmula Φ(v1 , . . . , vk ) de LTC, cuya definición es ∃x[(y1 ∈ x) ∧ · · · ∧ (yk ∈ x) ∧ (∀z ∈ x)[(z = y1 ) ∨ · · · ∨ (z = yk )]]. Dado que Φ es Σ1 y dado que X ≺1 Lα , tenemos la siguiente equivalencia: ΦX (a1 , . . . , ak ) ⇔ ΦLα (a1 , . . . , ak ), y como Lα es modelo del axioma de par, deducimos ΦLα (a1 , . . . , ak ). Podemos concluir que existe x ∈ X tal que x = {a1 , . . . , ak }, y como X es extensional, hemos demostrado que Lm+1 ⊆ X. Ahora, ya que mostramos que para toda m ∈ ω se cumple Lm ⊆ X, entonces es cierto que Lω ⊆ X. Por lo que si α = ω, se concluye que Lα ⊆ X ⊆ Lα . Ası́, para α = ω queda demostrado el teorema. De ahora en adelante supondremos que α > ω. Ya que X es extensional, podemos aplicar el lema del colapso (Lema 8.6.13) para concluir que existe una única clase transitiva M y un único π tal que (π : X ∼ = M) ∧ ∀Y [(Y ⊆ X ∧ Y es transitivo ) ⇒ π ↾ Y = id ↾ Y )]. A continuación demostraremos que M = Lβ para un (único) ordinal lı́mite β ≤ α: Observe que como la fórmula H(u, γ) que define la relación u = Lγ es ∆ZF 1 , el lema de contracción de cuantificadores asegura que existe una Σ0 -fórmula Φ(z, u, γ) de LTC tal que T = {Ex, Ext, Par} ⊢ ∀u∀γ(H(u, γ) ⇔ ∃zΦ(z, u, γ)). Luego, por el lema 8.2.2, y como Lα es modelo de T, H(u, γ) es absoluta para Lα si y sólo si ∃zΦ(z, u, γ) lo es. Pero como H(u, γ) es absoluta para Lα (pues 666 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 667 ✐ ✐ Conjuntos y modelos. Curso avanzado Lα es adecuado), se concluye que ∃zΦ(z, u, γ) también lo es. De tal modo, se obtiene la siguiente equivalencia: ∀u(∀γ < α)(H(u, γ) ⇔ u ∈ Lα ∧ (∃z ∈ Lα )ΦLα (z, u, γ)), lo cual implica que ∀γ < α(∃u, z ∈ Lα )ΦLα (z, u, γ). (1) Ahora, sea γ ∈ M tal que Or M (γ). Luego, Or X (π −1 (γ)), lo que implica que Or Lα (π −1 (γ)), de donde π −1 (γ) < α. Por (1) se concluye que existen u, z ∈ Lα tales que Φ(z, u, π −1 (γ)). De nuevo, haciendo uso del hecho de que X ≺1 Lα y aplicando el isomorfismo π, se concluye que (∃z, u ∈ M)ΦM (z, u, γ). Queda demostrado el siguiente hecho: (∀γ ∈ M)(∃z ∈ M)(∃u ∈ M)ΦM (z, u, γ). Pero como Φ es Σ0 y M es transitivo, lo que en realidad se tiene es que (∀γ ∈ M)(∃z ∈ M)(∃u ∈ M)Φ(z, u, γ), que por elección de Φ es equivalente a (∀γ ∈ M)(Lγ ∈ M). (2) Ahora, sea β = o(M) = OR ∩ M. Como M es transitivo, β ∈ OR; de aquı́ se sigue (usando [2]) que y, por lo tanto, (∀γ < β)(Lγ ∈ M) [ γ<β Lγ ⊆ M. A continuación demostraremos que β es un ordinal lı́mite y que la otra contención también es válida, para ası́ concluir que Lβ = M. S Primero observe que como Lα = γ<α Lγ y dado que ∃zΦ(z, u, γ) es absoluta para Lα , se tiene que (∀x ∈ Lα )[∃γ∃u∃zΦ(z, u, γ) ∧ x ∈ u)]Lα . Luego, aplicando π −1 y siguiendo el mismo proceso desarrollado arriba, se concluye que (∀x ∈ M)(∃γ ∈ M)(∃u ∈ M)(∃z ∈ M)[Φ(z, u, γ) ∧ x ∈ u)]Lα . 667 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 668 ✐ ✐ 9. El universo construible Otra vez, puesto que M es transitivo y que tanto Φ como x ∈ u son Σ0 , lo anterior implica que (∀x ∈ M)(∃γ ∈ M)(∃u ∈ M)(∃z ∈ M)[Φ(z, u, γ) ∧ x ∈ u)], de donde se concluye, por la elección de Φ, que (∀x ∈ M)(∃γ ∈ M)(x ∈ Lγ ). Pero por definición de β, (∀x ∈ M)(∃γ < β)(x ∈ Lγ ), lo que en otras palabras significa que M⊆ [ Lγ . γ<β Por último, demostraremos que Lím(β). Como Lím(α), entonces (∀γ < α)[∃λ(γ < λ)]Lα , lo que implica que (haciendo uso de los métodos ya conocidos), (∀γ ∈ M)[∃λ(γ < λ)]M , que por la elección que hicimos de β y por la absolutez de la fórmula γ < λ, se concluye que (∀γ < β)[(∃λ < β)(γ < λ)]Lα , por lo que Lím(β). En conclusión, M = Lβ . Hasta el momento hemos demostrado que π : hX, ∈i ∼ = hLβ , ∈i. con β ≤ α y π únicos. La parte (ii) del teorema se sigue directamente del teorema del colapso de Mostowski. Más adelante seguiremos usando los métodos de este importante teorema para demostrar, por ejemplo, la validez de ciertos principios en el universo L. 668 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 669 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 6.2. Sea α un ordinal lı́mite mayor que 0, sea X ⊆ Lα y sea M ⊆ Lα constituido por aquellos elementos de Lα que pueden definirse en Lα a partir de elementos de X (esto es, a ∈ M si y sólo si a es el único elemento de Lα tal ◦ que |=Lα φ(a) para alguna fórmula φ(v0 ) de LX ). Entonces, X ⊆ M ≺ Lα . Además, M es la mı́nima subestructura elemental de Lα que contiene a X. Demostración. Si α = ω, se pueden aplicar argumentos similares a los usados en la primera parte de la demostración del lema de condensación, para mostrar que M = Lα y que la única subestructura elemental de Lα es Lα mismo. Ası́ que en adelante se supondrá que α > ω. En primer lugar, para ◦ cada x ∈ X, x es definible en Lα por la fórmula x = v0 de LX ; ası́, X ⊆ M. Para demostrar que M ≺ Lα haremos uso del criterio TV de Tarski-Vaught (Teorema 5.6.21) para una subestructura elemental, es decir, demostraremos que para cualquier fórmula φ(v0 ) de LX , ◦ ◦ [|=Lα ∃xΦ(x)] ⇒ (∃x ∈ M)[|=Lα φ(x)]. Sean φ(v0 ) una fórmula de LX y ψ(v0 ) la fórmula de LX definida por ψ(v0 ) ≡ φ(v0 ) ∧ ∀v1 (v1 <L v0 ⇒ ¬φ(v1 )). ◦ ◦ Suponga que |=Lα ∃xφ(x), entonces |=Lα ∃xψ(x), pero además dicha x debe ser única en Lα , por lo que x ∈ M, pero en virtud de la definición de ψ(v0 ) también ◦ se tiene que para dicha x, |=Lα φ(x). Queda ası́ demostrado que M ≺ Lα . Para demostrar la mimimalidad de M, supondremos que X ⊆ N ≺ Lα y demostraremos que M ⊆ N. Sea x ∈ M, y entonces existe una fórmula ◦ φ(v0 ) de LX tal que |=Lα φ(x); además, x es el único elemento de Lα con esta propiedad. Luego, como M ⊆ Lα , lo anterior implica que |=Lα ∃v0 φ(v0 ). Pero como N es una subestructura elemental de Lα y x ∈ X ⊆ N, se cumple que |=N ∃v0 φ(v0 ). 669 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 670 ✐ ✐ 9. El universo construible ◦ Ası́, existe y ∈ N tal que |=N φ(y). Puesto que N ≺ Lα , lo anterior implica ◦ |=Lα φ(y). Pero se observó que x era el único en Lα con esta propiedad, ası́ que x = y. De ahí que x ∈ N. Corolario 6.3. Sean α un ordinal lı́mite (distinto de 0), X ⊆ Lα y M ≺ Lα definidos en el lema 6.2. Para dicha M se cumple |M| = máx(|X|, ω). Demostración. Como LX tiene máx(|X|, ω) fórmulas, es válido: |M| ≤ máx(|X|, ω). Pero por otro lado, también es cierto que máx(|X|, ω) ≤ |M|. Con ayuda de los resultados anteriores se puede establecer la esencia de la hipótesis generalizada del continuo en L: Lema 6.4. Suponga V = L. Sea κ un cardinal, si x es un subconjunto acotado de Lκ (es decir, existe α < κ tal que x ⊆ Lα ), entonces x ∈ Lκ . Demostración. Para κ ≤ ω el resultado es trivial, pues en ese caso Lκ = Vκ . Sean κ > ω, α < κ tal que ω ≤ α y x ⊆ Lα . Si λ es un ordinal lı́mite con κ ≤ λ y x ∈ Lλ , según el corolario anterior existe M ⊆ Lλ tal que M ≺ Lλ , Lα ∪ {x} ⊆ M y |M| = |Lα |. Ahora, por el lema de condensación, existe un único isomorfismo π : M ∼ = Lγ (para un único ordinal γ ≤ λ) tal que si Y ⊆ M es transitivo, entonces π ↾ Y = id ↾ Y . Ası́, como Lα ∪ {x} es un subconjunto transitivo de M, π(x) = x. Por lo tanto, x ∈ Lγ . Pero además |γ| = |Lγ | = |π[M]| = |M| = |Lα | = |α| < κ, de donde se concluye que γ < κ, y por lo tanto que x ∈ Lκ . Teorema 6.5. ZF + V = L ⊢ HGC . Demostración. Sean κ un cardinal infinito y x ⊆ κ. Como κ < κ+ , el lema anterior asegura que x ∈ Lκ+ . Ası́, Pot(κ) ⊆ Lκ+ . De aquí se concluye que ∀κ(2κ ≤ |Lκ+ | = κ+ ). Una vez más, mediante el lema fundamental de modelos internos, se obtienen los siguientes corolarios: Corolario 6.6. ZF ⊢ HGC L . 670 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 671 ✐ ✐ Conjuntos y modelos. Curso avanzado Corolario 6.7. Si ZF es consistente, también lo es ZF + HGC . Por último, el siguiente teorema establece que bajo la hipótesis del axioma de constructibilidad (y con ayuda de varios lemas demostrados hasta el momento), existe una gran cantidad de estratos de la jerarquı́a construible de conjuntos que son modelos de ZF − . Teorema 6.8 (V = L). Si κ es un cardinal regular no numerable, entonces la estructura hLκ , ∈i es modelo de los axiomas de ZF − . Demostración. La demostración del teorema estará referida a la demostración del teorema 2.3, en el cual se probó que L es un modelo interno de ZF . Los axiomas de extensionalidad y fundación se cumplen en Lκ , pues esta estructura es transitiva y estándar. La demostración de que los axiomas de par y unión se cumplen en Lκ es la misma que las respectivas en el teorema 2.3; solamente es necesario cambiar las apariciones de L por Lκ . Observe que esto es posible dado que κ es un ordinal lı́mite. El axioma de infinito se cumple en Lκ pues κ es no numerable, lo cual implica que ω ∈ Lκ . Para demostrar los axiomas de comprensión y reemplazo relativizados a Lκ , es necesario observar, primero, que dado que κ es un cardinal regular, se cumple en Lκ la siguiente propiedad: ∀X(X ∈ Lκ ⇔ X ⊂ Lκ ∧ |X| < κ). Este hecho es cierto debido a la regularidad de κ por el lema 6.4, pues si X es un subconjunto de Lκ , cuya cardinalidad es menor que κ, entonces existe α < κ tal que X ⊆ Lα (aquı́ se usa la regularidad de κ). Luego, haciendo uso del lema 6.4, se concluye que X ∈ Lκ (observe que aquı́ se hace uso del axioma de constructibilidad). Por otro lado, si X ∈ Lκ , entonces X ∈ Lα para algún α < κ, y por lo tanto la cardinalidad de X es menor que κ. Por último, es claro que la transitividad de Lκ implica que X ⊂ Lκ . Ası́, con ayuda de esta afirmación, demostramos el axioma de comprensión relativizado a Lκ . Se debe demostrar que para toda fórmula Φ(u,~v), es cierta la afirmación ~ )))]Lκ . [∀~ p∀x∃y∀z((z ∈ y) ⇔ ((z ∈ x) ∧ Φ(z, p 671 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 672 ✐ ✐ 9. El universo construible ~ , x ∈ Lκ . Puesto que L es modelo de comprensión, sabemos que Sean pues p existe y ∈ L tal que ~ )]L }. y = {z ∈ x : [φLκ (z, p Pero como el corolario al lema 4.12 asegura que Lκ es absoluto para L, se cumple ~ )}. y = {z ∈ x : φLκ (z, p Para terminar la demostración, sólo falta mostrar que y ∈ Lκ . Aquı́ es donde hacemos uso de la afirmación mencionada: como y ⊆ Lκ y la cardinalidad de y es menor o igual que la de x, cuya cardinalidad es menor que κ (pues x ∈ Lκ ), la cardinalidad del subconjunto y de Lκ es menor que κ, y se concluye que y ∈ Lκ . Para el caso del axioma de reemplazo, se debe demostrar que para cualquier ~ ) de LTC: fórmula Φ(u, v, w ~ ) ∧ ∀w(Φ(u, w, p ~ ) ⇒ v = w) p[∀u∃v[Φ(u, v, p [∀~ ~ )]]Lκ . ⇒ ∀x∃y(∀u ∈ x)(∃v ∈ y)Φ(u, v, p Suponga que ~ ) ∧ ∀z(Φ(x, z, p ~ ) ⇒ y = z))]Lκ , [∀~ p[∀x∃y(Φ(x, y, p ~ , x ∈ Lκ . Si definimos y sean p ~ )}, y = {v ∈ Lκ : (∃u ∈ x)ΦLκ (u, v, p ~ )). Sólo hace falta demostrar que y ∈ Lκ ; entonces (∀u ∈ x)(∃v ∈ y)ΦLκ (u, v, p para lograr esto se debe observar que, al igual que en el caso anterior, y es un subconjunto acotado de Lκ y por lo tanto (Lema 6.4) pertenece a Lκ . 7. Algunos principios combinatorios en L Presentamos tres pruebas de consistencia relativa. De ellas concluiremos que en ZF no se pueden refutar los principios combinatorios ♦, ♦+ y ♦∗ . Para iniciar con las pruebas de consistencia relativa necesitamos de algunos resultados ligados a los lemas 6.2, 6.4 y al teorema 6.8. Lema 7.1 (V = L). Si M ≺ Lω1 , entonces M es transitivo. 672 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 673 ✐ ✐ Conjuntos y modelos. Curso avanzado S Demostración. Sea x ∈ M; ası́, x ∈ Lω1 = γ<ω1 Lγ , lo cual implica que x ∈ Lγ para algún γ < ω1 . Luego, como |Lγ | ≤ |γ| + ω y Lγ es transitivo, x es a lo sumo numerable, y existe cuando menos una función suprayectiva de ω sobre x. Sea f la <L -mı́nima de tales funciones. Observe que f ⊆ Lβ (con β = máx{ω, γ}) y que dicha β < ω1 . El lema 6.4 asegura que f ∈ Lω1 , y si F (f ) es la fórmula f es una función suprayectiva de ω sobre x, entonces F (f ) se puede expresar en el lenguaje Lω1 mediante una fórmula Σ0 , cuya única constante es x0 , y además la función f (definida arriba) satisface dicha definición. Ası́, como M ≺ Lω1 y x ∈ M, se tiene que f ∈ M. Pero, más aún, f (n) ∈ M (para cada n ∈ ω), pues ω ⊆ M. Se concluye que f [ω] = x ⊆ M, es decir, M es transitivo. Lema 7.2 (V = L). Si M ≺ Lω1 , entonces M = Lα para algún α ≤ ω1 . Demostración. El lema de condensación asegura que existen α y π únicos tales que π : M ∼ = Lα , con α ≤ ω1 . El lema anterior asegura que con nuestras hipótesis, M debe ser transitivo; y M ⊆ Lα , y como π es la identidad cuando se le restringe a conjuntos transitivos, se concluye que M = Lα . Lema 7.3 (V = L). Si κ es un cardinal mayor que ω1 y M ≺ Lκ , entonces existe α ≤ ω1 tal que M ∩ Lω1 = α. Demostración. Primero observe que ω1 ∈ M, pues ω1 ∈ Lκ y ω1 es definible por la fórmula biy biy (∀x ∈ u)(∃f (f : ω − → x)) ∧ ¬∃f (f : ω − → u). Ası́, ω1X = ω1Lκ = ω1 . De igual manera, Lω1 ∈ M, pues la fórmula H(ω1 , x) ≡ x = Lω1 ) es absoluta para M, Lκ y el teorema 4.23 asegura que Lκ H(ω1 , x) es absoluta para Lκ ; ası́, LM ω1 = Lω1 = Lω1 . Deducimos M ∩ Lω1 = {x ∈ M : (x ∈ Lω1 )M }. Luego, si φ(~x) es una fórmula de LTC y ~x ∈ M ∩ Lω1 , entonces φ(~x)Lω1 ⇔ (φ(~x)Lω1 )Lκ ; además, dado que M es una subestructura elemental de Lκ , se satisface (φ(~x)Lω1 )Lκ ⇔ (φ(~x)Lω1 )X . 673 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 674 ✐ ✐ 9. El universo construible Pero, según la observación de arriba, esta última fórmula es equivalente a φ(~x)M∩Lω1 . Por lo tanto, es cierto que M ∩ Lω1 es una subestructura elemental de Lω1 . Si se aplica este último hecho al lema 7.2, se concluye que existe α ≤ ω1 tal que M ∩ Lω1 = Lα . Teorema 7.4. El axioma de constructibilidad implica el principio diamante (V = L ⇒ ♦). Demostración. Por recursión sobre α < ω1 , definimos la siguiente ω1 sucesión de parejas de subconjuntos de ω1 : 1. (S0 , C0 ) = (∅, ∅); 2. (Sα+1 , Cα+1 ) = (α + 1, α + 1); 3. Si α es lı́mite, definimos (Sα , Cα ) como la <L -mı́nima pareja (S, C) tal que (a) S ⊆ α, (b) C es un club de α, (c) (∀ψ ∈ C)(S ∩ ψ 6= Sψ ). En caso de que dicha pareja no exista se define: (Sα , Cα ) = (α, α). Afirmamos que la sucesión hSα : α < ω1 i es una ♦-sucesión (es decir, es la sucesión de la cual asegura su existencia el principio ♦). Demostraremos esta afirmación por reducción al absurdo. Se supone la existencia de un conjunto X ⊆ ω1 y un club C ⊆ ω1 en ω1 tal que (∀α ∈ C)(X ∩ α 6= Sα ). Sea pues (X, C) la <L -mı́nima pareja con dicha propiedad. Observe que la sucesión h(Sα , Cα ) : α < ω1 i se define en Lω2 por la fórmula H(f ): (f es una función ) ∧ (dom(f ) = ω1 ) ∧ (rango(f ) ⊆ ω1 × ω1 ) ∧ (f (∅) = (∅, ∅)) ∧ (∀α ∈ ω1 )[(sucesor(α) ⇒ f (α) = (α, α)) ∧ (lím(α) ∧ ∃S∃C((S, C) ⊆ α × α ∧ clubα (C) ∧ (∀γ < α)(γ ∈ C ⇒ S ∩ γ 6= f (γ))) ⇒ ∃Ŝ∃Ĉ((Ŝ, Ĉ) ⊆ α × α ∧ clubα (Ĉ) 674 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 675 ✐ ✐ Conjuntos y modelos. Curso avanzado ∧ (∀γ < α)(γ ∈ Ĉ ⇒ Ŝ ∩ γ 6= f (γ))) ∧ f (α) = (Ŝ, Ĉ) ⇒ (f (α) <L (S, C))) ∧ (lím(α) ∧ ¬(∃S∃C((S, C) ⊆ α × α ∧ clubα (C) ∧ (∀γ < α)(γ ∈ C ⇒ S ∩ γ 6= f (γ))) ⇒ (f (α) = (α, α))]. De igual manera es fácil ver que la pareja (X, C) también es definible en Lω2 . Sea M un conjunto numerable tal que ω1 ∈ M y M ≺ Lω2 (el Lema 6.2 y su Corolario 6.3 garantizan la existencia de dicha subestructura). Luego, el lema de condensación asegura que existe un único β ≤ ω2 y un único isomorfismo π : hM, ∈i − → hLβ , ∈i (observe que el ordinal β debe ser menor que ω1 , pues M es numerable). El lema 7.3 sostiene que existe α ≤ ω1 tal que M ∩Lω1 = Lα (aquı́ se usa la hipótesis: V = L); ası́, M ∩ ω1 = α, y este ordinal α debe ser el mı́nimo ordinal numerable que no está en M. Por lo tanto, π(ω1 ) = α; además, como Lα ⊆ M es transitivo, para todo x ∈ Lα , π(x) = x. Más aún: π(X) = X ∩ α, π(C) = C ∩ α, π(hSγ : γ < ω1 i) = hSγ : γ < αi, π(hCγ : γ < ω1 i) = hCγ : γ < αi. Como mencionamos antes, la pareja (X, C) es definible en Lω2 ; ası́: Lω2 |= (X, C) es la <L -mı́nima pareja de subconjuntos de ω1 con la propiedad “C es un club en ω1 y (∀γ ∈ C)(X ∩ γ 6= Sγ )”. Por la elección de M, la siguiente afirmación es válida: M |= “(X, C) es el <L -mı́nimo par de subconjuntos de ω1 tal que C es un club en ω1 y (∀γ ∈ C)(X ∩ γ 6= Sγ )”. Dadas las características del isomorfismo π, se concluye que Lβ |= “(X ∩ α, C ∩ α) es la <L -mı́nima pareja de subconjuntos de α tal que C ∩ α es un club en α y (∀γ ∈ (C ∩ α))((X ∩ α) ∩ γ 6= Sγ )”. En consecuencia, la absolutez de la definición de (X, C) y de la definición de (Sα , Cα ) implican que X ∩ α = Sα y C ∩ α = Cα , 675 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 676 ✐ ✐ 9. El universo construible puesto que Lβ |= C ∩ α es no acotado en α. C ∩ α es en realidad no acotado en α; esto implica, en vista de que C es cerrado en ω1 , que α ∈ C. Por definición de la pareja (X, C), X ∩ α 6= Sα , concluimos la contradicción: (X ∩ α 6= Sα ) ∧ (X ∩ α = Sα ). Corolario 7.5. La consistencia de la teorı́a ZFE + HGC + (V = L) + ♦ se obtiene de la consistencia de la teorı́a ZF . Teorema 7.6. El axioma de constructibilidad implica el principio ♦∗ (V = L ⇒ ♦∗ ). por Demostración. Considere la siguiente función f : ω1 − → ω1 , definida f (α) = mín{γ < ω1 : (γ > α) ∧ (|=Lα α es numerable)}. Luego, para cada α < ω1 , se define una ω1 -sucesión hSα : α < ω1 i dada por Sα = Pot(α) ∩ Lf (α) . Observe que, como |Lf (α) | = |f (α)| < ℵ1 , para cada α < ω1 , Sα es un subconjunto numerable de Pot(α). A continuación demostraremos que la sucesión hSα : α < ω1 i es una ♦∗ -sucesión. Sea X ⊆ ω1 . El lema 6.4 implica que X ∈ Lω2 . Ahora, el corolario 6.3 asegura que ({X} es un subconjunto de Lω2 ) existe una subestructura elemental M de Lω2 , mı́nima, que contiene a {X} (es decir, que X ∈ M) y con la propiedad |M| = máx(|{X}|, ω) = ℵ0 . Definimos, por recursión sobre ω1 , una sucesión hNν : ν < ω1 i de subestructuras elementales de Lω2 : (i) N0 = M (la estructura M mencionada arriba). (ii) Definimos Nν+1 (en términos del Lema 6.2 y el Corolario 6.3) como la mínima subestructura elemental de Lω2 , tal que Nν ∪ {Nν } ⊆ Nν+1 . (iii) Si δ es lı́mite, definimos: Nδ = S ν<δ Nν . Observe que al igual que N0 , el cardinal de todas las subestructuras Nν es ℵ0 . Ası́, el lema 7.3 asegura que para cada ν < ω1 , existe αν tal que Nν ∩ Lω1 = Lαν . 676 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 677 ✐ ✐ Conjuntos y modelos. Curso avanzado Por lo tanto, Nν ∩ ω1 = αν . Note que αν < ω1 , pues según el lema 7.3, ω1 ∈ Nν . Además, αν es el primer cardinal numerable que no está en Nν . Afirmamos que el conjunto C = {αν : ν < ω1 } es el club de ω1 que buscamos. Primero debemos demostrar que C es en realidad un club de ω1 . El conjunto C es cerrado: sea γ un punto lı́mite de C, es decir, γ < ω1 lı́mite tal que [ (C ∩ γ) = γ. Para γ se cumple [ αν = γ. αν <γ Por otro lado, la construcción de las subestructuras Nν y la definición de los ordinales αν garantizan que αγ = [ αν . [ αν = γ ≤ αγ . ν<γ Por último, dado que para cada ν < ω1 , ν < αν , concluimos que αγ = [ ν<γ αν ≤ αν <γ Es decir, γ = αγ y, por lo tanto, γ ∈ C. El hecho de que C sea no acotado se sigue trivialmente de la observación de que para toda ν < ω1 , ν ≤ αν . Ahora demostramos que C es el club que buscamos, es decir, mostramos que para toda α ∈ C, X ∩ α ∈ Sα : sea pues α ∈ C. Existe ν < ω1 tal que αν = α y para dicha ν, el lema de condensación asegura que existen β ≤ ω2 y un isomorfismo: π : Nν ∼ = Lβ , con las siguientes propiedades: π ↾ αν = id ↾ αν , π(ω1 ) = αν , π(X) = X ∩ αν . Por lo tanto, X ∩ αν ∈ Lβ . Pero la definción de la función f asegura que |=Lf (αν ) αν es numerable. L Por otro lado, como π(ω1 ) = αν (es decir, ω1 β = αν ), se tiene que |=Lβ αν es no numerable, 677 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 678 ✐ ✐ 9. El universo construible ası́ que Lβ debe estar contenido propiamente en Lf (αν ) (pues la relación “no numerable” es D-absoluta). Por lo tanto, β < f (αν ), y como X ∩ αν ∈ Lβ , entonces X ∩ αν ∈ Lf (αν ) . Puesto que X ∩ αν ∈ Pot(αν ), de la definición de Sαν se sigue que X ∩ αν ∈ Sαν . Teorema 7.7. El axioma de constructibilidad implica el principio ♦+ . (V = L ⇒ ♦+ ). Demostración. Sea f : ω1 − → ω1 una función definida por f (α) = mín{γ : (α < γ), (α ∈ Lγ ), (Lγ ≺ Lω1 )}. Definimos, para cada α < ω1 , el conjunto Sα mediante Sα = Pot(α) ∩ Lf (α) . En primer lugar, se debe observar que las definiciones anteriores llevan a que estos mismos conjuntos (f y Sα , respectivamente) estén en Lω2 (pues estas definciones pueden ser expresadas por fórmulas absolutas cuyos parámetros claramente están en Lω2 ). Demostraremos a continuación que la sucesión hSα : α < ω1 i es una ♦+ -sucesión. Supongamos, por el contrario, que existe X ⊆ ω1 tal que para todo club C de ω1 existe α ∈ C para el que no se cumple (X ∩ α ∈ Sα ) ∧ C ∩ α ∈ Sα ). Sea X el <L -mı́nimo conjunto con la propiedad. (Observe que el conjunto X también puede definirse en Lω2 a partir de esta misma definición.) A continuación definiremos, por recursión sobre ω1 , una familia de subestructuras elementales de Lω2 : (i) Definimos N0 como la mı́nima subestructura elemental de Lω2 . (ii) Se define Nν+1 como la mı́nima subestructura elemental de Lω2 tal que Nν ∪ {Nν } ⊆ Nν+1 . (iii) Si δ es lı́mite Nδ = S ν<δ Nν . Al igual que en la demostración del teorema 7.6, se prueba que las estructuras Nν son todas numerables, y, de igual manera, el lema 7.3 asegura que para cada ν < ω1 existe αν < ω1 , con αν = Nν ∩ ω1 , y αν es el mı́nimo ordinal numerable que no está en Nν . Ahora, de acuerdo con el lema de condensación, para cada ν < ω1 existe un único ordinal βν y un único isomorfismo πν : Nν ∼ = Lβν tal que 678 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 679 ✐ ✐ Conjuntos y modelos. Curso avanzado πν (ω1 ) = αν , y πν (X) = X ∩ αν . Sea B = {βν : ν < ω1 }. Como B es no acotado en ω1 (para cada ν < ω1 , se tiene que ν ≤ αν < βν ), el conjunto formado por los puntos lı́mite de B es un club de ω1 . Llamamos C a dicho conjunto y demostramos que C es un contraejemplo a nuestra hipótesis hecha por reducción al absurdo. Es decir, demostraremos que (∀α ∈ C)((X ∩ α ∈ Sα ) ∧ (C ∩ α ∈ Sα )). Sea α ∈ C. Debido a la definición de C, existe un ordinal lı́mite γ < ω1 tal que α= [ βν . ν<γ Pero además, α = αγ : Primero observe que αν < βν (para toda ν < ω1 ), pues πν (ω1 ) = αν ∈ Lβν . Por otro lado, observe que para cualquier ν < ω1 la definición de Lβν está dada en términos de Nν , y dicha definición es absoluta para Lω2 . Ası́, como Nν+1 es una subestructura elemental de Lω2 y Nν ∈ Nν+1 , el axioma de comprensión en Lω2 asegura que βν ∈ Nν+1 y, por lo tanto, βν < αν+1 . Hemos concluido, que para toda ν < ω1 , αν < βν < αν+1 . Por lo tanto, tomando supremos para ν < γ, se concluye que αγ ≤ α ≤ αγ . Es decir, hemos demostrado que α = αγ . Ahora, aplicando un argumento similar al usado en la demostración del teorema 7.6, se puede concluir que βγ < f (α) pues dado que Lβ |=Lf (α) α es numerable y que α = αγ = ω1 γ , se debe cumplir que Lf (α) contiene propiamente a Lβγ ; en consecuencia, βγ < f (α). De α = αγ se sigue que X ∩ α = πγ (X) ∈ Lβγ . Debido a que βγ < Lf (α) , podemos concluir (X ∩ α) ∈ (Lf (α) ∩ α) = Sα . Ahora, para demostrar que C ∩ α ∈ Sα , claramente es suficiente mostrar que {βν : ν < ω1 } ∈ Lf (α) . 679 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 680 ✐ ✐ 9. El universo construible Para probarlo hacemos uso del teorema 6.8, para ası́ poder afirmar que Lf (α) es modelo de ZF − . En vista de que Lf (α) es modelo de ZF − , se puede definir dentro de Lf (α) una sucesión hMν : ν < γi de subestructuras elementales de Lβν (en adelante se considera la igualdad β = βγ ) de la siguiente manera: (i) M0 es la mı́nima subestructura elemental de Lβ ; (ii) Mν+1 es la mı́nima subestructura elemental M de Lβ tal que Mν ∪ {Mν } ⊆ Mν+1 ; S (iii) si δ es lı́mite, Mδ = ν<δ Mν . Aun dentro de Lf (α) , se puede hacer uso del lema de condensación en Lf (α) y definir (para cada ν < γ) los isomorfismos: π ′ : Mν ∼ = Lβ′ . ν ν Dado que la sucesión de estructuras Mν y de isomorfismos πν′ está definida en Lf (α) , se cumple que hβν′ : ν < γi ∈ Lf (α) . Lo que a continuación queremos demostrar es que βν′ = βν , y concluir que {βν : ν < γ} ∈ Lf (α) . Observe que Nν ≺ Nγ ≺ Lω2 (para ν < γ), por lo que es posible redefinir el primer γ-segmento de la sucesión hNν : ν < γi en términos de Nγ en lugar de Lω2 . Es decir, se puede redefinir que (i) N0 es la mı́nima subestructura elemental de Nγ ; (ii) Nν+1 es la mı́nima subestructura elemental N de Nγ tal que Nν ∪{Nν } ⊆ Nν+1 ; S (iii) si δ es un ordinal lı́mite menor que γ, Nδ = ν<δ Nν . A partir del isomorfismo πγ ∼ = Lβ se puede demostrar, por inducción sobre γ, que πγ ↾ Nν : Nν ∼ = Mν . Luego, a partir de la sucesión de isomorfismos: π −1 : Lβ ∼ = Mν , π ν ↾−1 Nν πν′ ν : Mν ∼ = Nν , ∼ : Nν = Lβ′ . ν podemos concluir que −1 ∼ (πν′ ◦ π ↾−1 Nν ◦πν ) : Lβν = Lβν′ , 680 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 681 ✐ ✐ Conjuntos y modelos. Curso avanzado es decir, que las estructuras transitivas Lβν′ y Lβν son isomorfas. Por lo tanto, el segundo teorema del isomorfismo 6.10 asegura que Lβν′ = Lβν y finalmente, βν = βν′ para cada ν < γ. 8. Aplicaciones En el capítulo 7 estudiamos el problema de Souslin principalmente en términos de árboles. A continuación presentamos una solución en su formulación original. Teorema 8.1 (V=L). Existe un conjunto linalmente ordenado (Y, ≤) con las siguientes propiedades: (i) ≤ es un orden lineal denso sin extremos. (ii) Y satisface la propiedad de Souslin. (iii) (Y, ≤) no es isomorfo a R. En lo inmediato probaremos este teorema, pero primero requerimos algunos resultados auxiliares. Notemos que el siguiente resultado implica el teorema 8.1 en donde consideramos que todo conjunto parcialmente ordenado es un espacio topológico con la topología del orden. Lema 8.2 (V=L). Existe un conjunto linealmente ordenado (X, ≤) tal que (i) ≤ es un orden lineal denso sin extremos; (ii) todo subconjunto de X cerrado y denso en ninguna parte es numerable; (iii) X no es separable, es decir, no tiene un subconjunto denso numerable. Demostración del teorema 8.1 a partir del lema 8.2. Sea (X, ≤) como en el lema 8.2 y (Y, ≤) su compleción de Dedekind. Es inmediato que Y satisface (i) y (iii) del teorema 8.1. Supongamos que falla la condición 8.1(ii). Se sigue que X no satisface la propiedad de Sosulin. Sea entonces {(ai , bi ) : i ∈ I} una familia no numerable de intervalos abiertos ajenos entre sí de X. Por el principio máximo de Hausdorff (o el lemaSde Zorn), podemos suponer que esta familia es máxima. Hacemos K = X − i∈I (ai , bi ). K es cerrado y denso en ninguna parte en X, pero {ai : i ∈ I} ⊆ K así que K es no numerable, lo que viola 8.2(ii). Por lo tanto, Y satisface las condiciones 8.1(i)–(iii). Suponga que no se satisface 8.1(iv), y entonces (Y, ≤) es isomorfo a R. En consecuencia, X es 681 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 682 ✐ ✐ 9. El universo construible isomorfo a un subespacio de R, lo que implica que X es separable, contrario a 8.2(iii). Supongamos V = L y construyamos por inducción un conjunto ordenado (X, ≤) como en 8.2. Por supuesto, el orden en los puntos de X es el importante, no su naturaleza, por lo que podemos considerar que X es el conjunto ω1 . Definimos primero el orden en ω y lo extendemos a ω + ω, posterioriormente a ω + ω + ω, y así sucesivamente. En lo sucesivo α y β denotan ordinales límite menores que ω1 . Por inducción sobre α definimos un orden <∗α en α con las siguientes propiedades: (i) <∗α es un orden lineal denso sin puntos extremos; (ii) si α < β, entonces <∗α =<∗β ∩(α × α). Para comenzar tomamos <∗ω como cualquier orden de ω isomorfo a Q. Si β S es el límite de un conjunto de ordinales límite, hacemos <∗β = α<β <∗α que por S (ii) satisfará (i) y (ii). Una vez que hemos terminado definimos <∗ = α<ω1 <∗α para obtener el orden requerido en ω1 (es decir en X). Es inmediato que <∗ satisface la condición 8.2(i). Así que debemos definir <∗β+ω a partir de <∗β asegurando en cada caso que se cumplen 8.2(ii) y (iii). Asegurar que 8.2(iii) se cumple es fácil; basta evitar que para ninguna β < ω1 ocurra que β es denso en (ω1 , <∗ ): como cf (ω1 ) = ω1 , si A ⊆ ω1 es numerable, entonces A ⊆ β para alguna β < ω1 , así que si A fuera denso en (ω1 , <∗ ), β sería denso en (ω1 , <∗ ). En resumen, el problema es lograr que β no sea denso en (ω1 , <∗β ). Supongamos que queremos definir <∗β+ω a partir de <∗β . Sea Dβ una cortadura de Dedekind propia en (β, <∗β ) (es decir, un segmento inicial propio de (β, <∗β ) sin cota superior mínima). Como (β, < β∗ ) es numerable y un orden lineal denso, es isomorfo a Q por el teorema de Cantor, por lo que no tendremos dificultad en encontrar tal Dβ . Definimos <∗β+ω ordenando los ordinales β + n (n ∈ ω) en forma isomorfa a Q y ponemos esta copia de Q donde está el hueco en la parte superior de Dβ . En consecuencia, para cada n ∈ ω tendremos Dβ <∗β+ω β + n <∗β+ω β − Dβ . Por lo tanto, β no será denso en β + ω y, por supuesto, tampoco en ω1 . Ahora mostramos que después de escoger las cortaduras Dβ cuidadosamente, podemos asegurar que 8.2(ii) se cumple. La idea es aplicar el teorema 682 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 683 ✐ ✐ Conjuntos y modelos. Curso avanzado de categoría de Baire para evadir ciertos conjuntos cerrados y densos en ninguna parte. Precisemos estas ideas. Sean E un subconjunto cerrado y denso en ninguna parte de Q, y D una cortadura de Dedekind propia en Q. Decimos que D evita K si existen números racionales a < b con a ∈ D y [a, b] ∩ K = ∅. Lema 8.3. Sean Kn (n ∈ N) subconjuntos de Q cerrados y densos en ninguna parte. Existe una cortadura de Dedekind propia que evita cada Kn . Demostración. Se trata realmente de un caso particular del teorema de Baire. Las cerraduras de los conjuntos Kn en R son cerrados y densos en ninguna parte; así que existe un número irracional x que no pertenece a la cerradura de ninguno de los conjuntos Kn . Tomemos como D la cortadura definidad por x. Como (β, <∗β ) es isomorfo a Q, el lema 8.3 es adecuado para este orden. Debemos especificar qué subconjuntos de β cerrados y densos en ninguna parte queremos evitar. Aquí aparece la necesidad de un principio de predicción, por lo que aprovechamos la hipótesis V = L para usar el principio ♦. Sea {Sα : α < ω1 } una ♦-sucesión. Para definir <∗β+ω usamos 8.3 para obtener Dβ y evitar todos los conjuntos Sα , α ≤ β que sean subconjuntos de β cerrados y densos en ninguna parte. Una vez que hemos completado la definición del conjunto ordenado, falta sólo probar que es el que 8.2 reclama. Solamente debemos verificar 8.2(ii), en vista de nuestras observaciones previas. Sea K ⊆ ω1 un subconjunto cerrado y denso en ninguna parte en (ω1 , <∗ ). Debemos probar que K es numerable. Queremos encontrar un ordinal numerable α para el cual K = K ∩ α. Para ello utilizamos ♦. Escogemos un club C ⊆ ω1 adecuado y elegimos α ∈ C para el cual K ∩ α = Sα ; ahora estamos en posición de encontrar α. Definamos dos funciones f, g : ω1 − → ω1 de tal suerte que para cada ν ∈ ω1 − K, f (ν) <∗ ν <∗ g(ν) y (f (ν), g(ν))∗ ∩ K = ∅. 683 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 684 ✐ ✐ 9. El universo construible También definimos dos funciones h, k : ω1 × ω1 − → ω1 con la propiedad de que siempre que ν <∗ τ, h(ν, τ), k(ν, τ) ∈ (ν, τ)∗ ; h(ν, τ) ∈ / K; k(ν, τ) ∈ K siempre que K ∩ (ν, τ)∗ 6= ∅. Sea C = {α ∈ ω1 : Lím(α), ∀ ν < α(f (ν) < α, g(ν) < α)), ∀ ν, τ < α(h(ν, τ) < α, h(ν, τ) < α)}. Lema 8.4. (i) C es un club en ω1 ; (ii) si α ∈ C, entonces α es un ordinal límite; (iii) K ∩ α es cerrado y denso en ninguna parte en α para cada α ∈ C. Demostración. (i) y (ii) son inmediatos de la definición de C. Para probar (iii), si α ∈ C y puesto que C es cerrado respecto a f y g, K ∩ α es denso en ninguna parte en α. Por ♦ fijemos un ordinal α ∈ C tal que K ∩ α = Sα . Lema 8.5. Sea β ≥ α. Entonces (i) K ∩ β = K ∩ α, (ii) si α ∈ β − K, existen ν, τ ∈ α con ν <∗ γ <∗ y (ν, τ)∗ ∩ K = ∅. Demostración. Por inducción sobre β. Para β = α usamos la cerradura de α respecto a f y g, mientras que la etapa inductiva en etapas límite es trivial. Supongamos que el resultado es cierto para β. Lo probaremos para β + ω. Por la hipótesis de inducción, Sα = K ∩β es cerrado y denso en ninguna parte en β, así que por construcción Dβ evita Sα . Entonces existen α <∗ γ < γ ′ en β tales que [γ, γ ′ ] ∩ K ∩ β = ∅ y todos los ordinales β + n(n ∈ ω) pertenecen a (γ, γ ′ ). Sean ν, τ, ν′ , τ ′ < α de acuerdo en el inciso (ii) de la hipótesis de inducción (es decir, parte (ii) del lema) aplicada a γ y γ ′ respectivamente. Entonces (ν, τ ′ ) ∩ K ∩ α = ∅, por lo que α es cerrado respecto a κ, (ν, τ ′ )∗ ∩ K = ∅. Pero como todos los ordinales β + n (n ∈ ω) están en (ν, τ ′ )∗ , (i) y (ii) se siguen inmediatamente en β + ω. 684 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 685 ✐ ✐ Conjuntos y modelos. Curso avanzado S Por (i) del lema 8.5 tenemos K = β (K ∩ β) = K ∩ α. Por consiguiente, K ⊆ α. En particular, K es numerable. Con esto terminamos la prueba del lema 8.2. 9. Un ejemplo en teoría de la medida En esta sección investigaremos el siguiente problema: ¿Existe un conjunto no numerable X y una medida definida en Pot(X)? Por supuesto, es suficiente considerar números cardinales κ en lugar de un conjunto arbitrario X. En lo sucesivo entendemos que una medida en un cardinal κ es una medida definida en todos los subconjuntos de κ. Sean µ una medida en un cardinal no numerable κ y λ un cardinal no numerable. Decimos que µSes λ-aditiva si para toda familia {Aν : ν < λ} de conjuntos de medida cero, ν<λ Aν tiene medida cero. Así que por definición, toda medida es ℵ1 -aditiva. Supongamos que µ es una medida en un cardinal no numerable κ. Claramente existe un cardinal más grande λ tal que µ es λ-aditiva. Por lo anterior, λ ≥ ℵ1 y como κ es la unión de singuletes, λ ≤ κ. Por definición de λ, existe un conjunto A ⊆ κ de medida positiva que es la unión de λ conjuntos disjuntos de medida cero: [ A= Aν . µ<λ → λ mediante f (a) = ν si y sólo si a ∈ Aν . Definimos una función f : A − Para B ⊆ λ, hacemos µ(f −1 [B]) σ(B) = . µ(A) Se verifica fácilmente que σ es una medida λ-aditiva en λ. Por lo tanto, definimos una medida µ en un cardinal κ como fuerte si es κ-aditiva; hemos probado el siguiente lema: Lema 9.1. Supongamos que para algún cardinal no numerable existe una medida definida en todos los subconjuntos de κ. Entonces existe un cardinal no numerable λ ≤ κ con una medida fuerte definida en todos sus subconjuntos. En consecuencia, para demostrar que en ningún cardinal no numerable existe una medida (definida en todos sus subconjuntos), es suficiente mostrar que en ningún cardinal inumerable existe una medida fuerte. Como primera etapa demostraremos que si existe una medida fuerte en el cardinal inumerable 685 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 686 ✐ ✐ 9. El universo construible κ, entonces κ es un cardinal inaccesible. Recordemos que un cardinal inaccesible es un cardinal regular y límite. Fijemos una medida fuerte µ en un cardinal no numerable κ. Lema 9.2. Si ξ < κ, entonces {α : α < ξ} tiene medida cero. Demostración. Se sigue de que µ es fuerte. Lema 9.3. κ es regular. Demostración. Supongamos lo contrario. Entonces existen λ < κ y ordinales κν < κ, ν < λ tales que κ= [ κν . ν<λ Pero, por el lema 9.2, µ(κν ) = 0 para toda ν < λ. Como µ es fuerte, obtenemos µ(κ) = 0, una contradicción. Decimos que µ es normal si siempre que B ⊆ κ tiene medida positiva y f :B− → κ es tal que f (ξ) < ξ para toda ξ ∈ B, existe B′ ⊆ B de medida positiva tal que f es constante en B′ . Como primera etapa en nuestra demostración probaremos que nuestra medida µ es normal. Antes requerimos algunas definiciones. Sea f : A − → κ donde A ⊆ κ. Decimos que f es casi acotada si existe λ < κ tal que {ξ ∈ A : f (ξ) > λ} tiene medida cero. Decimos que f nunca es acotada si para cada λ < κ, {ξ ∈ A : f (ξ) ≤ λ} tiene medida cero. La función f es incompresible si nunca es acotada y siempre que B ⊆ A tiene medida positiva y g : B − → κ, g(ξ) < f (ξ) para toda ξ ∈ B, entonces g es casi acotada. Note que si A tiene medida cero, entonces toda función f es simultáneamente casi acotada, nunca acotada e incompresible, por lo que todos estos conceptos tienen relevancia cuando A tiene medida positiva. Lema 9.4. Sea f : A − → κ nunca acotada. Podemos escribir a A como la unión de conjuntos ajenos B y C tales que (1) f ↾ B es incompresible; (2) existe una función g : C − → κ tal que g(ξ) < f (ξ) para toda ξ ∈ C y tal que g nunca es acotada. 686 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 687 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. Mediante el lema de Zorn, obtenemos una familia máxima F = {(Ci , gi ) : i ∈ k} con las siguientes propiedades: 1. Ci ⊆ A tiene medida positiva. 2. gi : Ci − → k nunca es acotada. 3. ξ ∈ Ci , entonces gi (ξ) < f (ξ). 4. Si i, j son elementos distintos de k, entonces Ci ∩ Cj = ∅. Por 1 y 4, k debe ser numerable (en caso contrario, para algún número positivo n, Ci tendría medida mayor que n1 para una cantidad no numerable de i, contrario a que la medida es finita). Hacemos C= [ g= Ci i∈k [ gi . i∈k Como k es numerable, g nunca es acotada. Claramente, ξ ∈ C implica g(ξ) < f (ξ). Definimos B = A − C. Si B tiene medida cero, f ↾ B es trivialmente incompresible; si B tiene medida positiva, la maximalidad de F implica que f ↾ B es incompresible. Lema 9.5. Existe una función incompresible f : κ − → κ. Demostración. Definimos una sucesión de conjuntos {An : n ∈ ω} y funciones kn : An − → κ por inducción en n. Para comenzar hacemos A0 = κ y sea h0 la función identidad en κ. (De acuerdo con el Lema 9.2, h0 nunca es acotada). Supongamos que n = k + 1 y que hemos definido Ak y hk : Ak − → κ nunca acotada. Aplicamos el lema 9.4 a Ak y kn para obtener un conjunto Ak+1 ⊆ Ak y una función hk+1 − → k que nunca es constante, tales que hk+1 (ξ) < hk (ξ) para ξ ∈ Ak+1 y hk ↾ Ak = Ak+1 es incompresible. T Mostraremos que ∞ n=1 An = ∅. Supongamos lo contrario, y sea ξ es miembro de esta intersección. Entonces h0 (ξ) > h1 (ξ) > · · · , así que {hn (ξ) : n ∈ ω} es una sucesión estrictamente decreciente de ordinales, lo cual no es posible. Por lo anterior, κ= ∞ [ (An − An+1 ) n=1 es una unión disjunta y podemos definir h : κ − → κ mediante h(ξ) = hn (ξ) si y sólo si ξ ∈ An − An+1 . Se verifica que h es incompresible. 687 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 688 ✐ ✐ 9. El universo construible Sean h : κ − → κ incompresible. Definimos una función ν : Pot(κ) − → [0, 1] mediante ν(A) = µ(h−1 [A]). Se corrobora sin esfuerzo que ν es una medida fuerte en κ. Probaremos que ν es normal. Supongamos que A tiene ν-medida positiva y que g : A − → κ es tal que g(ξ) < ξ para todo ξ ∈ A. Sea B = h−1 [A]. Entonces B tiene µ-medida positiva. Sea f = g ◦ h, así f : B − → κ. Si γ ∈ B, f (γ) = g(h(γ)) < h(γ). Como h es incompresible, existe λ < κ para la cual {γ ∈ B : f (γ) ≤ λ} tiene µ-medida positiva. Puesto que µ es fuerte y λ < κ, existe λ′ ≤ λ tal que D = {γ ∈ B : f (γ) = λ′ } tiene µ-medida positiva. Sea E = {γ ∈ A : g(γ) = λ′ }. Entonces γ ∈ D ⇔ g(h(γ)) = λ′ ⇔ h(γ) ∈ E. Así, D = h−1 [E]. Por lo tanto, E tiene ν-medida positiva. Pero E ⊆ A y g es constante en E. Lema 9.6. Supongamos que A tiene medida positiva. Sea h : A − → κ tal que h(ξ) < ξ para todo ξ ∈ A. Entonces h es casi acotada. Demostración. Sea E = {λ < κ : h−1 [{λ}]}, que tiene medida positiva. Claramente, E debe ser numerable. Sea B = {γ ∈ A : h(γ) ∈ / E}. B debe tener medida cero: en caso contrario, existen λ < κ y B′ ⊆ B de medida positiva tales que h(γ) = λ para λ ∈ B′ , que conduce a λ ∈ E, contrario a la definición de B. Como κ es regular, λ0 = sup(E) < κ. Pero {γ ∈ A : h(γ) > λ0 } ⊆ B. Por consiguiente, κ es casi acotado. Lema 9.7. Para casi toda α ∈ κ, α es un cardinal regular. Demostración. Supongamos que no es así. Sea E = {α : cf (α) < α}, y entonces E tiene medida positiva. Por lo tanto, por la normalidad, existe λ < κ tal que E1 = {α : cf (α) = λ} tiene medida positiva. Para cada α ∈ E1 escogemos una función hα : λ − → α tal que sup(hα [λ]) = α. Definimos una función gξ : E1 − → κ para cada ξ < λ mediante gξ (α) = hα (ξ) < α. Aplicamos el lema 9.6 a gξ para obtener un conjunto Nξ de medida cero y un ordinal γξ < κ tal que gξ (α) ≤ γξ si α ∈ E1 − Nξ . Hacemos γ = sup{γξ : ξ < λ}. Como κ es regular, γ < κ. 688 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 689 ✐ ✐ Conjuntos y modelos. Curso avanzado S Defina E2 = E1 − ξ<λ Nξ . Puesto que µ es fuerte, µ(E2 ) > 0. Ahora, para α ∈ E2 , α = sup{gξ (α) : ξ < λ} ≤ sup{γ1 : ξ < γ} ≤ γ. Así, E2 ⊆ {α : α < γ}. Como µ(E2 ) > 0, esto contradice el lema 9.2. Teorema 9.8. κ es inaccesible. Demostración. Ya sabemos que κ es regular; si no fuera inaccesible, sería sucesor, digamos κ = λ+ . Entonces {α : α es regular} ⊆ {α : α ≤ λ}, así que por el lema 9.2 {α : α es regular} tiene medida cero, contrario al lema 9.7. Puesto que todo cardinal inaccesible es mayor que ℵ1 , el teorema 9.8 da una demostración de un teorema de Ulam que afirma: [HC] no existe una extensión de la medida de Lebesgue a todos los subconjuntos de reales. De la proposición 5.12.2 se obtiene fácilmente el siguiente resultado. Lema 9.9. Sea L un lenguaje asociado a una signatura con una cantidad a lo más numerable de símbolos de relación, sin símbolos de constante o función. Sea A una L-estructura, entonces existen funciones f1 , f2 , . . . de A en A tales S que para cualquier conjunto X ⊆ A, si B = ∞ f [X] y si B es la estructura n n=1 generada por B, entonces B ≺ A y X ⊆ B. Teorema 9.10. Sean κ un cardinal inumerable que porta una medida fuerte, L un lenguaje como en el lema 9.9 que contiene un símbolo Ũ de 1-relación y A una L- estructura de cardinalidad no menor que κ, tal que la interpretación U A de Ũ tiene cardinalidad menor que κ. Entonces existe una L-estructura B, con B ≺ A tal que |B| = κ y |U B | ≤ ℵ0 . Antes de proceder con la demostración del teorema 9.10 requerimos del siguiente resultado. Recuerde que (κ)n representa la conjunto de n-adas crecientes de elementos de κ Lema 9.11. Sean κ un cardinal inumerable, µ una medida fuerte normal en κ y f : (κ)n − → λ < κ. Entonces existe un conjunto D ⊆ κ de medida 1 tal que |f [(D)n ]| ≤ ℵ0 . 689 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 690 ✐ ✐ 9. El universo construible Demostración. Por inducción en n. Caso 1. n = 1. Sea E = {ξ : f −1 [{ξ}] tiene medida positiva}. Claramente, E es numerable. Sea N = {γ : f (γ) ∈ / E}. Como f (ξ) < λ < κ para toda ξ, la normalidad de µ implica que µ(N) = 0. Así, D = κ − N es satisfactorio. Caso 2. n = k + 1. Para cada α, definimos una función hα : (κ)k − → λ por hα (x1 , . . . , xk ) = ( f (α1 , x1 , . . . , xk ), 0, si α < x1 en otro caso. Por hipótesis de inducción podemos encontrar un conjunto Dα de medida uno tal que Dα ⊆ κ − α y |hα [(Dα )k ]| ≤ ℵ0 . Sea Sα = hα [(Dα )k ], por lo que |Sα | ≤ ℵ0 . Sean sα : ω − → Sα funciones sobre y para cada n, gn : κ − →λ definida mediante gn (α) = sα (n). Del caso 1 sabemos que existe un conjunto Nn de medida cero y un conjunto numerable En ⊆ κ tal que Hagamos ⇒ gn (α) ∈ En . α ∈ κ − Nn F =κ− E= ∞ [ ∞ [ Nn n=0 En . n=0 Entonces µ(F ) = 1, E es numerable y para toda n, α∈F En consecuencia, si α ∈ F Definimos ⇒ gn (α) ∈ E. Sα = {sα (n) : n ∈ ω} = {gn (α) : n ∈ ω} ⊆ E. D = {γ ∈ F : γ ∈ \ α<γ Dα }. Probaremos que f [(D)n ] ⊆ E. Sean x ∈ (D)n , α = mín(x) y y ∈ (D)k , con la propiedad de que x = {α} ∪ y. Por definición de D, y ∈ (Dα )k . Así, 690 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 691 ✐ ✐ Conjuntos y modelos. Curso avanzado f (x) = hα (y) ∈ Sα . Pero α ∈ D ⊆ F , así que Sα ⊆ E. Por lo tanto, f (x) ∈ E y f [(D)n ] ⊆ E. Por consiguiente, es suficiente mostrar que µ(D) = 1. Supongamos lo contrario; entonces \ D′ = {γ ∈ F : γ ∈ / Dα } α<γ tiene medida positiva. Definamos g : D′ − → κ mediante g(γ) = mínα<γ {γ ∈ / Dα }. Entonces g(γ) < γ para todo γ ∈ D′ , y en vista de la normalidad de µ, existe un conjunto D′′ ⊆ D′ de medida positiva tal que g es constante en D′′ , digamos con valor α0 . En consecuencia, γ ∈ D′′ ⇒ γ∈ / Dα 0 . Pero Dα0 tiene medida 1, lo que es imposible y la prueba está completa. Demostración del teorema 9.10. En vista del lema 9.11, basta observar lo siguiente. Sin pérdida de generalidad podemos suponer que A es un cardinal y, por lo tanto, κ ⊆ A. Fijamos una sucesión {fn : n ∈ ω} de funciones de Skolem para A de acuerdo con el lema 9.9. Supongamos que fn es una k(n)-función. Definimos una k(n)-función f n de κk(n) a U A mediante: fn (x1 , . . . , xk(n) ) = ( fn (x1 , . . . , xk(n) ), un elemento arbitrario de U A , si es un elemento de U A ; en otro caso. Para probar el teorema 9.10 es suficiente encontrar un subconjunto X de κ de cardinalidad κ tal que |f n [X]| ≤ ℵ0 para toda n, pues en tal caso el rango de las funciones fn en X será el dominio de la subestructura requerida. Introduzcamos funciones extra f n , si es necesario, para conseguir que las funciones f n sean conmutativas (es decir, el orden en el que operan sobre el argumento es irrelevante) y que si xi = xj para cualesquier i, j con 1 ≤ i < j ≤ k(n), entonces para alguna m con k(m) = k(n) − 1, f n (x1 , . . . , xk(n) ) = f n (x1 , . . . , xj−1 , xj+1 , . . . , xk(n) ). 691 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 692 ✐ ✐ 9. El universo construible Hemos reducido el problema a demostrar lo siguiente: sea una sucesión de funciones f : (κ)k(n) − → λ, donde λ < κ. Entonces existe un subconjunto X de κ de cardinalidad κ tal que |fn [(X)k(n) ]| ≤ ℵ0 para toda n. Note que por conveniencia hemos reemplazado al conjunto U A por su cardinalidad λ. Como la intersección de una cantidad numerable de conjuntos de medida 1 tiene medida 1, el teorema 9.10 se sigue del lema 9.11. Lema 9.12 (V = L). Si κ es un cardinal infinito y x ⊆ κ, entonces x ∈ Lκ+ . S Demostración. Como V = α Lα , existe un cardinal λ con x ∈ Lλ . Por el teorema de Löwenheim-Skolem, podemos encontrar un submodelo elemental hN, ∈, =i ≺ hLλ , ∈, =i tal que {α : α < κ}∪{x} ⊆ N y |N| = κ. Por el lema de condensación existe π : hN, ∈, =i ∼ = hLγ , ∈, =i. Ahora, |Lγ | = |N| = κ. Como |Lξ | = |ξ| para todo ordinal infinito ξ, podemos concluir que γ < κ+ . Por lo tanto, Lγ ⊆ Lκ+ . Pero x ∈ N y x ⊆ κ = {α : α < κ} ∈ N, así que π(x) = x. Entonces x ∈ π[N] = Lγ , propiciando que x ∈ Lκ+ como se requiere. Finalmente llegamos a la solución del problema de medida: Teorema 9.13 (V = L). Sea κ un cardinal no numerable. Entonces no existe una medida fuerte en κ. Demostración. Supongamos lo contrario y denotemos con µ la medida normal fuerte en κ. De acuerdo con el lema 9.12, hLκ , Lω1 , ∈, =i |= ϕ[ω], (83) donde ϕ es la fórmula ∀ x(c ⊆ y ⇒ P(x)). Lω1 interpreta el símbolo de 1relación P, así que P(x) se interpreta como x ∈ Lω1 y ω interpreta la variable libre y. Para mostrar que la ecuación 83 es válida debemos saber que dice ϕ al interpretarse en hLκ , Lω1 , ∈, =i: expresa que Lω1 contiene todos los subconjuntos de ω que sabemos es cierto por el lema 9.12. Por el teorema 9.10 existe un conjunto N de cardinalidad κ tal que |N ∩ Lω1 | ≤ ℵ0 y hN, Lω1 , ∩N, ∈, =i ≺ hLκ , Lω1 , ∈, =i. Claramente hN, ∈, =i ≺ hLκ , ∈, =i, así que, por el lema de condensación, sea π : hN, ∈, =i ∼ = hLγ , ∈, =i. 692 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 693 ✐ ✐ Conjuntos y modelos. Curso avanzado Entonces |γ| = |Lγ | = |N| = κ y γ ≥ κ. De hecho, se puede probar que γ = κ. Sea W = π[Lω1 ∩ N], y en consecuencia |W| ≤ ℵ0 . Por supuesto, π : hN, Lω ∩ N, ∈, =i ∼ = hLγ , W, ∈, =i. 1 Ahora por lo que y si aplicamos π, hLκ , Lω1 , ∈, =i |= ϕ[ω], (84) hN, Lω1 ∩ N, ∈, =i |= ϕ[ω], (85) hLγ , W, ∈, =i |= ϕ[π(ω)]. (86) hLγ , W, ∈, =i |= ϕ[ω], (87) Todo entero positivo n es definible en Lκ mediante un LTC-enunciado. Por lo tanto, y puesto que hN, ∈, =i ≺ hLκ , ∈, =i, N contiene a N. DE manera similar, ω es un elemento de N. Por las propiedades de π, π(ω) = ω. De la ecuación 86 se sigue lo que significa que en Lγ todos los subconjuntos de ω están en W. Pero γ ≥ κ, así que Lγ contiene todos los subconjuntos de ω. Entonces la ecuación 87 implica que W contiene todos los subconjuntos de ω. Pero W es numerable, una contradicción. Corolario 9.14 (V = L). En ningún conjunto X no numerable existe una medida definida en todos los subconjuntos de X. 10. Más sobre cardinales débilmente compactos En esta sección estudiaremos en forma muy breve una extensión de los lenguajes de primer orden, lenguajes que hemos considerado siempre. Este sucinto estudio dista mucho de ser completo y sólo lo desarrollaremos lo suficiente para incorporar a nuestro bagaje algunos tipos de grandes cardinales. Para más información respecto a este tipo de lenguajes, recomendamos al lector las obras [Karp64], [Kei71] y [Dick74]. Suponga que λ, κ son cardinales infinitos. Entonces Lλκ es el lenguaje que se obtiene de añadir dos nuevos tipos de operaciones lógicas a un lenguaje usual de primer orden L. Sin embargo, para L supondremos que cuenta con 693 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 694 ✐ ✐ 9. El universo construible una cantidad infinita de variables, suficientemente grande para permitir las operaciones que a continuación describimos. También permitimos símbolos de relación y función de aridad infinita. (1) Suponga que {φξ : ξ < ζ} es un conjunto de Lλκ -fórmulas con ζ < λ; entonces ^ φξ _ φξ ξ<ζ y ξ<ζ son fórmulas de Lλκ . La interpretación de las mismas en una L-estructura A es la usual: la conjunción es cierta en A si cada φξ , ξ < ζ es cierta en A. La disyunción es cierta en A si alguna φξ es cierta en A. (2) Suponga que {xξ : ξ < ζ} es un conjunto de variables con ζ < κ y φ es una Lλκ -fórmula; entonces ∀ (xξ )ξ<ζ φ y ∃ (xξ )ξ<ζ φ son Lλκ -fórmulas. La interpretación en una L-estructura A es la siguiente: la fórmula ∀ (xξ )ξ<ζ φ es cierta en A si y sólo si es cierta en A para toda valuación de las variables {xξ : ξ < ζ}, manteniendo fija la valuación para las variables libres restantes; la fórmula ∃ (xξ )ξ<ζ φ es cierta en A si y sólo si φ es cierta para alguna de tales valuaciones. En este orden de ideas, nuestros lenguajes usuales L son Lωω -lenguajes. La propiedad distintiva de Lωω es que es compacto, es decir, si Σ es un conjunto de Lωω -enunciados, entonces Σ tiene un modelo si y sólo si todo subconjunto finito de Σ tiene un modelo. Para lenguajes infinitarios no tenemos, en general, un ánalogo al teorema de compacidad. Consideremos algunos ejemplos de este acontecer. 694 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 695 ✐ ✐ Conjuntos y modelos. Curso avanzado ◦ ◦ Ejemplo 10.1. Considere el lenguaje Lλ+ ,κ ({cµ : µ < λ+ } ∪ {d ν : ν < λ}). El conjunto de fórmulas Γ={ ∪ _ ◦ ◦ (c µ = ˙ d ν ) : µ < λ+ } ∪ ν<λ ◦ ◦ {¬(cµ = ˙ cµ ′ ) : µ 6= µ′ , µ, µ′ < λ+ } es claramente inconsistente, pues no tiene modelo (el último enunciado exige ◦ λ+ interpretaciones diferentes para las constantes cµ , mientras que los primeros enunciados exigen que estas interpretaciones provengan de un conjunto de ◦ cardinalidad a lo más λ, las interpretaciones de las λ constantes d ν ). Pero también es claro que todo subconjunto de Γ de cardinalidad menor que λ+ tiene un modelo. Así que el lenguaje Lλ+ κ no es compacto para ninguna κ. En vista del ejemplo 10.1 podemos decir que el lenguaje Lλ+ κ es (λ+ , λ+ )no compacto, donde un lenguaje es (ζ, η)-no compacto si existe un conjunto de enunciados de cardinalidad ζ del lenguaje que no tiene modelo, pero cualquier subconjunto de enunciados de cardinalidad menor que η tiene modelo. Ejemplo 10.2. Al lenguaje Lλ+ κ añadimos símbolos de 0-relación Pη,i para η < λ, i < 2, y formamos el conjunto de enunciados Γ={ ^ η<λ (Pη,0 ∨ Pη,1 } ∪ {¬ ^ η<λ Pη,f (η) : f ∈ 2λ }. Entonces Γ no tiene modelo, pues para satisfacer el primer enunciado debemos tener una función f : λ − → 2 tal que Pη,f (η) sea cierta para cada η < λ; pero el enunciado del segundo conjunto correspondiente a esta f debe ser falso. No obstante, todo subconjunto propio de Γ tiene modelo. Esto demuestra que la parte propocicional del lenguaje Lλ+ κ es (2λ , 2λ )-no compacto. Ejemplo 10.3. Suponga que el lenguaje Lλλ (λ > ℵ0 ) tiene un símbolo de 2-relación < y sea BO el enunciado ∀ x, y(x < y ∨ y < x ∨ x=y) ˙ ∧ ¬∃ (xn )n<ω ( ^ xn+1 < xn )). n<ω 695 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 696 ✐ ✐ 9. El universo construible Entonces todo modelo de BO debe interpretar < como un buen orden. Sea φη (x) la fórmula ∃ (xν )ν<η [( ^ ^ ξ<η ζ<ξ (xζ < xξ )) ∧ ∀ z(z < x ⇒ _ (z=x ˙ ξ ))]. ξ<η Entonces en una estructura hρ, <, . . .i, donde ρ es un ordinal, los elementos ξ satisfacen φη (x) si y sólo si ξ = η, ya que debe tener predecesores de tipo ordinal η. S Ahora suponga que λ es un cardinal singular, digamos λ = ξ<α νξ , donde |α| < λ y |νξ | < λ. Sea P un símbolo de 1-relación, y considere el conjunto de enunciados Γ = {BO} ∪ { _ ξ<α ∃ (xζ )ζ<νξ [∀ z(Pz ⇒ ∪ {∃ z(Pz ∧ φη (z)) : η < λ}. _ ζ<νξ (z=x ˙ ζ ))]} ∪ Entonces Γ no tiene modelo, pues un modelo debería tener la forma hρ, <, Ri con ρ un ordinal y R ⊆ ρ que interprete a P, y para satisfacer los enunciados ∃ z(Pz ∧ φη (z)) para η < λ, debemos tener η ∈ R para η < λ, así que λ ⊆ R. Pero el segundo enunciado dice que R tiene a lo sumo νξ miembros para algún ξ < α, y |νξ | < λ, lo que es una contradicción. No obstante, cualquier subconjunto de Γ de cardinalidad menor que λ tiene modelo; por lo que Lλλ es (λ, λ)- no compacto. Una Lκκ -extensión elemental es la generalización obvia de extensión elemental, usando todas las Lκκ -fórmulas en lugar de sólo las L-fórmulas. Antes de retomar el estudio de los cardinales débilmente compacto es conveniente establecer una propiedad de los cardinales medibles (que se definieron en el Cap. 6). Teorema 10.4. Todo cardinal medible es inaccesible. Demostración. Recuerde que un cardinal es inaccesible si es no numerable, regular y límite fuerte. Sea κ un cardinal medible y U un ultrafiltro libre κ-completo en κ. Sea I el ideal primo (es decir, κ no pertenece a I) dual al ultrafiltro U. Todo singulete pertenece a I, y por κ- completud, todo X ⊆ κ de cardinalidad menor que κ pertenece a I. Si κ fuera singular, el conjunto κ pertenecería a I por κ-completud. Por lo tanto, κ es regular. 696 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 697 ✐ ✐ Conjuntos y modelos. Curso avanzado Supongamos que κ no es límite fuerte. Por consiguiente, existe λ < κ tal que 2λ ≥ κ, así que existe un conjunto S ⊆ {0, 1}λ de cardinalidad κ. En S existe un ultrafiltro V libre y κ-completo. Para cada α < λ, exactamente uno de los conjuntos {f ∈ S : f (α) = 0} y {f ∈ S : f (α) = 1} (88) pertenece a V ; digamos que ese conjunto es Xα . T En consecuencia, para cada α < λ se tiene Xα ∈ V , y por κ-completud, X = α<λ Xα también pertenece a V . Pero existe a lo sumo una función f en S que pertenece a todos los Xα ; el valor de f en α está determinado por la elección de los conjuntos en 88. Por consiguiente, |X| ≤ 1, una contradicción pues V es libre. A. Tarski [Tar62] formuló dos generalizaciones naturales de la compacidad de Lωω . Definición 10.5. Una colección de Lλµ -enunciados es satisfacible si y sólo si tiene un modelo; es ν-satisfacible si y sólo si toda subfamilia de cardinalidad menor que ν es satisfacible. Para κ > ω, κ es compacto fuerte si cualquier familia de Lκκ -enunciados es κ-satisfacible, si y sólo si es satisfacible. κ es débilmente compacto si todo conjunto de Lκκ -enunciados usando a lo sumo κ símbolos no lógicos es satisfacible, si y sólo si es κ-satisfacible. Proposición 10.6. κ es compacto fuerte si y sólo si para cualquier conjunto S, todo filtro κ-completo en S se puede extender a un ultrafiltro κ-completo en S. Demostración. Suponga que κ es compacto fuerte y que F es un filtro κ-completo en un conjunto S. Usando como nuevos símbolos de constante ◦ X ⊆ S para todo X ⊆ S, sea Σ la Lκκ -teoría de hS ∪ Pot(S), ∈, {X : X ⊆ S}i ◦ junto con los enunciados c ∈ X para toda X ∈ F, donde c es un nuevo símbolo de constante. Σ es κ-satisfacible ya que F es κ-completo, por lo que sea A un modelo de Σ por compacidad fuerte. Definimos U mediante X∈U ⇔ ◦ X ⊆ S ∧ A |= (c ∈ X). Es fácil verificar que U es un ultrafiltro en S que extiende a F y que Σ contiene los Lκκ -enunciados que aseguran que U es κ-completo. 697 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 698 ✐ ✐ 9. El universo construible Recíprocamente, note que κ debe ser regular: en caso contrario, la κcompletud implicaría la κ+ -completud para filtros. Pero entonces, si U es un ultrafiltro κ-completo sobre κ+ extendiendo el filtro κ-completo (de hecho, κ+ completo) {X ⊆ κ+ : |κ+ − X| < κ+ }, entonces U también sería κ+ -completo y κ+ sería medible, lo que contradice el teorema 10.4. Suponga que Σ = {σα : α < λ} es una familia κ-satisfacible de Lκκ enunciados. Para toda x ∈ [λ]<κ , sea Ax una estructura en el lenguaje de Σ V tal que Ax |= α∈x σα . Puesto que disponemos de Aλ podemos suponer que λ ≥ κ. Como {{x ∈ [λ]<κ : y ⊆ x} : y ∈ [λ]<κ } genera un filtro κ-completo en [λ]<κ por la regularidad de κ, sea U un ultrafiltro κ-completo en [λ]<κ que extiende a este filtro. Considere el ultraproducto Q A = P Ax /U, donde P = [λ]<κ . De acuerdo con el ejercicio 33, el teorema de Łoś es cierto para Lκκ -ultraproductos módulo ultrafiltros κ-completos, por lo que para toda α < λ, {x ∈ [λ]<κ : Ax |= σα } ⊇ {x ∈ [λ]<κ : α ∈ x} ∈ U. En consecuencia, A |= σα . Corolario 10.7. Si κ es compacto fuerte, entonces κ es medible. Demostración. κ es regular, de acuerdo con el teorema 10.4. El filtro {X ⊆ κ : |κ − X| < κ} es κ-completo, y puesto que se extiende a un ultrafiltro κ-completo se verifica que κ es medible. Proposición 10.8. Si κ es medible entonces también es compacto débil. Demostración. Suponga que Σ es una familia κ-satisfacible de Lκκ enunciados con no más de κ símbolos no lógicos. En tal situación es fácil κ probar que |Σ| ≤ κ⌣ . Pero como los cardinales medibles son inaccesibles, |Σ| ≤ κ. Enumeramos Σ como {σα : α < κ} y procedemos como en la proposición 10.6: V Para cada β < κ sean Aβ |= α<β σα , U un ultrafiltro κ-completo sobre κ Q y A = β<κ Aβ /U. Entonces para cualquier α < κ, {β < κ : Aβ |= σα } ⊇ {β < κ : β > α} ∈ U, por lo que A |= σα . Pero compacidad débil implica inaccesibilidad: 698 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 699 ✐ ✐ Conjuntos y modelos. Curso avanzado Proposición 10.9. Todo cardinal débilmente compacto es inaccesible. Demostración. Para mostrar que κ es regular, supongamos lo contrario y sea X ⊆ κ no acotado pero de cardinalidad menor que κ. Entonces, para símbolos de constante distintos cα y dαi para α < λ e i < 2, { ^ α<λ [(cα =d ˙ α0 ∨ cα =d ˙ α1 ) ∧ dα0 6= dα1 ]} ∪ { _ α<λ (cα 6= dαf (α) ) : f ∈ 2λ } no es satisfacible, pues toda interpretación de {cα : α < λ} correspondería a una función de λ en 2 diferente de todo miembro de 2λ , pero con un razonamiento similar cualquier subconjunto propio es satisfacible, una contradicción. Una ligera generalización de cardinal compacto es: un cardinal κ es Lλω compacto si para todo conjunto S, todo filtro κ-completo en S se puede extender a un ultrafiltro λ-completo en S. Por supuesto, Lλω -compacto implica Lµω compacto si λ ≥ µ, y κ es compacto fuerte si y sólo si κ es Lκω -compacto. Si κ es Lλω -compacto, entonces todo cardinal ≥ κ es Lλω -compacto. H. Keisler estableció el siguiente resultado, que generaliza el uso del teorema de compacidad en la obtención de extensiones propias de modelos. Teorema 10.10. El cardinal κ es débilmente compacto si sólo si para todo R ⊆ Vk existe un conjunto transitivo X 6= Vκ y un S ⊆ X tal que hVκ , ∈, Ri ≺ hX, ∈, Si. En este caso R y S interpretan al mismo símbolo de función, con R ⊆ Vκ y S ⊆ X. Observe que la exigencia de transitividad de X implica que κ ∈ X. Demostración. Primero suponemos que κ es débilmente compacto; en ◦ este caso |Vκ | = κ. Considere símbolos de constantes c y x para cada x ∈ Vκ , para obtener la Lκκ -teoría Σ de ◦ hVκ , ∈, R, {x : x ∈ Vκ }i ◦ junto con los enunciados OR(c) y (c 6= α) para cada α < κ. Claramente Σ es κ-satisfacible y por compacidad débil también es satisfacible. Obviamente el axioma de extensionalidad pertenece a Σ y como la propiedad de ser bien fundado es expresable en Lω1 ω1 , Σ tiene un enunciado que expresa que ∈ está bien fundada. Ahora podemos aplicar el lema 8.6.13 para obtener un modelo transitivo hX, ∈, S, {x : x ∈ Vκ }, γi, 699 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 700 ✐ ✐ 9. El universo construible donde γ interpreta a c. Para toda x ∈ Vκ , Σ contiene el enunciado ◦ ∀ v(v ∈ x ⇔ _ ◦ v= ˙ y). y∈x Mediante una sencilla inducción en el rango podemos probar que x ∈ Vκ implica x = x. Claramente γ es un ordinal ≥ κ, así que X 6= Vκ ; por lo tanto, hX, ∈, Si satisface todos los requisitos. Para el recíproco debemos trabajar un poco más. Antes el lector debe revisar la construcción del lenguaje LV en el capítulo 9. Cada fórmula del lenguaje se asocia con cierta sucesión de números naturales. Esta sucesión es el codigo de la fórmula. Este proceso se conoce como aritmetización de fórmulas y fue utilizado por Gödel en la demostración de su famoso teorema de incompletud. Primero demostraremos que la hipótesis del teorema implica que κ es inaccesible: supongamos que µ < κ, que F : µ − → κ tiene rango cofinal y que tenemos una extensión propia hVκ , ∈, F i ≺ hX, ∈, Si con X transitivo. Entonces ∃ x(F [µ] ⊆ x) es falsa en la primera estructura pero ∃ x(S[µ] ⊆ x) es cierta en la segunda, lo que es una contradicción. Ahora supongamos que existe ν < κ tal que κ ≤ 2ν . Entonces 2ν ≤ |Vν+1 | y Vν+1 ∈ Vκ y otra vez podemos usar una biyección G : Vν+1 − → κ para llegar a una contradicción. Observe que para todo cardinal inaccesible λ los siguientes teoremas de “Löwenheim-Skolem” para el lenguaje Lλλ se demuestran, con los argumentos correspondietes, como en el caso del lenguaje Lωω : (i) Si σ es un Lλλ -enunciado satisfacible, entonces tiene un modelo de cardinalidad menor que λ. (ii) Si Σ es un conjunto de cardinalidad a lo sumo λ satisfacible de Lλλ enunciados, entonces tiene un modelo de cardinalidad a lo sumo λ. Suponga que Σ es un conjunto de Lκκ -enunciados κ-satisfacibles que involucran a lo sumo κ símbolos no lógicos. El lenguaje Lκκ correspondiente tiene κ fórmulas, pues κ es inaccesible, por lo que podemos aritmetizar el lenguaje de tal forma que los códigos de las fórmulas sean miembros de Vκ y definir la relación de satisfacción para estructuras (elementos de Vκ ) como un conjunto de Vκ . Sea R1 ⊆ Vκ el codigo de la relación de satisfacción y construyamos Σ como un subconjunto de Vκ mediante la aritmetización. Sea R2 : κ − → Σ sobre; entonces por (i), hVκ , ∈, R1 , R2 i |= ∀ α(R2 [α] tiene un modelo). 700 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 701 ✐ ✐ Conjuntos y modelos. Curso avanzado Por la propiedad de extensión en la hipótesis (con hR1 , R2 i codificada por un mismo subconjunto de Vκ ) podemos lograr hVκ , ∈, R1 , R2 i ≺ hX, ∈, S1 , S2 i, una extensión propia con X transitivo. Puesto que es una subestructura elemental, S2 [κ] = R2 [κ] = Σ y hX, ∈ S1 , S2 i |= Σ tiene un modelo. Pero κ es inaccesible, así que hVκ , ∈i y, por lo tanto, hX, ∈i son modelos de ZFE; puesto que X es transitivo y κ ∈ X, hX, ∈i |= “κ es inaccesible”. Se sigue de (ii) que hX, ∈, S1 , S2 i |= Σ tiene un modelo A con A ⊆ κ. Finalmente, podemos suponer que la Lκκ -relación de satisfacción S1 para κ A se preserva de X a V (de hecho es absoluta), pues κ⌣ ⊆ Vξ ⊆ X y como en el caso de Lωω la relación de satisfacción para A es Σ1 (y también Π1 ). Por consiguiente, A realmente es un modelo de Σ en V . Aunque hX, ∈i |= “κ es inaccesible”, en general no se puede aseverar que hX, ∈i |= “κ es débilmente compacto”: X puede no contener todos los modelos necesarios de conjuntos de enunciados κ-satisfacibles; en caso contrario, puesto que hX, ∈i es subestructura elemental de hVκ , ∈i que es modelo de ∃ α(α es débilmente compacto), existiría realmente un cardinal débilmente compacto menor que κ, lo que no sería cierto si κ es el cardinal débilmente compacto más pequeño. Proposición 10.11. Suponga que κ es débilmente compacto. Entonces: (a) Si A es un conjunto estacionario en κ, existe un cardinal inaccesible λ < κ tal que A ∩ λ es estacionario en λ. (b) Si Aα es estacionario en κ para cada α < κ, entonces existe un cardinal inaccesible λ < κ tal que Aα ∩ λ es estacionario en λ para cada α < λ. Demostración. (a) Supongamos lo contrario: para cada ξ < κ, ξ no es inaccesible o existe un club Cξ en ξ tal que Cξ ∩ A = ∅. Sea R : κ − → Vκ definida mediante: R(ξ) = Cξ si ξ es inaccesible e igual al vacío en otro caso. Por el teorema 10.10 (con hA, Ri codificado por un conjunto en Vκ ), sea hVκ , ∈, A, Ri ≺ hX, ∈, B, Si una extensión propia con X transitivo. Entonces hX, ∈, B, Si |=κ es inaccesible ∧ S(κ) es un club en κ ∧ S(κ) ∩ B = ∅. En tal situación, S(κ) realmente es un club, y como B ∩ κ = A, S(κ) ∩ A = ∅, lo que contradice la suposición de que A es estacionario. 701 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 702 ✐ ✐ 9. El universo construible (b) El argumento es similar; en este caso usamos la hipótesis Cξ ∩ Aα = ∅ para algún α < ξ y A = {(α, β) : β ∈ Aα }. A estas alturas el lector debe estar alarmado o con una sonrisa maliciosa, pues en el capítulo 7 se definieron los cardinales débilmente compactos como aquellos κ para los cuales se cumple κ −→ (κ)22 . Por otro lado, en esta sección se definió un cardinal débilmente compacto de otra manera. Para bien de la ciencia, de los autores y de este libro, ambas definiciones son equivalentes. Recuerde que en el capítulo 7, teorema 10.4, se demuestra que un cardinal es débilmente compacto (en el viejo sentido) si y sólo si tiene la propiedad del árbol. A continuación mostramos que un cardinal es débilmente compacto (de acuerdo con la nueva definición, pág. 697), si y sólo si tiene la propiedad del árbol, lo cual asegura que todo sigue bien. Antes, y como es natural, necesitamos definir una construcción muy especial llamada límite directo y requerimos de un lema previo. Un conjunto dirigido es un conjunto parcialmente ordenado (S, ≤) tal que para cualesquier, i, j ∈ S existe una k ∈ S con i ≤ k y j ≤ k. Un sistema dirigido es una pareja hhMi : i ∈ Si, hfij : i ≤ jii, donde hS, ≤i es un conjunto dirigido, cada Mi es una L-estructura y cada fij : Mi − → Mj es un encaje elemental tal que fij = fjk ◦ fij para i ≤ j ≤ k (así que cada fii es la identidad en Mi ). Un límite directo es una L-estructura M para la que existen encajes elementales fi : Mi − → M, i ∈ S con fi = fj ◦ fij para i ≤ j y tal que: para cada x en el domino de M, x ∈ ran(fi ) para alguna i ∈ S. La siguiente proposición resalta la importancia del esta nueva noción. Proposición 10.12. Suponga que hhMi : i ∈ Si, hfij : i ≤ jii es un sistema dirigido y M es un límite directo con encajes elementales correspondientes fi : Mi − → M. Suponga que N es una L-estructura tal que existen encajes elementales gi : Mi − → N que satisfacen gi = gj ◦ fij para i ≤ j. Entonces existe un encaje elemental g : M − → N tal que gi = g ◦ fi . Demostración. Para definir g, si x ∈ M, digamos x = fi (x) para alguna i ∈ S y x en el dominio de Mi , hacemos g(x) = gi (x). Se verifica fácilmente que g está bien definida y es un encaje elemental. 702 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 703 ✐ ✐ Conjuntos y modelos. Curso avanzado Lema 10.13. Suponga que κ es inaccesible y R ⊆ Vκ . Entonces es un club en κ. {α < κ : hVα , ∈, R ∩ Vα i ≺ hVκ , ∈, Ri} Demostración. La cerradura es inmediata. Para mostrar que no es acotado en κ, sea α < κ arbitrario. Defina αn < κ para n ∈ ω por recursión: sea α0 = α. Dada αn < κ, definimos αn+1 como el menor β ≥ αn tal que para cualesquier y1 , . . . , yk ∈ Vαn y hVκ , ∈, Ri |= ∃ v0 ϕ[y1 , . . . , yk ] para alguna fórmula ϕ, existe x ∈ Vβ tal que hVκ , ∈, Ri |= ϕ[x, y1 , . . . , yk ]. Como κ es inaccesible, |Vκ | < κ y αn+1 < κ. Finalmente, sea α = sup{αn : n ∈ ω}. Entonces hVκ , ∈, R ∩ Vα i ≺ hVκ , ∈, Ri usando la prueba TV. Ahora sí, nuestra equivalencia salvadora es el siguiente teorema: Teorema 10.14. Las siguientes afirmaciones son equivalentes para todo cardinal κ > ω. (a) κ es compacto débil (de acuerdo con la definición de la pág. 697). (b) κ es inaccesible y tiene la propiedad del árbol. Demostración. (a) ⇒ (b). Compacidad débil implica inaccesibilidad. Para mostrar que κ tiene la propiedad del árbol usamos un argumento de compacidad: sea (T, <T ) un κ-árbol. A cada t ∈ T asociamos un símbolo de 0predicado Pt , y considere la siguiente colección de Lκω -enunciados consistente W en: disyunciones {Pt : t ∈ Tα } para α < κ, y ¬(Pt ∧ Pt ′ ) para t, t ′ ∈ T que sean <T -incomparables. Como T tiene altura κ, esta colección de κ enunciados es κ-satisfacible. Por compacidad débil, es satisfacible y tiene un modelo A. Por lo tanto, {t ∈ T : A |= Pt } es una rama cofinal en T . (b) ⇒ (a). Usaremos la equivalencia del teorema 10.10. Suponga entonces que R ⊆ Vκ ; debemos encontrar un conjunto transitivo X 6= Vκ y un conjunto S ⊆ X tales que hVκ , ∈, Ri ≺ hX, ∈, Si. Por la inaccesiblidad de κ y el lema 10.13, el conjunto {α < κ : hVκ , ∈, R ∩ Vα i ≺ hVκ , ∈, Ri} es un club en κ; sea hαξ : ξ < κi una enumeración creciente de este conjunto. Definiremos un árbol (T, <T ). Fijemos un conjunto completo de funciones de Skolem para hVκ , ∈ Ri y envolventes de Skolem para todo X ⊆ Vκ . Para αξ < β < κ, sea H(ξ, β) = la envolvente de Skolem de Vαξ ∪ {β} en hVκ , ∈, Ri 703 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 704 ✐ ✐ 9. El universo construible tal que hVgaξ , ∈, R ∩ Vαξ i ≺ H(ξ, β). Definamos H(ξ, β) ≈ H(ξ, β) ⇔ ξ < ξ y existe un isomorfismo entre las dos estructuras que deja fijo a Vαξ y transforma β en β. Claramente, ≈ es una relación de equivalencia y denotamos con [H(ξ, β)] la clase de equivalencia de H(ξ, β). Los elementos de nuestro árbol T son las clases [H(ξ, β)]. Finalmente introducimos un orden <T : [H(ξ, β)] <T [H(ξ, β] ⇔ ξ < ξ, β ≤ β y H(ξ, β) es isomorfo a la envolvente de Skolem de Vαξ ∪ {β} en H(ξ, β). Con esta definición (T, <T ) se convierte en un árbol; note que Tξ = {[H(ξ, β)] : αξ < β < κ}. En realidad se trata de un κ-árbol, lo que se |V | deduce de que κ es inaccesible, pues hay a lo sumo 2 αξ < κ envolventes de Skolem (módulo isomorfismos) generados por Vαξ ∪ {x}. Por la propiedad del árbol existe una κ-rama {[H(ξ, βξ )] : ξ < κ} en T . Por definición de <T , siempre que ξ ≤ η < κ existe un encaje elemental iξη : H(ξ, βξ ) − → H(η, βη ) que deja fijo a Vαξ e iξη (βξ ) = βη . Por construcción, ξ ≤ η ≤ ρ < κ implica que iξρ = iηρ ◦ iξη . En consecuencia, podemos formar el límite directo y está bien fundado pues cf (κ) > ω. El colapso de Mostowski es entonces una extensión elemental hX, ∈, Si de hVκ , ∈, Ri. Como los βξ se identifican con un ordinal β ∈ X con β ≥ κ, la estructura hX, ∈, Si es la que se requiere. 11. 0# En esta última sección del libro presentamos una serie de nociones que serán, en cierta medida, el motivo de la parte conjuntista en el siguiente volumen. La meta es establecer una relación entre grandes cardinales y el universo construible. Propiamente lo que se logra es que si una cierta propiedad de grandes cardinales (0# ) no es cierta, entonces el universo V es muy similar a L. El principio 0# es el primer artefacto que nos expulsa de L. Su origen se encuentra en los trabajos de Ehrenfeucht y Mostowski sobre indicernibles, y su relación con L fue descrita por R. Jensen mediante su famoso teorema de cubierta. Nuestro primer resultado se origina en la aplicación de propiedades de partición a la obtención de indicernibles; podríamos decir que es una suerte de generalización del teorema de Ramsey. Recuerde que la notación β − → (α)<ω δ <ω − α homogénea para f , es significa que para toda f : [β] → δ existe H ∈ [β]   decir, | [H]n | ≤ 1 para toda n ∈ ω. 704 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 705 ✐ ✐ Conjuntos y modelos. Curso avanzado Teorema 11.1 (Silver). Sea α un ordinal límite infinito, κ −→ (α)<ω 2 si y sólo si para toda L- estructura A con L un lenguaje numerable y κ ⊆ A, existe un conjunto de indicernibles X ∈ [κ]α para A. Demostración. Sea {ϕn : n ∈ ω} una enumeración de las L-fórmulas de tal forma que lib(ϕn ) ⊆ {v1 , . . . , vk(n) }, donde k(n) ≤ n. Definamos f : [κ]<ω − → 2 mediante f (ξ1 , . . . , ξn ) = ( 0, A |= ϕn [ξ1 , . . . , ξk(n) ]; 1, en otro caso. Entonces cualquier conjunto X homogéneo para f cuyo tipo ordinal es un ordinal límite es un conjunto de indicernibles para A. Recíprocamente, supongamos que f : [κ]<ω − → 2 y X es un conjunto de indicernibles para la L-estructura hκ, c, {f ↾ [κ]n : n ∈ ω}i. Entonces X es homogéneo para f . Existe una fórmula BO(x, y) (Definición 5.11) que define, en L, un buen orden <L tal que para toda δ > ω límite, x, y ∈ Lδ , x <L y, si y sólo si Lδ |= BO(x, y). Para cada LTC-fórmula ϕ(~v) definimos el término canónico de Skolem tϕ para ϕ mediante BO como sigue: tϕ (v1 , . . . , vm ) = v0 ⇔ (∀ vm+2 ¬ϕ(vm+2 , v1 , . . . , vm ) ∧ v0 = ∅) ∨ ∨ (ϕ(v0 , v1 , . . . , vm ) ∧ ∀ vm+1 (ϕ(vm+1 , v0 ) (89) ⇒ ¬ϕ(vm+1 , v1 , . . . , vn ))). Es decir, tϕ (v1 , . . . , vm ) “escoge” el primer elemento (respecto a <L ) que hace cierta a ϕ (en caso de existir alguna). Para cualquier LTC-estructura M = hM, Ei que satisfaga el requisito de estar bien ordenado por <L (p. ej., si M es elementalmente equivalente a algún hLδ , Ei con δ un ordinal límite mayor que ω), considere la correspondiente expansión hM, E, {tϕM : ϕ ∈ Fml(LTC)}i, donde la interpretación de tϕM es la función de Skolem para ϕ tal que tϕM (x1 , . . . , xm ) es el menor y (respecto a BO) que satisface M |= ϕ[y1 , x1 , . . . , xm ], si existe alguno. Note que {tϕM : ϕ ∈ Fml(LTC)} es cerrado respecto a la composición de funciones. 705 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 706 ✐ ✐ 9. El universo construible Si X ⊆ M, la envolvente de Skolem de X en M tiene como dominio al conjunto {tϕM (x1 , . . . , xm ) : ϕ es una LTC-fórmula y x1 , . . . , xm ∈ X}. Este conjunto coincide con la colección de x ∈ M tales que {x} es definible en M mediante parámetros en X, ya que esta colección está contenida en cualquier subestructura elemental de M que contenga a X. En lo sucesivo, un término de Skolem significa una de las tϕ . Para simplificar, sea L∗ = LTC({cn : n ∈ ω}). También en el resto de la sección entenderemos por una EM-teoría la L∗ -teoría de alguna estructura del tipo hLδ , ∈, {xk : k ∈ ω}i, donde δ es un ordinal límite > ω y {xk : k ∈ ω} es una sucesión de ordinales indicernibles para hLδ , ∈i. Observe que para cualquier ordinal límite δ > ω, cualquier sucesión de ordinales indicernibles para hLδ , ∈i determina en forma única una EM-teoría: simplemente tome la teoría de hLδ , ∈, {xk : k ∈ ω}i para cualquier subsucesión creciente {xk : k ∈ ω} indicernible. Teorema 11.2. Supongamos que T es una L-teoría con modelos infinitos y (X, <) es un conjunto linealmente ordenado. Existe un modelo M de T tal que X está contenido en M y es un conjunto de indicernibles para M. Demostración. Expandimos el lenguaje de T introduciendo nuevas constantes cx para cada x ∈ X, y considere la teoría T = T ∪ {cx 6= cy : x 6= y ∧ x, y ∈ X} ∪ {ϕ(cx1 , . . . , cxn ) ⇔ ϕ(cy1 , . . . , cyn ) : ϕ(v1 , . . . , vn ) es una L-fórmula y x1 < · · · < xn , y1 < · · · < yn son elementos de X}. Es suficiente mostrar que T es consistente, y para ello basta probar que todo subconjunto finito de T es satisfacible. Supongamos que S ⊆ T es finito. Sean A un modelo infinito de T, {ai : i ∈ ω} miembros distintos de A y m el número de nuevos símbolos de constante que aparecen en las fórmulas en S; para k ≤ m definimos fk ∈ [ω]k 706 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 707 ✐ ✐ Conjuntos y modelos. Curso avanzado mediante fk (i1 , . . . , ik ) = {ϕ(v1 , . . . , vk ) : ϕ(cx1 , . . . , cxk ) ⇔ ϕ(cy1 , . . . , cyk ) ∈ S ∧ ∧ A |= ϕ[ai1 , . . . , aik ]}. Como S es finito, el rango de fk es finito y podemos aplicar el teorema de Ramsey m veces para encontrar un H ∈ [ω]ω homogéneo para cada fk . Por lo tanto, A satisface S para cualesquier m elementos de {ai : i ∈ H} como las interpretaciones de los nuevos símbolos de constante que aparecen en S en el orden creciente correspondiente. Si T es una L∗ -teoría, T− denota su restricción a LTC, es decir, eliminamos de T los enunciados ϕ que contengan algún símbolo de constante ck . Lema 11.3. Suponga que T es una EM-teoría. Para cualquier α existe un modelo M = M(T, α) de T− único (salvo ismomorfismos) tal que: (a) Existe un conjunto X de ordinales de M con tipo ordinal α (respecto a M) que constituye un conjunto de indicernibles para M. Más aún, para cualquier LTC-fórmula ϕ(~v), ~x ∈ (X)n satisface ϕ en M exactamente cuando ϕ(c0 , . . . , cn ) ∈ T. (b) La envolvente de Skolem de X en M pertenece a M. Demostración. Por definición, T tiene al menos un modelo infinito, así que la prueba del teorema 11.2 muestra que hay un modelo que satisface (a). Si en este modelo tomamos la envolvente de Skolem de los indicernibles como un modelo M, éste satisface (b). Ahora supongamos que hay dos de tales modelos M y M, con correspondientes conjuntos de indicernibles X y X. Como X y X tienen tipo ordinal α, sea h : X − → X un isomorfismo de orden. Extendemos h a un isomorfismo entre M y M: por (b), cualquier elemento de M es de la forma t M (x1 , . . . , xn ) para algún término de Skolem t y x1 , . . . , xn ∈ X; de manera similar para M y X. Por lo tanto, es suficiente mostrar que la función h̃ dada por h̃(t M (x1 , . . . , xn )) = t M (h(x1 ), . . . , h(xn )) es un isomorfismo: para cualquier fórmula ϕ(v1 , . . . , vn ) y toda n-ada (x1 , . . . , xn ) ∈ (X)n se cumple M |= ϕ(x1 , . . . , xn ) ⇔ ϕ(c0 , . . . , cn−1 ) ∈ T ⇔ M |= ϕ(h(x1 ), . . . , h(xn )). ⇔ 707 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 708 ✐ ✐ 9. El universo construible Como los términos de Skolem son definibles, usamos fórmulas específicas que aseguran la igualdad de los términos de Skolem para verificar que h̃ está bien definida, es decir, no depende de la descripción de los términos y que es inyectiva. Así mismo, preserva la relación de pertenencia y es claramente sobre. Es especialmente afortunada la situación en la que M del lema 11.3 está bien fundado; en tal caso tiene un colapso de Mostowski transitivo que debe tener la forma de hLδ , ∈i por el lema de condensación. En este caso, M se identifica con hLδ , ∈i y más simple con Lδ . Lema 11.4. Supongamos que T es una EM-teoría. Entonces M(T, α) está bien fundado para toda α si y sólo si (I) M(T, α) está bien fundado para toda α < ω1 . Demostración. Supongamos que para alguna α, no está bien fundado. Sea M(T, α) = hM, Ei hai : i ∈ ωi ∈ M ω con ai+1 Eai para toda i ∈ ω. Cada ai es de la forma t hM,Ei (x1 , . . . , xj ) para algún término de Skolem t e indicernibles x0 , . . . , xj , así que sea Y un conjunto que consiste en los indicernibles involucrados en estos términos. Si η es la envolvente de Skolem de Y en M(T, α), entonces η no está bien fundado; de hecho, η ∼ = M(T, β), donde β < ω1 es el tipo ordinal de Y . Este resultado motiva el uso de propiedades de partición para obtener EMteorías cuyos modelos son bien fundados y arbitrariamente grandes: Lema 11.5. Sea κ un cardinal con la propiedad κ −→ (ω1 )<ω 2 . Entonces existe una EM- teoría T tal que M(T, α) está bien fundado para toda α < ω1 . Demostración. De acuerdo con el teorema 11.1, Lκ tiene un conjunto no numerable de ordinales indicernibles. Sea T la EM-teoría correspondiente. Entonces, para cualquier α < ω1 , M(T, α) está bien fundado ya que es isomorfa a la envolvente de Skolem en Lκ de los primeros α indicernibles. Lema 11.6. Si existe una EM-teoría tal que M(T, α) está bien fundado para todo α < ω1 , entonces Pot(ω)L es numerable. 708 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 709 ✐ ✐ Conjuntos y modelos. Curso avanzado Demostración. M(T, ω1 ) = Lδ para alguna δ ≥ ω1 , así que Pot(ω)L ⊆ Lδ . En particular, si a ∈ Pot(ω)L , entonces a = t Lδ (x0 , . . . , xn ) para algún término de Skolem t e indicernibles x0 < · · · < xn . Sea hzi : i ∈ ωi una enumeración creciente de los primeros ω indicernibles. Como cada k ∈ ω es definible, k ∈ t Lδ (x0 , . . . , xn ) ⇔ k ∈ t Lδ (z0 , . . . , zn ), y por lo tanto, a = t Lδ (z0 , . . . , zn ). Puesto que existen una cantidad numerables de tales formas, Pot(ω)L debe ser numerable. Las hipótesis del lema 11.5 implican la existencia de una EM-teoría que satisface condiciones adicionales de las que podemos obtener buen provecho. De acuerdo con la prueba del lema 11.5: (i) ρ es el menor ordinal límite tal que Lρ tiene un conjunto de ordinales indicernibles con tipo ordinal ω. (ii) H es el conjunto de indicernibles con los ω elementos menores. (iii) T0 es la correspondiente EM-teoría. Lema 11.7. La siguiente condición es cierta para T = T0 . (II) Para cualquier n-término de Skolem t, T incluye el enunciado t(c0 , . . . , cn−1 ) ∈ OR ⇒ t(c0 , . . . , cn−1 ) < cn . Demostración. Supongamos lo contrario, es decir, t(c0 , . . . , cn−1 ) ∈ OR ∧ cn ≤ t(c0 , . . . , cn−1 ) pertenece a T0 para alguna t. Sean z0 < · · · < zn−1 los primeros n miembros de nuestro conjunto fijo A de indicernibles para Lρ , H = H − {z0 , . . . , zn−1 } y δ = t Lρ (z0 , . . . , zn−1 ) < ρ. De acuerdo con nuestra hipótesis y por propiedades de los indicernibles, δ se puede considerar un ordinal límite (porque si δ = δ+k, donde δ es un ordinal límite y k ∈ ω, entonces t(c0 , . . . , cn−1 ) se puede reemplazar por t(c0 , . . . , cn−1 ) − k) y H ⊆ δ. Ahora probaremos que H es un conjunto de indicernibles para Lδ , lo que contradice la elección mínima de ρ: supongamos que x1 < · · · < xm y y1 < · · · < ym pertenecen a H. Entonces para cualquier fórmula ϕ(v1 , . . . , vm ) Lδ |= ϕ[x1 , . . . , xn ] (90) es equivalente a Lρ |= ϕLδ [x1 , . . . , xn ]; esta relativización es posible pues Lδ ⊆ Lρ son transitivos. 709 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 710 ✐ ✐ 9. El universo construible Note que Lδ es definible en Lρ con δ como parámetro, e incorporando la definición de δ, la ecuación 90 es equivalente a Lρ |= ϕ[x1 , . . . , xm , z0 , . . . , zn−1 ] para alguna ϕ. En forma similar, Lδ |= ϕ[y1 , . . . , ym ] si y sólo si Lρ |= ϕ[y1 , . . . , ym , z0 , . . . , zn−1 ]. Por lo tanto, puesto que H es indicernible para Lρ , H es indicernible para Lδ . Podemos enunciar la siguiente caracterización que se desprende de lo ya mostrado. Lema 11.8. Una EM-teoría satisface la condición (II) del lema 11.7 si y sólo si para cualquier ordinal límite α el conjunto de indicernibles que corresponde a M(T, α) es cofinal en los ordinales de la estructura. Lema 11.9. La siguiente condición es cierta para T = T0 . (III) Para cualquier (m + n + 1)-término de Skolem t, T incluye el enunciado t(c0 , . . . , cm+n ) ⇒ t(c0 , . . . , cm+n ) = t(c0 , . . . , cm−1 , cm+n+1 , . . . , cm+2n+1 ). Por un simple razonamiento con indicernibles, la conclusión se puede reemplazar por t(c0 , . . . , cm+n ) = t(c0 , . . . , cm−1 , ck1 , . . . , ckn+1 ) para cualesquier k1 < · · · < kn+1 con m ≤ k; de hecho, utilizaremos (III) en esta forma. Demostración. Se puede suponer que t(c0 , . . . , cm+n ) < cm S pertence a T0 . Sea H = {Sξ : ξ < ω1 } una partición en conjuntos que consisten en elementos consecutivos de H y tal que |S0 | = m, |Sη | = n + 1 y máx(Sξ ) < mín(Sη ) para 0 ≤ ξ < η < ω1 . Mediante t(S0 , . . . , Sξ ), para 0 < ξ < ω1 denotamos t Lρ (x0 , . . . , xm−1 , y0ξ , . . . , ynξ ), donde S0 = {x0 , . . . , xm−1 } y Sξ = {y0ξ , . . . , ynξ } en orden 710 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 711 ✐ ✐ Conjuntos y modelos. Curso avanzado creciente. Por la propiedad de los indicernibles, basta deducir una contradicción de la suposición t(S0 , Sξ ) 6= t(S0 , Sη ) para algún (y por lo tanto para cualquier) 0 < ξ < η < ω1 . Si t(S0 , Sξ ) > t(S0 , Sη ) para 0 < ξ < η < ω1 , existiría una sucesión infinita y decreciente de ordinales. Por otra parte, si t(S0 , Sξ ) < t(S0 , Sξ ) para 0 < ξ < η < ω1 , es fácil notar que {t(S0 , Sξ ) : 0 < ξ < ω1 } sería un conjunto de indicernibles para Lρ . Sin embargo, el primer elemento y0ω de Sω es el ω-ésimo elemento de H y t(S0 , Sω ) < y0ω por nuestra hipótesis inicial, lo que contradice el que los elementos de H sean los ω menores posibles. A continuación analizaremos en detalle las EM-teorías T que satisfacen las condiciones (I)-(III). Para tal T y cualquier α, por el momento hιT,α : ξ < αi denota la sucesión correspondiente y creciente de indicernibles para M(T, α). (III) implica la siguiente afirmación. Lema 11.10. Si T es una EM-teoría que satisface (I)-(III) y ω ≤ α ≤ β con α un ordinal límite, entonces la envolvente de Skolem de {ιξT,β : ξ < α} en M(T, β) es Lι , donde ι = ιαT,β . En consecuencia, M(T, α) = Lι y ιξT,α = ιξT,α ∀ ξ < α. Demostración. Sea N la envolvente mencionada de Skolem. Es suficiente mostrar que ORN = ιαT,β ; en particular N es transitivo, y la segunda afirmación se sigue de la definición y unicidad de M(T, α). Para simplificar la demostración, prescindiremos de los superíndices T, β en los indicernibles. Si σ es un ordinal en N, para algún término de Skolem t y ξ0 < · · · < ξn−1 < α, σ = t M(T,β) (ιξ0 , . . . , ιξn−1 ) < ιξn < ια , por (II) y ya que α es límite. Recíprocamente, si τ < ια entonces τ = uM(T,β) (ιζ0 , . . . , ιζm−1 , ιη0 , . . . , ιηn ) < ια , para algún término de Skolem u e indicernibles en orden creciente con ζm−1 < α ≤ η0 . 711 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 712 ✐ ✐ 9. El universo construible Por (III), τ = uM(T,β) (ιζ0 , . . . , ιζm−1 , ιζm+1 , . . . , ιζm+n+1 ), que pertenece a N ya que α es un ordinal límite. Así que para cualquier EM-teoría T que satisfaga (I)-(III) y cualquier ξ, tiene sentido definir ιξT = ιξT,α para algún (cualquier) ordinal límite α > ξ, e I T = {ιξT : ξ ∈ OR}. Lema 11.11. Supongamos que T es una EM-teoría que satisface (I)-(III). Entonces (a) LιT ≺ LιT cuando ξ < ζ. (b) (c) (d) (e) ξ ζ |Lξ | = |ξ| + ℵ0 para todo ξ. I T es una clase cerrada y no acotada de ordinales. Para todo ordinal λ > ω, ιλT = λ ∈ I T , por lo que M(T, λ) = Lλ . Si T es una EM-teoría que satisface (I)-(III), entonces T = T. Demostración. (a) Para ordinales infinitos ξ < ζ, (a) se deduce del lema 11.10. En consecuencia, es cierto para ξ < ζ arbitrario mediante un argumento con indicernibles, dentro de algún LιT suficientemente grande. β (b) Si α es un ordinal límite infinito, LιαT es elemento de la envolvente de Skolem de {ιξT : ξ < α} de acuerdo con el lema 11.10. Por lo tanto, |ιαT | = |α| y (b) se sigue para toda ξ. (c) También se deduce del argumento anterior pues {ιξT : ξ < α} es cofinal en ιαT por el lema 11.8. (d) es una consecuencia de (b) y (c). (e) Note que T es la teoría de hLωω , ∈, {ωn+1 : n ∈ ω}i por (d), y por lo tanto está en T. Si suponemos (a) y (d), L resulta la unión de la cadena elemental {Lλ : λ > ω es un cardinal}, así que la relación de satisfacción para L se puede definir en ZFE mediante L |= ϕ[a1 , . . . , an ] ⇔ Lλ |= ϕ[a1 , . . . , an ] 712 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 713 ✐ ✐ Conjuntos y modelos. Curso avanzado para algún (cualquier) λ > ω con a1 , . . . , an ∈ Lλ . En particular, es posible dar una definición de veracidad para L mediante L |= σ ⇔ Lω1 |= σ, para enunciados σ. En consecuencia, el conjunto de enunciados cierto en L es construible. No se puede definir en L por la imposibilidad de definir veracidad, pues ω1 (el auténtico) al ser indicernible no es definible en L. Lema 11.12. Supongamos que T es una EM-teoría que satisface (I)-(III). Entonces (a) LιT ≺ L para todo ξ; ξ (b) C es una clase cerrada y no acotada de ordinales indicernibles para L tal que la envolvente de Skolem de C en L también pertenece a L si y sólo si C = I T. Demostración. Sólo falta verificar la dirección ⇒ de (b). Notemos que C ∩ I T es infinito, así que la EM-teoría correspondiente a C es T. Sea h : C − → I T una biyección que preserva el orden. Se sigue del argumento de unicidad del lema 11.3 que h se extiende a un isomorfismo h̃ : L − → L. Pero entonces h̃ debe ser la identidad (en caso contrario, movería algún ordinal, quitándolo de su rango). Por lo tanto, C = I T . Con el lema 11.11(e) a la mano, podemos definir: 0# es la única EM-teoría que satisface (I)–(III), si existe alguna. En resumen, 0# existe si hay alguna EM-teoría que satisfaga (I)–(III). Mediante la correspondiente aritmetización, 0# se puede considerar como un subconjunto de ω, y su existencia se traduce como la presencia de cierto subconjunto de números naturales. Lema 11.13 (Silver). (a) 0# existe si y sólo si algún Lδ tiene un conjunto inumerable de indicernibles. Por lo tanto, si κ −→ (ω1 )<ω 2 para algún cardinal κ (p. ej., si κ es medible), entonces 0# existe. (b) 0# existe si y sólo si existe una clase I de ordinales caracterizada por: I es una clase cerrada y no acotada de indicernibles para L tal que la envolvente de Skolem de I en L pertenece a L. Más aún, si hιξ : ξ ∈ ORi es la enumeración creciente de I y tiene las siguientes propiedades: si ξ ≤ ζ, 713 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 714 ✐ ✐ 9. El universo construible entonces Lιξ ≺ L y |ιξ | = |ξ|+ℵ0 tal que I contiene solamente cardinales no numerables, y para cualquier ordinal límite α ≥ ω la envolvente de Skolem en Lιξ de {ιξ : ξ < α} pertenece a Lια . Demostración. Se sigue directamente de los lemas 11.11 y 11.12 (eliminando el superíndice T). En resumen, la existencia de 0# es un principio (intrínseco) que proporciona un método para construir L usando una teoría y una clase de ordinales indicernibles como generadores. Teorema 11.14. Supongamos que M es un modelo interno de ZFE , α < ω1M <ω M y κ −→ (α)<ω δ . Entonces (κ −→ (α)δ ) . Por lo tanto, Con(ZFE + ∃ κ∀ α < ω1 (κ −→ (α)<ω 2 ) implica # Con(ZFE + ∃ κ∀ α < ω1 (κ −→ (α)<ω 2 ) + 0 no existe ). Demostración. Supongamos que f : [κ]<ω − → δ con f ∈ M. Debe existir un X ∈ M con tipo ordinal α y homogéneo para f . Como α < ω1M , sea g:ω− → α una biyección con g ∈ M. Sea D = {d : d es una inyección que preserva el orden , d : g[n] − → κ, para algún n cuyo rango es homogéneo para f } y definimos un orden parcial ≺ en D mediante ω d ≺ d si y sólo si d ⊃ d. ω Como g ∈ M y (κ⌣ )M = κ⌣ , (D, ≺ ) ∈ M. Es simple verificar que el siguiente enunciado es un teorema de ZFE: ≺ no está bien fundado si y sólo si existe X de tipo ordinal α homogéneo para f. Así que ≺ no está bien fundado en V . Pero en tal situación, ≺ no está bien fundado en M por absolutez, y, en consecuencia, aplicando el lema 11.13 a M se propicia el resultado buscado. La última afirmación se sigue al tomar M = L en el lema 11.6 (no existe una EM-teoría que satisfaga (I)L ). 714 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 715 ✐ ✐ Conjuntos y modelos. Curso avanzado Note que M sólo necesita ser modelo de un teorema de ZFE suficientemente fuerte para probar el argumento dado en la demostración del teorema 11.14, y que el superíndice < ω se puede reemplazar por n para cualquier n ∈ ω. Si M es un modelo interno M η −→ (α)<ω 2 , asegura que para toda función f : [η]<ω − → 2 tal que f ∈ M, existe X ∈ [η]α (no necesariamente en M) homogéneo para f . Aquí concluye nuestra investigación sobre 0# ; resta sólo mencionar que una de las consecuencias más importantes de 0# es la relación que establece entre V y L, de acuerdo con el teorema de cubierta de Jensen ([DeJen5]): Si 0# no existe entonces L cubre a V , es decir, (∀ x ⊆ OR)(∃ y ∈ L)(x ⊆ y ∧ |y| ≤ |x| + ℵ1 ). Si L cubre a V , existe una estrecha relación entre L y V . Por el teorema de Jensen, el universo tiene trazos de comportamiento construible o debemos aceptar propiedades de grandes cardinales equivalentes a “0# existe”. De hecho, este teorema de cubierta dio origen a la teoría de modelos núcleo. El modelo núcleo primigenio es L, al que siguió el modelo K de Jensen y Dodd [DoJen81], [DoJen82], [DoJen82b], un modelo construible que aproxima un modelo con cardinales medibles. En el volumen 2 veremos que, si existe un cardinal medible, entonces V 6= L. El modelo K satisface la propiedad de cubierta: Si no existe un modelo interno con un cardinal medible, entonces K cubre a V. El modelo núcleo K constituyó un gran avance en la obtención de modelos internos más grandes. Aunque ya se conocían modelos internos con cardinales medibles, no tenían la aproximación adecuada al universo. La construcción de modelos núcleo con otro tipo de grandes cardinales es motivo de intensa actividad en el presente. 12. Ejercicios 1. Sea L un lenguaje que no tiene símbolos de función ni de constante (por ej. LTC). Sea T una L-teoría y A una L-estructura. Entonces A se encaja en algún modelo de T si y sólo si toda subestructura finita de A se encaja en algún modelo de T. 715 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 716 ✐ ✐ 9. El universo construible 2. Muestre que para todo L-modelo infinito A, existe un modelo B de Def cardinalidad |L| tal que A = B y no todo elemento de B es una constante de B. 3. Sea A un L-modelo infinito arbitrario y κ ≥ |L|. Existe un modelo B, Def A = B y tal que para toda fórmula ϕ(x); si ϕ(x) se satisface por una cantidad infinita de elementos de B, entonces ϕ(x) se satisface por κ elementos diferentes de B. 4. Sean M y N modelos de una LTC-teoría T tales que M ⊆ N y T ⊢ ∀ x1 · · · xn (Φ(x1 , . . . , xn ) ⇔ Ψ(x1 , . . . , xn )). Entonces, Φ es absoluta para M, N si y sólo si Ψ lo es. 5. (a) Demuestre que para α > ω, |Lα | = |Vα | ⇔ α = iα . (b) Demuestre que si V = L y α > ω, entonces Lα = Vα ⇔ α = iα . 6. Sea hHα : α ∈ ORi una jerarquı́a acumulativa de conjuntos tal que para S cada α ∈ OR, Def(H) ⊆ Hα+1 . Demuestre que H = α∈OR Hα es un modelo de ZF. 7. Decimos que un conjunto a es definible0 si existe una fórmula Φ(x) de LTC tal que ∀x(Φ(x) ↔ x = a). ¿Es posible definir, en LTC, la relación de ser definible0 ? 8. Sean X y A conjuntos. Se define Def A (X) como el conjunto de todos los subconjuntos de X que son definibles en la estructura hX, ∈, A ∩ Xi por ◦ una fórmula con una sola variable libre del lenguaje LX (A). Sea A un conjunto; la clase L[A] se define por recursión de la siguiente manera: (i) L[A]0 = ∅. (ii) L[A]α+1 = Def A (L[A]α ). S (iii) Para γ esSlı́mite, L[A]γ = α<γ L[A]α . (iv) L[A] = α∈OR L[A]α . 716 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 717 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) Demuestre que: (i) Si γ ≤ α, entonces L[A]γ ⊆ L[A]α . (ii) L[A]α es transitivo. (iii) L[A] es transitiva. (iv) L[A]α ⊆ Vα . (v) L[A] ∩ α = L[A]α ∩ On = α. (vi) Si α < β, entonces α, L[A]α ∈ L[A]β . (vii) On ⊆ L[A]. (viii) Si α ≤ ω, entonces L[A]α = Vα . (ix) Si ω ≤ α, entonces |L[A]α | = |α|. (b) Demuestre que L[A] es un modelo interno de ZF. 9. Demuestre que la relación <• bien ordena las fórmulas de L. 10. Demuestre que la relación <∗ bien ordena la clase de las sucesiones finitas de ordinales. 11. Demuestre que la relación <L bien ordena L. 12. Demuestre que existe una fórmula BO(x, y, a) en LTC tal que ZF ⊢ {(x, y)|BO(x, y, a) es un buen orden para L[a]}. 13. Demuestre AE L[A] . 14. Sea α un ordinal límite mayor que ω. (a) Demuestre que para toda γ < α se tiene que: (Lγ )Lα = Lγ . Por lo tanto, LLα = Lα . (b) Demuestre que H(u, γ) es absoluta para Lα . 15. Demuestre que si α es un ordinal lı́mite mayor que ω, y X ≺1 L[A]α , entonces existen π, β únicos tales que π:X∼ = L[π[A ∩ X]]β . 16. Demuestre que si A ∈ L[A]γ , γ < α, α < ω, α lı́mite y L[A]γ ⊆ X ≺1 L[A]α , entonces existen únicos π y β tales que π:X∼ = L[A]β . 17. Demuestre que si V = L[A], donde A es un subconjunto de un cardinal infinito κ, entonces 2λ = λ+ para todo cardinal κ ≤ λ. 717 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 718 ✐ ✐ 9. El universo construible 18. Un conjunto M es suceptible si es transitivo y satisface las siguientes condiciones: • (∀ x, y ∈ M)({x, y} ∈ M); S • (∀ x ∈ M)( x ∈ M); • ω ∈ M; • (∀ x, y ∈ M)(x × y ∈ M); • Si R ⊆ M es una relación definible mediante una Σ0 -fórmula con parámetros en M, entonces (∀ x ∈ M)(R ∩ x ∈ M). La teorı́a básica de los conjuntos TBC es aquella que parte de los siguientes axiomas: • Ext • Ind: ∀~a(∀x((∀y ∈ x)Φ(y,~a) ⇒ Φ(x,~a)) ⇒ ∀xΦ(x,~a)), donde Φ es una fórmula de LTC. • Unión • Inf • Prod: ∀x∀y∃z∀u(u ∈ z ⇔ (∃a ∈ x)(∃b ∈ y)(u = (a, b))) • Σ0 -Comp: ∀~a∀x∃y∀z(z ∈ y ⇔ z ∈ x ∧ Φ(~a, z)), donde Φ es una Σ0 fórmula de LTC. (a) Demuestre que un conjunto suceptible es modelo de la teoría TBC. (b) Una estructura hM, ∈, Ai es susceptible si M es un conjunto susceptible y A∩u ∈ M para todo u ∈ M. Pruebe que para cualquier ordinal límite α > ω, la estructura hLα [A], ∈, A ∩ Lα [A]i es suceptible. 19. Una función f : V n − → V es primitivo-recursiva (p.r) si está generada (mediante composición) por los siguientes esquemas: (i) f (x1 , . . . , xn ) = xi (1 ≤ i ≤ n); (ii) f (x1 , . . . , xn ) = {xi , xj } (1 ≤ i, j ≤ n); (iii) f (x1 , . . . , xn ) = xi − xj (1 ≤ i, j ≤ n); (iv) f (x1 , . . . , xn ) = h(g1 (x1 , . . . , xn ), . . . , gk (x1 , . . . , xn )), donde h, g1 , . . . , gk son p.r. y donde z ∈ h(y) ⇒ rg(z) < rg(y). Las funciones generadas por los esquemas (i)–(v) se conocen como rudimentarias y desempeñan un papel fundamental en la teoría de la estructura fina. 718 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 719 ✐ ✐ Conjuntos y modelos. Curso avanzado (a) Demuestre que las siguientes funciones son p.r.: f (x1 , . . . , xn ) = [ xi (1 ≤ i ≤ n); f (x1 , . . . , xn ) = xi ∪ xj (1 ≤ i, j ≤ n); f (x1 , . . . , xn ) = {x1 , . . . , xn }; f (x1 , . . . , xn ) = (x1 , . . . , xn ); f (x1 , . . . , xn ) = ∅. (b) Muestre que si la función f (y, x1 , . . . , xn ) es p.r., también lo es la función g(y, x1 , . . . , xn ) = (f (z, x1 , . . . , xn ) : z ∈ y). Una relación R ⊆ V n es p.r. si existe una función p.r. f : V n − → V tal que R = {(x1 , . . . , xn ) : f (x1 , . . . , xn ) 6= ∅}. (c) Demuestre lo siguiente: (i) Si f y R son p.r., también lo es g(x1 , . . . , xn ) = ( f (x1 , . . . , xn ), ∅, si R(x1 , . . . , xn ) si ¬R(x1 , . . . , xn ). (ii) R es p.r. si y sólo si χR (la función característica de R) es p.r. (iii) R es p.r. si y sólo si ¬R es p.r. (iv) Sean fi : V n − → V p.r. para i = 1,S. . . , m y Ri ⊆ V n p.r. para n n i, . . . , m, tales que Ri ∩ Rj = ∅ para i 6= j y m i=1 Ri = V . Defina f : V − → V mediante f (x1 , . . . , xn ) = fi (x1 , . . . , xn ) ⇔ Ri (x1 , . . . , xn ); entonces f es p.r. (v) Si R(y, x1 , . . . , xn ) es p.r., también lo es f (y, x1 , . . . , xn ) = {z ∈ y : R(z, x1 , . . . , xn )}. (vi) Sea R(y, x1 , . . . , xn ) p.r. tal que (∀ x1 · · · xn )(∃ !y)R(y, x1 , . . . , xn ). Defina f mediante f (y, x1 , . . . , xn ) = ( z ∈ y tal que R(z, x1 , . . . , xn ), ∅, si existe tal z si no existe tal z. Entonces f es p.r. 719 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 720 ✐ ✐ 9. El universo construible (vii) Si R(y, x1 , . . . , xn ) es p.r., también lo es (∃ z ∈ y)R(z, x1 , . . . , xn ). S (viii) Si R ⊆ V n son p.r. para i = 1, . . . , m, también lo son m i=1 Ri y R . i i=1 (ix) Las funciones (x)0 , (x)1 , dom(x), ran(x) son p.r. (x) Las relaciones x = y y x ∈ y son p.r. (d) Muestre que si f : V n − → V es p.r., existe una Σ1 -fórmula Φ de LTC tal que Tm y = f (x1 , . . . , xn ) ⇔ Φ(y, x1 , . . . , xn ). (e) Muestre que las funciones ordinales α + 1, α + β, α · β, αβ son p.r. (f) Sea f (y, x1 , . . . , xn ) p.r. Mediante recursión, defina las funciones ν f , ν ∈ OR por f 0 (y, x1 , . . . , xn ) = y; f ν+1 (y, x1 , . . . , xn ) = f (f ν (y, x1 , . . . , xn ), x1 , . . . , xn ); f λ (y, x1 , . . . , xn ) = [ f ν (y, x1 , . . . , xn ), si Lím(λ); ν<λ Sea g la función g(ν, y, x1 , . . . , xn ) = f ν (y, x1 , . . . , xn ). Muestre que g es p.r. (g) Muestre que la función cerradura transitiva CT (x) es p.r. (h) Muestre que cualquier predicado definido por una Σ0 -fórmula de LTC es p.r. [Sugerencia: Use inducción sobre fórmulas; utilice (c) (iii), (vii) y (viii).] (i) Muestre que las siguientes funciones son p.r.: • f (u) = {x : Cte(x, u)}; • f (u =) = {x : Var(x)}; • f (u) = {x : Fml(x, u)}; • f (u) = {x : Sat(u, x)}; • f (u) = Def (u). (j) Muestre que la función (Lν : ν ∈ OR) es p.r. 720 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 721 ✐ ✐ Conjuntos y modelos. Curso avanzado 20. La teoría Kripke-Platek (KP) es la LTC-teoría cuyos axiomas son los de TBC junto con el esquema de Σ0 colección, Σ0 -Col: ∀~a[∀ x∃ yΦ(y, x,~a) ⇒ ∀ u∃ v(∀ x ∈ u)(∃ y ∈ v)Φ(y, x,~a)], donde Φ es un Σ0 -fórmula de LTC. Un conjunto admisible es un conjunto susceptible M tal que para cualquier relación R ⊆ M × M definible mediante una Σ0 -fórmula con parámetros en M, si (∀ x ∈ M)(∃ y ∈ M)R(y, x), entonces para cualquier u ∈ M existe v ∈ M tal que (∀ x ∈ u)(∃ y ∈ v)R(y, x). Muestre que un conjunto admisible es un modelo de KP. 21. Investigaremos el siguiente problema: conforme α varía entre los ordinales límite, ¿cuántos conjuntos de L-enunciados son teorías de algún Lα ? (a) Sea Σ el conjunto de todos los conjuntos de L-enunciados de la forma {ϕ :|=Lα ϕ} para algún ordinal límite α. Muestre que |Σ| ≤ |ω1L |. ¿Será cierto también que |Σ|L ≤ |ω1L |L ? (b) Sea (ϕn : n < ω) la enumeración lexicográfica de los enunciados de L como se hizo para encontrar un buen orden de L. Muestre que no existe una fórmula ϕ(v0 ) de L tal que ◦ |=Lα ϕn ⇔|=Lα ϕ(n). [Sugerencia: Use diagonalización. Sea (ψn : n < ω) la enumeración lexicográfica de las L-fórmulas cuya variables libres son a lo sumo v0 . Considere la fórmula “v0 es un número natural” ∧ ∃ k[“k es un número natural” ∧ (ϕk = ∗ψv0 (v0 )∗) ∧ ¬ϕ(k)], donde ∗ψm (n)∗ denota la fórmula que se obtiene de ψm (v0 ) reemplazando toda ocurrencia libre de v0 por el término que denota el entero n.] (c) Muestre que |σ| = |ω1L |. [Sugerencia: Primero reduzca el problema a demostrar que |Σ| > ω. Después suponga que |Σ|L = ω y sea T el <L menor subconjunto de ω × ω tal que (T [{n}] : n < ω) enumera todos los 721 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 722 ✐ ✐ 9. El universo construible miembros de Σ mediante la enumeración (ϕn : n < ω) de L-enunciados en (b). Ahora considere la L-teoría de LωL y busque una contradicción 1 con (b).] Una solución alternativa a la pregunta original se puede obtener exhibiendo un conjunto no acotado A ⊆ ω1L tal que siempre que α, β ∈ A y α 6= β, entonces las teorías de Lα y Lβ son diferentes. Esto se puede hacer como sigue: (d) Haga A = {α ∈ ω1L : Lím(α) ∧ todo elemento de Lα es definible (sin el uso de parámetros) en Lα }. Muestre que A no es acotado en ω1L . (e) Muestre que si α, β ∈ A son distintos, entonces Lα y Lβ tienen teorías diferentes. [Sugerencia: Use (b)]. 22. Se sabe que es consistente con ZFE que todo árbol de Aronszajn es Qencajable (véase el Ejer. 7.71). Muestre que si V = L, existe un árbol de Aronszjan R-encajable que no es Q-encajable. [Sugerencia: Tome como elementos de T el conjunto de sucesiones inyectivas numerables de enteros, cuyos rangos son cofinitos en ω, ordenadas por inclusión. Construya T por recursión en los niveles para que satisfaga la siguiente condición: si α < β < ω1 y s ∈ Tα y σ es un conjunto finito de enteros ajeno a ran(s), existe t ∈ Tβ tal que s ⊆ t y σ ∩ ran(t) = ∅. Use V = L para asegurar que si f : T − → A fuera un encaje, existiría un ordinal límite α < ω1 tal que para cada x ∈ Tα , existe y ∈ T , y <T x tal que f (y) = f (x).] 23. Suponga que V = L[A], donde A ⊆ ω1 . Pruebe que ♦ es válido. [Sugerencia: Para cada ordinal límite α, sea (Sα , Cα ) la <L[A]∩α -menor pareja de subconjuntos de α en L[A ∩ α] tal que Cα es un club en α y Sα ∩ γ 6= Sγ para toda γ ∈ Cα , siempre que sea posible. Prosiga como en la demostración de que ♦ es válido en presencia de V = L.] 24. (a) Suponga que V = L[A], donde A ⊆ ω1 . Pruebe que ♦+ es válido. → ω1 por casos, dependiendo de A. Si [Sugerencia: Defina δ : ω1 − ω1 = ω1L[A∩ω1 ] para alguna α < ω1 , sea α0 el menor de tales α y sea δ(α) = ω1 ∩ Mα , donde Mα es el menor con M ≺ Lω1 [A] y α, α0 ∈ M. En otro caso, sea δ(α) = ω3L[A∩α] (que es numerable en 722 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 723 ✐ ✐ Conjuntos y modelos. Curso avanzado virtud de 23), y sea α0 = ω. Para α < ω1 , sea α̃ = máx{α, α0 }. Defina Sα = Pot(α) ∩ Lδ(α) [A ∩ α]. Prosiga como en la demostración de que ♦+ es válido, pero sólo hay un caso, y no dos, por considerar.] (b) Pruebe que si no hay árboles de Kurepa, entonces ω2 es inaccesible en L. [Sugerencia: Use (a), junto con un argumento de absolutez concerniente a árboles de Kurepa.] 25. Demuestre que si M es transitivo, entonces cl(M) también lo es. 26. Demuestre que si M es una clase extensional y cerrado bajo las operaciones de Gödel, y π es el isomorfismo dado por el teorema del colapso, entonces π(Fi (X, Y )) = Fi (π(X), π(Y )), para i = 1, . . . , 10 y para todo X, Y ∈ M. 27. Si M es un conjunto transitivo y Fi es una función primitiva de Gödel tal que Fi (a, b) ⊆ M, entonces Fi (a, b) = Fi (a ∩ M, b ∩ M). 28. Sean Fi una operación primitiva de Gödel, M un conjunto transitivo y a, b ∈ Def(M). Pruebe que Fi (a, b) ∩ M ∈ Def(M). 29. Muestre directamente que el primer cardinal (fuertemente) inaccesible no es débilmente compacto. [Sugerencia: Suponga que κ es el primer cardinal inaccesible y escriba fórmulas de Lκκ usando sólo las relaciones ∈, = ˙ que expresen: (a) El universo está bien fundado y satisface el axioma de extensionalidad. (b) Existe un ordinal más grande. (c) Cada ordinal es numerable o accesible (es decir, singular o menor o igual que la potencia de algún ordinal menor). (d)γ El universo es cerrado respecto a subconjuntos de cardinalidad ≤ γ (aquí se requiere un cuantificador universal ∀ (xξ )ξ<γ ). Si Γ es {(a), (b), (c)} ∪ {(d)γ : γ < κ}, muestre que Γ no tiene modelo, pero cualquier subconjunto de cardinalidad < κ tiene un modelo]. 30. Muestre que los cardinales débilmente compactos (sin suponer que son inaccesibles) deben ser débilmente Mahlo, débilmente hipermahlo, etcétera. [Sugerencia: Suponga que A ⊆ α es un club pero no contiene cardinales 723 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 724 ✐ ✐ 9. El universo construible regulares. Escriba Lαα -fórmulas con un símbolo adicional de 1-relación P para expresar: • El universo está bien fundado. • P es una clase cerrada y no acotada de ordinales no regulares. • P(δ) para cada δ ∈ A, es decir, ∃ x(φδ (x)∧P(x)), donde φδ (x) describe a δ como en el ejemplo 10.3. • Existe un ordinal más grande. Muestre que este conjunto no tiene modelo pero que cualquier subconjunto de cardinalidad < α tiene un modelo, así que α no es débilmente compacto. Este proceso se puede continuar para obtener enunciados cada vez más fuertes, sin límite (véase [Ha64])]. 31. Muestre que si α = βγ para β, γ < α, entonces α no es débilmente compacto. [Sugerencia: Suponga que f : α − → βγ es una biyección; añada una 3-relación P a Lαα y escriba fórmulas que expresen: • El universo está bien fundado y satisface extensionalidad. • Para cada ordinal δ, P(δ, x, y) define una función gδ : γ − → β, si y sólo si δ 6= δ′ , entonces gδ 6= gδ′ . • Para cualesquier δ, ζ, η tales que f (δ)(ζ) = η, la fórmula ∃ x, y, z(φδ (x) ∧ φζ (y) ∧ φη (z) ∧ P(x, y, z)), (donde φδ (x), etc., como en el Ej. 10.3). • Existe un ordinal más grande. Muestre que este conjunto de fórmulas no tiene modelo, pero si α es regular, cualquier subconjunto de cardinalidad menor que α tiene un modelo]. 32. Demuestre que las siguientes afirmaciones son equivalentes. (a) Para cualquier subconjunto U ⊆ Vκ , la estructura hVκ , ∈, Ui tiene un extensión elemental propia hA, ∈ U ′ i, donde κ ∈ A y A es transitivo. (b) Para cualquier n-relación R en κ, hκ, <, Ri tiene una Lκκ - extensión elemental hα, <, Ri con κ < α. 33. Demuestre el teorema de Łoś para Lκκ lenguajes, tomando el ultraproducto módulo un ultrafiltro κ-completo. 34. Demuestre que las siguientes afirmaciones son equivalentes: (a) 0# existe. L (b) Para todo cardinal λ > ω, λ −→ (λ)<ω 2 . 724 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 725 ✐ ✐ Conjuntos y modelos. Curso avanzado L (c) Para algún η, η −→ (ω1 )<ω 2 . 35. Demuestre que Vω es un modelo de ZF − Inf . 36. Muestre que Lω = Vω . 37. Sea (Hα : α ∈ OR) una jerarquía acumulativa y suponga que para cada α, Def (Hα ) ⊆ Hα+1 . Demuestre que H= [ Hα α∈OR es un modelo de ZF . 38. Sea M un término clase transitivo. Demuestre lo siguiente: (a) Si M |= |X| ≤ |Y |, entonces |X| ≤ |Y |. (b) Si α ∈ M y si α es un cardinal, entonces M |= “α es un cardinal”. 39. La operación clausura transitiva CT (x) es absoluta para modelos transitivos de ZF . 40. Si M es un modelo transitivo de ZF y es un conjunto, entonces LM = Lα , donde α es el mínimo ordinal que no pertenece a M. 41. En el volumen II estudiaremos con detalle la jerarquía de Jensen que a continuación definimos: sea (Jα : α ∈ OR) una jerarquía acumulativa definida como: J0 = ∅ Jα = [ Jβ α un ordinal límite β<α Jα+1 = cl(Jα ∪ {Jα }), donde cl es la cerradura respecto a las operaciones primitivas de Gödel. Muestre lo siguiente: (a) S Jα es transitivo para toda α ∈ OR. S (b) α∈OR Jα es un modelo de ZF (así que L ⊆ α∈OR Jα ). (c) La fórmula K(α) = Jα es absoluta para L, y en consecuencia L = S α∈OR Jα . (d) La clase C = {α : Jα = Lα } es cerrada y no acotada. 42. Si M es un modelo transitivo de ZF , entonces Vω ⊆ M, por lo que “x es finito” es absoluto para M. 725 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 726 ✐ ✐ 9. El universo construible 43. S Si {Mi : i ∈ I} es una cadena de conjuntos transitivos adecuados, entonces i∈I Mi es transitivo y adecuado. 44. Para toda β ≥ ω, existe α ≥ β tal que |α| = |β| y Lα es adecuado. Aun más, si κ es un cardinal regular no numerable, entonces {α < κ : Lα es adecuado} es un club κ. 45. Sea M un modelo transitivo de ZF− . Entonces M es adecuado. 46. Si α ≥ ω y X es un conjunto construible contenido en α. Muestre que x ∈ Lβ , donde β es el menor cardinal en L mayor que α. 47. Si X ∈ L, entonces X ∈ Lα , donde α es el menor cardinal infinito en L mayor que |CT (X)|L . 48. Si κ es un cardinal no numerable y regular en L, entonces Lκ es un modelo de ZF− . 49. Si κ es inaccesible en L, entonces Lκ = VκL = Vκ ∩ L y Lκ es un modelo de ZFE +(V=L). 50. Si Lα es adecuado y X ≺ hLα , ∈i, entonces X es isomorfo a algún Lβ , β ≤ α. 51. Si Lα es adecuado, entonces el modelo hLα , ∈i tiene funciones de Skolem definibles. Por lo tanto, para todo X ⊆ Lα , existe un modelo M ≺ hLα , ∈i (el más pequeño posible) tal que X ⊆ M. 52. (V=L) Si M ≺ hLω1 , ∈i, entonces M = Lα para algún α. 53. (V=L) Si M ≺ hLω2 , ∈i, entonces ω1 ∩ M = α, para algún α ≤ ω1 . 54. Demuestre que la fórmula ϕ(x) ≡ “x es numerable” es Σ1 . También pruebe que |X| ≤ |Y | y |X| = |Y | son Σ1 . 55. Muestre que la función CT (X) es ∆1 . 56. Si G es una Σn -función (n ≥ 1) y F se define por ∈-inducción usando G, entonces F es una Σn -función. 57. La función F (x) = rg(x) es ∆1 . 58. Sea σ un teorema de ZF y P(x) una propiedad U-absoluta para todo modelo transitivo de Σ; entonces P(x) es Σ1 . [Sugerencia: P(x) ⇔ ∃ M(M transitivo, x ∈ M, M |= σ ∧ P(x)]. 59. Demuestre que la siguiente función es primitivo recursiva y ∆1 . hM, Ei 7→ {(ϕ,~a) : ϕ ∈ Fml(LTC),~a ∈ M n , hM, Ei |= ϕ[~a]}. 726 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 727 ✐ ✐ Conjuntos y modelos. Curso avanzado 60. Si M es un conjunto cerrado respecto a las operaciones de Gödel y la función CT (X), entonces CT (X) es una ∆1 -función en M. 61. (ZFE ) Sea σ un teorema de ZFE tal que σ implica Ext, y sea P(x) una propiedad U-absoluta para modelos transitivos de σ. Entonces P(x) es Σ1 en HC. [Sugerencia: P(x) ⇔ ∃ M numerable tal que X ∈ M y M |= σ ∧ P(x) ⇔ ∃ M numerable y transitivo, X ∈ M y M |= σ ∧ P(x)]. 62. Si σ es Σ1 es un enunciado cierto en hHC, ∈i, entonces σ es cierto en hHCL , ∈i. 63. Si M es un conjunto transitivo, entonces M ≺ 0 V . 64. Sea n un número natural. Para todo conjunto M0 existe M ⊇ M0 tal que M ≺ nV . 65. Muestre que el orden <L bien ordena Lκ , κ ≥ ω con tipo ordinal κ. 66. Pruebe que si κ es inaccesible débil (en V ), entonces κ es inaccesible en L. Deduzca que no podemos encontrar una demostración en ZF de la existencia de cardinales inaccesibles débiles. 67. Muestre que los ordinales γ < ω para los cuales L ∩ Vγ = Lγ son precisamente los cardinales para los cuales se cumple γ = ℵγ . 68. Demuestre que si Con(ZFE + “existe un cardinal inaccesible”) implica Con(ZFE + ∀ α∃ β > α(Lβ |= ZF )). 69. Sean X un conjunto transitivo y Y ⊆ X. Decimos que Y es un subconjunto de X definible pequeño, si Y ∈ Def (X) y para alguna X ∈ Y , Y = S Pot(X) ∩ X o Y = X o Y = f [X] para alguna función f ∈ Def (X). Muestre que si Def0 (X) es el conjunto de todos los subconjuntos de X definibles pequeños, entonces Def0 (X) es ∆ZF 1 . 70. Suponga que X es un conjunto transitivo que tiene a ω como miembro. Defina T0 (X) = X Tα+1 = Def0 (Tα (X)) Tλ (X) = [ Tα (X) para lím(λ) α<λ T = [ Tα (X). α∈OR 727 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 728 ✐ ✐ 9. El universo construible Demuestre que T (X) es un modelo de ZF y que si M es un modelo transitivo de ZF , con X ∈ M, entonces T M (X) = T (X). Deduzca que T (X) es el modelo más pequeño de ZF que contiene a X; en particular, si X = ω∪{ω}, entonces T (X) = Lξ0 , el modelo más pequeño de ZF. Concluya que no podemos probar que Def0 (Tα (X)) ⊆ Tα (X) para ninguna X. [Sugerencia: Muestre que TαM (X) = Tα (X) por inducción para toda α ∈ M y note que Def0 (T M (X)) ⊆ T M (X), ya que éste es un modelo de ZF ]. 71. Muestre que OD(X) y HOD(X) son ΣZF 2 , donde OD(X) si y sólo si para ~ , X es el único conjunto tal que ϕ(X, α ~ ) es alguna fórmula ϕ y ordinales α cierta. HOD(X) es la fórmula CT (X) ⊆ OD(X). 72. Sea X el término clase {Vα : α ∈ OR} y sea Y la cerradura de X respecto a las funciones de Gödel. Muestre que Y = OD. 73. Demuestre que OD ∩ Pot(ω) = HOD ∩ Pot(ω) es el subconjunto más grande de Pot(ω) con un buen orden definible. 74. El n-tipo de una n-nada a0 , . . . , an−1 de elementos de una estructura A es el conjunto de L-fórmulas Φ(v0 , . . . , vn−1 ) tales que A |= Φ[a0 , . . . , an−1 ]. Decimos que A realiza el n-tipo Φ si A |= Φ. Muestre que si A es infinita, entonces Teo(A) tiene modelos arbitrariamente grandes pero que realiza a lo sumo λ n-tipos distintos, donde λ es la cardinalidad del lenguaje de A. 75. Muestre que para alguna teoría T (con un orden definible <) cualquier ′ estructura A modelo de T tal que <A es infinito, tiene una extensión ′ elemental A′ en el cual <A no está bien fundado. Deduzca que ningún conjunto de axiomas de primer orden puede asegurar que una relación dada es un buen orden en todo modelo de los axiomas, a menos que implique que la relación es finita. 76. Un cardinal κ es un cardinal Rowbottom si siempre que A = hA, U, . . .i es una estructura de un lenguaje numerable, |A| = κ, U ⊆ A y |U < κ; entonces A tiene una subestructura elemental B = hB, U ′ , . . .i con |B| = κ, |U ′ | ≤ ℵ0 . Muestre que todo cardinal Ramsey es un cardinal Rowbottom, donde κ es un cardinal Ramsey si κ −→ (κ)<ω 2 . Demuestre que ω no es un cardinal Ramsey. 77. Muestre que si existe un cardinal Rowbottom, entonces |Pot(ω)∩L| = ℵ0 y que ℵ1 es inaccesible. [Sugerencia: Use la estructura hLκ , Pot(α) ∩ L, {β : β ≤ α}i, donde κ es Rowbottom y α < ω1 , para probar que Pot(α) ∩ L 728 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 729 ✐ ✐ Conjuntos y modelos. Curso avanzado es numerable y, por lo tanto, ω1 6= (α+ )L ; recuerde que HGCL , por lo que los inaccesibles son inaccesibles débiles y viceversa]. 78. Muestre que κ es un cardinal Rowbottom si y sólo si para cualquier f : [κ]<ω − → λ, donde λ < κ, existe un conjunto X ⊆ κ con |X| = κ tal <ω que |f [[X] ]| ≤ ℵ0 . 729 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 730 ✐ ✐ 9. El universo construible 730 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 731 ✐ ✐ Bibliografía [Am97] J. A. Amor. 1997. Teoría de conjuntos para estudiantes de ciencias. México, unam (Facultad de Ciencias). [Bar75] J. Barwise. 1975. Admissible sets and structures. Berlin, Springer-Verlag. [BaPr76] J. Baumgartner y K. Prikry. 1976. “On a theorem of Silver”. Discrete Math., 14: 17–21. [BeSl69] J. L. Bell y A. B. Slomson. 1969. Models and ultraproducts: an introduction. 3rda. imp. revisada. Nort-Holland. [Bern37] P. Bernays. 1937, 1942. “A system of axiomatic set theory I, III”, J. Symb. Logic, 2, 7, 65–77, 65–89. [Bor98] [Bor05] E. Borel. 1898, 1950. Lecons sur la théorie des fonctions, Paris, Gauthier-Villars. 1905. Lecons sur les fonctions de variables reelles, Paris, Gauthier-Villars. [BuMa91] M. Burke y M. Magidor. 1990. “Shelah’s pcf theory and applications”. Annals of pure App. Logic, 50: 207–254. [Can70] [Can72] [Can72a] [Can79] [Can84] [Can85] [Can95] G. Cantor. 1870. “Beweis, daß eine für jeden rellen Wert von x durch eine trigonometrische Reihe gegebene Funktion f (x) sich nur auf eine einzige Weise in dieser Form darstellen läßt”. J. reine ang. Math. 72: 139–142. 1872. “Über die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Reihen”. Math. Ann., 5: 122–132. 1870. “Über einen die trogonometrischen Reihen betreffenden Satz”. J. reine und ang. Math., 72: 130–138. 1879. “Über unendliche lineare Punktmanichfaltigkeiten”. Math. Ann, 15: 1–7. 1884. “Über unendliche lineare Punktmanichfaltigkeiten”. Math. Ann., 23: 139–246. 1885. “Über verschiedene Theorems aus der Theorie der Punktmengen in einem n-fach ausgedehntes stetigen Räume Gn ”. Zweite Mitteilung. Acta Math., 7: 105–124. 1895. “Beiträge zur Begründung der transfiniten Mengenlehre”. Math. Ann., 46: 481–512. 731 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 732 ✐ ✐ Bibliografía [Can32] 1932. Gesammelte Abhandlungen mathematischen und philosophischen Inhalts. Berlin, Hrsg. von E. Zermelo, Springer-Verlag. [CK90] C. Chang y J. Keisler. 1990. Model Theory. 3rda. ed. Amsterdam, North-Holland. [Coh63] P. Cohen. 1965.“Independence results in set theory”. En Theory of models Proc. Symp. Berkeley, North-Holland, pp. 39–54. P. Cohen. 1963. “The independence of the continuum hypothesis I, II”. Proc. Nat. Acad. Sci., USA, 50: 1143–1148. [Coh63b] [De73] K. Devlin. 1973. “Measurable cardinals and a combinatorial principle of Jensen”. J. of Symb. Logic, 38: 551–560. [De77] K. Devlin. 1977. The axiom of constructibility. A guide for the mathematician. Berlin, Springer-Verlag (Lect. Notes Math. 617). [DeShe78] K. Devlin y S. Shelah. 1978. “A weak version of ♦ which follows from 2ℵ0 < 2ℵ1 ”. Israel J. Math., 29: 239–247. [De79] K. Devlin. 1979. “Variations on ♦”. J. Symb. Logic, 44: 51–58. [De84] K. Devlin. 1984.Constructibility. Berlin, Springer-Velag. [De94] K. Devlin. 1993. The Joy of Sets. Berlin, Springer-Verlag. [DeJo74] K. Devlin y H. Johnsbraten. 1974. The Souslin problem. Berlin, Springer-Verlag (Lect. Notes Math. 405). [DeJen5] K. Devlin y R. Jensen. “ Marginalia to a theorem of Silver”. En G. H. Müller, A. Oberschelp, K. Potthoff (eds.) (Lect. Notes Math. 499). 115–142. [Dick74] M. Dickman. 1974. Large infinitary languages–Model Theory. Amsterdam, NorthHolland. [Do96] K. Doets. 1996. Basic Model Theory. FoLLI. [DoJen81] A. Dodd y R. Jensen. 1981. “The core model”. Ann. Math. Logic, 20: 43–75. 1982. “The covering lemma for K”. Ann. Math. Logic, 22: 127–135. [DoJen82] [DoJen82b] 1982. “The covering lemma for L[U]”. Ann. Math. Logic, 22: 1–30. [Dra74] [DraSi96] F. Drake. 1974. Set Theory. An Introduction to Large Cardinals. Amsterdam, North Holland. F. Drake y D. Singh. 1996. Intermediate Set Theory. John Wiley & Sons. [Ek80] P. Eklof. 1980. Set theoretic methods in homological algebra ans abelian groups. Les Presses de Canada, Université de Montreal. [EkMe90] P. Eklof y A. Mekler. 1990. Almost free modules. Amsterdam, North-Holland. [End77] [End87] H. Enderton. 1977. Elements of Set Theory. Academic Press. 1987. Una introducción matemática a la lógica. México, unam. [En89] R. Engelking. 1989. General Topology, 2a ed. revisada. Berlin, Heldermann–Verlag. [Ers67] Yu. L. Ersov. 1967. “Fields with a solvable theory”. Soviet Math. Dok., 174: 19–20. [Fran22] A. Fraenkel. 1922. “Zu den Grundlagen der Cantor-Zermeloschen Mengenlehre”. Math. Ann., 86: 230–237. 732 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 733 ✐ ✐ Conjuntos y modelos. Curso avanzado [Fran27] A. Fraenkel. 1927. Zehn Vorlesungen über die Grundlegung der Mengenlehre. Leipzig, Teubner. [GalHaj75] F. Galvin y A. Hajnal. 1975. “Inequalities for cardinal powers”. Ann. of Math., 101: 491–498. [Gi89] [Gi91a] [Gi91b] M. Gitik. 1989. “The negation of the singular cardinal hypothesis from o(κ) = κ++ ”. Ann. Pure Appl. Logic, 43: 209–234. 1991. “The strength of the failure of the singular cardinal hypothesis”. Ann. Pure Appl. Logic, 51: 215–240. M. Gitik y M. Magidor. 1991. “The singular cardinal hypothesis revisited”. W. Just, H. Judah y H. Woodin (eds.). Set theory of the continuum. Berlin, Springer-Verlag, pp. 243–279. [Glo72] K. Gloede. 1972. “Ordinals with partition properties and the constructible hierarchy”. Zeit. Math. Logik., 18: 135–164. [Göd30] K. Gödel. 1930. “Die Vollständigkeit des logischen Funktionenkalkülus”. Monat. Hef. Math. Phys., 37:. 1931. “Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I”. Monat. Hef. f. Math. u. Phys., 38:173–198. 1938. “The consistency of the axiom of choice and the generalized continuum hypothesis”. Proc. Nat. Acad. Sci., usa 24: 556–557. 1938. “Consistency proof of the generalized continuum hypothesis”. Proc. Nat. Acad. Sci., usa 25: 220–224. 1940. The consistency of axiom of choice and of the generalized continuum hypothesis. Princeton, Univ. Press. [Göd31] [Göd38] [Göd38b] [Göd40] [Gre76] J. Gregory. 1976. “Higher Souslin trees and the generalized continuum hypothesis”. J. Symb. Logic, 41: 663–671. [Ha64] W. P. Hanf. “Incompactness in languages with infinitely long expressions”. Fund. Math., 53: 309–324. [Haus08] F. Hausdorff. 1908. “Grundzüge einer Theorie der geordneten Mengen”. Math. Ann., 65: 435–443. 1914. Grundzüge der Mengenlehre. Leipzig, [Haus14] [Hei70] H. Heine. 1870. “Über trigonometrische Reihen”. J. reine u. angw. Math., 71: 353– 365. [Hen70] H. Henkel. 1870. “Untersuchungen über die unendlich oft oszillierenden und unstetigen Funktionen”. [Hen49] L. Henkin. 1949. “The completeness of the first-order functional calculus”. J. Symb. Logic, 14 [Hens98] C. W. Henson. 1998. Model theory. (Class notes). University of Illinois, 733 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 734 ✐ ✐ Bibliografía [Her98] F. Hernández. 1998. Teorı́a de conjuntos. Aportaciones matemáticas. SMM. (Serie Textos 13). [Hess06] G. Hessenberg. 1906. “Grundbegriffe der Mengenlehre”. Abh. Friess. Schule, 4: 477–778. [Hil25] [Hil99] D. Hilbert. 1925. “Über das Unendliche”. Math. Ann., 95: 161–190. 1899. Grundlagen der Geometrie. Leipzig, Teubner. [Hod97] [Hod93] W. Hodges. 1997. A Shorter Model Theory. Cambridge, Cambridge University Press. 1993. Model Theory. Cambridge, Cambridge University Press. [HrJe84] K. Hrbacek y T. Jech. 1984. Introduction to Set Theory. Marcel Dekker. [Hu74] T. Hungerford. 1974. Algebra. Berlin, Springer–Verlag, [Jac64] N. Jacobson. 1964. Lectures in abstract algebra, 3, N. J., Van-Nostrand. [Jac06] E. Jacobsthal. 1906. “Über den Aufbau der transfiniten Arithmetik”. Math. Ann., 66: 145–194. [Je71] [Je73] T. Jech. 1971. “Trees”. J. Symb. Logic, 36: 1–14. 1971. “Some combinatorial problems concerning uncountable cardinals”. Ann. Math. Logic., 5: 165–198. 1973. The Axiom of Choice. Amsterdam, North Holland. 1992. “Singular Cardinal problem: Shelah’s theorem on 2ℵω ”. Bull. London Math. Soc., 24: 127–139. 1995. “Singular Cardinals and the PCF Theory”. Bulletin of the Association of Symbolic Logic, 1, 4: 408–424. 1997. Set Theory. 2a. ed. Berlin, Springer-Verlag. [Je73b] [Je92] [Je95] [Je97] [JenLen89] C. Jensen y H. Lenzig. 1989. Model theoretic Algebra with particular emphasis of fields, rings, modules. Gordon Breach. [Jen67] R. Jensen. 1967. Modelle der Mengenlehre Widerspruchfreiheit und Unabhängigkeit der Kontinuum-Hypothese und der Auswahlaxioms. Berlin, Springer-Verlag (Lecture Notes Math. 37). [JenFried68] H. Friedman y R. Jensen 1968. “Note on admissible ordinals”. Berlin, SpringerVerlag (Lect. Note Math. 72). [Jen72] R. Jensen. 1972. “The fine structure of the constructible Hierarchy”. Ann. Pure App. Logic, 4: 229-308. 1973. “Concrete models of set theory”. En M. Morley (ed.). Studies in model [Jen73] theory, Asoc. Math. Am., pp. 44–74. [Jen82] 1982. Coding the Universe, London Math. (Lect. Notes 47). [Jour08] P. Jourdain. 1908. “On the multiplications of the alephs”. Math. Ann., 65: 506–512. [Kan94] A. Kanamori, The higher infinite. Berlin, Springer-Verlag, 1994. 734 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 735 ✐ ✐ Conjuntos y modelos. Curso avanzado [Kan96] [Kan97] [Kan97b] A. Kanamori. 1996.“The Mathematical Development of Set Theory from Cantor to Cohen”. Bulletin of the Association for Symbolic Logic, 2, 1: 1–71, A. Kanamori. 1997. “The Mathematical Import of Zermelo’s Well-Ordering Theorem”. Bulletin of the Association for Symbolic Logic, 3: 281–311, A. Kanamori. 1994. The higher infinite. Berlin, Springer-Verlag. [Karp64] C. Karp. 1964. Languages with expressions of Infinite Length. Amsterdam, NorthHolland. [Ka82] F. Kasch. 1982. Modules and rings. Academic-Press. [Kei71] H. J. Keisler. 1971. Model theory for infinitary logic. Amsterdam, North-Holland. [KoBu96] P. Kopke y M. Burghardt. 1996. Mengenlehre. Boon, Mathematisches Institut der Universität. [Ku80] K. Kunen. 1980. Set Theory. An Introduction to Independence Proofs. Amsterdam, North Holland. [Le79] A. Lévy. 1979. Basic Set Theory. Berlin, Springer-Verlag. [LinTar26] A. Lindenbaum y A. Tarski. 1926 “Communication sur les recherches de la théorie des ensembles”. C. R. Varsovie, 19: 299–330. [LinMos37] A. Lindenbaum y A. Mostowski. 1937. “Über die Unabhängigkeit des Auswahlaxioms und einiger seiner Folgerungen”. C. R. Varsovie, 31: 27–32. [Loś54] J. Łoś. 1954. “On the categoricity in power of elementary deduction systems and some related problems”. Colloq. Math., 3: 58–62. [Lö15] L. Löwenheim. 1915. “Über Möglichkeiten im Relativkalkül”. Math. Ann. 76: 447– 470. [Lus25] N. Lusin. 1925. “Sur les ensembles projectives de M. Henri Lebesgue”. C. R. Acad. Sci. Paris, 164:, 1258–1265. [Mal71] A. I. Malcev. 1971. “A general method for obtaining local theorems in group theory”. Collected Papers. Amsterdam, pp. 15–21. [Mah11] P. Mahlo. 1911. “Über lineare transfiniten Mengen, Ber, Sächs, Akad, Wiss”. Math. Phys., 63: 187–225. [Mar95] F. Martı́nez. 1995. “El teorema de Löwenheim-Skolem y algunas de sus variantes”. Tesis de Licenciatura, Facultad de Ciencias unam. [Men56] E. Mendelson. 1956. “The independence of weak axiom of choice”. J. Symb. Logic, 21: 350–366. E. Mendelson. 1987. Introduction to Mathematical Logic, 3a. ed. Wadsworth & Brooks. [Men87] [Mi97] F. E. Miranda P. 1997. “Una prueba de consistencia de la aritmética de Peano, del tipo de Gentzen”. Tesis de licenciatura, Facultad de Ciencias unam. 735 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 736 ✐ ✐ Bibliografía [MiMa99] F.E. Miranda y P. F. Martı́nez. 1999. “Juegos en teorı́a de modelos finitos”. En Memorias del xxxi Congreso Nacional de la SMM. México, SMM. [Mir17] D. Mirimanoff. 1917. “Les antinomies de Rusell et de Burali-Forti et le probléme fondamentale de la théorie des ensembles”. L’Enseig. Math., 19: 37–52. [Mitch1] [Mitch2] W. Mitchell. “Indescribable sequences for extenders, and the SCH”. Preimpresión. “On the singular cardinal hypothesis”. Preimpresión. [Mon55] R. Montague. 1955. “Well-founded relations: generalizations of principles of induction and recursion” Bull. Amer. Math. Soc., 61: 442. [Mor65] M. Morley. 1965. “Categoricity in power”. Trans. Am. Math. Soc., bf 114: 514–538. [Mos39] A. Mostowski. 1939. “Über die Unabhängigkeit des Wohlordnungsatzes vom Ordnungsprinzip”. Fund. Math., 32: 201–252. [Neum23] J. von Neumann. 1923. “Zur Einführung der transfinite Zahlen”. Acta Szeged, 1: 199–208. [Neum25] 1925. “Eine axiomatisierung der Mengenlehre”. J. f. reine u. angw. Math., 154: 219–240. [Neum28] 1928. “Über die Definition durch transfinite Zahlen und verwandte Fragen für allgemeinen Mengenlehre”. Math. Ann., 99: 373–391. [Neum29] 1929. “Über eine Widerspruchfreiheitsfragen in der axiomatischen Mengenlehre”. J. f. reine u. angw. Math., 160: 227–241. [Os76] A. Ostaszewski. 1976. “On countably compact perfectly normal spaces”. J. London Math. Soc., 14: 505–516. [PaHa77] J. Paris y L. Harrington. 1977. “A mathematical incompleteness in Peano arithmetic”. En J. Barwise. Handbook of mathematical logic. msterdam, North-Holland. [PiVi99] M. Pineda R. y L. M. Villegas S. 1999. “Una aplicación de la teoría de modelos al álgebra”. México, uami. [PiViZa00] M. Pineda, L. M. Villegas y F. Zaldívar. “A shorter proof of a Steinitz’s theorem”. Propuesto para publicación en New Zealand Journal of Mathematics. [Pon34] L. S. Pontryagin. 1934. “The theory of topological commutative groups”. Ann. Math., 35: 361–388. [Pre88] M. Prest. 1988. Model theory and modules. Cambridge, Cambridge Univ. Press. [PurIl87] W. Purkert y A. Ilgauds. 1987. Georg Cantor, 1845-1917. Birkhäuser-Verlag. [Rib72] P. Ribenboim. 1972. L’arithmetique des corps. Hermann Paris. [Ro97] D. Rojas. 1997. “La naturaleza de la matemática en Gödel y su relación con los teoremas limitativos”. Tesis de licenciatura, Facultad de Ciencias unam. D. Rojas R. 1998. “Richard, Gödel y una confusión matemática”. En Memorias del xxx Congreso Nacional de la SMM. (Aportaciones Matemáticas 22, Serie Comunicaciones), México, SMM. [Ro98] 736 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 737 ✐ ✐ Conjuntos y modelos. Curso avanzado [Ro99] D. Rojas. 1999. “Algunos principios combinatorios en el modelo núcleo”. Tesis de maestría, Facultad de Ciencias unam. [Sab69] G. Sabbagh. 1969. “How to characterize the multiplicative group of a field”. J. London Math. Soc., 1: 369–370. [Schü54] K. Schütte. 1954. “Kennzeichnung von Ordinalzahlen durch rekursiv definierte Funktionen”. Math. Ann., 127: 16–32. [Schw90] H. Schwarz. 1890. Gesammelte mathematische Abhandlungen. 2 vols., Berlin, Springer. [Schwi98] H. Schwichtenberg. 1998. Mathematische Logik I, II. Vorlesungsskript, Universität München. [Sh71] [Sh81] [Sh94] [Sh98] S. Shelah. 1971. “The number of non-isomorphic models of unstable first-order theory”. Israel J. Math., 9: 473–487. 1981. “Models with second order properties III”. Arch. Math. Log., 21: 1-11. 1994. Cardinal Arithmetic. Oxford University Press. 1998. Proper and improper forcing. 2a. ed. Berlin, Springer-Verlag. [Sho67] [Sho67b] J. R. Shoenfield, Mathematical Logic, Addison-Wesley Pub. Co., 1967 1967. “Unramified forcing”. Proc. Symp. Pure App. Math., part I (xiii) 357– 381. [Sier25] [Sier47] W. Sierpiński. 1925. “ Sur une classe des ensembles”. Fund. Math., 7: 237–243. 1947. “L’hypothése généralisee du continu et l’axiome du choix”. Fund. Math., 34: 1–5. [Sil71] J. Silver. 1971. “The independence of the Kurepa’s conjecture and two-cardinal conjecture in model theory”. En “Axiomatic Set Theory”, Proc. Symp. Pure Math. AMS, 13(I): 383–390. 1974. “On the singular cardinal problem”. Proc. Int. Congr. Math. Vancouver, 265–268. [Sil74] [Sk20] [Sk22] Th. Skolem. 1920. “Logisch-kombinatorische Untersuchungen über die Erfullbarkeit oder Beweisbarkeit mathematischer Sätze nebst einem Theorem über dichte Mengen”. Skr., Vidensk. Krist. I. Mat.-Nat. Kl., 4: 1–36. 1922. “Einige Bemerkungen zur axiomatischen Begründung der Mengenlehre”. Proc. 5th. Scand. Math. Congress, Helsinski, 217–232. [Sol72] R. Solovay. 1972. “The fine structure of L[µ]”. Notas. Berkeley. [Stein10] E. Steinitz. 1910. “Algebrische Theorie der Körper”. J. f. Mathem., 137: 167–309. [Tar30] A. Tarski. 1930. “Über einige fundamentale Begriffe der Mathematik”. C. R. Séances Soc. Sci. Letters Varsovie CI. III, 23: 22–29. 1955. “General principles of induction and recursion in axiomatic set theory”. Bull. Amer. Math. Soc., 61: 442–443. [Tar55] 737 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 738 ✐ ✐ Bibliografía [Tar55b] [Tar62] [Tar57] 1955. “The notion of rank in axiomatic set theory and some of its applications”. Bull. Amer. Math. Soc., 61: 443. 1962. “Some problems and results relevant to the foundations of set theory”. En E. NAgel, P. Suppes, A. Tarki (Eds.) Logic, Methodology and Philosophy of Science. Stanford Univ. Press. 125–135. A. Tarski y R. Vaught. 1957. “Arithmetical extensions of relational systems”. Comp. Math., 13: 81–102. [TVHR97] M. Tkachenko, L. M. Villegas S., C. Hernández G. y O. Rendón G. 1997. Grupos Topológicos. México, uam Iztapalapa. [ToSo95] Y. Torres F. y J. Solís D. 1995. Lógica Matemática. México, uam Iztapalapa. [Vau54] R. Vaught. 1954. “Applications of the Löwenheim-Skolem-Tarski theorem to problem of completeness and decidability”. Koninkl. Ned. Akad. d. Wettensch. Proc. Ser. A., 57: 467–473. [Ve08] O. Veblen. 1908. “Continuous increasing functions of finite and transfinite ordinals”. Transc. AMS, 9: 280–292. [WeMe97] W. Weiss y C. D. Mello. 1997.“Fundamentals of model theory”. University of Toronto. [We13] H. Weyl. 1913. Die Idee der Riemanschen Flächen. Leipzig, Teubner. [Wis91] R. Wisbauer. 1991. Foundations of module and ring theory. Gordon and Breach. [Zer04] E. Zermelo. 1904. “Beweis, daß jede Menge wohlgeordnet werden kann”. Math. Ann., 59: 514–516. 1908. “Neuer Beweis für die Möglichkeit einer Wohlordnung”. Math. Ann., 65: 107–128. E. Zermelo. 1930. “Über Grenzzahlen und Mengenbereiche”. Fund. Math., 16: 29–47. [Zer08] [Zer30] [Zieg98] M. Ziegler. 1998. Vorlesung über Modelltheorie. Vorlesungsskript, Universität Freiburg. 738 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 739 ✐ ✐ Índice de símbolos (X)n , 346 (κ)n , 682 | · |, 74 | σ |, 169 {a1 , . . . , an }, 31 cl(M), 629 [a]R , 40 cf (κ), 96 ◦, 39 Comp, 32 a, 175, 176 s⌢ r, 604 AB , 35 Φ |= ϕ, 196 |=L , 207 ConL (Φ), 214 Const(φ, f ), 607 Con(T), 532 c, 100 (x, <), 40 CT (x), 66 Cte(x, u), 611 Cte(x), 605 ✷, 408 {a}, 31 ∅, 31 c(X), 494 A(u, v), 640 A, 170 A∗ , 194 [A]κ , 150 ℵ, 78 ℵα , 78 ℵ0 , 78 AL , 176 Alt T (t), 470 Alt(T ), 470 AM, 408 [A]≤κ , 150 [A]<κ , 150 AP, 202, 244 A′ ↾ L, 170 ◦ a, 193 At(L), 177 Aut{X} A, 268 AutX A, 268 AE, 33, 79 V = L, 638 iα , 138 BF (A), 597 BO(R, A), 42 BOF (R, A), 43 ς(α), 136 Def(X), 620 Def0 (x), 720 ∆(A), 276 ∆0k , 243 ∆Tn , 586 hAα : α < κi, 283 CAR, 76 CARD, 76 739 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 740 ✐ ✐ Índice de símbolos h(Φi , ϕi ) : i ≤ ni, 208 ♦, 408, 440, 454, 456, 478 diag(A), 233, 294 diag+ (A), 233 ♦1 , 444 ′ ♦1 , 444 ♦κ (E), 441 ♦∗κ (E), 456 ♦f , 444 ♦1F , 452 ′ ♦1F , 452 ♦‘F , 452 ♦l , 444 ♦‘, 444 ♦× , 444 ′ ♦× , 444 ∗ ♦ , 455 ♦+ , 456 dom(·), 35 2ℵ0 , 94 d(X), 494 ⊥, 214 ⊥, 216 ∆ f :A− → B, 292 ∆ f : A ֒→ B, 292 F (x), 37 F [z], 35 Fa , 364 f [u], 39 f −1 [v], 39 , v ◭, v Fin(S), 367 κ− → (µ)ρν , 487 κ− → (λi )ni<σ , 502 κ− → (λ)<ω σ , 501 Fml(x), 610 FmlΣ0 (φ), 618 FmlΣ0 (φ, u), 618 FmlΣn (φ), 619 Fml(x, u), 611 FmlΠn (φ), 619 Fml0 (L), 185 Fml(L), 177 Fmln (L), 185 f ↾ u, 39 F, 168 Fun(·), 35 f : A −→ B, 35 Fund, 32, 50, 61, 109, 202 E(α, f ), 643 L(~c), 232 Def = ,v xI , 40 ⇔, 28 ≡, 293 ⇔, 176, 178 ≡, 262 A∗ , 174 Ex, 31 ∃, 28, 176, 178 hA, Ci, 171 (B, f [M]), 193 (A, M), 193 Ext, 31 ‫(ג‬κ), 434 Υ, 208 H(α, x), 644 HA, 595 HA, 595 H(a), 77 HC, 595 HC, 100 HCS, 435 h : A ֒→ A′ , 173 HF , 595 HGC, 103 F= , 606 F∃ , 606 F∈ , 606 F¬ , 606 F∧ , 606 740 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 741 ✐ ✐ Conjuntos y modelos. Curso avanzado h:A− → A′ , 173 H, 260 ∗ R, 302 h:A∼ = A′ , 173 H(κ) , 578 HK, 482 HOD , 581, 583 HOD (M), 598 HS, 468 H(X), 335 H(X), 335 Lib(φ, x), 612 lib(ϕ), 185 Límξ<λ αξ , 105 ◦ L(M), 193 | w |, 174 LTC, 27 LZ, 80 A |= ϕ, 189 |=, 187 A∗ |= ϕ, 194 A |=II ϕ, 200 |=u φ, 617 A |=I ϕ, 200 ModL (Φ), 201, 274 =, 28, 172 =, ˙ 176 ≈, 604 ⇒ , 28, 176, 178 ⇛∆ , 292 ínf x, 41 Inf, 32 ∆α Aα , 423 T a, 31 t A [β], 186 t A (~a), 194 ∼ =, 41, 173 ◦ M, 193 n, 48 N, 48 NBG, 34 ¬, 28 ksk, 604 ∨, 28, 176, 178 OD , 581 OD (M), 598 W ϕ , 179 i<n i ω, 48, 78 ωα , 78 OLE(R, A), 42 K(u, w), 642 K, 168 L, 175 LAra , 326 L(C), 222 LAr , 202 L(A), 170 LEq , 201 LGr , 202 Lκκ , 178 L, 611 LV , 604 LX , 611 LOLD , 203 Lωω , 178 L(T), 312 L∅ , 201 L∗ , 334 P(x, y), 639, 640 ✷, 174 Par, 31 (S, U), 385 (a, b), 31 PBO, 80 pcf, 157 ∈, 28 Φ(v1 , . . . , vn ), 30 ΦAP , 202 Φcac , 289 Φcamp , 285 741 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 742 ✐ ✐ Índice de símbolos ΦW , 526 ΦEq , 201 ΦGr , 202 ΦAGr , 202 ϕ=n , 201, 276 Φ∞ , 201 ϕ≥n , 201, 276 Φ|= , 289 ΦOLD , 203 Φ{vj /vi }, 31 ϕW , 526 ϕx , 223 Φ((x)0 , ~z), 592 Φ((x)1 , ~z), 592 Φ((x)ni , ~z), 592 Φ(x(y), ~z), 592 Π00 , 243 Π1 , 295 Πn , 586 Π0k+1 , 243 πR , 566 ΠTn , 586 Pot(a), 31 Comp, 32 AI /F , 379 ⊛, 456 Prim(x, u), 611 Prim(x), 605 ⊛(S), 457 a × b, 31 Q x , 40 i∈I i A × B, 263 Q Ai , 376 i∈I Q A /F , 378 i∈I i ⊢H , 261 ⊢L , 207 ψ(A), 234 ψ(A, ~c), 234 RBF (R, A), 64 R, 93 Reemp, 32 (Reemp)loc , 572 (=), 205 (⊆), 206 ¬1, 205 ¬2, 205 RI, 205 ∀1, 205 ∀2, 205 ∧1, 205 ∧2, 205 ∧3, 205 Rel(·), 35 ∽, 218 R ↾ A, 35 rg(·), 73 R, 168 Sat(u, φ), 614, 617 Sat(Φ), 196 A |= ϕ[β], 187 A |= ϕ(~a), 195 sc, 294 ⊑, 175 Σ00 , 243 Σ0k , 243 Σn , 586 ΣTn , 586 σ, 168 ≺ , 301 ≺ ∆ , 300 h~aiA , 233 hY iB , 199 Sucefin(x), 606 Sucf(x, y), 639 suc(S), 111 Suc(u, a, n), 608 hx0 , . . . , xn i, 603 ♠, 466 Sα,β , 143 Q, 93 ρ Φ , 115 ran(·), 35 η µ⌣ , 130 742 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 743 ✐ ✐ Conjuntos y modelos. Curso avanzado ◦ κλ , 164 x, 604 ` sup x, 41 ϕ{x/s}, 190 Sust(φ′ , φ, v, t), 613 t{x/s}, 190 S(X), 494 ∧, V 28, 176 ϕ , 179 i<n i Z, 596 Z, 93 ZF , 33 ZF 2 , 115 ZFE , 31 ZF − , 33 ZF 1 , 115 ∗ t A , 194 τ, 168 T∆ , 290 TEC, 31 Teo∆ (K), 290 Teo(K), 290 TeoL (K), 290 Teo(N), 244 {x : Φ(x)}, 34 tˆ, 470 Tm(L), 177 Trans(x), 66 ♣, 452, 454 TV, 303 t W , 538 Q S i∈I Ai /U, 363, 376, 379 a, 31 Unión, 31 ∀, 28, 176 V , 34 Vα , 71 V (α, A), 597 |= ϕ, 196 kϕ(~a)k, 377 β, 186 β(vn /a), 187 Var, 189 var(ϕ), 185 vn , 176 vn , 28 var(t), 184 Var(x), 605 V, 72, 577 X(κ) , 495 743 ✐ ✐ ✐ ✐ LIBROCON ✐ 2000/9/17 ✐ page 744 ✐ ✐ Índice de símbolos 744 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 745 ✐ ✐ Índice válido, 262 aritmética consistencia de la, 564 de Peano, 247, 328 aritmética cardinal, 84 ordinal, 88 axioma de fundación, 581 independencia de un, 564 constructibilidad, 642 de comprensión, 35, 39 de elección, 167, 233 de elección, 36, 41, 83, 118 de elecciones dependientes, 120 de existencia, 34 de extensionalidad, 34 de fundación, 36, 41, 112 para los naturales, 53 para ordinales, 64 de infinito, 35 de par, 34 de potencia, 35 de reemplazo, 35, 39, 40 de unión, 34 reemplazo local, 576 axiomas de la teoría de conjuntos, 31 axiomatización finita, 579 G-fórmula, 635 G-función, 634 absolutez de cardinales, 558 de fórmulas, 540 de un término, 550, 552, 558 del rango, 557 álef, 81, 126, 146, 166 alfabeto, 178, 179 altura ordinal, 75 árbol, 474 altura, 474 anticadena, 476, 484 cadena, 474 de Aronszajn, 476, 485, 504, 521 de Cantor, 475 de Kurepa, 485, 486 de Souslin, 478, 482, 484 encajable, 485, 527 especial de Aronszajn, 485 κ-, 475 límite único, 475 normal, 475, 483, 485 rama, 474 cofinal, 475, 484 ramificado, 493 (θ, λ)-, 475 trayectoria, 474 argumento borde, 271 745 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 746 ✐ ✐ Índice buen orden, 116, 117, 234 fórmula de LTC, 46 fuerte, 45, 68 medible, 375, 376, 693 producto, 104 Ramsey, 506, 725 regular, 99, 101, 138, 150, 602 Rowbottom, 725 singular, 99 sucesor, 99 suma, 104 cardinalidad, 78, 84 propiedades, 78 ccna, 467 celularidad, 498, 522 cerradura algebraica, 323 deductiva, 293 pura, 509, 510 transitiva, 69, 602 cerradura de Gödel, 633 clase, 37 axiomatizable, 204, 281, 282 cerrada respecto a equivalencia elemental, 386 respecto a ultraproductos, 386 cerrada y acotada, 413 de equivalencia, 43 de modelos, 204 axiomatizable, 280, 288 de campos, 289 de conjuntos infinitos, 205 de grupos, 205 de grupos abelianos, 205 de la aritmética de Peano, 206 de ordenes lineales densos, 206 de relaciones de equivalencia, 205 de todos los modelos, 284 ∆-elemental, 281, 282, 386 elemental, 281, 283, 360, 361, 386 elementalmente equivalente, 386, 408 finitamente axiomatizable, 281, 284, 360 normal, 413, 415 operaciones, 38 ordinal, 59 propia, 37 cálculo de secuencias, 208, 217 reglas, 208 cadena, 178 de modelos, 286 elemental de modelos, 408 campo, 289 algebraicamente cerrado, 289, 291, 322, 324 característica, 322 de caracteristica 0, 388 extensión, 289 formalmente real, 388 ordenado, 397 real cerrado, 397 separablemente cerrado, 388 cardinal acotado, 439 ℵ0 -medible, 376 aritmética, 85 Lλω -compacto, 696 compacto fuerte, 694 débilmente compacto, 502, 504, 694 inaccesible, 149, 422, 521 del continuo, 105 exponenciación, 132, 162, 168, 437 exponenciación, 103, 106 fuertemente inaccesible, 150, 502, 520, 584 hipermahlo, 521 inaccesible, 150, 153, 154, 157, 161, 536, 602 κ-inaccesible, 494 límite, 99, 602 fuerte, 138, 150, 439, 504 Mahlo, 504 fuerte, 520 746 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 747 ✐ ✐ Conjuntos y modelos. Curso avanzado reflejo, 575 relación de orden, 45 seudoelemental, 393, 408 transitiva, 59 club, 424, 426, 434, 436, 443, 445, 448, 518 en [λ]<κ , 467, 468 filtro, 521 cofinalidad, 99, 105 relativización de la, 562 colapso de Mostowski, 571, 600 color, 507 coloración, 433, 447 canónica, 491 colores, 433 completación de un conjunto ordenado, 48 concatenación, 180 conjunto, 36 X-definible, 624 acotado, 47 por abajo, 47 por arriba, 47 adecuado, 650 admisible, 718 bien fundado, 44 ordenado, 45, 46 coestacionario, 465 cofinal, 99 completo, 48 construible, 625 cubierta, 155 de enunciados deductivamente cerrado, 315 consistente, 295 de fórmulas consistente, 217, 218, 220, 226, 231, 234 deductivamente cerrado, 294 equivalentes, 293 finitamente satisfacible, 236 inconsistente, 217, 218 maximal consistente, 221 satisfacible, 220, 226, 234, 236, 279 de Henkin, 220, 221, 224, 231, 232 Dedekind-infinito, 115 deductivamente cerrado, 293 definible, 238, 239, 273, 305 con parámetros, 305 parámetro, 238 primer orden, 239 definible por ordinales, 585 delgado, 465 dirigido, 699 equipotente, 78, 118 estacionario, 428–430, 432, 435, 441, 442, 519, 520 en [λ]<κ , 467, 469 juego, 433 η1 , 397 finito, 84 hereditariamente finito, 582 hereditariamente numerable, 582 hereditario, 582 homogéneo, 490 simultaneamente, 506 inductivo, 51 infinito, 35, 84, 370, 374 intersección, 34 linealmente ordenado, 502 linealmente ordenado, 678 minimal, 239 operaciones, 34 ordenado isomorfismo, 44 parcialmente ordenado, 43, 474 pequeño, 461 potencia, 111 recursivo, 246 satisfacible, 200 solución, 238 susceptible, 715 transitivo, 52 747 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 748 ✐ ✐ Índice de constantes, 227 encaje, 200, 201, 237, 270, 297, 305, 314, 327 canónico, 392 elemental, 297, 408 entre estructuras, 177 natural, 389, 409 enunciado, 189, 237, 298 atómico, 237 consistente, 293 de Horn, 269 independiente, 266 primitivo, 237 envolvente de Skolem, 339 escala, 432, 448 sistema, 432, 447 espacio calibre, 421, 422 conexo, 122 de Hilbert, 520 de Tikhonov, 421 hausdorff, 286 vectorial, 272 espectro, 269 esquema inductivo ∈, 69 estrategia ganadora, 434 estrella de Kleene, 178 estructura de los modelos no estándar, 329 elementalmente equivalente, 297, 314, 326, 362 isomorfa, 177 lenguaje, 178 matemática, 174 minimal, 239, 272 O-minimal, 272 producto, 266, 272 directo, 407 reducto, 201 unión, 34 vacío, 34 consecuencia, 208 lógica, 199 consistencia, 536 absoluta, 564 de ZFE, 539 relativa, 563 de ZF − Fund + ¬AE , 601 de la aritmética, 564 de ZF − , 582 de ZFE, 585 del axioma de fundación, 581 principio de, 589 constante adición, 280 contradicción, 218 coordenadas polares, 113 cortadura, 49 de Dedekind, 49 cota inferior, 44 superior, 44 criterio de Pontryagin, 509 cuantificador, 182, 189, 194 acotado, 247 alcance, 188 ∆-sistema, 419, 518 densidad, 498 derivación, 212, 227 diagrama, 298, 315 de Robinson, 236 elemental, 303 dominio, 38 elemento maximal, 44 mayor, 44 menor, 44 minimal, 44 eliminación 748 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 749 ✐ ✐ Conjuntos y modelos. Curso avanzado ∈-término, 529 η1 -conjunto, 397 expansión de Skolem, 338 elemental, 305, 314 exponenciación de cardinales, 87 de ordinales, 89 extensión elemental, 305 por definición, 318, 321, 358 de LTC, 111, 118 fórmulas atómicas, 32 de LTC, 32 familia ajena, 435 máxima, 423 carácter finito, 118 casi ajena, 423, 424, 442, 466 celular, 498, 500 de funciones casi ajena, 441 de Kurepa, 486 κ-filtración, 431, 445 filtración, 510, 522 continuidad, 431 estandar, 510 filtro, 368, 370, 382 cofinito, 370 de los cofinitos, 368 en [λ]<κ , 467 máximo, 369 maximo, 368 principal, 368 trivial, 368 forma normal de Cantor, 92 disyuntiva, 251 prenexa, 251 fórmulas equivalentes respecto a satisfacción, 253 función colapso, 570 continua, 144, 413 continuo, 437, 439 ς, 141 de orden, 415 diferenciable, 307 elemental, 297, 303, 304, 306 respecto a estructuras, 311 fórmula, 181, 182, 184, 193, 201 ΣTEC , 542 0 absoluta, 539 atómica, 181, 183 de Bernstein, 130, 132 de Horn, 268 de recursión de Hausdorff, 127, 152 de Tarski, 129, 147 deducible, 211, 212 ∆0 , 602 ∆n , 602 demostrable, 211 generalizada de Hausdorff, 129 interpretación, 190 lógicamente equivalente, 266 modelo de, 190 normal, 634 parámetro, 191, 239 positiva, 266 primitiva, 181 relativizada, 530 Πm n , 247 Σm n , 247 satisfacible, 200 universalmente válida, 200 fórmulas equivalentes, 238 fórmula 749 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 750 ✐ ✐ Índice del continuo, 103 generalizada del continuo, 106, 107 hiperreales, 306 homomorfismo, 200, 201, 272, 569 entre estructuras, 176, 236, 237 fuerte, 361 huéco, 520 hueco, 47 Gimel, 438 normal, 412, 414, 415, 417 representación, 417 regresiva, 429 función, 38, 42 aproximación, 54, 65, 72 biyectiva, 42, 102, 104, 115 clase, 40 compatible, 114 continua, 109 de Baire, 116 imagen, 42 inversa, 42 inyectiva, 42 normal, 109, 111 rango, 76, 118 propiedades, 76 restricción, 42 sobre, 42 suprayectiva, 42 funciones de Skolem, 338 incorporadas, 339 ideal, 461 normal, 461 imagen homomórfica, 270 independencia de Pot, 584 inducción en fórmulas, 186 en términos, 185 ínfimo, 44, 114 infinitesimal, 306 interpretación, 190, 208, 266 intersección diagonal, 426, 467 intervalo, 471 invariante Γ, 522 isomorfismo, 44, 100, 117, 167, 270 entre estructuras, 177 propiedades, 57 gráfica, 271 grupo cíclico, 272 libre de torsión, 282 localmente libre, 508 puro, 522 separable, 508, 522 hereditariamente, 508 κ-, 508 jerarquı́a de von Neumann, 74, 116 propiedades, 74 jerarquía acumulativa, 573 de Veblen, 414, 416 de von Neumann, 536 juego, 433 abierto, 434 cerrado, 434 determinado, 434, 435 en árboles, 523 hipótesis de Kurepa, 486 de los cardinales singulares, 439, 440 de Souslin, 472 del continuo, 457, 462, 521 generalizada del continuo, 147, 152, 163, 167, 472 hipótesis 750 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 751 ✐ ✐ Conjuntos y modelos. Curso avanzado matriz, 251 medida, 376 bivaluada, 376 modelo, 190, 192, 200, 208, 222, 278, 279 cadena, 286, 291 de Henkin, 224, 235 elementalmente equivalente, 311 encajable, 389 estándar de la aritmética, 328, 329 finito, 311 infinito, 278, 279, 282, 294, 313 lema del, 530 no estándar de la aritmética, 328, 329 numerable, 325 transitivo numerable, 588 unión, 287 modus ponens, 216 lógica de segundo orden, 280 lı́nea de Souslin, 473 lema de relativización, 542 de coincidencia, 191 de la raíz, 419, 518 de Tarski, 359 de Zorn, 83, 120, 233 del diagrama, 237, 298, 362 del modelo, 530 fundamental de modelos internos, 564 lenguaje, 181, 189, 193, 220, 278 cardinalidad, 179 compacto, 691 con igualdad, 180 de primer orden, 178 de una teoría, 316 estructura, 236 expansión, 198, 236 formal, 31, 178, 179 infinitario, 181, 690 Lλκ , 690 LTC, 31 teoría de grupos, 193 leyes de De Morgan, 217 límite directo, 699 literal, 201, 298 longitud de palabra, 178 número de Hartog, 117 de Souslin, 498 ordinal, 116 números beth, 142, 145, 148 propiedades, 143 naturales, 116, 269 primos, 270, 271 racionales, 272, 323, 492 reales, 116, 174, 269, 306, 492 caracterización, 472 número cardinal, 79, 84 operaciones, 80 de Hartog, 80 ordinal, 59, 62 números naturales, 50 operaciones, 55 reales, 103 nivel de uncampo, 388 números racionales método de modelos internos, 565 módulo fuertemente κ-libre, 509 generado <κ , 508 libre κ-, 508 751 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 752 ✐ ✐ Índice diádicos, 124 de reflexión de Levy, 575 de transferencia, 394 del buen orden, 83, 119 ♦, 521, 526 ♦′ (E), 526 ⊛, 521 diamante, 445, 460 problema de Souslin, 471, 472, 678 producto cartesiano, 42, 112, 117, 380 de cardinales, 85 de ordinales, 89 directo, 380 de estructuras, 407 reducido, 382 propiedad de la intersección finita, 368, 369, 374, 378 de Sosulin, 472 proyección, 510 prueba de Loś-Vaught, 321 de Tarski-Vaught, 307, 313, 322 formal, 212, 214 punto fijo, 110, 111, 414 límite, 425 operación sucesor, 51 operaciones de Gödel, 633 primitivas, 633 orden completo, 471 denso, 471 Kleene-Brouwer, 115 lineal, 43, 114, 115, 326 parcial, 43, 113, 120 total, 43 ordinal aritmética, 116 cerrado, 435 exponenciación, 90 lı́mite, 63, 116 multiplicación, 89 sucesión, 108 sucesor, 63, 88 suma, 88 palabra, 178 par ordenado, 34 paradoja de Skolem, 313 pareja ordenada, 112 uniformizante, 447 partición, 491 canónica, 491 polinómio minimal, 292 prefijo, 251 primer argumento diagonal de Cantor, 78 principio C(S), 521 de conservación de Łos-Tarski, 302 de las cajas, 419 de Leibnitz, 306 de predicción, 444 raíz, 419 rango, 38, 76 absolutez del, 557 recursión en fórmulas, 187 en términos, 187 reducto, 279 reflexión para LTC, 574 principio de, 576 principio de Lévy, 575 principio restringido, 578 principios de, 572 752 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 753 ✐ ✐ Conjuntos y modelos. Curso avanzado restricción, 38 retracción, 270 regla de casos, 209 de conjunción primera, 208 segunda, 209 tercera, 209 de contradicción, 209 de igualdad, 209 de inicio, 208 de monotonía, 209 del cálculo de secuencias, 210 derivable, 267 derivada, 215 universal, 209 válida, 267 válida, 208, 211 reglas del cálculo de secuencias, 209 relación elementalmente definible, 269 flecha, 491, 501, 505 Πm n , 247 Σm n , 247 relación, 38, 42 antisimétrica, 43 bien fundada, 59, 66 binaria, 43, 112 de equivalencia, 43 funcional, 35 reflexiva, 43 simétrica, 43 total, 43 transitiva, 43 relación asimétrica, 118 relativización, 529 de la cofinalidad, 562 de cardinales, 558 de un término, 542 de una fórmula, 530 símbolo de constante, 172 de función, 172 de LTC, 31 de relación, 172 no lógico, 173 satisfacción, 191 de fórmulas, 191 segmento inicial, 58, 474 segundo argumento diagonal de Cantor, 97 semántica, 189 signatura, 172, 174, 236, 239 finita, 265 sistema de escalas, 523 definidor, 241 dirigido, 699 subárbol, 474 subestructura, 175 elemental, 305, 307, 309, 312, 389 generada, 202, 236 subfórmula, 185, 266 submodelo elemental, 305 Sucefin(x), 609 sucesor, 88 suma cardinal, 84 débil, 135, 137, 139, 156, 164, 166 ordinal, 88 superestructura, 175 supremo, 44, 114 sustitución, 193, 226 término, 180, 182, 193, 201, 265 Σ0 -cerrado, 566 absoluto, 550, 552, 558 casi universal, 566 753 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 754 ✐ ✐ Índice cerrado, 197, 236 equivalente, 222 interpretación, 190 variables en, 188 término clase, 38, 112, 144 teorı́a de Zermelo, 600 teoría, 294, 309, 362, 386 categórica, 321 completa, 295, 310, 315, 321 conservativa, 316, 317 consistente, 563 ∆ de una clase, 295 de Bernays-Gödel, 37 de campos, 288, 324, 408 de conjuntos infinitos, 205 de grupos, 266 de los campos algebraicamente cerrados, 322 de relaciones de equivalencia, 266 de Skolem, 338 elemental de conjuntos, 34 extensión, 316 por definición, 316 finita, 310 incompleta, 296 lógicamente equivalente, 361 pcf, 162 Π2 -, 288 TEC, 34 totalmente categórica, 321 Zermelo-Fraenkel-Axioma de elección, 34 teorema, 189 de Keisler-Shelah, 387 Cantor-Schröder-Bernstein, 78 de Lós, 384 de Baire, 680 de Cantor, 117, 325, 472 de compacidad, 219, 235, 385 de completud de Gödel, 235, 236 del cálculo de secuencias, 235 de correctud, 211 de Erdös-Dushnik-Miller, 506 de Erdös-Rado, 493, 495 de existencia de modelos, 234 de finitud, 235 de Fodor, 429, 523 de Heine-Borel, 285 de Herbrand, 257, 258 de Hessenberg, 93 de incompletud de Gödel, 247 de inducción en buenos ordenes, 56 en los naturales, 51 en ordinales, 64 en relaciones bien fundadas, 71 de isomorfismo primer, 569 segundo, 570 de Jensen, 482 de König, 101, 104 de König (árboles), 475 de Keisler-Shelah, 387 de Kleene, 247 de Kurepa (en árboles), 478 de Löwenheim-Skolem, 313 creciente, 279 creciente para ≺ , 314 decreciente, 235 decreciente para ≺ , 312 de Ramsey, 328, 490 finito, 492 de recursión, 191 de recursión en los naturales, 54, 114 en ordinales, 122 en relaciones bien fundadas, 71 de representación 754 ✐ ✐ ✐ ✐ ✐ ✐ LIBROCON 2000/9/17 page 755 ✐ ✐ Conjuntos y modelos. Curso avanzado de conjuntos parcialmente ordenados, 45 de Silver, 436, 441, 524 de Skolem, 328 de Tarski, 370, 399 del colapso de Mostowski, 600 del ∆-sistema, 420 término clase, 37 testigo, 268 tipo ordinal, 59 topología, 285 del orden, 121, 520, 678 producto, 499 valor booleano, 381 valuación, 190, 196, 199, 200, 234, 238 variable acotada, 32, 188, 273 compatible, 194, 196 libre, 32, 188, 273 en una fórmula, 188 ultrafiltro, 369, 370, 389, 461, 520 ℵ0 -completo, 374, 405 ℵ0 -incompleto, 374, 378, 405 de Ramsey, 403 κ-incompleto, 375 κ-completo, 375, 376, 404 κ-incompleto, 377 no principal, 369, 371, 374, 375, 380, 390 p-punto, 403 principal, 369, 370, 390, 403 producto, 403 regular, 378, 380 uniforme, 373, 374, 378, 380, 391, 407 ultrapotencia, 383, 389 ultraproducto, 367, 380, 381, 383, 384, 386, 404 unión diagonal, 429 unión conjuntos numerables, 95 universo constructivo, 588 universo construible, 625 universo de conjuntos V, 37, 39, 111 vértice, 271 755 ✐ ✐ ✐ ✐