Dos Teoremas de interpolación

Franklin Galindo

Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación Two interpolation theorems Franklin Galindo (franklin.galindo@ucv.ve) Departamento de lógica y Filosofı́a de la Ciencia. Escuela de Filosofı́a. Universidad Central de Venezuela. Resumen En este artı́culo se presentan dos demostraciones del teorema de interpolación: Una para la lógica proposicional y otra para la lógica de primer orden (ℓℵ0 ℵ0 ). Ambas se realizan en el contexto de la teorı́a de modelos. El teorema de interpolación afirma que si ϕ y ψ son fórmulas, donde ϕ no es una contradicción, ψ no es válida y ψ es una consecuencia lógica de ϕ (ϕ |= ψ), entonces existe una fórmula δ que está escrita en un lenguaje común al de ϕ y ψ, tal que ϕ |= δ y δ |= ψ. El teorema de interpolación fue demostrado por primera vez para ℓℵ0 ℵ0 por William Craig en 1957, y desde entonces se ha investigado la posibilidad de generalizarlo o aplicarlo. Dicho teorema tiene generalizaciones o aplicaciones en teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Se presentan ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación relacionados con lógicas infinitarias, cuantificadores generalizados, segundo orden, no clásicas, abstractas, etc. También se ofrecen referencias de problemas abiertos sobre interpolación en el contexto de la teorı́a de modelos abstracta. Palabras y frases clave: lógica proposicional, lógica de primer orden, propiedad de interpolación de Craig, construcción de modelos a partir de constantes y teorı́as inseparables, teorı́a de modelos abstracta. Abstract In this paper we present two proofs of the interpolation theorem: One for propositional logic and one for first order logic (ℓℵ0 ℵ0 ). Both are performed in the context of model theory. The interpolation theorem states that if ϕ and ψ are formulas, where ϕ is not a contradiction, ψ is not valid, and ψ is a logical consequence of ϕ (ϕ |= ψ), then there exists a formula δ which is written in a common language to that of ϕ and ψ, such that ϕ |= δ and δ |= ψ. The interpolation theorem was first proved for ℓℵ0 ℵ0 by William Craig in 1957, and since then the possibility of generalizing or applying it has been investigated. This theorem has generalizations or applications in proof theory, abstract model theory, computer science, modal logic, intuitionistic logic, etc. Examples of applications or generalizations of the interpolation property are presented related to infinitary logics, generalized quantifiers, second order, non-classical, abstract, etc, are presented. References on open problems regarding the interpolation property in the context of abstract model theory are also offered. Key words and phrases: Propositional logic, first order logic, Craig’s interpolation property, models constructed from constants and inseparable theories, abstract model theory. Recibido 04/01/2017. Revisado 27/03/2017. Aceptado 05/05/2017. MSC (2010): Primary 03C40; Secondary 03C40. Autor de correspondencia: Franklin Galindo 16 1 Franklin Galindo Introducción En este artı́culo se presentan dos demostraciones del teorema de interpolación: Una para la lógica proposicional (ℓprop ) y otra para la lógica de primer orden (ℓℵ0 ℵ0 ). Ambas se realizan en el contexto de la teorı́a de modelos. El teorema de interpolación afirma que si ϕ y ψ son fórmulas, donde ϕ no es una contradicción, ψ no es válida y ψ es una consecuencia lógica de ϕ (ϕ |= ψ), entonces existe una fórmula δ que está escrita en un lenguaje común al de ϕ y ψ, tal que ϕ |= δ y δ |= ψ. El teorema de interpolación fue demostrado por primera vez para ℓℵ0 ℵ0 por William Craig en 1957, y desde entonces se ha investigado la posibilidad de generalizarlo o aplicarlo. Dicho teorema tiene generalizaciones o aplicaciones en teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Se presentarán ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación relacionados con lógicas infinitarias, lógicas con cuantificadores generalizados, lógica segundo orden, lógicas no clásicas, lógicas abstractas, etc. También se ofrecen referencias de problemas abiertos sobre interpolación en el contexto de la teorı́a de modelos abstracta. Vale la pena resaltar que, según [32], existen varias pruebas del teorema interpolación de Craig: Con métodos de teorı́a de la demostración (por ejemplo la original de Craig de 1957 , ver [6, 7]), con métodos de la teorı́a de modelos (por ejemplo la de Henkin, 1963, ver [18]) y con métodos de teorı́a de juegos y teorı́a de conjuntos (por ejemplo Svenonious, 1965, ver [32]). En este artı́culo se realizará una demostración utilizando ideas de una prueba que se encuentra en [8], y también usando ideas propias del autor de este trabajo (incluyendo ejemplos propios). Tal prueba se hace utilizando el método de Henkin (1949, ver [17]) de construcción de modelos a partir de constantes (con el cual se puede construir un modelo para una teorı́a T que sea consistente) extendido por el mismo Henkin (ver [18]) con la noción de “par de teorı́as inseparables”, lo cual proporciona un nuevo método de construcción de modelos para la unión de dos teorı́as T1 ∪ T2 , donde T1 y T2 son inseparables y consistentes. La demostración del teorema interpolación de Craig que se realiza es por reducción al absurdo. Vale la pena resaltar que la unión de dos teorı́as consistentes no necesariamente tiene un modelo, por ejemplo, como consecuencia del teorema de incompletitud de Gödel (1931) (ver [16]) existe una proposición indecidible ϑ de la aritmética de Peano en primer orden (AP (ℓℵ0 ℵ0 )), es decir, AP (ℓℵ0 ℵ0 ) 6⊢ ϑ y AP (ℓℵ0 ℵ0 ) 6⊢ ¬ϑ. Ası́, las teorı́as extendidas AP (ℓℵ0 ℵ0 )∪{¬ϑ} y AP (ℓℵ0 ℵ0 )∪{ϑ} son consistentes. Sin ambargo, la unión de ambas AP (ℓℵ0 ℵ0 ) ∪ {ϑ, ¬ϑ} es inconsistente y, por lo tanto, no tiene modelo. También existen distintas pruebas del teorema de interpolación para ℓprop . En este trabajo se realiza una demostración que es constructiva y usa el principio de inducción matemática, utilizando ideas de una prueba que se encuentra en [21], y también se usarán ideas propias del autor de este trabajo (incluyendo ejemplos propios). Es importante destacar que el autor de este artı́culo no conoce la fecha exacta de la demostración del teorema de interpolación para la lógica proposicional, en consecuencia no sabe si se demostró antes o después de la prueba de interpolación de Craig para ℓℵ0 ℵ0 . Según Feferman el teorema de interpolación de Craig, a pesar de la aparente simpleza (ver [13]), es una propiedad lógica central que se ha utilizado para revelar una profunda armonı́a entre la sintaxis y la semántica de ℓℵ0 ℵ0 . Dos importantes consecuencias del teorema de interpolación de Craig son el teorema de definibilidad de Beth (1953, ver [4]) y el teorema de consistencia de Robinson (1956, ver [27]). También el teorema de consistencia Robinson implica al teorema de interpolación de Craig, es decir, ambos resultados son equivalentes. Y una mejora del teorema de interpolación de Craig es el teorema de interpolación de Lyndon (1959, ver [8]). El teorema de definibilidad de Beth proDivulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 17 porciona (entre otros) un importante método para investigaciones metamatemáticas de teorı́as matemáticas axiomatizadas, que permite realizar pruebas de independencia de términos primitivos. Y el teorema de consistencia Robinson proporciona un valioso método para investigar la consistencia de teorı́as matemáticas axiomatizadas. Una formulación del teorema de definibilidad de Beth y del teorema de consistencia de Robinson, ası́ como una demostración de los mismos, a partir del teorema de interpolación de Craig puede encontrarse en el texto [8, p. 90-91]. Y una formulación y demostración del teorema de interpolación de Lyndon puede encontrarse en el texto [8, p. 92-93]. Además de las demostraciones de los teoremas de interpolación para ℓprop y ℓℵ0 ℵ0 , que se realizan en este artı́culo, se presentan ejemplos de generalizaciones o aplicaciones de la propiedad de interpolación de Craig que han sido hechas por diversos investigadores en el transcurso del tiempo. Se presenta una lista de resultados obtenidos en diversos sistemas lógicos (lógicas infinitarias, lógicas con cuantificadores generalizados, lógica de segundo orden, lógicas no clásicas, lógicas abstractas, etc), en la cual se dirá explı́citamente si estas cumplen o no la propiedad de interpolación. Dichos resultados han sido recopilados por el autor de este artı́culo de distintas fuentes, eligiendo presentar (principalmente) una parte importante de la tabla de resultados que se encuentra en el texto [19] porque se considera que es una de las más completas que aparece en la bibliografı́a consultada. También se expone una caracterización de la lógica infinitaria ℓℵ1 ℵ0 , lógica que admite conjunciones y disyunciones infinitas numerables. Dicha caracterización se realiza en el contexto de la teorı́a de modelos abstracta y usando la propiedad de interpolación. Solo se formula el teorema, y para ello se define el concepto de lógica abstracta, tal resultado se encuentra en [23, p. 17]. Adicionalmente, en la sección 6 de este artı́culo, se ofrecen algunas referencias de problemas abiertos sobre la propiedad de interpolación (siguiendo los artı́culos [13, 33]), tales problemas abiertos pertenecen a la teorı́a de modelos abstracta. Vale la pena resaltar que las pruebas que se realizan en este trabajo pueden hacerse solo con ZF (La teorı́a axiomática de conjuntos de Zermelo-Fraenkel), no se necesita el axioma de elección. Sin embargo, en las secciones de este artı́culo donde se hace referencia al concepto de lógica abastracta (teorı́a de modelos abstracta) si se requiere del axioma de elección para poder trabajar sin ninguna restricción con las lógicas infinitarias o con las lógicas con cuantificadores geralizados, entre otros sistemas lógicos. El estudio de tales lógicas tiene gran importantancia, por ejemplo, en teorı́a de modelos finitos y en el estudio de problemas de complejidad computacional (ver [33, p. 51]). También las lógicas infinitarias son fundamentales en la teorı́a de modelos y en la teorı́a de conjuntos para investigar problemas de grandes cardinales [8, 10], entre otros. El orden expositivo del contenido del artı́culo es siguiente: En la sección 2 se define ℓprop describiendo su sintaxis y su semántica, y luego se formula y demuestra el teorema de interpolación para ℓprop . En la sección 3 se define ℓℵ0 ℵ0 describiendo su sintaxis y su semántica, luego se formula y demuestra el teorema de interpolación para ℓℵ0 ℵ0 . En la sección 4 se presenta una lista de sistemas lógicos, mencionada anteriormente. En la sección 5 se presenta un resultado, en el contexto de la teorı́a de modelos abstracta, que caracteriza a la lógica infinitaria ℓℵ1 ℵ0 , usando la propiedad de interpolación (entre otras). En la sección 6 se presentan algunas referencias de problemas abiertos antes mencionados. Y en la sección 7 se ofrecen algunas conclusiones del artı́culo. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 18 2 Franklin Galindo Teorema de interpolación para la lógica proposicional A continuación se presenta una demostración del teorema de interpolación para ℓprop . Tal demostración es constructiva y se realiza utilizando el principio de inducción matemática, para hacer la misma se definen primero los conceptos básicos sintácticos y semánticos de la lógica proposicional tal como son presentados en la mayorı́a de los textos contemporáneos de lógica matemática, por ejemplo [8, 9, 11, 25, 26]. Tales conceptos son los de proposición, valuación (o interpretación), tautologı́a, contradicción, satisfacible, consecuencia lógica (Σ |= σ), etc. En esta sección se usarán las definiciones expuestas en los textos [9, 11, 26]. La demostración que se realiza usa ideas de la prueba del teorema que se encuentra en el texto [21, p. 79-80], entre otros. También utilizan ideas propias y ejemplos propios del autor de este trabajo. Definición 2.1 (Lenguaje de ℓprop ). Sea p0 , p1 , p2 , . . . un conjunto numerable de letras proposicionales, se llamará a este conjunto LP . Para construir el lenguaje también se requiere de otros sı́mbolos: las conectivas y los paréntesis. Las conectivas son: ¬ (negación), ∧ (conjunción), ∨ (disyunción), → (condicional material) y ↔ (bicondicional). Los paréntesis son: “)” paréntesis derecho y “(” paréntesis izquierdo. Con estas letras, más las conectivas y los paréntesis, se define lo que es una proposición usando inducción: Definición 2.2. (a) Toda letra proposional es una proposición. (b) Si ϕ y ψ son proposiciones, entonces (¬ϕ), (ϕ ∨ ψ), (ϕ ∧ ψ), (ϕ → ψ) y (ϕ ↔ ψ) son proposiciones. (c) Solo son proposiciones las sucesiones finitas de sı́mbolos que se puedan construir aplicando una cantidad finita de veces las cláusulas (a) y (b). Se denota el conjunto de todas las proposiciones por P ROP , y cuando no exista posibilidad de ambiguedad se eliminarán los paréntesis externos (por simplicidad). Por ejemplo, en vez de (ϕ ∨ ψ) es escribirá ϕ ∨ ψ. Ahora se definirá la semántica de ℓprop : Definición 2.3. • Una asignación de valores de verdad es una función A : LP −→ {V, F }. • Una valuación (o interpretación ) es una función I : P ROP −→ {V, F } tal que: 1. I(¬ϕ) = V ⇐⇒ I(ϕ) = F . 2. I(ϕ → ψ) = V ⇐⇒ I(ϕ) = F o I(ψ) = V . 3. I(ϕ ∧ ψ) = V ⇐⇒ I(ϕ) = V y I(ψ) = V . 4. I(ϕ ∨ ψ) = V ⇐⇒ I(ϕ) = V o I(ψ) = V . 5. I(ϕ ↔ ψ) = V ⇐⇒ I(ϕ) = I(ψ). Las asignaciones y las valuaciones guardan una estrecha relación que se describe a continuación en el siguiente lema: Lema 2.1. Sea A una asignación. Se cumple que para todo par de valuaciones Z y W, si Z ↾ A = W ↾ A, entonces Z = W. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 19 Ahora se procederá a definir los conceptos de “tautologı́a”, “contradicción”, “satisfacible” y “consecuencia lógica”: Definición 2.4. Sea ϕ ∈ P ROP una proposición, entonces se cumple que 1. ϕ es una tautologı́a si I(ϕ) = V , para toda valuación I. Cuando ϕ es una tautologı́a también se dice que ϕ es válida. 2. ϕ es una contradicción si I(ϕ) = F , para toda valuación I. 3. ϕ es satisfactible si existe una valuación I tal que I(ϕ) = V , es decir, si ϕ no es una cotradicción. En tal caso, se dice que I es un modelo de ϕ. 4. Sea Γ ⊆ P ROP un conjunto de proposiciones. Se dice que ϕ es una consecuencia lógica de Γ, denotado por Γ |= ϕ, si toda valuación I que sea un modelo de Γ (es decir: I(σ) = V , para toda σ ∈ Γ) también es un modelo de ϕ, es decir, si no existe una valuación I que sea modelo de Γ y no sea modelo de ϕ. Cuando se trata de consecuencia lógica de conjuntos unitarios, por ejemplo {ψ} |= ϕ, se escribe ψ |= ϕ. Y cuando se trata de consecuencias lógicas del conjunto de sentencias vacı́o, ∅ |= ϕ, se escribe ası́: |= ϕ. Observación 2.1. Una consecuencia inmediata de la definición anterior es que: ϕ es una tautologı́a si y solo si |= ϕ. Teorema 2.1 (Teorema de interpolación para la lógica proposicional). Sean χ y ζ dos proposiciones tal que χ |= ζ, entonces se cumple una de las siguientes afirmaciones: (i) χ es insatisfacible (ii) ζ es válida (iii) Existe una proposición λ tal que χ |= λ y λ |= ζ, y cualquier letra proposicional que aparece en λ también aparece en χ y en ζ (en ambas). La proposición λ es llamada una interpolación de χ y ζ. Ejemplo 2.1 (Ejemplos del teorema de interpolación para ℓprop ). (1) χ = [¬r → (s ∧ t)] y ζ = [¬r → ¬¬s]. Es claro que χ |= ζ. Una interpolación de χ y ζ es: λ = ¬r → s. (2) χ = [(p → q) ∧ (p → (q → r))] y ζ = (p → r). Es claro que χ |= ζ. Una interpolación de χ y ζ es: λ = [p → (r ∨ ¬r) ∧ (p → ((r ∨ ¬r) → r))] ∨ [(p → (r ∧ ¬r)) ∧ (p → ((r ∧ ¬r) → r))]. La proposición λ presente en el ı́tem (2), del Ejemplo 2.1, ha sido construı́da con un procedimiento efectivo que se describirá en la demostración del Teorema 2.1. Tal procedimiento usa las letras proposicionales que están en χ y no están en ζ hasta eliminarlas todas sustituyéndolas por una tautologı́a (r ∨ ¬r) o por una contradicción (r ∧ ¬r) de una manera especı́fica (utilizando disyunciones) para lograr construir la proposición interpolación. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 20 Franklin Galindo Demostración del teorema. Para probar el teorema se supone que (i) y (ii) no ocurren y se prueba que se cumple (iii). Como (i) y (ii) no ocurren entonces χ y ¬ζ son satisfacibles, es decir, existe una valuación V : P ROP −→ {V, F } tal que V(χ) = V y existe una valuación W : P ROP −→ {V, F } tal que W(ζ) = F , donde P ROP es el conjunto de todas las proposiciones. Entonces χ y ζ tienen al menos una letra proposicional en común, pues si esto no ocurre se puede definir una valuación H : P ROP −→ {V, F } tal que H coincida con V en los valores a las letras proposicionales de χ y H coincide con W en los valores a las letras proposicionales de ζ, en consecuencia H(χ) = V y H(ζ) = F (para definir H se usa la Definición 2.3 y el principio de inducción matemática), lo cual contradice la hipótesis χ |= ζ. Por lo tanto, χ y ζ tiene al menos una letra proposicional en común. Sea φ ∈ P ROP , y sea LP (φ) el conjunto de las letras proposicionales que aparecen en φ. Considérese el conjunto de las letras proposicionales que aparecen en φ y no aparecen en ζ, es decir, LP (φ) \ LP (ζ). El cardinal | LP (φ) \ LP (ζ) | es un número natural. Se probará (iii) por L inducción en N, usando | LP (φ) \ LP (ζ) |. Se demostrará la siguiente Proposición que implica (iii) y donde ζ está fija: L Proposición : ∀ n ∈ N y ∀ φ ∈ P ROP . Si φ |= ζ, φ es satisfacible y | LP (φ) \ LP (ζ) |= n, entonces existe una proposición interpolación de φ y ζ. L Demostración de la Proposición . Caso base: (n = 0). Sea σ una proposición tal que σ |= ζ, σ es satisfacible y | LP (σ) \ LP (ζ) |= 0, entonces se toma λ = σ. Claramente se cumple que σ |= σ y, por hipótesis, ocurre σ |= ζ. También, todas las letras proposicionales de σ están en σ y en ζ ya que | LP (σ) \ LP (ζ) |= 0. Caso L inductivo: Sea k ∈ N, k > 0. Supóngase que para cualquier r < k se cumple la Proposición , es decir, existe una proposición interpolación de φ y ζ, donde φ |= ζ, φ es Lsatisfacible y | LP (φ) \ LP (ζ) |= r, ∀r < k y ∀φ ∈ P ROP . Se demostrará que la Proposición se cumple para k, es decir, se mostrará que existe una proposición interpolación de φ y ζ, donde φ |= ζ, φ es satisfacible y | LP (φ) \ LP (ζ) |= k, ∀φ ∈ P ROP . Sea σ una proposición tal que σ |= ζ, σ es satisfacible y | LP (σ) \ LP (ζ) |= k. Como k > 0 sea u ∈ LP (σ) \ LP (ζ). Sea s una letra proposicional que aparece en σ y ζ. Se construyen dos proposiciones a partir de σ: la proposición σ1 , que resulta de sustituir u por la tautologı́a (s ∨ ¬s) en σ; y la proposición σ2 , que resulta de sustituir u por la contradicción (s ∧ ¬s) en σ. Se probará que σ1 |= ζ y σ2 |= ζ. Para probar que σ1 |= ζ, sea V una valuación tal que V(σ1 ) = V . Se cumple que V(u) = V o V(u) = F . Caso 1: (V(u) = V ). Por la construcción de σ1 a partir de σ, como en σ1 no aparece u y en los lugares donde estaba u aparece (s ∨ ¬s) y V((s ∨ ¬s)) = V , se concluye que V(σ) = V . Luego, por hipótesis V(ζ) = V . Caso 2: (V(u) = F ). Como u no aparece en σ1 se define a partir de V otra valuación V ′ que coincide con V en los valores a todas las letras proposicionales menos u, es decir, V ′ (u) = V . En consecuencia, V ′ (σ) = V . Luego, por hipótesis V ′ (ζ) = V . De modo que V(ζ) = V , pues como u no aparece en ζ se cumple que V ′ (ζ) = V(ζ). La prueba de σ2 |= ζ se realiza de manera análoga pero considerando la sustitución de (s ∧ ¬s) por u en σ. Por lo tanto, como σ1 |= ζ y σ2 |= ζ, se concluye que σ1 ∨ σ2 |= ζ. Entonces, como por construcción la proposición σ1 ∨ σ2 tiene k − 1 letras proposicionales que no aparecen en ζ, y es satisfacible porque σ lo es, se aplica la hipótesis inductiva y se tiene que existe una proposición λ interpolación de σ1 ∨ σ2 y ζ. Es decir, σ1 ∨ σ2 |= λ y λ |= ζ, y cualquier letra proposicional que aparece en λ también aparece en σ1 ∨ σ2 y en ζ. Como se cumple que σ |= σ1 ∨ σ2 , entonces σ |= λ. Por lo tanto λ es una Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 21 proposición interpolación de σ y ζ. Lo que se querı́a demostrar. Ha terminado la demostración L de la Proposición y, por lo tanto, ha finalizado también la prueba del Teorema 2.1. 3 Teorema de interpolación para la lógica de primer orden A continuación se presenta una demostración del teorema de interpolación para ℓℵ0 ℵ0 . Tal prueba se hace utilizando el método de Henkin (ver [17]) de construcción de modelos a partir de constantes (con el cual se puede construir un modelo para una teorı́a T que sea consistente) extendido con la noción de “par de teorı́as inseparables”(extensión que hace el mismo Henkin en [18]), lo cual proporciona un nuevo método de construcción de modelos para la unión de dos teorı́as T1 ∪ T2 , donde T1 y T2 son inseparables y consistentes. Para hacer la formulación y demostración del teorema se requiere definir previamente los conceptos básicos de la sintaxis y la semántica de ℓℵ0 ℵ0 . Estas nociones se presentan siguiendo la metodologı́a de textos contemporáneos de la lógica matemática, por ejemplo [8, 9, 11, 12, 24, 25]. Los conceptos sintácticos y semánticos son los de “lenguaje”, “estructura”(o “interpretación”), “estructuras isomorfas”, “formalización de un lenguaje”, “término”, “fórmula”, “sentencia”, “satisfacción”, “verdad”, “contradicción”, “validez”, “consecuencia lógica”(Σ |= σ), “deducibilidad”(Σ ⊢ σ), etc. Especı́ficamente se describirán tales nociones tal como se hace en los textos [8, 9, 11], y en el artı́culo [15]. En la demostración que se realiza en esta sección del teorema de interpolación para ℓℵ0 ℵ0 se usan ideas que se encuentran en la prueba que hacen Chang y Keisler en el texto [8], y también se utilizan ideas propias (y ejemplos propios) del autor de este trabajo. El orden expositivo de esta sección es el siguiente: En las siguientes tres subsecciones (3.1, 3.2 y 3.3) se describe la sintaxis y la semántica de ℓℵ0 ℵ0 y, además, se enuncian dos resultados previos que se usarán en la demostración: el teorema de completitud de Gödel y el teorema de compacidad. En la última subsección (3.4) se formula y demuestra el teorema de interpolación para ℓℵ0 ℵ0 . 3.1 Lenguajes de primer orden, estructuras e isomorfismo entre estructuras Las definiciones se harán siguiendo el orden y la notación (principalmente) de los textos [8, 9], pero se realizarán de manera generalizada para cualquier cardinal: Definición 3.1.1. Un lenguaje L es un conjunto de sı́mbolos cuyo cardinal puede ser finito, infinito numerable o infinito no numerabe (de cualquier cardinalidad mayor que ℵ0 ). Los sı́mbolos de L son agrupados en tres clases: • Sı́mbolos relacionales R0 , R1 , R2 , R3 , . . . , Rα , . . . (α ∈ γ). Donde γ es cualquier ordinal. (El conjunto de sı́mbolos relacionales puede ser vacı́o). • Sı́mbolos funcionales h0 , h1 , h2 , h3 , . . . , hβ , . . . (β ∈ δ). Donde δ es cualquier ordinal. (El conjunto de sı́mbolos funcionales puede ser vacı́o). • Sı́mbolos constantes d0 , d1 , d3 , . . . , dρ , . . . (ρ ∈ η). Donde η es cualquier ordinal. (El conjunto de sı́mbolos constantes puede ser vacı́o). Todo sı́mbolo relacional y todo sı́mbolo funcional, tiene asociado un número natural n ≥ 1 (su número de argumentos), de este modo se tienen entonces sı́mbolos relacionales o funcionales unarios, binarios, 3-arios, 4-arios, 5-arios, 6-arios, . . ., n-arios, etc. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 22 Franklin Galindo Definición 3.1.2. Una estructura U para un lenguaje L (o una interpretación U para un lenguaje L) está cosntituida por: • Un conjunto no vacı́o U (el universo de U) • Para cada sı́mbolo relacional n-ario Rα de L, una relación U Rα ⊆ U n. • Para cada sı́mbolo funcional n-ario hβ de L, una función n hU β : U −→ U. • Para cada sı́mbolo constante dρ de L, un elemento dU ρ ∈ U. La estructura U definida se puede expresar ası́: U U = hU, < Rα >α∈γ , < fβC >β∈δ , < dU ρ >ρ∈η i. U X Definición 3.1.3. Sean U = hU, < Rα >α∈γ , < gβC >β∈δ , < dU ρ >ρ∈η i, y X = hX, < Rα >α∈γ X ∼ , < hX β >β∈δ , < dρ >ρ∈η i dos estructuras para un lenguaje L. U y X son isomorfas (U = X) si y solo si existe una función biyectiva i : U −→ X que satisface: 1. Para cada sı́mbolo relacional Rα de L, si n es la aridad de Rα , entonces para cada (u1 , . . . , un ) ∈ U n: U X (i(u1 ), . . . , i(un )). Rα (u1 , . . . , un ) ⇔ Rα 2. Para cada sı́mbolo funcional hβ de L, si n es la aridad de hβ , entonces para cada (u1 , . . . , un ) ∈ U n: X i(hU β (u1 , . . . , un )) = hβ (i(u1 ), . . . , i(un )). 3. Para cada sı́mbolo constante dρ de L se tiene que: X i(dU ρ ) = dρ . Ejemplo 3.1.1. [Ejemplos de estructuras isomorfas] b donde < b es un sı́mbolo (1) Sean hN, <i y hN \ {0}, <i dos estructuras para el lenguaje {<}, relacional binario. La función g : N \ {0} −→ N tal que g(n) = n − 1 es un isomorfismo, es decir, hN, <i ∼ = hN \ {0}, <i (ver [24, p. 57]). (2) Teorema (Cantor): Si hB, <B i y hA, <A i son dos ordenes totales, densos, no acotados y numerables, entonces hB, <B i ∼ = hA, <A i (ver [22, p. 38-39]). Notar que un lenguaje b adecuado para estas estructuras es el mencionado en (1) del presente ejemplo {<}. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 23 (3) Teorema (Cantor): Si hA, <A i es un orden total, denso, completo y, además, hA, <A i tiene un subconjunto numerable y denso E isomorfo a hQ, <i, es decir, hE, <A i ∼ = hQ, <i, entonces hA, <A i ∼ = hR, <i (ver [22, p.38-39]). (Un orden total hA, <A i es “denso”si ∀x ∈ A, ∀y ∈ A(x <A y → ∃z ∈ A(x <A z <A y)). Un conjunto Y ⊆ A es un “subconjunto denso”de A si para todo x <A y en A existe un z ∈ Y tal que x <A z <A y. Un conjunto ordenado es “no acotado”si no tiene mayor, ni menor elemento. Un orden total hA, <A i es “completo”si cualquier subconjunto Y ⊆ A distinto de vacı́o tiene un supremo, es decir, una menor cota superior). Notar que un lenguaje adecuado para estas estructuras es también el b mencionado en el Ejemplo 3.1.1 {<}. (4) Teorema (Dedeking): Cualquier dos estructuras de Peano son isomorfas (ver [12, p. 47-48]). Donde una estructura de Peano es una estructura hA, s, 0i para el lenguaje {b s, b 0}, donde b sb es un sı́mbolo funcional binario y 0 es sı́mbolo constante, que cumple con los siguientes tres axiomas P1: ∀x(b s(x) 6≡ x). P2: ∀x∀y(b s(x) ≡ sb(y) → x ≡ y). P3: ∀X[(X(b 0) ∧ ∀x(X(x) → X(b s(x))) → ∀yXy]. Los dos primeros axiomas P1 y P2 son expresables con el lenguaje de la lógica de primer orden que se define más adelante en esta sección, y el tercer axioma P3 (el principio de inducción matemática) no se puede expresar en el lenguaje de la lógica de primer orden si no en el lenguaje (por ejemplo) de la lógica de segundo orden, la razón es que en la lógica de primer orden no se puede cuantificar sobre variables de propiedades si no solo sobre variables de individuos. Un ejemplo de estructura de Peano es hN, S, 0i, donde S es la operación sucesor en N (S(n) = n + 1). Otros ejemplos de estructuras isomorfas pueden encontrarse en [8] y en [24, p. 56-57]. En la demostración del teorema de interpolación para ℓℵ0 ℵ0 que se realiza en la subsección 3.4 se prueba que dos estructuras para un lenguaje determinado son isomorfas. Además, se usará el concepto de isomorfismo para construir una estructura (a partir de otra) que permitirá concluir la prueba del teorema. 3.2 Formalización de un lenguaje de primer orden, satisfación, verdad, validez, contradicción y consecuencia lógica Sea L un lenguaje. Para formalizar a L se utiliza un conjunto de sı́mbolos lógicos, los cuales se listan a continuación: • Conectivas: ¬, ∨, ∧, →, ↔ (negación, disyunción, conjunción, condicional y bicondicional, respectivamente). • Cuantificadores: ∀, ∃ (universal y existencial, respectivamente). • Sı́mbolo de identidad: ≡ (un sı́mbolo relacional binario). • Variables: v0 , v1 , v2 , v3 , v4 , . . . , vk , . . . (k ∈ ℵ0 ). El conjunto de las variables se denotará por V AR. • Paréntesis: ) , ( (paréntesis derecho y paréntesis izquierdo, respectivamente). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 24 Franklin Galindo • La coma: , Ahora se presentará una lista de definiciones que tienen por objetivo indicar cómo usar los sı́mbolos lógicos y los sı́mbolos de L para construir términos y fórmulas del lenguaje L, términos y fórmulas que permitirán hablar de las estructuras para L. Se inicia definiendo Término del lenguaje L, usando inducción: Definición 3.2.1. (a) Toda variable y todo sı́mbolo constantes es un término. (b) Si f es un sı́mbolo funcional n-ario y t1 , . . . , tn son términos, entonces f (t1 , . . . , tn ) es un término. (c) Una sucesión de sı́mbolos es un término si y solo si se obtiene aplicando una cantidad finita de veces las cláusulas (a) y (b). El conjunto de los términos de L se denotará por TL . Ahora se define fórmula atómica de L, las fórmulas más simples del lenguaje L: Definición 3.2.2. (a) Si t1 y t2 son términos, entonces t1 ≡ t2 es una fórmula atómica. (b) Si R es un sı́mbolo relacional n-ario y t1 , . . . , tn son términos, entonces R(t1 , . . . , tn ) es una fórmula atómica. Con la definición de fórmula atómica se procede ahora a formular el concepto de fórmula (fórmula bien formada) de L, dicha definición se hace usando inducción: Definición 3.2.3. (a) Toda fórmula atómica es una foŕmula. (b) Si φ y χ son fórmulas, entonces (¬φ), (φ ∨ χ), (φ ∧ χ), (φ → χ) y (φ ↔ χ) son fórmulas. (c) Si v es una variable y φ es una fórmula, entonces (∀v)φ y (∃v)φ son fórmulas. (d) Una sucesión de sı́mbolos es una fórmula si y solo si se obtiene usando una cantidad finita de veces las cláusulas (a), (b) y (c). Por simplicidad, cuando no exista ambiguedad, se eliminarán los paréntesis externos de las fórmulas y de los cuantificadores, es decir, se escribirá ¬ψ en lugar de (¬ψ) y ∀vψ en lugar de (∀v)ψ, por ejemplo. El conjunto de las fórmulas de L se denotará por FL . Una ocurrencia de una variable en una fórmula se dice que es libre si esta ocurrencia no está bajo el alcance de algún cuantificador. Se dice que dicha ocurrencia es ligada en caso contrario, es decir, si ella está bajo el alcance de algún cuantificador. Según esta definición se puede apreciar que una variable puede tener ocurrencias libres y ocurrencias ligadas en una fórmula. Una definición inductiva de estos conceptos puede encontrarse en [9, p. 41-42]. Con las dos nociones anteriores se define cuándo una variable está libre en una fórmula: Una variable está libre en una fórmula si ella tiene al menos una ocurrencia libre en dicha fórmula. En caso contrario se dice que dicha variable no está libre en la fórmula. Dada una fórmula ψ se escribe ψ(x1 , . . . , xn ) para indicar que las variables libres de ψ están entre x1 , . . . , xn . Los términos de un lenguaje denotan objetos en una estructura (para dicho lenguaje) y las fórmulas del lenguaje afirman hechos relativos a estos objetos en tal estructura, a continuación se definirán de manera precisa estos conceptos. Luego, se definirá (entre otros conceptos) cuándo una fórmula es verdadera y cuando es falsa en una estructura. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 25 Definición 3.2.4. Sea U una estructura para L y k : V AR −→ U . Se define el valor de un término de L en U según k inductivamente en la complejidad del término. Dado un término t se denotará este valor por tU [k] y se omitirá mencionar la estructura U en los casos donde no exista posibilidad de ambiguedad. (a) Si t es la variable v, tU [k] = k(v). (b) Si t es el sı́mbolo constante c, tU [k] = cU . (c) Si t1 , . . . , tn son términos, f es un sı́mbolo funcional n-ario y t = f (t1 , . . . , tn ), entonces tU [k] = f U (t1U [k], . . . , tnU [k]). Intuitivamente, el valor de t en U según k, es el elemento de U denotado por t cuando asignamos a la variables de t valores según k. De lo anterior se deduce que si k y k′ coinciden en las variables que aparecen en el término t, entonces tU [k] = tU [k′ ]. Sea U una estructura para L, k : V AR −→ U y φ una fórmula de L. Se procede a definir lo que significa que k satisface a φ en U, lo que se denota por U |= φ[k]. El significado intuitivo de U |= ϕ[k] es que el resultado de sustituir en φ las variables libres por sus valores según k, es una afirmación verdadera en U. La definición se hace aplicando inducción en la construcción de las fórmula φ. Definición 3.2.5. (Caso base) (a) Caso base: Si φ es una fórmula atómica, es decir, φ = t1 ≡ t2 o φ = R(t1 , . . . , tn ), entonces: (a.1) U |= t1 ≡ t2 [k] ⇐⇒ t1U [k] = t2U [k]. (a.2) U |= R(t1 , . . . , tn )[k] ⇐⇒ RU (t1U [k], . . . , tnU [k]). (b) Caso inductivo: Si φ = ¬χ o φ = χ → σ o φ = χ ∧ σ o φ = χ ∨ σ o φ = χ ↔ σ, donde χ y σ son fórmulas para las cuales se ha definido lo que se quiere, entonces: (b.1) U |= (¬χ)[k] ⇐⇒ U 6|= χ[k]. (b.2) U |= (χ → σ)[k] ⇐⇒ U 6|= χ[k] o U |= σ[k]. (b.3) U |= (χ ∧ σ)[k] ⇐⇒ U |= χ[k] y U |= σ[k]. (b.4) U |= (χ ∨ σ)[k] ⇐⇒ U |= χ[k] o U |= σ[k]. (b.5) U |= (χ ↔ σ)[k] ⇐⇒ {U |= χ[k] y U |= σ[k]} o {U 6|= χ[k] y U 6|= σ[k]}. (b.6) U |= ((∀v)χ)[k] ⇐⇒ U |= χ[k′ ] para toda k′ : V AR −→ U que difiere de k a lo sumo en el valor que le asigna a la variable v. (b.7) U |= ((∃v)χ)[k] ⇐⇒ U |= χ[k′ ] para alguna k′ : V AR −→ U que difiere de k a lo sumo en el valor que le asigna a la variable v. Definición 3.2.6. Sea U una estructura para L y φ una fórmula de L, entonces se cumple: (a) φ es satisfacible si existe una estructura U y una k : V AR −→ U tal que U |= φ[k]. (b) φ es verdad en U si y solo si U |= ϕ[k], para toda k : V AR −→ U . Esto también se expresa diciendo que U es un modelo de φ y se denota por U |= φ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 26 Franklin Galindo (c) φ es falsa en U si y solo si U 6|= φ[k], para toda k : V AR −→ U . (d) Si Γ es un conjunto de fórmulas, se dice que U es un modelo de Γ si toda fórmula φ ∈ Γ es verdad en U. Observación 3.2.1. Se cumple que si φ es una fórmula con variables libres vi1 , . . . , vim , entonces el que k : V AR −→ U satisfaga a φ en U solo depende de los valores de k en las variables vi1 , . . . , vim . De modo que si a1 = k(vi1 ), . . . , am = k(vim ), entonces se escribirá U |= φ[a1 , . . . , am ] en vez de U |= φ[k]. Definición 3.2.7. Sea Γ un conjunto de fórmulas en un lenguaje L y φ una fórmula de L. Se dice que: (a) φ es lógicamente válida (o válida) si es verdad en toda estructura. (b) φ es contradictoria si ¬φ es lógicamente válida, es decir, si φ es falsa en toda estructura. (c) φ es una consecuencia lógica de Γ, denotado por Γ |= φ, si toda estructura para L que es un modelo de Γ también es un modelo de φ, es decir, si no existe una estructura para L que sea modelo de Γ y no sea modelo de φ. Cuando se trata de consecuencia lógica de conjuntos unitarios, por ejemplo, {ψ} |= φ, se escribe ψ |= φ. Y cuando se trata de consecuencias lógicas del conjunto de sentencias vacı́o, ∅ |= φ, se escribe ası́: |= φ. Observación 3.2.2. Como en el caso de la lógica proposicional, una consecuencia inmediata de la definición anterior es que: ψ es lógicamente válida si y solo si |= ψ. 3.3 Teorema de completitud de Gödel y el teorema de compacidad A continuación se enuncia el teorema de completitud de Gödel para ℓℵ0 ℵ0 , el cual se utilizará en la prueba del teorema de interpolación para ℓℵ0 ℵ0 . En especial, se usará la técnica de Henkin de construcción de modelos a partir de constantes que se aplica contemporáneamente en la demostración del teorema de Completitud de Gödel (ver [17]). Dicha técnica, contiene un método que permite construir un modelo para un conjunto consistente de sentencias T en un lenguaje J , extendiéndola (inductivamente) a una teorı́a maximal consistente T ′ , en un lenguaje expandido J ∪ E, donde E es un conjunto numerable de nuevos sı́mbolos constantes que funcionan como “testigos”para T ′ . El modelo se construye con los términos cerrados de J ∪ E, o solamente con E, usando clases de equivalencia de los mismos y la propiedad de maximal consistencia. Más adelante se definirán estos conceptos. Una prueba contemporánea del teorema de completitud de Gödel aplicando el método de Henkin puede encontrarse en los textos [8, 9, 11, 12, 24, 25]. La que se utiliza en este trabajo es la versión presente en [8]. Se presentan dos enunciandos del teorema que son equivalentes, pero antes de formularlos se definirá la noción de “deducibidad”, pues ella es requerida para dichas formulaciones. Axiomas para ℓℵ0 ℵ0 (esquemas de axiomas) (ver [11, p. 166-167]): Son todas las generalizaciones de fórmulas de la formas siguientes, donde x, y son variables y φ y χ son fórmulas (Definición: φ es una generalización de χ si φ es ∀x1 , . . . , xn χ, para variables x1 , . . . , xn ): 1. Todas las instancias de tautologı́as de la lógica proposicional. 2. ∀xφ → φxt , donde t es substituible por x en φ. 3. ∀x(φ → χ) → (∀xφ → ∀xχ). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 27 4. φ → ∀xφ, donde x no ocurre libre en φ. 5. y ≡ y. ′ ′ 6. (x ≡ y) → (φ → φ ), donde φ es una fórmula atómica y φ se obtiene de φ al reemplazar x por y en cero o más lugares (aunque no necesariamente en todos). REGLA DE INFERENCIA: (Modus Ponens) A partir de φ → χ y φ se puede inferir χ. Definición 3.3.1. Sea Γ un conjunto de fórmulas y φ una fórmula. Se dice que φ se deduce de Γ o que φ se demuestra a partir de Γ, lo que se denota por Γ ⊢ φ, si existe una sucesión finita σ1 , . . . , σm de fórmulas tales que σm = φ, y cada σi es un axioma, o es un miembro de Γ, o se obtiene de dos fórmulas anteriores en la sucesión por la regla de inferencia Modus Ponens. Si Γ = ∅, entonces se escribe ⊢ φ en lugar de ∅ ⊢ φ. Definición 3.3.2. Sea Θ un conjunto de fórmulas de un lenguaje L. Se dice que Θ es consistente si y solo si no existe una fórmula ψ del lenguaje L tal que Θ ⊢ ψ y Θ ⊢ ¬ψ. Y se dice que Θ es inconsistente si Θ no es consistente. Teorema 3.3.1 (Teorema de completitud de Gödel (1930), Henkin (1949)). Sea Σ un conjunto de sentencias de un lenguaje numerable L y ϕ una sentencia de L, entonces: (1) Primera versión: Σ es consistente ⇐⇒ Σ tiene un modelo. (2) Segunda versión: Σ ⊢ ϕ ⇐⇒ Σ |= ϕ. Vale la pena resaltar que el teorema de completitud de Gödel también se cumple para lenguajes de primer orden de cualquier cardinalidad, en tal caso se requiere del axioma de elección para hacer la prueba (ver [8, 25]). Una consecuencia muy conocida del teorema de completitud de Gödel es el teorema de compacidad, dicho teorema también se utilizará en la prueba del teorema de interpolación para ℓℵ0 ℵ0 . El teorema de compacidad se puede probar como un corolario del teorema de completitud de Gödel o directamente usando, por ejemplo, el método de ultraproductos. Ambas pruebas pueden encontrarse (entre otros) en los textos [8, 9, 11, 24]. A continuación se presentan dos enunciados del teorema de compacidad que son equivalentes, en este trabajo se utilizará la segunda versión: Teorema 3.3.2 (Teorema de compacidad). Sea Σ un conjunto de sentencias de un lenguaje numerable L y ϕ una sentencia de L, entonces: (1) Primera versión: Σ tiene un modelo ⇐⇒ cada subconjunto finito de Σ tiene un modelo. (2) Segunda versión: Σ |= ϕ ⇐⇒ Existe un subconjunto finito Σ0 ⊆ Σ tal que Σ0 |= ϕ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 28 Franklin Galindo Vale la pena resaltar que no es fácil encontrar en la bibliografı́a la fecha de la primera demostración del teorema de compacidad para ℓℵ0 ℵ0 , la más antigua que conoce el autor de este trabajo es la de Gödel de 1930 (ver [16]), quien lo probó como un cololario de su teorema de completitud. Es conocido que la propiedad de “compacidad” en lógica está estrechamente relacionada con la propiedad de “compacidad” en el análisis matemático o en la topologı́a, pues (por ejemplo) se cumple que el teorema de compacidad para una teorı́a en primer orden Γ es equivalente a que el espacio (topológico) de Stone correspondiente al álgebra de Lindenbaum de Γ sea compacto. Y los antecedentes de la propiedad de compacidad en análisis y Topologı́a (según la bibliografı́a) se remontan al teorema clásico de Heine-Borel (ver [28]) que afirma que “todo cubrimiento abierto de un conjunto cerrado y acotado del espacio de los reales tiene un subcubrimiento finito”, dicho teorema (Heine-Borel) tiene versiones de finales del siglo XIX (ver [30]). 3.4 Formulación y demostración del teorema de interpolación A continuación se presentarán una serie de definiciones que serán pilares fundamentales para la demostración del teorema principal de esta sección. Definición 3.4.1. Una teorı́a de un lenguaje J , es un conjunto de sentencias de J . Definición 3.4.2. Sea Σ un conjunto de sentencias de un lenguaje J . Σ es maximal consistente si Σ es consistente y no existe un conjunto de sentencias consistente Γ que contenga propiamente a Σ, es decir, un Γ tal que Σ ⊆ Γ y exista una sentencia γ tal γ ∈ Γ y γ 6∈ Σ. Definición 3.4.3. Sea Σ un conjunto de sentencias de un lenguaje J y E un conjunto de constantes de J . Se dice que E es un conjunto de testigos para Σ en J si para toda fórmula ϕ de J con a lo sumo una variable libre (digamos, x) existe una e ∈ E tal que: Σ ⊢ ∃xϕ(x) → ϕ(e). Es importante destacar que en la demostración del siguiente teorema se presentan una serie de proposiciones, intrı́nsecas del mismo, que se irán probando acorde a su aparición para hacer menos pesado el dearrollo de la demostración del teorema, ya que la misma es extensa. Para tal fin se usará el sı́mbolo “” para indicar el final de la prueba de las proposiciones, distinguiendo de esta forma el final de la demostración del teorema que se indicará con el sı́mbolo “”. También se presentan una serie de observaciones intrı́nsecas, y de utilidad, para el desarrollo de la demostración. Teorema 3.4.1 (Teorema de interpolación para la lógica de primer orden). Sean χ y ζ dos sentencias en primer orden tal que χ |= ζ, entonces existe una sentencia λ tal que: (i) χ |= λ y λ |= ζ. (ii) Cualquier sı́mbolo de relación, función o constante (excluyendo la identidad) que ocurra en λ, también ocurre en χ y ζ. La sentencia λ es llamada una “interpolación de χ y ζ”. Observación 3.4.1. Los siguientes tres ejemplos muestran porque es necesario permitir que el sı́mbolo de la identidad ocurra en λ y no necesariamente en χ y ζ, en efecto, notar que los siguientes pares de sentencias tienen el sı́mbolo de identidad a lo sumo en una de ellas, y sin embargo, ellas no tienen interpolación λ que no tenga el sı́mbolo de identidad: (1) χ = ∃x(Sx ∧ ¬Sx) y ζ = ∃xRx. Una λ = ¬∀x(x ≡ x). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación (2) χ = ∃xRx y ζ = ∃x(Sx ∨ ¬Sx). (3) χ = ∀x∀y(x ≡ y) y 29 Una λ = ∀x(x ≡ x). ζ = ∀x∀y(Sx ↔ Sy). Una λ = ∀x∀y(x ≡ y). Sin embargo, cuando el sı́mbolo de identidad no aparece en χ ni en ζ, y χ no es una sentencia contadictoria y ζ no es una sentencia válida, entonces en la interpolación λ de χ y ζ no aparece el sı́mbolo de identidad (ver [8]). Por ejemplo: χ = ∀x∀y((T (x, y) → C(x, y)) ∧ T (f (a), b)) y ζ = C(f (a), b)) ∧ T (f (a), b)). Una λ = (T (f (a), b)) → C(f (a), b)) ∧ T (f (a), b). Otro ejemplo de interpolación es el siguiente: χ = g(b) ≡ d ∧ Q(g(b)) y ζ = (d ≡ e) → Q(e). Una λ = Q(d). Demostración del teorema. Considerando la observación anterior se tiene que si χ es una sentencia insatisfacible, entonces una sentencia λ interpolación de χ y ζ es ¬∀x(x ≡ x), y si ζ es una sentencia válida, entonces una sentencia λ interpolación de χ y ζ es ∀x(x ≡ x). En consecuencia, para terminar de demostrar el teorema se considerará el caso en que χ no es una sentencia insatisfacible (χ es satisfacible) y ζ no es una sentencia válida (¬ζ es satisfacible). Se demostrará este caso por reducción al absurdo. Supóngase que no existe una sentencia λ interpolación para χ y ζ. Se obtendrá una contradicción demostrando que no ocurre χ |= ζ contruyendo un modelo para χ ∧ ¬ζ. (Notar que la prueba que se realizará no es constructiva). Sea L el lenguaje de todos los sı́mbolos que ocurren en χ o en ζ o en ambas. Sea L1 el lenguaje de todos los sı́mbolos que ocurren en χ, L2 el lenguaje de todos los sı́mbolos que ocurren en ζ y L0 el lenguaje de todos los sı́mbolos que ocurren en ambas (χ y ζ), es decir, L = L1 ∪ L2 , L0 = L1 ∩ L2 . Ahora se extiende el lenguaje L a un lenguaje L′ , agregándole un conjunto numerable C = {cn : n ∈ ℵ0 } de nuevos sı́mbolos constantes, es decir, L′ = L ∪ C. En correspondencia con esta extensión de L, se definen las extensiones con C de L0 , L1 y L2 , ası́: L′0 = L0 ∪ C, L′1 = L1 ∪ C, L′2 = L2 ∪ C. Considérese ahora un par de teorı́as K de L′1 y H de L′2 . Se dice que una sentencia λ de L′0 separa a K y a H si y solo si: K |= λ y H |= ¬λ. Además, se dice que las teorı́as K y H son inseparables si y solo si ninguna sentencia λ de L′0 separa a K y H. Lo que resta de la demostración se parece a la prueba del teorema de completitud de Gödel usando la técnica de Henkin sobre construcción de modelos a partir de constantes, pero usando adicionalmente la noción de “par de teorı́as inseparables”. Veamos de inicio la siguiente: Proposición ♦: {χ} y {¬ζ} son inseparables. Demostración: Aplicando reducción al absurdo, supóngase que existe una sentencia λ(c1 , . . . , cn ) de L′0 que separa a K y H, donde c1 , . . . , cn ∈ C. Sean z1 , z2 , . . . , zn variables que no ocurren en Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 30 Franklin Galindo λ(c1 , c2 , . . . , cn ), entonces la sentencia ∀z1 ∀z2 . . . ∀zn λ(z1 , z2 , . . . , zn ) es una interpolación de χ y ζ, es decir, χ |= ∀z1 ∀z2 . . . ∀vn λ(z1 , z2 , . . . , zn ) y ∀z1 ∀z2 . . . ∀zn λ(z1 , z2 , . . . , zn ) |= ζ. Contradicción pues se está suponiendo que no existe una sentencia interpolación para χ y ζ. El conjunto de todas las sentencias de L′1 es numerable y también el conjunto de todas las sentencias de L′2 . Considérese una lista de tales sentencias, primero las de L′1 y luego las de L′2 : χ0 , χ1 , χ2 , . . . , χn , . . . (n ∈ ℵ0 ), ζ0 , ζ1 , ζ2 , . . . , ζn , . . . (n ∈ ℵ0 ) Ahora se construirán dos secuencias crecientes de teorı́as de L′1 y de L′2 , respectivamente, {χ} = K0 ⊆ K1 ⊆ K2 . . . ⊆ Kn . . . (n ∈ ℵ0 ), {¬ζ} = H0 ⊆ H1 ⊆ H2 . . . ⊆ Hn . . . (n ∈ ℵ0 ), tales que cumplen las siguientes propiedades: (i) Kn y Hn son conjuntos finitos de sentencias inseparables. (ii) Si Kn ∪ {χn } es inseparable con Hn , entonces χn ∈ Kn+1 . Si Kn+1 y Hn ∪ {ζn } son inseparables, entonces ζn ∈ Hn+1 (Notar que el procedimiento es en zigzag). (iii) Si χn = ∃xρ(x) y χn ∈ Kn+1 , entonces ρ(a) ∈ Kn+1 , para alguna a ∈ C tal que a no aparezca en Kn ∪ {χn }. Si ζn = ∃xτ (x) y ζn ∈ Hn+1 , entonces τ (b) ∈ Hn+1 , para alguna b ∈ C tal que b no aparezca en Hn ∪ {ζn }. Si han sido definidas las teorı́as Kn y Hn , entonces se pueden construir las teorı́as Kn+1 y Hn+1 de la manera usual:  si Kn ∪ {χn } es inseparable con Hn y χn no es existencial  Kn ∪ {χn } Kn ∪ {χn } ∪ {ρ(a)} si Kn ∪ {χn } es inseparable con Hn , y χn = ∃xρ(x) Kn+1 =  Kn en caso de que Kn ∪ {χn } no sea inseparable con Hn donde a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪{χn }.  si Hn ∪ {ζn } es inseparable con Kn+1 y ζn no es existencial  Hn ∪ {ζn } Hn ∪ {ζn } ∪ {τ (b)} si Hn ∪ {ζn } es inseparable con Kn+1 , y ζn = ∃xτ (x) Hn+1 =  Hn en caso de que Hn ∪ {ζn } no sea inseparable con Kn+1 donde b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪{ζn }. Entonces, como por construcción se tiene a las teorı́as K0 = {χ} y H0 = {¬ζ}, se puede continuar construyendo inductivamente, mediante la regla de definición anterior, a las dos secuencias de teorı́as Ki y Hi , para cada i ∈ ℵ0 . Se demostrará que tales secuencias tienen las propiedades (i), (ii) y (iii). Solo se mostrará (i), pues las propiedades (ii) y (iii) se cumplen por contrucción. (i) Hay que probar que ∀i ∈ ℵ0 , Ki y Hi son finitos e inseparables. Se hará por inducción en N: Caso base: (n = 0). Obviamente K0 y H0 son finitos y también son inseparables (Ver Proposición ♦). Caso inductivo: Sea n ∈ N. Supóngase que Kn y Hn cumplen con lo deseado, es decir, son finitos e inseparables. Se debe probar que Kn+1 y Hn+1 son finitos e inseparables. El que son finitos es Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 31 inmediato por la construcción. Para probar que son inseparables hay que considerar varios casos según la definición inductiva (Kn+1 y Hn+1 tienen tres posibilidades de ser cada uno), pero la idea principal de dicha prueba se puede presentar demostrando un caso modelo de todos los posibles, los demás casos salen usando esa idea y/o la hipótesis inductiva y/o la definición inductiva. Considérese el siguiente caso: Kn+1 = Kn ∪ {χn } ∪ {ρ(a)}, Hn+1 = Hn ∪ {ζn } ∪ {τ (b)}, (1) donde χn = ∃xρ(x), ζn = ∃xτ (x), a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪ {χn }, y b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪ {ζn }. Supóngase que Kn+1 y Hn+1 son separables, es decir, existe una sentencia λ de L′0 tal que: Kn+1 |= λ y Hn+1 |= ¬λ. Aplicando el teorema de completitud de Gödel y el teorema de la deducción en Hn+1 se tiene que: Hn ∪ {ζn } ⊢ τ (b) → ¬λ. Entonces, como b no aparece en Hn ∪{ζn }, se aplica la regla de introducción del generalizador y se tiene que: Hn ∪ {ζn } ⊢ ∀x(τ (x) → ¬λ). Volviendo a aplicar el teorema de completitud de Gödel se concluye que: Hn ∪ {ζn } |= ∀x(τ (x) → ¬λ). En consecuencia se tiene que: Hn ∪ {ζn } |= ¬λ. Entonces Kn+1 y Hn ∪ {ζn } son separables. Esto contradice la definición de Hn+1 en el caso analizado, ver la ecuación (1) y la definición inductiva. Por lo tanto, Kn+1 y Hn+1 son inseparables, lo que se querı́a probar. Sean ahora, Kω = [ Kn , n∈ω Hω = [ Hn . n∈ω Se mostrará lo siguiente: Proposición ♣: Kω y Hω son inseparables. Demostración: Aplicando reducción al absurdo, si Kω y Hω son separables, entonces existe una sentencia λ de L′0 tal que Kω |= λ y Hω |= ¬λ. Entonces, por el teorema de compacidad, existen conjuntos finitos Γ0 ⊆ Kω y Γ1 ⊆ Hω tales que Γ0 |= λ y Γ1 |= ¬λ. Luego, por la construcción Kω y Hω , existe j ∈ ℵ0 tal que Γ0 ⊆ Kj y Γ1 ⊆ Hj . En consecuencia, Kj |= λ y Hj |= ¬λ. Por lo tanto, Kj y Hj son separables. Esto contradice la cláusula (i) probada anteriormente. Entonces, Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 32 Franklin Galindo Kω y Hω son inseparables. Ahora, tomando en cuenta la Definición 3.4.2 y la Definición 3.4.3, se tiene lo siguiente: Proposición △: Kω y Hω son teorı́as maximal consistentes en L′1 y L′2 , respectivamente. Además, ambas tienen al conjunto de constantes C como conjunto de testigos (en L′1 y L′2 , respectivamente). Demostración: Primero se probará que Kω y Hω son consistentes, luego se probará que son máximal consistentes, y por último se probará que el conjunto de constantes C es un conjunto de testigos para Kω y también para Hω (en L′1 y L′2 , respectivamente). Para probar que Kω y Hω son consistentes primero se probará que ∀i ∈ ℵ0 , Ki y Hi son consistentes. Aplicando inducción en N: Caso base: (n = 0). K0 tiene un modelo, pues por hipótesis χ no es insatisfacible, y H0 tiene un modelo, pues por hipótesis ζ no es válida, entonces por el teorema de completitud de Gödel K0 y H0 son consistentes. Caso inductivo: Sea n ∈ N. Supóngase que Kn y Hn cumplen con lo deseado, es decir, ellas son consistentes. Se debe probar que Kn+1 y Hn+1 son consistentes. Para esto hay que considerar varios casos según la definición inductiva (Kn+1 y Hn+1 tienen tres posibilidades de ser cada uno), pero la idea principal de dicha prueba se puede presentar demostrando un caso modelo de todos los posibles, los demás casos salen usando esa idea y/o la hipótesis inductiva y/o la definición inductiva. Considérese ahora el siguiente caso: Kn+1 = Kn ∪ {χn } ∪ {ρ(a)}, (2) Hn+1 = Hn ∪ {ζn } ∪ {τ (b)}, (3) donde χn = ∃xρ(x), ζn = ∃xτ (x), a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪{χn }, y b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪ {ζn }. Supóngase que Kn+1 es inconsistente, entonces cualquier proposición de L′1 es consecuencia lógica de Kn+1 . Sea λ una sentencia contradictoria de L′0 , entonces: Kn+1 |= λ. Aplicando el teorema de completitud de Gödel y el teorema de la deducción en Kn+1 se tiene que: Kn ∪ {χn } ⊢ ρ(a) → λ. Entonces, como a no aparece en Kn ∪ {χn }, se aplica la regla de introducción del generalizador y se tiene que: Kn ∪ {χn } ⊢ ∀x(ρ(x) → λ). Volviendo a aplicar el teorema de completitud de Gödel se concluye que: Kn ∪ {χn } |= ∀x(ρ(x) → λ). En consecuencia, se tiene que Kn ∪ {χn } es insatisfacible. Por lo tanto, Kn ∪ {χn } |= λ y, como ¬λ es una sentencia válida, se tiene que Hn |= ¬λ. Ası́, Kn ∪ {χn } y Hn son separables. Esto Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 33 contradice la definición de Kn+1 en el caso analizado, ver ecuación (2) y definición inductiva. Por lo tanto, Kn+1 es cosistente. Si Hn+1 es inconsistente, entonces se aplica un razonamiento análogo al caso anterior de Kn+1 y se concluye que Hn ∪ {ζn } y Kn+1 son separables lo cual contradice a definición de Hn+1 en el caso analizado, ver ecuación (3) y definición inductiva. Por lo tanto, Hn+1 es consistente. Con lo queda demostrado que ∀i ∈ ℵ0 , Ki y Hi son consistentes. Ahora se probará que Kω y Hω son consistentes. Si Kω es inconsistente, entonces por la Definición 3.3.1 se tiene que existe un conjunto finito Γ0 ⊆ Kω tal que Γ0 es inconsistente. En consecuencia, (por construcción) existe un j ∈ ℵ0 tal que Γ0 ⊆ Kj . Por lo tanto, Kj es inconsistente. Esto contradice el resultado anterior. Entonces Kω es consistente. Aplicando un razonamiento análogo se prueba que Hω es consistente. Seguidamente se probará que Kω y Hω son maximal consistente en L′1 y L′2 , respectivamente. Se demostrará que Hω es máximal consistente en L′2 , para esto suficiente mostrar que ∀i ∈ ℵ0 , (ζi ∈ Hω ) o (¬ζi ∈ Hω ). Por reducción al absurdo, supóngase que existe un n ∈ ℵ0 tal que (ζn 6∈ Hω ) y (¬ζn 6∈ Hω ). Ası́, por construcción, ambas proposiciones fueron sacadas en el paso corespondiente a su subı́ndice, ζn en Hn+1 , y supóngase que ¬ζn en Hr+1 , donde r ∈ ℵ0 , es decir, por construcción: Hn ∪ {ζn } es separable con Kn+1 ; y Hr ∪ {ζr } es separable con Kr+1 , donde ¬ζn = ζr . En consecuencia, existe una sentencia λ de L′0 tal que (Hn ∪ {ζn }) |= λ y Kn+1 |= ¬λ. Y existe una sentencia λ′ de L′0 tal que (Hr ∪ {¬ζn }) |= λ′ y Kr+1 |= ¬λ′ . Sin perder generalidad, supóngase que r > n. Entonces, por construcción, Hn ⊆ Hr y Kn+1 ⊆ Kr+1 , teniendo que: Hr |= ζn → λ, Kr+1 |= ¬λ, Hr |= ¬ζn → λ′ , Kr+1 |= ¬λ′ . Luego, Hr |= (λ ∨ λ′ ), Kr+1 |= ¬(λ ∨ λ′ ). En consecuencia, Kω |= (λ ∨ λ′ ), Hω |= ¬(λ ∨ λ′ ). Por lo tanto, Kω y Hω son separables. Esto contradice lo desmostrado anteriormente en la Proposición ♣, entonces ∀i ∈ ℵ0 , (ζi ∈ Hω ) o (¬ζi ∈ Hω ), concluyendo que Hω es maximal consistente. La prueba de que Kω es maximal consistente se realiza de manera análoga. Por último, se probará que el conjunto de constantes C es un conjunto de testigos para Kω y para Hω (en L′1 y L′2 , respectivamente). Se mostrará que C es un conjunto de testigos para Kω en L′1 . Sea ∃xϕ(x) una sentencia de L′1 . Como Kω es maximal consistente, entonces ∃xϕ(x) ∈ Kω o ¬∃xϕ(x) ∈ Kω . Si ∃xϕ(x) ∈ Kω , entonces por construcción para alguna constante a ∈ C se tiene que ϕ(a) ∈ Kω . Ası́, Kω ⊢ ϕ(a) y, en consecuencia, Kω ⊢ ∃xϕ(x) → ϕ(a). Si ¬∃xϕ(x) ∈ Kω , entonces Kω ⊢ ¬∃xϕ(x). Luego, Kω ⊢ (¬∃xϕ(x)) ∨ ϕ(a) para cualquier constante a ∈ C. En consecuencia, Kω ⊢ ∃xϕ(x) → ϕ(a) para cualquier constante a ∈ C. En conclusión, C es un conjunto de testigos para Kω en L′1 . La demostración de que C es un conjunto de testigos para Hω (en L′2 ) se realiza de manera análoga. Proposición ♠: Kω ∩ Hω es una teorı́a maximal consistente en L′0 . Demostración: Como Kω ∩ Hω ⊆ Kω y Kω ∩ Hω ⊆ Hω y Kω y Hω son teorı́as consistentes, entonces Kω ∩ Hω es consistente. Se probará que Kω ∩ Hω es maximal consistente demostrando que para toda proposición φ de L′0 se cumple que φ ∈ Kω ∩ Hω o ¬φ ∈ Kω ∩ Hω . Sea una proposición φ de L′0 . Como Kω y Hω son inseparables, entonces no puede ocurrir que φ ∈ Kω y Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 34 Franklin Galindo ¬φ ∈ Hω o que ¬φ ∈ Kω y φ ∈ Hω . Entonces como Kω y Hω son teorı́as maximal consistentes en L′1 y L′2 , respectivamente, se concluye que φ ∈ Kω ∩ Hω o ¬φ ∈ Kω ∩ Hω . Por lo tanto, Kω ∩ Hω es maximal consistente. Ahora se procederá a construir un modelo para la teorı́a Kω ∪ Hω , y como χ ∈ Kω y ¬ζ ∈ Hω entonces se tendrá el modelo buscado para χ ∧ ¬ζ. Con esto terminará la demostración del teorema: Usando la técnica de construcción de modelos a partir de constantes de Henkin, que se aplica para demostrar en teorema de completitud de Gödel en [8], se puede construir un modelo para la teorı́a Kω y otro modelo para la teorı́a Hω , pues se ha demostrado (Proposición △) que dichas teorı́as son maximal consistentes en L′1 y L′2 , respectivamente. Además, ambas tienen al conjunto numerable de nuevas constantes C = {cn : n ∈ ℵ0 } como un conjunto de testigos (en L′1 y L′2 , respectivamente). Sea A una estructura para L′1 , modelo para Kω , que se construirá utilizando la técnica referida anteriormente. Sea C = {cn : n ∈ ℵ0 } el conjunto de nuevas constantes. Para no tener problemas con las sentencias atómicas de Kω , se define sobre C una relación de equivalencia ∼ de la siguiente manera: Sean ci ∈ C y cj ∈ C, entonces ci ∼ cj si y solo si ci ≡ cj ∈ Kω . Notar que ∼ es una relación de equivalencia porque, la relación de identidad es reflexiva, simétriC = {[cn ] : cn ∈ C} el conjunto cociente determinado por ∼. Notar que el ca y transitiva. Sea ∼ C cardinal de es a lo sumo numerable. ∼ C El universo A de la estructura A es el conjunto cociente , y las interpretaciones en A para ∼ los sı́mbolos de L′1 son las siguientes: (1) Si c1 , . . . , cn son constantes de C y R es un sı́mbolo relacional n-ario de L′1 entonces, RA ([c1 ], . . . , [cn ]) ⇐⇒ R(c1 , . . . , cn ) ∈ Kω . (2) Si a es un sı́mbolo constante de L′1 , entonces, aA = [ci ], para alguna constante ci ∈ C tal que a ≡ ci ∈ Kω . Tal constante existe, pues ⊢ ∃x(a ≡ x). Por tanto, ∃x(a ≡ x) ∈ Kω . Luego, como C es un conjunto de testigos para Kω , se concluye que existe una constante ci ∈ C tal que (a ≡ ci ) ∈ Kω . Notar que por las propiedades de la relación de identidad ≡ la interpretación de a en A, aA , es única. Notar también que ∀j ∈ ℵ0 si cj ∈ C, entonces cA j = [cj ], pues cj ≡ cj ∈ Kω . (3) Si c1 , . . . , cn son constantes de C y f es un sı́mbolo funcional n-ario de L′1 entonces, f A ([c1 ], . . . , [cn ]) = [ci ], para alguna constante ci ∈ C tal que (f (c1 , . . . , cn ) ≡ ci ) ∈ Kω . Como en el caso anterior, tal constante ci existe pues ∃x(f (c1 , . . . , cn ) ≡ x) ∈ Kω y C es un conjuntos de testigos para Kω . Notar también que por las propiedades de la relación de identidad está garantizada la unicidad de la imagen en A de f A ([c1 ], . . . , [cn ]). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 35 Con esto termina la definición de la estructura A que es un modelo de la teorı́a Kω . Sea ahora una esructura B para L′2 , modelo para Hω , que se construye de manera análoga a la estructura A para L′1 . Los universos de A y B son los siguientes (por construcción): A = {[cn ] : cn ∈ C}, B = {[cn ]′ : cn ∈ C}. Como Kω ∩ Hω es una teorı́a maximal consistente en L′0 (Proposición ♠), pues Kω y Hω son inseparables (Proposición ♣), se cumple que A ↾ L′0 y B ↾ L′0 son isomorfas. Donde A ↾ L′0 es la estructura para L′0 que tiene el mismo universo de A y preserva la misma interpretación de A para los sı́mbolos de L′0 , y B ↾ L′0 es la estructura para L′0 que tiene el mismo universo de B y preserva la misma interpretación de B para los sı́mbolos de L′0 . En efecto, sea f : A −→ B una función de A en B definida ası́: f ([cn ]) = [cn ]′ . Claramente, f es sobreyectiva, y f es inyectiva porque Kω ∩ Hω es una teorı́a maximal consistente en L′0 . Por tanto, f es una función biyectiva. Se demostrará que f preserva las funciones, relaciones y constantes corrrespondientes a L′0 . Sea R un sı́mbolo de relación n-ario de L′0 . Hay que probar que: RA ([c1 ], . . . , [cn ]) ⇔ RB ([c1 ]′ , . . . , [cn ]′ ). Por definición se tiene que: RA ([c1 ], . . . , [cn ]) ⇔ R(c1 , . . . , cn ) ∈ Kω Como Kω ∩ Hω es maximal consistente, entonces R(c1 , . . . , cn ) ∈ Kω ⇔ R(c1 , . . . , cn ) ∈ Hω . Luego, por definición, R(c1 , . . . , cn ) ∈ Hω ⇔ RB ([c1 ]′ , . . . , [cn ]′ ). Sea g un sı́mbolo de función n-ario de L′0 . Hay que probar que: f (g A ([c1 ], . . . , [cn ])) = g B (f ([c1 ]), . . . , f ([cn ])). Por definición de f , se obtiene que g B (f ([c1 ]), . . . , f ([cn ])) = g B ([c1 ]′ , . . . , [cn ]′ ) Dado que g(c1 , . . . , cn ) ≡ ci ∈ Hω (para algún i ∈ ℵ0 ), entonces g B ([c1 ]′ , . . . , [cn ]′ ) = [ci ]′ . Por definición de f , se tiene que [ci ]′ = f ([ci ]). Ası́, dado que g(c1 , . . . , cn ) ≡ ci ∈ Kω pues Kω ∩ Hω es maximal consistente, se tiene f ([ci ]) = f (g A ([c1 ], . . . , [cn ]). B ′ Sea ci una constante de C, entonces por definición, cA i = [ci ] y ci = [ci ] . En consecuencia, ′ B = f ([ci ]) = [ci ] = ci . Sea a una constante de L′0 que no está en C, entonces existe un j ∈ ℵ0 tal que cj ∈ C y a ≡ cj ∈ Kω . Luego, a ≡ cj ∈ Hω pues Kω ∩ Hω es maximal consistente. En consecuencia, por f (cA i ) Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 36 Franklin Galindo definición, aA = [cj ] y aB = [cj ]′ , concluyendo que f (aA )=aB . Ası́, se tiene que A ↾ L′0 y B ↾ L′0 son isomorfas. Considérese ahora que A = B, es decir, que ∀n ∈ ℵ0 ([cn ] = [cn ]′ ). Sea D un conjunto equipotente a B y h : B −→ D una función biyectiva de B en D, entonces se construye una extensión de la estructura B al lenguaje L′ de la manera usual (teniendo presente la definición de estructuras isomorfas), es decir, se construye de la manera natural una estructura D para L′ tal que D ↾ L′2 y B sean isomorfas, y D ↾ L′1 y A sean isomorfas. En consecuencia, D es un modelo de Tω ∪ Hω y, como χ ∈ Kω y ¬ζ ∈ Hω, entonces D es un modelo de χ ∧ ¬ζ. Observación 3.4.2. Como se dijo en la introducción de este artı́culo un corolario importante del teorema de interpolación de Craig es el teorema de definibilidad de Beth (1953): Γ(Q) define a Q implı́citamente si y solo si Γ(Q) define a Q explı́citamente. Donde Q es un sı́mbolo relacional n-ario y Γ(Q) es un conjunto de sentencias de un lenguaje que contiene a Q y (posiblemente) a otros sı́mbolos relacionales. Otro corolario destacado del teorema de interpolación de Craig, es el teorema de consistencia de Robinson (1956): Sean J1 y J2 dos lenguajes y sea J = J1 ∩ J2 . Supóngase que K es una teorı́a completa en J , y K1 ⊇ K y K2 ⊇ K son dos teorı́as consistentes en J1 y J2 , respectivamente. Entonces K1 ∪ K2 es una teorı́a consistente en J1 ∪ J2 . Una (detallada) formulación y demostración de ambos teoremas a partir del teorema de interpolación de Craig puede encontrarse en el texto [8, p. 90-91]. 4 Algunas generalizaciones del teorema de interpolación Craig a otros sistemas lógicos La revisión de bibliográfı́a especializada sobre la propiedad de interpolación Craig revela que tal tema es bastante amplio y profundo, (como se dijo en la introducción de este artı́culo) abarca teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Por ejemplo, se ha investigado si dicha propiedad la cumplen otros sistemas lógicos, y entre los resultados obtenidos se encuentran los siguientes [13, 14, 19, 32], entre otros. Antes de enunciar dichos resultados se presentarán dos maneras de formular la propiedad de interpolación Craig que exiten (entre otras) en la bibliografı́a especializada: La propiedad de interpolación Craig (P IC → ), también llamada propiedad de interpolación local o propiedad de interpolación fuerte, y |=-propiedad de interpolación Craig (P IC |= ), también llamada propiedad de interpolación global o propiedad de interpolación débil, ambas propiedades no son comparables, es decir, ninguna implica a la otra (P IC → 6=⇒ P IC |= y P IC |= 6=⇒ P IC → ), una prueba de ello puede encontrarse en [19, p.31]. Aunque bajo algunas condiciones (teorema de deducción local) se cumple que P IC → =⇒ P IC |= (ver [19, p. 30]): P IC → : Sea ℓ una lógica la cual tiene la implicación entre sus conectivas lógicas. Se dice que ℓ tiene la propiedad de interpolación Craig, o que P IC → ocurre para ella, si para cualquier par de fórmulas χ y ζ del lenguaje de ℓ tal que |=ℓ χ → ζ, existe una fórmula interpolante en ℓ. Es decir, existe una fórmula λ del lenguaje de ℓ, con un lenguaje común a χ y ζ tal que: |=ℓ χ → λ y |=ℓ λ → ζ. Observación 4.1. En el caso de que la lógica ℓ no contenga fórmulas constantes las cuales denoten verdad y falsedad, la existencia de una interpolante para |=ℓ χ → ζ es requerida solo en el caso de 6|= ¬χ y 6|= ζ. Un ejemplo de una lógica con estas caracterı́sticas es la lógica de primer orden sin identidad (ℓℵ0 ℵ0 ⋆ ), esta lógica no tiene P IC → pues, por ejemplo, no existe interpolante Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 37 para |=ℓℵ0 ℵ0 ⋆ Q(x) → (T (x) ↔ T (x)). Sin embargo, el teorema de interpolación ocurre para tal lógica si se agrega a la definición P IC → la observación anterior. P IC |= : Sea ℓ una lógica. Se dice que ℓ tiene la |=-propiedad de interpolación Craig, o que P IC |= ocurre para ella, si para cualquier par de fórmulas χ y ζ del lenguaje de ℓ tal que χ |=ℓ ζ, existe una fórmula interpolante en ℓ. Es decir, existe una fórmula λ del lenguaje de ℓ, con un lenguaje común a χ y ζ tal que: χ |=ℓ λ y λ |=ℓ ζ. (Aplica para P IC |= la misma observación que para P IC → ). Notar que P IC → depende de la noción de validez y P IC |= depende de la relación de consecuencia lógica. En la bibliografı́a consultada se pueden encontrar varias tablas que resumen algunos resultados obtenidos, dichos resúmenes son con P IC → o con P IC |= , y ellos tienen algunos resultados similares, se elige presentar aquı́ una parte de la tabla resumen que se encuentra en [19, p. 40], la cual se hace considerando P IC → . La elección de esta tabla resumen se debe a que en la misma aparecen sistemas lógicos no clásicos, además de los clásicos, algo que no ocurre con otros resúmenes revisados: 4.1 Lógicas que cumplen CIP → 1. Lógica proposicional, ver [19, p. 40]. En este trabajo se probó que también cumple con P IC |= . 2. Lógica de primer orden, (ver Craig, [6, 7]). En este trabajo se probó que también cumple con P IC |= . 3. ℓℵ1 ℵ0 : lógica infinitaria que admite conjunciones y disyunciones infinitas numerables. (LopezEscobar, 1965), ver [19, p. 40]. También cumple con P IC |= (Lopez-Escobar, 1965), ver [32]. 4. Lógica modal proposicional T. (Gabbay, 1972), ver [19, p. 40]. 5. Lógica modal proposicional S4. (Gabbay, 1972), ver [19, p. 40]. 6. Lógica modal proposicional S5. (Schumm, 1976). ver [19, p. 40]. 7. Lógica modal en primer orden T (sin la fórmula de Barcan), (Gabbay, 1972), ver [19, p. 40]. 8. Lógica modal en primer orden S4 (sin la fórmula de Barcan), (Gabbay, 1972), ver [19, p. 40]. 9. Lógica intuicionista de predicados, (Schütte, 1962), ver [19, p. 40]. 4.2 Lógicas que no cumplen CIP → 1. Lógica de segundo orden (ℓII ), (Lopez-Escobar, Barwise), ver [13]. (Observación: La lógica de segundo orden cumple con P IC |= [29, p. 163-164]) 2. Lógicas con cuantificadores generalizados: ℓQα , para todo ordinal α ≥ ℵ0 . Qα xP x ⇐⇒| {x : P (x)} |≥ ℵα , (Lopez-Escobar, Barwise), ver [13]. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 38 Franklin Galindo 3. Lógicas infinitarias: ℓαℵ0 , para todo α > ℵ1 , o α = ∞. (ℓαℵ0 admite conjunciones y disyunciones de cardinal menor que α, y ℓ∞ℵ0 admite conjunciones y disyunciones de cuaquier cardinalidad), (Malitz, 1971), ver [19, p. 40]. También no cumple con P IC |= . (Malitz, 1971), ver [32]. 4. Lógica modal S5 en primer orden, (Fine, 1979), ver [19, p. 40]. 5. Las lógicas con varios valores de verdad de Lukasiewuiz, para n > 2, (Krzystek y Zachorowski, 1977), ver [19, p. 30]. 6. Lógica de la relavancia R, (Urquart, 1999), ver [19, p. 40]. 7. Lógica Entailment E, (Urquart, 1999), ver [19, p. 40]. 5 Una caracterización de la lógica infinitaria ℓℵ1 ℵ0 usando interpolación en el contexto de la teorı́a de modelos abstracta Por los resultados presentados en la sección anterior (4) se tiene que la lógica ℓℵ1 ℵ0 satisface el teorema de interpolación Craig (Lopez-Escobar, 1965). También se tiene que Scott y Engeler probaron (de manera independiente) que: (⋆) Toda estructura numerable para un lenguaje numerable puede ser caracterizada, salvo isomorfismo, con una sentencia de ℓℵ1 ℵ0 (ver [23, p. 17]). Después de eso Makowsky probó en 1973 un teorema que carateriza a ℓℵ1 ℵ0 con tal propiedad (⋆) e interpolación (ver [23, p. 23]), la caracteriza como la menor lógica (la lógica de menor poder expresivo) que satisface la propiedad de interpolación de Craig y cumple con (⋆). Para formular el teorema primero se deben presentar dos conceptos fundamentales de la teorı́a de modelos abstracta: (1) “lógica abastracta”, ℓ, y (2) cuándo una lógica abstracta ℓ′ es “al menos más fuerte” que otra lógica abstracta ℓ: ℓ ≤ ℓ′ . Se formulan tales conceptos a continuación siguiendo los textos [12, p. 193-194] y [8, p. 128]: Definición 5.1. Una lógica abstracta (o sistema lógico), ℓ, es un par ordendo (S , |=ℓ ) donde S es una función y |=ℓ una relación binaria que cumplen con las siguientes propiedades: 1. S asocia a cualquier lenguaje L un conjunto S(L), el conjunto de las sentencias de ℓ correspondientes al lenguaje L, las S-sentencias de ℓ. 2. Si L ⊆ L⋆ , entonces S(L) ⊆ S(L⋆ ). 3. Si U|=ℓ φ (es decir, U y φ están relacionadas según |=ℓ ), entonces para algún lenguaje L, U es una estructura para L y φ ∈ S(L). 4. (Propiedad de isomorfismo). Si U|=ℓ φ y U ∼ = X, entonces X|=ℓ φ. 5. (Propiedad de reducción). Si L ⊆ L⋆ , φ ∈ S(L), y U es una estructura para L⋆ , entonces: U|=ℓ φ ⇐⇒ U ↾ L|=ℓ φ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 39 Ejemplo 5.1. Algunos ejemplos de lógicas abstarctas son: ℓℵ0 ℵ0 , ℓII , ℓℵ1 ℵ0 , ℓQα , (ver [12, p. 194]). Si ℓ es una lógica abstracta y φ ∈ S(L), entonces: M odL ℓ (φ) = {U : U es una estructura para L y U |=ℓ φ}. Definición 5.2. Sea ℓ y ℓ′ dos lógicas abstractas. 1. ℓ′ es al menos más fuerte que ℓ, ℓ ≤ ℓ′ , si y solo si, para cualquier lenguaje L y para cuaquier φ ∈ S(L) existe ψ ∈ S ′ (L) tal que: L M odL ℓ (φ) = M odℓ′ (ψ). 2. ℓ y ℓ′ son igual de fuertes (ℓ y ℓ′ tienen el mismo poder expresivo), ℓ ∼ ℓ′ , si y solo si ℓ ≤ ℓ′ y ℓ′ ≤ ℓ. Ejemplo 5.2. Algunos ejemplos son: ℓℵ0 ℵ0 ≤ ℓII ; ℓℵ0 ℵ0 ≤ ℓℵ1 ℵ0 ; ℓℵ0 ℵ0 ≤ ℓQ1 ; ℓQ1 6≤ ℓℵ0 ℵ0 ; ℓII 6≤ ℓℵ0 ℵ0 ; ℓℵ1 ℵ0 6≤ ℓℵ0 ℵ0 . Demostraciones de algunos de estos resultados pueden encntrarse en [12]. Ahora, finalmente, se formula el teorema que carateriza a ℓℵ1 ℵ0 : Teorema 5.1. Sea ℓ una lógica abstracta que satisface el teorema de interpolación de Craig y, además, se cumple que toda estructura numerable para un lenguaje numerable puede ser caracterizada, salvo isomorfismo, con una sentencia de ℓ, entonces ℓℵ1 ℵ0 ≤ ℓ. 6 Problemas abiertos en teorı́a de modelos abstracta relacionados con la propiedad de interpolación A continuación se presenta uno de los primeros problemas abiertos (clásicos) que fueron planteados en relación con las lógicas abstractas, los cuantificadores generalizados, la propiedad de interpolación y ℓℵ0 ℵ0 . Dicho problema contribuyó con el desarrollo de la teorı́a de modelos abstracta y fue formulado (por ejemplo) por Feferman, Friedman y Shelah (ver [33, p. 2]), más información sobre el mismo puede encontrarse en [33], el autor de este artı́culo no tiene noticias de que halla sido resuelto: Problema abierto 1 : ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y que satisfaga las siguientes propiedades: compacidad numerable, y interpolación Craig? Una lógica abstracta ℓ tiene la propiedad de compacidad numerable si satisface el teorema de compacidad (Teorema 3.3.2) para todo conjunto numerable de sentencias Σ ⊆ Lenguaje de ℓ. Por ejemplo, la lógica ℓQ1 es numerablemente compacta [13, p. 18], [12, p. 142-143] y [8, p. 134]. Sin embargo, ella no satisface la propiedad de interpolación de Craig como aparece referido en el resumen de sistemas lógicos que no satisfacen la propiedad de interpolación expuesta anteriormente en la sección 4. Problema abierto 2: ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y sea “razonable”?. (ver [13, p. 22]) Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 40 Franklin Galindo Donde se ha sugerido que para que una lógica ℓ sea “razonable” ella debe satisfacer compacidad numerable y ∆-interpolación, o al menos la propiedad de Beth. La definición (y referencias) de estas propiedades puede encontrarse en [13], entre otros. Pero intuitivamente se puede decir que ∆-interpolación es una propiedad más débil que la propiedad de interpolación (interpolación implica ∆-interpolación) y que la propiedad de Beth significa que “definibilidad explı́cita” es equivalente a “definibilidad implı́cita” (ver [8]). Por ejemplo, la lógica ℓQ1 es numerablemente compacta, pero ella no satisface ∆-interpolación (ver [13, p. 21]). Otros interesantes problemas abiertos sobre la propiedad de interpolación en el contexto de la teorı́a de modelos abstracta pueden encontrarse en [13, 33], entre otros. 7 Conclusiones Se cumplió con el objetivo de presentar dos demostraciones del teorema de interpolación: Una para ℓprop y otra para ℓℵ0 ℵ0 . Ambas en el contexto de la teorı́a de modelos. Vale la pena resaltar que la demostración que se realizó para ℓprop es constructiva y usa el principio de inducción matemática. Tal demostración proporciona un procedimiento efectivo para construir una proposición λ interpolación de χ y ζ, para cualquier par de proposiciones χ y ζ que cumplan con las hipótesis del teorema. Dicho procedimiento usa las letras proposicionales que están en χ y no están en ζ hasta eliminarlas todas sustituyéndolas por una tautologı́a (s ∨ ¬s) o por una contradicción (s ∧ ¬s) de una manera especı́fica (utilizando disyunciones) para lograr construir la proposición interpolación. La demostración realizada para ℓℵ0 ℵ0 no es constructiva, es decir, se demuestra la existencia de la sentencia λ interpolación de χ y ζ por reducción al absurdo sin ofrecer un procedimiento efectivo para calcularla. Es importante destacar que la técnica usada, para dicha prueba (Henkin, 1963), es una ampliación del método de construcción de modelos a partir de constantes de Henkin (1949), mediante la noción de “teorı́as inseparables”. El nuevo método de construcción de modelos resultante, permite construir un modelo para la unión de dos teorı́as K0 ∪ H0 en un lenguaje L1 y L2 , respectivamente, las cuales son consistentes e inseparables, expandiéndolas simultáneamente (por inducción y en zigzag) a dos teorı́as Kω y Hω maximal consistentes e inseparables en un lenguaje extendido L1 ∪ C y L2 ∪ C, respectivamente, donde C es un conjunto numerable de nuevos sı́mbolos constantes que funciona como testigos para ambas. También se cumple (por la maximal consistencia e inseparabilidad) que la teorı́a Kω ∩ Hω es maximal consistente. El modelo buscado D para K0 ∪ H0 se construye (Henkin, 1963) aplicando el hecho de que Kω ∩ Hω es maximal consistente a dos modelos previos: Un modelo A para Kω y un modelo B para Hω que se construyen mediente el método de Henkin de 1949. Adicionalmente se presentaron ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación a otros sistemas lógicos distintos a ℓprop y ℓℵ0 ℵ0 como por ejemplo: lógicas infinitarias, lógicas con cuantificadores generalizados, lógica de segundo orden, lógicas no clásicas, lógicas abstractas, etc. Y también se ofrecieron referencias de problemas abiertos en el contexto de la teorı́a de modelos abstracta relacionados con la propiedad de interpolación, como por ejemplo: ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y que sea “razonable”?, donde se ha sugerido que para que una lógica sea “razonable” ella debe satisfacer compacidad numerable y ∆-interpolación, o al menos la propiedad de Beth. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 41 Referencias [1] E. Amir. Interpolation theorems for Nonmonotonic Reasoning Systems. Appear in 8th European Conference on Logic in Artificial Intelligence (JELIA 2002). [2] A. Anderson y R. Belnap. Entailment. The Logic of relevance and necesity. Princeton University Press. 1975. [3] J. Bell. Infinitary Logic. Enciclopedia de Filosofı́a de la universidad de Stanford. 2016. https: //plato.stanford.edu/entries/logic-infinitary/ [4] E. Beth. On Padoa’s method in the theory of definition. Nederl. Akad. Wetensch. Proc. Ser. A. 56 = Indagationes Math., 15: 330-339. (1953). [5] J. van Benthem. Interpolation, Annotated Proofs, and Inference Across Models. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http: //math.stanford.edu/~feferman. [6] W. Craig. Linear reasoning. A new form the Herbrand-Gentzen theorem. The Journal of Symbolic Logic 22 (1957), n◦ 3, 250-268. [7] W. Craig. Three uses of the Herbrand-Gentzen theorem in relating model theory and proof theory. The Journal of Symbolic Logic 22 (1957), n◦ 3, 269-285. [8] C. Chang y H. Keisler. Model Theory. Dover Publications, Inc. New York. 2012. [9] C. Di Prisco. Introdución a la lógica Matemática. EMALCA AMAZONIA. 2009. [10] C. Di Prisco. Inmersiones elementales y grandes cardinales. Notas no publicadas. 1982. [11] H. Enderton. Una Introducción Matemática a la lógica. Universidad Nacional Autónoma de México. México. 2004. [12] H. Ebbinghaus y J. Flum y W. Thomas. Mathematical Logic. Springer-Verlag. New York. 1989. [13] S. Feferman. Harmonious Logic: Craig[U+0092]s Interpolation Theorem and its Descendants. Interpolations Conference in Honor o William Craig. Universidad de Stanford. 2007. http://math.stanford.edu/~feferman. [14] D. Gabbay y L. Maksimova. Interpolation and Definability: modal and Intuitionistic Logics. Clarendon Press. Oxford. 2005. [15] F. Galindo. Una presentación de la demostración directa del teorema de compacidad de la lógica de primer orden que usa el método de ultraproductos. UNA INVESTIGACI@CIÓN, Vol. VIII, N ◦ 15 (2016). [16] K. Gödel. Obras completas. Alianza. Madrid. 1981. [17] L . Henkin. The completeness of the firs-orden functional calculus. The Journal of Symbolic Logic 14 (1949), 159-166. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 42 Franklin Galindo [18] L. Henkin. An extension of the Craig-Lyndon interpolation theorem. The Journal of Symbolic Logic 28 (1963), 201-216. [19] E. Hoogland. Definability and Interpolation. Model-Theoretic investigations. Institute for Logic, Language and Computation. Universiteit van Amsterdam. Promotor: Prof. dr. D. H. J. de Jongh. 2001. [20] G. Hughes y M. Cresswell. Introducción a la lógica modal. Tecnos. Madrid. 1973. [21] G. Hunter. Metalógica. Introducción a la metateorı́a de la lógica clásica de primer orden. Paraninfo. Madrid. 1981. [22] T. Jech. Set Theory. Springer. New York. 2000. [23] J. Makowsky. Model Theory in computer science: My Own Recurrent themes (and some lessons I learned). Faculty of Computer Science Technion-Israel Institute of Technology, Haifa, Israel. 2016. [24] M. Manzano. Teorı́a de modelos. Alianza. Madrid. 1989. [25] E. Mendelson. Introduction to Mathematical Logic. Chapman and Hall/CRL. U.S.A. 2009. [26] A. Nerode y R. Shore. Logic for Applications. Springer-Verlag. New York. 1993. [27] A. Robinson. A result on consistency and its application to the theory of definition. Nederl. Akad. Wetensch. Proc. Ser. A. 59 = Indag. Math., 18, 47-58. 1956. [28] H. Royden. Real Analysis. Pearson.2010. [29] S. Shapiro. Foundations without Foundationalism. A Caso for Second-order Logic. Clarendon Press. Oxford. 2002. [30] M. Sundström. A Pedagogical History of Compactness. The American Mathematical Monthly, Vol. 122, N 7, (August-September 2015), 619-635. [31] C. Tinelli. The Impact of Craig’s Interpolation Theorem in Computer Science. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http: //math.stanford.edu/~feferman. [32] J. Väänänen. The Interpolation Theorem in Abstract Model Theory. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http://math.stanford. edu/~feferman. [33] J. Väänänen. Barwise: Abstract Model Theory and Generalized Quantifiers. The Bulletin Symbolic Logic. Volumen 10, Número 1, Marzo 2004. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42

RELATED PAPERS

RELATED TOPICS

Log In

Dos Teoremas de interpolación

Dos Teoremas de interpolación

Dos Teoremas de interpolación

Dos Teoremas de interpolación

Dos Teoremas de interpolación

Related Papers

RELATED PAPERS

RELATED TOPICS