Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación Two interpolation theorems Franklin Galindo (franklin.galindo@ucv.ve) Departamento de lógica y Filosofı́a de la Ciencia. Escuela de Filosofı́a. Universidad Central de Venezuela. Resumen En este artı́culo se presentan dos demostraciones del teorema de interpolación: Una para la lógica proposicional y otra para la lógica de primer orden (ℓℵ0 ℵ0 ). Ambas se realizan en el contexto de la teorı́a de modelos. El teorema de interpolación afirma que si ϕ y ψ son fórmulas, donde ϕ no es una contradicción, ψ no es válida y ψ es una consecuencia lógica de ϕ (ϕ |= ψ), entonces existe una fórmula δ que está escrita en un lenguaje común al de ϕ y ψ, tal que ϕ |= δ y δ |= ψ. El teorema de interpolación fue demostrado por primera vez para ℓℵ0 ℵ0 por William Craig en 1957, y desde entonces se ha investigado la posibilidad de generalizarlo o aplicarlo. Dicho teorema tiene generalizaciones o aplicaciones en teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Se presentan ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación relacionados con lógicas infinitarias, cuantificadores generalizados, segundo orden, no clásicas, abstractas, etc. También se ofrecen referencias de problemas abiertos sobre interpolación en el contexto de la teorı́a de modelos abstracta. Palabras y frases clave: lógica proposicional, lógica de primer orden, propiedad de interpolación de Craig, construcción de modelos a partir de constantes y teorı́as inseparables, teorı́a de modelos abstracta. Abstract In this paper we present two proofs of the interpolation theorem: One for propositional logic and one for first order logic (ℓℵ0 ℵ0 ). Both are performed in the context of model theory. The interpolation theorem states that if ϕ and ψ are formulas, where ϕ is not a contradiction, ψ is not valid, and ψ is a logical consequence of ϕ (ϕ |= ψ), then there exists a formula δ which is written in a common language to that of ϕ and ψ, such that ϕ |= δ and δ |= ψ. The interpolation theorem was first proved for ℓℵ0 ℵ0 by William Craig in 1957, and since then the possibility of generalizing or applying it has been investigated. This theorem has generalizations or applications in proof theory, abstract model theory, computer science, modal logic, intuitionistic logic, etc. Examples of applications or generalizations of the interpolation property are presented related to infinitary logics, generalized quantifiers, second order, non-classical, abstract, etc, are presented. References on open problems regarding the interpolation property in the context of abstract model theory are also offered. Key words and phrases: Propositional logic, first order logic, Craig’s interpolation property, models constructed from constants and inseparable theories, abstract model theory. Recibido 04/01/2017. Revisado 27/03/2017. Aceptado 05/05/2017. MSC (2010): Primary 03C40; Secondary 03C40. Autor de correspondencia: Franklin Galindo 16 1 Franklin Galindo Introducción En este artı́culo se presentan dos demostraciones del teorema de interpolación: Una para la lógica proposicional (ℓprop ) y otra para la lógica de primer orden (ℓℵ0 ℵ0 ). Ambas se realizan en el contexto de la teorı́a de modelos. El teorema de interpolación afirma que si ϕ y ψ son fórmulas, donde ϕ no es una contradicción, ψ no es válida y ψ es una consecuencia lógica de ϕ (ϕ |= ψ), entonces existe una fórmula δ que está escrita en un lenguaje común al de ϕ y ψ, tal que ϕ |= δ y δ |= ψ. El teorema de interpolación fue demostrado por primera vez para ℓℵ0 ℵ0 por William Craig en 1957, y desde entonces se ha investigado la posibilidad de generalizarlo o aplicarlo. Dicho teorema tiene generalizaciones o aplicaciones en teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Se presentarán ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación relacionados con lógicas infinitarias, lógicas con cuantificadores generalizados, lógica segundo orden, lógicas no clásicas, lógicas abstractas, etc. También se ofrecen referencias de problemas abiertos sobre interpolación en el contexto de la teorı́a de modelos abstracta. Vale la pena resaltar que, según [32], existen varias pruebas del teorema interpolación de Craig: Con métodos de teorı́a de la demostración (por ejemplo la original de Craig de 1957 , ver [6, 7]), con métodos de la teorı́a de modelos (por ejemplo la de Henkin, 1963, ver [18]) y con métodos de teorı́a de juegos y teorı́a de conjuntos (por ejemplo Svenonious, 1965, ver [32]). En este artı́culo se realizará una demostración utilizando ideas de una prueba que se encuentra en [8], y también usando ideas propias del autor de este trabajo (incluyendo ejemplos propios). Tal prueba se hace utilizando el método de Henkin (1949, ver [17]) de construcción de modelos a partir de constantes (con el cual se puede construir un modelo para una teorı́a T que sea consistente) extendido por el mismo Henkin (ver [18]) con la noción de “par de teorı́as inseparables”, lo cual proporciona un nuevo método de construcción de modelos para la unión de dos teorı́as T1 ∪ T2 , donde T1 y T2 son inseparables y consistentes. La demostración del teorema interpolación de Craig que se realiza es por reducción al absurdo. Vale la pena resaltar que la unión de dos teorı́as consistentes no necesariamente tiene un modelo, por ejemplo, como consecuencia del teorema de incompletitud de Gödel (1931) (ver [16]) existe una proposición indecidible ϑ de la aritmética de Peano en primer orden (AP (ℓℵ0 ℵ0 )), es decir, AP (ℓℵ0 ℵ0 ) 6⊢ ϑ y AP (ℓℵ0 ℵ0 ) 6⊢ ¬ϑ. Ası́, las teorı́as extendidas AP (ℓℵ0 ℵ0 )∪{¬ϑ} y AP (ℓℵ0 ℵ0 )∪{ϑ} son consistentes. Sin ambargo, la unión de ambas AP (ℓℵ0 ℵ0 ) ∪ {ϑ, ¬ϑ} es inconsistente y, por lo tanto, no tiene modelo. También existen distintas pruebas del teorema de interpolación para ℓprop . En este trabajo se realiza una demostración que es constructiva y usa el principio de inducción matemática, utilizando ideas de una prueba que se encuentra en [21], y también se usarán ideas propias del autor de este trabajo (incluyendo ejemplos propios). Es importante destacar que el autor de este artı́culo no conoce la fecha exacta de la demostración del teorema de interpolación para la lógica proposicional, en consecuencia no sabe si se demostró antes o después de la prueba de interpolación de Craig para ℓℵ0 ℵ0 . Según Feferman el teorema de interpolación de Craig, a pesar de la aparente simpleza (ver [13]), es una propiedad lógica central que se ha utilizado para revelar una profunda armonı́a entre la sintaxis y la semántica de ℓℵ0 ℵ0 . Dos importantes consecuencias del teorema de interpolación de Craig son el teorema de definibilidad de Beth (1953, ver [4]) y el teorema de consistencia de Robinson (1956, ver [27]). También el teorema de consistencia Robinson implica al teorema de interpolación de Craig, es decir, ambos resultados son equivalentes. Y una mejora del teorema de interpolación de Craig es el teorema de interpolación de Lyndon (1959, ver [8]). El teorema de definibilidad de Beth proDivulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 17 porciona (entre otros) un importante método para investigaciones metamatemáticas de teorı́as matemáticas axiomatizadas, que permite realizar pruebas de independencia de términos primitivos. Y el teorema de consistencia Robinson proporciona un valioso método para investigar la consistencia de teorı́as matemáticas axiomatizadas. Una formulación del teorema de definibilidad de Beth y del teorema de consistencia de Robinson, ası́ como una demostración de los mismos, a partir del teorema de interpolación de Craig puede encontrarse en el texto [8, p. 90-91]. Y una formulación y demostración del teorema de interpolación de Lyndon puede encontrarse en el texto [8, p. 92-93]. Además de las demostraciones de los teoremas de interpolación para ℓprop y ℓℵ0 ℵ0 , que se realizan en este artı́culo, se presentan ejemplos de generalizaciones o aplicaciones de la propiedad de interpolación de Craig que han sido hechas por diversos investigadores en el transcurso del tiempo. Se presenta una lista de resultados obtenidos en diversos sistemas lógicos (lógicas infinitarias, lógicas con cuantificadores generalizados, lógica de segundo orden, lógicas no clásicas, lógicas abstractas, etc), en la cual se dirá explı́citamente si estas cumplen o no la propiedad de interpolación. Dichos resultados han sido recopilados por el autor de este artı́culo de distintas fuentes, eligiendo presentar (principalmente) una parte importante de la tabla de resultados que se encuentra en el texto [19] porque se considera que es una de las más completas que aparece en la bibliografı́a consultada. También se expone una caracterización de la lógica infinitaria ℓℵ1 ℵ0 , lógica que admite conjunciones y disyunciones infinitas numerables. Dicha caracterización se realiza en el contexto de la teorı́a de modelos abstracta y usando la propiedad de interpolación. Solo se formula el teorema, y para ello se define el concepto de lógica abstracta, tal resultado se encuentra en [23, p. 17]. Adicionalmente, en la sección 6 de este artı́culo, se ofrecen algunas referencias de problemas abiertos sobre la propiedad de interpolación (siguiendo los artı́culos [13, 33]), tales problemas abiertos pertenecen a la teorı́a de modelos abstracta. Vale la pena resaltar que las pruebas que se realizan en este trabajo pueden hacerse solo con ZF (La teorı́a axiomática de conjuntos de Zermelo-Fraenkel), no se necesita el axioma de elección. Sin embargo, en las secciones de este artı́culo donde se hace referencia al concepto de lógica abastracta (teorı́a de modelos abstracta) si se requiere del axioma de elección para poder trabajar sin ninguna restricción con las lógicas infinitarias o con las lógicas con cuantificadores geralizados, entre otros sistemas lógicos. El estudio de tales lógicas tiene gran importantancia, por ejemplo, en teorı́a de modelos finitos y en el estudio de problemas de complejidad computacional (ver [33, p. 51]). También las lógicas infinitarias son fundamentales en la teorı́a de modelos y en la teorı́a de conjuntos para investigar problemas de grandes cardinales [8, 10], entre otros. El orden expositivo del contenido del artı́culo es siguiente: En la sección 2 se define ℓprop describiendo su sintaxis y su semántica, y luego se formula y demuestra el teorema de interpolación para ℓprop . En la sección 3 se define ℓℵ0 ℵ0 describiendo su sintaxis y su semántica, luego se formula y demuestra el teorema de interpolación para ℓℵ0 ℵ0 . En la sección 4 se presenta una lista de sistemas lógicos, mencionada anteriormente. En la sección 5 se presenta un resultado, en el contexto de la teorı́a de modelos abstracta, que caracteriza a la lógica infinitaria ℓℵ1 ℵ0 , usando la propiedad de interpolación (entre otras). En la sección 6 se presentan algunas referencias de problemas abiertos antes mencionados. Y en la sección 7 se ofrecen algunas conclusiones del artı́culo. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 18 2 Franklin Galindo Teorema de interpolación para la lógica proposicional A continuación se presenta una demostración del teorema de interpolación para ℓprop . Tal demostración es constructiva y se realiza utilizando el principio de inducción matemática, para hacer la misma se definen primero los conceptos básicos sintácticos y semánticos de la lógica proposicional tal como son presentados en la mayorı́a de los textos contemporáneos de lógica matemática, por ejemplo [8, 9, 11, 25, 26]. Tales conceptos son los de proposición, valuación (o interpretación), tautologı́a, contradicción, satisfacible, consecuencia lógica (Σ |= σ), etc. En esta sección se usarán las definiciones expuestas en los textos [9, 11, 26]. La demostración que se realiza usa ideas de la prueba del teorema que se encuentra en el texto [21, p. 79-80], entre otros. También utilizan ideas propias y ejemplos propios del autor de este trabajo. Definición 2.1 (Lenguaje de ℓprop ). Sea p0 , p1 , p2 , . . . un conjunto numerable de letras proposicionales, se llamará a este conjunto LP . Para construir el lenguaje también se requiere de otros sı́mbolos: las conectivas y los paréntesis. Las conectivas son: ¬ (negación), ∧ (conjunción), ∨ (disyunción), → (condicional material) y ↔ (bicondicional). Los paréntesis son: “)” paréntesis derecho y “(” paréntesis izquierdo. Con estas letras, más las conectivas y los paréntesis, se define lo que es una proposición usando inducción: Definición 2.2. (a) Toda letra proposional es una proposición. (b) Si ϕ y ψ son proposiciones, entonces (¬ϕ), (ϕ ∨ ψ), (ϕ ∧ ψ), (ϕ → ψ) y (ϕ ↔ ψ) son proposiciones. (c) Solo son proposiciones las sucesiones finitas de sı́mbolos que se puedan construir aplicando una cantidad finita de veces las cláusulas (a) y (b). Se denota el conjunto de todas las proposiciones por P ROP , y cuando no exista posibilidad de ambiguedad se eliminarán los paréntesis externos (por simplicidad). Por ejemplo, en vez de (ϕ ∨ ψ) es escribirá ϕ ∨ ψ. Ahora se definirá la semántica de ℓprop : Definición 2.3. • Una asignación de valores de verdad es una función A : LP −→ {V, F }. • Una valuación (o interpretación ) es una función I : P ROP −→ {V, F } tal que: 1. I(¬ϕ) = V ⇐⇒ I(ϕ) = F . 2. I(ϕ → ψ) = V ⇐⇒ I(ϕ) = F o I(ψ) = V . 3. I(ϕ ∧ ψ) = V ⇐⇒ I(ϕ) = V y I(ψ) = V . 4. I(ϕ ∨ ψ) = V ⇐⇒ I(ϕ) = V o I(ψ) = V . 5. I(ϕ ↔ ψ) = V ⇐⇒ I(ϕ) = I(ψ). Las asignaciones y las valuaciones guardan una estrecha relación que se describe a continuación en el siguiente lema: Lema 2.1. Sea A una asignación. Se cumple que para todo par de valuaciones Z y W, si Z ↾ A = W ↾ A, entonces Z = W. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 19 Ahora se procederá a definir los conceptos de “tautologı́a”, “contradicción”, “satisfacible” y “consecuencia lógica”: Definición 2.4. Sea ϕ ∈ P ROP una proposición, entonces se cumple que 1. ϕ es una tautologı́a si I(ϕ) = V , para toda valuación I. Cuando ϕ es una tautologı́a también se dice que ϕ es válida. 2. ϕ es una contradicción si I(ϕ) = F , para toda valuación I. 3. ϕ es satisfactible si existe una valuación I tal que I(ϕ) = V , es decir, si ϕ no es una cotradicción. En tal caso, se dice que I es un modelo de ϕ. 4. Sea Γ ⊆ P ROP un conjunto de proposiciones. Se dice que ϕ es una consecuencia lógica de Γ, denotado por Γ |= ϕ, si toda valuación I que sea un modelo de Γ (es decir: I(σ) = V , para toda σ ∈ Γ) también es un modelo de ϕ, es decir, si no existe una valuación I que sea modelo de Γ y no sea modelo de ϕ. Cuando se trata de consecuencia lógica de conjuntos unitarios, por ejemplo {ψ} |= ϕ, se escribe ψ |= ϕ. Y cuando se trata de consecuencias lógicas del conjunto de sentencias vacı́o, ∅ |= ϕ, se escribe ası́: |= ϕ. Observación 2.1. Una consecuencia inmediata de la definición anterior es que: ϕ es una tautologı́a si y solo si |= ϕ. Teorema 2.1 (Teorema de interpolación para la lógica proposicional). Sean χ y ζ dos proposiciones tal que χ |= ζ, entonces se cumple una de las siguientes afirmaciones: (i) χ es insatisfacible (ii) ζ es válida (iii) Existe una proposición λ tal que χ |= λ y λ |= ζ, y cualquier letra proposicional que aparece en λ también aparece en χ y en ζ (en ambas). La proposición λ es llamada una interpolación de χ y ζ. Ejemplo 2.1 (Ejemplos del teorema de interpolación para ℓprop ). (1) χ = [¬r → (s ∧ t)] y ζ = [¬r → ¬¬s]. Es claro que χ |= ζ. Una interpolación de χ y ζ es: λ = ¬r → s. (2) χ = [(p → q) ∧ (p → (q → r))] y ζ = (p → r). Es claro que χ |= ζ. Una interpolación de χ y ζ es: λ = [p → (r ∨ ¬r) ∧ (p → ((r ∨ ¬r) → r))] ∨ [(p → (r ∧ ¬r)) ∧ (p → ((r ∧ ¬r) → r))]. La proposición λ presente en el ı́tem (2), del Ejemplo 2.1, ha sido construı́da con un procedimiento efectivo que se describirá en la demostración del Teorema 2.1. Tal procedimiento usa las letras proposicionales que están en χ y no están en ζ hasta eliminarlas todas sustituyéndolas por una tautologı́a (r ∨ ¬r) o por una contradicción (r ∧ ¬r) de una manera especı́fica (utilizando disyunciones) para lograr construir la proposición interpolación. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 20 Franklin Galindo Demostración del teorema. Para probar el teorema se supone que (i) y (ii) no ocurren y se prueba que se cumple (iii). Como (i) y (ii) no ocurren entonces χ y ¬ζ son satisfacibles, es decir, existe una valuación V : P ROP −→ {V, F } tal que V(χ) = V y existe una valuación W : P ROP −→ {V, F } tal que W(ζ) = F , donde P ROP es el conjunto de todas las proposiciones. Entonces χ y ζ tienen al menos una letra proposicional en común, pues si esto no ocurre se puede definir una valuación H : P ROP −→ {V, F } tal que H coincida con V en los valores a las letras proposicionales de χ y H coincide con W en los valores a las letras proposicionales de ζ, en consecuencia H(χ) = V y H(ζ) = F (para definir H se usa la Definición 2.3 y el principio de inducción matemática), lo cual contradice la hipótesis χ |= ζ. Por lo tanto, χ y ζ tiene al menos una letra proposicional en común. Sea φ ∈ P ROP , y sea LP (φ) el conjunto de las letras proposicionales que aparecen en φ. Considérese el conjunto de las letras proposicionales que aparecen en φ y no aparecen en ζ, es decir, LP (φ) \ LP (ζ). El cardinal | LP (φ) \ LP (ζ) | es un número natural. Se probará (iii) por L inducción en N, usando | LP (φ) \ LP (ζ) |. Se demostrará la siguiente Proposición que implica (iii) y donde ζ está fija: L Proposición : ∀ n ∈ N y ∀ φ ∈ P ROP . Si φ |= ζ, φ es satisfacible y | LP (φ) \ LP (ζ) |= n, entonces existe una proposición interpolación de φ y ζ. L Demostración de la Proposición . Caso base: (n = 0). Sea σ una proposición tal que σ |= ζ, σ es satisfacible y | LP (σ) \ LP (ζ) |= 0, entonces se toma λ = σ. Claramente se cumple que σ |= σ y, por hipótesis, ocurre σ |= ζ. También, todas las letras proposicionales de σ están en σ y en ζ ya que | LP (σ) \ LP (ζ) |= 0. Caso L inductivo: Sea k ∈ N, k > 0. Supóngase que para cualquier r < k se cumple la Proposición , es decir, existe una proposición interpolación de φ y ζ, donde φ |= ζ, φ es Lsatisfacible y | LP (φ) \ LP (ζ) |= r, ∀r < k y ∀φ ∈ P ROP . Se demostrará que la Proposición se cumple para k, es decir, se mostrará que existe una proposición interpolación de φ y ζ, donde φ |= ζ, φ es satisfacible y | LP (φ) \ LP (ζ) |= k, ∀φ ∈ P ROP . Sea σ una proposición tal que σ |= ζ, σ es satisfacible y | LP (σ) \ LP (ζ) |= k. Como k > 0 sea u ∈ LP (σ) \ LP (ζ). Sea s una letra proposicional que aparece en σ y ζ. Se construyen dos proposiciones a partir de σ: la proposición σ1 , que resulta de sustituir u por la tautologı́a (s ∨ ¬s) en σ; y la proposición σ2 , que resulta de sustituir u por la contradicción (s ∧ ¬s) en σ. Se probará que σ1 |= ζ y σ2 |= ζ. Para probar que σ1 |= ζ, sea V una valuación tal que V(σ1 ) = V . Se cumple que V(u) = V o V(u) = F . Caso 1: (V(u) = V ). Por la construcción de σ1 a partir de σ, como en σ1 no aparece u y en los lugares donde estaba u aparece (s ∨ ¬s) y V((s ∨ ¬s)) = V , se concluye que V(σ) = V . Luego, por hipótesis V(ζ) = V . Caso 2: (V(u) = F ). Como u no aparece en σ1 se define a partir de V otra valuación V ′ que coincide con V en los valores a todas las letras proposicionales menos u, es decir, V ′ (u) = V . En consecuencia, V ′ (σ) = V . Luego, por hipótesis V ′ (ζ) = V . De modo que V(ζ) = V , pues como u no aparece en ζ se cumple que V ′ (ζ) = V(ζ). La prueba de σ2 |= ζ se realiza de manera análoga pero considerando la sustitución de (s ∧ ¬s) por u en σ. Por lo tanto, como σ1 |= ζ y σ2 |= ζ, se concluye que σ1 ∨ σ2 |= ζ. Entonces, como por construcción la proposición σ1 ∨ σ2 tiene k − 1 letras proposicionales que no aparecen en ζ, y es satisfacible porque σ lo es, se aplica la hipótesis inductiva y se tiene que existe una proposición λ interpolación de σ1 ∨ σ2 y ζ. Es decir, σ1 ∨ σ2 |= λ y λ |= ζ, y cualquier letra proposicional que aparece en λ también aparece en σ1 ∨ σ2 y en ζ. Como se cumple que σ |= σ1 ∨ σ2 , entonces σ |= λ. Por lo tanto λ es una Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 21 proposición interpolación de σ y ζ. Lo que se querı́a demostrar. Ha terminado la demostración L de la Proposición y, por lo tanto, ha finalizado también la prueba del Teorema 2.1. 3 Teorema de interpolación para la lógica de primer orden A continuación se presenta una demostración del teorema de interpolación para ℓℵ0 ℵ0 . Tal prueba se hace utilizando el método de Henkin (ver [17]) de construcción de modelos a partir de constantes (con el cual se puede construir un modelo para una teorı́a T que sea consistente) extendido con la noción de “par de teorı́as inseparables”(extensión que hace el mismo Henkin en [18]), lo cual proporciona un nuevo método de construcción de modelos para la unión de dos teorı́as T1 ∪ T2 , donde T1 y T2 son inseparables y consistentes. Para hacer la formulación y demostración del teorema se requiere definir previamente los conceptos básicos de la sintaxis y la semántica de ℓℵ0 ℵ0 . Estas nociones se presentan siguiendo la metodologı́a de textos contemporáneos de la lógica matemática, por ejemplo [8, 9, 11, 12, 24, 25]. Los conceptos sintácticos y semánticos son los de “lenguaje”, “estructura”(o “interpretación”), “estructuras isomorfas”, “formalización de un lenguaje”, “término”, “fórmula”, “sentencia”, “satisfacción”, “verdad”, “contradicción”, “validez”, “consecuencia lógica”(Σ |= σ), “deducibilidad”(Σ ⊢ σ), etc. Especı́ficamente se describirán tales nociones tal como se hace en los textos [8, 9, 11], y en el artı́culo [15]. En la demostración que se realiza en esta sección del teorema de interpolación para ℓℵ0 ℵ0 se usan ideas que se encuentran en la prueba que hacen Chang y Keisler en el texto [8], y también se utilizan ideas propias (y ejemplos propios) del autor de este trabajo. El orden expositivo de esta sección es el siguiente: En las siguientes tres subsecciones (3.1, 3.2 y 3.3) se describe la sintaxis y la semántica de ℓℵ0 ℵ0 y, además, se enuncian dos resultados previos que se usarán en la demostración: el teorema de completitud de Gödel y el teorema de compacidad. En la última subsección (3.4) se formula y demuestra el teorema de interpolación para ℓℵ0 ℵ0 . 3.1 Lenguajes de primer orden, estructuras e isomorfismo entre estructuras Las definiciones se harán siguiendo el orden y la notación (principalmente) de los textos [8, 9], pero se realizarán de manera generalizada para cualquier cardinal: Definición 3.1.1. Un lenguaje L es un conjunto de sı́mbolos cuyo cardinal puede ser finito, infinito numerable o infinito no numerabe (de cualquier cardinalidad mayor que ℵ0 ). Los sı́mbolos de L son agrupados en tres clases: • Sı́mbolos relacionales R0 , R1 , R2 , R3 , . . . , Rα , . . . (α ∈ γ). Donde γ es cualquier ordinal. (El conjunto de sı́mbolos relacionales puede ser vacı́o). • Sı́mbolos funcionales h0 , h1 , h2 , h3 , . . . , hβ , . . . (β ∈ δ). Donde δ es cualquier ordinal. (El conjunto de sı́mbolos funcionales puede ser vacı́o). • Sı́mbolos constantes d0 , d1 , d3 , . . . , dρ , . . . (ρ ∈ η). Donde η es cualquier ordinal. (El conjunto de sı́mbolos constantes puede ser vacı́o). Todo sı́mbolo relacional y todo sı́mbolo funcional, tiene asociado un número natural n ≥ 1 (su número de argumentos), de este modo se tienen entonces sı́mbolos relacionales o funcionales unarios, binarios, 3-arios, 4-arios, 5-arios, 6-arios, . . ., n-arios, etc. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 22 Franklin Galindo Definición 3.1.2. Una estructura U para un lenguaje L (o una interpretación U para un lenguaje L) está cosntituida por: • Un conjunto no vacı́o U (el universo de U) • Para cada sı́mbolo relacional n-ario Rα de L, una relación U Rα ⊆ U n. • Para cada sı́mbolo funcional n-ario hβ de L, una función n hU β : U −→ U. • Para cada sı́mbolo constante dρ de L, un elemento dU ρ ∈ U. La estructura U definida se puede expresar ası́: U U = hU, < Rα >α∈γ , < fβC >β∈δ , < dU ρ >ρ∈η i. U X Definición 3.1.3. Sean U = hU, < Rα >α∈γ , < gβC >β∈δ , < dU ρ >ρ∈η i, y X = hX, < Rα >α∈γ X ∼ , < hX β >β∈δ , < dρ >ρ∈η i dos estructuras para un lenguaje L. U y X son isomorfas (U = X) si y solo si existe una función biyectiva i : U −→ X que satisface: 1. Para cada sı́mbolo relacional Rα de L, si n es la aridad de Rα , entonces para cada (u1 , . . . , un ) ∈ U n: U X (i(u1 ), . . . , i(un )). Rα (u1 , . . . , un ) ⇔ Rα 2. Para cada sı́mbolo funcional hβ de L, si n es la aridad de hβ , entonces para cada (u1 , . . . , un ) ∈ U n: X i(hU β (u1 , . . . , un )) = hβ (i(u1 ), . . . , i(un )). 3. Para cada sı́mbolo constante dρ de L se tiene que: X i(dU ρ ) = dρ . Ejemplo 3.1.1. [Ejemplos de estructuras isomorfas] b donde < b es un sı́mbolo (1) Sean hN, <i y hN \ {0}, <i dos estructuras para el lenguaje {<}, relacional binario. La función g : N \ {0} −→ N tal que g(n) = n − 1 es un isomorfismo, es decir, hN, <i ∼ = hN \ {0}, <i (ver [24, p. 57]). (2) Teorema (Cantor): Si hB, <B i y hA, <A i son dos ordenes totales, densos, no acotados y numerables, entonces hB, <B i ∼ = hA, <A i (ver [22, p. 38-39]). Notar que un lenguaje b adecuado para estas estructuras es el mencionado en (1) del presente ejemplo {<}. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 23 (3) Teorema (Cantor): Si hA, <A i es un orden total, denso, completo y, además, hA, <A i tiene un subconjunto numerable y denso E isomorfo a hQ, <i, es decir, hE, <A i ∼ = hQ, <i, entonces hA, <A i ∼ = hR, <i (ver [22, p.38-39]). (Un orden total hA, <A i es “denso”si ∀x ∈ A, ∀y ∈ A(x <A y → ∃z ∈ A(x <A z <A y)). Un conjunto Y ⊆ A es un “subconjunto denso”de A si para todo x <A y en A existe un z ∈ Y tal que x <A z <A y. Un conjunto ordenado es “no acotado”si no tiene mayor, ni menor elemento. Un orden total hA, <A i es “completo”si cualquier subconjunto Y ⊆ A distinto de vacı́o tiene un supremo, es decir, una menor cota superior). Notar que un lenguaje adecuado para estas estructuras es también el b mencionado en el Ejemplo 3.1.1 {<}. (4) Teorema (Dedeking): Cualquier dos estructuras de Peano son isomorfas (ver [12, p. 47-48]). Donde una estructura de Peano es una estructura hA, s, 0i para el lenguaje {b s, b 0}, donde b sb es un sı́mbolo funcional binario y 0 es sı́mbolo constante, que cumple con los siguientes tres axiomas P1: ∀x(b s(x) 6≡ x). P2: ∀x∀y(b s(x) ≡ sb(y) → x ≡ y). P3: ∀X[(X(b 0) ∧ ∀x(X(x) → X(b s(x))) → ∀yXy]. Los dos primeros axiomas P1 y P2 son expresables con el lenguaje de la lógica de primer orden que se define más adelante en esta sección, y el tercer axioma P3 (el principio de inducción matemática) no se puede expresar en el lenguaje de la lógica de primer orden si no en el lenguaje (por ejemplo) de la lógica de segundo orden, la razón es que en la lógica de primer orden no se puede cuantificar sobre variables de propiedades si no solo sobre variables de individuos. Un ejemplo de estructura de Peano es hN, S, 0i, donde S es la operación sucesor en N (S(n) = n + 1). Otros ejemplos de estructuras isomorfas pueden encontrarse en [8] y en [24, p. 56-57]. En la demostración del teorema de interpolación para ℓℵ0 ℵ0 que se realiza en la subsección 3.4 se prueba que dos estructuras para un lenguaje determinado son isomorfas. Además, se usará el concepto de isomorfismo para construir una estructura (a partir de otra) que permitirá concluir la prueba del teorema. 3.2 Formalización de un lenguaje de primer orden, satisfación, verdad, validez, contradicción y consecuencia lógica Sea L un lenguaje. Para formalizar a L se utiliza un conjunto de sı́mbolos lógicos, los cuales se listan a continuación: • Conectivas: ¬, ∨, ∧, →, ↔ (negación, disyunción, conjunción, condicional y bicondicional, respectivamente). • Cuantificadores: ∀, ∃ (universal y existencial, respectivamente). • Sı́mbolo de identidad: ≡ (un sı́mbolo relacional binario). • Variables: v0 , v1 , v2 , v3 , v4 , . . . , vk , . . . (k ∈ ℵ0 ). El conjunto de las variables se denotará por V AR. • Paréntesis: ) , ( (paréntesis derecho y paréntesis izquierdo, respectivamente). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 24 Franklin Galindo • La coma: , Ahora se presentará una lista de definiciones que tienen por objetivo indicar cómo usar los sı́mbolos lógicos y los sı́mbolos de L para construir términos y fórmulas del lenguaje L, términos y fórmulas que permitirán hablar de las estructuras para L. Se inicia definiendo Término del lenguaje L, usando inducción: Definición 3.2.1. (a) Toda variable y todo sı́mbolo constantes es un término. (b) Si f es un sı́mbolo funcional n-ario y t1 , . . . , tn son términos, entonces f (t1 , . . . , tn ) es un término. (c) Una sucesión de sı́mbolos es un término si y solo si se obtiene aplicando una cantidad finita de veces las cláusulas (a) y (b). El conjunto de los términos de L se denotará por TL . Ahora se define fórmula atómica de L, las fórmulas más simples del lenguaje L: Definición 3.2.2. (a) Si t1 y t2 son términos, entonces t1 ≡ t2 es una fórmula atómica. (b) Si R es un sı́mbolo relacional n-ario y t1 , . . . , tn son términos, entonces R(t1 , . . . , tn ) es una fórmula atómica. Con la definición de fórmula atómica se procede ahora a formular el concepto de fórmula (fórmula bien formada) de L, dicha definición se hace usando inducción: Definición 3.2.3. (a) Toda fórmula atómica es una foŕmula. (b) Si φ y χ son fórmulas, entonces (¬φ), (φ ∨ χ), (φ ∧ χ), (φ → χ) y (φ ↔ χ) son fórmulas. (c) Si v es una variable y φ es una fórmula, entonces (∀v)φ y (∃v)φ son fórmulas. (d) Una sucesión de sı́mbolos es una fórmula si y solo si se obtiene usando una cantidad finita de veces las cláusulas (a), (b) y (c). Por simplicidad, cuando no exista ambiguedad, se eliminarán los paréntesis externos de las fórmulas y de los cuantificadores, es decir, se escribirá ¬ψ en lugar de (¬ψ) y ∀vψ en lugar de (∀v)ψ, por ejemplo. El conjunto de las fórmulas de L se denotará por FL . Una ocurrencia de una variable en una fórmula se dice que es libre si esta ocurrencia no está bajo el alcance de algún cuantificador. Se dice que dicha ocurrencia es ligada en caso contrario, es decir, si ella está bajo el alcance de algún cuantificador. Según esta definición se puede apreciar que una variable puede tener ocurrencias libres y ocurrencias ligadas en una fórmula. Una definición inductiva de estos conceptos puede encontrarse en [9, p. 41-42]. Con las dos nociones anteriores se define cuándo una variable está libre en una fórmula: Una variable está libre en una fórmula si ella tiene al menos una ocurrencia libre en dicha fórmula. En caso contrario se dice que dicha variable no está libre en la fórmula. Dada una fórmula ψ se escribe ψ(x1 , . . . , xn ) para indicar que las variables libres de ψ están entre x1 , . . . , xn . Los términos de un lenguaje denotan objetos en una estructura (para dicho lenguaje) y las fórmulas del lenguaje afirman hechos relativos a estos objetos en tal estructura, a continuación se definirán de manera precisa estos conceptos. Luego, se definirá (entre otros conceptos) cuándo una fórmula es verdadera y cuando es falsa en una estructura. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 25 Definición 3.2.4. Sea U una estructura para L y k : V AR −→ U . Se define el valor de un término de L en U según k inductivamente en la complejidad del término. Dado un término t se denotará este valor por tU [k] y se omitirá mencionar la estructura U en los casos donde no exista posibilidad de ambiguedad. (a) Si t es la variable v, tU [k] = k(v). (b) Si t es el sı́mbolo constante c, tU [k] = cU . (c) Si t1 , . . . , tn son términos, f es un sı́mbolo funcional n-ario y t = f (t1 , . . . , tn ), entonces tU [k] = f U (t1U [k], . . . , tnU [k]). Intuitivamente, el valor de t en U según k, es el elemento de U denotado por t cuando asignamos a la variables de t valores según k. De lo anterior se deduce que si k y k′ coinciden en las variables que aparecen en el término t, entonces tU [k] = tU [k′ ]. Sea U una estructura para L, k : V AR −→ U y φ una fórmula de L. Se procede a definir lo que significa que k satisface a φ en U, lo que se denota por U |= φ[k]. El significado intuitivo de U |= ϕ[k] es que el resultado de sustituir en φ las variables libres por sus valores según k, es una afirmación verdadera en U. La definición se hace aplicando inducción en la construcción de las fórmula φ. Definición 3.2.5. (Caso base) (a) Caso base: Si φ es una fórmula atómica, es decir, φ = t1 ≡ t2 o φ = R(t1 , . . . , tn ), entonces: (a.1) U |= t1 ≡ t2 [k] ⇐⇒ t1U [k] = t2U [k]. (a.2) U |= R(t1 , . . . , tn )[k] ⇐⇒ RU (t1U [k], . . . , tnU [k]). (b) Caso inductivo: Si φ = ¬χ o φ = χ → σ o φ = χ ∧ σ o φ = χ ∨ σ o φ = χ ↔ σ, donde χ y σ son fórmulas para las cuales se ha definido lo que se quiere, entonces: (b.1) U |= (¬χ)[k] ⇐⇒ U 6|= χ[k]. (b.2) U |= (χ → σ)[k] ⇐⇒ U 6|= χ[k] o U |= σ[k]. (b.3) U |= (χ ∧ σ)[k] ⇐⇒ U |= χ[k] y U |= σ[k]. (b.4) U |= (χ ∨ σ)[k] ⇐⇒ U |= χ[k] o U |= σ[k]. (b.5) U |= (χ ↔ σ)[k] ⇐⇒ {U |= χ[k] y U |= σ[k]} o {U 6|= χ[k] y U 6|= σ[k]}. (b.6) U |= ((∀v)χ)[k] ⇐⇒ U |= χ[k′ ] para toda k′ : V AR −→ U que difiere de k a lo sumo en el valor que le asigna a la variable v. (b.7) U |= ((∃v)χ)[k] ⇐⇒ U |= χ[k′ ] para alguna k′ : V AR −→ U que difiere de k a lo sumo en el valor que le asigna a la variable v. Definición 3.2.6. Sea U una estructura para L y φ una fórmula de L, entonces se cumple: (a) φ es satisfacible si existe una estructura U y una k : V AR −→ U tal que U |= φ[k]. (b) φ es verdad en U si y solo si U |= ϕ[k], para toda k : V AR −→ U . Esto también se expresa diciendo que U es un modelo de φ y se denota por U |= φ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 26 Franklin Galindo (c) φ es falsa en U si y solo si U 6|= φ[k], para toda k : V AR −→ U . (d) Si Γ es un conjunto de fórmulas, se dice que U es un modelo de Γ si toda fórmula φ ∈ Γ es verdad en U. Observación 3.2.1. Se cumple que si φ es una fórmula con variables libres vi1 , . . . , vim , entonces el que k : V AR −→ U satisfaga a φ en U solo depende de los valores de k en las variables vi1 , . . . , vim . De modo que si a1 = k(vi1 ), . . . , am = k(vim ), entonces se escribirá U |= φ[a1 , . . . , am ] en vez de U |= φ[k]. Definición 3.2.7. Sea Γ un conjunto de fórmulas en un lenguaje L y φ una fórmula de L. Se dice que: (a) φ es lógicamente válida (o válida) si es verdad en toda estructura. (b) φ es contradictoria si ¬φ es lógicamente válida, es decir, si φ es falsa en toda estructura. (c) φ es una consecuencia lógica de Γ, denotado por Γ |= φ, si toda estructura para L que es un modelo de Γ también es un modelo de φ, es decir, si no existe una estructura para L que sea modelo de Γ y no sea modelo de φ. Cuando se trata de consecuencia lógica de conjuntos unitarios, por ejemplo, {ψ} |= φ, se escribe ψ |= φ. Y cuando se trata de consecuencias lógicas del conjunto de sentencias vacı́o, ∅ |= φ, se escribe ası́: |= φ. Observación 3.2.2. Como en el caso de la lógica proposicional, una consecuencia inmediata de la definición anterior es que: ψ es lógicamente válida si y solo si |= ψ. 3.3 Teorema de completitud de Gödel y el teorema de compacidad A continuación se enuncia el teorema de completitud de Gödel para ℓℵ0 ℵ0 , el cual se utilizará en la prueba del teorema de interpolación para ℓℵ0 ℵ0 . En especial, se usará la técnica de Henkin de construcción de modelos a partir de constantes que se aplica contemporáneamente en la demostración del teorema de Completitud de Gödel (ver [17]). Dicha técnica, contiene un método que permite construir un modelo para un conjunto consistente de sentencias T en un lenguaje J , extendiéndola (inductivamente) a una teorı́a maximal consistente T ′ , en un lenguaje expandido J ∪ E, donde E es un conjunto numerable de nuevos sı́mbolos constantes que funcionan como “testigos”para T ′ . El modelo se construye con los términos cerrados de J ∪ E, o solamente con E, usando clases de equivalencia de los mismos y la propiedad de maximal consistencia. Más adelante se definirán estos conceptos. Una prueba contemporánea del teorema de completitud de Gödel aplicando el método de Henkin puede encontrarse en los textos [8, 9, 11, 12, 24, 25]. La que se utiliza en este trabajo es la versión presente en [8]. Se presentan dos enunciandos del teorema que son equivalentes, pero antes de formularlos se definirá la noción de “deducibidad”, pues ella es requerida para dichas formulaciones. Axiomas para ℓℵ0 ℵ0 (esquemas de axiomas) (ver [11, p. 166-167]): Son todas las generalizaciones de fórmulas de la formas siguientes, donde x, y son variables y φ y χ son fórmulas (Definición: φ es una generalización de χ si φ es ∀x1 , . . . , xn χ, para variables x1 , . . . , xn ): 1. Todas las instancias de tautologı́as de la lógica proposicional. 2. ∀xφ → φxt , donde t es substituible por x en φ. 3. ∀x(φ → χ) → (∀xφ → ∀xχ). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 27 4. φ → ∀xφ, donde x no ocurre libre en φ. 5. y ≡ y. ′ ′ 6. (x ≡ y) → (φ → φ ), donde φ es una fórmula atómica y φ se obtiene de φ al reemplazar x por y en cero o más lugares (aunque no necesariamente en todos). REGLA DE INFERENCIA: (Modus Ponens) A partir de φ → χ y φ se puede inferir χ. Definición 3.3.1. Sea Γ un conjunto de fórmulas y φ una fórmula. Se dice que φ se deduce de Γ o que φ se demuestra a partir de Γ, lo que se denota por Γ ⊢ φ, si existe una sucesión finita σ1 , . . . , σm de fórmulas tales que σm = φ, y cada σi es un axioma, o es un miembro de Γ, o se obtiene de dos fórmulas anteriores en la sucesión por la regla de inferencia Modus Ponens. Si Γ = ∅, entonces se escribe ⊢ φ en lugar de ∅ ⊢ φ. Definición 3.3.2. Sea Θ un conjunto de fórmulas de un lenguaje L. Se dice que Θ es consistente si y solo si no existe una fórmula ψ del lenguaje L tal que Θ ⊢ ψ y Θ ⊢ ¬ψ. Y se dice que Θ es inconsistente si Θ no es consistente. Teorema 3.3.1 (Teorema de completitud de Gödel (1930), Henkin (1949)). Sea Σ un conjunto de sentencias de un lenguaje numerable L y ϕ una sentencia de L, entonces: (1) Primera versión: Σ es consistente ⇐⇒ Σ tiene un modelo. (2) Segunda versión: Σ ⊢ ϕ ⇐⇒ Σ |= ϕ. Vale la pena resaltar que el teorema de completitud de Gödel también se cumple para lenguajes de primer orden de cualquier cardinalidad, en tal caso se requiere del axioma de elección para hacer la prueba (ver [8, 25]). Una consecuencia muy conocida del teorema de completitud de Gödel es el teorema de compacidad, dicho teorema también se utilizará en la prueba del teorema de interpolación para ℓℵ0 ℵ0 . El teorema de compacidad se puede probar como un corolario del teorema de completitud de Gödel o directamente usando, por ejemplo, el método de ultraproductos. Ambas pruebas pueden encontrarse (entre otros) en los textos [8, 9, 11, 24]. A continuación se presentan dos enunciados del teorema de compacidad que son equivalentes, en este trabajo se utilizará la segunda versión: Teorema 3.3.2 (Teorema de compacidad). Sea Σ un conjunto de sentencias de un lenguaje numerable L y ϕ una sentencia de L, entonces: (1) Primera versión: Σ tiene un modelo ⇐⇒ cada subconjunto finito de Σ tiene un modelo. (2) Segunda versión: Σ |= ϕ ⇐⇒ Existe un subconjunto finito Σ0 ⊆ Σ tal que Σ0 |= ϕ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 28 Franklin Galindo Vale la pena resaltar que no es fácil encontrar en la bibliografı́a la fecha de la primera demostración del teorema de compacidad para ℓℵ0 ℵ0 , la más antigua que conoce el autor de este trabajo es la de Gödel de 1930 (ver [16]), quien lo probó como un cololario de su teorema de completitud. Es conocido que la propiedad de “compacidad” en lógica está estrechamente relacionada con la propiedad de “compacidad” en el análisis matemático o en la topologı́a, pues (por ejemplo) se cumple que el teorema de compacidad para una teorı́a en primer orden Γ es equivalente a que el espacio (topológico) de Stone correspondiente al álgebra de Lindenbaum de Γ sea compacto. Y los antecedentes de la propiedad de compacidad en análisis y Topologı́a (según la bibliografı́a) se remontan al teorema clásico de Heine-Borel (ver [28]) que afirma que “todo cubrimiento abierto de un conjunto cerrado y acotado del espacio de los reales tiene un subcubrimiento finito”, dicho teorema (Heine-Borel) tiene versiones de finales del siglo XIX (ver [30]). 3.4 Formulación y demostración del teorema de interpolación A continuación se presentarán una serie de definiciones que serán pilares fundamentales para la demostración del teorema principal de esta sección. Definición 3.4.1. Una teorı́a de un lenguaje J , es un conjunto de sentencias de J . Definición 3.4.2. Sea Σ un conjunto de sentencias de un lenguaje J . Σ es maximal consistente si Σ es consistente y no existe un conjunto de sentencias consistente Γ que contenga propiamente a Σ, es decir, un Γ tal que Σ ⊆ Γ y exista una sentencia γ tal γ ∈ Γ y γ 6∈ Σ. Definición 3.4.3. Sea Σ un conjunto de sentencias de un lenguaje J y E un conjunto de constantes de J . Se dice que E es un conjunto de testigos para Σ en J si para toda fórmula ϕ de J con a lo sumo una variable libre (digamos, x) existe una e ∈ E tal que: Σ ⊢ ∃xϕ(x) → ϕ(e). Es importante destacar que en la demostración del siguiente teorema se presentan una serie de proposiciones, intrı́nsecas del mismo, que se irán probando acorde a su aparición para hacer menos pesado el dearrollo de la demostración del teorema, ya que la misma es extensa. Para tal fin se usará el sı́mbolo “” para indicar el final de la prueba de las proposiciones, distinguiendo de esta forma el final de la demostración del teorema que se indicará con el sı́mbolo “”. También se presentan una serie de observaciones intrı́nsecas, y de utilidad, para el desarrollo de la demostración. Teorema 3.4.1 (Teorema de interpolación para la lógica de primer orden). Sean χ y ζ dos sentencias en primer orden tal que χ |= ζ, entonces existe una sentencia λ tal que: (i) χ |= λ y λ |= ζ. (ii) Cualquier sı́mbolo de relación, función o constante (excluyendo la identidad) que ocurra en λ, también ocurre en χ y ζ. La sentencia λ es llamada una “interpolación de χ y ζ”. Observación 3.4.1. Los siguientes tres ejemplos muestran porque es necesario permitir que el sı́mbolo de la identidad ocurra en λ y no necesariamente en χ y ζ, en efecto, notar que los siguientes pares de sentencias tienen el sı́mbolo de identidad a lo sumo en una de ellas, y sin embargo, ellas no tienen interpolación λ que no tenga el sı́mbolo de identidad: (1) χ = ∃x(Sx ∧ ¬Sx) y ζ = ∃xRx. Una λ = ¬∀x(x ≡ x). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación (2) χ = ∃xRx y ζ = ∃x(Sx ∨ ¬Sx). (3) χ = ∀x∀y(x ≡ y) y 29 Una λ = ∀x(x ≡ x). ζ = ∀x∀y(Sx ↔ Sy). Una λ = ∀x∀y(x ≡ y). Sin embargo, cuando el sı́mbolo de identidad no aparece en χ ni en ζ, y χ no es una sentencia contadictoria y ζ no es una sentencia válida, entonces en la interpolación λ de χ y ζ no aparece el sı́mbolo de identidad (ver [8]). Por ejemplo: χ = ∀x∀y((T (x, y) → C(x, y)) ∧ T (f (a), b)) y ζ = C(f (a), b)) ∧ T (f (a), b)). Una λ = (T (f (a), b)) → C(f (a), b)) ∧ T (f (a), b). Otro ejemplo de interpolación es el siguiente: χ = g(b) ≡ d ∧ Q(g(b)) y ζ = (d ≡ e) → Q(e). Una λ = Q(d). Demostración del teorema. Considerando la observación anterior se tiene que si χ es una sentencia insatisfacible, entonces una sentencia λ interpolación de χ y ζ es ¬∀x(x ≡ x), y si ζ es una sentencia válida, entonces una sentencia λ interpolación de χ y ζ es ∀x(x ≡ x). En consecuencia, para terminar de demostrar el teorema se considerará el caso en que χ no es una sentencia insatisfacible (χ es satisfacible) y ζ no es una sentencia válida (¬ζ es satisfacible). Se demostrará este caso por reducción al absurdo. Supóngase que no existe una sentencia λ interpolación para χ y ζ. Se obtendrá una contradicción demostrando que no ocurre χ |= ζ contruyendo un modelo para χ ∧ ¬ζ. (Notar que la prueba que se realizará no es constructiva). Sea L el lenguaje de todos los sı́mbolos que ocurren en χ o en ζ o en ambas. Sea L1 el lenguaje de todos los sı́mbolos que ocurren en χ, L2 el lenguaje de todos los sı́mbolos que ocurren en ζ y L0 el lenguaje de todos los sı́mbolos que ocurren en ambas (χ y ζ), es decir, L = L1 ∪ L2 , L0 = L1 ∩ L2 . Ahora se extiende el lenguaje L a un lenguaje L′ , agregándole un conjunto numerable C = {cn : n ∈ ℵ0 } de nuevos sı́mbolos constantes, es decir, L′ = L ∪ C. En correspondencia con esta extensión de L, se definen las extensiones con C de L0 , L1 y L2 , ası́: L′0 = L0 ∪ C, L′1 = L1 ∪ C, L′2 = L2 ∪ C. Considérese ahora un par de teorı́as K de L′1 y H de L′2 . Se dice que una sentencia λ de L′0 separa a K y a H si y solo si: K |= λ y H |= ¬λ. Además, se dice que las teorı́as K y H son inseparables si y solo si ninguna sentencia λ de L′0 separa a K y H. Lo que resta de la demostración se parece a la prueba del teorema de completitud de Gödel usando la técnica de Henkin sobre construcción de modelos a partir de constantes, pero usando adicionalmente la noción de “par de teorı́as inseparables”. Veamos de inicio la siguiente: Proposición ♦: {χ} y {¬ζ} son inseparables. Demostración: Aplicando reducción al absurdo, supóngase que existe una sentencia λ(c1 , . . . , cn ) de L′0 que separa a K y H, donde c1 , . . . , cn ∈ C. Sean z1 , z2 , . . . , zn variables que no ocurren en Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 30 Franklin Galindo λ(c1 , c2 , . . . , cn ), entonces la sentencia ∀z1 ∀z2 . . . ∀zn λ(z1 , z2 , . . . , zn ) es una interpolación de χ y ζ, es decir, χ |= ∀z1 ∀z2 . . . ∀vn λ(z1 , z2 , . . . , zn ) y ∀z1 ∀z2 . . . ∀zn λ(z1 , z2 , . . . , zn ) |= ζ. Contradicción pues se está suponiendo que no existe una sentencia interpolación para χ y ζ.  El conjunto de todas las sentencias de L′1 es numerable y también el conjunto de todas las sentencias de L′2 . Considérese una lista de tales sentencias, primero las de L′1 y luego las de L′2 : χ0 , χ1 , χ2 , . . . , χn , . . . (n ∈ ℵ0 ), ζ0 , ζ1 , ζ2 , . . . , ζn , . . . (n ∈ ℵ0 ) Ahora se construirán dos secuencias crecientes de teorı́as de L′1 y de L′2 , respectivamente, {χ} = K0 ⊆ K1 ⊆ K2 . . . ⊆ Kn . . . (n ∈ ℵ0 ), {¬ζ} = H0 ⊆ H1 ⊆ H2 . . . ⊆ Hn . . . (n ∈ ℵ0 ), tales que cumplen las siguientes propiedades: (i) Kn y Hn son conjuntos finitos de sentencias inseparables. (ii) Si Kn ∪ {χn } es inseparable con Hn , entonces χn ∈ Kn+1 . Si Kn+1 y Hn ∪ {ζn } son inseparables, entonces ζn ∈ Hn+1 (Notar que el procedimiento es en zigzag). (iii) Si χn = ∃xρ(x) y χn ∈ Kn+1 , entonces ρ(a) ∈ Kn+1 , para alguna a ∈ C tal que a no aparezca en Kn ∪ {χn }. Si ζn = ∃xτ (x) y ζn ∈ Hn+1 , entonces τ (b) ∈ Hn+1 , para alguna b ∈ C tal que b no aparezca en Hn ∪ {ζn }. Si han sido definidas las teorı́as Kn y Hn , entonces se pueden construir las teorı́as Kn+1 y Hn+1 de la manera usual:  si Kn ∪ {χn } es inseparable con Hn y χn no es existencial  Kn ∪ {χn } Kn ∪ {χn } ∪ {ρ(a)} si Kn ∪ {χn } es inseparable con Hn , y χn = ∃xρ(x) Kn+1 =  Kn en caso de que Kn ∪ {χn } no sea inseparable con Hn donde a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪{χn }.  si Hn ∪ {ζn } es inseparable con Kn+1 y ζn no es existencial  Hn ∪ {ζn } Hn ∪ {ζn } ∪ {τ (b)} si Hn ∪ {ζn } es inseparable con Kn+1 , y ζn = ∃xτ (x) Hn+1 =  Hn en caso de que Hn ∪ {ζn } no sea inseparable con Kn+1 donde b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪{ζn }. Entonces, como por construcción se tiene a las teorı́as K0 = {χ} y H0 = {¬ζ}, se puede continuar construyendo inductivamente, mediante la regla de definición anterior, a las dos secuencias de teorı́as Ki y Hi , para cada i ∈ ℵ0 . Se demostrará que tales secuencias tienen las propiedades (i), (ii) y (iii). Solo se mostrará (i), pues las propiedades (ii) y (iii) se cumplen por contrucción. (i) Hay que probar que ∀i ∈ ℵ0 , Ki y Hi son finitos e inseparables. Se hará por inducción en N: Caso base: (n = 0). Obviamente K0 y H0 son finitos y también son inseparables (Ver Proposición ♦). Caso inductivo: Sea n ∈ N. Supóngase que Kn y Hn cumplen con lo deseado, es decir, son finitos e inseparables. Se debe probar que Kn+1 y Hn+1 son finitos e inseparables. El que son finitos es Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 31 inmediato por la construcción. Para probar que son inseparables hay que considerar varios casos según la definición inductiva (Kn+1 y Hn+1 tienen tres posibilidades de ser cada uno), pero la idea principal de dicha prueba se puede presentar demostrando un caso modelo de todos los posibles, los demás casos salen usando esa idea y/o la hipótesis inductiva y/o la definición inductiva. Considérese el siguiente caso: Kn+1 = Kn ∪ {χn } ∪ {ρ(a)}, Hn+1 = Hn ∪ {ζn } ∪ {τ (b)}, (1) donde χn = ∃xρ(x), ζn = ∃xτ (x), a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪ {χn }, y b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪ {ζn }. Supóngase que Kn+1 y Hn+1 son separables, es decir, existe una sentencia λ de L′0 tal que: Kn+1 |= λ y Hn+1 |= ¬λ. Aplicando el teorema de completitud de Gödel y el teorema de la deducción en Hn+1 se tiene que: Hn ∪ {ζn } ⊢ τ (b) → ¬λ. Entonces, como b no aparece en Hn ∪{ζn }, se aplica la regla de introducción del generalizador y se tiene que: Hn ∪ {ζn } ⊢ ∀x(τ (x) → ¬λ). Volviendo a aplicar el teorema de completitud de Gödel se concluye que: Hn ∪ {ζn } |= ∀x(τ (x) → ¬λ). En consecuencia se tiene que: Hn ∪ {ζn } |= ¬λ. Entonces Kn+1 y Hn ∪ {ζn } son separables. Esto contradice la definición de Hn+1 en el caso analizado, ver la ecuación (1) y la definición inductiva. Por lo tanto, Kn+1 y Hn+1 son inseparables, lo que se querı́a probar. Sean ahora, Kω = [ Kn , n∈ω Hω = [ Hn . n∈ω Se mostrará lo siguiente: Proposición ♣: Kω y Hω son inseparables. Demostración: Aplicando reducción al absurdo, si Kω y Hω son separables, entonces existe una sentencia λ de L′0 tal que Kω |= λ y Hω |= ¬λ. Entonces, por el teorema de compacidad, existen conjuntos finitos Γ0 ⊆ Kω y Γ1 ⊆ Hω tales que Γ0 |= λ y Γ1 |= ¬λ. Luego, por la construcción Kω y Hω , existe j ∈ ℵ0 tal que Γ0 ⊆ Kj y Γ1 ⊆ Hj . En consecuencia, Kj |= λ y Hj |= ¬λ. Por lo tanto, Kj y Hj son separables. Esto contradice la cláusula (i) probada anteriormente. Entonces, Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 32 Franklin Galindo Kω y Hω son inseparables. Ahora, tomando en cuenta la Definición 3.4.2 y la Definición 3.4.3, se tiene lo siguiente: Proposición △: Kω y Hω son teorı́as maximal consistentes en L′1 y L′2 , respectivamente. Además, ambas tienen al conjunto de constantes C como conjunto de testigos (en L′1 y L′2 , respectivamente). Demostración: Primero se probará que Kω y Hω son consistentes, luego se probará que son máximal consistentes, y por último se probará que el conjunto de constantes C es un conjunto de testigos para Kω y también para Hω (en L′1 y L′2 , respectivamente). Para probar que Kω y Hω son consistentes primero se probará que ∀i ∈ ℵ0 , Ki y Hi son consistentes. Aplicando inducción en N: Caso base: (n = 0). K0 tiene un modelo, pues por hipótesis χ no es insatisfacible, y H0 tiene un modelo, pues por hipótesis ζ no es válida, entonces por el teorema de completitud de Gödel K0 y H0 son consistentes. Caso inductivo: Sea n ∈ N. Supóngase que Kn y Hn cumplen con lo deseado, es decir, ellas son consistentes. Se debe probar que Kn+1 y Hn+1 son consistentes. Para esto hay que considerar varios casos según la definición inductiva (Kn+1 y Hn+1 tienen tres posibilidades de ser cada uno), pero la idea principal de dicha prueba se puede presentar demostrando un caso modelo de todos los posibles, los demás casos salen usando esa idea y/o la hipótesis inductiva y/o la definición inductiva. Considérese ahora el siguiente caso: Kn+1 = Kn ∪ {χn } ∪ {ρ(a)}, (2) Hn+1 = Hn ∪ {ζn } ∪ {τ (b)}, (3) donde χn = ∃xρ(x), ζn = ∃xτ (x), a es la menor constante de C (en la numeración fijada al incio) que no aparece en Kn ∪{χn }, y b es la menor constante de C (en la numeración fijada al incio) que no aparece en Hn ∪ {ζn }. Supóngase que Kn+1 es inconsistente, entonces cualquier proposición de L′1 es consecuencia lógica de Kn+1 . Sea λ una sentencia contradictoria de L′0 , entonces: Kn+1 |= λ. Aplicando el teorema de completitud de Gödel y el teorema de la deducción en Kn+1 se tiene que: Kn ∪ {χn } ⊢ ρ(a) → λ. Entonces, como a no aparece en Kn ∪ {χn }, se aplica la regla de introducción del generalizador y se tiene que: Kn ∪ {χn } ⊢ ∀x(ρ(x) → λ). Volviendo a aplicar el teorema de completitud de Gödel se concluye que: Kn ∪ {χn } |= ∀x(ρ(x) → λ). En consecuencia, se tiene que Kn ∪ {χn } es insatisfacible. Por lo tanto, Kn ∪ {χn } |= λ y, como ¬λ es una sentencia válida, se tiene que Hn |= ¬λ. Ası́, Kn ∪ {χn } y Hn son separables. Esto Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 33 contradice la definición de Kn+1 en el caso analizado, ver ecuación (2) y definición inductiva. Por lo tanto, Kn+1 es cosistente. Si Hn+1 es inconsistente, entonces se aplica un razonamiento análogo al caso anterior de Kn+1 y se concluye que Hn ∪ {ζn } y Kn+1 son separables lo cual contradice a definición de Hn+1 en el caso analizado, ver ecuación (3) y definición inductiva. Por lo tanto, Hn+1 es consistente. Con lo queda demostrado que ∀i ∈ ℵ0 , Ki y Hi son consistentes. Ahora se probará que Kω y Hω son consistentes. Si Kω es inconsistente, entonces por la Definición 3.3.1 se tiene que existe un conjunto finito Γ0 ⊆ Kω tal que Γ0 es inconsistente. En consecuencia, (por construcción) existe un j ∈ ℵ0 tal que Γ0 ⊆ Kj . Por lo tanto, Kj es inconsistente. Esto contradice el resultado anterior. Entonces Kω es consistente. Aplicando un razonamiento análogo se prueba que Hω es consistente. Seguidamente se probará que Kω y Hω son maximal consistente en L′1 y L′2 , respectivamente. Se demostrará que Hω es máximal consistente en L′2 , para esto suficiente mostrar que ∀i ∈ ℵ0 , (ζi ∈ Hω ) o (¬ζi ∈ Hω ). Por reducción al absurdo, supóngase que existe un n ∈ ℵ0 tal que (ζn 6∈ Hω ) y (¬ζn 6∈ Hω ). Ası́, por construcción, ambas proposiciones fueron sacadas en el paso corespondiente a su subı́ndice, ζn en Hn+1 , y supóngase que ¬ζn en Hr+1 , donde r ∈ ℵ0 , es decir, por construcción: Hn ∪ {ζn } es separable con Kn+1 ; y Hr ∪ {ζr } es separable con Kr+1 , donde ¬ζn = ζr . En consecuencia, existe una sentencia λ de L′0 tal que (Hn ∪ {ζn }) |= λ y Kn+1 |= ¬λ. Y existe una sentencia λ′ de L′0 tal que (Hr ∪ {¬ζn }) |= λ′ y Kr+1 |= ¬λ′ . Sin perder generalidad, supóngase que r > n. Entonces, por construcción, Hn ⊆ Hr y Kn+1 ⊆ Kr+1 , teniendo que: Hr |= ζn → λ, Kr+1 |= ¬λ, Hr |= ¬ζn → λ′ , Kr+1 |= ¬λ′ . Luego, Hr |= (λ ∨ λ′ ), Kr+1 |= ¬(λ ∨ λ′ ). En consecuencia, Kω |= (λ ∨ λ′ ), Hω |= ¬(λ ∨ λ′ ). Por lo tanto, Kω y Hω son separables. Esto contradice lo desmostrado anteriormente en la Proposición ♣, entonces ∀i ∈ ℵ0 , (ζi ∈ Hω ) o (¬ζi ∈ Hω ), concluyendo que Hω es maximal consistente. La prueba de que Kω es maximal consistente se realiza de manera análoga. Por último, se probará que el conjunto de constantes C es un conjunto de testigos para Kω y para Hω (en L′1 y L′2 , respectivamente). Se mostrará que C es un conjunto de testigos para Kω en L′1 . Sea ∃xϕ(x) una sentencia de L′1 . Como Kω es maximal consistente, entonces ∃xϕ(x) ∈ Kω o ¬∃xϕ(x) ∈ Kω . Si ∃xϕ(x) ∈ Kω , entonces por construcción para alguna constante a ∈ C se tiene que ϕ(a) ∈ Kω . Ası́, Kω ⊢ ϕ(a) y, en consecuencia, Kω ⊢ ∃xϕ(x) → ϕ(a). Si ¬∃xϕ(x) ∈ Kω , entonces Kω ⊢ ¬∃xϕ(x). Luego, Kω ⊢ (¬∃xϕ(x)) ∨ ϕ(a) para cualquier constante a ∈ C. En consecuencia, Kω ⊢ ∃xϕ(x) → ϕ(a) para cualquier constante a ∈ C. En conclusión, C es un conjunto de testigos para Kω en L′1 . La demostración de que C es un conjunto de testigos para Hω (en L′2 ) se realiza de manera análoga.  Proposición ♠: Kω ∩ Hω es una teorı́a maximal consistente en L′0 . Demostración: Como Kω ∩ Hω ⊆ Kω y Kω ∩ Hω ⊆ Hω y Kω y Hω son teorı́as consistentes, entonces Kω ∩ Hω es consistente. Se probará que Kω ∩ Hω es maximal consistente demostrando que para toda proposición φ de L′0 se cumple que φ ∈ Kω ∩ Hω o ¬φ ∈ Kω ∩ Hω . Sea una proposición φ de L′0 . Como Kω y Hω son inseparables, entonces no puede ocurrir que φ ∈ Kω y Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 34 Franklin Galindo ¬φ ∈ Hω o que ¬φ ∈ Kω y φ ∈ Hω . Entonces como Kω y Hω son teorı́as maximal consistentes en L′1 y L′2 , respectivamente, se concluye que φ ∈ Kω ∩ Hω o ¬φ ∈ Kω ∩ Hω . Por lo tanto, Kω ∩ Hω es maximal consistente.  Ahora se procederá a construir un modelo para la teorı́a Kω ∪ Hω , y como χ ∈ Kω y ¬ζ ∈ Hω entonces se tendrá el modelo buscado para χ ∧ ¬ζ. Con esto terminará la demostración del teorema: Usando la técnica de construcción de modelos a partir de constantes de Henkin, que se aplica para demostrar en teorema de completitud de Gödel en [8], se puede construir un modelo para la teorı́a Kω y otro modelo para la teorı́a Hω , pues se ha demostrado (Proposición △) que dichas teorı́as son maximal consistentes en L′1 y L′2 , respectivamente. Además, ambas tienen al conjunto numerable de nuevas constantes C = {cn : n ∈ ℵ0 } como un conjunto de testigos (en L′1 y L′2 , respectivamente). Sea A una estructura para L′1 , modelo para Kω , que se construirá utilizando la técnica referida anteriormente. Sea C = {cn : n ∈ ℵ0 } el conjunto de nuevas constantes. Para no tener problemas con las sentencias atómicas de Kω , se define sobre C una relación de equivalencia ∼ de la siguiente manera: Sean ci ∈ C y cj ∈ C, entonces ci ∼ cj si y solo si ci ≡ cj ∈ Kω . Notar que ∼ es una relación de equivalencia porque, la relación de identidad es reflexiva, simétriC = {[cn ] : cn ∈ C} el conjunto cociente determinado por ∼. Notar que el ca y transitiva. Sea ∼ C cardinal de es a lo sumo numerable. ∼ C El universo A de la estructura A es el conjunto cociente , y las interpretaciones en A para ∼ los sı́mbolos de L′1 son las siguientes: (1) Si c1 , . . . , cn son constantes de C y R es un sı́mbolo relacional n-ario de L′1 entonces, RA ([c1 ], . . . , [cn ]) ⇐⇒ R(c1 , . . . , cn ) ∈ Kω . (2) Si a es un sı́mbolo constante de L′1 , entonces, aA = [ci ], para alguna constante ci ∈ C tal que a ≡ ci ∈ Kω . Tal constante existe, pues ⊢ ∃x(a ≡ x). Por tanto, ∃x(a ≡ x) ∈ Kω . Luego, como C es un conjunto de testigos para Kω , se concluye que existe una constante ci ∈ C tal que (a ≡ ci ) ∈ Kω . Notar que por las propiedades de la relación de identidad ≡ la interpretación de a en A, aA , es única. Notar también que ∀j ∈ ℵ0 si cj ∈ C, entonces cA j = [cj ], pues cj ≡ cj ∈ Kω . (3) Si c1 , . . . , cn son constantes de C y f es un sı́mbolo funcional n-ario de L′1 entonces, f A ([c1 ], . . . , [cn ]) = [ci ], para alguna constante ci ∈ C tal que (f (c1 , . . . , cn ) ≡ ci ) ∈ Kω . Como en el caso anterior, tal constante ci existe pues ∃x(f (c1 , . . . , cn ) ≡ x) ∈ Kω y C es un conjuntos de testigos para Kω . Notar también que por las propiedades de la relación de identidad está garantizada la unicidad de la imagen en A de f A ([c1 ], . . . , [cn ]). Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 35 Con esto termina la definición de la estructura A que es un modelo de la teorı́a Kω . Sea ahora una esructura B para L′2 , modelo para Hω , que se construye de manera análoga a la estructura A para L′1 . Los universos de A y B son los siguientes (por construcción): A = {[cn ] : cn ∈ C}, B = {[cn ]′ : cn ∈ C}. Como Kω ∩ Hω es una teorı́a maximal consistente en L′0 (Proposición ♠), pues Kω y Hω son inseparables (Proposición ♣), se cumple que A ↾ L′0 y B ↾ L′0 son isomorfas. Donde A ↾ L′0 es la estructura para L′0 que tiene el mismo universo de A y preserva la misma interpretación de A para los sı́mbolos de L′0 , y B ↾ L′0 es la estructura para L′0 que tiene el mismo universo de B y preserva la misma interpretación de B para los sı́mbolos de L′0 . En efecto, sea f : A −→ B una función de A en B definida ası́: f ([cn ]) = [cn ]′ . Claramente, f es sobreyectiva, y f es inyectiva porque Kω ∩ Hω es una teorı́a maximal consistente en L′0 . Por tanto, f es una función biyectiva. Se demostrará que f preserva las funciones, relaciones y constantes corrrespondientes a L′0 . Sea R un sı́mbolo de relación n-ario de L′0 . Hay que probar que: RA ([c1 ], . . . , [cn ]) ⇔ RB ([c1 ]′ , . . . , [cn ]′ ). Por definición se tiene que: RA ([c1 ], . . . , [cn ]) ⇔ R(c1 , . . . , cn ) ∈ Kω Como Kω ∩ Hω es maximal consistente, entonces R(c1 , . . . , cn ) ∈ Kω ⇔ R(c1 , . . . , cn ) ∈ Hω . Luego, por definición, R(c1 , . . . , cn ) ∈ Hω ⇔ RB ([c1 ]′ , . . . , [cn ]′ ). Sea g un sı́mbolo de función n-ario de L′0 . Hay que probar que: f (g A ([c1 ], . . . , [cn ])) = g B (f ([c1 ]), . . . , f ([cn ])). Por definición de f , se obtiene que g B (f ([c1 ]), . . . , f ([cn ])) = g B ([c1 ]′ , . . . , [cn ]′ ) Dado que g(c1 , . . . , cn ) ≡ ci ∈ Hω (para algún i ∈ ℵ0 ), entonces g B ([c1 ]′ , . . . , [cn ]′ ) = [ci ]′ . Por definición de f , se tiene que [ci ]′ = f ([ci ]). Ası́, dado que g(c1 , . . . , cn ) ≡ ci ∈ Kω pues Kω ∩ Hω es maximal consistente, se tiene f ([ci ]) = f (g A ([c1 ], . . . , [cn ]). B ′ Sea ci una constante de C, entonces por definición, cA i = [ci ] y ci = [ci ] . En consecuencia, ′ B = f ([ci ]) = [ci ] = ci . Sea a una constante de L′0 que no está en C, entonces existe un j ∈ ℵ0 tal que cj ∈ C y a ≡ cj ∈ Kω . Luego, a ≡ cj ∈ Hω pues Kω ∩ Hω es maximal consistente. En consecuencia, por f (cA i ) Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 36 Franklin Galindo definición, aA = [cj ] y aB = [cj ]′ , concluyendo que f (aA )=aB . Ası́, se tiene que A ↾ L′0 y B ↾ L′0 son isomorfas. Considérese ahora que A = B, es decir, que ∀n ∈ ℵ0 ([cn ] = [cn ]′ ). Sea D un conjunto equipotente a B y h : B −→ D una función biyectiva de B en D, entonces se construye una extensión de la estructura B al lenguaje L′ de la manera usual (teniendo presente la definición de estructuras isomorfas), es decir, se construye de la manera natural una estructura D para L′ tal que D ↾ L′2 y B sean isomorfas, y D ↾ L′1 y A sean isomorfas. En consecuencia, D es un modelo de Tω ∪ Hω y, como χ ∈ Kω y ¬ζ ∈ Hω, entonces D es un modelo de χ ∧ ¬ζ. Observación 3.4.2. Como se dijo en la introducción de este artı́culo un corolario importante del teorema de interpolación de Craig es el teorema de definibilidad de Beth (1953): Γ(Q) define a Q implı́citamente si y solo si Γ(Q) define a Q explı́citamente. Donde Q es un sı́mbolo relacional n-ario y Γ(Q) es un conjunto de sentencias de un lenguaje que contiene a Q y (posiblemente) a otros sı́mbolos relacionales. Otro corolario destacado del teorema de interpolación de Craig, es el teorema de consistencia de Robinson (1956): Sean J1 y J2 dos lenguajes y sea J = J1 ∩ J2 . Supóngase que K es una teorı́a completa en J , y K1 ⊇ K y K2 ⊇ K son dos teorı́as consistentes en J1 y J2 , respectivamente. Entonces K1 ∪ K2 es una teorı́a consistente en J1 ∪ J2 . Una (detallada) formulación y demostración de ambos teoremas a partir del teorema de interpolación de Craig puede encontrarse en el texto [8, p. 90-91]. 4 Algunas generalizaciones del teorema de interpolación Craig a otros sistemas lógicos La revisión de bibliográfı́a especializada sobre la propiedad de interpolación Craig revela que tal tema es bastante amplio y profundo, (como se dijo en la introducción de este artı́culo) abarca teorı́a de la demostración, teorı́a de modelos abstracta, ciencias de la computación, lógica modal, lógica intuicionista, etc. Por ejemplo, se ha investigado si dicha propiedad la cumplen otros sistemas lógicos, y entre los resultados obtenidos se encuentran los siguientes [13, 14, 19, 32], entre otros. Antes de enunciar dichos resultados se presentarán dos maneras de formular la propiedad de interpolación Craig que exiten (entre otras) en la bibliografı́a especializada: La propiedad de interpolación Craig (P IC → ), también llamada propiedad de interpolación local o propiedad de interpolación fuerte, y |=-propiedad de interpolación Craig (P IC |= ), también llamada propiedad de interpolación global o propiedad de interpolación débil, ambas propiedades no son comparables, es decir, ninguna implica a la otra (P IC → 6=⇒ P IC |= y P IC |= 6=⇒ P IC → ), una prueba de ello puede encontrarse en [19, p.31]. Aunque bajo algunas condiciones (teorema de deducción local) se cumple que P IC → =⇒ P IC |= (ver [19, p. 30]): P IC → : Sea ℓ una lógica la cual tiene la implicación entre sus conectivas lógicas. Se dice que ℓ tiene la propiedad de interpolación Craig, o que P IC → ocurre para ella, si para cualquier par de fórmulas χ y ζ del lenguaje de ℓ tal que |=ℓ χ → ζ, existe una fórmula interpolante en ℓ. Es decir, existe una fórmula λ del lenguaje de ℓ, con un lenguaje común a χ y ζ tal que: |=ℓ χ → λ y |=ℓ λ → ζ. Observación 4.1. En el caso de que la lógica ℓ no contenga fórmulas constantes las cuales denoten verdad y falsedad, la existencia de una interpolante para |=ℓ χ → ζ es requerida solo en el caso de 6|= ¬χ y 6|= ζ. Un ejemplo de una lógica con estas caracterı́sticas es la lógica de primer orden sin identidad (ℓℵ0 ℵ0 ⋆ ), esta lógica no tiene P IC → pues, por ejemplo, no existe interpolante Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 37 para |=ℓℵ0 ℵ0 ⋆ Q(x) → (T (x) ↔ T (x)). Sin embargo, el teorema de interpolación ocurre para tal lógica si se agrega a la definición P IC → la observación anterior. P IC |= : Sea ℓ una lógica. Se dice que ℓ tiene la |=-propiedad de interpolación Craig, o que P IC |= ocurre para ella, si para cualquier par de fórmulas χ y ζ del lenguaje de ℓ tal que χ |=ℓ ζ, existe una fórmula interpolante en ℓ. Es decir, existe una fórmula λ del lenguaje de ℓ, con un lenguaje común a χ y ζ tal que: χ |=ℓ λ y λ |=ℓ ζ. (Aplica para P IC |= la misma observación que para P IC → ). Notar que P IC → depende de la noción de validez y P IC |= depende de la relación de consecuencia lógica. En la bibliografı́a consultada se pueden encontrar varias tablas que resumen algunos resultados obtenidos, dichos resúmenes son con P IC → o con P IC |= , y ellos tienen algunos resultados similares, se elige presentar aquı́ una parte de la tabla resumen que se encuentra en [19, p. 40], la cual se hace considerando P IC → . La elección de esta tabla resumen se debe a que en la misma aparecen sistemas lógicos no clásicos, además de los clásicos, algo que no ocurre con otros resúmenes revisados: 4.1 Lógicas que cumplen CIP → 1. Lógica proposicional, ver [19, p. 40]. En este trabajo se probó que también cumple con P IC |= . 2. Lógica de primer orden, (ver Craig, [6, 7]). En este trabajo se probó que también cumple con P IC |= . 3. ℓℵ1 ℵ0 : lógica infinitaria que admite conjunciones y disyunciones infinitas numerables. (LopezEscobar, 1965), ver [19, p. 40]. También cumple con P IC |= (Lopez-Escobar, 1965), ver [32]. 4. Lógica modal proposicional T. (Gabbay, 1972), ver [19, p. 40]. 5. Lógica modal proposicional S4. (Gabbay, 1972), ver [19, p. 40]. 6. Lógica modal proposicional S5. (Schumm, 1976). ver [19, p. 40]. 7. Lógica modal en primer orden T (sin la fórmula de Barcan), (Gabbay, 1972), ver [19, p. 40]. 8. Lógica modal en primer orden S4 (sin la fórmula de Barcan), (Gabbay, 1972), ver [19, p. 40]. 9. Lógica intuicionista de predicados, (Schütte, 1962), ver [19, p. 40]. 4.2 Lógicas que no cumplen CIP → 1. Lógica de segundo orden (ℓII ), (Lopez-Escobar, Barwise), ver [13]. (Observación: La lógica de segundo orden cumple con P IC |= [29, p. 163-164]) 2. Lógicas con cuantificadores generalizados: ℓQα , para todo ordinal α ≥ ℵ0 . Qα xP x ⇐⇒| {x : P (x)} |≥ ℵα , (Lopez-Escobar, Barwise), ver [13]. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 38 Franklin Galindo 3. Lógicas infinitarias: ℓαℵ0 , para todo α > ℵ1 , o α = ∞. (ℓαℵ0 admite conjunciones y disyunciones de cardinal menor que α, y ℓ∞ℵ0 admite conjunciones y disyunciones de cuaquier cardinalidad), (Malitz, 1971), ver [19, p. 40]. También no cumple con P IC |= . (Malitz, 1971), ver [32]. 4. Lógica modal S5 en primer orden, (Fine, 1979), ver [19, p. 40]. 5. Las lógicas con varios valores de verdad de Lukasiewuiz, para n > 2, (Krzystek y Zachorowski, 1977), ver [19, p. 30]. 6. Lógica de la relavancia R, (Urquart, 1999), ver [19, p. 40]. 7. Lógica Entailment E, (Urquart, 1999), ver [19, p. 40]. 5 Una caracterización de la lógica infinitaria ℓℵ1 ℵ0 usando interpolación en el contexto de la teorı́a de modelos abstracta Por los resultados presentados en la sección anterior (4) se tiene que la lógica ℓℵ1 ℵ0 satisface el teorema de interpolación Craig (Lopez-Escobar, 1965). También se tiene que Scott y Engeler probaron (de manera independiente) que: (⋆) Toda estructura numerable para un lenguaje numerable puede ser caracterizada, salvo isomorfismo, con una sentencia de ℓℵ1 ℵ0 (ver [23, p. 17]). Después de eso Makowsky probó en 1973 un teorema que carateriza a ℓℵ1 ℵ0 con tal propiedad (⋆) e interpolación (ver [23, p. 23]), la caracteriza como la menor lógica (la lógica de menor poder expresivo) que satisface la propiedad de interpolación de Craig y cumple con (⋆). Para formular el teorema primero se deben presentar dos conceptos fundamentales de la teorı́a de modelos abstracta: (1) “lógica abastracta”, ℓ, y (2) cuándo una lógica abstracta ℓ′ es “al menos más fuerte” que otra lógica abstracta ℓ: ℓ ≤ ℓ′ . Se formulan tales conceptos a continuación siguiendo los textos [12, p. 193-194] y [8, p. 128]: Definición 5.1. Una lógica abstracta (o sistema lógico), ℓ, es un par ordendo (S , |=ℓ ) donde S es una función y |=ℓ una relación binaria que cumplen con las siguientes propiedades: 1. S asocia a cualquier lenguaje L un conjunto S(L), el conjunto de las sentencias de ℓ correspondientes al lenguaje L, las S-sentencias de ℓ. 2. Si L ⊆ L⋆ , entonces S(L) ⊆ S(L⋆ ). 3. Si U|=ℓ φ (es decir, U y φ están relacionadas según |=ℓ ), entonces para algún lenguaje L, U es una estructura para L y φ ∈ S(L). 4. (Propiedad de isomorfismo). Si U|=ℓ φ y U ∼ = X, entonces X|=ℓ φ. 5. (Propiedad de reducción). Si L ⊆ L⋆ , φ ∈ S(L), y U es una estructura para L⋆ , entonces: U|=ℓ φ ⇐⇒ U ↾ L|=ℓ φ. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 39 Ejemplo 5.1. Algunos ejemplos de lógicas abstarctas son: ℓℵ0 ℵ0 , ℓII , ℓℵ1 ℵ0 , ℓQα , (ver [12, p. 194]). Si ℓ es una lógica abstracta y φ ∈ S(L), entonces: M odL ℓ (φ) = {U : U es una estructura para L y U |=ℓ φ}. Definición 5.2. Sea ℓ y ℓ′ dos lógicas abstractas. 1. ℓ′ es al menos más fuerte que ℓ, ℓ ≤ ℓ′ , si y solo si, para cualquier lenguaje L y para cuaquier φ ∈ S(L) existe ψ ∈ S ′ (L) tal que: L M odL ℓ (φ) = M odℓ′ (ψ). 2. ℓ y ℓ′ son igual de fuertes (ℓ y ℓ′ tienen el mismo poder expresivo), ℓ ∼ ℓ′ , si y solo si ℓ ≤ ℓ′ y ℓ′ ≤ ℓ. Ejemplo 5.2. Algunos ejemplos son: ℓℵ0 ℵ0 ≤ ℓII ; ℓℵ0 ℵ0 ≤ ℓℵ1 ℵ0 ; ℓℵ0 ℵ0 ≤ ℓQ1 ; ℓQ1 6≤ ℓℵ0 ℵ0 ; ℓII 6≤ ℓℵ0 ℵ0 ; ℓℵ1 ℵ0 6≤ ℓℵ0 ℵ0 . Demostraciones de algunos de estos resultados pueden encntrarse en [12]. Ahora, finalmente, se formula el teorema que carateriza a ℓℵ1 ℵ0 : Teorema 5.1. Sea ℓ una lógica abstracta que satisface el teorema de interpolación de Craig y, además, se cumple que toda estructura numerable para un lenguaje numerable puede ser caracterizada, salvo isomorfismo, con una sentencia de ℓ, entonces ℓℵ1 ℵ0 ≤ ℓ. 6 Problemas abiertos en teorı́a de modelos abstracta relacionados con la propiedad de interpolación A continuación se presenta uno de los primeros problemas abiertos (clásicos) que fueron planteados en relación con las lógicas abstractas, los cuantificadores generalizados, la propiedad de interpolación y ℓℵ0 ℵ0 . Dicho problema contribuyó con el desarrollo de la teorı́a de modelos abstracta y fue formulado (por ejemplo) por Feferman, Friedman y Shelah (ver [33, p. 2]), más información sobre el mismo puede encontrarse en [33], el autor de este artı́culo no tiene noticias de que halla sido resuelto: Problema abierto 1 : ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y que satisfaga las siguientes propiedades: compacidad numerable, y interpolación Craig? Una lógica abstracta ℓ tiene la propiedad de compacidad numerable si satisface el teorema de compacidad (Teorema 3.3.2) para todo conjunto numerable de sentencias Σ ⊆ Lenguaje de ℓ. Por ejemplo, la lógica ℓQ1 es numerablemente compacta [13, p. 18], [12, p. 142-143] y [8, p. 134]. Sin embargo, ella no satisface la propiedad de interpolación de Craig como aparece referido en el resumen de sistemas lógicos que no satisfacen la propiedad de interpolación expuesta anteriormente en la sección 4. Problema abierto 2: ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y sea “razonable”?. (ver [13, p. 22]) Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 40 Franklin Galindo Donde se ha sugerido que para que una lógica ℓ sea “razonable” ella debe satisfacer compacidad numerable y ∆-interpolación, o al menos la propiedad de Beth. La definición (y referencias) de estas propiedades puede encontrarse en [13], entre otros. Pero intuitivamente se puede decir que ∆-interpolación es una propiedad más débil que la propiedad de interpolación (interpolación implica ∆-interpolación) y que la propiedad de Beth significa que “definibilidad explı́cita” es equivalente a “definibilidad implı́cita” (ver [8]). Por ejemplo, la lógica ℓQ1 es numerablemente compacta, pero ella no satisface ∆-interpolación (ver [13, p. 21]). Otros interesantes problemas abiertos sobre la propiedad de interpolación en el contexto de la teorı́a de modelos abstracta pueden encontrarse en [13, 33], entre otros. 7 Conclusiones Se cumplió con el objetivo de presentar dos demostraciones del teorema de interpolación: Una para ℓprop y otra para ℓℵ0 ℵ0 . Ambas en el contexto de la teorı́a de modelos. Vale la pena resaltar que la demostración que se realizó para ℓprop es constructiva y usa el principio de inducción matemática. Tal demostración proporciona un procedimiento efectivo para construir una proposición λ interpolación de χ y ζ, para cualquier par de proposiciones χ y ζ que cumplan con las hipótesis del teorema. Dicho procedimiento usa las letras proposicionales que están en χ y no están en ζ hasta eliminarlas todas sustituyéndolas por una tautologı́a (s ∨ ¬s) o por una contradicción (s ∧ ¬s) de una manera especı́fica (utilizando disyunciones) para lograr construir la proposición interpolación. La demostración realizada para ℓℵ0 ℵ0 no es constructiva, es decir, se demuestra la existencia de la sentencia λ interpolación de χ y ζ por reducción al absurdo sin ofrecer un procedimiento efectivo para calcularla. Es importante destacar que la técnica usada, para dicha prueba (Henkin, 1963), es una ampliación del método de construcción de modelos a partir de constantes de Henkin (1949), mediante la noción de “teorı́as inseparables”. El nuevo método de construcción de modelos resultante, permite construir un modelo para la unión de dos teorı́as K0 ∪ H0 en un lenguaje L1 y L2 , respectivamente, las cuales son consistentes e inseparables, expandiéndolas simultáneamente (por inducción y en zigzag) a dos teorı́as Kω y Hω maximal consistentes e inseparables en un lenguaje extendido L1 ∪ C y L2 ∪ C, respectivamente, donde C es un conjunto numerable de nuevos sı́mbolos constantes que funciona como testigos para ambas. También se cumple (por la maximal consistencia e inseparabilidad) que la teorı́a Kω ∩ Hω es maximal consistente. El modelo buscado D para K0 ∪ H0 se construye (Henkin, 1963) aplicando el hecho de que Kω ∩ Hω es maximal consistente a dos modelos previos: Un modelo A para Kω y un modelo B para Hω que se construyen mediente el método de Henkin de 1949. Adicionalmente se presentaron ejemplos de aplicaciones o generalizaciones de la propiedad de interpolación a otros sistemas lógicos distintos a ℓprop y ℓℵ0 ℵ0 como por ejemplo: lógicas infinitarias, lógicas con cuantificadores generalizados, lógica de segundo orden, lógicas no clásicas, lógicas abstractas, etc. Y también se ofrecieron referencias de problemas abiertos en el contexto de la teorı́a de modelos abstracta relacionados con la propiedad de interpolación, como por ejemplo: ¿Existe una lógica abstracta ℓ que sea extensión propia de ℓℵ0 ℵ0 y que sea “razonable”?, donde se ha sugerido que para que una lógica sea “razonable” ella debe satisfacer compacidad numerable y ∆-interpolación, o al menos la propiedad de Beth. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 Dos teoremas de interpolación 41 Referencias [1] E. Amir. Interpolation theorems for Nonmonotonic Reasoning Systems. Appear in 8th European Conference on Logic in Artificial Intelligence (JELIA 2002). [2] A. Anderson y R. Belnap. Entailment. The Logic of relevance and necesity. Princeton University Press. 1975. [3] J. Bell. Infinitary Logic. Enciclopedia de Filosofı́a de la universidad de Stanford. 2016. https: //plato.stanford.edu/entries/logic-infinitary/ [4] E. Beth. On Padoa’s method in the theory of definition. Nederl. Akad. Wetensch. Proc. Ser. A. 56 = Indagationes Math., 15: 330-339. (1953). [5] J. van Benthem. Interpolation, Annotated Proofs, and Inference Across Models. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http: //math.stanford.edu/~feferman. [6] W. Craig. Linear reasoning. A new form the Herbrand-Gentzen theorem. The Journal of Symbolic Logic 22 (1957), n◦ 3, 250-268. [7] W. Craig. Three uses of the Herbrand-Gentzen theorem in relating model theory and proof theory. The Journal of Symbolic Logic 22 (1957), n◦ 3, 269-285. [8] C. Chang y H. Keisler. Model Theory. Dover Publications, Inc. New York. 2012. [9] C. Di Prisco. Introdución a la lógica Matemática. EMALCA AMAZONIA. 2009. [10] C. Di Prisco. Inmersiones elementales y grandes cardinales. Notas no publicadas. 1982. [11] H. Enderton. Una Introducción Matemática a la lógica. Universidad Nacional Autónoma de México. México. 2004. [12] H. Ebbinghaus y J. Flum y W. Thomas. Mathematical Logic. Springer-Verlag. New York. 1989. [13] S. Feferman. Harmonious Logic: Craig[U+0092]s Interpolation Theorem and its Descendants. Interpolations Conference in Honor o William Craig. Universidad de Stanford. 2007. http://math.stanford.edu/~feferman. [14] D. Gabbay y L. Maksimova. Interpolation and Definability: modal and Intuitionistic Logics. Clarendon Press. Oxford. 2005. [15] F. Galindo. Una presentación de la demostración directa del teorema de compacidad de la lógica de primer orden que usa el método de ultraproductos. UNA INVESTIGACI@CIÓN, Vol. VIII, N ◦ 15 (2016). [16] K. Gödel. Obras completas. Alianza. Madrid. 1981. [17] L . Henkin. The completeness of the firs-orden functional calculus. The Journal of Symbolic Logic 14 (1949), 159-166. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42 42 Franklin Galindo [18] L. Henkin. An extension of the Craig-Lyndon interpolation theorem. The Journal of Symbolic Logic 28 (1963), 201-216. [19] E. Hoogland. Definability and Interpolation. Model-Theoretic investigations. Institute for Logic, Language and Computation. Universiteit van Amsterdam. Promotor: Prof. dr. D. H. J. de Jongh. 2001. [20] G. Hughes y M. Cresswell. Introducción a la lógica modal. Tecnos. Madrid. 1973. [21] G. Hunter. Metalógica. Introducción a la metateorı́a de la lógica clásica de primer orden. Paraninfo. Madrid. 1981. [22] T. Jech. Set Theory. Springer. New York. 2000. [23] J. Makowsky. Model Theory in computer science: My Own Recurrent themes (and some lessons I learned). Faculty of Computer Science Technion-Israel Institute of Technology, Haifa, Israel. 2016. [24] M. Manzano. Teorı́a de modelos. Alianza. Madrid. 1989. [25] E. Mendelson. Introduction to Mathematical Logic. Chapman and Hall/CRL. U.S.A. 2009. [26] A. Nerode y R. Shore. Logic for Applications. Springer-Verlag. New York. 1993. [27] A. Robinson. A result on consistency and its application to the theory of definition. Nederl. Akad. Wetensch. Proc. Ser. A. 59 = Indag. Math., 18, 47-58. 1956. [28] H. Royden. Real Analysis. Pearson.2010. [29] S. Shapiro. Foundations without Foundationalism. A Caso for Second-order Logic. Clarendon Press. Oxford. 2002. [30] M. Sundström. A Pedagogical History of Compactness. The American Mathematical Monthly, Vol. 122, N 7, (August-September 2015), 619-635. [31] C. Tinelli. The Impact of Craig’s Interpolation Theorem in Computer Science. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http: //math.stanford.edu/~feferman. [32] J. Väänänen. The Interpolation Theorem in Abstract Model Theory. Interpolations Conference in Honor of William Craig. Universidad de Stanford. 2007. http://math.stanford. edu/~feferman. [33] J. Väänänen. Barwise: Abstract Model Theory and Generalized Quantifiers. The Bulletin Symbolic Logic. Volumen 10, Número 1, Marzo 2004. Divulgaciones Matemáticas Vol. 17, No. 2 (2016), pp. 15–42