Apostila 1 - Fundamentos de Linguistica Comparada
Apostila 1 - Fundamentos de Linguistica Comparada
Apostila 1 - Fundamentos de Linguistica Comparada
APOSTILA:
FUNDAMENTOS DE LINGUÍSTICA COMPARADA
PRESENCIAL
1
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 1
O QUE É LINGUÍSTICA COMPARADA?
Como você vê, uma brincadeira divertida com uma das frases que mais costumava
aparecer em livros tradicionais para ensino de línguas estrangeiras, sobretudo o inglês. As
oito línguas faziam parte do rol das habilitações ofertadas na Faculdade de Letras,
envolvendo, além das modernas, duas antigas (o latim e o grego clássico) e dois alfabetos
diferentes (o grego e o latino). No caso do grego, a transliteração para o alfabeto latino é:
Mas mesmo com essa diversidade, não era difícil entender que as frases correspondiam
umas às outras praticamente palavra por palavra. Antes de tudo, porque todas são línguas de
uma mesma família, a indo-europeia, representada na relação por três de suas dez
ramificações: o itálico (com o latim e as quatro línguas dele procedentes: francês, espanhol,
1A duração das vogais, quando for importante marcá-la, será indicada assim: (a) vogais longas: ā/ē/ī/ō/ū (o traço
horizontal sobre elas se chama macro); (b) vogais breve: ă/ĕ/ĭ/ŏ/ŭ (o símbolo sobre elas se chama braquia).
2
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 1
O livro está sobre a mesa
Português o livro está sobre a mesa
Inglês
Francês
Espanhol
Alemão
Grego
Italiano
Latim
Tendo constatado essas duas diferenças, apenas para que a correspondência no quadro
se faça palavra a palavra, anote a preposição su separada do artigo la, no caso do italiano, e
2Aos poucos você se acostumará com os símbolos que utilizaremos: B < A indica que a palavra B procede de A,
o que pode ser representado também assim, A > B. A ordem da procedência segue sempre a direção indicada
pela seta.
3
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
escreva os termos latinos na ordem dos demais, deixando em branco os espaços em que as
outras línguas apresentam artigos.
Agora observe na segunda coluna as palavras que designam ‘livro’. Não será difícil
constatar que elas se distribuem em três conjuntos, considerando-se sua semelhança: o
primeiro, com cinco termos; o segundo, com dois; e o terceiro, com apenas um. Organize-os:
QUADRO 2
Palavras para ‘livro’
1 livro
2
3
3Em alemão, todos os substantivos se escrevem com inicial maiúscula: Buch, Tisch etc.
4 As palavras marcadas com um asterisco não são documentadas, mas reconstituídas, pelo método comparativo.
Isso se faz sistematicamente nos estudos de linguística histórico-comparativa.
4
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 3
Palavras para ‘mesa’
mensam table Tisch trapézēi
Fica claro que as palavras do espanhol e do português, mesa, provêm do latim mensa.
Entretanto, também as palavras da segunda coluna têm uma origem latina: tabŭla
significa ‘tábua’, ‘tabuleiro’, estando na origem do italiano tavola e do francês table (o
português tem, da mesma origem, o termo tábua, assim como o espanhol, tabla; recorde-se
ainda que távola, com o significado de ‘mesa’, existe também em português, embora seja um
arcaísmo, fossilizado, por exemplo, na referência ao Rei Artur e “os cavaleiros da távola
redonda”).
O inglês table procede do francês, por empréstimo, como acontece com grande parte do
vocabulário daquela língua, em consequência do domínio normando, iniciado em 1066, sobre
as Ilhas Britânicas.
O caso do alemão também se deve a um longo processo de empréstimos: (a) o termo
original é o grego dískos, ‘disco, objeto circular’, ‘disco de arremesso’ (como continua a ser
usado nos jogos olímpicos); (b) o latim discus, ‘prato’, ‘travessa redonda’, constitui um
empréstimo da palavra grega citada; (c) o germânico tomou emprestado o termo latino,
*disku/diskuz, significando ‘prato’, ‘travessa’, ‘tábua de comida’, ‘bandeja’, ‘mesa’, donde
provém a palavra do antigo-alto-alemão tisk/tisc, ‘mesa’, ‘prato’, ‘travessa’, ‘trípode’,
‘bandeja’, origem do termo do médio-alto-alemão tisch, ‘mesa’, ‘mesa onde se come’ e do
alemão Tisch, ‘mesa’. É curioso que em alemão existe também uma outra palavra para ‘mesa’,
‘tábua’: Tafel, que procede do médio-alto-alemão tavele/tabele, por sua vez proveniente do
antigo-alto-alemão tavala/tabala, empréstimo do latim tabŭla. Veja como esses fatos linguísticos
sugerem que os germanos não possuíam uma palavra para ‘mesa’ e parecem ter tomado dos
romanos tanto o objeto, quanto sua denominação.
5 Acusativo é a forma que a palavra assume quando se encontra na função de objeto ou regida por certas
preposições. A forma da palavra quando está na função de sujeito se chama nominativo: liber
(nominativo)/librum (acusativo); mensa (nominativo)/mensam (acusativo).
5
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Enfim, o grego trápeza é uma abreviação de tetrapéza, isto é, ‘de quatro pés’, o que
remete para a forma da mesa.
***
Não continuaremos a explorar a origem dos demais termos de nossas oito frases, aos
quais teremos oportunidade de voltar nas lições seguintes. Uma vez que lidamos apenas com
línguas indo-europeias, tudo que fizemos até aqui teve uma perspectiva histórica. Esse será
um dos vetores de nosso curso, o qual abordaremos na primeira metade, ao tratarmos dos
primórdios da linguística comparada – que se deu com o estudo da família indo-europeia – e
das diferentes famílias linguísticas do mundo.
Outro método de comparação das línguas, que gera uma classificação diferente da
genética, é o da linguística tipológica ou tipologia linguística. Este será o assunto da segunda
metade do nosso curso, quando não mais nos interessarão as relações entre línguas de uma
mesma família, mas os traços gramaticais que sejam comuns a certas línguas.
Para adiantar essa forma de tratamento, continuando a utilizar a nossa frase padrão,
nas suas oito versões, observaremos agora três aspectos: (a) o uso de artigos; (b) a flexão
nominal; (c) o uso de preposições.
Você já observou que o latim não possui artigo definido, tanto que deixou em branco
os espaços do quadro 1 ocupados pelos artigos das demais línguas. Agora observe que esses
artigos, nas línguas que os possuem, têm uma ou mais formas, como se mostra no quadro
seguinte:
QUADRO 4
Línguas sem artigo/línguas com artigo definido
Língua sem artigo Línguas que possuem artigo definido
definido Forma única 2 formas 3 formas
(masculino/feminino) (masc./fem./neutro)
Latim Inglês: the Português: o/a Alemão: der/die/das
Espanhol: el/la Grego: ho/hē/tó
Italiano: il/la
Francês: le/la
Ora, o artigo definido é um termo gramatical, ou seja, que não tem significado lexical
(como têm livro e mesa), mas a função de indicar que aquilo de que se fala é conhecido (o que
6
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
se representa como “[+] determinado”)6. O fato de o inglês ter apenas uma forma para o
artigo definido não interfere nessa função. A única diferença com o português, o espanhol, o
italiano, o francês, o alemão e o grego é que, nestas línguas, o artigo concorda em gênero com
a palavra que determina.
Agora preste atenção: o latim está bem acompanhado, já que uma grande parte das
línguas do mundo não apresenta artigos – e mesmo uma boa parte das línguas indo-
europeias, como as eslavas e indo-iranianas. Assim, ‘o livro está sobre a mesa’ se diz, em
russo:
КНИГА НА СТОЛЕ.
Veja como encontramos mais um alfabeto, o cirílico, usado pelo russo e por outras
línguas eslavas. A frase acima, transliterada para o alfabeto latino, lê-se assim:
KNIGA NA STOLIE
livro sobre mesa
O livro está sobre a mesa.
Para tomarmos mais um exemplo, de uma língua não indo-europeia, vejamos como a
mesma frase se diz em turco, da família uralo-altaica (o turco utiliza o alfabeto latino):
6Nos exemplos, a presença de artigo determinado, independentemente de sua forma, será indicada pela sigla
DET.
7
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
função de sujeito (caso nominativo), objeto direto (acusativo), beneficiário da ação (dativo),
adjunto ou complemento circunstancial indicando ‘lugar onde’ (inessivo), ‘lugar para onde’
(alativo), ‘lugar de onde’ (ablativo) etc.
Na nossa frase padrão, como se trata de dizer que “o livro está sobre a mesa”, a palavra
que, em húngaro, significa ‘mesa’, asztal, receberá a terminação do caso supressivo (que
indica ‘lugar sobre’), assumindo então a forma asztal-on, ‘sobre a mesa’:
Como asztalon já significa ‘sobre mesa’, estando determinado pelo artigo az8 – o que faz
com que az asztalon signifique ‘sobre a mesa’ – não há necessidade de acrescentar uma
preposição para indicar ‘sobre’, como nos demais exemplos que vimos até agora.
Agora preste atenção: nas línguas indo-europeias que vimos, as românicas –
português, espanhol, francês e italiano – não conhecem flexão de caso e o inglês marca apenas
o genitivo, que expressa o possuidor; já o grego, o latim, o alemão e o russo, sim, como se
pode constatar abaixo:
Latim
Liber super mensa est.
livro-NOM sobre mesa-AC está.
Russo
Kniga na stolie.
livro-NOM sobre mesa-PREP
Grego
Tò biblíon epì têi trapézēi estí.
DET-NOM livro-NOM sobre DET-DAT mesa-DAT está.
7Aos poucos você se acostumará com as siglas que utilizaremos: SUP = supressivo.
8O artigo determinado do húngaro apresenta apenas uma forma (como acontece em inglês): a; se, contudo, ele
ocorre antes de palavras começadas com vogal, aparece como az. Repare no nosso exemplo: a könyv, ‘o livro’; az
asztal, ‘a mesa’.
8
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Alemão
Das Buch ist auf dem Tisch.
DET-NOM livro está sobre DET-DAT mesa.
Observe:
(a) O latim e o russo declinam cada um dos substantivos: ‘livro’, por ser sujeito das
orações, encontra-se no nominativo (que indicamos com a sigla NOM); ‘mesa’, como
complemento circunstancial de lugar, construído com as preposições que significam
‘sobre’, apresenta-se, em latim, no acusativo (AC), que nesta língua inclui o sentido de
locativo (‘lugar onde’), e, em russo, no prepositivo (PREP), que tem também a função
de expressar o locativo.
(b) O grego declina tanto os artigos quanto os substantivos, sendo que o locativo se
inclui no caso dativo (DAT).
(c) O alemão declina apenas os artigos, permanecendo os substantivos sem
modificação – também nesta língua o dativo (DAT) expressa o locativo.
O mais importante, contudo, é perceber como existe, nas quatro línguas, uma
sobrecarga de marcas. Ainda que haja declinação dos nomes e/ou dos artigos, usam-se
também preposições.
Uma razão para isso é que, nelas, os casos não são tão específicos quanto no húngaro,
em que a terminação -on indica apenas ‘lugar sobre onde’, havendo outros casos para o ‘lugar
onde’, ‘lugar para onde’ etc. De fato, em grego e alemão, o dativo serve tanto para indicar
‘lugar onde’, quanto o objeto indireto, dentre outras funções, o mesmo acúmulo de funções
variadas acontecendo com o acusativo latino e com o prepositivo do russo. É por isso que as
preposições se tornam indispensáveis e são elas que terminam por reger o caso dos nomes
com os quais constituem sintagmas.
De um certo modo, essa sobrecarga (preposição + declinação) tende a fazer com que a
declinação de artigos e nomes termine por desaparecer em muitas línguas, como ocorreu com
as românicas, que procedem do latim, e também com o inglês, que conservou, do germânico,
apenas um caso, o genitivo, para indicar o possuidor (Rose’s book, ‘livro da Rose’).
***
Última observação: você deve ter reparado quantas vezes o imperativo “observe” foi
repetido no que você acabou de ler. É que comparar exige isso: treinar a capacidade de
observar, para perceber as semelhanças e diferenças. Como nosso tema é a comparação
9
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
linguística, então nosso principal objetivo é desenvolver em você essa capacidade de observar
o que acontece nas línguas. Uma atitude muito importante para que se torne capaz de
observar também o que acontece na nossa própria língua, o português.
Nos textos seguintes, você tomará contato com muitas informações novas e aprenderá
umas tantas categorias linguísticas. É evidente que não se espera que você aprenda as tantas
línguas a que se fará referência, mas sim – o que é o mais importante – que tome as línguas e
a linguística como objeto de conhecimento e de reflexão. Afinal, o homem é um animal que
fala, logo, as línguas são um dos traços mais preciosos da condição humana.
Ponto para você que escolheu estudar Letras!
10
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(1) Por que é possível identificar tantas semelhanças entre as frases escritas nos sete
idiomas?
(2) Identifique os três grupos linguísticos em que o quadro pode ser dividido.
(3) Qual a origem do termo grego biblíon?
(4) Qual a origem dos termos book e Buch?
(5) E da palavra latina líber?
(6) Explique, resumidamente, a série de empréstimos que culminou no termo alemão
referente à mesa.
(7) Além do método histórico-comparativo, qual o outro critério utilizado para classificar
as línguas em grupos de semelhança?
(8) Em quais línguas, elencadas no quadro, o artigo concorda em gênero com a palavra
que determina?
(9) Cite quatro línguas indo-europeias em que se observa a marcação de caso.
(10) Por que existe uma sobrecarga de marcas nestas línguas? Explique.
11
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 2
ARQUEOLOGIAS
Tanto a diferença quanto a semelhança entre as línguas intrigou desde eras muito
antigas a humanidade. É bastante conhecido o episódio da Torre de Babel, através do qual o
narrador da Torah9, que escreve por volta do século VI a.C., busca dar uma explicação para a
diversidade linguística, nestes termos:
Todo mundo se servia de uma mesma língua e das mesmas palavras. Como os homens
emigrassem para o oriente, encontraram um vale na terra de Senaar e aí se estabeleceram. Disseram um
ao outro: Vamos! Façamos tijolos e cozamo-los ao fogo! O tijolo lhes serviu de pedra e o betume de
argamassa. Disseram: Vamos! Construamos uma cidade e uma torre cujo ápice penetre nos céus.
Façamo-nos um nome e não sejamos dispersos sobre a terra!
Ora, Iahweh desceu para ver a cidade e a torre que os homens tinham construído. E Iahweh
disse: Eis que todos constituem um só povo e falam uma só língua. Isso é o começo de suas iniciativas!
Agora, nenhum desígnio será irrealizável para eles. Vamos! Desçamos e confundamos (nablah) a sua
linguagem para que não mais se entendam uns aos outros. Iahweh os dispersou dali por toda a face da
terra, e eles cessaram de construir a cidade. Deu-se-lhe por isso o nome de Babel, pois foi lá que Iahweh
confundiu (balal) a linguagem de todos os habitantes da terra e foi lá que ele os dispersou sobre toda a
face da terra. (Gênesis, 11, 1-9. Tradução da Bíblia de Jerusalém, com modificações)
Além da maneira curiosa como a origem da diversidade é apresentada, nada mais que
punição pela insolência dos homens, e ainda que a existência de línguas diferentes seja
explicada por esse modo, supõe-se que a diversificação aconteceu de chofre, transformando
uma situação primitiva quando toda a humanidade falava uma única língua, ou, nas palavras
do Rabi Shlomó Yitzkhaki (Rashi, 1040-1105), quando possuía “o bem de ser um só povo com
uma só língua”. Não se esclarece, contudo, qual seria essa língua original nem há qualquer
traço de que pudesse ser a origem das demais. O que se deseja enfatizar é como a providência
tomada por Yahweh, confundindo a linguagem humana, teve o efeito esperado de imediato,
ou seja, cessar a construção da torre. Conforme comenta Rashi, na confusão que se instala de
9Torah é o nome original que se dá aos cinco primeiros livros da Bíblia judaica, chamados, em grego, Pentateuco.
O livro da Torah que, também a partir do grego, conhecemos como Gênesis, se chama, em hebraico, Bereshit, ou
seja, No princípio. No Oriente Médio, a partir da prática corrente na Mesopotâmia desde o segundo milênio a.C.,
era costume que as obras recebessem como título as palavras com que começavam. No caso do Gênesis: “No
princípio criou Deus o céu e a terra...”.
12
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
imediato, “um pede um tijolo e o outro lhe traz argila; o primeiro então se enfurece e quebra a
cabeça do outro” (YITZJAK, El Pentateuco, p. 43-44).
Quase um século após o relato da Torah, encontramos em Heródoto (séc. V a.C.) a
descrição da pesquisa levada a cabo por Psamético, faraó do Egito entre 664 e 610 a.C., o qual
desejava descobrir que língua e, em consequência, que povo seriam os mais antigos do
mundo:
Os egípcios, antes que Psamético os governasse, julgavam que eram anteriores (prótoi) a todos os
povos. Uma vez que Psamético, quando começou a reinar, quis saber quem seriam os primeiros,
disseram-lhe que se pensava que os frígios eram anteriores a eles, egípcios, e eles próprios aos demais
povos. Psamético, como não conhecia nenhum meio de descobrir quais seriam os primeiros homens,
elaborou este: deu duas crianças recém-nascidas de pessoas de baixa condição a um pastor, para que as
alimentasse entre os rebanhos, com o alimento ali usado, ordenando que ninguém, diante delas, emitisse
qualquer som (phonén); ele devia deixá-las numa cabana solitária e, nos momentos apropriados, levar
cabras até elas, dando-lhes leite – e observar o que aconteceria. Psamético fez e levou ao cabo isso por
querer ouvir das crianças, quando abandonassem os inarticulados gritos sem significado (asémon), qual a
primeira palavra (phonèn próten) que se poriam a falar. Completados dois anos, ao pastor que cumpria
sua tarefa, quando abria a porta e entrava, ambas as crianças, arrastando-se em sua direção, diziam
(ephóneon) “bekós”, estendendo as mãos. De início, ouvindo isso, ele ficou quieto, mas, como muitas
vezes, quando entrava e prestava atenção, essa era a palavra (épos), contou-o ao rei. Por ordem deste,
conduziu as crianças à sua presença. Tendo-o ouvido o próprio Psamético, informou-se sobre quais
dentre homens chamavam algo de “bekós”. Pesquisando, descobriu (heúriske) que os frígios assim
chamavam o pão. Desse modo, os egípcios aquiesceram, concluindo dessa experiência que os frígios
eram mais velhos (presbytérous) que eles. (Heródoto, Histórias 2, 2. Tradução de Brito Broca, com
modificações)
Ressalte-se que esse interesse em saber qual seria a língua primitiva da humanidade
não é inocente. Nesse tipo de pensamento, que podemos chamar de arqueológico, há três
perspectivas culturais entrelaçadas. Num sentido amplo e etimológico, arqueologia, palavra
composta com os termos gregos arkhé e lógos, constitui um discurso (lógos) sobre o princípio
(arkhé). Ora, arkhé cobre três esferas de significado: (a) a origem no tempo, um começo (como
em arqueolítico); (b) o ponto de partida de onde outras coisas procedem (como em arquétipo);
(c) o poder (como em arconte, monarquia, oligarquia etc.). Perguntar, portanto, sobre a origem
das línguas envolve os três campos: (a) qual a língua mais antiga? (b) qual a língua donde as
demais procedem? (c) qual a língua, que por ser o princípio das demais, exerce sobre elas seu
poder e confere poder a quem a conhece? Assim, escolher uma língua qualquer como a
original implica atribuir-lhe primazia, em termos de precedência, procedência e poder,
supondo-se que aqueles que a falam sejam o povo mais antigo ou descendam diretamente
dele, bem como são os detentores da linguagem natural, portanto mais perfeita, de que todas
as demais não são mais que devedoras.
Que o assunto manteve seu interesse comprova o fato de que, mais de dois milênios
depois, Frederico II, rei do Reino das duas Sicílias e imperador do Sacro Império Romano-
Germânico, repetiu, mais de uma vez, a experiência de Psamético, com desfechos fatais:
13
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
[Frederico II] quis experimentar qual língua e idioma teriam as crianças, chegando à
adolescência, sem terem jamais podido falar com ninguém. E por isso ordenou às amas de leite e às
nutrizes que dessem leite aos infantes (...), com a proibição de falar-lhes. Com efeito, queria saber se
falariam o hebraico, que foi a primeira língua, ou talvez o grego, ou o latim, ou o árabe; ou se não
falariam sempre a língua dos próprios genitores de quem tinham nascido. Mas cansou-se sem resultado,
porque as crianças ou infantes morriam todos. (Salimbene da Parma, Cronaca, n. 1664, apud ECO, 2002, p.
5).
Nesse contexto, há mais um pressuposto importante: o de “língua natural”. As crianças
falariam a língua primordial da humanidade (supostamente o hebraico) ou de parcela dela (o
grego, o latim ou o árabe, idiomas igualmente antigos) – ou se expressariam na língua
materna, ainda que tivessem sido separados das respectivas mães, estando, portanto,
impedidos de aprender a falar como todas as crianças? Noutros termos: a língua é inata ou
aprendida? Dizendo com mais precisão: é natural ou cultural?
Essa última questão já tinha sido discutida por Platão no Crátilo (séc. IV a.C.) e foi
enfrentada marginalmente pelo desconhecido autor dos Discursos duplos (Dissoì lógoi), obra
provavelmente escrita no século V a.C. Pela simplicidade como se resolve nesta última obra,
mostra-se como é possível encontrar uma resposta sem a necessidade de apelar para
experimentos crueis como os de Psamético e Frederico II. O problema que se coloca é se é
possível alguém ensinar e aprender. Para solucioná-lo, apela-se para o que se chama de
“experiência mental”: dada uma determinada situação, o rigor de análise levará à alternativa
correta. Assim, declara o autor:
Se alguém, quando ainda criancinha, fosse mandado para a Pérsia e lá fosse criado, não ouvindo
jamais a língua da Grécia, falaria persa; se alguém de lá fosse trazido para cá, falaria grego. (Dissoì lógoi,
6, 12)
Portanto, a língua é um dado não da natureza, mas da cultura, e as palavras podem ser
ensinadas e aprendidas, uma vez que a criança esteja exposta a determinados contextos,
independentemente de sua origem familiar ou étnica.
Observe-se como, nos exemplos citados, há reis dentre aqueles que se preocupam em
desvendar qual seria a língua originária da humanidade, o que nos garante a relação entre
conhecimento da origem e poder. Não se pense que se trata de uma perspectiva que se perde
nas brumas do passado, bastando recordar como o nazismo se apropriou de descobertas no
campo da linguística indo-europeia para justificar desmandos e atrocidades, criando o mito
da superioridade da raça ariana e de sua pureza (cf. BLIKSTEIN, 1992). Conclusão: trabalhar
com a linguagem e as línguas não é algo inócuo ou mera curiosidade, como se poderia
pensar.
14
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Em geral, a exegese rabínica concordará que aquela “só e mesma língua” utilizada
pelos homens no princípio era o hebraico (segundo Rashi, a “língua santa”), ponto de vista
adotado também pela quase totalidade dos hermeneutas cristãos antigos e medievais.
Ainda no início da era moderna insistem na mesma tecla, dentre outros, Guillaume
Postel (1510-1581) e Claude Duret (1570-1611) – atitude ridicularizada pelo filósofo judeu-
holandês Gottfried Leibniz (1646-1716), o qual afirmava que “na suposição de que o hebraico
foi a língua original da humanidade há tanta verdade quanto na afirmação do holandês
Goropius (...) de que a língua que se falava no Paraíso era justamente o holandês”
(NIKOLSKI; JAKOWLEW, 1947, p. 21-22).
A referência de Leibniz é a Goropius Becanus (Jan van Gorp, 1519-1572), modelo de
um conjunto mais amplos de autores que defendiam outras candidatas ao posto de língua
originária (cada qual puxando a brasa para a própria sardinha): assim, o poeta sueco George
Stiernhielm (1598-1672) pretendia que o gótico (ou antigo nórdico) fosse a origem de todas as
línguas, assim como os países nórdicos seriam a vagina gentium, lugar onde se originou a
humanidade; já o médico irlandês James Parsons (1705-1770) opinava que o gaélico era a
língua mais próxima da primitiva; e mesmo o filósofo Johann Gottlieb Fichte (1762-1814)
defendia que o melhor candidato a língua originária (Ursprache) seria o alemão, em vista de
sua “pureza”. Outros optaram por soluções mais diversificadas: para um, “Adão falava
basco; para outro, ao contrário, Adão e Eva utilizavam o persa, a serpente, que os seduziu, o
árabe, e o Arcanjo Gabriel, o turco” (NIKOLSKI; JAKOWLEW, 1947, p. 21-22).
Umberto Eco resume bem os meandros de toda essa pendenga, em que se encontra
envolvida a ideia de que a língua original seria também a língua perfeita, o que só comprova
como nada se faz por simples curiosidade:
Na sua versão mais antiga, a busca da língua perfeita assume a forma da hipótese monogenética,
ou seja, da derivação de todas as línguas de uma única língua-mãe. (...) Os Padres da Igreja, de Orígenes
a Agostinho, haviam assumido como um dado incontestável que o hebraico tinha sido, antes da
confusão, a língua primordial da humanidade. A exceção mais importante fora a de Gregório de Nissa
(Contra Eunomium), que sustentara que Deus não falava hebraico e ironizava a imagem de um Deus-
professor ensinando o alfabeto a nossos pais. (...) Mas a idéia do hebraico como língua divina sobrevive
ao longo de toda Idade Média. Entre os séculos XVI e XVII, não basta mais sustentar que o hebraico era a
protolíngua (...): então interessa promover seu estudo e, se possível, sua difusão.
Um lugar particular na história do renascimento do hebraico cabe à figura de erudito utopista
que foi Guillaume Postel (1510-1581). (...) No De originibus seu de Hebraicae linguae et gentis antiquitate
(1538), afirma ele que a língua hebraica provém da descendência de Noé e que dela derivaram o árabe, o
caldeu, o índico e, só medianamente, o grego. (...)
Claude Duret, em 1613, publica um monumental Trésor de l’histoire des langues de cet univers (...).
Já que Duret mantém a idéia de que o hebraico foi a língua universal do gênero humano, é óbvio que o
15
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
nome hebraico dos animais contém em si toda sua “história natural”. Assim, “a águia chama-se nesher,
nome que concorda com shor e isachar, que significam olhar e estar ereto, porque este pássaro tem, mais
que todos, a vista firme e sempre levantada para o sol”. (...)
Mas se Duret fazia etimologia regressiva, para mostrar como a língua-mãe estava em harmonia
com as coisas, outros farão etimologia progressiva, para mostrar como do hebraico derivaram todas as
outras línguas. Em 1606, Estienne Guichard escreve L’harmonie étymologique des langues, onde demonstra
como todas as línguas existentes podem ser reconduzidas a raízes hebraicas. Partindo da afirmação de
que o hebraico é a língua mais simples porque nele “todas as palavras são simples e sua substância
consiste de apenas três radicais”, elabora um critério que lhe permite jogar com esses radicais por
inversões, anagramas, permutações, segundo a melhor tradição cabalística. Batar em hebraico significa
“dividir”. Como se justifica que de batar tenha provindo, em latim, dividere? Por inversão se produz
tarab, de tarab se chega ao latim tribus, e então a distribuo – e a dividere (...). Zaqen significa “velho”;
transpondo-se os radicais, tem-se zaneq, donde senex em latim; e com uma sucessiva permutação de
letras tem-se cazen, donde em osco casnar, de que derivaria o latino canus, que significa justamente
“ancião” (...).
O século XVII oferece-nos exemplos saborosos de nacionalismos linguísticos (...). Goropius
Becanus (Jan van Gorp), em Origines Antwerpianae (1569), sustenta todas as teses correntes sobre a
inspiração divina da língua primitiva, sobre a relação entre palavras e coisas, e encontra essa relação
exemplarmente presente no holandês, ou melhor, no dialeto de Antuérpia. Os antepassados dos
habitantes de Antuérpia, os címbrios, descendem diretamente dos filhos de Jafé, que não se achavam
presentes junto da Torre de Babel, escapando assim da confusio linguarum. Conservaram, portanto, a
língua adâmica, o que se prova através de claras etimologias (...) e pelo fato de que o holandês tem o
maior número de palavras monossilábicas, supera todas as outras línguas em riqueza de sons e oferece
excepcionais possibilidades para a geração de palavras compostas. (...)
Ao lado da tese holandesa-flamenga não falta a tese “sueca”, com George Stiernhielm (De
linguarum origine praefatio, 1671). (...)
Quanto ao alemão, várias e repetidas suspeitas sobre seu direito de primogenitura agitam-se no
mundo germânico desde o século XIV, em seguida ao pensamento de Lutero (para o qual o alemão é a
língua que mais que todas aproxima de Deus), enquanto, em 1533, Konrad Pelicanus (Commentaria
bibliorum) mostra as evidentes analogias entre alemão e hebraico. (ECO, 2002, p. 83-109)
Enfim, toda essa discussão chegou a tal paroxismo que acabou inteligentemente
parodiada pelo filósofo e filólogo sueco Andreas Kempe (1622-1689): em seu panfleto satírico
As línguas do Paraíso (Die Sprachen des Paradises, de 1688), seu protagonista, Simon Simplex
(um Simão simplório qualquer), estabelece que Deus se dirigia a Adão em sueco e este lhe
respondia em dinamarquês – enquanto a serpente falava com Eva em francês, já que esta, “a
língua tradicional da sedução, ‘mexe com o corpo todo de tal modo que até a pessoa mais
sábia pode ser por ela iludida’” (apud OSTLER, 2003, p. 1).
Apenas no final do século XVIII e princípios do XIX que o tipo de especulação acima
apresentado foi sendo substituído pela ideia de que as línguas do mundo se dividem em
diferentes famílias, cujo estabelecimento depende de um paciente trabalho de comparação.
16
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Esse trabalho iniciou-se no âmbito das línguas indo-europeias, num processo paulatino, mas
contínuo, marco da fundação da linguística moderna, que abordaremos no capítulo seguinte.
Isso não implica, todavia, que a pergunta sobre a origem – não tanto das línguas, mas
da linguagem humana – se tenha tornado improcedente. Com efeito, se toda humanidade
tem como característica utilizar-se de línguas como forma de comunicação, isso implica que
há, na linguagem humana, um conjunto de categorias universais relacionadas com
determinados processos cognitivos, os quais têm recebido cada vez mais a atenção dos
linguistas, com enfoques variados.
A diferença com relação às interpretações anteriormente expostas está:
(a) no estabelecimento de que a língua é um dado de cultura, não da natureza, não
havendo, portanto, línguas ou palavras “naturais”;
(b) no abandono da ideia de que as línguas do mundo possam provir de alguma das
línguas conhecidas, uma vez que qualquer língua se encontra em processo de
constante mutação;
(c) na admissão de que é possível, através da comparação, retroceder a estágios
anteriores das línguas conhecidas, reconstituindo em parte as protolínguas donde uma
determinada família procede;
(d) finalmente, na constatação de que, a partir da diversidade de línguas e da
compreensão de como elas funcionam e se modificam, se podem deduzir certos
parâmetros relativos à linguagem humana.
Embora tenha sido abandonada por muito tempo e continue recebendo críticas, a
hipótese de que as línguas do mundo tenham uma origem comum voltou a ser considerada
seriamente por linguistas como Joseph Greenberg e Merritt Ruhlen, tendo em vista,
sobretudo, o avanço do conhecimento relativo às macrofamílias linguísticas, aliado às
conquistas da arqueologia, que estuda os dados da cultura material, e, mais recentemente,
também da biologia, que vem trabalhando, com bons resultados, no mapeamento do genoma
humano. Se o homo sapiens sapiens tem uma origem comum – que tudo leva a crer se encontra
no continente africano –, é razoável supor que também as várias línguas possam ter uma
única origem. Evidentemente, não se poderá jamais saber como seria esse sistema linguístico
primeiro, a não ser em termos muito gerais, ou seja, naquilo em que todas as línguas
coincidem:
(a) a arbitrariedade do signo linguístico;
(b) o uso de categorias linguísticas compatíveis com os processos cognitivos através
dos quais o homem apreende o mundo e com ele se relaciona;
(c) o caráter social da linguagem humana enquanto meio de comunicação;
(d) o fato de que a língua se encontra em constante processo de variação e mudança.
17
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
LEITURA COMPLEMENTAR
(KELLER, 1994, p. 19-22)
A história de Chico
Era uma vez um grupo de homens-macaco. Os homens-macaco eram seres que haviam
acabado de ultrapassar o estágio de símios, mas não tinham ainda atingido um ponto em que
se poderia dizer que eram simplesmente humanos, porque não tinham eles uma linguagem.
Todavia, esses homens-macaco tinham a sua disposição, exatamente como seus parentes mais
próximos, gorilas e chimpanzés, um rico repertório de expressões sonoras. Os mais coléricos
batiam a boca e rosnavam quando estavam irados; os vaidosos batiam no peito e rugiam
quando queriam exibir-se. Eles batiam os dentes quando se divertiam, ronronavam quando se
sentiam confortáveis e emitiam gritos que rompiam os ouvidos quando ansiosos.
Todas essas manifestações estavam longe de ser signos linguísticos. Não serviam para
a comunicação, como hoje a entendemos, mas eram, ao invés disso, a expressão natural de
eventos internos: sintomas da vida emocional, comparáveis ao suor, ao frio, ao riso, às
lágrimas ou ao rubor. Alguém não comunica suas emoções por meio desses fenômenos, mas,
em certas condições, pode revelar algo sobre as mesmas. É que os sintomas podem causar
efeitos similares aos dos signos linguísticos.
Um dos integrantes do grupo era um homem-macaco que a natureza pusera em
desvantagem: pequeno, mais fraco que os outros e ansioso ao máximo. Podemos chamá-lo de
Chico.
Sendo fraco, Chico era muitas vezes forçado, desde a infância, a ser um tanto mais
esperto que os outros. Ele tinha de compensar sua falta de força corpórea e seu baixo status
social, sob o risco de ficar completamente dominado pelos demais. Em especial, os membros
mais fortes do grupo afastavam-no regularmente da comida, não deixando que ficasse perto
dos bocados mais suculentos. Mas, sendo ágil e esperto, Chico conseguia ultrapassar alguns
desses obstáculos.
18
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Um dia aconteceu algo que teria uma imensa importância para o futuro de toda raça
dos homens-macaco. O grupo estava pacificamente amontoado em volta da comida,
consumindo a presa capturada naquele dia. Como sempre, havia algumas pequenas brigas e
empurrões ocasionais. Chico foi de novo empurrado para a borda exterior, onde descobriu
um par de olhos no meio da vegetação rasteira – os olhos de um tigre! Seus olhos encontram-
se com os do animal... Morrendo de medo, ele grita aterrorizado. O grupo dispersa
instantaneamente. Cada qual trata de encontrar abrigo na árvore mais próxima, porque tal
grito era sinal de enorme perigo. Estavam todos condicionados, desde a infância, a reagir
assim.
Chico ficou parado lá, como se congelado. Estar tão perto de morrer o havia tornado
incapaz de fugir. Todavia, para seu grande espanto, os olhos piscavam para ele, de um modo
nada parecido com o que faz um tigre, e seu proprietário foi-se embora irritado. O que ele
havia visto como olhos de tigre pertencia a nada mais que um pacato porco. Chico tinha sido
vítima de sua vívida imaginação, alimentada por sua natural ansiedade.
Mas “vítima” é a palavra correta neste caso?
Quando Chico olhou em volta, desconcertado, desamparado e um pouco
envergonhado, viu que estava completamente sozinho, junto com a comida deixada para trás
pelos outros. A expressão de medo em seu rosto deu lugar a um firme e travesso sorriso. Ele
quase não podia acreditar.
Na medida em que passavam os dias e as semanas – e que, a cada vez, a disputa pelas
melhores partes de alimento tinha lugar – ele era tentado a fazer intencionalmente o que lhe
havia acontecido por acidente. O que Chico não podia imaginar é que essa tentação marcava
o fim do paraíso da comunicação natural.
O que tinha de acontecer finalmente aconteceu. Como sempre, ele tinha de ficar
observando como aqueles grandalhões cabeludos repartiam as melhores partes entre si,
enquanto ele, faminto, se sentava perto, tomado por uma raiva impotente. Foi então que
sucumbiu à tentação. Deu o grito de angústia e, de novo, o grupo dispersou-se em matéria de
segundos, incluindo os repugnantes grandalhões.
A melhor parte da comida ficara ali, montes de comida. Na sua agitação, Chico, na
verdade, nem pôde saboreá-la (talvez sua má consciência o impedisse). Mas o primeiro
degrau tinha sido galgado e Chico achou muito mais fácil da próxima vez. Com o tempo,
tornou-se quase impiedoso. Achava prazer em executar seu truque e começou mesmo a
abusar.
Como era inevitável, logo alguém suspeitou dele. Quando Chico foi bobo o suficiente
para gritar pela segunda vez durante uma mesma tarde, um outro macaco parou, depois de
poucos saltos, olhou para trás e começou a devorar a comida. Chico ficou um pouco irritado,
mas não se incomodou, pois havia comida suficiente para ambos. Mas logo o cúmplice
começou também a usar do expediente que aprendera e, como Chico, a exagerar.
O número daqueles que não se deixavam enganar pela mentira – e, finalmente, o
número de imitadores – tomou dimensões inflacionárias. A comunidade entrou num período
extremamente crítico. Cada qual suspeitava dos demais. Os grandalhões tentaram restaurar a
19
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
antiga ordem, penalizando todo abuso do grito de prevenção. Mas um conhecimento, uma
vez adquirido, não pode ser jamais erradicado. Pelo contrário, era reforçado por todo novo
abuso e toda tentativa de penalizar quem dele utilizava.
O abuso permanente do grito de prevenção representava um perigo para a existência
física de todo o grupo, uma vez que a crença cega nele era necessária para a sobrevivência.
Mas essa época havia definitivamente acabado. Os que quisessem sobreviver nesses tempos
de corrupção tinham de ter bons ouvidos. Tinham de aprender a diferenciar o grito genuíno
do fingido, algo que não se mostrou difícil para muitos deles. (...)
A história de Chico não pretende ser realista, mas diz algo sobre a realidade. Ela
mostra como a transição da comunicação natural para a humana poderia ter acontecido. Não
se trata de uma reconstrução histórica, mas filosófica. Não são os fatos, mas apenas os dados
lógicos da história que devem estar corretos, a saber:
1. As etapas que conduzem do grito natural de angústia ao ato intencional parecem
plausíveis. A passagem de um ao outro não deve ter apresentado nem furos, nem
saltos.
2. As pressuposições relativas às habilidades dos homens-macaco parecem ser
realistas. A história seria sem valor caso se atribuísse a Chico uma alta (e irrealista)
capacidade intelectual.
EXERCÍCIO
20
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
21
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 3
O MÉTODO HISTÓRICO-COMPARATIVO
1 A descoberta do indo-europeu
22
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 1
Comparação de termos gregos e latinos
Significado Grego Latim
campo agrós ager
porco hûs sus
boi boûs bos
touro taûros taurus
ovelha óis ouis
23
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
em tantos outros tratava-se de produzir obras com finalidades bastante pragmáticas. Mas foi
a uma parte das línguas da Índia, aquelas pertencentes ao grupo indo-europeu, em especial
ao sânscrito, que caberia um papel decisivo, por permitir comparações cada vez mais
detalhadas com uma parte das línguas da Europa.
Já em 1583, numa carta que permaneceu inédita até o século XX, o jesuíta inglês
Thomas Stephens (1549-1619) dava notícia da existência de paralelos entre o concâni, o grego
e o latim. Dois anos mais tarde, em 1585, o mercador florentino Filippo Sassetti (1540-1588),
que viveu algum tempo em Goa e estudou sânscrito, chamou a atenção para a
correspondência entre esta língua e o italiano, como, por exemplo, nas palavras abaixo:
QUADRO 2
Comparação de termos italianos e sânscritos
Significado Italiano Sânscrito
sete sette sapta
nove nove nava
deus dio devah
serpente serpe sarpah
A língua sânscrita, seja qual for a sua antiguidade, tem uma estrutura admirável; mais perfeita
que o grego, mais copiosa que o latim e mais elegantemente refinada que cada um deles, ainda que
mantenha com ambos, seja nas raízes dos verbos, seja nas formas gramaticais, uma afinidade mais forte
do que seria possível produzir-se por acidente – deveras tão forte que nenhum filólogo poderia
examinar todas as três sem crer que tenham advindo de alguma fonte comum, a qual talvez não exista
mais há muito tempo; há uma razão similar, embora não absolutamente tão impositiva, para supor que
também o gótico e o celta, embora mesclados com um idioma bastante diferente, tenham a mesma
origem que o sânscrito; e o antigo persa deveria ser adicionado à mesma família, se houvesse ocasião
para discutir alguma questão relativa às antiguidades da Pérsia. (JONES, 2009, p. 19-34)
Ainda que com toda essa concisão, na verdade a declaração de Jones teve como mérito:
(a) ressaltar a proximidade entre sânscrito, grego, latim, germânico, celta e persa (ou seja,
representantes de cinco dos dez grupos de línguas indo-europeias hoje admitidos); (b) não
imaginar que uma das línguas conhecidas fosse a origem das demais, mas postular que
deveriam elas provir de uma fonte comum (some common source) talvez não mais existente
(which, perhaps, no longer exists); (c) isso posto, atribuir as afinidades ou parentesco (affinity) ao
fato de que todas essas línguas deveriam pertencer a uma mesma família (the same family).
Mais que tudo, observe-se, no uso dos condicionais e dos advérbios, que não se trata de
formular postulados, mas de levantar hipóteses cuja comprovação dependeria de outros
estudos. Como observa Blikstein, tendo em vista os antecedentes acima expostos,
na verdade, as semelhanças entre o sânscrito e as línguas europeias já tinham sido percebidas bem antes
do séc. XIX. Ocorre, no entanto, que a história das ideias e do pensamento não é linear; ao contrário, ela é
descontínua e, no dizer do eminente linguista romeno Eugenio Coseriu (...), a história da ciência
linguística é “cheia de ocos, a tal ponto que, reiteradamente, as mesmas coisas voltam a ser
‘redescobertas’”. (BLIKSTEIN, 1992, p. 105)
O passo seguinte da “redescoberta” será dado pelo livro de Schlegel já referido, mas o
mais importante foi a publicação, em 1816, do estudo do alemão Franz Bopp (1791-1867) Über
das Conjugationssystem der Sanskritsprache in Vergleichung mit jener der griechischen, lateinischen,
persischen, und germanischen Sprache (Sobre o sistema de conjugação da língua sânscrita em
comparação com o das línguas grega, latina, persa e germânica). O estudo de um sistema, neste
caso o verbal, revelou-se um argumento mais poderoso para fundamentar a hipótese de uma
origem comum que a simples comparação lexical. Estava, portanto, criado o método
comparativo, cujo pressuposto de partida é que
entre elementos de línguas aparentadas existem correspondências sistemáticas (e não apenas aleatórias)
em termos de estrutura gramatical, correspondências estas passíveis de serem estabelecidas por meio
duma cuidadosa comparação. Com isso, podemos não só explicitar o parentesco entre línguas (isto é,
dizer se uma língua pertence ou não a uma determinada família), como também determinar, por
inferência, características da língua ascendente comum de um certo conjunto de línguas. (FARACO,
2005, p. 134).
Na sequência, entre 1833 e 1852, o próprio Bopp estendeu a comparação ao lituano,
eslavo, armênio, celta e albanês, abrangendo, assim, todos os grupos indo-europeus então
conhecidos (ainda não tinham sido decifrados nem o hitita nem o tocário). Paralelamente, já
25
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
em 1818 havia aparecido o trabalho do dinamarquês Ramus Rask (1787-1832), em que eram
comparadas as línguas nórdicas com as demais línguas germânicas, o grego, o latim, o
lituano, o eslavo e o armênio, o que só confirmava a validade de se considerar que todos eles
integravam uma mesma família.
Você mesmo poderá observar, nos exemplos abaixo, o quanto essa hipótese é plausível.
Vamos examinar os nomes de parentesco, um grupo de palavras que tende a ser bastante
conservador. O quadro 3 apresenta quatro línguas antigas e não mais faladas (avéstico,
sânscrito, grego clássico e latim) e quatro línguas modernas e faladas hoje em dia (irlandês,
alemão, inglês e russo).
QUADRO 3
Nomes de parentesco nas línguas indo-europeias
Sentido Avéstico Sânscrito Grego Latim Irlandês Alemão Inglês Russo
mãe matár- matar méter mater máthair Mutter mother mati
pai pitár- pitar patér pater athair Vater father otiets
irmão bhrátar- bratar- adelphós frater bráthair Bruder brother brat
filha duhitár- dugədar- thugáter filia iníon Tochter daughter dotsiernii
irmã svásar- x aŋhar-
v adelphé soror siúr Schwester sister siestra
filho sunuh hunuš huiós filius mac Sohn son syn
A primeira constatação é que nem todas as palavras no quadro têm a mesma origem,
algumas línguas tendo procedido a substituição do termo que seria comum. Contudo, a
grande maioria conserva denominações muito próximas. Para descobrir quais vêm de um
étimo comum, faça assim:
a) Antes de tudo, tenha em vista os fonemas que têm alguma proximidade e procure
observar se há alguma regularidade nas correspondências entre eles: as oclusivas
dentais t/th/d/dh; as oclusivas velares k/kh/g/gh e a fricativa h, que pode derivar das
suas formas aspiradas; as oclusivas labiais ‘p/ph/b/bh’ e as fricativas que podem
derivar de suas formas aspiradas, ou seja, f/v; finalmente, as fricativas s/x e a
aspirada que pode derivar da primeira, h.
b) Agora comece por ‘mãe’, que apresenta semelhanças bastante regulares em todas as
línguas: você constatará que todos os termos são compostos de duas sílabas (a
primeira -ma/me/mo/mu-, seguida de -tar/thair/ter/ther/ti), o que sugere que todas
devem proceder do mesmo étimo, reconstituído inicialmente como *māter;
c) Passe em seguida para ‘pai’, em que a mesma terminação se repete, ocorrendo na
primeira sílaba as variações pa/pi/fa/va- (que podem ser explicadas considerando o
referido no item ‘a’ acima), a forma do irlandês apresentando a seguinte evolução:
*pa- > pha- > ha- > a-; em conclusão, a fonte de todos os termos (com exceção da
26
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
palavra russa, que tem origem diferente) foi reconstituída tradicionalmente como
*pater.
d) Em ‘irmão’ você perceberá que o grego apresenta uma palavra de origem diferente,
podendo todas as demais ser explicadas a partir do que você já conhece, o étimo
tendo sido primeiramente reconstituído como *bhrater.
e) Os termos correspondentes a ‘filha’ apresentam a mesma formação que os demais
(com o sufixo *-ter), podendo as diferenças ser explicadas a partir do que você já
conhece; o étimo comum foi em princípio reconstituído como *dhughter, as exceções
ficando por conta do latim, do irlandês e, parcialmente, do russo (o antigo eslavo
eclesiástico apresenta a forma dušti).
f) Com relação a ‘irmã’, a exceção se deve de novo ao grego, as demais palavras
podendo ser aproximadas e sua origem tendo sido reconstituída de início como
*swesor (no latim, a mudança s > r é normal em certos contextos).
g) Finalmente, para ‘filho’ as exceções se constatam no latim e no irlandês, para os
demais termos tendo sido proposto inicialmente o étimo *sunu-.
Todas essas reconstituições representam tentativas iniciais que mais tarde conhecerão
outras propostas de restabelecimento, na medida em que se diferenciem as formas como se
desenha o sistema fonológico do indo-europeu. Em especial, o vocalismo apresentava
problemas que só aos poucos foram esclarecidos. Mas alguns elementos se impõem de
imediato, como o uso de *-ter para marcar uma parte desses nomes de parentesco, o que leva
a supor que se trate de um sufixo (cuja produtividade parece ter sido estendida, no germânico
e no russo, além dos quatro primeiros nomes do quadro, abrangendo também o relativo a
‘filha’).
De qualquer modo, é evidente que a semelhança entre tantos termos com os mesmos
significados não se poderia dever a mero acaso – ou seja, o único modo de buscar uma
explicação razoável é apelar para a hipótese de uma origem comum de todas essas línguas.
27
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 4
Lei de Grimm
desvozeada > aspirada aspirada > vozeada vozeada > desvozeada
i.e. *trei- i.e. *bhrater i.e. *dwo-
latim tres gótico: threis sânsc.: bhratar- gótico: brothar latim: duo gótico: twa
grego treis inglês: three latim: frater inglês: brother grego: duo inglês: two
28
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 5
O grupo inicial pl- em latim e em línguas românicas
português espanhol francês italiano latim
chão llano plain piano planu-
cheio lleno plein pieno plēnu-
Acontece que, com relação a um dos casos, o do verbo ‘chover’, a previsão se aplicava
perfeitamente com relação ao grupo consonantal inicial, mas observava-se um problema no
final da palavra:
QUADRO 6
Chover
português espanhol francês italiano latim
chover llover pleuvoir piovere *plouēre
29
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Com o correr dos anos, outros grupos de línguas indo-europeias foram também objeto
de estudos específicos – como as eslavas, as celtas, as indo-iranianas etc –, o que terminou por
fornecer aos estudos histórico-comparativos uma boa base de dados empíricos, indispensável
para testar sua metodologia.
Uma das consequências mais importantes dos estudos comparados das línguas indo-
europeias foi ter induzido a teorizações sobre a língua e a linguagem, fundando a linguística
moderna.
É dos passos desse percurso que você encontrará um apanhado no texto complementar
que você lerá a seguir.
30
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
LEITURA COMPLEMENTAR
Rita D’Avino
Introduzione a un corso di storia comparata delle lingue classiche, 1997, p. 3-17
10É sabido que a Aristóteles remonta a individuação das categorias gramaticais, a divisão tradicional das partes
do discurso, a terminologia; que estoicos e peripatéticos constituíram aquele complexo de doutrinas gramaticais
que, assimiladas e elaboradas pelos latinos formaram a ars grammatica antiga e medieval, da qual depende a
reflexão gramatical até o surgimento da linguística moderna; que os alexandrinos estudaram e descreveram nas
suas específicas qualidades dialetais os textos literários)
31
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(hebraica, grega e latina) da Bíblia (ainda que com intentos teológicos) chegam à noção de
“gênio da língua”; até Bacon, Locke, seguido pelos outros empiristas ingleses, a Leibniz e,
independentemente, a Giambattista Vico, cuja voz isolada se opõe ao racionalismo, que
imperava na cultura do seu tempo, com o De causis linguae latinae de Giulio Cesare Scaligero e
a Minerva de Francesco Sanzio: a estes ele repreendeu por procederem “como se os povos que
encontraram as línguas tivessem antes de ter andado a escola de Aristóteles, com cujos
princípios ambos raciocinavam”. Em particular, a novidade revolucionária de Vico – com o
reconhecimento que o signo linguístico nasce como fato intuitivo e fantástico, e não como
qualificação racional do real – foi uma afirmação explícita e consciente da historicidade do
fato linguístico (as línguas mudam por intervenção de momentos poéticos no tecido dos
“falares convencionais”). Todavia, quase dois séculos após esta concepção pode se afirmar
sobre o plano dos estudos linguísticos, em que múltiplas observações e intuições, às vezes
felizes, desde a Idade Média, mas especialmente nos séculos XVI, XVII e XVIII, com sensível
progresso nesse último, surgiram do confronto e da tentativa de agrupamento dos materiais
linguísticos, afirmando-se, exatamente, quando os tempos foram culturalmente maduros para
exprimi-los e torna-los produtivos.
Concorreu para isso, sem dúvida, a impostação cultural mencionada, na qual, com
novo interesse se observou a história de cada um dos povos, o gosto tipicamente romântico. É
pelo gosto por tudo o que é exótico ou primitivo, ou de qualquer modo distante no tempo e
no espaço que se deve a ressonância de um livro como o de Friedrich Schlegel, Über die
Weisheit und Sprache der Indiers (1808). A comparação com o antigo indiano é o momento
iniciador da linguística como ciência. Schlegel nota a afinidade do sânscrito com o latim, o
grego, o germânico, o persa nos seguintes termos: “a afinidade reside não só no grande
número de raízes que ele (o sânscrito) tem em comum com essas línguas, mas se estende
também à estrutura mais interna e à gramática. A concordância, portanto, não é casual e tal
que se possa explicar por misturas, é concordância substancial, que evoca uma origem
comum”.
Primeira fase
Em 1816, a publicação do texto de Franz Bopp sobre a conjugação (Über das
Conigationssystem der Sanskritsprache, in Vergleichung mit jenem der griechischen, lateinischen
persischen und germanischen Sprache) assinala, tradicionalmente, a data de início da linguística
histórica. Isso não por um seu particular valor intrínseco, mas porque a partir dessa obra se
movem os primeiros passos da comparação como ciência, sobre a qual a linguística histórica
tem o seu fundamento metodológico.
A referência ao valor intrínseco deve-se ao fato de que, realmente, o interesse que
move a análise comparativa de Bopp é ainda o de remontar a um estado primitivo, originário,
no qual as formas gramaticais se deixam analisar em elementos inexplicáveis em si e não o
propriamente histórico, de reconstruir, mediante a comparação das formas documentadas,
um precedente estado linguístico comum. Meillet diz que ele ainda é um homem do século
XVIII, que pretende remontar à explicação originária dos fatos, dos quais a ciência, por ele
32
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
O momento naturalista
As obras de Bopp, de Hask e de Grimm representam a primeira fase na história dessa
ciência, em que se vê de um lado a afirmação da instância comparativa e de outro a formação
do interesse pelas modalidades do desenvolvimento fonético, que representam os elementos
essenciais para o surgimento do estudo diacrônico das línguas. Todavia, deve-se destacar,
quando se fala em linguística histórica como pesquisa sobre a evolução das línguas, que uma
diferença profunda separa a linguística do séc. XIX e a do século XX no modo de
compreender a natureza dessa evolução.
A noção de «forma orgânica» dos primeiros tempos do romantismo – as línguas como
realizações da espiritualidade individual dos povos – passa, próximo ao fim do século, àquela
de “organismo natural”, regulado por leis próprias, como todo outro dado da natureza: a
gramática é, conseqüentemente, a «doutrina da vida da língua», que se desenvolve segundo
33
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
leis análogas às que regulam o mundo físico. O Compendium der vergleischenden Grammatik der
indogermanischen Sprache (1861), de August Schleicher, constitui a aplicação de tais princípios
fundados sobre a concepção hegeliana da história como realização de liberdade consciente,
mas essa liberdade não pode ser encontrada na língua, que é por isso objeto de uma
sistematização análoga à das ciências naturais (é significativo que Schleicher fosse também
botânico e naturalista). Essa obra representa também a primeira organização de uma doutrina
linguística indo-europeia, como reconstrução de um estado linguístico não documentado,
através da comparação de estados linguísticos historicamente atestados que apresentam
correspondências evidentes. Tais correspondências, por ser o resultado de evoluções que
podem se percorrer no seu desenvolvimento, permitem que se remonte à uma “língua mãe”,
que representa o tronco do qual se ramificam os diversos grupos (Stammbaum-theorie: teoria
da “árvore-genealógica”). Dessa fase originária, concebida como algo puro e perfeito (note-se
a persistência de certas posições iluministas, as quais sobrevivem também, em âmbito teórico,
nas concepções de W. Humboldt) move o desenvolvimento diferenciado, visto como
«decadência», o qual se verifica, exatamente, segundo determinadas leis naturais.
A idade neogramática
Do conceito de língua como organismo natural, passa-se logicamente ao axioma da
validade absoluta das leis fonéticas: é este o axioma que, defendido pela orientação positivista
da cultura, domina no último quarto do século XIX. A escola dos neogramáticos (Scherer,
Leskien, Osthoff, Brugmann, Delbrück etc) funda a partir dele o entusiasmo com que atua
sobre a enorme quantidade de material oferecido pelas diversas filologias, atingindo a
sistematização rigorosa do fonetismo indo-europeu que, por sua vez, reforça, com a
qualidade dos resultados, a confiança nos seus princípios. Entretanto, diante do aspecto
concreto dessa problemática propriamente linguística, adquire-se definitivamente, ainda que
não ainda de modo perfeitamente consciente, o sentido da perspectiva histórica. Assim, já em
1875, não aparecem mais em nenhuma publicação, as ingênuas tentativas glotogônicas de
tipo boppiano (a redação de fábulas na língua reconstruída), nem se pensa mais no indo-
europeu como uma língua perfeita, colocada na origem do desenvolvimento linguístico.
Além disso, aparece a exigência de se observar de perto os fatos, ou seja, de se basear não
mais na língua escrita, mas sim na observação direta da língua falada (tal já era o valor
essencial da gramática lituana de Schleicher). Enfim, a fé na lei comporta o reconhecimento
da existência de anomalias e, por mais que se atribua a sua causa a um fator «analógico»
entendido também em modo absolutamente mecânico, todavia o fato de mais se admitir,
como era frequente em época anterior, a possibilidade de uma mudança «esporádica», ou
seja, sem uma causa, passa a dirigir a atenção exatamente sobre essas inegáveis exceções e,
portanto, a fazer que se revelasse logo a insuficiência de um princípio tão genérico e
impreciso, como é o da “analogia” dos neogramáticos.
34
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
A instância estruturalista
Contra um método desse tipo, baseado em uma posição teórica manifestadamente
unilateral, como aquele que na língua resultava em afirmar apenas a liberdade e a
criatividade subjetiva, deixando de lado completamente o aspecto objetivo que é a condição
de tal atividade, o movimento estruturalista se configura como uma reação natural,
manifestando, pelo menos na sua fase inicial, um extremismo semelhante, mas em direção
oposta.
Uma dialética desse tipo se deve, indubitavelmente, à singular recepção das doutrinas
de Ferdinand de Saussure, mesmo se favorecida por certas circunstâncias, como a formulação
ainda provisória de tais doutrinas e, por outro lado, a publicação póstuma em forma de um
tratado orgânico (o Cours de linguistique générale, publicado em 1916, preparado pelos alunos
35
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Bailly e Sechehaye) a qual ainda não tinham atingido, e pela qual teria sido indispensável o
esforço de síntese de quem o tinha criado.
Entre os velhos e os novos tempos, cheio de iniciativas inovadoras, mas consciente das
conquistas já alcançadas pela linguística e com pleno domínio do método rigoroso dos
neogramáticos, F. de Saussure representa a marca que distingue a linguística do século XX. A
sua obra representou uma enérgica chamada à objetividade sincrônica da língua, mas está
fora de discussão que nela se encontram também as premissas, teóricas e metodológicas, de
um método histórico produtivo e autêntico.
Para Saussure, a sistematicidade e o formalismo caracterizam a língua, enquanto objeto
de consideração científica (a determinação do objeto específico da ciência linguística é o
objetivo constante da sua reflexão, o motivo de fundo da sua problemática): “... partout et
toujours ce même équilibre complèxe de termes que se conditionnent réciproquement.
Autrement dit, la langue est une forme et non une substance”11 (Cours..., p. 169). Ou seja, a
língua é o patrimônio coletivo de formas fônicas, “significantes”, univocamente combinadas
com os relativos «significados». Esse patrimônio de signos é organizado em «sistema», na
medida em que cada um desses signos deve a sua existência ao fato de entrar em certas
relações com os outros. A funcionalidade do sistema, isto é, o que o torna um instrumento
apto a funcionar em cada ato de «palavra», é constituída exatamente pelas oposições e
correlações intercorrentes entre cada elemento, os quais resultam individuados pelas suas
relações diferenciais no conjunto dos elementos similares, mais que pelas suas características
positivas: “dans la langue il n´y a que des differences”12 (ib., 166). Porém, não é menos
saussuriana a afirmação da interdependência e, portanto, da substancial indivisibilidade da
“palavra” e da “língua”, essa considerada o produto e o instrumento daquela, assim como a
programação de uma linguística da palavra ao lado de uma da língua.
Na verdade, a enérgica chamada de Saussure à objetividade do sistema, em relação à
subjetividade do falante – a quem deu destaque o caráter incompleto da sua obra de
sistematização teórica, exatamente em relação à “palavra” – resolveu-se, em conexão, com a
polêmica anti-idealista, na definitiva dicotomia sincrônico-diacrônica, operada pelo
Estruturalismo.
Nascido, desde o manifesto da escola de Praga, com a precisa e declarada finalidade de
uma “linguística sincrônica”, esse direcionamento se demonstrou imediatamente empenhado
em dar conta das mudanças no próprio ato que criava a noção de equilíbrio estrutural, pronto
para se restabelecer automaticamente cada vez que um “fator externo” colocava em crise a
harmonia do sistema. Uma posição em que, por “sistema” se entendia racionalistamente – e,
portanto, arbitrariamente – se a língua é uma forma da atividade cognoscitiva integral e não
só de um seu momento, como racional a abstração das relações diferenciais intercorrentes
entre as unidades de uma dada língua. Por elemento “extra-funcional” cada entidade que não
pode ser enquadrada na organização simétrica dessas relações, arbitrariamente identificada
11 Tradução: ...em todo lugar e sempre esse mesmo equilíbrio complexo dos termos que se condicionam
reciprocamente. Dito de outra forma, a língua é uma forma e não uma substância.
12 Tradução: na língua há tão somente diferenças.
36
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
com a estrutura da língua e por «fator externo» todo elemento não identificável com a
exigência, automaticamente ativa no sistema, de distinção das unidades.
Colocadas essas premissas, o Estruturalismo procurou dar também ao problema da
inovação uma resposta estrutural, nitidamente distinta das oferecidas pela linguística
histórica: segundo o princípio que a «imanência» do método científico requer que se encontre
as razões de todos os fenômenos linguísticos, incluindo, pois, a mudança, no interior do
sistema linguístico. A insuficiência teórica do princípio metodológico torna-se evidente
quando se pensa que o sistema funciona nos atos linguísticos individuais dos falantes, de
modo que a palavra, com as suas exigências subjetivas e as suas realizações criativas,
representa o impulso contínuo da dinâmica do próprio sistema.
É mérito inegável do Estruturalismo ter definitivamente chamado a atenção para o fato
que, para atingir a essência do fenômeno linguístico, é indispensável considerar as unidades
relativas também nas mútuas relações que intercorrem entre elas. Mas é também verdadeiro
que identificar a exigência imanentista com a abstração do sistema de funções da realidade
concreta que a atua, condena a perder de vista o objeto da pesquisa, ou seja, as línguas nas
suas fisionomias individuais: a experiência da «glossemática», ou a do Estruturalismo
americano, pelo menos nas suas partes mais avançadas, oferecem uma confirmação precisa
dessas afirmações.
13 Mesmo se mediante o trâmite sociológico que em plena idade estruturalista reaparece, não por acaso, no
conceito de “norma” de Coseriu.
14 Tradução: língua nela mesma e por ela mesma.
37
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
EXERCÍCIO
38
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(1) Qual fato pode ser considerado o mais determinante para a fundação da Lingüística
Comparada?
(2) Qual a principal obra responsável pela difusão do conhecimento do sânscrito na
Europa? Quem foi seu autor?
(3) Por que a aproximação dos europeus desta língua causou tanto impacto nos estudos
comparativos? Cite, ao menos, três fatores que expliquem esse impacto.
(4) Qual a explicação, dada na Antiguidade, para as semelhanças e proximidades
gramaticais entre o latim e o grego?
(5) Quando os estudos comparativos avançaram para além da comparação superficial
entre línguas, encetada na Antiguidade?
(6) Em que ocasião o estudo da lingüística indo-européia começou a estruturar-se nos
moldes de uma disciplina moderna? Qual hipótese impeliu os acadêmicos nesta nova
direção de estudo?
(7) Quais os méritos da declaração de Jones sobre o sânscrito?
(8) Em que consistiram os estudos do linguista dinamarquês Rasmus Rask?
(9) Qual a contribuição ou a influência do estudo de Franz Bopp, publicado em 1816, sobre
o campo dos estudos comparativos?
(10) Qual a diferença da Deustche Grammatik, de Jacob Grimm, em relação às obras de
seus antecessores?
(11) Explique, sinteticamente, o funcionamento da chamada Lei de Grimm.
(12) Qual o marco de criação da Filologia Românica?
(13) Qual a relevância do Satiricon de Petrônio para a compreensão da evolução
histórica da língua latina?
39
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 4
A RECONSTRUÇÃO DO INDO-EUROPEU
Vamos retomar a família indo-europeia para seguir alguns dos passos a partir dos
quais se reconstitui uma protolíngua. Há três razões principais para essa escolha: (a) como
você já sabe, trata-se de uma família bastante estudada desde o século XIX, de cuja
protolíngua não temos nenhum registro escrito, o que faz com que seu conhecimento
dependa inteiramente da aplicação do método comparativo; (b) é nessa família que se
encontra o português, o que ajuda a compreender, em termos diacrônicos, algumas de suas
categorias gramaticais; (c) da comparação do proto-indo-europeu com as línguas indo-
europeias percebe-se como a mudança linguística se processa sem pressupostos teleológicos.
A reconstituição de uma protolíngua não documentada tem como primeiro requisito a
possibilidade de, comparativamente, a partir de um conjunto de línguas que se pretenda dela
sejam derivadas, estabelecer o que define uma língua, a saber: (a) um léxico; (b) um sistema
fonológico; (c) um sistema de morfológico; (d) padrões sintáticos. Atenção: como as línguas
encontram-se em processo constante de variação e mudança, não se trata de estabelecer essas
categorias para todo o conjunto, mas de deduzir do conjunto quais seriam os traços que se
encontrariam na protolíngua reconstituída, capazes de explicar os resultados observáveis nas
diferentes línguas dela procedentes.
Um segundo requisito é que a protolíngua deve ser tipologicamente viável. Como
veremos adiante, existem alguns padrões linguísticos (o que se denomina “tipos
linguísticos”), deduzidos da observação e comparação das línguas existentes. Por exemplo,
recordando algo a que já se fez referência: nem todas as línguas apresentam artigos, mas, se
uma língua tem apenas um tipo de artigo, este será o definido. Noutros termos, de uma
perspectiva diacrônica: tudo parece indicar que, quando se criam artigos, primeiro se cria o
definido e apenas depois, se for o caso, o indefinido. Nesse sentido, caso se reconstitua uma
língua que possua apenas artigos indefinidos isso representará, em princípio, uma
dificuldade tipológica que põe em suspeição a própria reconstituição.
Na sequência, vamos abordar alguns dos passos da reconstituição do indo-europeu,
enfatizando o que diz respeito às principais categorias morfológicas nominais e verbais, pois,
40
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
como você verá, seu conhecimento ajuda a entender as categorias de número, gênero, caso,
aspecto, tempo e modo nas línguas indo-europeias modernas, incluindo o português.
QUADRO 1
Quadro comparativo
I II III IV V VI VII VIII IX
1 cem cent ciento hundert centum sută cento yüz cent
2 oito huit ocho acht octo opt otto sekiz vuit
3 noite nuit noche Nacht nocte(m) noapte notte gece nit
4 filha fille hija Tochter filia fiică figlia kiz filla
5 folha feuille hoja Blatt folia foaie foglia yaprak fulla
6 figo figue higo Feige ficu(m) smochin fico incer figa
7 saber savoir saber wissen sapĕre şti sapere bilmek saber
8 vida vie vida Leben uita viaţă vita hayat vida
9 orelha oreille oreja Ohr auricula ureche orecchia kulak orella
10 velha vieille vieja alte uetŭla veche vecchia yaşli vella
português
15Algumas observações sobre algumas convenções ortográficas: 1. na coluna VI, a letra ‘ă’ grafa o fonema /ə/, semelhante
ao ‘e’ do inglês father, ‘ş’ representa o fonema /∫/, equivalente ao ‘ch’ do português, e ‘ţ’ o fonema /ts/; na coluna
VIII, ‘ş’ representa /∫/ e ‘ğ’ não grafa um fonema específico, apenas alongando a vogal que o precede.
41
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 2
Evolução da sequência -ct- nas línguas românicas
-ct- > -it-
-ct- > -ch-
-ct- > -tt-
-ct- > -pt-
e) Preste atenção agora com o que acontece com o ‘f’ inicial latino e nas linhas 4, 5 e 6:
ele se conserva em todas as línguas, com exceção de uma. Qual? Trata-se de uma
mudança que se debita ao substrato (ou seja, à língua falada numa determinada região
antes da implantação de outra): neste caso, o substrato basco, que não só não é uma
língua latina, mas nem mesmo indo-europeia. A substituição do /f/ inicial por uma
aspiração (/h/) registra-se lentamente a partir do século IX, na zona ao norte de Burgos,
e só se impõe literariamente no século XV, diferenciando, assim, o espanhol de todas as
outras línguas românicas (ELIA, 1979, p. 94-96).
(f) Ainda nas linhas 4 e 5, verifique a evolução da sequência latina -li-vogal:
considerando que os dígrafos -lh- (português), -ll- (catalão) e -gl- (italiano) representam
o mesmo fonema /λ/, que línguas mais se afastaram do latim?
(g) Nas linhas 6, 7 e 8, observe a evolução das consoantes desvozeadas intervocálicas, a
saber, /k/, /p/ e /t/ e você constatará que as línguas se organizam de um modo bastante
regular: as que mantém a consoante latina; as que a mudam para a correspondente
vozeada; uma língua que muda a vozeada para a correspondente fricativa (/p/ > /b/ >
/v/) ou elimina completamente a consoante (o romeno, nas linhas 6 e 7, adotou outros
42
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
termos, por isso não é representativo das mudanças fonéticas). Feita essas observações,
você constatará que as línguas da Península Ibérica vozeiam regularmente as
desvozeadas (o fenômeno chamado de “sonorização das surdas intervocálicas”, que
costuma ser atribuído ao substrato celta), sendo provável que o francês também tenha
conhecido esse estágio, antes de chegar às formas atuais (podendo-se, portanto, dizer
que se trata de tendência característica da România ocidental); por outro lado, o
italiano e o romeno tendem a manter as desvozeadas intervocálicas do latim (o que
seria um fenômeno típico da România oriental).
(h) Enfim, nas linhas 9 e 10 você encontra dois fenômenos semelhantes: na linha 9, a
palavra latina para ‘orelha’, auris, é substituída por seu diminutivo, auricŭla, que, por
ser proparoxítona, muda para *auricla. No Apendix Probi, uma lista de formas incorretas
do latim feita por um autor anônimo provavelmente do século III d.C., temos um
importante testemunho sobre a forma dessa palavra no latim da época, já que ele anota
“auris non oricla”. Do mesmo modo, o diminutivo de uetus, ‘velho’, é uetŭlus, sendo este
último que dá origem a *vetlus donde procede veclus, outra palavra registrada no
Apendix Probi: “vetulus non veclus.” Portanto, o ponto de partida das palavras
apresentadas nas linhas 9 e 10 encontra-se nas formas vulgares oricla e vecla. Agora
observe o tratamento do encontro consonantal -cl- e veja como as línguas se distribuem
entre as duas partes da România já referidas, a ocidental e a oriental (o espanhol
apresenta mais uma mudança própria: -ll- > -j-).
No caso das línguas românicas, temos a situação ideal de contarmos com registros da
língua de origem, ao lado das derivadas. Isso, todavia não seria suficiente, se não se
pudessem entender os fenômenos de mudança fonética, que, saliente-se, não são uma camisa-
de-força, pois interferem no processo também fatores de ordem pragmática e cultural.
2 A reconstituição do indo-europeu
Evidentemente, quando a tarefa é reconstituir uma língua de que não se tem nenhuma
documentação e que teria sido falada, provavelmente, há sete mil anos, tudo se torna mais
difícil, embora não seja impossível.
No quadro abaixo, vamos fazer o mesmo exercício de comparação:
43
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 3
Quadro comparativo
1 2 3 4 5 6 7 8
noite dois três cinco pé coração que/quem* português
I noctis duo tres quinque pedis cordis quid
II nuktós dúo treîs pénta podós kardía tí
III night two three five foot heart what
IV oíche dhá trí cúig cos chroí cad
V gaua bi hiru bost oinez bihotza zer
VI notsh dva tri piat fut sierdtsie kto*
VII nakti dvau trayah pañca pad hŗdaya kás*
VIII éjszaka ket három öt láb szív mi
IX naktis du trys penki pėda širdis kas*
X natt tva tre fem fot hjärta vad
Faça assim:
(a) Comece pelas colunas 1, 2 e 3, com as palavras para ‘noite’, ‘dois’ e ‘três’ e verifique
quais as duas línguas que não apresentam semelhanças com as demais (a primeira é
o basco, a outra, o húngaro, nesta ordem – anote na última coluna). Agora confira
se a mesma tendência se repete nas outras colunas (se necessário, corrija sua opção
anterior).
(b) Agora observe que, na coluna 2, a maior parte das palavras para ‘dois’ começam
com a dental vozeada /d/, havendo apenas duas que apresentam a correspondente
desvozeada /t/; nas coluna 3 e 4, onde a maior parte tem a labial desvozeada /p/, nas
mesmas duas encontramos /f/; na coluna 6, as mesmas duas línguas têm a aspirada
/h/ onde outras trazem a velar desvozeada /k/ ou a sibilante /s/. Fazendo isso, você
identificou a chamada “rotação germânica” e as duas línguas germânicas do
quadro, a saber, o inglês e o sueco (escreva os dois nomes).
(c) Na mesma coluna, observe agora a distribuição entre /k/ e /s/, as que apresentam a
última solução sendo, pela ordem, o russo e o lituano (escreva os nomes).
(d) Na última coluna, você tem um exemplo de outra distribuição: onde a língua I tem
uma labiovelar /kw/, as demais línguas apresentam três alternativas: /k/, /w/ ou /t/.
Compare agora com o tratamento da última sílaba da coluna IV e você descobrirá
que as línguas 1 e 2 mantiveram a correlação /kw/ ≈ /t/, sendo a primeira o latim e a
segunda o grego (não se esqueça de anotar os nomes).
44
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(e) Para completar as informações, agora anote as demais línguas do quadro, que são,
pela ordem, o irlandês e o sânscrito.
É assim que se trabalha comparativamente, caminhando passo a passo e estabelecendo
tendências. A partir disso é que se fazem as propostas de reconstituição do sistema fonológico
do indo-europeu e dos diferentes ramos de sua família.
Todavia, uma vez verificada a semelhança no nível meramente lexical, é preciso
avançar pelo estudo das categorias gramaticais, pois é isso que dá consistência ao modelo.
Vamos então prosseguir.
QUADRO 4
Exemplos de singular/plural/dual enquanto categorias gramaticais
Singular Plural Dual
Português esta fruta está madura. estas frutas estão maduras. x
Francês ce fruit est mûr. ces fruits sont mûrs. x
Inglês this fruit is ripe. these fruits are ripe. x
Sânscrito etat phalam pakvam. etāni phalāni pakvāni. ete phale pakve.
Grego ho karpòs hoûtos hóriós esti. hoi karpoì hoûtoi hórioí eisi. tō karpō toútō horiō estón.
Observe:
45
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(a) Nos três primeiros exemplos (português, francês e inglês) há dois números
(singular/plural), enquanto nos dois últimos (sânscrito/grego) encontramos três
(singular/plural/dual);
(b) Em português e francês tanto o demonstrativo (esta/ce x estas/ces), quanto o verbo
(está/est x estão/sont) e o predicativo (madura/mûr x maduras/mûrs) concordam em
número com o sujeito (fruta/fruit x frutas/fuits);
(c) No inglês, o demonstrativo (this/these) e o verbo (is/are) também apresentam
concordância de número com o sujeito (fuit/fruits), mas não o predicativo (ripe), já
que o adjetivo nesta língua é invariável;
(d) O sânscrito dispensa o verbo de ligação (etat phalam pakvam = esta fruta madura), o
demonstrativo (etat/etāni/ete, ‘este/estes/estes dois’) e o predicativo
(pakvam/pakvāni/pakve) concordando em número com o sujeito (phalam/phalāni/phale,
‘fruto/frutos/dois frutos’).
(e) Em grego, todos os elementos da oração realizam a concordância de número, a
saber: o artigo (ho/hoi/tō, ‘o/os/os dois’), o demonstrativo (hoûtos/hoûto/toútō, ‘este,
estes, estes dois’), o predicativo (hórios/hórioi/horiō) e o verbo (estí/eisí/estón, ‘ele
é/eles são/eles dois são’).
Naturalmente, o que se diz no dual em sânscrito e grego pode-se dizer também em
português, francês e inglês com o acréscimo do numeral ‘dois’ (estas duas frutas estão
maduras/ces deux fruits sont mûrs/these two fruits are ripe), mas então não se trata de número
gramatical, a concordância fazendo-se no plural, uma vez que não existe a oposição entre
plural e dual. Acrescente-se que em grego sempre se pode usar o plural no lugar do dual,
tendo este último número um uso bastante retrito, de modo que tō karpō toútō horiō estón
(dual) equivale a hoi dúo karpoì hoûtoi hórioí eisi (plural, sendo dúo o numeral ‘dois’). No grego
comum (koiné), já no fim da Antiguidade, bem como no grego moderno, o dual não existe
mais.
Nas línguas indo-europeias, o dual apresenta-se em algumas das línguas de que
dispomos de registros que remontam à Antiguidade – como, além do sânscrito e do grego,
também no avéstico, no gótico e no antigo eslavo eclesiástico –, não se registrando, contudo,
em outras igualmente antigas, como o latim e o hitita. Manteve-se ainda nos registros mais
arcaicos do islandês e conserva-se, ainda hoje, no esloveno (lipa/lipe/lipi, ‘tília/tílias/duas
tílias’). O fato de que se encontre atestado em diversos grupos (indo-iraniano, grego,
germânico e eslavo) leva a supor que tenha sido gramaticalizado em fase bastante remota do
indo-europeu, embora posterior à separação do grupo anatólio, uma vez que nas línguas
desse grupo não há qualquer traço do dual. Ressalte-se que em latim encontramos
reminiscência do dual no termo ambō, ‘ambos’.
46
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 5
A categoria de número no proto-indo-europeu
Plural
Singular (mais de um)
(apenas um) Dual Plural
(pares) (mais de dois)
47
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
grego a um sem número de outras línguas passou a designar ‘a Bíblia’ enquanto o conjunto
de livros sagrados de judeus e cristãos.
Em termos gerais, a categoria de gênero pode ser considerada gramatical quando, além
da eventual existência de afixos que o expressam (no plano morfológico), exerce ele um papel
na concordância nominal ou verbal (função sintática). Seria mais correto, portanto, considerá-
la como uma “classe de concordância”, a exemplo do que você já viu com relação às línguas
nigero-congolesas, dentre as quais o quimbundo. Como nas línguas indo-europeias o verbo
concorda com o sujeito apenas em número e pessoa, o gênero gramatical tem sua função
restrita à concordância nominal.
Nas línguas indo-europeias historicamente atestadas, encontramos cinco situações:
1. Línguas que não conhecem nenhuma distinção de gênero, como o persa moderno, o
tadjique, o assamês (todas do grupo iraniano), o bengali (grupo índico) e o armênio
(língua isolada);
2. Línguas que fazem duas distinções de gênero, podendo ser eles:
2.1. comum e neutro, como no hitita (grupo anatólio), no dinamarquês, no
holandês, e no sueco (todas estas do grupo germânico);
2.2. animado e inanimado, que é o caso do bretão (grupo celta);
2.3.masculino e feminino, como no letão (grupo báltico), no hindi, no români
(grupo índico), no pachto (grupo iraniano) e na maior parte das línguas
românicas (grupo itálico), a saber, galego, português, espanhol, catalão,
francês e italiano;
3. Línguas que admitem três distinções de gênero – masculino, feminino e neutro –, a
exemplo do avéstico (grupo iraniano), do sânscrito (grupo índico), do búlgaro
(grupo eslavo), do islandês, do inglês, do alemão (grupo germânico), do latim, do
romeno (grupo itálico) e do grego (língua isolada);
4. Línguas que admitem quatro distinções de gênero – a saber, masculino animado,
masculino inanimado, feminino e neutro –, como o russo, o tcheco, o eslovaco, o
croata, o sérvio, o bósnio e o montenegrino (todas do grupo eslavo);
5. Uma língua, o polonês (grupo eslavo), com cinco distinções de gênero – masculino
pessoal, masculino animado não-pessoal, masculino inanimado, feminino e neutro.
48
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
A partir dessa relação pode-se concluir: (a) não existe uma distribuição coerente entre
os diferentes critérios e os grupos linguísticos, a não ser com relação aos itens 4 e 5, já que se
trata de desdobramentos próprios das línguas eslavas (mas observe-se que o búlgaro se
encontra no item 3); (b) há duas ordens de motivação semântica envolvidas nas diferentes
combinações, a saber, a oposição animado/inanimado e a oposição masculino/feminino.
Parece que é essa existência de duas ordens de critérios de base diversos que torna a categoria
de gênero um fato complexo no grupo indo-europeu, o que se poderia representar assim:
QUADRO 6
Combinações dos critérios animado/inanimado e masculino/feminino no gênero gramatical das línguas indo-
europeias
Animado (ou Comum) Inanimado (ou Neutro)
Masculino Feminino
Animado Inanimado
Pessoal Não-pessoal
49
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 7
O gênero dos adjetivos em grego e latim
Grego Latim
Gênero masculino feminino neutro masculino feminino neutro
Triformes agathós, ‘bom’ agathē agathón bonus, ‘bom’ bona bonum
Biformes alethēs, ‘verdadeiro’ alethĕs brevis, ‘breve’ breve
QUADRO 8
O gênero dos adjetivos em português, espanhol, francês e italiano
Português Espanhol Italiano
Gênero Masc. Fem. Masc. Fem. Masc. Fem.
Biformes bom boa bueno buena buono buona
Uniformes breve breve breve
50
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 9
Critérios semânticos da classificação em animado/inanimado
Animado Inanimado
Humanos + -
Animais + -
Árvores + -
Astros + -
Filhotes - +
Frutos - +
Objetos - +
QUADRO 10
Distribuição entre masculinos/femininos e neutros que remontam à distinção animado/inanimado
Termos Língua Animados Inanimados Critério
Masculino Feminino Neutro predominante
Pai/mãe/bebê Grego patēr mētēr téknon Progenitores x
Alemão Vater Mutter Kind gerado
Figueira/figo Grego sukē sûkon
Pereira/pera Latim pirus pirum Árvore
Macieira/maçã Latim malus malum x
Russo iablonia iabloko fruto
Grego mēlís mēlon
51
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 11
Gêneros de elementos da natureza em latim, grego e alemão
Elemento da Línguas Animados Inanimados
natureza Masculino Feminino Neutro
Ceu Latim Caelus caelum
Grego ouranós
Alemão Himmel
Sol Latim sol
Grego hélios
Alemão Sonne
Lua Latim luna
Grego selēnē
Alemão Mond
Estrela Latim stella
Grego astēr
Alemão Stern
Terra Latim terra
Grego gē
Alemão Erde
Fogo Latim ignis
Grego pûr
Alemão Feuer
Água Latim aqua
Grego húdor
Alemão Wasser
Mar Latim mare
Grego póntos thálassa pélagos
Alemão See
Rio Latim flumen
Grego potamós
Alemão Fluß
Repare como até o elemento ‘terra’ não há, com a exceção do latim, ocorrência de
palavras do gênero neutro. O caso do latim é emblemático: caelum, neutro, designa o ceu
enquanto a calota sobre a terra, enquanto Caelus, masculino, o Ceu personificado como um
52
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
deus. Essa seria uma explicação para a concentração dos nomes relativos ao ceu, aos corpos
celestes e à terra no masculino ou feminino, uma vez que eles são considerados entidades
vivas, logo, do gênero animado. Quando se trata dos elementos naturais terrestres – fogo,
água, mar e rio – o número de ocorrências no neutro cresce, havendo mesmo a possibilidade,
como no caso das palavras que em grego nomeiam o mar, de contar-se com termos dos três
gêneros. Todos esses exemplos ilustram como a sucessão dos dois critérios de distinção de
gênero fez com que essa categoria, de um ponto de vista sincrônico, nas diferentes línguas e
provavelmente já na fase mais recente do indo-europeu, passasse a ser em grande parte
imotivada semanticamente, mantendo apenas a função de classe de concordância.
Há contudo uma motivação de ordem gramatical que é preciso ainda considerar.
Como já se disse, a categoria de gênero organiza o léxico das línguas que a possuem. Essa
organização, pelo menos em princípio, parece que estabelecia, no indo-europeu, restrições
quanto às relações entre substantivos e verbos, a saber: a) os nomes animados poderiam
ocorrer como sujeitos de verbos ativos, como ‘correr’, ‘destruir’, ‘comer’, ‘beber’, ‘morrer’,
‘falar’, ‘matar’, ‘crescer’; b) os nomes inanimados não poderiam exercer a função de sujeitos
de verbos ativos, mas apenas de verbos que semanticamente denotassem ações ou estados
compatíveis com sujeitos inativos (cf. GRAMKRELIDZE; IVANOV, 1995, p. 239).
Tomemos como exemplo o seguinte enunciado:
I II III
sujeito (agente) verbo (ativo) objeto (inativo)
o homem rola a pedra.
Existe um rol de termos que podem ocupar a posição I (como mulher, animal,
tempestade, vento etc.), mas não são todos os itens lexicais que podem fazê-lo: ‘a pedra rola o
homem’ seria, por exemplo, um enunciado sem sentido. Em princípio, as palavras que
poderiam ocupar a posição I são as que pertenceriam à classe dos animados (ou ativos), não
podendo fazê-lo os nomes inanimados (ou inativos). Assim se entende por que o conceito de
animado não se restringe a seres que, da nossa perspectiva, têm vida ou se movem, pois
seriam perfeitamente coerentes enunciados como:
I II III
sujeito (agente) verbo (ativo) objeto (inativo)
o ceu fecunda a terra.
a terra produz a árvore.
a árvore gera o fruto.
53
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Ainda que se trate de poesia, em que se trabalha com um registro figurado, o poeta fala
de uma experiência de mundo em que terra, sol, lua, mar, árvore são capazes de ocupar a
posição de agentes e não só de pacientes.
Um fato de ordem morfológico-sintática que parece corroborar isso é que nos neutros,
em geral, a forma do nominativo (o caso do sujeito) é a mesma que do acusativo (o caso do
objeto) – noutros termos, trata-se de palavras que originalmente não teriam uma forma de
nominativo porque, na condição de inanimados, não poderiam ocupar a posição de sujeitos
de verbos ativos. Tudo isso leva Gamkrelidze e Ivanov (1995, p. 239) a concluir:
A divisão de nomes em ativos e inativos, reconstituída para o indo-europeu, encontra paralelos
tipológicos frequentes em diversas línguas com uma classificação binária de nomes. A
classificação binária motiva a totalidade da estrutura gramatical e os recursos sintático-
semânticos do estágio mais remoto que se pode estabelecer para o proto-indo-europeu, a partir
da reconstituição comparativa e interna baseada nas línguas indo-europeias. Isso conta para
várias das características do indo-europeu, envolvendo as relações gramaticais, sintáticas e
semânticas.
Todo esse esforço histórico-comparativo de compreensão da motivação da repartição
dos gêneros nas diferentes fases do proto-indo-europeu não elimina o fato de que, com
exceção do inglês, nas línguas dessa família se trate de uma categoria em parte imotivada.
Repare bem: dizer imotivada parcialmente não implica que o seja de todo. Um falante do
português, por exemplo, sabe que o gênero masculino é próprio dos machos, enquanto o
feminino designa as fêmeas, compreendendo ambos ainda, em geral, o seguinte:
(a) são masculinos os nomes de funções exercidas por homens (o cardeal), de rios (o
Amazonas), de mares (o Mediterrâneo), dos meses (janeiro vindouro), dos pontos
cardeais;
(b) são femininos os nomes de funções exercidas por mulheres (a freira), de cidades e
ilhas (a antiga Ouro Preto, a pacata Paquetá).
Um falante do português sabe também que há razões de ordem fonética ou
morfológica para a classificação de gêneros, tais como:
54
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(a) são masculinas, em geral, as palavras terminadas em -o átono (livro, barco, aluno,
tesouro), os substantivos concretos terminados em -ão (limão, algodão, balcão) etc;
(b) são femininas, em geral, as palavras terminadas em -a átono (caneta, lancha, aluna,
tesoura), as palavras abstratas terminadas em -ão (instrução, razão, aflição), as palavras
terminadas em -agem (viagem, garagem, bobagem) etc (cf. CUNHA, 1982, p. 199-200).
Em todos os casos, os critérios são de ordem bastante genérica e termos que fogem às
previsões estabelecidas saltam à vista: ‘cobra’ (gênero feminino) pode ser tanto macha quanto
fêmea; o topônimo ‘Rio de Janeiro’ pertence ao gênero masculino; ‘mão’, embora substantivo
concreto terminado em –ão, é do gênero feminino; ‘cometa’, ‘telefonema’, ‘dia’, ‘fantasma’,
‘mapa’, todos terminados em –a átono, pertencem ao gênero masculino; ‘personagem’ admite
tanto o masculino (‘o personagem’) quanto o feminino (‘a personagem’). E assim por diante.
Isso leva a que se pense muitas vezes que o gênero é imotivado, o que não seria de
todo correto. O mais adequado, tendo em vista a variedade de línguas do mundo, parecer ser
considerar que há gradações, admitindo-se tanto critérios semânticos, quanto morfológicos,
na seguinte escala, de acordo com Corbett (1991): (a) sistemas estritamente semânticos; (b)
sistemas predominantemente semânticos; (c) sistemas morfológicos; (d) sistemas fonológicos
– prevendo-se ainda que possa haver a combinação de critérios semânticos, morfológicos e
fonológicos, o que se aplicaria, em geral, às línguas indo-europeias, com a eventual
predominância de um ou outro, como no russo, em que prevalece a morfologia (cf.
CORBETT, 1991, p. 1-61).
O inglês é a única língua indo-europeia que se enquadraria no primeiro item acima
citado, ou seja, o dos “sistemas estritamente semânticos”, com três gêneros: masculino,
feminino e neutro. Como o artigo, os demonstrativos e os adjetivos não apresentam variação
de gênero, não concordando, portanto, com o nome que determinam, há linguistas que
consideram que essa categoria gramatical simplesmente não existe no inglês moderno.
Todavia, o gênero se encontra expresso nos pronomes de terceira pessoa do singular (he/she/it)
e nos possessivos a eles correspondentes (his/her/its), exigindo a concordância com o referente,
de acordo com a seguinte distribuição: a) he (masculino), humanos machos; b) she (feminino),
humanos fêmeas; c) it (neutro), todo o restante. As exceções são raras, como ship, ‘navio’, que
frequentemente admite o pronome she. Entretanto, essa divisão estritamente semântica
permanece aberta, na prática, a uma maior variedade: animais domésticos, sobretudo quando
têm nomes próprios, admitem o uso de he ou she, dependendo de seu sexo, o mesmo
acontecendo nas histórias infantis, ou seja, fatores pragmáticos, de ordem emotiva e cultural,
interferem na escolha do falante, nas diversas situações comunicativas.
55
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Podemos definir caso em dois sentidos: (a) como as funções que uma palavra assume
numa estrutura sintática (sujeito, objeto etc); (b) como a forma assumida por determinada
palavra, que a vincula ao exercício de determinadas funções sintáticas (nominativo, acusativo
etc).
Neste último sentido, que é o que nos interessa do ponto de vista morfológico,
registram-se duas maneiras de marcação de caso:
(a) Sob a forma de declinação, ou seja, pelo acréscimo de afixos à palavra;
(b) Pela existência de séries supletivas.
Assim, em português os pronomes pessoais apresentam diferenciação de caso pelo uso
de formas supletivas, de acordo com a seguinte distribuição:
QUADRO 12
Formas supletivas dos pronomes pessoais em português nos casos reto e oblíquo
Pessoas Caso reto (função de sujeito) Caso oblíquo (demais funções)
Formas átonas Formas tônicas
singular 1ª. pessoa eu me mim/eu
2ª. pessoa tu/você te/o/a/lhe ti/você/tu
3ª. pessoa ele/ela o/a/lhe ele/ela
plural 1ª. pessoa nós/a gente nos nós/a gente
2ª. pessoa vós/vocês vos/lhes vós/vocês
3ª. pessoa eles/elas os/as/lhes eles/elas
56
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
57
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 13
Formas de nominativo e acusativo do pronome relativo em francês
Função do Pronome Exemplos
pronome relativo
Sujeito qui l’homme qui m’a vu est mon ami / o homem que me viu é meu amigo
Objeto direto que l’homme que j’ai vu est mon ami / o homem que eu vi é meu amigo
58
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 14
Casos morfologicamente marcados, através de flexão, em algumas línguas indo-europeias
Nom. Acus. Gen. Dativo Ablat. Locat. Instr. Vocat.
Hitita x x x x x x
Sânscrito x x x x x x x x
Persa antigo x x x x x x x x
Armênio x x x x x x x
Lituano x x x x x x x
Russo x x x x x x
Albanês x x x x x
Grego antigo x x x x x
Grego moderno x x x
Alemão x x x x
Inglês x
Irlandês x x x x x
Latim x x x x x x
Romeno x x x x x
59
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
se torna a marcação morfológica de caso, com no exemplo extremo do inglês que conserva
morfologicamente marcado apenas o genitivo.
No quadro abaixo, que toma como referência o pronome demonstrativo masculino,
você poderá observar como a marcação se processa:
QUADRO 15
Declinação do pronome demonstrativo ’esse’ (em latim) e ‘este’ (nas demais línguas)
Casos Sânscrito Russo Latim Grego antigo Alemão
Nominativo (este/esse) eshaḥ etot iste hoûtos dieser
Acusativo (este) etam etogo istum toûton diesen
Genitivo (deste) etasya etogo istīus toútou dieses
Dativo (a este) etasmai etomu istī toútōi diesem
Ablativo (deste) etasmāt istō
Locativo (neste) etasmin etom
Instrumental (com este) etena etim
Você pode se perguntar como procedem as línguas que não apresentam flexão para
todos os casos, a resposta sendo muito simples: apelam elas para o uso de preposições. No
sânscrito não há necessidade de preposições, pois os sete casos se encontram
sistematicamente marcados. Nas demais línguas a situação relativa aos casos que não têm
flexão própria apresenta-se assim: (a) utilizam-se preposições; (b) cada preposição pede um
dos casos flexionados, o que se chama regência da preposição:
QUADRO 16
Preposições que suprem a flexão de casos e sua regência em grego, russo, alemão e latim
Preposições que expressam o sentido dos casos não flexionados
Regência das Ablativo Locativo Instrumental
preposições (lugar de onde) (lugar onde) (com quê)
grego russo alemão grego alemão latim grego alemão latim
Genitivo ek/apó iz/ot
Dativo aus en in sún mit
Ablativo in cum
tentar entender como se processa a criação da flexão nominal de caso. É esta última hipótese
que seguiremos.
61
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 17
Nomes compostos e ordenação dos elementos envolvidos na composição
Língua Composto Significado Elementos de composição
Determinante Determinado
Sânscrito mahādevá- ‘grande deus’, ‘Shiva’ mahā-, ‘grande’ devá-, ‘deus’
svásthāna- ‘terra natal’ svá-, ‘seu, sua’ sthāna-, ‘terra’
Grego akrópolis ‘cidadela, cidade alta’ ákro-, ‘alto’ pólis, ‘cidade’
rhododáktulos ‘de dedos róseos’ rhodo-, ‘rosa’ dáktulos, ‘dedo’
Gótico armahaírts ‘misericordioso’ arma-, ‘piedade’ haírts, ‘coração’
Latim misericordĭa ‘misericórdia’ miser-, ‘desventurado’ cord-, ‘coração’
Russo polovod’e ‘enchente’ pol-, ‘cheio’ vod’-, ‘água’
Nesse contexto em que os itens lexicais se organizam nos sintagmas sem marcas
morfológicas de classe ou de caso, sendo provável que não existisse diferença entre
substantivos e adjetivos (o adjetivo sendo o determinante nominal por excelência), a
terminação *-os/es/s começa a ser usada para relacionar dois nomes, constituindo pares de
oposição entre um caso não marcado (o do determinado) e um caso marcado por sufixo (o do
determinante), como nos seguintes exemplos de genitivos: grego pod-ós, latim ped-is, sânscrito
pad-ás (-as < *-os), ‘do pé’; hitita nepiš-aš (-aš < *-os), ‘do ceu’. Parece que essa terminação
aplicava-se tanto ao singular quanto ao plural, antes que fosse criada uma flexão própria de
número, tanto que, em hitita, encontramos, como genitivo singular e plural de uddar,
‘palavra’, o termo flexionado uddanaš.
Ora, é curioso que haja ainda uma segunda terminação de genitivo atestada nas
línguas indo-europeias: *-ŏm. Também esta parece servir tanto para o singular quanto para o
plural, como encontramos, ainda em hitita, antuhšan (-an < *-ŏm), ‘de uma pessoa’, ao lado do
latim pedum (< *pedŏm), ‘dos pés’, e do antigo eslavo eclesiástico imenŭ (-ŭ < *-ŏm), ‘dos
nomes’. Parece que, inicialmente, a distribuição entre as duas terminações deveria ter relação
com o gênero de cada palavra, os nomes animados recebendo a terminação *-os e os
inanimados a terminação *-ŏm.
Posteriormente, com o acréscimo a esta última terminação (*-ŏm) da desinência de
plural *-s (*-oms > *ōm), a mesma se teria especializado para expressar a ideia apenas de
genitivo plural, como encontramos no grego pedōn, ‘dos solos’, sânscrito padām, ‘dos pés, dos
passos’, lituano vilkų (-ų < *-ōm), ‘dos lobos’ (cf. GRAMKRELIDZE; IVANOV, 1995, p. xx).
Declinar uma palavra é, no fundo, mudar-lhe a classe. Assim, os substantivos na forma
do genitivo (expressando uma relação que, em português, estabelecemos com a preposição
62
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Como você já sabe, o acusativo é o caso próprio do objeto. Portanto, quando um nome
recebe o sufixo próprio deste caso, isso indica tratar-se de um determinante do verbo, como
quando digo ‘eu como pão’, em que ‘pão’ determina o verbo ‘comer’ (não se trata de comer
‘carne’, ‘frutas’ ou seja lá o que for, mas ‘pão’).
Parece que, paralelamente à criação do morfema de genitivo, o estabelecimento de uma
marca morfológica para o acusativo se deu numa fase muito arcaica do indo-europeu,
anterior a sua separação em diferentes dialetos e línguas. O indício mais importante para
chegar-se a essa conclusão é que o acusativo apresenta, nos vários ramos do indo-europeu,
uma terminação bastante regular, com uma consoante nasal (-m/-n), como se pode constatar
no quadro seguinte:
QUADRO 18
Exemplos da oposição nominativo/acusativo
Casos Sânscrito Grego Latim Gótico Hitita
Nominativo vŗkah (lobo) lúkos (lobo) lupus (lobo) hana (galo) ginuš (joelho)
Acusativo vŗkam lúkon lupum hannan ginun
Se você não esqueceu que o gênero neutro corresponderia a palavras do tipo inativo,
ou seja, que não poderiam exercer a função de sujeito de verbos ativos, é importante agora
observar que esses nomes, no sânscrito, no grego, no latim e no hitita, têm como
característica, na declinação temática, o fato de que o nominativo termine com uma –m ou –n,
bastando observar de novo a distribuição de gênero nos adjetivos:
63
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 19
Gêneros nos adjetivos
Masculino Feminino Neutro
Sânscrito kântah (amado) kântâ kântam
Grego ponerós (infeliz) ponerá ponerón
Latim bonus (bom) bona bonum
No que diz respeito aos outros casos, é difícil descobrir padrões comuns que se
apliquem ao conjunto do indo-europeu, parecendo antes que os elementos morfológicos são
mais recentes, tendo sido criados já numa fase de dialetação, cada grupo gramaticalizando
certos morfemas para expressar outras relações sintáticas.
É razoável supor ainda que alguns ramos do indo-europeu levaram mais longe a
tendência a criar marcas nominais de caso, como o indo-iraniano e o eslavo, outros fazendo-o
menos, como o germânico e o grego. No caso desta última língua, é provável que alguns
sufixos locativos estivessem em vias de gramaticalizar-se como autênticas desinências, como
os sufixos -then para expressar o ablativo (lugar de onde) e -de para o alativo (lugar para onde) –
como em oíkothen (de casa) e oíkade (para a casa) –, o que todavia não aconteceu, mantendo-se
eles apenas como formadores de alguns advérbios.
64
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(1) Quais são os quatro itens que a reconstrução de uma protolíngua pretende estabelecer?
(2) O que significa dizer que a protolíngua deve ser tipologicamente viável? Ilustre sua explicação
com um exemplo.
(3) Qual o primeiro passo para a reconstrução de uma língua a partir do método comparativo?
(4) Qual a evolução do nexo consonantal -ct nas línguas advindas do latim?
(5) Em que consistia o chamado Apendix Probi? Em que esta obra pode ser útil para a apuração da
evolução histórica de palavras como orelha?
(6) Conceitue e exemplifique o fenômeno fonético conhecido por rotação germânica.
(7) Qual a organização hierárquica que regula as três noções de número nas línguas indo-
europeias (singular, plural e dual)?
(8) Cite duas línguas indo-europeias em que o dual esteja presente.
(9) Em que fase evolutiva supõe-se ter ocorrido a gramaticalização do dual no indo-europeu?
(10) Em que situações usa-se o dual nas línguas indo-europeias que dispõem desse recurso
gramatical? A que referentes, no mundo físico, o dual tipicamente está associado?
(11) Quando a categoria de gênero pode ser percebida como gramatical?
(12) Quanto à categoria de gênero, as línguas indo-europeias ramificam-se em cinco grupos,
cada qual marcado por um número específico de distinções de gênero. Quais são estes cinco
grupos?
(13) Quais as ordens de motivação semântica envolvidas nas distinções de gênero das
línguas indo-europeias?
(14) O que a existência do modelo tripartido de gêneros (masculino/feminino e neutro) no
avéstico, no sânscrito, no grego e no latim sugere com relação ao indo-europeu?
(15) Por que muitos nomes relativos aos corpos celestes e a elementos da natureza, como o
céu ou a terra, receberam marcas de feminino e masculino e não uma marca de neutro no indo-
europeu?
(16) Considerando-se o modelo tripartido, quais nomes podem exercer a função de sujeitos
de verbos ativos (nomes masculinos, femininos ou neutros)?
(17) Quais as duas definições possíveis para a categoria de caso?
(18) Como se dá a marcação de caso por meio de séries supletivas? Exemplifique.
(19) Dê a definição dos seguintes casos: nominativo, acusativo e dativo.
(20) Dê a definição dos seguintes casos: genitivo, ablativo e locativo.
(21) Dê a definição dos seguintes casos: instrumental-associativo e vocativo.
(22) Qual o procedimento utilizado por línguas que não possuem flexão para todos os casos
para expressar o conteúdo semântico dos casos para os quais não dispõe de marcação
morfológica?
65
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 5
O QUE É UMA LÍNGUA
Não é possível saber com exatidão quantas línguas existem no mundo, as estimativas
oscilando entre cinco e dez mil. Estabelecer essa quantidade depende, dentre outras coisas,
dos critérios com que se distinguem línguas e variedades de uma mesma língua. Por
exemplo, o português de Portugal e o português do Brasil são considerados duas variedades
da mesma língua, com base no fato de que há compreensão recíproca. Utilizando-se o mesmo
critério, contudo, os dialetos de Nápoles e de Milão deveriam ser tidos como línguas
diferentes, porque não há compreensão recíproca.
Caso se adote o critério de inteligibilidade mútua, a estimativa é de que são faladas
atualmente mais de seis mil línguas – conforme a última edição do Ethnologue, com data de
2009, exatamente 6.909 (Lewis, Ethonologue; dados disponíveis também no site
www.ethnologue.com).
Pode-se perguntar por que é tão complicado estabelecer o número de línguas faladas
no mundo. Uma das dificuldades está em que há sempre fatores de ordem histórica,
identitária, cultural e política que interferem no reconhecimento social de uma língua.
Sobretudo a partir do século XVIII, com a formação dos estados nacionais, predominou a
ideia de que uma nação se define por um território e uma única língua, a chamada “língua
oficial”, ensinada nas escolas e admitida em documentos públicos, assunto geralmente
tratado como tema constitucional.
Há nessa concepção dois tipos de problema: (a) por um lado, os que surgem em vista
do fato de que no interior de uma mesma fronteira geográfica muitas vezes se encontra mais
de uma língua (o que se constata exemplarmente no caso da Espanha, onde se falam o galego,
o espanhol, o catalão e o basco, para citar apenas as que contam, além das variantes orais,
também com uma rica literatura; ou no caso do Peru, com o espanhol, o quêchua e o aimara);
(b) por outro lado, levanta questões ainda o fato de que a abrangência geográfica de uma
língua pode ultrapassar as fronteiras nacionais (o basco, por exemplo, é falado num território
contínuo que se estende tanto pela Espanha, quanto pela França, bem como o espanhol, na
66
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
América, abrange um grande número de nações, o mesmo sendo verdadeiro com relação ao
quêchua, falado tanto no Peru, quanto na Bolívia, na Colômbia, no Equador, no Chile e na
Argentina). A concepção de que cada nação deve ter apenas uma língua, responsável pelo
desprestígio e até pela extinção de muitas línguas minoritárias, só pouco a pouco e com
muitos empecilhos tende a se modificar, a partir da perspectiva de que a diversidade
linguística representa riqueza e não um problema. Não se trata, entretanto, de algo simples.
Comprova-o caso do bretão, falado no norte da França. Até poucas décadas atrás, nas
repartições públicas e nas escolas havia cartazes com os dizeres: il est interdit de cracher par
terre et de parler breton (“é proibido cuspir no chão e falar bretão”). Isso implicou que essa
língua se restringisse praticamente a um uso doméstico, sendo em geral deixada de lado
pelos homens, em vista de sua integração nos espaços públicos, e mantida majoritariamente
pelas mulheres, então mais restritas à esfera privada. Atualmente, a Comunidade Europeia
incentiva a diversidade linguística, tendo mesmo sido aprovado, em 1992, pelo Conselho
Europeu, o “Estatuto Europeu das Línguas Regionais ou Minoritárias” (ETS 148), o qual
prevê, da parte dos diversos países, o reconhecimento das línguas minoritárias faladas em
seu território, bem como uma série de medidas visando a sua mantenção, tais como sua
presença no sistema de ensino para famílias e estudantes que assim o desejarem, a publicação
nelas de textos oficiais, o apoio a sua utilização nos meios de comunicação etc (cf. Conselho
da Europa, European Charter for Regional or Minority Languages). A maioria dos membros
da Comunidade Europeia já ratificou o estatuto, mas, na França, a Comissão pertinente da
Assembleia Nacional considerou, em junho de 1999, que ele contraria o artigo 2 da
Constituição, o qual prevê simplesmente que “a língua da República é o francês”. Desse
modo, conforme o deputado bretão François de Rugy, “cada vez que um dos deputados
(incluindo eu próprio) tem o azar de pronunciar apenas uma palavra numa das nossas
línguas regionais, o Presidente da sessão se apressa em lembrar que isso é proibido e que o
dito não será reproduzido na ata” (cf. Rugy, À l’Assemblée, il est interdit de parler breton...
[Na Assembleia Nacional é proibido falar bretão...]). Saliente-se que a França não é um caso
isolado: também Bélgica, Grécia, Irlanda, Portugal, Itália e Rússia, dentre outros, ainda não
ratificaram o citado estatuto.
Um outro exemplo, se bem que em sentido contrário, demonstra o quanto língua e
política podem manter relações bastante intricadas: o do “moldavo”. Nenhum linguista
duvida de que se trata não de uma língua, mas de um dialeto do romeno. Embora este último
tenha recebido, antes do século XVIII, denominações variadas, como valáquio e moldavo, já
em 1574 o viajante francês Pierre Lescalopier observava que os habitantes da Moldávia, da
Valáquia e da Transilvânia constituíam uma unidade etnolinguística que ele denominou
“românesc” (romena). Em 1716, também Dimitrie Cantemir, um dos grandes iniciadores da
67
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
68
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 1
Países que já ratificaram o ETS 148 e as línguas reconhecidas
País Ano da Língua ou Línguas reconhecidas como co-oficiais (LCO) e línguas
ratificação línguas oficiais regionais ou minoritárias reconhecidas (LRM)
Alemanha 1998 Alemão LRM: Baixo-alemão, Dinamarquês, Frísio, Români,
Sorábio
Armênia 2002 Armênio LRM: Aramaico, Grego, Curdo, Russo, Iezídi
Áustria 2001 Alemão LRM: Croata, Húngaro, Români, Eslovaco, Esloveno
Chipre 2002 Grego, Turco LRM: Árabe Cipriota Maronita, Armênio
Croácia 1997 Croata LRM: Húngaro, Italiano, Ruteno, Sérvio, Eslovaco,
Esloveno, Tcheco, Ucraniano
Dinamarca 2000 Dinamarquês LRM: Alemão
Eslováquia 2001 Eslovaco LRM: Alemão, Búlgaro, Croata, Húngaro, Polonês,
Români, Ruteno, Tcheco, Ucraniano
Eslovênia 2000 Esloveno LRM: Alemão, Croata, Húngaro, Italiano, Români
Espanha 2001 Espanhol LCO: Aranês (Catalunha), Basco (País Basco e Navarra),
Catalão (Catalunha e Ilhas Baleares), Galego (Galícia),
Valenciano (Valência); LRM: Árabe, Aragonês, Asturiano,
Bérbere, Português
Finlândia 1994 Finlandês LCO: Sueco (Ostrobotnie e Åland); LRM: Iídiche, Lapão,
Români, Russo, Sueco, Tártaro
Hungria 1995 Húngaro LRM: Alemão, Armênio, Beas, Búlgaro, Croata, Eslovaco,
Esloveno, Grego, Polonês, Romeno, Români, Ruteno,
Sérvio, Ucraniano
Lichtenstein 1997 Alemão
Luxemburgo 2005 Alemão,
Francês,
Luxemburguês
Montenegro 2006 Montenegrino, LRM: Albanês, Români
Sérvio
Noruega 1993 Norueguês LCO: Kven, Lapão, Români
Países Baixos 1996 Holandês LRM: Baixo-Saxão, Frísio, Luxemburguês, Români,
Iídiche
Polônia 2009 Polonês LRM: Alemão, Armênio, Bielorusso, Tcheco, Hebraico,
Íidiche, Caraíta, Cabucho, Lituano, Lemcoviano, Români,
Russo, Eslovaco, Tártaro, Ucraniano
Reino Unido 2001 Inglês LRM: Córnico, Escocês, Gaélico Escocês, Galês, Irlandês,
Manês
República 2006 Tcheco LRM: Alemão, Eslovaco, Polonês, Români
Tcheca
Romênia 2007 Romeno LRM: Albanês, Alemão, Armênio, Búlgaro, Croata,
Eslovaco, Grego, Húngaro, Iídiche, Italiano, Macedônio,
Polonês, Români, Russo, Ruteno, Sérvio, Tártaro, Tcheco,
Turco, Ucraniano
69
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
70
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
71
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
pertencerem às escolas, e todos os índios, que forem capazes de instrução nesta matéria, usem
da língua própria das suas nações ou da chamada geral” (apud CUNHA, 1985, p. 80).
O interessante, contudo, é que apenas a Constituição de 1988 declarou expressamente
que “a língua portuguesa é o idioma oficial da República Federativa do Brasil” (art. 13).
Anteriormente esse preceito permaneceu sem referência: nas constituições de 1824, logo após
a Independência, e de 1891, que se segue à Proclamação da República, não há qualquer
menção à língua nacional; a de 1934, no capítulo sobre o “Plano Nacional de Educação”,
prescreve que o “ensino, nos estabelecimentos particulares, [será] ministrado no idioma
pátrio, salvo o de línguas estrangeiras” (art. 150, parágrafo único, alínea “d”); na constituição
de 1937 não se observa nenhuma referência à língua; na de 1946, são duas menções: uma
sobre o ensino (“o ensino primário é obrigatório e será dado na língua nacional”, art. 168,
inciso I) e a outra sobre os direitos políticos dos cidadãos, em que se declara que “não podem
alistar-se a eleitores (...) os que não saibam exprimir-se na língua nacional” (art. 132, inciso II),
tendo sido ambos os preceitos repetidos na constituição de 1967 (artigos 168 e 142,
respectivamente). Finalmente, o texto de 1988 declara a língua portuguesa como “idioma
oficial” da República, eliminando a restrição a que só podem votar os que o dominarem e
dando a seguinte redação às normas relativas ao ensino: “o ensino regular será ministrado em
língua portuguesa, assegurada às comunidades indígenas também a utilização de suas
línguas maternas e processos próprios de aprendizagem” (art. 210, parágrafo 2º.).
Esses passos apresentam alguns aspectos significativos. Antes de tudo, não declarar
que o português é a “língua oficial” do Brasil não significa que não fosse, mas que isso estava
subentendido – alías, pelo próprio fato de que todas essas constituições sempre foram escritas
em português. Mesmo antes da Independência, é certo que o português desempenhava o
papel de língua oficial, já que era a única utilizada em documentos públicos no âmbito do
Reino de Portugal e suas colônias. O fato de que, a partir de 1934, o “idioma nacional” comece
a aparecer nas normas educacionais indica que alguma mudança havia ocorrido entre a
última década do século XIX e a três primeiras do século XX, o que não é difícil de identificar,
pois este é justamente o período da grande imigração europeia e oriental para o país (1887 a
1930). Para citar dados relativos apenas às comunidades mais numerosas, a quantidade de
imigrantes italianos que aportou no Brasil é da ordem de 1,4 milhão, seus descendentes hoje,
apenas na cidade de São Paulo, estando em torno de 5 milhões; em 1935, calcula-se que o
número de falantes de alemão no Brasil era de cerca de 1,2 milhão, somando-se os imigrantes
(cerca de 300 mil) e seus descendentes; o número de imigrantes japoneses, até a época da
Segunda Guerra, é calculado em 190 mil, chegando seus descentes hoje a 1,3 milhão
(BOLOGNINI; PAYER, 2005). Ora, ao se estabelecerem, formando suas comunidades, esses
migrantes naturalmente criavam escolas em que o ensino era ministrado nas línguas
72
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
maternas tanto de pais quanto de filhos. Assim se entende o motivo por que se introduziu,
justamente no texto constitucional de 1934, a norma de que o ensino primário se faria apenas
no “idioma nacional”, sendo principalmente por esse meio que as várias línguas acabariam
esquecidas em favor do português e os imigrantes integrados na nacionalidade.
Mais interessante ainda é que nas disposições transitórias da Constituição de 1946 se
preveja o seguinte: “O Governo nomeará Comissão de professores, escritores e jornalistas,
que opine sobre a denominação do idioma nacional” (art. 35). Nesse caso, trata-se de dar
solução a uma questão que se arrastava desde o século XIX, a de saber se o português do
Brasil se chamaria “português” ou “brasileiro” (no estilo da polêmica envolvendo romeno e
moldavo). A decisão, linguisticamente correta, é que a língua predominante no Brasil é a
portuguesa e assim deve ser denominada. Que o assunto não é de pequena monta pode-se
ainda constatar tendo em vista as prescrições, de 1946 e 1967, de que só podiam votar os
cidadãos falantes de português, o que afetava principalmente as comunidades indígenas,
mantidas em situação de tutela, sem reconhecimento efetivo de sua cidadania. É
provavelmente por isso que a carta de 1988 cuidou de lembrar que o ensino, nessas
comunidades, se poderá fazer “também” nas línguas próprias a cada uma delas – o advérbio
garantindo que se trata de uma concessão que, todavia, expressa um reconhecimento nunca
antes estabelecido em lei. Como a nova Lei de Diretrizes e Bases da Educação Nacional
dedicou todo um capítulo à educação indígena, as línguas desses povos começam a ser
retomadas e valorizadas, modificando a situação que perdurava desde as reformas
pombalinas. Sem dúvida essa mudança de atitude foi o que permitiu que, no município de
São Gabriel da Cachoeira (AM), em 2002, fossem legalmente reconhecidas como oficiais
quatro línguas: o português, o nheengatu, o tukano e o baniwa, as três últimas faladas pela
grande maioria da população (Lei Municipal 145, de 22 de novembro de 2002).
Trata-se de uma primeira experiência, ainda incipiente, mas que aponta no sentido da
viabilidade de se adotarem políticas de incentivo à preservação das línguas regionais e
minoritárias do Brasil, tendo em vista não só as indígenas, cuja conservação é sem dúvida
prioritária, como também as raras africanas que ainda resistem e as das comunidades
procedentes dos imigrantes europeus e orientais, esferas sobre as quais, aliás, a norma
constitucional infelizmente nada prevê. Com efeito, a diversidade linguística constitui uma
parte importante do patrimônio nacional, merecendo os mesmos cuidados que o patrimônio
natural e material.
73
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(a) Uma língua se distingue de outra pelo sistema de fonemas e pelo sistema de formas, bem como
pelos padrões frasais em que essas formas se ordenam na comunicação linguística ou frase. Da
estrutura específica de cada língua resulta a falta de inteligibilidade entre homens de línguas
diversas, quando cada qual não aprendeu previamente o sistema de linguagem de cada um dos
outros. (...) O que define uma língua, em face das demais, é a sua estrutura, que estabelece oposições
específicas de fonemas e formas. De acordo com a estrutura, se tem uma nova língua a partir de um
momento da evolução de uma língua dada (ex.: o português em face do latim) ou se distinguem
num território contínuo duas ou mais línguas que são evolução de uma única língua (ex.: na
península ibérica, a língua portuguesa, em fase da língua castelhana, ou espanhola, e da língua
catalã, todas provenientes do latim). Há, entretanto, uma hierarquia nas oposições linguísticas e são
as fundamentais, ou primárias, que definem essencialmente uma língua em face das demais. As
oposições superficiais, ou secundárias, criam dentro de uma língua as divisões chamadas falares,
que por sua vez são agrupáveis em dialetos. (p. 247-248).
(b) Falares [são] línguas de pequenas regiões, através de um território linguístico dado, que se
distinguem umas das outras por oposições superficiais dentro do sistema geral de oposições
fundamentais que reúne todas numa língua comum. Os dialetos são a rigor conjunto de falares que
concordam entre si por certos traços essenciais. Os falares caracterizam-se ainda, em face da língua
comum, pela circunstância de pertencerem à língua cotidiana oral. (p. 175).
(c) Do ponto de vista puramente linguístico, os dialetos são línguas regionais que apresentam entre si
coincidência de traços linguísticos fundamentais. Cada dialeto não oferece, por sua vez, uma
unidade absoluta em todo o território por que se estende, e pode dividir-se em subdialetos, quando
há divergência apreciável de traços linguísticos secundários entre zonas desse território. A
classificação dos dialetos e subdialetos de uma língua é, até certo ponto, convencional, pois depende
dos traços linguísticos escolhidos para base de classificação; são sempre preferidos traços
fonológicos e morfológicos porque a fonologia e a morfologia são aspectos de uma língua mais
estáveis, mais sistemáticos e mais característicos de sua fisionomia. (p. 141).
Como você vê, as línguas podem ser distinguidas de diferentes perspectivas, não
sendo tarefa simples estabelecer os critérios mais adequados. Em termos gerais, há duas
possibilidades de estudo de uma língua: (a) como um sistema fechado, com enfoque no
conjunto de sua gramática e de seu léxico, como nas descrições gramaticais e nos dicionários –
o que Câmara define como “sistema de fonemas” (ou fonologia), “sistema de formas” (ou
morfologia) e “padrões frasais” (sintaxe), a que é preciso acrescentar, sem dúvida, o léxico; (b)
no uso concreto, algo em boa medida diferente, mais complexo e dependente de muitas
variáveis não estritamente linguísticas, de ordem social, cultural e cognitiva. Para tornar mais
claro como esses critérios são utilizados, dintinguindo entre as oposições “fundamentais, ou
primárias” e as “superficiais, ou secundárias”, tomaremos como exemplo o “sistema de
fonemas”, estudado pela fonética e pela fonologia.
74
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
A fonética é a disciplina que estuda os sons emitidos pelo aparelho fonador humano e
recebidos por seu aparelho auditivo, os quais podem ser medidos por equipamentos
apropriados. Os sons, quando indicados foneticamente, são representados, entre colchetes,
usando-se o alfabeto fonético internacional. Assim, a transcrição fonética das palavras
portuguesas ‘casa’ e ‘vaza’ é, respectivamente,
[’kaza] / [’vaza],
não interessando que a norma ortográfica prescreva que uma se escreve com ‘s’ e a outra com
‘z’. Tomemos outro exemplo: ‘chocar’ e ‘tocar’ são foneticamente representadas como
[ςo’kar] / [to’kar],
ou seja, o primeiro som de chocar (que, na escrita do português, é representado com dois
símbolos gráficos, ‘ch’) corresponde ao que, no alfabeto fonético, é representado por [ς]; ao
contrário, o primeiro som de tocar tem a mesma representacão nos dois casos.16
A fonologia, por seu lado, é a disciplina que estuda os sons como são representados
mentalmente e como se agrupam, numa determinada língua, de acordo com sua capacidade
de atribuir distinções de significado às palavras. Considerando nosso segundo exemplo, em
português [ςo´kar] e [to´kar] se distinguem unicamente por um fonema, constituindo um par
mínimo, ou seja, um par de palavras diferentes que têm tudo em comum menos um único
som, o qual é suficiente para distinguir os respectivos significados. Isso indica que esses sons
têm uma representação mental diferente e, por isso, são fonologicamente relevantes. Quando
se trata de registrar a representação fonológica, colocamos os sons entre barras oblíquas:
par mínimo
/ςo’kar/ /to’kar/.
A situação muda se comparamos, ainda em português, [t] e [tς]. O primeiro é o som
inicial de ‘teto’; o segundo, de ‘tchau’. Em português, com exceção desta última palavra de
origem estrangeira (grafada com três símbolos gráficos, ‘tch’), o som [tς] não distingue
significados. Tanto que uma mesma palavra, por exemplo ‘tia’, é pronunciada como [‘tia] em
algumas partes do Brasil e como [‘tςia] em outras, sem que se pense que as duas formas
possam ter significados diferentes. Isso significa que a representação mental de [t] e [tς] é, em
português, geralmente a mesma. Acusticamente percebemos a diferença, mas ela não muda o
significado da palavra. Ao contrário, a diferença entre [p] e [b], acusticamente bem menor que
entre [t] e [tς], é mentalmente mais significativa, tanto que [´piko] e [´biko], [´pasta] e [´basta]
são palavras diversas.
16
O acento, na representação fonética, é colocado antes da sílaba a que se refere.
75
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Em resumo: o objeto da fonética são os fones, um fone sendo um som concreto; o objeto
da fonologia é o fonema, ou seja, a representação mental de um som que é capaz de distinguir
significados. A fonologia estuda, por assim dizer, a dimensão cognitiva do som. De fato,
apesar de todos os seres humanos terem as mesmas potencialidades fisiológicas para
produzir e ouvir sons, sabemos que um brasileiro, um italiano ou um chinês não conseguem
com a mesma facilidade produzir todos os sons nem decodificá-los quando os escutam. O que
acontece é que tanto o aparelho fonador quanto o aparelho auditivo são comandados pela
nossa cognição, sendo esta “moldada”, de diferentes maneiras, em diferentes lugares, a partir
do nosso nascimento. A cognição de um brasileiro é moldada diferentemente da de um
chinês: no primeiro caso, ela se molda de forma a diferenciar claramente os sons [r] e [l], o que
não acontece com relação a um chinês. A cognição de um italiano é moldada para diferenciar
claramente as consoantes intensas das simples, distinguindo, assim, entre
/´palla/ (bola) x /´pala/ (pá),
enquanto um estrangeiro geralmente não consegue perceber acusticamente nem executar
foneticamente essa diferença. Portanto, se todos os sons, em princípio, podem ser igualmente
produzidos e recebidos pelos aparelhos fonador e auditivo de todos os seres humanos (trata-
se de uma capacidade da espécie), não são todos de fato realizados e percebidos com a
mesma facilidade. Os falantes de uma língua produzem certos sons com mais facilidade que
outros e percebem mais facilmente certas diferenças de sons. Um brasileiro não tem
dificuldade em perceber a diferença entre
/´pãu/ (pão) x /´pau/ (pau),
mas, para um estrangeiro, as duas sequências podem parecer iguais, exatamente como para
um brasileiro podem parecer iguais as sequencias italianas
/´kasa/ (casa, ‘casa’) x /´kassa/ (cassa, ‘caixa’),
ou as sequências inglesas
/´tin/ (tin, ‘lata’) x /´θin/ (thin, ‘magro’, ‘fino’).
A percepção obviamente se reflete na realização: o que é difícil de ser percebido é
também difícil de ser realizado. Isso decorre do fato de que a decisão do que constitui um
fonema se faz de maneira diferente em cada língua. Um som que é fonema em uma língua
pode não ser em outra. Assim, enquanto o português considera [t] e [tς] como duas
realizações possíveis do mesmo fonema /t/, o italiano admite que se trata de dois fonemas
diferentes e diferencia os pares mínimos
/´tindζere/ (tingere, ‘tingir’) x /´tςindζere/ (cingere, ‘cercar’).
Enquanto em português ou em italiano a alternância entre [t] por [θ] não muda o significado
de nenhuma palavra – no máximo, podemos achar esquisita a pronúncia da pessoa –, em
inglês o contraste é significativo, como em
76
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
77
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
2.2 Morfologia
78
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
português. O imperfeito do verbo amar, ‘(eu) amava’ pode ser segmentado em {am}, morfema
lexical, como em ‘amor’, ‘amante’ etc, seguido por {av} e {a}, os quais expressam mais de um
significado: (a) {av} expressa pelo menos os significados de modo indicativo (assim ‘amava’
contrapõe-se, por exemplo, a ‘amasse’, imperfeito do subjuntivo), tempo passado (‘amava’
está em oposição a ‘amo’ e ‘amarei’, presente e futuro, respectivamente), e aspecto durativo
(‘amava’ distingue-se de ‘amei’, que também é uma forma do passado, por expressar
duração); (b) já o morfo {a} expressa os morfemas de primeira pessoa (em contraposição com
‘amavas’) e de número singular (opondo-se a ‘amávamos’). Um exemplo extremo é o caso da
palavra ‘é’, do verbo ‘ser’: com um único fonema e, portanto, um único morfo, indicamos
uma série de morfemas, ou seja, de significados, entre os quais pelo menos os seguintes:
morfema lexical, morfema de modo indicativo, morfema de aspecto durativo, morfema de
tempo presente, morfema de terceira pessoa, morfema de número singular.
Todavia, o contrário também pode acontecer, ou seja, que um mesmo morfema, um
mesmo significado, seja representado por mais de um morfo. De fato, em português, para o
significado {plural} nem sempre o morfo seria {s}, porque o plural de ‘mar’ é ‘mares’, o de
‘caracol’, ‘caracois’, o de ‘caminhão’, ‘caminhões’. Como você vê, tanto {s}, quanto {es}, {is},
{ões} e outros são morfos do mesmo morfema {plural}. Quando vários morfos são realizações
concretas do mesmo morfema, são chamados de alomorfos.
A morfologia se divide em morfologia gramatical e morfologia derivacional. A
morfologia gramatical serve para fornecer significados gramaticais ao mesmo lexema, ou seja,
ao mesmo significado lexical da palavra. Por exemplo ‘menino’ e ‘menina’ são duas formas
gramaticais do mesmo lexema. A única distinção está no gênero. Assim todas as formas do
verbo ‘amar’ (amo, amamos, amei, amaria etc.) são formas diferentes do mesmo lexema. Ao
contrário, a morfologia derivacional trata da formação de palavras, isto é, lexemas novos a
partir de um lexema que serve como base. Por exemplo, não podemos dizer que ‘comum’,
que é um adjetivo, e ‘comunidade’, que é um nome, são o mesmo lexema. O segundo,
contudo, é derivado do primeiro através de um processo de sufixação, ou seja, pelo acréscimo
ao final da palavra de um morfema (-idade) que tem a capacidade de fazer com que um
adjetivo se torne um nome e um novo lexema. Com o tempo pode até acontecer que os
falantes percam a percepção que uma palavra é derivada de outra. Ninguém mais percebe
que ‘amigo’ é derivado da mesma base de ‘amar’. A estratégia da derivação é extremamente
comum nas línguas como forma de ampliar o vocabulário. É uma estratégia muito
transparente, porque o sufixo ou o prefixo possui um significado imediatamente
interpretável. Por exemplo, o contrário de ‘jovem’ é ‘velho’, sendo necessário que saibamos o
significado de ambas as palavras, porque não há nada que nos diga que uma é o contrário da
outra. Mas com relação a ‘feliz’ e ‘infeliz’, é suficiente saber o que significa ‘feliz’ e que o
79
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 2
Exemplos de conversão em inglês
Classe back round
Substantivo I have a pain in my back, ‘estou com rounds of paper, ‘círculos de papel’
dor nas costas’
Adjetivo the back door, ‘a porta dos fundos’ a round table, ‘uma mesa redonda’
Verbo please, back the car, ‘por favor, to round a figure, ‘arredondar uma
chegue o carro para trás’ quantia’
Advérbio look back!, ‘olhe para atrás’ the earth goes round, ‘a terra gira’
Preposição I go back home, ‘eu vou de volta to travel round the world, ‘viajar ao
para casa’ redor do mundo’
3 O diassistema
Como você vê, se uma língua se define por sua fonética, morfologia, sintaxe e léxico,
nem tudo é tão simples, uma vez que se admitem variáveis em maior ou menor grau, como os
alofones e os alomorfos. A possibilidade da existência de variantes atinge todos os níveis
gramaticais, ou seja, nenhuma língua constitui um bloco absolutamente homogêneo, sua
riqueza e vitalidade estando expressas justamente pela capacidade de criação e variação
80
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
constantes.
Tomemos mais um exemplo de nossa própria língua. O fato de que a conjugação
verbal se apresente de forma variada, tanto nos registros escritos quanto orais, no Brasil e em
Portugal, não faz com que se trate de línguas diferentes, mas apenas de diversas variantes.
No quadro seguinte, você encontrará um rol de possibilidades de conjugação do verbo ‘ir’,
nenhuma delas agramatical, embora algumas formas não sejam admitidas pela gramática
normativa:
QUADRO 3
Tipos de conjugação verbal no português contemporâneo
Tipo 1 Tipo 2 Tipo 3 Tipo 4 Tipo 5 Tipo 6 Tipo 7
eu vou eu vou eu vou eu vou eu vou eu vou eu vou
tu vais tu vais tu vai você vai você vai você vai você vai
ele vai ele vai ele vai ele vai ele vai ele vai ele vai
nós vamos nós vamos nós vamos nós vamos a gente vai nós vai nós vai
vós ides vocês vão vocês vão vocês vão vocês vão vocês vão vocês vai
eles vão eles vão eles vão eles vão eles vão eles vão eles vai
17As formas agramaticais são sempre marcadas por um asterisco, o que implica que não são admissíveis pela
gramática de uma determinada língua.
81
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
82
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
83
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
cinema, o rádio, a televisão, a internet etc. Ninguém escreve da mesma maneira que
fala ou usa a mesma linguagem num chat, num e-mail, ou numa obra literária.
A figura 1, abaixo, mostra algumas das relações entre essas variáveis:
FIGURA 1 - O diassistema
84
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
85
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
São necessários alguns comentários. Em primeiro lugar, o gráfico deve ser imaginado
como tridimensional: a linha horizontal representa a largura do espaço, a linha vertical, sua
altura, e a linha oblíqua a profundidade, que obviamente não pode ser adequadamente
representada em uma superfície. Dito isso, a linha vertical representa a diastratia, do ponto
mais baixo até o mais alto; a linha horizontal representa a diamesia, com o polo da oralidade
mais interativa e não planejada à esquerda e o da escrita mais planejada à direita; a linha
oblíqua representa a diafasia, com as situações mais informais na parte baixa à direita e as
situações mais formais na parte alta à esquerda. Falta, além da variação diacrônica, também a
diatópica. Isso se deve ao fato que este gráfico se refere a uma diatopia, pois cada diatopia
possui um conjunto de variações diastráticas, diafásicas e diamésicas próprias. O gráfico
deveria, portanto, ser repetido para cada diatopia.
O que se mostra é que, no espaço tridimensional de um diassistema linguístico, é
possível identificar a posição ocupada por cada sistema com relação aos demais. Os seis
sistemas indicados para o português do Brasil não são claramente os únicos do diassistema
brasileiro, servindo unicamente para exemplificar a relação entre sistemas e variáveis. Não
86
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
existe um número definido de sistemas, porque o espaço linguístico deve ser considerado
como um continuum, inteiramente ocupado por inúmeras possibilidades. Se compararmos
sistemas distantes, as diferenças são claras, mas, entre um e outro, existem muitas realizações
possíveis.
O que diferencia um sistema do outro dentro de do mesmo diassistema? Obviamente
estamos sempre dentro da mesma língua. Portanto, muitos traços, como preposições, artigos,
várias conjunções e muitos lexemas são iguais em todos os sistemas. Há outros traços que
podem participar de mais de um sistema, mas geralmente com frequência bem diferente.
Outros ainda são específicos de um sistema ou de outro.
Para diferenciar os sistemas devemos considerar pelo menos o seguinte:
1. Traços que podem estar presentes em todos os sistemas, mas cuja frequência varia
de um sistema para o outro;
2. Traços específicos de um sistema, como léxico especializado, alguns usos
morfossintáticos etc;
3. Coocorrência de traços, uma vez que é muito frequente que alguns sistemas sejam
caracterizados não pela presença de um ou outro traço específico, mas pelo fato de
que certos traços ocorrem em conjunto somente naquele sistema, ou seja, tomados
individualmente, esses traços encontram-se também em outros sistemas, mas
somente em um sistema eles ocorrem juntos.
Quando se afirma que somente as línguas de sociedades complexas são diassistemas,
entende-se que o diassistema se produz quando uma língua necessita de muitos sistemas
porque com ela precisamos agir de maneira diferente, em muitas circunstâncias diferentes,
para fazer várias coisas de maneira diferente. A língua de uma pequena comunidade que não
possua escrita e, portanto, não conheça variação diamésica, não possua estratificação social e,
portanto, não experimente variação diastrática, e tenha necessidade de lidar com uma
variedade de situações limitada (pois não possui escolas, hospitais, burocracia etc.), essa
língua não é considerada um diassistema, mas um sistema simples.
Como você viu, uma língua é algo extremamente complexo, em que interfere um
número bastante elevado de variáveis significativas, de ordem externa e interna, as quais são
estudadas por diferentes ramos da linguística. Quando perguntamos o que é a língua
portuguesa, por exemplo, é necessário considerar seus diversos sistemas em termos
diacrônicos, com suas diatopias, no interior das quais se encontram as respectivas diastratias,
diafasias e diamesias.
87
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
***
88
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
LEITURA COMPLEMENTAR
Leia o texto abaixo e procure descobrir em que língua está escrito, muito semelhante,
como você constatará, ao português:
Esta eideia de qu’uas lhénguas son melhores qu’outras chegou a tener muitos
defensores, que magicórun18 teories mais ou menos mirabulantes. Dante, por eisemplo, dezie
que las lhénguas bulgares, nun serbien para falar de cousas profundas. Umberto Eco fala-mos
nun tal baron de Ryckholt, un flamengo que defendie que la lhéngua flamenga era mais
antiga, falada deçde l bércio de l’houmanidade. Todas las outras éran dialetos defíciles
d’antender. L sueco Andreas Kempe, dezie que Dius, an ne Paraíso, falou an sueco, Adan an
dinamarqués i, esta ye la melhor, la serpiente qu’ancantou Eba falaba francés. Eiqui na bezina
Spanha fazírun scola las palabras de l Amperador Carlos I para quien l castelhano era la
lhéngua mais apropriada para falar cun Dius.
Fui nesta rateira nacionalista que se deixórun caer tamien alguns filózofos i scritores de
ls mais afamados. L romántico Herder, por eisemplo, dezie que la lhéngua ye l melhor
speilho de l’alma nacional. L filózofo Leibniz, defendie que l aleman ye la lhéngua que
cunserbou la cara mais natural ou adânico. Ou seia, aqueilha que stá mais acerca de Dius i,
bien antendido, la lhéngua mais porfeita que las outras.
Mas todas estas teories dében ser antendidas no sou spácio i no sou tiempo. Alguas
perténcen a ua era an que las naçones ouropeias buscában, por todos ls meios, las razones
para defenir las sues frunteiras i para lhegitimar la sue eijistência. Las lhénguas fúrun, desde
siempre, l stendarte de ls pobos dominados. Fúrun eilhas que criórun las gientes, que
fabricórun ls pobos i ajudórun a formar las naçones. Las lhénguas son l arado i la charrua
qu’abrírun ls sucos donde stan sembradas las semientes de l’houmanidade. Hoije ls tiempos
son outros. Mas las lhénguas – todas las lhénguas – stan ende para mos dar cunta que somos
hardeiros desta bariedade lhenguística. Ye ua hardança i ua riqueza que tenemos
l’oubrigaçon de cunserbar porque eilha representa aquilho que de mais sublime tenemos
cumo spécie.
***
É provável que você não tenha podido identificar a língua em que o texto se encontra
escrito (se conseguiu, parabéns!, é provável que você seja um de seus quinze mil falantes).
Trata-se do mirandês, por alguns considerado um dialeto do asturiano, falado no concelho de
Miranda do Douro, nordeste de Portugal, país em que é reconhecido, ao lado do português,
como língua oficial.
18 “Imaginaram”.
89
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Até fins do século XX, restringiu-se à oralidade. Em 1882, o filólogo português Leite de
Vasconcelos publicou estudos sobre ela, recolhendo ainda contos, adivinhas, provérbios,
fábulas e canções em mirandês. Foi seguido por outros, como Bernardo Fernandes Monteiro,
que traduziu para o mirandês os quatro evangelhos, trabalho publicado apenas parcialmente,
a partir de 1896. Dos anos 1960 para cá, cresce a produção nessa língua, que, atualmente,
como outras línguas regionais e minoritárias da Comunidade Europeia, busca manter-se,
firmando-se também como língua escrita. Em 2008 sua norma ortográfica foi estabelecida pela
Câmara Municipal de Miranda do Douro.
O texto a seguir, de que o anterior é um extrato, reflete bem o desejo de
reconhecimento da parte de seus falantes:
90
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Mas a par de l camino de ls chamados ounibersales lhenguísticos, que mos dízen que
todas las lhénguas son eiguales, hai outro camino que bai a la par, cun ua lharga stória,
daqueilhes que s’acupórun a tentar mostrar nó l qu’ounie las lhénguas mas aquilho que
neilhas ye diferente. I deiqui até dezir qu’uas son melhores qu’outras, ou qu’esta sirbe melhor
para dezir ciertas cousas, fui un passo mui fácel de dar. Assi naciu l mito de las lhénguas
nacionales que, por stáren juntas al poder, atirórun cun las outras pa l buraco dialetal. Na
maior parte de las bezes, al menos an Pertual i Spanha, fui un camino que lhebou tiempo i
nun fui ampuosto por lei (cumo acunteciu an Fráncia qu’an 1539 decretou que la lhéngua
falada na region Île de France era francés i todas las outras éran patois). Debagarico, ua lhéngua
fui-se amponendo a las outras porque era la lhéngua de l poder, aqueilha que melhor
permitie chegar a el ou comunicar cun mais giente. Assi s’ampeçou, mesmo sien querer, a
caçoar de la maneira de falar d’alguns i a dezir qual era la maneira cierta de falar.
Durante muitos anhos mos fúrun dezindo que falábamos atrabessado, arrebesado, que
falábamos mal, ou qu’éramos palhantres. D’ua maneira ou doutra nun falábamos bien pertués.
Hai quien, inda hoije, nun tenga salido de l buraco scuro i perdura an dezir que l mirandés
nun sirbe para falar d’outras cousas a nun ser l mundo rural, yá el mais zbarrulhado que la
lhéngua.
EXERCÍCIO
Tomando como referência os dois últimos parágrafos do texto acima, arrole as semelhanças e
diferenças entre o mirandês e o português.
91
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
92
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 6
AS LÍNGUAS DO MUNDO
Das quase sete mil línguas hoje em uso no mundo, o número de falantes varia de mais
de 1 bilhão, no caso do chinês, a não mais que poucas centenas ou dezenas, como nos casos
do antakarinya, falado por cerca de 50 pessoas na Austrália; o omótico, com duas dezenas de
falantes no Quênia; o katukina, língua falada no estado do Acre, no Brasil, por cerca de 300
pessoas; o han, do Alasca, com 40 falantes; o yevanic ou judeo-grego, em Israel, com 50; o
helenorromeno ou romeno-grego, da Grécia, com 30 – e inúmeras outras.
Na tabela abaixo você encontra uma relação das línguas faladas como língua materna
por mais de 4 milhões de pessoas, o que se apresenta na coluna “estimativa 1”, conforme a
edição de 2009 do Ethnologue (cf. LEWIS, 2009, p. 20-26). Já a coluna “estimativa 2” mostra a
soma do número de falantes nativos de cada uma dessas línguas ao número de falantes que
as usam como segunda língua (os dados dessa segunda estimativa são bastante fluidos e,
quando não há informações, o número da estimativa 1 é repetido).
A tabela se organiza na ordem decrescente da estimativa 1, devendo ser observado
que, caso o critério fosse a estimativa 2, a ordenação se modificaria em vários pontos. Por
exemplo, o inglês passaria do terceiro lugar para o segundo, o árabe se colocaria antes do
espanhol e o russo ultrapassaria o português e o bengali. A diferença entre as duas colunas se
explica em grande parte em vista de processos históricos hegemônicos de natureza cultural,
religiosa ou política, que voltaremos a examinar com mais detalhes adiante.
Você encontra ainda, na segunda coluna da tabela, a família a que cada língua pertence
e, quando é o caso, os grupos e subgrupos, o que lhe dará uma primeira ideia sobre quais
famílias linguísticas são predominantes, considerado o número de falantes. Tendo em vista,
por exemplo, as dez primeiras posições, você observará que há sete línguas indo-europeias, e
apenas três pertencentes a outras famílias, um fato sobre o qual também voltaremos a refletir.
Note ainda como, das línguas indígenas da América, apenas o quêchua (com 10,1 milhões de
falantes nativos) e o guarani (com 4,9 milhões) integram nossa lista.
Finalmente, observe que a lista apresenta, no total, cento e quarenta e seis línguas, ou
seja, menos de 2% das quase sete mil de que se tem notícia. Isso indica que mais de 80% das
línguas do mundo são faladas por comunidades de menos de 4 milhões de pessoas.
93
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TABELA 1
Línguas mais faladas
Língua Família Pais de base Estimativa 1 Estimativa 2
(Língua materna) (Língua materna +
segunda língua)
Chinês Sino-Tibetano China 1.213.000.000 1.393.000.000
Espanhol Indo-Europeu Espanha 329.000.000 410.000.000
Inglês Indo-Europeu Reino Unido 328.000.000 508.000.000
Árabe Afro-Asiático Arábia Saudita 221.000.000 420.000.000
Hindi Indo-Europeu Índia 182.000.000 487.000.000
Bengali Indo-Europeu Bangladesh 181.000.000 210.000.000
Português Indo-Europeu Portugal 178.000.000 200.000.000
Russo Indo-Europeu Rússia 144.000.000 280.000.000
Japonês Japonês Japão 122.000.000 130.000.000
Alemão Indo-Europeu Alemanha 90.000.000 130.000.000
Javanês Austronésio Indonésia 84.600.000 89.600.000
Lahnda Indo-europeu Paquistão 78.300.000 78.300,000
Telugu Dravídico Índia 69.800.000 85.000.000
Vietnamita Austro-asiático Vietnam 68.600.000 85.000.000
Marathi Indo-Europeu Índia 68.100.000 71.000.000
Francês Indo-Europeu França 67.800.000 130.000.000
Coreano Coreano Coreia 66.300.000 70.000.000
Tamil Dravídico Índia 65.700.000 70.000.000
Italiano Indo-Europeu Itália 61.700.000 61.700.000
Urdu Indo-Europeu Paquistão 60.600.000 104.000.000
Turco Altaico Turquia 50.800.000 90.000.000
Gujarati Indo-Europeu Índia 46.500.000 46.500.000
Polonês Indo-Europeu Polônia 40.000.000 50.000.000
Malay Austronésio Malásia 39.100.000 39.100.000
Bhojpuri Indo-Europeu Índia 38.500.000 38.500.000
Awadhi Indo-Europeu Índia 38.300.000 38.300.000
Ucraniano Indo-Europeu Ucrânia 37.000,000 47.000.000
Malaiala Dravídico Índia 35.900.000 48.000.000
Kannada Dravídico Índia 35.300.000 64.000.000
Mahithili Indo-Europeu Índia 34.700.000 45.000.000
Sundanês Austronésico Indonésia 34.000.000 40.000.000
Burmese Sino-Tibetano Miamar 32.300.000 42.000.000
Oriya Indo-Europeu Índia 31.700.000 32.000.000
Persa Indo-Europeu Irã 31.400.000 100.000.000
Marwari Indo-Europeu Índia 31.100.000 31.100.000
Panjabi Indo-Europeu Índia 28.200.000 28.200.000
Filipino Austronésio Filipinas 28.000.000 50.000.000
Bhojpuri Indo-Europeu Índia 26.000.000 126.000.000
Hauçá Afro-Asiático Nigéria 25.000.000 25.000.000
Tagalog Austronésio Filipinas 23.900.000 85.000.000
Romeno Indo-Europeu Romênia 23.400.000 30.000.000
Indonésio Austronésio Indonésia 23.200.000 140.000.000
94
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
95
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TABELA 2
Línguas e falantes das cinco grandes áreas linguísticas mundiais
Área de Línguas Falantes
origem
Número de Percentual Número de Percentual Média Ponto
línguas falantes médio
África 2.110 30,5% 726.453.403 12,2% 344.291 25.200
América 993 14,4% 50.496.321 0,8% 50.852 2.300
Ásia 2.322 33,6% 3.622.771.264 60,8% 1.560.194 11.100
Europa 234 3,4% 1.553.360.941 26,1% 6.638.295 201.500
Pacífico 1.250 18,1 6.429.788 0,1% 5.144 980
Totais 6.909 100% 5.959.511.717 100% 862.572 7.560
Fonte: Lewis, 2009, p. 19.
(a) Como você pode observar na segunda coluna, a área com menos línguas é a
Europa, com 234, enquanto a Ásia e a África são as duas regiões com mais línguas,
respectivamente 2.322 e 2.110.
(b) Assim, as línguas europeias representam apenas 3,4% das línguas do mundo,
96
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
97
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
menos de 100 mil pessoas está condenada ao desaparecimento. Uma projeção de ordem geral
indica que 55% das línguas do mundo contam com menos de 10 mil falantes, um quarto delas
com menos de mil. É provável, portanto, que algumas das línguas do Pacífico acima
computadas já tenham desaparecido desde a publicação desses dados. Mas também nas
Américas a situação é precária: a média é de pouco mais de 50 mil falantes por língua (e
recorde-se que apenas o quêchua e o guarani somam 15 milhões, ou seja, quase 30% do total
de 50 milhões de pessoas que falam línguas americanas), o ponto médio sendo de pouco mais
de dois mil falantes.
Outro modo de analisar a situação linguística do mundo é agrupar as línguas por
famílias, o que pode nos fornecer uma perspectiva histórica complementar à relativa às áreas
linguísticas. O que se modifica, neste caso, é que, por exemplo, algumas línguas da área
europeia, como o húngaro e o finlandês, da família urálica, não serão agrupadas com o grupo
principal nesse espaço, o indo-europeu, ao passo que uma parte das línguas da Ásia, como o
persa, o hindi e o bengali, o serão.
Os dados relativos às seis maiores famílias são os que se mostram na tabela a seguir:
TABELA 3
Famílias linguísticas
Família Línguas Falantes
Número de Percentual Número de Percentual Média Ponto
línguas falantes médio
Afro-asiática 353 5,11% 339.478.607 5,93% 961.696 20.151
Austronésia 1.246 18,03% 311.740.132 5,45% 250.193 3.384
Indo-europeia 430 6,22% 2.562.896.428 44,78% 5.960.224 150.000
Nigero-cordofoniana 1.495 21,63% 358.091.103 6,26% 239.526 26.000
Sino-tibetana 399 5,77% 1.275.531.921 22,28% 3.196.822 18.686
Trans-Nova-Guiné 561 8,12% 3.359.894 0,06% 5.989 1.245
Outras famílias 2.428 35,13% 872.763.125 15,25% 359.457 -
Observe que a família indo-europeia, com apenas 6% do total de línguas (430) atinge
quase 45% da população mundial, enquanto a família trans-Nova-Guiné, que apresenta um
número de línguas bem próximo, embora ligeiramente maior (561 línguas, ou seja, 8,12% do
total), abrange só 0,06% dos falantes. Juntas, a família indo-europeia e a sino-tibetana, que
somam 829 línguas (11,99% das línguas do mundo), cobrem quase 70% da população.
O que os dados das duas tabelas têm em comum é a concentração de grandes línguas
no espaço da Europa e da Ásia. Apontam também em comum a tendência à diminuição do
número de falantes das línguas dos outros continentes e aumento da quantidade de pessoas
que falam línguas euroasiáticas – o que a média de falantes por língua e o ponto médio
98
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
expressam com bastante clareza –, a exceção ficando por conta do grupo banto, da família
nigero-cordofoniana, pelas razões que veremos mais à frente.
Como se explicam esses fatos? Antes de tudo, devemos considerar que o destino das
línguas se liga ao destino dos povos que as falam. Hoje, por exemplo, o inglês é tão difundido
porque os Estados Unidos são muito poderosos. Mas por que os indo-europeus e os sino-
tibetanos se tornaram tão poderosos, enquanto os aborígenes australianos e os ameríndios
brasileiros não? E mais: por que foram os povos e as línguas europeus que conquistaram o
mundo e não os ameríndios que conquistaram a Europa e a Ásia?
Uma das explicações possíveis e que parece bastante razoável está no fato de que
aonde a agricultura chegou a tempos mais remotos e teve a possibilidade de espalhar-se,
inevitavelmente as comunidades agrícolas acabaram se estendendo às custas das de
caçadores e coletores. Estas últimas foram assimiladas pelas primeiras ou dizimadas – ou,
ainda, o que ocorreu em alguns casos, ficaram confinadas em pequenas áreas marginais (cf.
DIAMONDS, 2006, p. 83-192; CAVALLI-SFORZA, 2003, p. 127-176). O mesmo destino
acompanhou as línguas dessas comunidades, que acabaram desaparecendo – ou, quando
confinadas, reduzindo-se a poucos falantes, como parece ter acontecido com o basco, uma
língua europeia isolada, provavelmente falada no espaço em que ainda se encontra
anteriormente à ocupação da Europa por falantes de línguas indo-europeias. Evidentemente é
muito difícil determinar como se desenrolou a história linguística do mundo, pois isso supõe
embrenhar por eras muito antigas.
Na esteira de Diamonds e Cavalli-Sforza, vamos dar um passo atrás para verificar a
importância da agricultura nos destinos da humanidade, acompanhando seu surgimento. A
espécie humana, mas ainda não com as características cognitivas que tem, surgiu
provavelmente na África Oriental, por volta de sete milhões de anos atrás. Por volta de um
milhão de anos, essa espécie, chamada homo erectus, depois de ter-se expandido pela África,
ocupou o mundo todo, menos a Austrália e as Américas. Mas foi o homo sapiens, primeiro o
neanderthaliano e depois a espécie que podemos chamar de nossa, que ocupou o mundo
todo. A nossa espécie se desenvolveu cerca de 50 mil anos atrás, mas os neanderthalianos,
que foram completamente eliminados, já eram bons caçadores.
Não se pode ter certeza da cronologia da ocupação do mundo em épocas tão remotas,
mas uma boa hipótese é que o homem saiu da África há cerca de um milhão de anos para
ocupar o Oriente Médio, depois se dividiu em dois grupos: um foi para o leste e ocupou toda
a Ásia do Sul; outro foi para noroeste e ocupou a Europa, por volta de 500 mil anos atrás.
99
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Somente a nossa espécie, surgida faz aproximadamente 50 mil anos, conseguiu ocupar a Ásia
do Norte, cerca de 20.000 a.C., a Austrália, cerca de 40.000 a.C., e as Américas. Pelo que se
sabe, ainda que os dados não sejam tão seguros, o homem moderno chegou à América do
Norte apenas por volta de 12.000 a.C. e ocupou rapidamente todo o continente, atingindo o
extremo sul em 10.000 a.C. A ocupação das Américas foi, portanto, muito tardia, mas, ao
mesmo tempo, extremamente rápida.
Esse quadro permite responder a outra pergunta importante: por que o continente sul-
americano, que possui condições ambientais tão parecidas às da África, não possui grandes
mamíferos. Parece sensata a seguinte hipótese: o homem, na África, desenvolveu suas
próprias características cognitivas e suas próprias capacidades de caçador apenas aos poucos;
e, enquanto o homem desenvolvia essas capacidades, os animais aprendiam a defender-se.
Ao contrário, quando o homem chegou à América do Sul, depois de sete milhões de anos, já
era o homem da nossa espécie, cognitivamente muito mais evoluído e treinado por milênios
de caça. Isso fez com que ele exterminasse rapidamente todos os grandes mamíferos, os quais
estavam despreparados para lidar com um predador tão poderoso. Foi o primeiro desastre
ecológico da humanidade. Isso terá consequências importantes para a agricultura.
Sabemos que a agricultura surgiu no Oriente Médio cerca de 10.000 a.C. (mais ou
menos quando o homem chegava nas Américas). Portanto, o homem, que surgiu cerca de sete
milhões de anos atrás, passou apenas 0,5% da própria história com a agricultura – e 99,5%
sem agricultura. Ou seja, se consideramos a história da humanidade como um dia, podemos
dizer que a agricultura surgiu por volta de dez ou quinze minutos antes da meia-noite. Seria
estranho pensar somente nos últimos quinze minutos e não dar nenhuma atenção às 23 horas
e 45 minutos que vieram antes. Mesmo se nos interessássemos somente pelos humanos da
nossa espécie, aquela de todo cognitivamente desenvolvida e que acabou com os
neanderthalianos, partindo da agricultura perderíamos 80% de sua história. É preciso
considerar outro aspecto: se a agricultura se desenvolveu no Oriente Médio por volta de
10.000 a.C., nas Américas isso aconteceu somente em 1.500 d.C., na Austrália, como em outros
muitos locais, bem depois – e em alguns poucos lugares, como em algumas tribos indígenas
da Amazônia, isso ainda não se verificou. Portanto, não entender as condições de vida do
homem caçador significaria não entender os índios brasileiros até a chegada dos portugueses
e as condições de algumas tribos até hoje.
Os caçadores-coletores viviam de maneira muito diferente dos agricultores, ou seja, de
nós. Eles se alimentavam, obviamente, com o que a natureza oferecia: os frutos naturalmente
produzidos pela vegetação nativa e os animais que eles conseguiam caçar. Periodicamente,
mudavam de lugar, sendo nômades. Isso era necessário para fazer com que uma área, cujos
produtos já tivessem sido desfrutados, pudesse regenerar-se. Eles não podiam guardar nada,
100
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
porque os frutos e as carnes, depois de poucos dias, apodrecem. De igual modo, não podiam
formar grupos muito numerosos, porque a natureza não forneceria alimento para muitas
pessoas e seria difícil transportar as crianças quando se mudava de área. Assim, as
comunidades de caçadores-coletores eram formadas por um número pequeno de indivíduos
e ocupavam uma área muito grande. Existia um equilíbrio natural entre o espaço geográfico-
alimentar e o número de indivíduos que nele podia ser hospedado.
Obviamente, a vida de uma comunidade de caçadores-coletores era muito simples: a
atividade principal era destinada à busca de comida, com as mulheres se dedicando à coleta e
os homens à caça. Eles tinham alguns rituais, fabricavam alguns objetos de pedra e madeira,
não possuindo uma verdadeira hierarquia interna, pois todos desempenhavam as mesmas
poucas atividades. De vez em quando, entravam em contato com comunidades vizinhas, que
moravam, de toda maneira, bem longe, por poucas razões: para trocar parceiras em
casamento; para trocar produtos, ou seja, para um comércio extremamente incipiente; para
fazer a guerra pelo domínio do território e de seus recursos alimentares. De vez em quando,
se a comunidade crescia demais, uma parte se separava para buscar recursos. Em suma, a
população não tinha muitas possibilidades de crescer. O limite de recursos controlava a
população e, quando isso não era suficiente, a guerra com os vizinhos fazia o resto.
Quando surge a agricultura, esse equilíbrio se quebra definitivamente. O homem pode
plantar seus produtos, acumular bens, morar sempre no mesmo lugar. Manipulando a
natureza, ele consegue uma quantidade de produtos superior ao necessário para a
sobrevivência imediata e não precisa mais limitar o número de membros da comunidade.
Deixando de ser nômade, não tem mais problemas de transporte e pode ter mais filhos e
riquezas. O crescimento traz, assim, várias consequências, esquematizadas no quadro que
segue:
101
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 1
Organizações populacionais humanas
Tipo de organização Bando Tribo Tribo Estado
centralizada
Dimensão
Número de pessoas Dezenas Centenas Milhares Mais de 50.000
Assentamentos Nômade Vilarejo Vilarejos Cidades
Relações Parentesco Clã Classe social Classe social
Etnias e línguas Uma Uma Uma Uma ou mais
Formas de governo
Decisões Igualitárias Influenciadas por Centralizadas Centralizadas
um chefe
Burocracia Não existe Não existe Simples Complexa
Controle do poder Não existe Não existe Sim Sim
Solução de conflitos Informal Informal Centralizada Leis, juízes
Hierarquia dos Não existe Não existe Vilarejo central Cidade central
assentamentos
Religião
Justifica a Não Não Sim Sim > não
cleptocracia?
Economia
Agricultura e criação Não Não > sim Sim > intensiva Intensiva
animal?
Divisão trabalho? Não Não Não > sim Sim
Trocas? Recíprocas Recíprocas Redistribuídas Redistribuídas
(impostos) (impostos)
Organização social
Estratificação? Não Não Sim (clã) Sim
Escravidão? Não Não Em pequena Em grande
escala escala
Produção de bens de Não Não Sim Sim
luxo para as elites?
Edifícios públicos? Não Não Não > sim Sim
Escrita? Não Não Não Frequentemente
Fonte: Diamonds, 2006, p. 268.
103
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Quando, ao contrário, uma sociedade agrícola cresce, é sempre a mesma língua que cresce.
Portanto, um contexto de comunidades de caçadores-coletores gera um contexto de muitas
línguas, cada uma delas com poucos falantes. Um contexto agrícola faz com que a uma
organização social corresponda uma única língua com muitos falantes. Os locais de
agricultura mais antiga, Oriente Médio, Europa e Ásia, são aqueles onde se encontram
também as mais antigas organizações estatais (Egito, Mesopotâmia, China, Pérsia, Grécia,
Roma etc) e as famílias linguísticas predominantes (principalmente a sino-tibetana, a indo-
europeia e a afro-asiática). Os locais onde a agricultura chegou mais tarde ou ainda não
chegou, são onde se encontram línguas faladas por pequenos grupos.
Como vimos, a Europa é, de longe, o continente com a menor diferenciação linguística.
Mas, ao mesmo tempo, é famosa exatamente pela impressão que dá ao viajante de que com
frequência há mudança de línguas. Quem se desloca por aquele continente percebe isso
claramente, enquanto quem viaja pelo Brasil ou pelos Estados Unidos tem a sensação que
esses paises, tão vastos quanto a Europa, são monolíngues, sem suspeitar que a diferenciação
linguística americana e brasileira é muito maior do que a europeia. Como explicar essa
contradição? Com a colonização iniciada no século XVI, os europeus empurraram as
comunidades locais que sobreviveram aos processos de extermínio e assimilação para lugares
impenetráveis, como a floresta amazônica, ou para pequenas reservas. Portanto, na maior
parte dos países da América há uma língua que abrange a quase totalidade do território e dos
falantes e muitas línguas faladas em pequenos enclaves pouco acessíveis e com pouquíssimos
falantes.
Como aconteceu esse processo? Como foi possível que poucos milhares de espanhois,
ingleses e portugueses destruissem, em poucas décadas, de 90 a 95% da população
ameríndia? Não foi somente nem principalmente com a força das armas, mas com uma força
que nem os próprios europeus imaginavam ter: a das doenças. De fato, um bom pacote
agrícola, como o euro-asiático, juntava a produção estritamente agrícola com a criação de
animais domésticos, os quais, dependendo do lugar, podiam ser vários, mas quase todos
parecem ter uma origem medio-oriental: a galinha, o boi, a cabra, a ovelha etc. Eles
contribuíam de várias maneiras: com as peles e a lã, para fazer tecidos; com a carne e os ovos,
para fornecer as proteínas antes encontradas na caça; com o leite e seus derivados, para
enriquecer a alimentação; com sua força de tração, para guiar o arado e melhorar as técnicas
agrícolas, bem como para facilitar o transporte. Trata-se de um conjunto poderosíssimo de
vantagens. Ora, como homens e animais passam a viver juntos, isso fez com que passassem a
compartilhar também as doenças. Como nos países de agricultura mais antiga o contato entre
homem e animais foi gradual, os agricultores desenvolveram também anticorpos contra as
enfermidades transmitidas pelos animais domésticos. Quando sociedades que vinham de
104
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
milênios de agricultura, como as dos portugueses, dos espanhois e dos ingleses, entraram em
contato com as comunidades indígenas das Américas, estas não tinham nenhuma defesa
contra as epidemias comuns na Europa, seus integrantes vindo a morrer de gripe, varíola e
outras enfermidades. (Cf. DIAMOND, 2006, p. xx)
Precisamos agora formular e responder outra pergunta. Por que a agricultura nasceu
no Oriente Médio e por que se desenvolveu tão bem na Eurásia? E ainda: por que a
agricultura não nasceu ou não se desenvolveu em outros continentes com a mesma pujança
que na Eurásia? Um primeiro problema é dado pelo fato de que parece que as condições de
vida dos agricultores, por muito tempo, foram piores que as dos caçadores-coletores. Os
dados arqueológicos mostram uma redução da estatura dos primeiros agricultores e uma
dimuição na duração de suas vidas. Por que então se passou da caça à agricultura? Como
normalmente acontece na história, parece que o motivo da mudança foi uma crise. Neste caso,
uma crise relativa às condições ambientais, como uma redução forte e imprevista dos animais
e dos frutos por motivos desconhecidos. A população teve então de inventar um novo
sistema de sobrevivência e começou a cultivar, com técnicas rudimentares, frutos que
certamente eram de qualidade e tamanho muito diferentes daqueles que temos agora, após
treze mil anos de domesticação. Mas aos poucos o novo sistema foi-se aperfeiçoando e
revelou potencialidades impensáveis, como vimos pelas consequências que trouxe. Portanto,
nos lugares onde não ocorreram as mesmas dificuldades, as populações não tiveram motivos
para mudar os hábitos tradicionais.
Observe-se que a agricultura surgiu, mesmo que não em épocas tão antigas, também
em outros locais: na Amazônia, no vale do Mississipi, no nordeste dos Estados Unidos, nos
Andes, nas montanhas de Papua-Nova Guiné, na África Oriental, na região entre Camarões e
a Nigéria. O que fez com que esses lugares não produzissem civilizações poderosas, como as
da China, da Europa e do Oriente Médio? É provável, como crê Diamonds, que sobretudo
devido também a questões ambientais. De fato, o pacote desenvolvido na China e no Oriente
Médio tinha dois motivos para prevalecer fortemente.
O primeiro, que nas Américas e em Papua-Nova Guiné praticamente não existiam
mais grandes mamíferos, todos massacrados, provavelmente, na primeira chegada do
homem. A África subsaariana possuía muitos grandes mamíferos, mas nenhum domesticável:
até hoje ninguém conseguiu domesticar leões, veados, girafas ou zebras; quanto aos elefantes,
podem ser adestrados, mas não podem se reproduzir nesse estado. O mesmo pode ser dito,
ainda que com menos evidências, com relação às plantas. O inhame da África, a batata doce
de Papua-Nova Guiné e a mandioca da Amazônia não podiam competir com o trigo medio-
oriental e com o arroz chinês.
O segundo motivo parece estar na estrutura geográfica dos continentes: a Eurásia se
105
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
estende ao longo de um eixo leste-oeste e, portanto, apresenta o mesmo clima por toda a sua
extensão. Além disso, não existem grandes barreiras entre o Oriente Médio, a Europa e a
Ásia. Isso fez com que os pacotes agrícolas fossem transportados e se integrassem com
facilidade em várias regiões. Ao contrário, a África e as Américas se estendem ao longo do
eixo norte-sul, com abruptas mudanças de clima, o que torna difícil transportar de uma
região para a outra a mesma planta ou mesmo animal, em vista das condições ambientais. A
isso aliam-se barreiras naturais. A agricultura que surgiu nas montanhas andinas não desceu
para a Amazônia, apesar da pouca distância. Na África, o deserto do Saara funcionou como
uma grande barreira entre o resto do continente e o Oriente Médio, bem como a Nigéria
estava separada, pela floresta equatorial, da África oriental.
Ora, nas tabelas anteriores você pôde verificar que duas famílias linguísticas, a indo-
europeia e a sino-tibetana, ou seja, as maiores da Eurásia, com apenas 829 línguas (muitas das
quais faladas por comunidades muito pequenas), abrangem 3,8 bilhões de falantes, uma alta
percentagem da população mundial. Todavia, enquanto a família sino-tibetana está
localizada numa única região da Ásia, a indo-europeia está presente em todos os continentes.
Esses dados apresentam dois aspectos: (a) que a agricultura, surgida e desenvolvida nos dois
continentes da Eurásia, determinou em grande parte que as grandes famílias euroasiáticas
crescessem como nenhuma outra do planeta; (b) mas também algo, num certo ponto da
história, determinou que somente os europeus se expandissem por outros continentes,
enquanto os asiáticos permaneceram numa região definida. Isso é verdade até certo ponto,
pois a também a família indonésia chegou até Madagascar, expandindo-se por uma enorme
área do Oceano Índico e do Pacífico.
O que determinou que os europeus viajassem até as Américas e os chineses, com uma
cultura, uma economia, um potencial militar e uma frota naval superiores, ficassem parados?
Parece que a resposta está na crise que a Europa viveu com a grande peste do século XIV, a
qual destruiu as populações numa fase de grande expansão econômica. O continente já tinha
passado antes por uma crise gigantesca, com a queda do Império Romano, como se pode
constatar por seu decréscimo em termos demográficos: se na parte da Eurásia pertencente ao
Império Romano – de Portugal até o Oriente Médio, incluindo o norte da África – a
população era, por volta do nascimento de Cristo, de mais de 200 milhões, com a crise que se
seguiu à dissolução decresceu consideravelmente, voltando ao mesmo patamar somente mais
de mil anos depois. A grande peste de metade do século XIV também produziu abrupta
diminuição populacional, somente por volta de 1500 voltando a verificar-se números
compatíveis com os anteriores à epidemia. Por que essas crises poderiam apontar alguma
explicação para o fato de terem sido os europeus (e não os chineses) a chegar nos outros
continentes? O que parece que aconteceu foi que, com a retomada do crescimento
106
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TABELA 4
Línguas mais faladas, famílias e áreas linguísticas
Língua Família Área linguística Número de falantes
Chinês Sino-Tibetano, Chinês Asiática 1.393.000.000
Inglês Indo-Europeu, Germânico Europeia 508.000.000
Hindi Indo-Europeu, Indo-Iraniano, Índico Asiática 487.000.000
Árabe Afro-Asiático, Semítico Asiática 420.000.000
Espanhol Indo-Europeu, Itálico, Românico Europeia 410.000.000
Russo Indo-Europeu, Eslavo Europeia 280.000.000
Bengali Indo-Europeu, Indo-Iraniano, Índico Asiática 210.000.000
Português Indo-Europeu, Itálico, Românico Europeia 200.000.000
Japonês Japonês Asiática 130.000.000
Alemão Indo-Europeu, Germânico Europeia 130.000.000
Francês Indo-Europeu, Itálico, Românico Europeia 130.000.000
107
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TABELA 5
Línguas ameaçadas de extinção
Área de origem Número total de Línguas ameaçadas de Percentual de línguas
línguas extinção ameaçadas na área
América 1.002 170 16,96%
Pacífico 1.310 210 16,03%
Europa 239 12 5,02%
Ásia 2.269 78 3,43%
África 2.092 46 2,19%
108
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
acadêmico italiano Matteo Giulio Bartoli, ele próprio natural de uma região próxima, a Ístria,
visitou, em 1897, Tuone Udaina, registrando cerca de 2.800 palavras do velhoto, além contos e
relatos da vida de seu informante. A partir, sobretudo, desse material, Bartoli escreveu um
livro tratando do vocabulário, da fonologia e da gramática do dálmata, obra publicada em
tradução para o alemão (Bartoli, M. G. Das Dalmatische. Viena: Kaiserliche Akademie der
Wissenschaft, 1906). É assim que o registro dessa língua românica oriental não se perdeu,
permitindo o conhecimento de fenômenos fonológicos, morfológicos e sintáticos que ela
compartilha com o romeno e o vêneto, bem como de características próprias apenas a ela. (cf.
VIDOS, 1973, p. 315-317).
Outro exemplo recentíssimo é o do bo, língua falada nas ilhas Andaman, no Golfo de
Bengala, Índia. Conforme noticiou a Profa. Anvita Abbi, do Centro de Linguística da
Universidade Jawaharlal Nehru (Nova Delhi), com a morte de Boa Sr., em Port Blair, em 26
de janeiro de 2010, aos 85 anos, desapareceu a última falante desta língua. Esta já não tinha
mais com quem conversar no seu idioma materno, razão por que aprendera também outras
línguas andamanesas da mesma ilha, além do hindi, mas era o único membro de sua etnia
que se recordava das antigas canções em bo. Em novembro de 2009, no mesmo local, também
a morte de Boro F. representara o fim da última falante do khora, outra língua andamanesa.
Conforme a Profa. Abbi, que mantém o projeto VOGA (Vanishing Voices of the Great
Andamaneses), é provável que essas línguas remontem à era pré-neolítica, quando os
primeiros homens se instalaram na região, contando elas, portanto, com quase setenta mil
anos (cf. Abbi, Vanishing Voices of the Great Andamaneses).
109
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
LEITURA COMPLEMENTAR
Ranka Bjeljac-Babic
110
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
“comércio”.
O ritmo de extinção das línguas alcançou, assim, proporções sem precedentes na
história: dez a cada ano, em escala mundial. Segundo os prognósticos mais sombrios, de 50%
a 90% das línguas faladas hoje em dia morrerão no curso do presente século. Preservá-las é
um assunto urgente.
As consequências do desaparecimento das línguas são graves em mais de um sentido.
Em primeiro lugar, se nos tornássemos uniformemente monolíngues, é possível que nosso
cérebro acabasse afetado ao ponto de perder parte de sua capacidade inata de criação
linguística. Na sequência, todas as tentativas de remontar às origens da linguagem humana se
tornariam impossíveis e o mistério do “primeiro idioma” jamais seria elucidado. Por último,
com a morte de cada língua, um capítulo da história da humanidade se fecha para sempre.
O plurilinguismo é o reflexo mais fiel do multiculturalismo. A eliminação do primeiro
acarretará inevitavelmente a perda do segundo. Impor um idioma – seja regional ou
internacional – a populações cuja cultura e estilo de vida não se identificam com ele é fazer
calar a expressão de seu espírito coletivo. As línguas não só são o meio primordial de
comunicação entre os seres humanos, como encarnam também a visão de mundo de seus
falantes, sua imaginação, suas formas de transmitir o saber. Apesar de seu parentesco,
refletem de maneira diferente a realidade. Se tratarmos de inventariar as diferentes palavras
que existem em todos os idiomas para expressar estritamente o mesmo sentido, damo-nos
conta de que há no máximo 300, tais como ‘eu’, ‘tu’, ‘nós’, ‘quem’, ‘que’, ‘não’, ‘tudo’, ‘um’,
‘dois’, ‘grande’, ‘comprido’, ‘pequeno’, ‘mulher’, ‘homem’, ‘comer’, ‘ver’, ‘ouvir’, ‘sol’, ‘lua’,
‘estrela’, ‘água’, ‘quente’, ‘frio’, ‘branco’, ‘preto’, ‘noite’, ‘terra’ ...
O perigo que ronda o plurilinguismo é análogo ao que afeta a biodiversidade. Não só
porque a grande maioria das línguas são “espécies” em vias de desaparecimento, como
também porque entre a diversidade biológica e a diversidade cultural existe um laço
intrínseco e causal. Do mesmo modo que as espécies vegetais e animais, as línguas em perigo
são endêmicas, ou seja, estão confinadas em regiões exíguas. Mais de 80% dos países onde
existe uma “megadiversidade” biológica formam parte dos que albergam o maior número de
línguas endêmicas. Essa correlação explica-se pelo fato de que os grupos humanos, ao
adaptar-se ao entorno em que evoluem, criam um conhecimento especial de seu ambiente,
que reflete em sua língua e, muitas vezes, unicamente nela. Grande parte dos recursos
naturais em perigo só são conhecidos atualmente por alguns povos cujas línguas estão em
extinção. Ao morrer, estas levam consigo todo o saber tradicional sobre o meio-ambiente.
Em 1992, a Cúpula do Rio criou dispositivos para lutar contra a redução da
biodiversidade. Chegou a hora do “Rio das línguas”. A tomada de consciência da necessidade
de proteger esse patrimônio surgiu em meados do século XX, quando os direitos linguísticos
se integraram à Declaração Universal dos Direitos Humanos. Desde então tiveram início
diversos projetos internacionais voltados para salvaguardar o que agora se reconhece como
patrimônio da humanidade. Ainda que não logrem pôr término ao processo de extinção das
línguas, têm o mérito de atenuá-lo e de promover o plurilinguismo no mundo.
111
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
EXERCÍCIO
112
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(1) Considerando-se a tabela que cataloga as línguas neste capítulo, explique porque algumas
vezes os dados da ''estimativa 1'' e da ''estimativa 2'' coincidem.
(2) Explique qual a razão de falantes do inglês nativos da Austrália serem computados como
pertencentes à área linguística europeia no Tabela 2.
(3) Qual a área linguística com menor número de línguas?
(4) Com relação ao número de falantes, qual a área linguística mais representativa?
(5) Qual a média de falantes por língua da área europeia? E das áreas africana e asiática?
(6) Em que situação pode-se considerar que uma determinada língua está condenada ao
desaparecimento?
(7) Qual a principal diferença em realizar um agrupamento de idiomas por área linguística e um
agrupamento baseado em um critério de parentesco, isto é, um agrupamento por famílias
linguísticas?
(8) Juntas, duas famílias linguísticas abrangem quase 70% da população mundial. Quais são elas?
(9) Quais as tendências comuns sinalizadas pelas tabelas 1 e 2?
(10) Explique o motivo pelo qual o estabelecimento da agricultura foi crucial para a
expansão de certas comunidades lingüísticas e para o declínio de outras.
(11) Em que região do mundo surgiu, há sete milhões de anos atrás, a espécie humana –
embora não com as características cognitivas que possui atualmente?
(12) Por que o continente sul-americano, que detém características ambientais similares às
da África, não possui grandes mamíferos?
(13) Quando a agricultura se desenvolveu no Oriente Médio? E nas Américas?
(14) Por que as comunidades de caçadores-coletores eram constituídas por um número
pequeno de indivíduos?
(15) Atentando-se ao Quadro 1, responda por que passa-se de uma organização igualitária
para uma estratificação em classes sociais.
(16) Por que a escrita é capaz de realizar uma mudança de foco e de cognição nas sociedades
em que é empregada?
(17) Por que, nos primeiros estágios representados no quadro, há apenas uma língua e, no
último, várias?
(18) Explique o motivo pelo qual um viajante que atravessa territórios europeus tem a
sensação de viver uma realidade de pluralidade linguística enquanto um viajante que
atravessa o território brasileiro tem a sensação de estar em um país monolíngüe.
(19) Por que locais como a Amazônia, o vale do Mississipi, os Andes e Papua Nova-Guiné,
em que houve o surgimento da agricultura, não surgiram civilizações poderosas, como as da
China, Europa e Oriente Médio?
113
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(20) Por que os europeus adquiriram predominância indiscutível nos projetos de expansão
marítima e colonização de terras no além-mar enquanto a China, com um potencial militar e
uma frota naval superiores, não se lançou em uma aventura similar?
(21) Levando em consideração a Tabela 5, por que se pode afirmar que nas áreas com menos
línguas ameaçadas a grande extinção já ocorreu há tempos?
114
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 7
SISTEMAS DE ESCRITA
Introdução
A escrita foi inventada há aproximadamente 10.000 anos, o que permitiu que os seres
humanos transmitissem e acumulassem com mais eficácia, de geração a geração, descobertas
e experiência de seus antecessores. Assim, ao nascermos, podemos ter acesso bastante
detalhado ao conhecimento adquirido pelas gerações anteriores. Isso permite progressos
impossíveis de existir em sociedades ágrafas, isto é, sem escrita, ou em grupos de outros
animais. Os sistemas de escrita não só são sofisticados por si só como derivaram de
antecedentes complexos. Provavelmente, todos eles têm como origem alguma escrita pictórica
primitiva e todos também são artificiais, ao contrário da linguagem oral, natural aos seres
humanos.
A escrita pode ser definida como a representação da linguagem falada por meio de
signos gráficos. É a interpretação de uma língua falada, seus elementos, seu ordenamento e as
relações desses elementos uns com os outros. Estes sinais materiais visíveis podem variar
muito de grupo para grupo humano, mas todos apresentam algumas características gerais: (i)
elementos básicos e definidos, os grafemas19; (ii) normas e convenções arbitrárias
compreendidas e compartilhadas por uma comunidade de fala; (iii) meios físicos (escrita no
papel, na tela do computador etc) para representar o sistema de escrita, permitindo que seus
usuários o interpretem.
Horcades (2004, p. 15) faz a seguinte afirmação:
Letras são como abelhas. Uma abelha sozinha é apenas um inseto irracional. Mas, se
observarmos uma colméia com seu funcionamento extremamente complexo, com
operárias, soldados, babás, faxineiras, zangões e rainha, veremos que esses insetos
primitivos desempenham funções bem determinadas. A abelha não tem inteligência
individual, mas a colméia possui inteligência coletiva.
Isso acontece também com as letras. Uma letra sozinha não vale nada. Mas letras
juntas formam palavras, e palavras são pensamentos.
19Grafema, conforme Ferreira (s/d), é um símbolo gráfico constituído por traços gráficos distintivos que
permitem o entendimento visual das palavras na língua escrita. É uma designação mais ampla do que letra,
porque também abarca diacríticos, ideogramas e sinais de pontuação.
115
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Os sistemas de escrita são muitos e podem ser classificados de várias maneiras, como
você verá em seguida. Para Fischer (2003), essas classificações não são uma tarefa fácil, pois os
critérios de cada uma podem variar: tipológico, cronológico, genealógico, geográfico... Além
do mais, muitos sistemas de escrita são mistos e há uma gama de empréstimos e inovações
que tornam semelhantes sistemas sem relação direta um com o outro. Ferdinand de Saussure,
em seu Curso de linguística geral, acredita que haveria dois sistemas básicos de escrita, o
ideográfico e o chamado fonético. Aqui vai uma proposta de desenvolvimento desses dois
tipos básicos.
1 Sistemas ideográficos
20 Ideograma é “um símbolo gráfico ou um desenho que representa um objeto ou uma ideia.” (HOUAISS, 2001,
p. 1565).
21 Era Comum, equivalente à Era Cristã, mas sem conotação religiosa.
116
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
1.2 O chinês
Falada por um quarto da população humana, a língua chinesa tem pelo menos 4.000
anos de existência. Inicialmente, os chineses desenhavam os objetos que queriam representar.
Com o passar do tempo, passaram a combinar esses desenhos para representar ideias
abstratas. Assim, o símbolo que representa “mulher”, se repetido duas vezes, significa
“discussão”; “escutar” é representado por “ouvir” seguido de “porta”; “sincero” ou
“verdadeiro” = “homem” + “palavra”.
Atualmente, todo caractere chinês é composto de dois elementos, uma chave ou radical
e um elemento fonético. Se por um lado esse novo sistema de escrita, denominado hsing shen,
aumentou o número de caracteres na escrita chinesa, por outro eliminou muitas
ambiguidades. A palavra k´o (rio), por exemplo, é composta por um primeiro elemento que
significa fruta e que também indica como deve ser a pronúncia final da palavra. Adiciona-se a
ele o símbolo determinativo shui, que significa água. Outros exemplos
(http://www.omniglot.com/writing/chinese.htm):
kung (trabalho manual) + hsin (coração) = k´ung (impaciência);
kung (trabalho manual) +yen (palavra) = kung (luta)
Para não haver confusão entre as dezenas de milhares de caracteres diferentes, o
número e a forma de cada traço são feitos com bastante rigor. A escrita tradicional é em linhas
verticais, de cima para baixo. Entretanto, atualmente, também encontramos textos na
horizontal.
O sistema de escrita dos maias e dos astecas manifestou-se a partir do século III EC.
Até hoje não foi completamente decifrado, em parte porque os missionários espanhóis
queimaram a maioria dos manuscritos astecas e praticamente todos os documentos maias. As
escritas maias e astecas podem ser chamadas de transicionais por se encontrarem um pouco
além da fase ideográfica, apresentando alguma fonetização.
Da língua dos maias, presentes na Guatemala, Yucatán (um dos estados mexicanos) e
Baixo México, só foi possível isolar os sinais dos meses e dos dias do calendário. O que se
chama de Antigo Império Maia pode ser situado por volta do século I EC. Nessa época, a
matemática e a astronomia estavam bastante adiantadas e seu calendário cobria um período
de 500 milhões de anos. Sobreviveram apenas três manuscritos, preservados pelo bispo Diego
117
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
de Landa, que também destruiu grande número de manuscritos maias. Entretanto, chegaram
até o presente grandes colunas monolíticas com caracteres e figuras esculpidas em baixo
relevo (estelas), pedras ovais (possíveis altares), esculturas e gravuras de metal, osso e
madeira. Segundo fontes espanholas, a escrita maia foi utilizada até fins do século XVII, mas
mesmo assim continua por decifrar. Para os maias, a escrita foi inventada pela divindade
Itzamná, sendo seu conhecimento limitado aos sacerdotes, seus filhos e alguns senhores
(http://www.famsi.org/mayawriting/index.html).
Abaixo, alguns elementos do silabário maia:
118
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
O sistema cuneiforme (< latim cuneus, “cunha”; forma, “forma”) é a escrita mais antiga
que se conhece. Apesar de decifrado no século XIX, sua origem continua obscura. Isso porque
apresenta muitas semelhanças com outras escritas, como a dos egípcios e dos povos do vale
do Indo, situado no subcontinente indiano. Por volta de IV aEC, os sumérios invadem e
conquistam o sul da Mesopotâmia, situada no Oriente Médio, entre os rios Eufrates e Tigre.
No século XX, mais de mil tabuinhas e fragmentos foram encontrados em Ur, uma cidade da
Mesopotâmia, com inscrições em língua sumérica. Inicialmente uma escrita figurativa, torna-
se transitória e finalmente ideográfica e fonética.
Com o passar do tempo, os escribas suméricos se deram conta de que os caracteres
tornavam-se mais nítidos se impressos na superfície de argila endurecida ao sol do que
riscados. Assim, as curvas, círculos e linhas foram substituídos por traços curtos e estreitos.
Esses traços eram feitos com um pedaço reto de cana, osso, madeira dura ou metal. A escrita
era feita da esquerda para a direita. Para evitar as ambiguidades dos símbolos cuneiformes,
os escribas criaram os determinativos, uma classe de sinais colocados antes ou depois das
palavras. Não eram pronunciados, mas indicavam a classe geral a que pertencia a palavra.
2 Sistemas fonéticos
119
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Nessa escrita, cada sinal corresponde a uma letra. Em relação à escrita silábica, a
alfabética representa não só maior complexidade ideológica como também maior
simplificação técnica.
Não se sabe com certeza que povo ou quais povos teria(m) criado o alfabeto. Em
relação ao Ocidente, a partir da Era Comum, a escrita alfabética espalhou-se na Europa graças
aos gregos e aos romanos. O desejo de propagação do Cristianismo aos pagãos fez com que os
apóstolos constituíssem novos alfabetos tomando por modelo o alfabeto lido por eles
mesmos. Assim, os alfabetos gótico e eslavo tiveram como modelo o grego.
A Fenícia é o ponto de partida para as especulações relativas ao surgimento do
alfabeto. Mas, de onde os fenícios obtiveram tal invenção? Como e quando apareceu? Supõe-
se que o alfabeto fenício tenha chegado à Grécia por volta de 900 aEC. Entretanto, há duas
importantes diferenças entre eles: o sistema consonantal e o uso de vogais, ausentes na escrita
fenícia. Os mais antigos textos que chegaram até nós, datados do século VIII aEC, já
apresentam essas transformações.
A questão da origem dos alfabetos pode ser iniciada pelo alfabeto norte-semítico,
considerado como a mais antiga escrita alfabética. Era formada por 22 símbolos consonantais
escritos da direita para a esquerda, tendo existido por volta do século II aEC.
O exemplar mais antigo de um abecedário completo foi descoberto na costa da Síria,
em Ugarit, em 1929. Trata-se de uma escrita impressa em placas de barro que vai da esquerda
para a direita. Ela é a atestação da existência de uma provável escrita alfabética semítica por
volta dos séculos XVI ou XV aEC. Os atuais Israel e Síria são, provavelmente, as regiões onde
se originou a invenção do alfabeto.
Vamos nos ater, aqui, a quatro alfabetos: o hebraico, o arábe, o grego e o latino.
O alfabeto hebraico originou-se da escrita aramaica. Esta, por sua vez, proveio da
fenícia. O que se chama de hebraico quadrado é a escrita empregada durante os primeiros
séculos da Era Comum para a cópia de textos sagrados. Como o protótipo fenício, possui 22
consoantes, também usadas como sinais numéricos, e sua direcionalidade é da direita para a
esquerda. Para se evitar erros de leituras dos textos sagrados, notam-se com sinais - pontos ou
acentos - as vogais, a pronúncia das consoantes e o lugar do acento tônico.
O árabe, como o hebraico, é uma escrita consonântica ainda em uso e escrita da direita
para a esquerda. A origem do alfabeto árabe é obscura, apesar de a tradição atribuir sua
invenção a um membro da família de Maomé. A primeira inscrição atestada em caracteres
árabes é uma inscrição trilíngue em grego, siríaco e árabe, datada de 512-513 EC. O alfabeto é
120
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
constituído de 28 letras que podem apresentar pontos diacríticos acima ou abaixo delas. O
árabe foi adotado por muçulmanos falantes de línguas não semíticas. Assim, por exemplo, há
na Espanha literatura em língua espanhola escrita em caracteres árabes, as aljamias. Como o
chinês, a escrita árabe é “um elemento de unidade, visto que é o veículo da língua clássica
compreendida por todos os letrados, ao passo que a língua falada se fragmentou em
múltiplos dialetos”, como esclarece Higounet (2003).
A escrita grega tem importância ímpar para o Ocidente: além de ter sido usada para
registrar língua e culturas riquíssimas, foi intermediária entre o alfabeto semítico e o latino e
deu origem a numerosas outras escritas. As mais antigas inscrições datam do século VIII aEC.
É provável, então, que o empréstimo feito pelos gregos aos fenícios de seu alfabeto e sua
adaptação date do século I ou II EC. Essa adaptação foi feita regionalmente, sendo possível
encontrar diversos alfabetos locais. Finalmente, no século IV, o alfabeto jônico sobrepujou os
demais. Era composto de 24 letras, vogais e consoantes, e ia da esquerda para a direita.
Mas por que o alfabeto grego é o ancestral dos demais alfabetos ocidentais? A inovação
em relação ao uso das vogais é a resposta certa. Como em grego são as desinências que
indicam função e categoria das palavras, era preciso fixar com precisão a sua posição. Os
gregos adaptaram o sistema de notação semítica às particularidades de sua língua:
transformaram os sinais representativos das guturais em sinais vocálicos e criaram mais três
sinais para as aspiradas.
Os mais antigos testemunhos da escrita latina, que chegaram até nós, datam do fim do
século VII ou início do século VI aEC. Não há dúvida de que derivam de um alfabeto grego
ocidental, provavelmente advindo da Itália que, por sua vez, teria recebido sua escrita por
meio dos etruscos.
No século I aEC, o alfabeto latino se apresenta constituído de 23 letras. Nos séculos II e
III, surgem duas novas grafias, a uncial e a nova escrita comum. Por volta dos séculos VI e VII, o
ato de escrever se concentrará nos scriptoria eclesiásticos, resultado do desenvolvimento da
liturgia e do esfriamento da atividade econômica em geral. No início do século 9, podemos
observar o retorno a um tipo comum de escrita, a carolíngia, constituída essencialmente nos
scriptoria franceses do Reno e de Loire. A reforma educacional feita por Carlos Magno,
durante seu reinado (768-814), cria uma demanda de manuscritos que favorecerá o
desenvolvimento dessa escrita mais normatizada. Esse imperador restaura antigas escolas e
funda novas, na tentativa de reviver o saber clássico, unificando e fortalecendo seu império.
A escrita carolíngia inicia a história da escrita medieval e moderna e dá a Europa
ocidental um mesmo tipo de escrita. Apenas no século 13 começa a mudar de forma, sendo
substituída pela escrita gótica.
Há outras transformações:
121
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Nos séculos XII e XIII, a arte de escrever, até então essencialmente monástica, se
difundiu amplamente no mundo secular e leigo. A renovação intelectual e a criação
das universidades provocou uma necessidade sempre crescente de livros. A produção
e a venda de manuscritos são a partir de então organizadas nas corporações, com
estatutos e privilégios, sob o controle das autoridades acadêmicas. Por outro lado, o
desenvolvimento da administração nos grandes Estados ocidentais, o renascimento do
direito romano e a extensão do notariado fizeram crescer consideravelmente a
necessidade dos escritos. Por volta de 1200 se constituem as grandes chancelarias - e,
logo depois, a burocracia - pontifícias, francesa e inglesa; no início do século XIII
também o notariado ganhou da Itália todo o sul da França. E o impulso da vida
econômica, do grande comércio, dos bancos multiplicaram igualmente as razões de
escrever (HIGOUNET, 2003, p. 58).
Nos séculos XIV e XV, as palavras passam a ser escritas sem se levantar a pena do
papel, fragmentando a escrita gótica em uma grande variedade de tipos por toda a Europa.
No Renascimento, surge uma escrita para livros, a humanística. Será entre os tipos de
escritas da Idade Média que os primeiros fundidores de tipos gráficos escolherão seus
modelos e deles se originam nossas escritas atuais.
Dois elementos são de grande importância para mudanças ocorridas nos sistemas de
escrita em geral: a imprensa e a informática.
A imprensa e sua grafia mecânica permitiram a reprodução de uma enorme gama de
grafemas sempre idênticos a si mesmos e que pouco mudaram desde então. Há muita
polêmica em relação ao nascimento dessa nova técnica, mas autores como Higounet (2003)
acreditam que seu responsável foi João Gutemberg, em Mainz, na Alemanha, por volta de
1450.
Ao mesmo tempo em que possibilita grande flexibilidade, a informática também
favorece a padronização dos sistemas de escrita. Ao redigir um texto utilizando o programa
Word ou similar, o usuário tem uma gama enorme de opções para a apresentação do sistema
de escrita em questão, na tela ou no papel. Entretanto, se todos utilizam o mesmo programa,
tem-se apenas as opções por ele propostas. Quanto mais amplo for o uso de computadores
pelas pessoas, maior a tendência à padronização. Muitos de nós, por exemplo, já sentem
algum desconforto ao escrever um texto a mão. Esta sensação de estranhamento em relação à
escrita manuscrita é consequência, evidentemente, da falta de prática. Como o uso da
informática para expressão da escrita é algo recente, ainda não podemos avaliar com grande
clareza as suas consequências para os sistemas de escrita em geral.
Conclusão
122
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Aqui termina nossa viagem pela evolução da escrita. Conforme Ong (1998), e como
você deve ter comprovado após a leitura do texto, a escrita amplia praticamente de forma
ilimitada a potencialidade da linguagem, além de reestruturar o próprio pensamento de seus
usuários. Nossa consciência e até mesmo nosso discurso oral são profundamente afetados
pela tecnologia da escrita. Se somos letrados, processamos o mundo a partir de uma
capacidade estruturada pela escrita e não apenas de nossa capacidade inata e natural. Não
devemos nos esquecer, entretanto, que o fato de a escrita gozar de grande importância para a
nossa cultura não deve diminuir o valor da língua oral e a necessidade de estudá-la e
respeitá-la em toda a sua variedade.
LEITURA COMPLEMENTAR
123
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
124
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 8
AS LÍNGUAS INDO-EUROPEIAS
Observe o quadro abaixo, que mostra o nome dos dez primeiros numerais em algumas
línguas românicas:
QUADRO 1
Os dez primeiros numerais em algumas línguas românicas
Português Espanhol Francês Italiano
um un un uno
dois dos deux due
três tres trois tre
quatro cuatro quatre quattro
cinco cinco cinq cinque
seis seis six sei
sete siete sept sette
oito ocho huit otto
nove nueve neuf nove
dez diez dix dieci
125
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 2
Numerais de dois a dez em algumas línguas
Latim Grego Sânscrito Galês Gótico Tocário Antigo Lituano
A eslavo
duo duo dvá(u) dau twai wu duva dù
tres treis tráyas tri threis tre trije trys
quattuor téttares catváras pedwar fidwor stwar cetyre keturì
quinque pénte páñca pump fimf päñ peti penkì
sex héks sát chwech saíhs säk sesti sesì
septem heptá saptá saith sibun spät sedmi septynì
octo októ astá(u) wyth ahtau okät osmi astuonì
nouem enné(w)a náva naw niun ñu deveti devynì
decem déka dása deg taíhun säk deseti desimt
Ainda que as semelhanças entre as palavras correspondentes a cada número não sejam
tão evidentes quanto as observadas no quadro anterior, em um exame mais atento pode ser
constatado que geralmente existem elementos comuns nas diversas séries. Por exemplo, nas
palavras para ‘dois’, a maioria tem um d- e um -u- (ou -w-, ou -v-); para ‘três’, todas
apresentam uma sequência de dental seguida de -r-. Além disso, observam-se
correspondências sistemáticas, ou seja, assim como as formas para ‘dois’ e ‘dez’ começam
com d- em praticamente todas as línguas apresentadas, em gótico encontramos twai e taíhun,
iniciadas com t- (o caso do tocário sendo diferente por outras razões); do mesmo modo, a sex
e septem, correspondem palavras iniciadas por s- na maioria das línguas, com exceção do
grego, cujos correspondentes apresentam h- inicial (o galês chwech tem uma explicação à
parte).
Como você já sabe, o exame minucioso de muitíssimas séries como essas, em diversos
campos semânticos, unido à comparação de fatos gramaticais e culturais, levou os estudiosos
a postularem a existência de uma língua ancestral comum, da qual teriam se desenvolvido as
diversas línguas atestadas. À língua comum dá-se o nome de indo-europeu, enquanto as
línguas dela descendentes recebem o nome de línguas indo-europeias.
As línguas indo-europeias dividem-se nos seguintes grupos:
1 Línguas célticas
No primeiro milênio a.C., os celtas ocupavam uma área muito vasta, que ia do oriente
da Europa ao extremo ocidente. Os celtas britânicos habitavam o sul da Grã Bretanha; os
126
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
celtiberos, grande parte da Península Ibérica; os gauleses, uma extensa faixa do Oceano
Atlântico ao Mar Negro; enfim os gálatas, o centro da atual Turquia (Anatólia).
Os do primeiro grupo, cujas línguas formam o céltico insular, se espalharam pelas
ilhas britânicas e deram origem a todas as línguas célticas ainda em uso, enquanto as línguas
dos demais, que formam o céltico continental, desapareceram, deixando poucos vestígios na
onomástica, na toponímia e em algumas inscrições não muito consistentes. As línguas
continentais, todas extintas, são o gaulês, o lepôntico (no norte da Itália) e o celtibérico. As
inscrições são em alfabeto grego ou nos diversos alfabetos itálicos: as mais antigas, em
lepôntico, remontam ao século VI a.C.; o celtibérico usa a escrita dos iberos, um povo não
indo-europeu, cujo alfabeto, parcialmente um silabário, parece ser uma mistura dos sistemas
grego e fenício, com modificações.
O celta insular divide-se em dois subgrupos: goidélico e britônico. O goidélico,
também chamado «céltico Q», inclui o antigo irlandês e seus descendentes: irlandês (gaélico
da Irlanda), gaélico da Escócia, e manxês. As inscrições mais antigas do irlandês primitivo,
em alfabeto ogâmico, cuja origem é incerta, vão do século IV ao VII, enquanto a mais antiga
literatura, em antigo irlandês, começa por volta do início do século VII. A partir da
cristianização, no século V, passa-se a usar o alfabeto latino. O irlandês moderno é
configurado pelos bardos no século XIII. No século XVI, com a decadência dos bardos, a
língua se diversifica em diversos dialetos regionais. Com o predomínio do inglês, hoje o
irlandês é falado por menos de 70 mil pessoas, muitas das quais como segunda língua, de
modo que o seu futuro é incerto.
O gaélico da Escócia provém de uma colônia fundada por imigrantes irlandeses no IV
século, sendo falado por menos de 80 mil pessoas, poucas das quais monolíngues. O manxês,
da ilha da Manx, tem origens semelhantes: a sua literatura começa no século XVI ou XVII,
mas seu uso declina a partir do fim do século XVIII, sendo que o último falante nativo morreu
em 1974, seu uso estando hoje limitado ao de segunda língua.
O britônico era a língua falada pelos celtas que habitavam a Grã-Bretanha antes da
conquista romana. Hoje, o grupo britônico, ou «céltico P», engloba o galês, o bretão e o
córnico. Nos séculos IV e V, as invasões e a expansão dos anglo-saxões levaram os celtas a se
concentrarem, por volta do século VII, a oeste, na região do atual País de Gales, e a sul, na
região da Cornualha, de onde saíram imigrantes que se transferiram para o noroeste da
França, dando origem, em cada uma dessas regiões, ao galês, ao córnico e ao bretão,
respectivamente.
As primeiras e breves inscrições conservadas em galês primitivo datam do século VI ao
fim do VIII, conservando alguns textos, geralmente em versões modernizadas nos séculos XII
e XIII, época considerada do galês médio, com uma rica literatura. O galês moderno tem
127
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
início em 1588, com a primeira tradução da Bíblia. O uso da língua declina lentamente, sendo
ela hoje falada por meio milhão de pessoas.
Do bretão há poucas atestações até o século XI, a partir de quando se passa a contar
com muitas obras literárias, geralmente textos religiosos ou traduções do francês ou do latim.
Com a publicação do primeiro dicionário e gramática, em 1659, tem início o bretão moderno.
Contudo, não tendo sido nunca a língua de um centro político ou cultural, o bretão jamais
passou por algum processo de estandardização, sendo composto por um número de dialetos
maior que o de qualquer outra língua céltica moderna. O vocabulário é em grande parte
tomado do francês e atualmente a língua é falada por cerca de meio milhão de pessoas, a
maior parte residente em área rural.
O córnico, bastante próximo de bretão, era falado pelos celtas habitantes do sudoeste
da Inglaterra. Os primeiros documentos em antigo córnico são glosas dos séculos IX e X e um
glossário compilado por volta do ano 1100. Do córnico médio há cerca de 10 mil linhas de
tradução de peças religiosas do inglês, dos séculos XV e XVI. O período do córnico tardio vai
até 1777, considerado o ano da morte do último falante nativo.
2 Línguas germânicas
128
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
129
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
130
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
3 Línguas itálicas
131
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
4 Grego
O fato mais característico do grego é que, em mais de três milênios de história escrita,
os seus dialetos não se transformaram em línguas mutuamente incompreensíveis. O dialeto
de mais antiga atestação é o micênico, datados entre os séculos XIV e XII a.C., em uma escrita
silábica chamada de “linear B”, encontrada na ilha de Creta e em cidades micênicas do
continente. Depois dessas inscrições, por um período de mais de 500 anos, encontra-se apenas
uma única inscrição, encontrada em Chipre, datada em torno de 1050.
O alfabeto grego em suas versões mais antigas apresenta muitas variações, mas trata-se
de uma adaptação do alfabeto fenício que, como os alfabetos de outras línguas semíticas
como o árabe e do hebraico moderno, tem letras apenas para consoantes. A grande inovação
dos gregos foi usar certas letras para representar os sons vocálicos, utilizando letras fenícias
que representavam sons inexistentes em grego, algumas outras, como o phi, khi, psi e omega
são adições.
Entre o aparecimento das primeiras inscrições alfabéticas, no século VIII, e o início do
século V, coloca-se o chamado período arcaico. No início desse período, fixam-se as formas
132
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
dos dois poemas homéricos: a Ilíada e a Odisseia, ápice de uma longa tradição oral. A forma
linguística desses poemas é também a dos chamados hinos homéricos e da poesia de Hesíodo
e tem como base o dialeto chamado jônico, misturado a um substrado de eólico. Na poesia
lírica desse período, destaca-se o uso do dialeto lésbio, usado por poetas como Safo, Alceu,
nos séculos VII e VI. A partir de 480 a.C., tem início o período clássico, marcado pela
hegemonia de Atenas, que tem seu dialeto, o ático, bastante próximo ao jônico, alçado a
categoria de língua literária standard. Todos esses dialetos, ou seja, o ático-jônico, o eólico e o
micênico, constituem o subgrupo oriental do grego, que inclui também os dialetos não
literários arcado-cipriotas e o panfílio. O outro subgrupo, ocidental, é constituído pelos
dialetos chamados dóricos, que também têm importantes usos literários.
Após as conquistas de Alexandre Magno, a língua grega se estende por uma área
vastíssima, e tem início o período helenístico, linguisticamente caracterizado por uma
variedade simplificada do grego falado conhecida como koiné, baseado principalmente no
ático, com elementos jônicos e de outros dialetos. Com isso, os dialetos gregos pouco a pouco
desaparecem na língua falada, restando apenas uma variedade de dórico, o lacônio, que
ainda hoje continua na forma do tsacônio.
Com exceção do tsacônico, no leste do Peloponeso, e dos dialetos gregos da Turquia,
todas as variedades do grego moderno são descendentes da koiné. Após a independência da
Turquia, em 1828, foi criada uma nova língua literária standard chamada katareúsa, enquanto
que uma variedade de grego chamada demótico se tornou a língua falada standard. Em 1976,
o demótico substituiu a katareúsa também na língua escrita, mas foi de uma convergência de
ambos que surgiu o chamado grego standard moderno.
5 Albanês
6 Línguas balto-eslavas
133
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
134
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
7 Línguas anatólicas
8 Armênio
Só no fim do século XIX é que ficou provado que o armeno constituía um grupo à parte
no domínio indo-europeu, uma vez que é muito grande o número de empréstimos de línguas
irânicas; na verdade, do vocabulário herdado restavam no armeno pouco mais de 450
palavras na época das primeiras atestações em inscrições e textos a partir do século V d.C.,
idade de ouro da literatura armena. A língua dessa época, o armeno clássico, permaneceu
como standard literário até o século XIX. O alfabeto, baseado no grego, foi criado
especificamente para o armeno, contém 36 letras que representam cada som da língua. Segue-
se o armeno médio, língua oficial do reino da Cilícia (séc. XI-XIV). As variantes modernas são
o armeno ocidental, uma das duas línguas literárias modernas, baseada no dialeto falado
135
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
próximo a Istambul, e o armeno oriental, língua oficial da Armênia, baseado no dialeto falado
próximo ao monte Ararat e à capital Erevan. As duas línguas literárias são bastante parecidas,
mas ao lado delas existe uma enorme variedade de dialetos, muitos deles bastante
influenciados pelas línguas dos vizinhos turcos e caucasianos.
9 Línguas indo-iranianas
136
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
137
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
literatura preservada. A maioria das línguas médio-irânicas são escritas em formas derivadas
do alfabeto aramaico que, como todos os alfabetos semíticos não possui signos para vogais
breves e cujos sinais para as longas trazem muita ambiguidade.
No irânico ocidental, o médio persa foi a língua oficial da dinastia Sassânida (224-652),
mas é conhecida também pela literatura dos séculos IX e X d.C. Foi a língua culta do
maniqueísmo na Pérsia. Os dois tipos principais são o pahlavi, a língua standard dos textos
do zoroastrismo, e o a língua dos textos maniqueístas, que é mais pura. Nenhum dos dois
parece descender diretamente da língua das inscrições aquemênidas.
No subgrupo oriental, coloca-se o bactriano, conhecido por moedas, uma inscrição de
25 linhas e documentos legais, em alfabeto grego; o kotanês e o tunshuquês, situados na rota
da seda, cujos documentos são escritos em alfabeto brahmi, o sogdiano, no atual Uzbequistão,
preservado em textos variados, que tem um continuador no moderno yaghnobi, e, finalmente
o choresmiano, conhecido principalmente a partir de uma tradução interlinear de uma
enciclopédia árabe medieval.
As línguas irânicas modernas são faladas em uma área muito vasta, que vai do
Cáucaso (ossético), ao norte de Oman (kumzari) e ao Xinjiang (sarikoli). Entre as línguas
mais faladas do irânico ocidental, podem-se citar o persa moderno ou farsi, língua nacional
do Irã e uma das duas línguas oficiais do Afeganistão, cuja variedade é chamada dari. Um
dialeto do persa, o tajiki, é falado no Tajikistão e países vizinhos; o kurdo é falado no Iraque,
Irã, Turquia e Rússia; o baloqui, principalmente no Baloquistão, mas também no sudeste do
Irã e sudoeste do Paquistão. No irânico oriental, coloca-se o pashto, a outra língua oficial do
Afeganistão, cuja tradição literária remonta ao século XVI. Enfim, isolado das demais línguas
irânicas, o ossético é falado na Turquia e Geórgia.
10 Tocário
O tocário só foi descoberto no século XX, e em 1907 já foi reconhecido como língua
indo-europeia. A maioria dos textos são traduções, muitas bilíngues, de peças budistas, o que
facilitou a sua decifração. Os documentos se colocam entre o séc. VI e VIII, e provém de uma
região localizada no Turquestão. São duas línguas: uma ocidental, o tocário A, outra, que se
encontra na mesma região e também na parte oriental, é conhecida como tocário B. Sobre os
falantes dessas línguas, sabe-se muito pouco, e sua identificação é problemática.
Na sua grande maioria, os textos em tocário são escritos em uma versão modificada do
alfabeto Brahmi indiano, também utilizado pelo kotanês (língua médio iraniana) e o tibetano.
Há também alguns fragmentos do tocário B que usam a escrita maniqueia.
138
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
11 Outras línguas
139
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
África do Sul
Bélgica
Islândia
Ilhas Faroe
Noruega
Dinamarca
Suécia
Holanda
140
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
França
Sul da França
Espanha
Catalunha, Espanha
Noroeste da Espanha
Itália
Sardenha, Itália
Romênia
141
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 9
AS LÍNGUAS DA ÁFRICA
A África é o único continente em que aparecem cinco dos seis grandes grupos étnicos
humanos – brancos, negros, coissãs, pigmeus e asiáticos (o único grupo que lá não se encontra
sendo o dos aborígenes australianos) – e também, como você já sabe, lá se concentra cerca de
um quarto das línguas do mundo. Por que tanta diversidade? Podem ser apontadas duas
razões.
A primeira, porque foi lá que o homo sapiens se originou há cerca de sete milhões de
anos. Portanto, houve mais tempo para a humanidade diferenciar-se, o que propiciou
interações entre os povos como em nenhum outro local e, assim, combinações genéticas
maiores.
A segunda razão estaria no fato de que a África apresenta grandes diferenças
geoclimáticas. Estendendo-se das regiões temperadas do hemisfério norte às temperadas do
hemisfério sul, possui algumas das mais altas montanhas tropicais do planeta, uma floresta
impenetrável no equador, um deserto praticamente intransitável que separa a parte norte do
resto do continente, além de várias outras áreas isoladas. Nesse contexto, desenvolveram-se
grupos muito diferentes graças às diversas condições ambientais.
Em tempos históricos, cumpre ressaltar que, por volta de 1400, a situação da África era
a seguinte: os brancos povoavam a região norte-saariana; os negros, grande parte da
subsaariana; os pigmeus, a floresta pluvial centro-africana e as áreas em volta; os coissãs, a
parte sul do continente; os indonésios, Madagascar.
Dentre estes, os pigmeus eram coletores e os coissãs, que compreendem dois
subgrupos, os hotentotes (khoikhoi) e os bosquímanos (san), respectivamente pastores e
coletores. Dos san há hoje poucos remanescentes no deserto de Calaari, na divisa entre a
África do Sul e a Namíbia, ou seja, na área para a qual foram expulsos e na qual conseguiram
sobreviver. Mas houve época em que ocupavam grande parte do sul do continente, tendo
deixado pinturas rupestres, as mais antigas contando com 27 mil anos. Um pequeno grupo
ainda ocupa uma área limitada da Tanzânia, testemunhando assim a antiga extensão da etnia.
Os khoi contam hoje com menos representantes que os san, pois foram massacrados pelas
armas e doenças dos europeus, com os quais boa parte dos sobreviventes se miscigenou.
O caso de Madagascar é intrigante. Essa ilha fica a somente quatrocentos quilômetros
142
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
da costa africana, estando separada da Ásia pelo Oceano Índico. Nela há duas populações
diferentes: os negros e os asiáticos. A língua falada por todos, o malgaxe, é austronésia,
parecida com o ma´anyan, falado em Borneu, a 6.500 quilômetros ao leste, nenhum povo
semelhante aos indonésios vivendo numa distância menor que esta. Quando, em 1500, os
portugueses chegaram a Madagascar, os indonésios já estavam lá.
1 As famílias linguísticas
A classificação das famílias linguísticas africanas foi feita pelo fundador da tipologia
linguística, Joseph Greenberg, que iniciou, em 1945, a publicação de uma série de artigos a
esse respeito, depois reunidos em Studies in African Linguistic Classification, de 1955, livro a
que se somou, em 1960, The Languages of Africa (a segunda edição revista apareceu em 1966).
Ele distingue, na África continental, quatro grandes famílias, algumas com várias
subdivisões, cuja distribuição espacial você poderá observar no mapa a seguir (em que os
nomes dos grupos se encontram em espanhol). Observe-se que a organização interna de cada
família sofreu, nos últimos anos, algumas pequenas reformulações ou correções, sem que se
modificassem as linhas gerais propostas por Greenberg (cf. BONVINI, 2008, p. 22-26):
143
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Conta com 197 línguas espalhadas pelo Saara, ao longo do Nilo, no Sudão e em
Uganda, dentre as quais a única com tradição escrita é o núbio, falado no Sudão e no
Egito por cerca de um milhão de pessoas.
144
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
145
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Com 22 línguas faladas na África do Sul e na Namíbia, poucas delas contando com
mais de mil falantes, como o kwadi e o sandawe, encontra-se ao longo do deserto de
Calaari.
Além das línguas propriamente africanas, naquele continente são faladas também
outras duas que pertencem a outras famílias: o Afrikaans, na África do Sul, da família indo-
europeia (procedente do holandês); e o malgaxe, em Madagascar, da família austronésia. No
que diz respeito ao Hazda e outras línguas apontadas, no mapa, como isoladas, há linguistas
que defendem pertencerem ao grupo coissã.
Agora observe como a distribuição espacial dos quatro grupos principais nos permite
inferir algo da história linguística da África. Dois deles, o nilo-saariano e o coissã não se
apresentam em áreas contínuas, o que leva a supor que as línguas que os integram fossem
faladas em partes mais extensas do território africano, posteriormente ocupadas, no norte, por
línguas afro-asiáticas, e, nas áreas centrais e do sul, pelas congo-cordofanianas.
Na verdade, Greenberg mostrou que o que sabíamos sobre as línguas da África era
muito limitado. Uma ideia comum, por exemplo, era que as línguas semíticas (como o
hebraico, o aramaico e o árabe) eram originárias do Oriente Médio, tendo-se mostrado, a
partir de então, que elas constituem somente um dos grupos da grande família afro-asiatica,
os demais estando confinados na África. Ainda hoje, doze das dezenove línguas semíticas
existentes são faladas apenas naquele continente.
A outra grande surpresa provocada pelas descobertas de Greenberg diz respeito aos
pigmeus. Vivendo numa área isolada da floresta equatorial, tiveram eles tempo suficiente
para desenvolver uma família linguística própria, hoje completamente extinta. Esse dado,
aliado ao fato de que os grupos de pigmeus são atualmente fragmentários, faz concluir que a
expansão congo-cordofaniana deve ter eliminado as línguas e quase exterminou também a
etnia dos pigmeus. A distribuição das línguas nilo-saarianas mostra algo parecido e, portanto,
é provável que esses povos também tenham sido subjugados pelos falantes de línguas afro-
asiáticas e congo-cordofanianas.
As línguas coissãs são caracterizadas por serem as únicas no mundo que possuem sons
avulsivos, chamados também de cliques, os quais passaram delas para várias línguas bantas.
Todas as línguas coissãs sobreviventes estão no sul do continente, com a exceção de duas,
isoladas na Tanzânia, a quase dois mil quilômetros da área maior, o que testemunha que a
extensão da família devia ser mais ampla, abrangendo áreas depois dominadas pela família
congo-cordofaniana.
Como você observou no mapa, esta última ocupa quase toda a África subsaariana, não
146
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
se sabendo ao certo o ponto a partir do qual se expandiu. Greenberg notou que todas as
línguas da família faladas ao sul do equador pertencem ao grupo banto, com pouco menos da
metade das 1.495 línguas nigero-congolesas e mais da metade de seus falantes. Além disso,
um traço marcante é que as línguas bantas são muito parecidas entre si, o que sugere que
tenham tido pouco tempo para se diferenciarem.
Quase todas as línguas bantas se encontram concentradas na África ocidental e aquelas
mais parecidas com as outras línguas da família nigero-congolesa se localizam na divisa entre
Camarões e Nigéria. Isso sugere que pode ser nesse local que elas tiveram origem e que foi a
partir daí que conquistaram quase todo o restante do continente, avançando em direção ao
sudeste. Essa expansão não pode ser recente, porque a língua originaria se dividiu em
quinhentas línguas dela derivadas, mas também não pode ser muito antiga, porque a
diferenciação não é muito grande.
Quando os europeus, no séc XIV, chegaram ao continente africano, encontraram cinco
áreas agrícolas: a África norte-saariana, que sempre mantivera contatos com a Europa e que
tinha sido inclusive província do Império Romano; o Sahel, logo abaixo do Saara, no lado
ocidental; a Etiópia; a África ocidental, na área de origem dos povos bantos; finalmente, a
África tropical oriental, onde se encontravam produtos de origem asiática, cuja procedência,
não fosse a situação de Madagascar, seria difícil de explicar. Ora, todas as plantas da
agricultura africana foram domesticadas ao norte do Equador e o único animal doméstico
originário do continente é a galinha d’Angola. Isso poderia explicar por que os bantos, que
eram agricultores, dominaram os pigmeus e os coissãs, caçadores-coletores.
A linguística nos diz muito sobre a história da agricultura africana. No sul da Nigéria,
onde se falam línguas nigero-congolesas, os nomes das plantas podem ser classificados em
três grupos: o primeiro compreende termos presentes em todas as línguas da grande família,
nomeando espécies de origem local, como o inhame africano, a palmeira de óleo e a cola; no
segundo, há nomes semelhantes somente no interior dos subgrupos, relativos a vegetais de
origem asiática, como as bananas; o terceiro abarca nomes que não podem ser relacionados
pela origem linguística. Assim, é possível perceber quais são as culturas autóctones e qual a
época da introdução das demais na África. Através da glotocronologia, que estuda a
mudança linguística para datar a origem das coisas através das mudanças das palavras,
inferimos as línguas faladas pelos povos que domesticaram as várias espécies. As famílias
que se impuseram na África parecem ter devido esse poder ao fato de que, no local onde se
originaram, havia condições para o desenvolvimento da agricultura.
147
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
O grupo banto inclui a maior parte das línguas africanas faladas, em algum momento,
no Brasil. Não que aqui tenham aportado apenas povos dessa etnia, mas este foi o contingente
maior, desde o século XVI, o que permitiu um contato com o colonizador português mais
contínuo e duradouro, resultando em muitos empréstimos e numa muito debatida (mas
supõe-se que considerável) influência no português (cf. CASTRO, 2001, p. 34-43; BONVINI,
2008, p. 32-52).
Vamos fazer um experimento. No quadro abaixo você encontrará palavras de origem
banta correntes no português, procedentes do quicongo e do quimbundo, já tão integradas ao
nosso vocabulário que é provável que você não só não imagine que tenham origem africana,
148
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 1
Termos da língua portuguesa de origem banta: Kk = Quicongo; Kb = Quimbundo
Termo português Étimo Sinônimo
de origem banta português
Bagunça Kk. bulugusa, Kb. bulungunza, ‘bagunça’ 22 Desordem
Banguela Kb. (ki)bangala, ‘fenda (nos dentes)’
Bunda Kk./Kb. mbunda, ‘bunda’, ‘ânus’
Cachaça Kk. kisasa, ‘bebida fermentada, excitante’
Cachimbo Kk. (ka)nsingu; kb. (ka)nzimu, ‘pequeno tição fumengante’
Caçula Kk. kasuka/Kb. kasule, ‘filho mais novo’
Camundongo Kk./Kb. kamindongo, ‘rato’
Capenga Kk. kiapenga; Kb. kimpenga, ‘torto’
Carimbo Kk./Kb. kandimbu/kindimbu, ‘marca’
Cochilar Kk./Kb. kushila, ‘cochilar’
Dengo Kk./Kb. ndenge, ‘criancice’, ‘cólera pueril’
Encabular Kk. (n)kivula; Kb. kulebula, ‘envergonhar’
Gangorra Kk. kangala/kangula, ‘gangorra’
Macaco Kk. makaaku (plural de kaaku), ‘espécie de macaco vermelho
e cinza, de rabo muito comprido’
Maconha Kk./Kb. makonya/makanya, ‘variedade de cânhamo’
Marimbondo Kb. (ma)di(m)bondo, ‘vespa’
Molambo Kk./Kb. mulamba, ‘pedaço de pano velho’
Moleque Kk./Kb. mi-/mu-/na-leeke, ‘moleque’
Zanga Kk./Kb. nzannga/nzandu, ‘zanga’
Zonzo Kk./Kb. (ki)nzanzu, ‘zonzo’
Fonte: CASTRO, 2001, p. 135-358.
A integração completa desses termos na nossa língua mostra-se também pelo fato de
que são produtivos, ou seja, admitem derivações de acordo com as regras do português:
‘bagunçar’, ‘desbunde’, ‘capengar’, ‘dengoso’, ‘macaquice’, ‘maconheiro’, ‘molecada’, ‘zangar’
22A estrutura silábica nas línguas bantas prevê a existência apenas de sílabas abertas ou não-travadas, ou seja,
terminadas em vogal (do tipo CV – ou CCV, desde que a primeira consoante seja uma nasal): bulungunza
pronuncia-se bu-lu-ngu-nza; mbunda, mbu-nda; kansingu, ka-nsi-ngu; kamindongo, ka-mi-ndo-ngo; kimpenga, ki-mpe-
nga; kusamba, ku-sa-mba; ndenge, nde-nge; etc. Outro traço das línguas bantas é o serem tonais, ou seja, não há
acento tônico, mas sílabas com diferenças de tons, em alguns casos, dois (alto e baixo, geralmente representados
graficamente pelos acentos agudo e grave, respectivamente), em outros, três (alto, médio, baixo).
149
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
etc. (cf. Alkmin e Petter, 2008). Isso para não falar de palavras que designam conteúdos
transmitidos à cultura luso-brasileira juntamente com suas denominações e para as quais não
haveria sinônimos, como ‘macumba’ (< Kk./Kb. makuba, reza, invocação), ‘quiabo’ (< Kk./Kb.
kingombo > kingambo > kyambo, ´quiabo´) e ‘samba’ (Kk./Kb. kusamba, ´rezar´).
O traço mais característico das línguas bantas é a existência de um sistema lexical
dividido no que geralmente se denomina “classes” (mas que seria mais adequado entender
como uma autêntica divisão em gêneros), o qual varia de língua para língua, comportando,
na reconstituição do protobanto, pelo método comparativo, entre dezenove e vinte e quatro
categorias. Atenção, não se trata de classes de palavras (substantivo, adjetivo, verbo) e sim de
uma organização do vocabulário em gêneros (seres humanos, plantas e objetos, animais etc),
a partir de critérios semânticos e morfológicos, com reflexos na sintaxe. Ressalte-se que a
distribuição do léxico português entre palavras masculinas e femininas (ou entre masculino,
feminino e neutro, como em inglês e alemão) não está em causa, mas uma forma diferente de
ver e de organizar o mundo, própria das culturas bantas.
Antes de conhecer os diversos gêneros, vamos entender como o sistema funciona.
Cada palavra, no singular e no plural, recebe o prefixo próprio de seu gênero. Assim, por
exemplo, em nyankore, o prefixo mu- marca o primeiro gênero ou classe, que inclui os seres
humanos, o plural sendo feito com o prefixo ba-: muntu (mu-ntu) significa ‘pessoa’ e bantu (ba-
ntu), ‘pessoas, gente, povo’; ki- é o prefixo do segundo gênero/classe, relativo, dentre outros, a
vegetais, o plural fazendo-se em bi-: kirabyo (ki-rabyo) quer dizer ‘flor’ e birabyo (bi-rabyo),
‘flores’; o prefixo m- marca tanto o singular quanto o plural do terceiro gênero/classe, que
inclui os animais: mbwa (m-bwa) significando tanto ‘cão’, quanto ‘cães’ (KATAMBA, 2006, p.
102).
No quadro abaixo, você encontrará a reconstituição do sistema no protobanto, com os
prefixos e o conteúdo semântico que originalmente deveria corresponder a cada classe, e seu
resultado no quicongo e no quimbundo, donde são tomados os exemplos:
150
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
QUADRO 2
Sistema lexical e de concordância na família banta
Protobanto23 Quicongo Quimbundo Classe Exemplos
Sing. Plural Sing. Plural Sing. Plural
1) *mu- 2) *ba- mu- ba- mu- a- *seres mujana, bajana,
humanos ‘criança(s)’; tata, batata,
‘pai(s)’24
3) *mu- 4) *mi- mu- mi- mu- mi- *vegetais e muti, miti, ‘árvore(s)’;
partes do mutue, mitue, ‘cabeça(s)’
corpo
5) *(d/l)i- 6) *ma- (di)ri- ma- ri- ma- *líquidos e ditadi, matadi: pedra(s)
sólidos dite, mate: saliva(s)
manzo: casario25
7) *ki- 8) *bi- ki- bi(shi)- ki- i(shi)- *depreciativo kinzo, inzo, ‘casebre(s)’;
kintu, bintu, ‘coisa sem
valor’
9) *n- 10) *n- n- m(ji)- - ji- *animais e ngombe, jingombe,
outras coisas ‘vacas(s)’; (i)nzo, jinzo,
‘casa(s)’
11) *du- lu- tu- lu- malu- *singulativo lunkambu, ‘um único
fio de cabelo’
12) *ka 13) *tu- ka- tu- ka- tu- *diminutivo kanzo, tunzo,
‘casinha(s)’; kabumgu,
‘vasilhinha’
14) *bu- bu- ma- u- ma- *abstratos bujana, ‘infância’
15) *ku- ku- ku- maku- *infinitivo kufua, makufua,
verbal ‘morrer’, ‘morte(s)’;
kuria, makuria, ‘comer’,
‘comida(s)’
16) *pa- va(ba)- ga- *superessivo panzo, ‘sobre a casa’
17) *ku- ku- ku- *alativo kunzo, ‘para casa’
23 Das várias propostas de reconstituição dos prefixos de classe no protobanto, a primeira das quais se deve a W.
H. I. Bleek (1869), adotamos a de Meeussen, Bantu Grammatical Reconstructions, p. 97 (apud Katamba, 2006, p.
104, onde as demais propostas também são apresentadas).
24 Nomes de parentesco só têm prefixo no plural.
25 O plural desta classe serve para coletivos: manzo, ‘conjunto de casas, casario’, ainda que a palavra ‘casa’, (i)nzo,
151
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
26
O livro de Chatelain foi publicado em 1888/1889, ou seja, ele descreve o quimbundo como falado em fins do
século XIX (o que constitui uma vantagem se o interesse é estudar sua influência no português do Brasil).
Naturalmente, há algumas diferenças com relação à forma atual (lembre-se que as línguas estão constantemente
em mudança). Isso, contudo, não prejudica o nosso propósito de exemplificar como funciona o sistema de
gêneros ou classes de concordância nas línguas bantas. Atente-se também para o fato de que, na tabela,
adotamos a numeração das classes (em algarismos romanos) tal qual apresentada por Chatelain. Para o
conteúdo de cada classe, utilizamos também o artigo de Bonvini.
152
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Para que nosso sintagma fique mais corrente, vamos usar também o artigo definido, que é
invariável em termos de gênero e número: o. Mãos à obra:
QUADRO 3
Exemplo das regras de concordância no quimbundo
Substantivos Conec-
Classe Núme- Pre- tivo: Exemplos
(Gênero) ro fixos pref.+-a
I Humanos Sing. mu- ua O mubika ua tata, ‘o escravo mubika, ‘escravo’
do pai’
Plural a- a O abika a tata, ‘os escravos abika, ‘escravos’
do pai’
II Plantas e Sing. mu- ua mulembu, ‘dedo’
objetos Plural mi- ia
III Objetos Sing. ki- kia kiala, ‘unha’
fabricados, Plural ia- ia
inanimados
IV Corpos, Sing. ri- ria rilonga, ‘prato’
coletivos,
líquidos, Plural ma- ma
plantas
V Abstratos Sing. u- ua uhaxi, ‘doença’
Plural mau- ma
VI Objetos Sing. lu- lua lumuenu, ‘espelho’
Plural malu- ma
VII Inespecí- Sing. tu- tua tujola, ‘tesoura’
fico Plural matu- ma
VIII Infinitivos e Sing. ku- kua kunua, ‘bebida’
deverbais Plural maku- ma
IX Animais, Sing. Ø ia kabalu, ‘cavalo’27
fenômenos Plural ji- ja
naturais
X Diminu- Sing. ka- ka kanzo, ‘casinha’
tivos Plural tu- tua
Fonte: CHATELAIN, 1888-89, p. 1-14; para o sentido de cada classe, BONVINI, 1996, p. 80.
27É nesta classe que, em geral, se incluem os empréstimos tomados de línguas estrangeiras: kabalu, por exemplo,
procede do português ‘cavalo’. O fato de que, no singular, o que caracteriza a classe IX é a ausência de prefixo
facilita a assimilação. No plural, as palavras tomadas de empréstimo se flexionam nomalmente: jikavalu,
‘cavalos’.
153
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Estes prefixos se usam, além de nos sintagmas de genitivo, também nos adjetivos,
pronomes possessivos e demonstrativos, bem como nos verbos em terceira pessoa e até nos
numerais, constituindo um sistema de concordância que permite o estabelecimento de
relações sintáticas bastante coesas. Apenas para ilustrar com mais um exemplo: ‘aquele
homem ama seus cães’ diz-se assim (na legenda se indicam a classe dos prefixos e seu
número):
Observe como tanto o demonstrativo riná, ‘aquele’, quanto o verbo rizola, ‘ama’,
concordam com riala, ‘homem’; por outro lado, repare também que o possesivo jê, concorda
com o nome que determina, ou seja, jimbua, ‘cães’. Caso se queira dizer que ‘aqueles homens
amam seus cães’, então o demonstrativo e o verbo passarão a concordar com o substantivo
‘homens’ no plural, mala (< ma-ala), recebendo o mesmo prefixo de classe, ou seja, ma-:
154
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Sem dúvida a língua que mais se conservou no Brasil foi o iorubá, a qual, na Bahia,
“não é mais falada nas ruas, entre as pessoas (...), mas é ainda muito falada nos terreiros dos
candomblés (...), nos cânticos para os orixás e durante as festas populares, como o carnaval, a
festa de Iemanjá, a festa de São Cosme e de São Damião etc.”, recebendo, em geral, a
denominação de “nagô” – podendo-se afirmar que “o nagô é o iorubá brasileiro”, ou “um
dialeto do iorubá que se distanciou do iorubá padrão por causa da influência da língua
portuguesa” (AJAYI, 2002, p. 304-305).
Das características principais do iorubá, que permitem um contraste com as categorias
das línguas bantas (em especial do quimbundo, que nos serviu de exemplo), podem ser
arroladas:
(a) Não há diferenças morfológicas de gênero, as palavras que designam seres
humanos e animais opondo-se enquanto itens lexicais para nomear os machos e as
fêmeas:
155
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
156
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
secretas são utilizadas por populações negras isoladas, tendo sido documentadas nos dois
casos já referidos: na Tabatinga, bairro de Bom Despacho (MG), por Queiroz (Pé preto no barro
branco); e no Cafundó, em Salto de Pirapora (SP), por Vogt e Fry (A África no Brasil). Em
ambos os exemplos, constituem “uma espécie de código secreto que serve, de preferência,
como meio de ocultar conversas, principalmente na presença de estranhos”, sendo “provável
que essas línguas tenham exercido a mesma função no passado, a fim de esconder dos
senhores as palavras trocadas entre os escravos, sobretudo quando eles planejavam fugas”,
como, aliás, afirma Peixoto em seu trabalho. Em termos linguísticos, “essas línguas partilham
um fundo lexical do tipo banto, mas enquanto a do Cafundó se aproxima de uma forma
pidginizada, a de Tabatinga avizinha-se mais daquilo que se designa como ‘português
popular brasileiro’” (BONVINI, 2008, p. 51-52).
Já vimos como há muitíssimos itens lexicais tomados de empréstimo pelo português às
línguas africanas, fato sobre o qual não pairam dúvidas: no levantamento de Castro, eles
somam 3517 itens, dos quais 1322 são de origem banta (quicongo, quimbundo e umbundo),
1299 de origem oeste-africana (iorubá, fon), 3 de origem imprecisa (banta ou oeste-africana),
outros 853 sendo classificados na categoria de decalques (como, por exemplo, ‘o-de-comer’,
cf. Castro, 2001, p. 135-358).
Todavia, quando se ultrapassa o nível lexical, torna-se muito difícil determinar o
quanto outras tendências do português brasileiro, nos planos fonético, morfológico e
sintático, podem dever-se ao influxo dessas línguas. De qualquer forma, temos de considerar
a hipótese de que o contato com as línguas africanas pode ter acelerado tendências latentes no
português, ou seja, não se trata de o português do Brasil ter adquirido traços alienígenas, mas
de as línguas africanas (e também indígenas) terem exercido um papel nos rumos que ele
tomou, processo que Castro chama, no campo específico da fonética, de “imantação”.
Abaixo você encontrará um breve resumo de algumas tendências do português
brasileiro que se acredita podem ser devidas ao contato com as línguas africanas, em especial
das bantas:
1. Como já observamos, a sílaba, nas línguas bantas é de tipo aberto, ou seja, sempre
terminam em vogal (CV ou CCV). Desse modo, a divisão silábica das palavras abaixo
(as quais você já conhece) se faz como indicado, o que, aliás, torna mais evidente o
prefixo de classe:
bantu – ba-ntu;
kanzo – ka-nzo;
rilonga – ri-lo-nga;
mulembu – mu-le-mbu.
157
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Isso dá um relevo especial à vogal, o que Castro acredita ter relação com a diferença
principal entre o português do Brasil e o de Portugal: enquanto nesta última
variedade as vogais átonas se abreviaram ou emudeceram, na nossa elas se
mantiveram como o elemento principal da sílaba.
2. Você já sabe que no sistema de classes o número (singular/plural) é marcado por
prefixos (e não por sufixos, como em português). Isso pode estar relacionado com a
tendência do português brasileiro de deslocar as marcas de plural para a esquerda,
em construções como ‘os menino’, ‘as casa’. Não se pode afirmar que o movimento
no sentido de simplificação morfológica, conjugado com essa tendência para a
esquerda, não seja próprio das línguas românicas (o francês, por exemplo, foi a que
tirou mais consequências disso, transferindo a marcação de singular/plural para a
esquerda, ainda que a grafia continue a manter a oposição -Ø/-s à direita: singular
l’ami [la´mi], ‘o amigo’; plural les amis [leza´mi]). Todavia, poderíamos estar diante
de uma conjunção de fatores, em que o contato com as línguas bantas pode ter
ativado uma tendência latente no português.
158
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
-a riala -a muhatu
mubika ua riala, ‘escravo’ mubika ua muhatu, ‘escrava’
ribengu ria riala, ‘rato’ ribengu ria muhatu, ‘ratazana’
mulambi ua riala, ‘cozinheiro’ mulambi ua muhatu, ‘cozinheira
hoji ia riala, ‘leão’ hoji ia muhatu, ‘leoa’
mona ua riala, ‘filho’ mona ua muhatu, filha
Como em outros casos, esse tipo de estrutura parece ter sido decalcado por
construções do português brasileiro do tipo ‘filho homem’ x ‘filha mulher’ (‘filho
homem dá menos trabalho que filha mulher’); ‘menino homem’ x ‘menina mulher’
(‘menina mulher é mais quieta que menino homem’); etc.
6. É significativo que para Pedro Dias, que escreve no século XVII, a dupla negação
seja sublinhada como algo típico da “língua de Angola”: conforme suas próprias
palavras, desde que ao verbo se acrescente a “palavra cana, antes ou depois do
verbo, fica negativo, v.g. canangazóla, não amo, canángagiba, não matei. Porém, posta
antes e depois do verbo, nega com eficácia, v.g. canángagiba cana, não matei não”
(Arte da lingoa de Angola, p. 21). Poderia a tendência do português brasileiro para a
159
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
dupla negação (“não chore ainda não...”) ser devida ao contato com as línguas da
África, ainda que o mesmo fenômeno se observe também em línguas românicas
como o francês (je ne sais pas, ‘eu não sei’)?
7. Uma segunda observação de Pedro Dias aponta também como típica da “língua de
Angola” uma tendência que se firmou bastante no português do Brasil, levando a
um uso bastante restrito do advérbio de afirmação ‘sim’: “não têm os ambudos
casos, e por isso respondem pela mesma pessoa e proposições pelas quais se faz a
pergunta, v.g. Nzambi üazola atu osso? Deus ama a todos? üazola: ama” (Arte da
lingoa de Angola, p. 41). Note-se que esse uso é o mais comum no português falado
do Brasil: ‘– Você vai na minha casa? – Vou.‘; ‘– Posso pegar esse livro emprestado?
– Pode.’
LEITURA COMPLEMENTAR
160
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
161
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
evolução fonética das palavras importadas, diante das semelhanças casuais, mas notáveis, do
sistema linguístico das línguas banto e kwa (...) com o sistema do português brasileiro. Entre
elas, sete vogais orais, reconstituídas no protobanto e próprias do iorubá e do fon, que
também conhecem as cinco vogais nasais, e, com exceção da nasal silábica para as línguas
africanas, a estrutura silábica (CV), onde a vogal é sempre centro de sílaba, estabelecendo a
fórmula (CV.CV) como representante da estrutura ideal, o que provavelmente possibilitou a
continuidade do tipo prosódico de base vocálica do português arcaico na modalidade
brasileira, afastando-o, portanto, da pronúncia atual, muito consonantal, do português
europeu.
Não estaria, então, nessa proximidade relativa, e possivelmente em outras ainda
encobertas, o elo perdido para fechar uma questão lógica quanto à avaliação da parte do
influxo de línguas africanas no português do Brasil, se o Brasil possui a maior população de
descendência negra concentrada fora do continente africano? Ainda o fato de não haver
sucedido um crioulo brasileiro adquirido como segunda língua ou como língua nacional,
semelhante às que emergiram em outras ex-colônias americanas, já que o português foi
imposto, de qualquer maneira, como um falar estrangeiro a uma população majoritariamente
de falantes africanos por três séculos consecutivos? Só um milagre seria capaz de responder a
essa indagação, ainda mais quando é admissível que falantes de qualquer língua, por mais
resistentes a mudar hábitos articulatórios da sua língua materna, tendem a acomodá-los ao
sistema fonológico da nova língua adquirida, como se deve ter passado no Brasil em relação
ao falante africano ante o português.
Como milagres desse tipo não acontecem, chegamos necessariamente a uma hipótese
compatível com as circunstâncias extralinguísticas que foram favoráveis a este processo: o
português do Brasil, naquilo em que se afastou, na fonologia, do português de Portugal é, a
priori, o resultado de um compromisso entre duas forças dinamicamente opostas e
complementares, ou seja, por um lado, uma imantação dos sistemas fônicos africanos em
direção ao sistema do português e, em sentido inverso, um movimento do português em
direção aos sistemas fônicos africanos, sobre uma matriz indígena preexistente e mais
localizada no Brasil. Consequentemente, o português de Portugal, arcaico e regional, foi ele
próprio, de certa forma, mais ou menos africanizado pelo fato de uma longa convivência. A
complacência ou resistência face a essas influências mútuas é uma questão de ordem
sociocultural e os graus de mestiçagem linguística correspondem, mas não de maneira
absoluta, aos graus de mestiçagem biológica que se processam no país.
162
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
163
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
TEXTO 10
LÍNGUAS INDÍGENAS BRASILEIRAS
Quesler Fagundes Camargos
Selmo Azevedo Apontes
28 http://pib.socioambiental.org/pt/c/no-brasil-atual/linguas/introducao
29 http://saturno.museu-goeldi.br/lingmpeg/portal/?page_id=205
164
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
a redução de 1.200 para 180 línguas indígenas nos últimos 500 anos foi o efeito de um
processo colonizador extremamente violento e continuado, o qual ainda perdura, não
tendo sido interrompido nem com a independência política do país no início do século
XIX, nem com a instauração do regime republicano no final desse mesmo século, nem
ainda com a promulgação da “Constituição Cidadã” de 1988. Embora esta tenha sido a
primeira carta magna a reconhecer direitos fundamentais dos povos indígenas,
inclusive direitos linguísticos, as relações entre a sociedade majoritária e as minorias
indígenas pouco mudou.
O primeiro contato feito com a população indígena no território brasileiro com a
finalidade de estudar suas línguas foi realizado pelos missionários jesuítas, quando da
colonização iniciada em abril de 1500. Nesta ocasião, o contato inicial foi feito com as tribos
que habitavam o litoral: os Tupinambás e/ou os Tamoios, principalmente. Pelo fato de as
línguas faladas no litoral serem muito semelhantes entre si, elas passaram a ser consideradas
como o padrão das línguas indígenas faladas no território. A consequência desse fato
histórico é que o Tupinambá foi uma das poucas línguas estudadas nos primeiros trezentos
anos de colonização. A primeira gramática descritiva de uma língua indígena em solo
brasileiro foi feita pelo Padre José de Anchieta, a qual foi publicada em 1595 com o título Arte
de Gramática da Lingoa mais usada na costa do Brasil.
165
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
De acordo com Rodrigues (1958, 1985, 1986), Rodrigues e Cabral (2002) e Dietrich (2010), o
tronco Tupí é constituído pelas seguintes famílias linguísticas geneticamente relacionadas:
Tupí-Guaraní, Mondé, Arikém, Tuparí, Juruna, Mundurukú, Mawé-Aweti e Poruborá-
Ramarama, conforme o seguinte organograma:
30A quantidade de línguas indicadas no quadro 1 é aproximada, visto que a definição de língua e de dialeto
difere entre os autores.
166
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
As línguas da família Tupí-Guaraní são faladas em várias regiões brasileiras, além de outros países da
31
América do Sul. Todas as outras famílias desse tronco estão situadas no Brasil, especificamente no sul do Rio
Amazonas.
167
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Xetá Guajajára
Guarani do Avá-
Chaco/ Canoeiro
Chiriguano
Tapiete
A família Tupí-Guaraní se destaca das demais famílias pela notável extensão territorial
sobre a qual estão distribuídas suas línguas. Para se ter uma ideia, falam-se línguas dessa
famílias no Amapá, no Amazonas, no Espírito Santo, em Goiás, no Maranhão, no Mato
Grosso, no Mato Grosso do Sul, no Pará, no Paraná, no Rio de Janeiro, no Rio Grande do Sul,
em Santa Catarina e em São Paulo, assim como fora do Brasil: na Guiana Francesa, na
Venezuela, na Colômbia, no Peru, na Bolívia, no Paraguai e na Argentina. Para ver mais
detalhes acerca das migrações dos povos Tupí, o que ocasionou essa significativa dispersão,
convido o leitor a consultar o trabalho de Fausto (2005).
3 Tronco linguístico Jê
168
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
família linguística Jê. Embora o tronco linguístico Jê seja ainda uma hipótese de trabalho,
como afirma Rodrigues (1999), ele é assumido por muitos autores. Dentre eles, destacamos
Rodrigues (1986, 1999) e Ribeiro (2006).
De acordo com Rodrigues (1999), a grande parte das línguas que provavelmente
compõe o tronco linguístico Jê já está extinta e as línguas que se mantêm vivas ainda são
pouco documentadas. Devido a estes dois fatores, as relações internas desse tronco precisam
ser significativamente investigadas, uma vez que ainda são hipotéticas. Para se ter uma ideia,
não há um consenso na literatura sobre quantas famílias constitui o tronco Jê: a quantidade
varia entre quinze e dezesseis.
De acordo com Greenberg (1987) e Ribeiro (2005), pertencem ao tronco Jê as famílias Jê,
Boróro, Chiquitano, Guató, Jabuti, Kamakã, Karajá, Krenak, Maxakalí, Ofayé, Otí, Purí
(Coroado), Rikbaktsá e Yatê. Greenberg (1987) e Rodrigues (1999) ainda defendem a inclusão
da família Karirí. Veja o quadro abaixo que apresenta as 15 famílias desse tronco:
169
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Apresentamos, no quadro abaixo, o qual foi retirado de Rodrigues (2002, p. 50), algumas
evidências do parentesco que une as línguas do tronco Jê como um conjunto. Mais
precisamente, mostraremos semelhanças e padrões que demonstram que estas línguas
possuem historicamente uma origem comum.
34A numeração que acompanha o nome de cada língua do tronco Jê corresponde à família linguística indicada
no quadro 2 da pág. 6.
170
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Segundo Rodrigues (2002), a série para a palavra “pé” é praticamente a única com
palavras cognatas e documentadas em todas as línguas apresentadas no quando acima. São
tidas como possivelmente cognatas porque sua constituição fonética permite supor que sejam
todas derivadas por modificações de uma só palavra de uma língua ancestral. Provavelmente,
o primeiro som dessa palavra ancestral é uma consoante labial, como /p/ ou /b/, o segundo
som é uma vogal central, como /a/ ou /y/, e o terceiro som é uma consoante dental, como /r/,
/d/ ou /t/. Note ainda que essas modificações de sons se repetem regularmente em outras
séries: as consoantes iniciais de “pé” são as mesmas de “um”, de “braço” e de “flecha”. Além
do mais, note que as palavras cognatas das línguas Apinayé, Xavánte e Kaingáng são
foneticamente mais semelhantes entre si do que com as outras línguas do tronco Jê. Essa
maior aproximação entre essas três línguas se justifica, uma vez que se tratam de línguas de
uma mesma família linguística: a família Jê.
Conforme Rodrigues (2002), o nome Karíb (Caribe) é uma das designações pelas quais
foi conhecido um povo indígena que habitou, nos séculos passados, grande parte da costa
norte da América do Sul e as Pequenas Antilhas. Seu território se estendia desde o norte da
foz do rio Amazonas, atravessando a Guiana Francesa, o Suriname e a Guiana, até chegar à
Venezuela.
A maior parte das línguas dessa família faladas em território brasileiro está situada ao
norte do rio Amazonas, no Amapá, no norte do Pará, em Roraima e no Amazonas. Há ainda
línguas Karíb ao sul do rio Amazonas, situadas essencialmente ao longo do rio Xingu. O
quadro abaixo, retirado de Rodrigues (2002, p. 58), apresenta uma pequena amostra que
compara línguas do norte do rio Amazonas.
171
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
De acordo com Rodrigues (2002), as línguas que não foram incluídas no quadro acima
estão associadas mais diretamente com uma ou com outra dessas cinco. O Makuxí e o
Ingarikó, por exemplo, estão intimamente ligadas ao Taulipáng, com palavras semelhantes
para “lua”, “sol” e “peixe” e com a perda da sílaba final -pu ou -po, substituída por uma
oclusão glotal (’), nas palavras “chuva”, “céu” e “pedra”. Além do mais, observe que essas
línguas são fortemente aparentadas, o que justifica incluí-las em uma mesma família
linguística.
Agora, no seguinte quadro, retirado de Rodrigues (2002, p. 59), apresentamos as
línguas Karíb do sul do rio Amazonas.
172
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
(MEIRA, 1999; CARLIN, 2004), o Bakairi (SOUZA, 1994), o Ikpeng (PACHÊCO, 2001) e o
Arara (SOUZA, 1993), os quais são essencialmente dissertações e teses de pós-graduação.
As classificações da família Karíb mais recentemente publicadas foram os trabalhos de
Girard (1971), Durbin (1977), Kaufman (1994) e Meira e Franchetto (2005). Para Rodrigues
(2002), deve-se, no entanto, levar em consideração que estes autores apresentam vários
pontos duvidosos e, em alguns casos, conflitantes, uma vez que não estão de acordo sobre o
grau de parentesco entre algumas línguas. Por exemplo, a língua Waimiri-Atroari é
considerada ora como língua isolada dentro da família ora faz parte do subgrupo junto com o
Mapoyo e o Yawarana. A principal razão para esta disparidade é a falta de dados que permita
uma conclusão definitiva. Dentre todas as propostas já mencionadas, apresentamos no
quadro abaixo a classificação proposta por Meira e Franchetto (2005) por dois motivos: (i)
porque revê as classificações anteriores e (ii) porque é a classificação mais recente. Contudo,
alertamos o leitor para o fato de que ainda não é uma classificação definitiva, uma vez que há
algumas línguas pouco conhecidas.
173
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Segundo Ferreira (2005), no Brasil, a preocupação com o estudo das línguas indígenas
reuniu quatro grandes troncos e famílias de línguas no país: Tupi, Jê, Aruak e Karib. No
entanto, pequenos grupos, como o das línguas Pano, foram esquecidos (CÂMARA, 1979).
Atualmente, mais pesquisadores estão se interessando pelas línguas Pano, o que resulta em
um aumento gradual de estudos dessas línguas.
Em se tratando da filiação, Paula (2004) faz uma descrição da filiação e o histórico da
questão: as línguas da família linguística Pano são faladas por povos indígenas que estão
distribuídos em três países: Bolívia, Brasil e Peru. O nome da família foi dado por Grasserie
(1890), quando, ao estudar um grupo de seis línguas - Caripuna, Conibo, Culino, Maxuruna
(Mayoruna), Pakagwara e Wariapano (ou Pano) - descobriu semelhanças entre elas
atribuindo o nome da última a todo o agrupamento linguístico. Brinton (1891), por sua vez,
amplia o número de línguas para dezoito, propondo assim uma revisão na classificação
proposta por Grasserie (1890).
Somente em Rivet e Tastevin (1927) é que a família Pano foi subdividida em três sub-
grupos geográficos: o grupo I correspondia às línguas faladas nos rios Amazonas e Ucayali; o
grupo II correspondia às línguas do rio Inambary; e, por fim, o grupo III ocupava as margens
dos rios Mamoré, Beni e Madre de Dios. Após Rivet e Tastevin (1927), surgiram outras
classificações, as quais foram importantes para o campo da linguística. Podemos citar os
trabalhos de Nimuendaju (1932), Loukotka (1939), Mason (1950), Rivet e Loukotka (1952).
A classificação proposta por Mason (1950), embora tenha apresentado alguns
problemas em relação aos nomes de alguns grupos (cf. KESINGER, 1985), caracterizou-se por
sumarizar todas as classificações anteriormente propostas. O autor dividiu as línguas em três
grupos. A sistemática adotada possibilitou uma nova organização das línguas em Pano
Central, Pano Sul-Ocidental e Pano Sul-Oriental.
Já d’Ans (1973) propõe uma reclassificação das línguas Pano, desmontando a
classificação tradicionalmente aceita de Pano Central, Pano Sul-Oriental e Pano Sul-Ocidental
feita por Mason (1950). Esta última subdivisão é considerada por d’Ans (1973) como
inexistente, tendo em vista que Mason (1950) se baseou em dados incorretos. A nova
classificação proposta estabelece uma divisão das línguas da família Pano em cinco blocos,
conforme o quadro abaixo:
174
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
175
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
176
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
Moré. Claro é que a lista estava incompleta, porque os registros mais antigos das missões
jesuíticas de Mojos (Bolívia) e dos relatos dos viajantes e naturalistas eram de difícil acesso.
Angenot-de-Lima (2001) apresenta 27 etnônimos para a família Txapakura. Porém,
onze deles são apenas notas etnográficas: Jamari, Tapoaya, Kutiana, Matáwa, Urunamakam,
Kujuna, Muré, Itoreauhip, Rokorona, Herisobokono, Kusikia-Manasi. Os outros 16 possuem
registro vocabular: Torá, Urupá, Jarú, Oro Win, Kuyubi (kawtayo), Kumana, Uomo,
Pawumwa, Abitana, Kabishi, Miguelenho, Moré, Chapakura (Tapakura), Kitemoka, Napeka,
Oro Wari. Na lista dos provavelmente extintos, estão quase todos da lista, com ressalvas:
Kuyubi (?), Oro Win, Moré, Oro Wari (com oito etnias).
Ramirez (2010) faz uma excelente análise dessa pequena família linguística e estabelece, por
meio do método léxico-estatístico35, uma proposta para o grupamento das línguas Txapakura,
considerando que vários dos registros étnicos são etnônimos sinônimos como: Torá, Moré e
Itene seriam codialetos. Os Abitana, Pawumwa, Miguelenho, Uomo e Kabishi, para o autor,
são Wanyam. Os Cautário, Cujubim, Rokorono, Matawá, Kumaná, Itene e Herisobocono são
Moré. Assim, o autor propôs a seguinte classificação.
35E também baseado nos relatos de D’Orbigny (1843), Hanseman (1912), Créqui-Montfort e Rivet (1913),
Nordenskiöld (1913-1914), Nimuendaju e Valle Bentes (1921), Metraux (1949), Loukotka (1963).
177
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
em uma situação bastante preocupante é o Oro Win (BR). Contando com aproximadamente
2.721 falantes (cf. FUNASA, 2006, vide ISA36), está o grupo Wari’, que mesmo não se situando
entre as línguas em perigo (endangered languages), encontra-se em franca desvantagem com a
língua oficial, em situação de vulnerabilidade.
Sabe-se que a classificação linguística que toma por base a proximidade geográfica
levou a muitos equívocos na classificação e agrupamento de línguas, como pode ser
observado em d’Ans (1973). A classificação acima situa o grande grupo no modo como as
línguas foram identificadas à época do contato: décadas de 50 e 60 do século passado. Nesse
período, viviam cada um com seu grupo. Após o período de contato, vários grupos passaram
36 http://pib.socioambiental.org/pt/c/quadro-geral.
178
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
a viver juntos nas Terras Indígenas: Ribeirão, Igarapé Lage, Pacaás Novas, Rio Negro Ocaia e
Sagarana. Vejamos um exemplo comparativo da estrutura silábica para a palavra jacaré:
7 Considerações finais
As línguas indígenas que ainda estão vivas no território brasileiro possuem uma
grande diversidade linguística: desde a organização dos sistemas de sons até as estruturas
gramaticais possíveis. Somente a partir da década de 80, houve um desenvolvimento
significativo nos estudos da linguística indígena. Mesmo assim, atualmente, poucas
instituições federais reservam um grupo de profissionais da área da linguística que seja
dedicado a essas línguas. Entre elas, podemos citar: a Universidade de Brasília, a
Universidade de Campinas, a Universidade de São Paulo, a Universidade Federal de Rio de
Janeiro (Museu Nacional), o Museu Emílio Goeldi, entre algumas outras instituições que
estão localizadas principalmente na região norte do Brasil. No entanto, apesar desses
esforços, vale ressaltar que até agora poucas línguas indígenas foram estudadas com
profundidade. Por essa razão, o conhecimento desses idiomas é constantemente atualizado.
Quando ocorrem novas descrições, novas descobertas surgem, o que permite reformulações
de teorias linguísticas.
Decidimos terminar esse texto citando trechos de Rodrigues (1966, p. 4-5),
179
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
no Brasil 24% das línguas são faladas por grupos com população de 50 pessoas ou
menos; 8% por grupos com população de 51-100 pessoas; 25% por grupos com 101-250
pessoas; 18% por grupos na faixa de 201-500 pessoas; 10% por grupos com uma
população estimada entre 501-1000 pessoas. Somente 15% do total de línguas
brasileiras são faladas por grupos superiores a mil pessoas.
Agora, não se sabe a situação real dessas línguas em relação ao grau de transmissão.
Moore e Gabas (2006, p. 436) exemplificam a situação de Rondônia, tendo por base o estudo
inicial feito por Moore e Storto (1992), os quais estimaram que das 25 línguas do estado:
10% não estão mais em uso (como o caso do Puruborá); 30% têm um número baixo de
falantes, e os jovens estão deixando de usar a língua; 25% ou têm número baixo de
falantes ou faltam falantes jovens (mas não ambos os fatores concomitantemente); 35%
têm falantes numerosos, incluindo jovens.
180
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
A partir dos dados acima, percebe-se que 65% das línguas do estado estão em situação
crítica. Esse fato indica que podemos perder a contribuição da experiência desses povos com
a linguagem.
Como convite, deixamos para o leitor a tarefa de investigar quais outras línguas
indígenas brasileiras estão em processo acelerado de extinção (i.e. na iminência de
desaparecer). Para isso, acesse o Atlas das Línguas do Mundo em Perigo da UNESCO, o qual
pode ser acessado pelo site http://www.unesco.org/culture/languages-atlas/index.php. No
site, encontrará informações mais específicas sobre as línguas e sua situação. Ademais,
convidamos também o leitor a conhecer mais sobre os povos indígenas brasileiros no
endereço eletrônico http://pib.socioambiental.org/pt/c/no-brasil-atual/linguas/introducao.
181
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
182
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
BIBLIOGRAFIA
ABBI, Anvita. Vanishing Voices of the Great Andamaneses (VOGA). Disponível em:
<http://andamanese.net>. Acesso em: 18 jul. 2011.
ABBOTT, Miriam. Macushi. In: DERBYSHIRE, Desmond. C.; PULLUM, Geoffrey. K. (Eds.).
Handbook of Amazonian languages. Berlin: Mouton de Gruyter, 1991. v. 3. p. 23-160.
ADAM, Lucien. Matériaux pour servir à l’établissement d’une grammaire comparée des dialectes de
la famille caribe. Paris: Librairie-Éditeur J. Maisonneuve, 1893.
AJAYI, Tayo Julius. Empréstimo e variação interlinguística: o iorubá em contato com o português
no Brasil. 2002. 424 f. Tese (Doutorado em Estudos linguísticos). Faculdade de Letras,
Universidade Federal de Minas Gerais, Belo Horizonte, 2002. N° chamada (Letras): 418 A312e
2002 T
ALKMIN, Tania; PETTER, Margarida. Palavras de África no Brasil de ontem e de hoje. In:
FIORIN, José Luiz; PETTER, Margarida (Orgs.). África no Brasil. São Paulo: Contexto, 2008. p.
145-177. N° de Chamada: 469.798 A258 2008 (FAFICH)
ANCHIETA, Pe. José de. Arte de Gramática da lingoa mais usada na costa do Brasil. Ed. Fac-
similar à de 1595. São Paulo: Loyola, 1990.
APONTES, Selmo A.; CAMARGOS, Quesler F. Processos de Causativização em Oro Waram e suas
consequências para a codificação dos argumentos nucleares. Apresentação no IV CIELLA, Pará.
2013 (no prelo)
183
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
APONTES, Selmo A. Descrição do Oro Waram, Variante Wari’ Norte (Pakka Nova, Txapakura).
Artigo apresentado no Congresso da ABRALIN, Natal (RN). 2013a. (no prelo).
APONTES, Selmo A. Processos fonológicos em Oro Waram (Wari’, Pakaa Nova, Txapakura) e as
fronteiras fortes e fracas: ‘restrição’ e ‘permissão’ de regras fonológicas regulares. Artigo apresentado
no Congresso da ABRALIN, Natal (RN). (no prelo). 2013b.
APONTES, Selmo A. Pronominalização em Oro Waram (Wari’, Pakaa Nova, Txapakura): formas
condicionadas pelo TAM. Artigo apresentado na Semana Internacional de Etnolinguística UNIR
em Guajará-Mirim, RO. 2013c. (no prelo)
AVINO, Rita d’. Introduzione a um corso di storia comparata delle lingue classiche. Roma: Kappa,
1997.
BEKSTA, Pe. Casimiro. Primeiras Letras para Oro Warí (Pakaa Nova – Oro Món, Oro Ramxién).
Sagarana: Guajará-Mirim, 1982.
BJELJAC-BABIC. Seis mil lenguas, un patrimonio en peligro. El correo de la Unesco, abril 2000.
Disponível em: <http://unesdoc.unesco.org/images/0011/001194/119473s.pdf>. Acesso em: 18
jul. 2011.
BLIKSTEIN, Izidoro. Indo-europeu, linguística e... racismo. Revista USP, n. 14, p. 104-110,
jun.-ago. 1992. Disponível em: <http://www.usp.br/revistausp/14/20-izidoro.pdf>. Acesso em:
18 jul. 2011.
BOLOGNINI, Carmen Zink; PAYER, Maria Onice. Línguas de imigrantes. Ciência e cultura, v.
57, n. 2, São Paulo, abril/junho 2005.
BONVINI, Emilio. “Classes d’accords” dans les langues négro-africaines. Un trait typologique
du Niger-Congo. Exemples du kassim et du kimbundu. Faits de langues, v. 4, n. 8, p. 77-88,
1996.
184
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
BONVINI, Emilio. Línguas africanas e português falado no Brasil. In: FIORIN, José Luiz;
PETTER, Margarida (Orgs.). África no Brasil. São Paulo: Contexto, 2008. p. 15-62. N° chamada
(Fafich): 469.798 A258 2008
BRINTON, Daniel G. The American Race: A linguistic classification and ethnographic description of
the native tribes of north and South America. Philadelphia: D. McKay, 1901
BUNSE, Heinrich A. W. Iniciação à filologia germânica. Porto Alegre: Editora da UFRGS, 1983.
CAGLIARI, Luiz Carlos. Alfabetização & linguística. São Paulo: Scipione, 2000. N° chamada
(Letras): 372.41 C131a 1996
CASA NOVA, Vera. Desertos. Rio de Janeiro: 7Letras, 2004. N° chamada (Letras): B869.141
C334c 2004
CASTRO, Yeda P. de. Falares africanos na Bahia: um vocabulário afro-brasileiro. Rio de Janeiro:
Academia Brasileira de Letras/Topbooks, 2001. N° chamada (Letras): 469.798 C355f 2001
CASTRO, Yeda P. de. A língua mina-jeje no Brasil: um falar africano em Ouro Preto do século
XVIII. Belo Horizonte: Fundação João Pinheiro, 2002. N° chamada (Letras): 417.2 C355l 2002
CAVALLI-SFORZA, Luigi. Genes, povos e línguas. São Paulo: Companhia das Letras, 2003. N°
chamada (Letras): 401 C377g.Pm 2003
185
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
CORBETT, Greville. Gender. Cambridge: CUP, 1991. N° Chamada (Letras): 415 C789g 1991
CUNHA, Celso. A questão da norma cultura brasileira. Rio de Janeiro: Tempo Brasileiro, 1985.
N° chamada (Letras): 469.07 C972q
CUNHA, Celso. Gramática da língua portuguesa. Rio de Janeiro: Fename, 1982. N° Chamada
(Letras): 469.5 C972g 1982
CHOMSKY, Noam. Lectures on Government and Binding. Dordrecht: Foris, 1981. N° chamada
(Letras): 415 C548l 1981
DIAMONDS, Jared. Armas, germes e aço. Rio de Janeiro: Record, 2006. N° chamada (Letras):
415 C548l 1981
DIAS, Pedro. Arte da lingva de Angola oeferecida a Virgem Senhora N. do Rosario, mãy, & Senhora
dos mesmos Pretos, pelo P. Pedro Dias da Companhia de Jesu. Lisboa: Officina de Miguel
Deslandes, 1697.
DIRINGER, David. A escrita. Lisboa: Verbo, 1968. Nº chamada (Esc. Ciência da Inf.): 003
D598w.P 1968
DURBIN, Marshall. A survey of the Carib language family. In: BASSO, Ellen. (Ed). Carib-
speaking indians: culture, society and language. Tucson: University of Arizona Press, 1977. p. 23-
38.
ECO, Umberto. La ricerca della lingua perfetta nella cultura europea. Roma-Bari: Laterza, 2002. N°
chamada (Letras): 410 E19r.Pa 2002
186
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
ELIA, Sílvio. Preparação à linguística românica. Rio de Janeiro: Ao Livro Técnico, 1979. N°
Chamada (Letras): 440 E42p 1979
EVERETT, Daniel L.; KERN, Bárbara. The Wari’ language of western Brazil (Pacaas Novos).
London: Routledge, [1997] 2006.
FARACO, Carlos Alberto. Linguística histórica: uma introdução ao estudo da história das
línguas. São Paulo: Parábola, 2005. N° chamada (Letras): 808.8 F981 1991 v.78
FRANÇA, Maria Cristina V. Aspectos da fonologia lexical e pós-lexical da língua Oro Tawati’ (Oro
Win). 350 f. Tese (Doutorado em Linguística). Guajará-Mirim: Campus da UNIR, 2002.
FIORIN, José Luiz; PETTER, Margarida (Org.). África no Brasil. São Paulo: Contexto, 2008. N°
chamada (Fafich): 469.798 A258 2008
GABBA, Emilio. Il latino come dialetto greco. In: Roma arcaica: storia e storiografia. Roma:
Edizioni di Storia e Letteratura, 2000. p. 159-164. N° chamada (Letras): 937 G112r 2000
GAMKRELIDZE, Thomas V.; IVANOV, Vjačeskav V. Ivanov. Indo-European and the Indo-
Europeans. Berlin/New York: Mouton de Gruyter, 1995. N° chamada (Letras): 491 G747i.In
1995
GREENBERG, Joseph. Language in the Americas. Stanford: Stanford University Press, 1987.
187
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
HALL, Katherine Lee. The morphosyntax of discourse in De’kwana carib. 1988. 428 f. Tese
(Doutorado em Linguística). St. Louis: Washington University, 1988.
HAGÈGE, Claude. Halte à la mort des langues. Paris: Odile Jacob, 2000.
HIGOUNET, Charles. História concisa da escrita. São Paulo: Parábola, 2003. N° chamada
(Letras): 411.09 H638e.Pm 2003
HOLANDA, Sérgio Buarque de. Raízes do Brasil. Rio de Janeiro: José Olympio, 1936. N°
chamada (Letras): 981.01 H722r 2004
HORCADES, Carlos M. A evolução da escrita. Rio de Janeiro: Editora Senac Rio, 2004. N°
chamada (Fafich): 417.7 H811e 2004
HOUAISS, Antônio. Dicionário Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2001. N°
chamada (Letras): 469.3 H835d 2001 R
HULST, Harry van der. The phonological structure of words: an introduction. Cambridge:
Cambridge University Press, 2001.
JACKSON, Walter. S. A Wayana grammar. In: GRIMES, J. E. (Ed.). Languages of the Guianas.
Norman: Summer Institute of Linguistics and University of Oklahoma Press, 1972. p. 47-77.
JONES, William. The Third Anniversary Discourse. In Works, v. 1. [s.l.]: General Books LCC,
2009. p. 19-34.
188
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
KATAMBA, Francis. Bantu Nominal Morphology. In: NURSE, Derek; PHILIPPSON, Gérard.
The Bantu Languages. London/New York: Routledge, 2006. p. 103-120. N° chamada (Letras):
496.39 B219 2003
KAUFMAN, Terrence K. The native languages of South America. In: MOSELEY, C.; ASHER,
R. E. Atlas of the World’s Languages. New York: Routledge, 1994. p. 46-76.
KELLER, Rudi. On language change: the invisible hand in language. London/New York:
Routledge, 1994. N° chamada (Letras): 410 K29o 1994
KOEHN, Edward; KOEHN, Sally. Apalai. In: DERBYSHIRE, Desmond. C.; PULLUM,
Geoffrey. K. (Eds.). Handbook of Amazonian languages. Berlin: Mouton de Gruyter, 1986. v. 1. p.
33-127.
LEWIS, M. P. (Ed.). Ethnologue: Languages of the World. Dallas: SIL, 2009. Disponível em:
<http://www.ethnologue.com/> Acesso em: 18 jul. 2011.
LOOS, Eugene. Pano. In: DIXON, Robert M. W.; AIKHENVALD, Alexandra Y. (Eds.). The
Amazonian Languages. Cambrigde: CUP, 1999, p. 226-250.
MACDONELL, Ronald B. 1994. 594 f. La phonologie du Makuxi, langue caribe: une analyse
fonctionnelle. Dissertação (Mestrado em Linguística). Québec: Université Laval, 1994.
MACHADO FILHO, Aires da Mata. O negro e o garimpo em Minas Gerais. Rio de Janeiro: José
Olympio, 1943. N° chamada (Fafich): 981.00821 D637 v.42
MAEDA, Cláudia T. Descrição Preliminar do Oro Eo: um caso de sílaba embutida no onset. 2000.
129 f. Dissertação (Mestrado em Linguística). Guajará-Mirim: Campus da UNIR, 2000.
MARTINS, Wilson. A palavra escrita. São Paulo: Ática, 2002. N° Chamada (Letras): 411.09
M386p 2001
189
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
MASON, John A. The languages of South American Indians. In: STEWARD, Julian. H. (Ed.)
Handbook of South American Indians, v. 6. Washington, DC: Smithsonian Institution. p. 157-317,
1950.
MEILLET, Antoine. Les langues dans l'Europe nouvelle. Paris: Payot, 1928.
MEILLET, Auguste. Linguistique historique et linguistique générale. Leiden: E. J. Brill, 1948. N°
chamada (Letras): 410 M513l 1982
MEIRA, Sérgio. A grammar of Tiriyó. 708 f. 1999. Tese (Doutorado em Linguística). Houston:
Rice University, 1999.
MEIRA, Sérgio; FRANCHETTO, Bruna. The southern Cariban languages and the Cariban
family. International Journal of American Linguistics, v. 71, p. 127-192, 2005.
MOORE, Denny; GABAS, Nilson. O Futuro das Línguas Indígenas Brasileiras. In: FORLINE,
Louis; VIEIRA, Ima; MURRIETA, Rui (Orgs.). Amazônia além dos 500 Anos. Belém: Museu
Paraense Emílio Goeldi, 2006. p. 433-454.
MÜLLER, Diocelma Maria. Aspectos da Fonética, da Fonêmica e do Léxico da Língua Moré (Família
Txapakura). 156 f. 1995. Dissertação (Mestrado em Linguística). Florianópolis: UFSC, 1995.
190
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
NIMUENDAJU, Curt; BENTES, E. H. do Valle. Document sur quelques langues peu connues
de l’Amazone. Journal de la Société des Américanistes, Paris, t. 14-15, 1922, p. 215-222.
NOLL, Volker; DIETRICH, Wolf. O português e o tupi no Brasil. São Paulo: Contexto, 2010.
NURSE, Derek; PHILIPPSON, Gérard. The Bantu Languages. London/New York: Routledge,
2006.
ONG, Walter. Oralidade e cultura escrita. Campinas: Papirus, 1998. N° chamada (Letras): 302.2
O58o.Pd 1998
OSTLER, Rosemarie. Searching for the first words. Verbatim: The Language Quaterly, v. 28, n.
4, p. 1-4, Winter 2003. Disponível em: <www.verbatimmag.com/28_4.pdf>. Acesso em: 18 jul.
2011.
PACHÊCO, Frantomé B. Morfossintaxe do verbo Ikpeng (Karíb). 2001. 303 f. Tese (Doutorado em
Linguística). Campinas: UNICAMP, 2001.
PAULA, Aldir. S. de. A língua dos índios Yawanawá do Acre. 2004. f. Tese (Doutorado em ?).
Campinas: UNICAMP, 2004.
PAYNE, Doris L. Noun Classification in the Western Amazon. In: Languages Sciences, v. 9, n. 1,
1987. p. 21-44.
QUEIROZ, Sônia. Pé preto no barro branco: a língua dos negros da Tabatinga. Belo Horizonte:
Editora UFMG, 1998. N° chamada (Letras): 417.2 Q3p 1998
RAMAT, Anna Giacalone; RAMAT, Paolo (Cur.). Le lingue indoeuropee. Bologna: Il Mulino, 1993.
191
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
RIBEIRO, Darci. Culturas e Línguas Indígenas do Brasil. Educação e Ciências Sociais. Rio de
Janeiro: v. 2, n. 6, nov. de 1957. p. 4-102.
RIBEIRO, Eduardo R. Macro-Jê. In: BROWN, Keith. Encyclopedia of Language and Linguistics. v.
7, Oxford: Elsevier, 2006. p. 422-426.
RODRIGUES DURAN, Ires. Descrição fonológica e lexical do dialeto Kaw Tayo da Língua Moré.
181f. 2000. Dissertação (Mestrado em Linguística) Guajará-Mirim: Campus da UNIR, 2000.
RODRIGUES, Aryon D. Línguas Brasileiras: para conhecimento das línguas indígenas. São Paulo:
Loyola, 2002.
RODRIGUES, Aryon D. Línguas Brasileiras: para conhecimento das línguas indígenas. São Paulo:
Loyola, 1986.
RODRIGUES, Aryon D.; CABRAL, Ana Suelly A. Revendo a classificação interna da família
tupi-guarani. In: ____ (Orgs.). Línguas Indígenas Brasileiras. Fonologia, gramática e história.
Atas do I Encontro Internacional do Grupo de Trabalho sobre Línguas Indígenas da Anpoll. Belém:
UFPA, 2002. p. 327-337.
RODRIGUES, Aryon D. Sobre as línguas indígenas e sua pesquisa no Brasil. Ciência e Cultura,
Jun. 2005, v. 57, n. 2, p. 35-38.
RONDON, Gen. Cândido M. S.; FARIA, Dr. João B. de. Glossário Geral das tribos silvícolas de
Mato-Grosso e outras da Amazônia e do Norte do Brasil. Tomo I. Rio de Janeiro: Imprensa
Nacional, 1948.
RYDEN, Stig. Los índios Moré: notas etnográficas. Bolivia, La Paz: Ministerio de Educación -
Departamento de Arqueologia, Etnografia y Folklore, 1958.
192
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
RUGY, François de. À l’Assemblée, il est interdit de parler breton... Disponível em:
<http://auxmarchesdupalaisbourbon.blogs.liberation.fr/2008/2008/05/a-lassemble-il.html>.
Acesso em: 18 jul. 2011.
SAUSSURE, Ferdinand de. Curso de linguística geral. São Paulo: Cultrix, s/d. N° chamada
(Letras): 410 S259c.Pc 1989
SAUSSURE, Ferdinand de. Mémoire sur le système primitif des voyelles dans les langues indo-
européennes. Leipsick: B. G. Teubner, 1879. Disponível em: <http://www.revue-
texto.net/Saussure/De_Saussure/Memoire/N0072920_PDF_1_306.pdf>. Acesso em: 18 jul.
2011.
SAEZ, Oscar Calávia. O nome e o tempo em Yaminawa: etnologia e história dos Yaminawa do rio
Acre. São Paulo: Editora UNESP: ISA; Rio de Janeiro: NUTI, 2006.
SHEL. Las lenguas Pano y sy reconstrucción. Estudios Panos III, Série Linguística Peruana, 10,
Peru. ILV, 1975.
SILVA, Oziel Marques da. A arquitetura das representações fonológicas dos empréstimos
portugueses em Oro Mon (Wari’ Norte, Rondônia). 2003. 89 f. Dissertação (Mestrado em
Linguística). Guajará-Mirim-RO: Campus da UNIR, 2003.
SOUSA, Maria de Fátima Lima. Dicionário da Língua Wari’: Oro Mon – Português. 2009. 140 f.
Dissertação (Mestrado em Linguística). Guajará-Mirim: Campus da UNIR, 2009.
SOUZA, Shirley D. Alguns aspectos morfológicos da língua arara (Karíb). 1993. 76 f. Dissertação
(Mestrado em Linguística). Brasília: Universidade de Brasília, 1993.
SOUZA, Tânia C. Discurso e oralidade: um estudo em língua indígena. 1994. 398 f. Tese
(Doutorado em Linguística). Campinas: UNICAMP, 1994.
SPANGUERO FERREIRA, R. Estudo lexical da língua Matís: subsídios para um dicionário bilíngue.
2003. 211 f. Tese (Doutorado em Linguística). Campinas: UNICAMP, 2003.
STEINEN, Karl von den. Die Bakaïrí-Sprache: Wörterverzeichnis, Sätze, Sagen, Grammatik. Mit
Beiträgen zu einer Lautlehre der karaïbischen Grundsprache. Leipzig: Koehler, 1892.
STEINEN, Karl von den. Durch Central-Brasilien: Expedition zur Erforschung des Schingú im
Jahre 1884. Leipzig: F. A. Brockhaus, 1886.
193
Faculdade de Letras da UFMG - Fundamentos de Linguística Comparada - Apostila
VILLAR LIÉBANA, Francisco. Los indoeuropeos y los Orígenes de Europa, Lenguage e historia.
Madrid: Gredos, 1991.
VILAÇA, Aparecida. Comendo como gente: formas do canibalismo Wari’ (Pakaa Nova). Rio de
Janeiro: Editora UFRJ, 1992.
194