Tümevarımlı Mantık Programlama İle Türkçe İçin Kelime
Anlamı Belirginleştirme Uygulaması
Özlem Aydın1, Yılmaz Kılıçaslan2
1,2
Bilgisayar Mühendisliği Bölümü, Trakya Üniversitesi, Edirne
ozlema@trakya.edu.tr, yilmazk@trakya.edu.tr
Özet: Verilen bir bağlamda birkaç farklı anlamı olan bir kelimenin hangi anlamı ile
kullanıldığının belirlenmesi problemine Kelime Anlamı Belirginleştirme (KAB) denir. Doğal
dil işleme uygulamalarında gereksinim duyulan önemli bir işlemdir. Tümevarımlı mantık
programlama (TMP), makine öğrenmesi ve mantık programlamayı içeren bir yapay zekâ
alanıdır. Birinci derecede tümcecik gösteriminde olan örnekler ve artalan bilgisinden birinci
dereceden teorilerin oluşturulmasını amaçlar. TMP‟de birinci dereceden mantığın
kullanılmasının yarattığı zenginlik, KAB ve diğer doğal dil işleme uygulamalarında avantajlar
kazandırmaktadır. Bu çalışmada tümevarımlı mantık programlama kullanılarak derlem-tabanlı
bir kelime anlamı belirginleştirme uygulaması geliştirilmiştir.
Anahtar Sözcükler: Kelime Anlamı Belirginleştirme, Tümevarımlı Mantık Programlama,
Makine Öğrenmesi, Mantık Programlama.
Word Sense Disambiguation Application
Programming
For Turkish With Inductive Logic
Abstract: Word sense disambiguation (WSD) is the problem of determining the sense of a
multi-sense word in a given context. It is one of the important processes needed for natural
language processing applications. Inductive Logic Programming (ILP) is the area of artificial
intelligence which contains machine learning and logic programming. It aims to build firstorder theories from examples and background knowledge, which are also represented by firstorder clauses. The richness of first order logic employed in ILP can hopefully provide
advantages for NLP applications such as WSD. In this study, a corpus-based WSD application
is improved by using ILP.
Keywords: Word Sense Disambiguation, Inductive Logic Programming, Machine Learning,
Logic Programming.
1. Giriş
Kelime anlamına göre belirsizlik durumu
doğal dil işleme uygulamalarının birçoğunda
karşılaşılan ve çözülmesi gerekli olan önemli
bir problemdir. Bu anlam belirsizliğinin
giderilmesi için KAB işleminin uygulanması
gerekir. Bahsedilen belirsizlik durumunu bir
örnek cümle üzerinden açıklayalım:
“Yeşilden maviye dönüşen iri gözlerini bize
çevirmişti.”
Bu cümlede çok anlamlı olan hedef
kelimemiz “göz”‟dür. Bu kelimenin Türk Dil
Kurumu Türkçe Sözlük‟üne göre en sık
kullanılan üç anlamı aşağıda verilmiştir [1]:
1. anlam: Görme organı.
2. anlam: Bazı deyimlerde görme, bakma.
3. anlam: Bakış, görüş.
Verilen cümleye KAB işlemi uygulandığında
elde edilen sonuç, “göz” kelimesinin bu
cümlede birinci anlamı ile kullanıldığı
olacaktır. Bu anlam belirleme süreci iki
aşamada gerçekleşir. İlk aşamada, verilen
bağlamdaki belirginleştirme yapılacak hedef
kelime için var olan tüm anlamları belirlenir.
Bu anlamların alınabileceği çeşitli elektronik
sözlükler mevcuttur. İkinci aşamada ise
kelimenin uygun anlamı belirlenir. Bunun
için de kelimenin bulunduğu bağlam ve bazı
bilgi kaynakları kullanılır [2].
KAB birçok alana uygulanmaktadır. Bu
uygulama alanlarından bazıları şunlardır:
Makine Çevirisi (Machine Translation), Bilgi
Geri Getirimi (Information Retrieval), Ses
İşleme (Speech Processing), İnsan-Makine
Haberleşmesi
(Man-Machine
Communication), Metin İşleme (Text
Processing), İçerik ve Tematik Analiz
(Content and Thematic Analysis) ve Gramer
Çözümlemesi (Gramatical Analysis). KAB
genelde doğal dil işleme uygulamalarında
kullanılmasına
rağmen
son
yıllarda
Biyoenformatik
(Bioinformatics)
ve
Semantik Web alanlarındaki önemi artmıştır.
Bu konular içerisinde Makine Çevirisi
KAB‟ın en yaygın kullanıldığı alanlardan
birisidir. KAB‟ın önemini vurgulamak için
Makine Çevirisi kapsamında bir örneği
inceleyelim. Çevirisi yapılacak kaynak dili
anlamada bir kelimenin birden fazla anlamı
olduğu bir durum ile karşılaşıldığında KAB
işlemine gerek duyulur. Makine çevirisi
süreci en az iki aşamadan oluşur. İlk aşama
kaynak dili anlamaya yöneliktir. İkinci
aşamada hedef dilde cümleler üretilir. Çeviri
işleminin doğru olarak yapılabilmesi için
kaynak dilde karşılaşılabilecek kelime
belirsizliği durumu çözülmelidir. Örneğin bir
makine çevirisi sistemine içinde “kahve”
kelimesinin bulunduğu bir cümleyi giriş
olarak verelim. “Kahve” kelimesinin Türkçe
WordNet‟de [3] iki kelime anlamı karşılığı
bulunmaktadır:
1.kahve -- Kahve, çay, ıhlamur, nargile içilen,
hafif yiyecekler bulunduran, tavla, domino,
bilardo, kâğıt oyunları vb. oynanan yer.
2.kahve -- Kavrulmuş ve çekilmiş kahve
çekirdeklerinden hazırlanan içecek.
Hedef dilin İngilizce olduğunu kabul edersek
“kahve” kelimesinin birinci anlamı için
“cafe” kelimesi, ikinci anlamı için ise
“coffee” kelimesi çeviri karşılığı olacaktır
[4].
2. KAB’da kullanılan bilgi türleri
KAB işlemi sürecinde faydalı bazı bilgi
türleri de bulunmaktadır. Bunlar kategori
bilgisi (Part of speech-POS), anlamların
sıklıkları
(frequency
of
senses),
eşdizimlilikler
(collocations),
seçimsel
öncelikler (selectional preferences) ve altöğeleme
bilgisi
(subcategorization
information) vb. olabilir.
Kategori bilgisi: Herhangi bir kelimenin
sözdizimsel sınıf bilgisidir. Bir kelimeye
ait olabilecek olası anlamların sayısını
azaltan faydalı bir işlemdir. Örneğin, bir
kelimenin fiil olarak üç anlamı var iken,
isim olarak tek anlamı olabilir.
Anlamların
sıklıkları:
Genellikle
istatistiksel
yaklaşımlarda
kullanılmaktadır.
Bu
bilgi
elle
etiketlenmiş
derlemlerden
çıkarılabilmektedir.
Eşdizimlilikler: Herhangi bir kelime
grubu içindeki kelimelerin arasındaki
ilişkiyi verir. Şöyle ki bir kelime yanına
başka bir kelime geldiğinde kelime grubu
olarak başka bir anlama gelebilir.
Örneğin, “kahve” kelimesi tek başına
birkaç anlama geliyorken “kahve falı”
kelime grubunun tek bir anlamı vardır
[4].
Seçimsel öncelikler: Bir kelimenin
sözdizimsel ve anlamsal özelliklerini
diğer bir kelime belirleyebilir. Buna
seçimsel öncelikler denir. Örneğin
yemek fiili yanına canlı ya da cansız bir
nesne alabilirken, öldürmek fiili sadece
canlı nesne alabilir.
Alt-öğeleme bilgisi: Bu bilgi kelimeler ve
öbekler arasındaki belirli ilişkileri
gösterir. Örneğin bir fiil yanına başka bir
fiil veya isim öbeği alabilirken başka bir
fiil sadece isim öbeği alabilir. Altöğeleme çerçeveleri tamamlayıcılar
(complements) ile ilgili sözdizimsel
kuralları içerir.
Verilen bu sözdizimsel ve biçimsel
özelliklerin KAB çalışmalarında kullanımı
daha doğru sonuçların elde edilmesi için
gereklidir. Çünkü hemen hemen tüm yerel ve
diğer özelliklerin KAB için faydalı olduğu
bilinmektedir [5]. Bu bilgi türlerini elde
etmek için kullanılan bazı bilgi kaynakları
vardır.
Bunlardan
bazıları
elektronik
sözlükler, teknik sözlükler ve derlemlerdir.
KAB sistemleri verilen hedef kelimenin
bağlamsal
özelliklerini
bu
bilgi
kaynaklarından elde edip kelimenin farklı
anlam karşılıklarını kıyaslamada kullanır.
3. KAB Yaklaşımları
KAB için günümüze kadar yapılmış olan
çalışmalarda
birçok
yaklaşım
ortaya
atılmıştır. Kullanılan kaynağa göre yapılan
sınıflandırmaya göre iki tür yaklaşım
bulunaktadır: bilgi-tabanlı KAB ve derlemtabanlı KAB.
3.1 Bilgi-tabanlı KAB
Bu yaklaşımda sözlük benzeri kaynaklardan
alınan
bilgi
kullanılmaktadır.
Büyük
boyutlardaki
elektronik
sözlüklerin
hazırlanması ile 1980‟li yıllarda bu sözlükler
kullanılmaya başlamıştır. Bu kaynakların
oluşturulması bilginin otomatik olarak
çıkarılması çalışmalarını hızlandırmıştır. Bu
yaklaşımda
kullanılan
elektronik
sözlüklerden
biri
makine
tarafından
okunabilir sözlüklerdir (machine-readable
dictionaries).
Bu
sözlükler
kelime
anlamlarının olduğu hazır bir bilgi kaynağıdır
ve ilk olarak Lesk (1986) tarafından
kullanılmıştır. Lesk, belirsiz kelimenin bu
sözlükteki tanımı ile bulunduğu bağlamdaki
diğer kelimelerin sözlük tanımları arasındaki
örtüşen kelimelerin sayısını hesaplayarak
belirsiz
kelimenin
hangi
anlamının
seçileceğini bulan bir metot geliştirmiştir [6].
Lesk metodu kendisinden sonra gelen makine
tarafından okunabilir sözlükleri kullanan
çalışmalara temel olmuştur. Banerjee ve
Pedersen, Lesk algoritmasından farklı olarak
Adapted
Lesk
algoritması
(2002)
geliştirmişlerdir. Bu algoritmada bir ilişki
ölçümü kullanarak bir bağlamda bir kelime
belirginleştirilebilir [7]. Gömü (thesauri) de
bu yaklaşımda kullanılan diğer bir kaynaktır.
Gömüler kelimeler arasındaki ilişki bilgisini
içeren yapılardır. Bir gömüden alınan
anlamsal kategori bilgisi belirginleştirmede
kullanılır. KAB‟da en çok kullanılan gömü
Roget‟s International Thesarusus‟dur [8].
3.2 Derlem tabanlı KAB
Derlem (bütünce, corpus (İng.)) belli
prensipler çerçevesinde özel veya genel
amaçlı metin ya da konuşma parça ya da
bütünlerinin, üzerinde yapılacak araştırmaya
uygun işaretlemelerle beraber bir araya
getirilmesinden oluşan bütündür. Günümüz
derlemlerinin elektronik ortamda tutularak,
erişim ve kullanım kolaylığı sağlanması
yaygındır. [9]. Şimdiye kadar hazırlanmış
birçok derlem bulunmaktadır. 1970„li yıllarda
Brown Üniversitesinde oluşturulan “Brown
Corpus” 1 milyon kelime ile en geniş
kapsamlı olarak etiketlenmiş metinlerden
biridir.
Türkçe
dil
çalışmalarında
kullanılmak için de ODTÜ Türkçe Derlem
geliştirilmiştir [10].
Derlem tabanlı KAB‟da en başarılı
yaklaşımlar derlemden sınıflayıcı veya
istatistiksel
modelleri
öğrenmek
için
kullanılan
istatistiksel
veya
makine
öğrenmesi algoritmalarıdır. Bu algoritma ve
tekniklere olan ilgideki artış, makine öğrenme
konusuna
duyulan
ilgiden
kaynaklanmaktadır. Çünkü makine öğrenme
algoritmaları çoğu doğal dil işleme
çalışmalarında dikkat çekici bir başarı
göstermiştir. Bu algoritmalar genel olarak
öngörmesiz (unsupervised) ve öngörmeli
(supervised) olmak üzere ikiye ayrılır.
Öngörmesiz KAB yönteminde anlam etiketli
olmayan
bir
derlem
kullanmadan
belirginleştirme gerçekleştirilir. Öngörmeli
makine öğrenme ile gerçekleştirilen KAB‟da
bir sınıflayıcı yaratılır. Burada amaç geçmiş
durumlara bakarak yeni durumları doğru
olarak
sınıflandıran
bir
sınıflayıcı
oluşturmaktır.
Geliştirilen
uygulamada
anlam
belirginleştirmeyi
gerçekleştirmek
için
makine öğrenmesi tekniği olarak tümevarımlı
mantık programlama kullanılmıştır. Sonraki
bölümde TMP konusu ve bu uygulamada
nasıl kullanıldığı anlatılmıştır.
4. Tümevarımlı Mantık Programlama
TMP, makine öğrenmesi ve mantık
programlamanın
kesişimi
olarak
tanımlanabilir.
Amacı
gözlemlerden
(örneklerden) hipotezler geliştiren ve artalan
bilgisinden yeni bilgiler elde eden teknikler
ve araçlar geliştirmektir. Bu sebeple TMP,
makine öğrenmesi ve mantık programlama
tekniklerinin her ikisini de kullanır [11].
Makine öğrenmesi
Mantık programlama
TMP‟de kullanılan mantıksal
tanımları aşağıda açıklanmıştır.
-
B sonlu sayıda cümlecik içeren artalan
bilgisidir.
E sonlu sayıda örnek setidir = E E
Pozitif örnekler. E {e1 , e2 ,...} Boş
olmayan tanımlı cümle kümesidir.
Negatif örnekler. E { f 1 , f 2 ,...}
Horn cümleciği kümesidir (boş
olabilir).
Bu mantıksal terimlerin ne ifade ettiğini
birinci dereceden yüklem mantığına benzer
bir gösterim kullanarak bir örnek ile
açıklayalım.
Aile
içindeki
akrabalık
ilişkilerinin öğrenileceği bir aile örneğini ele
alalım. Bunun için verilenler şunlardır:
←
,
�=
, ,
�
�, �ş ←
( �ş , ℎ
)←
( �ş ,
)←
Şekil 1. Makine Öğrenmesi, Mantık
Programlama ve TMP
,
Dede ve torunları arasındaki ilişkiyi gösteren
pozitif örnekler aşağıda verilmiştir.
�, ℎ
( �,
�+ =
←
)←
Ek olarak aşağıdaki negatif örneklerin de
verildiğini varsayalım.
�− =
←
←
(
ℎ
,
,
�
�)
B‟nin doğrulunu kabul edip, yeni � + ve � −
gerçekleri ile karşılaşıldığında aşağıdaki ilişki
tahmin edilebilir.
TMP
İstatistiksel tekniklerin
Teori uygulamasının
uygulanması
gösterimi
Örneklerden mantık programları
oluşturmak için teori uygulaması
ve program uygulaması
terimlerin
�=
� ( , )←
( , )
Burada H, elde edilen hipotezdir.
5. Geliştirilen Uygulama
Belirginleştirme için artalan bilgisi olarak
KAB‟da
faydalı
olan
bilgi
türleri
kullanılmaktadır.
Bu
bilgiler
belirginleştirilecek kelime ve bulunduğu
bağlamdaki diğer kelimelere ait sözdizimsel
ve anlambilimsel özellikleri içermektedir.
Bahsedilen özellikleri elde edilmesi için
kullanılan Türkçe doğal dil işleme
kaynaklarının
yeterince
bulunmaması
nedeniyle Türkçe için yapılmış KAB
çalışması çok az bulunmaktadır. Bu eksikliği
gidermek amacı ile bir sözlüksel kaynak
olarak Türkçe sözlüksel örnek görevi
(Turkish
Lexical
Sample
Task)
oluşturulmuştur. Bu çalışma Semeval2007‟de kabul edilmiştir [12].
Geliştirilen uygulamada Türkçe sözlüksel
örnek görevinden alınan 10 isim, 10 fiil ile 6
sıfat
ve
zarf
üzerinde
KAB
gerçekleştirilmiştir. Bu kelimelere ait anlam
sayısı, eğitim ve test örnek setinde bulunan
cümle sayıları ve toplam örnek cümle sayısı
Tablo1‟de verilmiştir.
Kelimeler
Anlam
sayısı
Eğitim
boyutu
Test
boyutu
Örnek
boyutu
İsimler
ara
7
192
63
255
baş
5
68
22
90
el
3
113
38
151
göz
3
92
27
119
kız
ön
2
5
96
72
21
23
117
95
sıra
7
85
28
113
üst
7
69
23
92
yan
5
65
31
96
yol
6
68
29
97
al
24
963
125
1088
bak
4
207
85
292
çalış
4
103
61
164
çık
6
138
87
225
Fiiller
geç
11
164
90
254
gel
20
346
215
561
gir
6
163
84
247
git
13
214
120
334
gör
5
206
68
274
konuş
6
129
63
192
büyük
6
97
26
123
doğru
6
81
38
119
küçük
4
45
14
59
öyle
son
4
2
51
86
23
18
74
104
tek
2
40
10
50
Zarflar&
Sıfatlar
Tablo 1. Kelimeler, anlam sayıları ve örnek
boyutları
KAB uygulamamızı bir TMP sistemi olan
ALEPH (A Learning Engine for Proposing
Hypotheses)
ile
gerçekleştirdik
[13].
ALEPH‟de teorileri oluşturmak için 3 veri
dosyası gerekmektedir:
- Artalan bilgisinin bulunduğu .b uzantılı bir
dosya.
- Pozitif örneklerin bulunduğu .p uzantılı bir
dosya.
- Negatif örneklerin bulunduğu .n uzantılı bir
dosya.
Bu dosyaların içerik bilgisini elde etmek için
kaynak olarak Türkçe Sözlüksel Örnek
Görevi kullanılmıştır. Şimdi bu veri
dosyalarının nasıl oluşturulduğuna bakalım.
Artalan bilgisinin bulunduğu dosya
Artalan bilgisi için kullandığımız özellikleri
aşağıda vermiş olduğumuz bir örnek cümle
üzerinden açıklayalım:
Cümle: “Yeşilden maviye
gözlerini bize çevirmişti.”
dönüşen
iri
Hedef kelime: göz
1)
has_bag()
özelliği:
Anlamı
belirginleştirilecek hedef kelimenin sağında
ve solunda bulunan kelimeler. Bu özelliğin
programdaki gösterimi aşağıdaki gibidir:
has_bag(cümle_no,kelime).
has_bag(snt1, iri).
has_bag(snt1, çevir).
2) has_narrow() özelliği: Hedef kelimenin
sağında ve solunda bulunan kelimeler ve bu
kelimelerin hedef kelimeye göre konum
bilgisidir.
has_narrow(cümle_no, kelimenin_konumu,
kelime).
has_narrow(snt1,
first_content_word_left,
iri).
has_narrow(snt1, first_content_word_right,
çevir).
3) has_pos() özelliği: Hedef kelimenin
kategori bilgisi ile hedef kelimenin sağında
ve solunda bulunan kelimelerin kategori
bilgisi ve hedef kelimeye göre konum
bilgileridir.
has_pos(cümle_no,kelimenin_konumu,kelime
nin_kategori_bilgisi).
has_pos(snt1, target_word,noun).
has_pos(snt1, first_content_word_left,adj).
has_pos(snt1,
first_content_word_right,
verb).
4) has_ont() özelliği: Hedef kelimenin
sağında ve solunda bulunan kelimelerin
ontolojik düzey bilgisidir. Ontoloji düzeyi 3
olarak sınırlıdır.
has_ont(cümle_no,kelimenin_konumu,ontoloj
i_düzeyi, ontoloji).
has_ont(snt1,first_content_word_left,1,abstra
ction).
has_ont(snt1,first_content_word_left,2,qualit
y).
has_ont(snt1,first_content_word_left,3,state).
has_ont(snt1,first_content_word_right,1,phys
ical_entity).
has_ont(snt1,first_content_word_right,2,moti
on).
has_ont(snt1,first_content_word_right,3,moti
on).
5) has_case() özelliği: Hedef kelimenin hal
bilgisi ile hedef kelimenin sağında ve solunda
bulunan kelimelerin hal bilgileri ve hedef
kelimeye göre konum bilgileri.
has_case(cümle_no,
kelimenin_konumu,
kelimenin_hali).
has_case(cümle1, target_word, acc).
has_case(cümle1, first_content_word_left, _).
has_case(cümle1,first_content_word_right,
_).
6) has_rel() özelliği: Hedef kelimenin
sağında ve solunda bulunan kelimeler ile olan
ilişki türü ve bu kelimelerin hedef kelimeye
göre konum bilgileri.
has_rel(cümle,kelimenin_konumu,ilişki_türü).
has_rel(snt1, target_word, object).
has_rel(snt1,first_content_word_left,
modifier).
has_rel(snt1,first_content_word_right,
sentence).
7) has_ possessor() özelliği: Hedef kelime ile
hedef kelimenin sağında ve solunda bulunan
kelimelere ait sahipleyici(possessor) bilgisi.
has_ possessor (snt1,target_word,tr).
has_possessor(snt1,first_content_word_left,fl
).
has_possessor(snt1,first_content_word_right,
fl).
Artalan bilgisi dosyasında eğitim kümesi ve
test
kümesi
örneklerinin
özellikleri
bulunmaktadır.
Pozitif örnek dosyasının oluşturulması
Hedef kelimenin doğru anlamını gösteren
bilgi burada verilir.
sense(A,1).
Bu kural bize verilen bir cümlede hiçbir
özelliğe bakılmaksızın hedef kelime için
anlam karşılığının birinci anlamı olacağını
söylemektedir. Örneğin “göz” kelimesi test
edildiğinde aşağıdaki tablo elde edilmektedir.
sense(cümle, hedef_kelimenin_anlamı).
sense(snt1,sense1).
Negatif örnek dosyasının oluşturulması
Hedef
kelimenin
doğru
anlamını
sağlamayacak şekilde diğer anlam etiketleri
kullanılarak elde edilen bilgidir.
sense(cümle,hedef_kelimenin_hatalı_anlamı).
sense(snt1,sense3).
Uygulamada her kelimenin eğitim kümesi
cümlelerine ait artalan bilgisi, pozitif örnekler
ve negatif örnekler alınarak ALEPH
sistemine
verilmiş
ve
bir
model
oluşturulmuştur.
Bu
modelin
değerlendirilmesi aşamasında test kümesine
ait artalan bilgisinin, pozitif örneklerin ve
negatif örneklerin bulunduğu dosyalar
oluşturulmuştur. Son olarak da bu dosyalar
sisteme verilerek test işlemi yapılmıştır. Elde
edilen sonuçlar aşağıdaki tabloda verilmiştir.
Kelimeler
Fiiller
İsimler
Zarflar ve
Sıfatlar
Precision
0.635
0.699
0.821
Recall
0.805
0.717
0.656
Tablo 2. TMP ile elde edilen başarı oranları
Öğrenme sonucu elde edilen hipotezlerden
biri aşağıdaki gibidir:
sense(A,B):- true, B=1.
Bu hipotez her ne kadar kural gibi görünüyor
olsa da aslında aşağıdaki gerçeğe denktir.
elde
edilen
sonuç
doğru sonuç
+
+ 21 7 28
- 6 20 26
27 27 54
Tablo 3. “göz” kelimesi için test performansı
Tabloya bakıldığında test dosyasında bulunan
27 örnek cümle için,
pozitif dosyada
sense(A,1) hipotezini gerçekleyen 21 örnek
var iken diğer anlamları için 6 örnek olduğu
görülmektedir. Benzer şekilde aynı hipotez
negatif dosyada 7 örnek için birinci anlam
değerini alırken 20 örnek için de diğer
anlamlarını sağlamaktadır.
Sonuç olarak öğrenmeden sonra kelimelerin
özelliklerine bağımlı olmayan bir prolog
gerçeği ile ifade edilmiş bir genellemeye
ulaşılmıştır. Bunun nedeni de elimizdeki
kelimelerin birinci anlamının diğer anlamlara
oranla daha fazla sayıda bulunmasıdır. Bu
dengesizlik ALEPH sisteminin özelliklerden
bağımsız olarak her kelime için “her kelime
birinci anlamış taşır.” biçiminde aşırı bir
genelleme
yapmasıdır.
Bu aşırılıktan
kaçınmak için daha dengeli örnek kümeleri
ile çalışılmalıdır.
6. Sonuç
Çoğu KAB tekniği, belirginleştirme için
farklı sözlüksel kaynaklardan alınan bilgilerin
aralarındaki ilişkiyi tespit edememektedir.
Ancak TMP ilişkisel bilginin gösteriminde
başarılıdır ve çeşitli kaynaklardan alınan
verilerle farklı bir yapı oluşturabilmektedir.
Birinci
dereceden
yüklem
mantığını
kullanarak bu veriler arasındaki bağlamsal
ilişkileri kapsayacak gücü kazanır [14].
TMP ile yapılan çalışmalarda elde edilen
deneysel sonuçlar TMP‟nin artalan bilgisini
kullanmada başarılı olduğunu göstermiştir.
TMP‟nin bu yeteneğinin kelime anlamı
belirginleştirme konusunda kullanılması bu
alanda önemli bir gelişme sağlayabilir [15].
Sonuç olarak Türkçe için, Türkçe Sözlüksel
Örnek görevini kaynak olarak kullanan ve bir
TMP sisteminden faydalanan bir KAB
uygulaması geliştirilmiştir.
7. Kaynaklar
[1] http://tdk.gov.tr
[2] Ide, N. and Veronis, J., “Word Sense
Disambiguation: The State of the Art”,
Computational Linguistics, (1998).
[3] Bilgin, O. Çetinoğlu, Ö., and Oflazer, K.,
“Morphosemantic Relations In and
Across Wordnets: A Study Based on
Turkish”, Proceedings of the Second
Global WordNet Conference (GWC
2004), January, Brno, Czech Republic,
(2004).
[4] Aydın, Ö., Tüysüz, M.A.A., Kılıçaslan
Y., "Türkçe için bir Kelime Anlamı
Belirginleştirme
Uygulaması,"
XII.
Elektrik,
Elektronik,
Bilgisayar,
Biyomedikal
Mühendisliği
Ulusal
Kongresi,
Eskişehir
Osmangazi
Üniversitesi, Eskişehir, (2007).
[5] Agirre, E. ve Edmonds, P., “Word Sense
Disambiguation:
Algorithms
and
Applications”.
Kluwer
Academic
Publishers, (2004).
[6] Lesk,
M.,
“Automated
Sense
Disambiguation Using Machine-readable
Dictionaries”, Proceedings of the
SIGDOC Conference, (1986).
[7] Banerjee, S., Pedersen T., “An adapted
Lesk algorithm for word sense
disambiguation using WordNet” . In:
Proceedings of the third international
conference on intelligent text processing
and computational linguistics, Mexico
City, February 17–23, pp 136–145,
(2002).
[8] Chapman, R., “Roget‟s International
Thesaurus (Fourth Edition)”, Harper and
Row, New York, (1977).
[9] Kennedy, G., “An Introduction to Corpus
Linguistics”, Longman, (1998).
[10] Oflazer, K., Say, B., Tur, D. Z. H., Tur,
G., “Building A Turkish Treebank,
Invited Chapter In Building and
Exploiting
Syntactically-Annotated
Corpora”, Anne Abeille Editor, Kluwer
Academic Publishers, (2003).
[11] Muggleton, S. and De Raedt, L.
“Inductive logic programming: Theory
and methods.”, J. Logic Program, (1994).
[12] Orhan, Z., Çelik, E., Demirgüç, N.,
“SemEval-2007 Task 12: Turkish
Lexical Sample Task”, (2007).
[13] Srinivasan, A.: The Aleph Manual
Available
at
http://www.comlab.ox.ac.uk/oucl/researc
h/areas/machlearn /Aleph/, 1999.
[14] Aydın, Ö., Kılıçaslan, Y., "Tümevarımlı
Mantık Programlamanın Kelime Anlamı
Belirginleştirmeye Uygulanabilirliğinin
İncelenmesi", IV. İletişim Teknolojileri
Ulusal Sempozyumu Bildiriler Kitabı,
135-140, (2009).
[15] Specia, L., Nunes, M.G.V., Srinivasan,
A., Ramakrishnan, G., “ Word Sense
Disambiguation using Inductive Logic
Programming”, Proceedings of the 16th
International Conference on ILP,
Springer-Verlag, (2007).