Zipfin laki
Tähän artikkeliin tai osioon ei ole merkitty lähteitä, joten tiedot kannattaa tarkistaa muista tietolähteistä. Voit auttaa Wikipediaa lisäämällä artikkeliin tarkistettavissa olevia lähteitä ja merkitsemällä ne ohjeen mukaan. Tarkennus: aika typerästi referoitu tutkimuksia merkitsemättä niitä tai referaatin lähdettä lähteeksi |
Zipfin laki oli Harvardin kielitieteilijä George Kingsley Zipfin löydös, jonka mukaan n:nneksi käytetyimmän sanan (tai jonkin muun mitattavan yksikön, kuten äänteen) käyttötiheys missä tahansa luonnollisessa kielessä on käänteisesti verrannollinen lukuun n.
Zipfin laki on empiirinen tulos eikä teoreettinen malli. Syyt zipfiläisiin jakaumiin eri ilmiöissä vaihtelevat suuresti ja niiden perusteista on kiistaa. Zipfiläisiä jakaumia kuitenkin esiintyy tosielämässä.
Zipfin laki voidaan kuvata matemaattisesti:
Zipfiläinen jakauma todistetaan usein kuvaamalla data graafisesti, akseleina järjestysnumeron logaritmi ja frekvenssin logaritmi. Jos pisteet asettuvat likimäärin suoralle, kyseessä on Zipfin lain tapaus. Logaritmin kantaluvulla ei ole merkitystä tässä tapauksessa.
Toteutumisesta
muokkaaDahui, Li Menghui ja Di Zengru havaitsivat tutkimuksessaan ”True reason for Zipf’s law in language” (2005), että vaikka kielet normaalisti noudattavat Zipfin jakaumaa, kiina on poikkeus. Kiinan kieli lakkasi noudattamasta Zipfin jakaumaa Qin-dynastian jälkeen. Syyksi he esittivät sitä, että uusien kiinan sanamerkkien luominen ja merkistön satunnainen muuttuminen on hidasta.
R. N. Mantegna, S. V. Buldyrev, A. L. Goldberger, S. Havlin, C. K. Peng, M. Simons ja H. E. Stanley osoittivat tutkimuksessaan ”Linguistic Features of Noncoding DNA Sequences” (1994), että Tilke-DNA noudattaa Zipfin lakia ja geenit eivät.
Lähteet
muokkaa- Li, Wentian: Zipf's Law everywhere. Glottometrics, 2002, nro 5, s. 14-21.
- Wyllys, Ronald E.: Empirical and theoretical bases of Zipf's law. Library Trends, 1981, 30. vsk, nro 1, s. 53—64.