Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

About: Soundex

An Entity of Type: software, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling. The algorithm mainly encodes consonants; a vowel will not be encoded unless it is the first letter. Soundex is the most widely known of all phonetic algorithms (in part because it is a standard feature of popular database software such as IBM Db2, PostgreSQL, MySQL, SQLite, Ingres, MS SQL Server, Oracle. and SAP ASE.) Improvements to Soundex are the basis for many modern phonetic algorithms.

Property Value
dbo:abstract
  • Soundex je fonetický algoritmus pro indexování slov podle anglické výslovnosti. Cílem je kódování homofonů pomocí stejné reprezentace tak, aby mohly být považovány za shodné i v případě malých rozdílů v pravopisu. Algoritmus kóduje především souhlásky. Samohlásky jsou kódovány pouze v případě, že jsou prvním písmenem slova. Soundex je standardní součástí mnoha databázových systémů jako například PostgreSQL, MySQL, SQLite, MS SQL Server nebo Oracle. Vylepšení Soundexu jsou základem mnoha moderních fonetických algoritmů. (cs)
  • Soundex ist ein phonetischer Algorithmus zur Indizierung von Wörtern und Phrasen nach ihrem Klang in der englischen Sprache. Gleichklingende Wörter sollen dabei zu einer identischen Zeichenfolge kodiert werden. Der Soundex-Algorithmus erbringt aber häufig auch für die deutsche Sprache gute Ergebnisse. Soundex wurde von und für die Indizierung der Familiennamen im United States Census entwickelt und 1918 patentiert ( 1,261,167). Der Soundex-Code für ein Wort besteht aus seinem ersten Buchstaben, gefolgt von drei Ziffern, die die nach dem Anfangsbuchstaben folgenden Konsonanten des Wortes repräsentieren. Ähnliche Laute besitzen den gleichen Code (B, F, P und V werden z. B. alle mit der Ziffer „1“ codiert). (de)
  • Soundex es un , un algoritmo para indexar nombre por su sonido, al ser pronunciados en Inglés. El objetivo básico de este algoritmo es codificar de la misma forma los nombres con la misma pronunciación. Soundex es el algoritmo fonético conocido más ampliamente y es usada en ocasiones (de forma incorrecta) para describir el "algoritmo fonético". Soundex fue desarrollado por y y patentado en 1918 y 1922. Una variación llamada American Soundex fue desarrollada en 1930 para realizar un análisis retrospectivo del censo de los Estados Unidos de América entre los años 1890 y 1920. El código de Soundex tomó notoriedad en los años 60 cuando protagonizó varios artículos en y Journal of the ACM de la Association for Computing Machinery, y especialmente al ser descrito en la obra maestra de Donald Knuth, The Art of Computer Programming. El código Soundex para un nombre consiste en una letra seguida de tres números: la letra es la primera letra del nombre, y el número codifica el resto de consonantes. Las consonantes que suenan de forma similar comparten el mismo número así, por ejemplo, la B, F, P y V son codificadas como 1. Las vocales pueden afectar la codificación, pero nunca se codifican directamente a menos que aparezcan al principio de los nombres. Como respuesta a deficiencias en el algoritmo Soundex, desarrolló el algoritmo Metaphone para el mismo propósito.El algoritmo Soundex Daitch-Mokotoff fue desarrollado por Gary Mokotoff y Randy Daitch para solucionar los problemas al aplicar el algoritmo de Russell a los judíos con apellidos germánicos o eslavos (como Moskowitz vs. Moskovitz o Levine vs. Lewin). Este algoritmo es mucho más complejo que el de Russell. (es)
  • Soundex est un algorithme phonétique d'indexation de noms par leur prononciation en anglais britannique. L'objectif de base est que les noms ayant la même prononciation soient codés avec la même chaîne de manière à pouvoir trouver une correspondance entre eux malgré des différences mineures d'écriture. Soundex est le plus largement connu des algorithmes phonétiques et est souvent utilisé incorrectement comme synonyme de « algorithme phonétique ». (fr)
  • Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling. The algorithm mainly encodes consonants; a vowel will not be encoded unless it is the first letter. Soundex is the most widely known of all phonetic algorithms (in part because it is a standard feature of popular database software such as IBM Db2, PostgreSQL, MySQL, SQLite, Ingres, MS SQL Server, Oracle. and SAP ASE.) Improvements to Soundex are the basis for many modern phonetic algorithms. (en)
  • Soundex atau Russell Soundex ialah sistem penyandian berbasis bunyi bahasa, diterapkan dalam pemrosesan bahasa alami mencakup pengambilan informasi terhadap kesalahan secara ejaan, tetapi serupa secara bunyi. Menjadi algoritme pertama kepada memadankan susunan karakter berdasar bunyi. Sebab itu, Soundex diketahui sebagai yang paling dikenal luas. Secara sebagian besar, Soundex banyak dihubungkan pada hal yang berurusan dengan pencarian nama individu terutama nama keluarga, sebagai contoh pada pendataan sensus dan tugas tertentu yang terdapat kesalahan penulisan disebabkan kesamaan bunyi. Penggunaan Soundex hingga kini masih terdapat pada Arsip Nasional Amerika Serikat terhadap penyelidikan atas tujuan sensus. Pula dilestarikan dalam catatan historis yang menunjukkan penelitian dan pengembangan algoritme modern. (in)
  • Soundex is een fonetisch algoritme voor het indexeren van namen of woorden naar hun uitspraak in de Engelse taal. Namen die gelijk klinken, maar mogelijk niet gelijk geschreven worden, krijgen eenzelfde soundexcode. Het woord "soundex" is een samentrekking van "sound" en "index". Het algoritme werd rond 1917 ontwikkeld om het mogelijk te maken te zoeken naar persoonsnamen in steekkaartenbestanden, zonder kennis te hebben van de exacte spelling van die namen. Door te selecteren op de soundexcode verkrijgt men alle namen die (bijna) hetzelfde klinken maar niet hetzelfde geschreven worden; bijvoorbeeld Peters, Pieters, Peeters, Petersen enz. Het gebruik van soundex voor het indexeren van en het zoeken in computerbestanden en databases steeg in de jaren 60 en 70 van de twintigste eeuw vooral nadat Donald Knuth het algoritme beschreef in zijn standaardwerk The Art of Computer Programming, Volume 3 (1973). (nl)
  • Soundex — один из алгоритмов сравнения строк по их звучанию; устанавливает одинаковый индекс для строк, имеющих схожее звучание в английском языке. Разработан Робертом Расселом (Robert C. Russel) и Маргарет Кинг Оделл (Margaret King Odell) и запатентован в 1918 и 1922 годах, является исторически первым . Стал популярным в 1960-х годах после того как ему были посвящены несколько статей в журналах «Communications of the ACM» и «Journal of the ACM»; ещё большую известность он обрёл после появления в «Искусстве программирования» Кнута. С 1980-х годов используется как стандартная функция во многих СУБД. Изначально ориентирован на фонетику американского варианта английского языка, посредством модификаций может быть применён и для других вариантов и языков, но в ряде случаев требуются существенные изменения (как, например, в , поддерживающем имена собственные на идише и славянских языках). Впоследствии также появились альтернативы, ориентированные в большей степени на обычные слова английского языка, нежели на имена собственные (такие как Metaphone, ) (ru)
  • Soundex (od ang. sound: dźwięk) – algorytm fonetyczny wymyślony przez Roberta Russella i Margaret Odell i opatentowany w latach 1918 i 1922 (USA). Soundex używany jest do porównywania słów w języku angielskim. Słowa podobnie brzmiące (np. Robert i Rupert) będą miały ten sam 4-znakowy kod Soundex (w tym przypadku R163). Jest wykorzystywany m.in. przy poszukiwaniach genealogicznych różnych wariantów tego samego nazwiska, a obliczenie kodu Soundex umożliwiają niektóre programy genealogiczne. Dokładny opis algorytmu: 1. * Pierwsza litera wyrazu staje się pierwszym znakiem kodu. 2. * Spośród pozostałych liter usuwane są a, e, h, i, o, u, w i y. 3. * Pozostałym literom przypisuje się następujące liczby: 4. 1. * b, f, p, v 5. 2. * c, g, j, k, q, s, x, z 6. 3. * d, t, 7. 4. * l 8. 5. * m, n 9. 6. * r 10. * Spośród kolejnych wystąpień tego samego kodu w kolejnych literach wyrazu po usunięciu h lub w usuwane są wszystkie poza pierwszym. 11. * Jeżeli pozostaje więcej, niż trzy cyfry to następne są usuwane. Jeżeli jest ich mniej niż trzy, to dodawane są zera. 12. * Kodem Soundex wyrazu jest jego pierwsza litera i trzy uzyskane powyżej cyfry. (pl)
  • Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做类似模糊匹配的效果。例如Knuth和Kant二个字符串,它们的Soundex值都是「K530」。其在计算机科学家高德納名著《計算機程序設計藝術》都有詳細的介紹。 (zh)
  • Алгоритм саундекс (англ. Soundex) — фонетичний алгоритм для індексації назв за вимовою в англійській мові. Він встановлює однакове представлення омофонів, що спрощує їх пошук, незважаючи на неточності в написанні. Алгоритм переважно кодує приголосні звуки, голосні опускаються, крім першої букви. Саундекс — найвідоміший з усіх фонетичних алгоритмів (частково через те, що доступний у популярних СКБД, таких як DB2, PostgreSQL, MySQL, Ingres, MS SQL і Oracle), та часто використовується (неправильно) як синонім до «фонетичного алгоритму». Удосконалення саундексу є основою для багатьох сучасних фонетичних алгоритмів. (uk)
dbo:wikiPageID
  • 891942 (xsd:integer)
dbo:wikiPageLength
  • 9578 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1080944828 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • Soundex je fonetický algoritmus pro indexování slov podle anglické výslovnosti. Cílem je kódování homofonů pomocí stejné reprezentace tak, aby mohly být považovány za shodné i v případě malých rozdílů v pravopisu. Algoritmus kóduje především souhlásky. Samohlásky jsou kódovány pouze v případě, že jsou prvním písmenem slova. Soundex je standardní součástí mnoha databázových systémů jako například PostgreSQL, MySQL, SQLite, MS SQL Server nebo Oracle. Vylepšení Soundexu jsou základem mnoha moderních fonetických algoritmů. (cs)
  • Soundex est un algorithme phonétique d'indexation de noms par leur prononciation en anglais britannique. L'objectif de base est que les noms ayant la même prononciation soient codés avec la même chaîne de manière à pouvoir trouver une correspondance entre eux malgré des différences mineures d'écriture. Soundex est le plus largement connu des algorithmes phonétiques et est souvent utilisé incorrectement comme synonyme de « algorithme phonétique ». (fr)
  • Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling. The algorithm mainly encodes consonants; a vowel will not be encoded unless it is the first letter. Soundex is the most widely known of all phonetic algorithms (in part because it is a standard feature of popular database software such as IBM Db2, PostgreSQL, MySQL, SQLite, Ingres, MS SQL Server, Oracle. and SAP ASE.) Improvements to Soundex are the basis for many modern phonetic algorithms. (en)
  • Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做类似模糊匹配的效果。例如Knuth和Kant二个字符串,它们的Soundex值都是「K530」。其在计算机科学家高德納名著《計算機程序設計藝術》都有詳細的介紹。 (zh)
  • Алгоритм саундекс (англ. Soundex) — фонетичний алгоритм для індексації назв за вимовою в англійській мові. Він встановлює однакове представлення омофонів, що спрощує їх пошук, незважаючи на неточності в написанні. Алгоритм переважно кодує приголосні звуки, голосні опускаються, крім першої букви. Саундекс — найвідоміший з усіх фонетичних алгоритмів (частково через те, що доступний у популярних СКБД, таких як DB2, PostgreSQL, MySQL, Ingres, MS SQL і Oracle), та часто використовується (неправильно) як синонім до «фонетичного алгоритму». Удосконалення саундексу є основою для багатьох сучасних фонетичних алгоритмів. (uk)
  • Soundex ist ein phonetischer Algorithmus zur Indizierung von Wörtern und Phrasen nach ihrem Klang in der englischen Sprache. Gleichklingende Wörter sollen dabei zu einer identischen Zeichenfolge kodiert werden. Der Soundex-Algorithmus erbringt aber häufig auch für die deutsche Sprache gute Ergebnisse. (de)
  • Soundex es un , un algoritmo para indexar nombre por su sonido, al ser pronunciados en Inglés. El objetivo básico de este algoritmo es codificar de la misma forma los nombres con la misma pronunciación. Soundex es el algoritmo fonético conocido más ampliamente y es usada en ocasiones (de forma incorrecta) para describir el "algoritmo fonético". (es)
  • Soundex atau Russell Soundex ialah sistem penyandian berbasis bunyi bahasa, diterapkan dalam pemrosesan bahasa alami mencakup pengambilan informasi terhadap kesalahan secara ejaan, tetapi serupa secara bunyi. Menjadi algoritme pertama kepada memadankan susunan karakter berdasar bunyi. Sebab itu, Soundex diketahui sebagai yang paling dikenal luas. Secara sebagian besar, Soundex banyak dihubungkan pada hal yang berurusan dengan pencarian nama individu terutama nama keluarga, sebagai contoh pada pendataan sensus dan tugas tertentu yang terdapat kesalahan penulisan disebabkan kesamaan bunyi. (in)
  • Soundex is een fonetisch algoritme voor het indexeren van namen of woorden naar hun uitspraak in de Engelse taal. Namen die gelijk klinken, maar mogelijk niet gelijk geschreven worden, krijgen eenzelfde soundexcode. Het woord "soundex" is een samentrekking van "sound" en "index". Het gebruik van soundex voor het indexeren van en het zoeken in computerbestanden en databases steeg in de jaren 60 en 70 van de twintigste eeuw vooral nadat Donald Knuth het algoritme beschreef in zijn standaardwerk The Art of Computer Programming, Volume 3 (1973). (nl)
  • Soundex (od ang. sound: dźwięk) – algorytm fonetyczny wymyślony przez Roberta Russella i Margaret Odell i opatentowany w latach 1918 i 1922 (USA). Soundex używany jest do porównywania słów w języku angielskim. Słowa podobnie brzmiące (np. Robert i Rupert) będą miały ten sam 4-znakowy kod Soundex (w tym przypadku R163). Jest wykorzystywany m.in. przy poszukiwaniach genealogicznych różnych wariantów tego samego nazwiska, a obliczenie kodu Soundex umożliwiają niektóre programy genealogiczne. Dokładny opis algorytmu: (pl)
  • Soundex — один из алгоритмов сравнения строк по их звучанию; устанавливает одинаковый индекс для строк, имеющих схожее звучание в английском языке. Разработан Робертом Расселом (Robert C. Russel) и Маргарет Кинг Оделл (Margaret King Odell) и запатентован в 1918 и 1922 годах, является исторически первым . Стал популярным в 1960-х годах после того как ему были посвящены несколько статей в журналах «Communications of the ACM» и «Journal of the ACM»; ещё большую известность он обрёл после появления в «Искусстве программирования» Кнута. С 1980-х годов используется как стандартная функция во многих СУБД. (ru)
rdfs:label
  • Soundex (cs)
  • Soundex (de)
  • Soundex (es)
  • Soundex (in)
  • Soundex (fr)
  • Soundex (nl)
  • Soundex (pl)
  • Soundex (en)
  • Soundex (ru)
  • Soundex (zh)
  • Саундекс (uk)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License