Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
An Entity of Type: person, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

Vector space model or term vector model is an algebraic model for representing text documents (and any objects, in general) as vectors of identifiers (such as index terms). It is used in information filtering, information retrieval, indexing and relevancy rankings. Its first use was in the SMART Information Retrieval System.

Property Value
dbo:abstract
  • نموذج فضاء المتجه (أو نموذج متجه المصطلحات) هو لتمثيل مستندات نصية (أو أي كائنات، بشكل عام) كمتجهات معرفات، مثل، على سبيل المثال مصطلحات الفهرسة. ويستخدم في ، واسترجاع المعلومات، والفهرسة . وكان أول استخدام له في . (ar)
  • Das Vektorraum-Retrieval (engl.: Vector Space Model (VSM)) ist ein Verfahren zurInformationsbeschaffung, bei dem die Informationen als Punkte in einem hochdimensionalen, metrischen Vektorraum repräsentiert werden. Zur Auswertung wird die mathematische Distanz zwischen dem Suchvektor und dem Dokument-/Informationsvektor verwendet. Das Vektorraummodell wurde erstmals im SMART-System implementiert, das unter der Leitung von Gerard Salton an der Cornell University entwickelt wurde. (de)
  • Se conoce como modelo de espacio vectorial a un modelo algebraico utilizado para filtrado, recuperación, indexado y cálculo de relevancia de información. Representa documentos en lenguaje natural de una manera formal mediante el uso de vectores (de identificadores, por ejemplo términos de búsqueda) en un espacio lineal multidimensional. Fue usado por primera vez por el sistema SMART de recuperación de información. Muchas de las tareas de recuperación de información como la búsqueda, agrupamiento o categorización de textos tienen como primer objetivo procesar documentos en lenguaje natural. El problema que surge es que los algoritmos que pretenden resolver estas tareas necesitan representaciones internas explícitas de los documentos. En el área de recuperación de información normalmente se usa una expresión vectorial, donde las dimensiones del vector representan términos, frases o conceptos que aparecen en el documento. En este aspecto la representación más adoptada es la conocida como bolsa de palabras: una colección de documentos compuesta por n documentos indexados y m términos representados por una matriz documento-término de n x m. Donde los n vectores renglón representan los n documentos; y el valor asignado a cada componente refleja la importancia o frecuencia ponderada que produce el término, frase o concepto ti en la representación semántica del documento j. Donde m es la cardinalidad del diccionario (una lista de términos únicos que aparecen en un conjunto de documentos) y representa la contribución del término ti para la representación semántica del documento dj. En esta representación vectorial de documentos el éxito o fracaso se basa en la ponderación o peso de los términos. Aunque ha habido mucha investigación sobre técnicas de ponderación de términos, en realidad no hay un consenso sobre cuál método es el mejor. También hay que destacar que el espacio de renglones de la matriz documento-término determinan el contenido semántico de la colección de documentos. Sin embargo, una combinación lineal de dos vectores-documento no representa necesariamente un documento viable de la colección. Más importante aún, mediante el modelo espacio vectorial se pueden explotar las relaciones geométricas entre dos vectores documento (y términos) a fin de expresar las similitudes y diferencias entre términos. Si bien el rendimiento de un sistema de recuperación de información depende en gran medida de las medidas de similitud entre documentos, la ponderación de términos desempeña un papel fundamental para que esa similitud entre documentos sea más confiable. Así, por ejemplo, mientras que una representación de documentos basada solo en las frecuencias o apariciones de términos no es capaz de representar adecuadamente el contenido semántico de los documentos, la representación de términos ponderados (Aplicación de métodos de normalización a la matriz documento-término) hace frente a errores o incertidumbres asociadas a la representación simple de documentos. (es)
  • Un modèle vectoriel (parfois nommé sémantique vectorielle) est une méthode algébrique de représentation d'un document visant à rendre compte de sémantique, proposé par Gerard Salton dans les années 1970. Elle est utilisée en recherche d'information, notamment pour la recherche documentaire, la classification ou le filtrage de données. Ce modèle concernait originellement les documents textuels et a été étendu depuis à d'autres types de contenus. Le premier exemple d'emploi de ce modèle est le système SMART. (fr)
  • ベクトル空間モデルとは情報検索を行うためのアルゴリズムの一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量をコサイン類似度、内積、距離等によって計算して関連度を求める。 (ja)
  • Vector space model or term vector model is an algebraic model for representing text documents (and any objects, in general) as vectors of identifiers (such as index terms). It is used in information filtering, information retrieval, indexing and relevancy rankings. Its first use was in the SMART Information Retrieval System. (en)
  • 벡터 공간 모델(―空間―, 영어: vector space model) 또는 단어 벡터 모델(單語―, 영어: term vector model)은 텍스트 문서를 단어 색인 등의 식별자로 구성된 벡터로 표현하는 대수적 모델이다. 정보 검색, 정보 필터링 및 검색 엔진의 색인이나 연관도 순위에 사용된다. 이 모델이 최초로 적용된 것은 코넬 대학교의 게오르그 셀튼 교수 연구실의 이었다. (ko)
  • O Modelo Vetorial em Sistemas de Recuperação da Informação, proposto inicialmente por Salton, reconhece que o uso de pesos binários (como feito no modelo Booleano) é muito limitado e propõe um arcabouço onde o casamento parcial entre uma consulta e um documento da coleção é possível. O modelo de espaço vetorial, ou simplesmente modelo vetorial, representa documentos e consultas como vetores de termos: Termos são ocorrências únicas nos documentos. A relevância dos termos é destacada assinalando pesos não binários aos termos de indexação dos documentos e consultas. Esses pesos associados aos termos são usados para calcular o grau de similaridade entre cada documento de uma coleção e a consulta de usuário. Dessa forma, o modelo vetorial leva em consideração documentos que casam com a consulta de forma parcial. Como resultado, o conjunto de respostas ordenadas é muito mais preciso do que o conjunto de respostas geradas pelo modelo booleano.Para determinar se um documento está próximo de uma consulta, compara-se o vetor do documento com o vetor da consulta. Ao invés de calcular o ângulo, calcula-se o cosseno, definido pela fórmula [Salton (1988)]: em que é o Produto escalar (intersecção) dos vetores do documento d e da consulta q, é a norma do vetor d, e é a norma do vetor q. A norma de um vetor é calculada como: Usando o cosseno, a similaridade entre um documento dj e uma consulta q pode ser calculada como: Os pesos quantificam a relevância de cada termo para as consultas e para os documentos no espaço vetorial. Para o cálculo dos pesos e , utiliza-se uma técnica que faz o balanceamento entre as características do documento, utilizando a frequência de um termo num documento . Se uma coleção possui documentos e é a quantidade de documentos que possuem o termo , então o inverso da frequência do termo na coleção, ou é dado por: Este valor é usado para calcular o peso, utilizando aseguinte fórmula: , ou seja, é o produto da frequência do termo As principais vantagens do modelo vetorial são a sua simplicidade, a facilidade que ele provê de se computarsimilaridades com eficiência e o fato de que o modelo se comporta bem com coleções genéricas. Entre as limitações do modelo, vale citar que ele considera os termos de um documento como um saco-de-palavras, ou seja, a posição do termo no documento não é levado em consideração. Além disso, a semântica dos termos não é considerada nem questões de sinonímia, ambiguidade. termos compostos, etc. (pt)
  • Векторна модель (англ. vector space model) — в інформаційному пошуку алгебраїчне представлення колекції документів векторами одного спільного для всієї колекції векторного простору. Векторна модель є основою для вирішення багатьох завдань інформаційного пошуку, таких як: пошук документа за запитом, класифікація документів, кластеризація документів. (uk)
  • Ве́кторная моде́ль (англ. vector space model) — в информационном поиске представление коллекции документов векторами из одного общего для всей коллекции векторного пространства. Векторная модель является основой для решения многих задач информационного поиска, как то: поиск документа по запросу, классификация документов, кластеризация документов. (ru)
  • 向量空间模型是一个把文本文件表示為标识符(比如索引)向量的代数模型。它应用于、信息检索、索引以及。SMART是第一个使用这个模型的信息检索系统。 (zh)
dbo:thumbnail
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 20948989 (xsd:integer)
dbo:wikiPageLength
  • 9566 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1123732597 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dct:subject
gold:hypernym
rdf:type
rdfs:comment
  • نموذج فضاء المتجه (أو نموذج متجه المصطلحات) هو لتمثيل مستندات نصية (أو أي كائنات، بشكل عام) كمتجهات معرفات، مثل، على سبيل المثال مصطلحات الفهرسة. ويستخدم في ، واسترجاع المعلومات، والفهرسة . وكان أول استخدام له في . (ar)
  • Das Vektorraum-Retrieval (engl.: Vector Space Model (VSM)) ist ein Verfahren zurInformationsbeschaffung, bei dem die Informationen als Punkte in einem hochdimensionalen, metrischen Vektorraum repräsentiert werden. Zur Auswertung wird die mathematische Distanz zwischen dem Suchvektor und dem Dokument-/Informationsvektor verwendet. Das Vektorraummodell wurde erstmals im SMART-System implementiert, das unter der Leitung von Gerard Salton an der Cornell University entwickelt wurde. (de)
  • Un modèle vectoriel (parfois nommé sémantique vectorielle) est une méthode algébrique de représentation d'un document visant à rendre compte de sémantique, proposé par Gerard Salton dans les années 1970. Elle est utilisée en recherche d'information, notamment pour la recherche documentaire, la classification ou le filtrage de données. Ce modèle concernait originellement les documents textuels et a été étendu depuis à d'autres types de contenus. Le premier exemple d'emploi de ce modèle est le système SMART. (fr)
  • ベクトル空間モデルとは情報検索を行うためのアルゴリズムの一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量をコサイン類似度、内積、距離等によって計算して関連度を求める。 (ja)
  • Vector space model or term vector model is an algebraic model for representing text documents (and any objects, in general) as vectors of identifiers (such as index terms). It is used in information filtering, information retrieval, indexing and relevancy rankings. Its first use was in the SMART Information Retrieval System. (en)
  • 벡터 공간 모델(―空間―, 영어: vector space model) 또는 단어 벡터 모델(單語―, 영어: term vector model)은 텍스트 문서를 단어 색인 등의 식별자로 구성된 벡터로 표현하는 대수적 모델이다. 정보 검색, 정보 필터링 및 검색 엔진의 색인이나 연관도 순위에 사용된다. 이 모델이 최초로 적용된 것은 코넬 대학교의 게오르그 셀튼 교수 연구실의 이었다. (ko)
  • Векторна модель (англ. vector space model) — в інформаційному пошуку алгебраїчне представлення колекції документів векторами одного спільного для всієї колекції векторного простору. Векторна модель є основою для вирішення багатьох завдань інформаційного пошуку, таких як: пошук документа за запитом, класифікація документів, кластеризація документів. (uk)
  • Ве́кторная моде́ль (англ. vector space model) — в информационном поиске представление коллекции документов векторами из одного общего для всей коллекции векторного пространства. Векторная модель является основой для решения многих задач информационного поиска, как то: поиск документа по запросу, классификация документов, кластеризация документов. (ru)
  • 向量空间模型是一个把文本文件表示為标识符(比如索引)向量的代数模型。它应用于、信息检索、索引以及。SMART是第一个使用这个模型的信息检索系统。 (zh)
  • Se conoce como modelo de espacio vectorial a un modelo algebraico utilizado para filtrado, recuperación, indexado y cálculo de relevancia de información. Representa documentos en lenguaje natural de una manera formal mediante el uso de vectores (de identificadores, por ejemplo términos de búsqueda) en un espacio lineal multidimensional. Fue usado por primera vez por el sistema SMART de recuperación de información. (es)
  • O Modelo Vetorial em Sistemas de Recuperação da Informação, proposto inicialmente por Salton, reconhece que o uso de pesos binários (como feito no modelo Booleano) é muito limitado e propõe um arcabouço onde o casamento parcial entre uma consulta e um documento da coleção é possível. O modelo de espaço vetorial, ou simplesmente modelo vetorial, representa documentos e consultas como vetores de termos: em que é o Produto escalar (intersecção) dos vetores do documento d e da consulta q, é a norma do vetor d, e é a norma do vetor q. A norma de um vetor é calculada como: (pt)
rdfs:label
  • Vector space model (en)
  • نموذج فضاء المتجه (ar)
  • Vektorraum-Retrieval (de)
  • Modelo de espacio vectorial (es)
  • Modèle vectoriel (fr)
  • ベクトル空間モデル (ja)
  • 벡터 공간 모델 (ko)
  • Modelo vetorial em sistemas de recuperação da informação (pt)
  • Векторная модель (ru)
  • Векторна модель (uk)
  • 向量空間模型 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:depiction
foaf:isPrimaryTopicOf
is dbo:programmingLanguage of
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License