Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

resourceに関するvvwashikaのブックマーク (7)

  • 各言語資源・サービスの概要

    資源の説明書(契約後は、「負担・ トラブル表現リスト(Version 1.0)説明書 trouble_README.euc」という名前で同じ内容のファイルがダウンロードできます) ファイル容量: 約148KB。 (A-4)上位語階層データ すでに公開中のWikipediaからの上位下位関係抽出ツール(http://nlpwww.nict.go.jp/hyponymy/index.html)を日Wikipedia (2007-03-28版)に適用し、得られた上位下位関係に現れた上位語、約69,000名詞句を階層化して、階層を構成する名詞句のすべてに、その指示対象が十分に特定されるかどうかのタグ付けをおこなったものです。例えば、「成分」という語はそれだけでは指示対象が特定されず、「品の成分」などというように表現を補わないと適切な上位語とは呼べません。データによって、Wikipedia

  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

  • 動詞項構造シソーラス

    人の言葉をコンピュータで処理するために動詞の概念を整理したコンピュータ用の 辞書を構築してfreeで配布しています(現在4425語(7473語義)).動詞の概念は名詞と異なり,係り関係のある名詞との形が 重要になってきます.例えば 彼が(Agent)秘密を(Theme)握る → 秘密を(Theme)得る 彼が(Agent)おにぎりを(Theme)握る → おにぎりを(Theme)作る のように表層の格(ガ,ヲ..)と深層格(Agent, Theme,..)との組み合わせで 動詞の持つ意味が異なり,他の動詞との関係が変わってきます(言語学の語彙意味論では深層格と動詞の 関係を項構造と呼びます).このような関係を全ての名詞と動詞の組で 記述するのは不可能ですが,それを推測するのに必要な構築可能な動詞辞書の構築を行っています. 具体的な方針としては 語義を仮定して,語義ごと

  • ALAGIN Forum

    コミュニケーションにおける種々の壁を越える技術であるユニバーサルコミュニケーションの重要性がますます高まっています。その中で、言語の壁を越える技術は、人間のコミュニケーション能力を飛躍的に向上させ、さらに、言語、知識、文化、コミュニティの壁をも越えた相互理解を促進するものであり、誰もが心豊かで便利に生活できる情報化社会の創成に不可欠なものです。 平成23年3月、我が国は1000年に一度と言われる未曾有の大震災に見舞われ、東北地方は壊滅的な被害を受けました。しかし、その中で、インターネットを介して、安否情報や被災状況等の情報を検索、共有する試みや、家族との再会や被災地への物資の供給等に対する支援の試みが、大きな貢献を果たしました。また、これらの情報共有は、救援物資の配給、備蓄のための流通協力、自動車部品を始めとする工場設備の融通など、組織の境界を越えた協力を促進し、震災からの復旧・復興に不可

  • 日本語 WordNet (wn-ja)

    語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日語をつけています。もちろん、 Princeton WordNetにはない日語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

    vvwashika
    vvwashika 2009/05/07
    すばらしい!
  • GSK2008-B 京都大学格フレーム(Ver 1.0)

    GSK会員限定無料配布言語資源。 会員は、年度中、会員限定無料配布言語資源の利用が一件目の場合に限り無料(ただし、送料は着払い)。 年度中、会員限定無料配布言語資源の利用が二件目以上にあたる会員は、5,250円(税込み、送料別)。非会員には配布しない。 公開が年度末であるため、2008年度のGSK会員の無料配布分としての利用申請を2009年4月30日まで受け付ける。

  • GSK | 特定非営利活動法人 言語資源協会

    What's GSK 特定非営利活動法人 言語資源協会(GSK)は、平成15年6月に設立されました。 言語資源協会は、音声データ、レキシコン、テキストコーパス、ターミノロジー、各種言語処理ツール等の言語資源の流通を促進することにより、言語資源を必要とする音声・自然言語処理分野の学術・研究・産業の発展、さらには、言語学分野の研究の推進に貢献することを目的としています。 このため、言語資源保有者と言語資源利用者の双方にとって意義・メリットのある言語資源の流通の仕組み・サービスの提供を推進します。 また、対象を日国内の言語資源に限定せず、将来的にはアジア地域に拡張することにより、音声・自然言語処理技術、言語研究への国際貢献を目指します。

  • 1