Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

pythonとjapaneseに関するrhosoiのブックマーク (3)

  • ひらがな・カタカナ・半角カナを相互に変換するjcconvを書いた – taichino.com

    クローラで日語情報を収集してると、ひらがな・カタカナを相互に変換したい事が割とあります。毎回適当に処理するのが嫌になってきたので、相互変換するpythonモジュールを書きました。 使い方は以下の様な感じです。 >>> from jcconv import * >>> print hira2kata('あいうえお') # hiragana to katakana アイウエオ >>> print kata2hira('カタカナ') # katakana to hiragana かたかな >>> print half2hira('ハンカクカタカナ') # half-width kana to hiragana はんかくかたかな >>> print half2wide('hello jcconv') # half-width alphabet to wide-width hello jcconv

  • Python による日本語自然言語処理

    はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日語を対象とする場合、いくつか気をつけなければいけない点があります。日語を扱う場合にも

  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 1