Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

ブックマーク / www.mwsoft.jp (7)

  • MeCabのコマンドライン引数一覧とその実行例 | mwSoft

    -r --rcfile 使用するリソースファイルを指定する リソースファイルとは、辞書ディレクトリに入っている「dicrc」ファイルを指します。 試しにシステム辞書の「dicrc」ファイルをコピーして、「dicrc2」というファイルを作り、その中の「; simple」の「EOS」を「eos」に書き換えます。するとこんな風になります。 // リソースを指定せずに実行 $ echo テスト | mecab -O simple テスト 名詞-サ変接続 EOS // リソースを改変したdic2に指定して実行 $ echo テスト | mecab -r dicrc2 -O simple -d /usr/local/lib/mecab/dic/naist-jdic テスト 名詞-サ変接続 eos 我が家の環境では、システム辞書ディレクトリをカレントディレクトリとした状態にするか、「-d」でシステム辞書

    seikenn
    seikenn 2012/01/12
    MeCabのオプション
  • プログラミング言語人気TOP10の簡易解説

    0-1. 前書き この世にはたくさんのプログラミング言語が存在します。Wikiepdiaのプログラミング言語一覧を見ると、実に200個以上というわけの分からない数の言語が並んでいたりします。 【参考URL】プログラミング言語一覧 - Wikipedia http://ja.wikipedia.org/wiki/%E3%83%97%E3%83%AD%E3%82%B0%... 200の中にはほとんど使われてない言語も混じってるので、実際に仕事でざくざく使われている言語は20とか30とかそういうオーダーなのですが、それでも1人の人間が把握するにはちょっと多過ぎる数です。 記事では、そうした有り余るプログラミング言語の海の中で「どれを勉強したらいいの?」とか「どれを採用するのが適切?」という悩みをお持ちの方が「よし、この言語に決めた!」と自信を持って決断できるように背中を押すことを目的として書か

    seikenn
    seikenn 2011/11/28
    この記事をブクマしてなかったとは・・・!
  • Java使いをScalaに引き込むサンプル集 | mwSoft

    前書き Scalaという言語をご存知ですか? Javaと同じくコンパイルされるとclassファイルになり、実行時はJVM上で動作する、オブジェクト指向+関数型のプログラミング言語です。 Scalaを開発したのはJavaのgenericsの設計を手がけたり、javacの開発をしていた経歴も持つMartin Odersky氏。 Scalaは後発の言語ということもあって、Javaを書いている時に感じる冗長さに対する様々な解が用意されています。 記事では、ScalaJavaのコードを比較しながら、JavaユーザがScalaに移った際に得られるメリットを提示していきます。 尚、序盤のサンプルコードはJavaユーザに伝わりやすいように、returnを明記したり、メソッドは必ず{ }で囲むなど、極力Javaっぽい記述をしています。 だいたいJavaと同じような書き方ができます ScalaJava

  • 自然言語系(?)情報 | mwSoft

    形態素解析 Mecab、mecab-ruby、IAP、NAIST、UniDic辞書のインストール手順と簡単なサンプル MeCabをコマンドラインから実行した際に指定できる引数と、その実行サンプル一覧 日テレビ東京というどこで分けるか判別し辛い言葉を使って、コスト計算について解説 複数の辞書による解析結果を並べて表示します。どの辞書を使うか悩んだ時などにお使いください Igoのインストールと軽く使ってみた感想などを 辞書内包でLuceneでもSolrでも使える便利なライブラリ SearchモードがおしゃれなKuromojiを利用したメモ 言語資源 Wikimediaが公開しているDBのダンプ等のデータファイルの入手方法と、内容の説明 Solrサーバを立ててWikipediaのデータを登録する 対象を絞ったIME辞書は良い教師になってくれるかもしれない 不自然言語資源の宝庫であるTwitte

  • Hadoopメモ(主にScala利用) | mwSoft

    Hadoopの導入(CDH3系および0.20利用) Hadoopとはどんなものかをぼんやりと説明 1台構成の擬似分散モードの導入手順 4台構成でNameNodeとDataNodeを動かした際の手順 4台構成でJobTrackerとTaskTrackerを動かした際の手順 Hadoopの導入(CDH4系利用) Clouderaが後悔しているVMイメージを使ってVirtualBox上で動かしてみる Impalaを試す目的で、impala-shellからいろいろコマンドを打ち込んで結果を見てみる。 MapReduce Eclise、Maven、Scalaを使ったMapReduce開発の環境構築とか CDH3、Scala、Kuromojiで形態素解析しつつ日語WordCount LuceneのTokenizerやFilterでテキストを整形してから単語を取り扱ってみる Mapperのメモリ上で集

  • Top Page | mwSoft

    メニュー 形態素解析Scala等、雑多な内容のメモ書き IPアドレスの表示やエスケープ処理等の簡易なアプリ 主にプログラミング関連の文章 文学のような修羅場のような何か TIPSや日記等 ご意見、ご要望などがあればどうぞ

  • Hadoopインストール手順(0.20.1)

    インストール時に打ったコマンドのログです。 素直にQuick Startを見た方が参考になると思いますが、日語で実際に入れた人間のログが役に立つこともあると思ったので公開してみた感じです。 ディレクトリやユーザの構成は、割と自分仕様になっています。 # hadoop用にユーザを追加してみる(任意) $ sudo addgroup -gid 5000 hadoop $ sudo adduser --uid 5000 --home /home/hadoop --shell /bin/bash --system --group hadoop $ sudo passwd hadoop # hadoopユーザになる $ sudo su hadoop $ cd ~ # SUN純正のJDK6をここからダウンロード http://java.sun.com/javase/ja/6/download.htm

  • 1