[B! parser] nitoyonのブックマーク

nitoyon id:nitoyon

parserに関するnitoyonのブックマーク (10)

京都テキスト解析ツールキットを使ってみた - 射撃しつつ前転改
KyTea(京都テキスト解析ツールキット)は京大のGraham Neubigさんが中心となって開発している単語分割&発音推定ツールである。私はかな漢字変換用の学習データを作るのにこれまではmecabを使っていたのだが、mecab-ipadicのデータには、そもそも読み推定に力が入ってない、という問題があった。形態素解析は文章を単語に区切ることと品詞を推定する事が主目的な感じなのでそこを期待するのはそもそも筋違いなのだが。かといって自分で作ろうにも、こういうものは学習用コーパスが必要なので、コードだけで簡単にどうにかできる問題ではない。コーパス作りはとても手間のかかる作業なので、気軽に週末に作れるようなものでもない。というわけで、根本的な解決は棚上げして、これまではmecabの解析結果を後付けで適当に確率的に揺らしてみたりとかしながら使ってきたのである。そこに新しくKyTeaが現れた。
nitoyon 2010/04/23
京大のGraham Neubig 氏が開発した KyTea。mecab が力を入れていない「読み推定」に強み。

parser
リンク
steps to phantasien(2009-01-30) - Martin Fawler は(多分)やっていないこと
ThoughtWorks アンソロジーを読んでいたら Ruby を使った DSL の話が載っており, 仕事でうっかり Ruby DSL を作ってしまった私は興味深く読んだ. 特段目新しい話じゃないものの, (DSL と言えば聞こえはいいけれど要は設定ファイルですからね.) オレオレ DSL を作る際には "Martin Fowler もやっている" と言えば説得力もあるってもんだろう. 説得力はさておき, Martin Fowler は私の DSL が抱える問題に答えてくれなかった. 最近の私は Ruby DSL の文書化に困っている. その DSL/設定ファイルはもともと余興にちまちま作っていたもので, 思ったより出来がよくなったため実プロジェクトで使いはじめたところだった. ちゃんと使ってみると案の定ぼろぼろと問題がでて, 後始末のために残業が続いている. まあドッグフードの自業
nitoyon 2009/02/03
ruby_parserでパースして、XMLに変換して、XPath でドキュメント化。

ruby

documentation

parser

dsl
リンク
お手軽パーザー
日頃より楽天のサービスをご利用いただきましてありがとうございます。サービスをご利用いただいておりますところ大変申し訳ございませんが、現在、緊急メンテナンスを行わせていただいております。お客様には、緊急のメンテナンスにより、ご迷惑をおかけしており、誠に申し訳ございません。メンテナンスが終了次第、サービスを復旧いたしますので、今しばらくお待ちいただけますよう、お願い申し上げます。
nitoyon 2009/01/24
10分で書く50行の再帰下降 LL(1) 数式パーサー。左再帰や先読みにどう対処するか。

parser

compiler

c++

algorithm
リンク
正規表現ベースの字句解析器を書くときは - 最速チュパカブラ研究会
正規表現ベースの字句解析器を書くときは、narcissusというJSベースのJS処理系のコードを見るといいです http://mxr.mozilla.org/mozilla/source/js/narcissus/jsparse.js 面倒な正規表現の模範解答が載ってます。下手に自分で考えて誤爆するより、一流の人が書いたものを使いましょう正規表現リテラル /^\/((?:\\.|[^\/])+)\/([gimy]*)/ 文字列（ダブルクォート、シングルクォート共）/^"(?:\\.|[^"])*"|^'(?:[^']|\\.)*'/ → 訂正 Cスタイルコメント（一行、ブロック共） /^\/(?:\*(?:.|\n)*?\*\/|\/.*)/ ↓narcissusについてはyukobaさんのプレゼンを(去年のShibuya.es) http://accelart.jp/shibuyajs
nitoyon 2008/04/29
各種リテラルの正規表現。narcissusが参考になる。

regex

javascript

parser
リンク
八角研究所 : Flash/Flex で作る俺様言語(kmyacc編)（2） - kmyacc で BASICっぽい言語を作ってみよう
Flash/Flex で作る俺様言語(kmyacc編)（2） - kmyacc で BASICっぽい言語を作ってみよう
nitoyon 2008/04/20
kmyacc(as)でBASIC

parser

yacc

actionscript

basic
リンク
八角研究所 : Shibuya.abcより、携帯電話で遊べる俺様言語を作ってあそぶ(1)
Shibuya.abcより、携帯電話で遊べる俺様言語を作ってあそぶ(1)
nitoyon 2008/03/17
俺様言語をFlashで。言語入門によさげ。

abc

mobile

parser
リンク
八角研究所 : Flash/Flex で作る俺様言語(kmyacc編)（1） - kmyacc の ActionScript 版を使ってみよう
Flash/Flex で作る俺様言語(kmyacc編)（1） - kmyacc の ActionScript 版を使ってみよう
nitoyon 2008/02/28
kmyacc+AS3で遊ぼう。未読。

unread

actionscript

parser
リンク
はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
nitoyon 2007/11/18
HTML文字列をパースして、DOMノードに変換するパーサー。<br/>のように/は必須。

html

parser
リンク
10分で書く字句解析器 - Scala で TAPLを勉強しつつ LLVM コンパイラを作る日記
http://sakurai.s59.xrea.com/10min/10minlex.html なんか、やってみました。後で見たら、最後失敗してて恥ずかしいです。名前が、sakuraiなもんで。sakuraエディタ使ってみました。正規表現使ってます。字句解析って、flexをインストールしようとして失敗したり、手書きで長々書いてあって、めんどくさくて大変だったりってのが多いように思うので、めんどくさいっていうイメージを払拭したくてやってみました。次回は１０分で書く構文解析器をやろうと思います。
nitoyon 2006/01/24
正規表現で字句解析。

parser

javascript

compiler
リンク
10分で書く構文解析器 - Scala で TAPLを勉強しつつ LLVM コンパイラを作る日記
10分で書く構文解析器をやってみました。再帰下降法を使っています。四則演算して結果を返します。最初に、簡単なスタックのように使える文字読み込み関数pop(),push(),peek()をつくり、その関数を利用して、再帰下降構文解析の関数expr,term,factを作成しています。字句解析は、pop()とfact()関数内でやってる感じです。時間が余った分、空白の処理を入れています。 htmlはありものを使ってるので、実質、作ってる時間は5,6分です。ムービー http://sakurai.s59.xrea.com/10min/10minparse.html できあがったもの http://sakurai.s59.xrea.com/10min/parse.html 詳しいところは、id:tanakhさんの 10分で書ける、お手軽パーザーを見てください。 http://fxp.
nitoyon 2006/01/24
再帰下降法による構文解析。

parser

javascript

compiler
リンク
1