[B! nlp] efclのブックマーク

efcl id:efcl

nlpに関するefclのブックマーク (89)

GitHub - togatoga/kanpyo: Japanese Morphological Analyzer written in Rust
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
efcl 2024/06/26
Rustで書かれた形態素解析

Rust

japanese

nlp
リンク
Amazon.co.jp: 自然言語処理の教科書: 小町守: Digital Ebook Purchas
efcl 2024/05/25
自然言語処理についての書籍

nlp

book
リンク
表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz
その他のサンプル: Wikipedia:良質な記事, Wikipedia:長いページ紹介「テキストゆれないくん」は文章に含まれる表記揺れを検出するツールです。「コンピュータ」と「コンピューター」、あるいは「全て」と「すべて」といった同じ単語の別表記が使われていないかどうかをチェックできます。「テキストゆれないくん」は元々このサイト (https://inzkyk.xyz/) の文章校正用に開発されました。機能が成熟してきたので UI を付けて公開します。このページから手動で使う限り、「テキストゆれないくん」は商用/非商用を問わず自由に使って構いません。「テキストゆれないくん」は無保証で提供されます。特徴ウェブブラウザから使えるこのページをウェブブラウザで開いているなら、「テキストゆれないくん」は既に動いています。このページの最初にあるのは「テキストゆれないくん」を使うための完
efcl 2024/05/03
表記揺れ検出ツール

nlp
リンク
https://www.anlp.jp/proceedings/annual_meeting/2016/pdf_dir/D6-5.pdf
efcl 2023/12/12
形態素解析器によるトークナイズと検索クエリの定量評価についての論文

nlp

paper
リンク
GitHub - greyblake/whatlang-rs: Natural language detection library for Rust. Try demo online: https://whatlang.org/
efcl 2023/12/12
テキストからどの自然言語なのかを判定してくれるCrate。 trigramベースの判定をして、ISO 639-3の言語を返してくれる

Rust

library

language

nlp
リンク
Typoless（タイポレス）朝日新聞社の文章校正AI
「+Plus」プランではPDFファイルの校正が可能になります。エンタープライズプラン、プレミアムプランをご利用中・トライアル中のお客さまは無料でお試しいただけます。詳しくはこちらプレミアム+Plus エンタープライズ+Plus
efcl 2023/11/06
朝日新聞の校正ツール

webservice

japanese

nlp
リンク
GitHub - google/budoux
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
efcl 2023/09/24
TinySegmenter的に機械学習したデータを使って辞書なしの分かち書きを行いライブラリ

JavaScript

nlp

library

MachineLearning
リンク
Getting Started with Natural Language Processing
efcl 2023/09/01
自然言語の入門書

nlp

book

python
リンク
そあん（soan）：古活字画像を用いて現代日本語テキストをくずし字画像に変換／共有するサービス
ライブラリのアプリ化現代のニュースをくずし字で読んでみませんか？内容がわかるテキストをくずし字で読んでみると、くずし字に対する印象が変わるかもしれません。 edomi ニュースその他の事例については、活用事例を参照してください。構成古活字とくずし字そあん（soan）で用いる「古活字」とは、今から400年ほど前に使われた印刷技術に由来する言葉です。一方「くずし字」とは、くずして書かれた文字を指す言葉です。くずし字は、印刷では古活字版だけでなく整版印刷にも使われましたし、写本などの手書きの文字（草書体）も、その多くはくずし字です。一方、古活字の中には、文字を崩していないものもあります。このように、古活字は印刷技術を指す言葉、くずし字は文字の形を指す言葉、という違いがあります。そあん（soan）は、テキストをくずし字画像に変換する方法として、古活字画像を組み合わせる方法を用いるサービ
efcl 2023/08/07
テキストからくずし字の画像生成

nlp

Image

webservice

Tools
リンク
Learn about grammar check in Search - Google Search Help
efcl 2023/08/07
Google検索に文法チェックが入ってる

google

nlp
リンク
Jagger - C++ implementation of Pattern-based Japanese Morphological Analyzer
Jagger - C++ implementation of Pattern-based Japanese Morphological Analyzer About Jagger is a fast, accurate, and space-efficient morphological analyzer [1] inspired by the dictionary-based longest matching for tokenization and the precomputation of machine-learning classifiers. Jagger applies patterns, which are extracted from morphological dictionaries and training data, to input from the begin
efcl 2023/07/30
高速でメモリ消費量が小さな形態素解析

nlp

C++
リンク
最長一致パターンに基づく高速・高精度な日本語形態素解析
ynaga@iis.u-tokyo.ac.jp 1/2 1/20 1,000,000 / C++ 1000 http://www.tkl.iis.u-tokyo.ac.jp/∼ynaga/jagger 1 Twitter Zoom, Slack [1] GPU [2, 3] [4, 5] ( ) () (MeCab, Vaporetto) MeCab 15 Vaporetto 10 (M2 MacBook Air 1,000,000 /) 2 [6] ( ) [7, 8] [9, 10] [11] ― 351 ― 言語処理学会第29回年次大会発表論文集 (2023年3月) This work is licensed by the author(s) under CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/). Algor
efcl 2023/03/13
http://www.tkl.iis.u-tokyo.ac.jp/~ynaga/ 最長一致パターンに基づく形態素解析

nlp

paper
リンク
https://www.anlp.jp/proceedings/annual_meeting/2011/pdf_dir/C4-3.pdf
efcl 2023/02/05
Mozcの統計的かな漢字変換システム

nlp

IME
リンク
DeepL Write: AI-powered writing companion
Write with confidence, powered by AIGet perfect spelling, grammar, and punctuationSound fluent, professional, and naturalFine-tune your writing with word and sentence alternativesChoose a writing style and tone that fits your audience
efcl 2023/01/18
DeepLの文章チェックツール。英語の文章の表現をブラッシュアップするsuggestをしてくれる

editor

nlp

MachineLearning

webservice

english
リンク
GitHub - graykode/commit-autosuggestions: A tool that AI automatically recommends commit messages.
efcl 2023/01/16
BERTを使ったDiffからコミットメッセージを自動生成するツール

nlp

GIt
リンク
続・MeCabの分かち書きを並列処理で高速化する
まとめ Pythonから巨大なテキストファイルを並列に読み込み・処理・書き込みする方法を紹介読み込み: テキストファイルをバイト列として見て、プロセスごとにファイルの読み込み区間を割り振る処理: multiprocessingを用いた並列処理書き込み: プロセスごとにtmpファイルへ並列に書き込み & catによる結合はじめに日本語形態素解析器であるMeCabを用いると、日本語のテキストに対する解析や処理が簡単に実行できます。特に最近は、BERTをはじめとする深層学習モデルへの入力のための前処理として、MeCabなどを用いて文を単語単位に分割する「分かち書き」を行う機会が多くなっています。 MeCabはコマンドラインから実行することもできますし、Pythonなどからプログラム的に呼び出すことも可能です。特にコマンドラインから実行する場合は、インストールさえ終わっていれば以下の
efcl 2022/11/20
形態素解析のパフォーマンス手法

nlp

performance
リンク
ShodoのAI校正APIを一般公開しました - ライティングラボ by Shodo
ShodoのAI校正APIを一般公開しました ShodoのAI校正APIを一般公開しました！ Shodoにユーザーアカウントがあれば、誰でも校正APIをご利用いただけます。こんな文章のタイポや変換ミスをチェックしてくれます：手元で書いたドキュメント Markdownで書いている技術書エディターで書いた記事 ShodoのCLIコマンドもオープンソースで公開されています： $ pip3 install shodo $ shodo login $ shodo lint README.md Linting... 3:11 もしかしてAI 飛行機の欠便があり、運行（→ 運航）状況が変わった。バ 6:5 もしかしてAI ません。これが私で（→ の）自己紹介です。こ 8:11 「ご」や「して」を付けると日本語として正しくなりますこんにちは。なんでも相談（→ 相談して）ください。こちらを.
efcl 2022/10/06
校正API

nlp

API
リンク
MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog
こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは、MeCab互換の形態素解析器Vibrato（ヴィブラ〰ト）を開発しています。プログラミング言語Rustで実装しており、高速に動作することが主な利点です。Vibratoはオープンソースソフトウェアとして以下のレポジトリで公開しています。 github.com 本記事では、Vibratoの技術仕様を解説します。以下のような方を読者として想定します。自然言語処理の要素技術に興味のある方データ構造・アルゴリズムに興味のある方 Rustでの自然言語処理に興味がある方 Vibratoについて最小コスト法による形態素解析単語ラティスの構築最小コスト経路の計算高速化の取り組み辞書引きのキャッシュ効率化実装での注意点連接コスト参照のキャ
efcl 2022/09/20
Rustでの形態素解析器の実装とパフォーマンス。キャッシュヒットの改善

nlp
リンク
GitHub - daac-tools/vibrato: 🎤 vibrato: Viterbi-based accelerated tokenizer
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
efcl 2022/08/23
MeCab互換の形態素解析器

japanese

nlp

Rust

library
リンク
GitHub - messense/jieba-rs: The Jieba Chinese Word Segmentation Implemented in Rust
efcl 2022/08/17
中国語の形態素解析器

Chinese

library

nlp

Rust
リンク
1 2 3 4 5 次のページ