The domain kfka.net may be for sale. Please send an inquiry to info@first1.com
SPARQL Endpoint 東京都 SELECT DISTINCT * WHERE { <http://ja.dbpedia.org/resource/東京都> ?p ?o . } SPARQL結果 ロック音楽のリスト (もしあれば画像uriも) SELECT DISTINCT ?label ?depiction WHERE { ?s <http://ja.dbpedia.org/property/genre> <http://ja.dbpedia.org/resource/ロック_(音楽)> ; rdfs:label ?label . OPTIONAL { ?s foaf:depiction ?depiction . } } SPARQL結果 誕生日が1月1日 SELECT DISTINCT ?label ?birthYear WHERE { ?s <http://ja.dbpedi
大規模コーパスを無料で手に入れることのできるサイトについて、Quoraで質問したところ回答があったのでまとめてみました。質問してから気づいたのですが、QuoraにはText Corporaというカテゴリがあってその中に似た質問がいくつかあったので、合わせてまとめています。Text Corpora - Quora今回のエントリは主に英語のコーパスに関するものなので、日本語コーパスの情報については以下のエントリをご覧ください。NLP関係のリソースまとめ - nokunoの日記大規模データのエントリが伸びており、この問題に関心のある人の多さが伺えますね。NLP屋としてはやはり、大規模データの中でもテキストデータ(コーパス)に興味のあるところです。 大規模データを無料で手に入れることのできるサイトまとめ - nokunoの日記 タグ付きコーパス(ツリーバンク)Penn Tree bankWSJ C
Bill Ponsford (1900–1991) was an Australian cricketer, the only player to twice break the world record for the highest individual score in first-class cricket. Predominantly playing as an opening batsman, he formed a successful and long-lived partnership opening the batting for Victoria and Australia with Bill Woodfull, his friend and state and national captain. Aside from Brian Lara, he is the on
国立国会図書館長 長尾真氏「ウィキペディアは大いに活用させていただいている」 11月22日、東京大学工学部を会場に『Wikimedeia Conference Japan 2009』が開催された。ウィキメディアの活動にスポットを当てたものとしては日本初のイベントとなる。基調講演では、ウィキメディア財団広報部長のJay Walsh氏がウィキペディアとウィキメディア財団の歴史と現状、そして展望について、また国立国会図書館館長の長尾真氏が、事典や辞書の構成を研究する「辞書学(lexicography)」と、辞書学の視点で見た現在のウィキペディアについて発表を行った。 辞書学とは 長尾氏は1990年に出版された「岩波情報科学辞典」の編集に携わった経験を持つ。後の話にも出るが、これは様々な視点から検索できることや、見出し語の相互関係の表現など、ユニークな特色を持つ専門事典だ。この他、様々な辞書の編集
「なんでも質問する」姿勢と「ググってから質問する」行動や質問の仕方による回答の相場観に関連した話。 卒論生に対して、毎日のように「何でも質問して」というのだけど、まだ質問がでない。なので、どこまで自主努力したら十分努力したとみなすかを具体化してみた。自己規制気味の方は以下をたたき台にしてみてください(なお、指導教員や上司ごとに方針は違うと思うのであくまでたたき台としてご利用ください)。 基本方針 以下のケース別下準備の行動をすべて行なった上で、なお、「すっきりしない」や「納得できない」場合は、指導教員や上司に相談すること。 もっと、念入りに下準備したい場合は自問自答すればよい。 質問の型をいくつか持っておくと便利 一匹狼のための一人Q&A大会 ケース1: 研究の背景、目的、位置づけについて 自分のわからないと思うことを文章で丁寧に書く(親や高校生ぐらいのいとこに説明するつもりで) 研究ノー
11月22日に開かれたWikimedia Conference Japan 2009に行ってきた。おそらく最年少(17歳以下がいなければ)。会場は東大。さすがは日本の知の牙城。貫禄有るたたずまいは相変わらず。自分は高校の時はここの附属生だったので、ことあるごとに訪ねたが、大学に入学してからは初めて来たかも。やっぱ色々違う。軽くブルーになる。基調講演基調講演は途中から参加(激しく寝坊した)。国立国会図書館長の長尾真氏による講演。テーマは「辞書・事典とは何か―その体系性・網羅性・信頼性を求めて― 」。難しいタイトルだが、辞書・辞典の分類から、あり方あるいは、あるべき姿をかみ砕いて説いてくださった。講演と言うよりは、大学の講義みたい。特に僕が一番気になっていた、「Wikipediaは信用できるか」についての話は興味深かった。専門的な用語は、一つの分野でも数万から数十万語ある。そのすべてに対し信頼
この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 脚注による出典や参考文献の参照が不十分です。脚注を追加してください。(2024年10月) 独自研究が含まれているおそれがあります。(2015年6月) マークアップをスタイルマニュアルに沿った形に修正する必要があります。(2024年10月) あまり重要でない事項が過剰に含まれているおそれがあり、整理が求められています。(2015年6月) IMRAD(IPA: /ˈɪmræd/、(イムラッド)は、文章構成 (Organization) の型式 (Style) の名称の1つである。IMRADの名前は、Introduction, Methods, Results And Discussionの略に因む。その名前の由来通り、IMRAD型の文章は、その骨格部が、少なくともIntroduction, Methods, Res
wikipediaのタイトルを追加しようとしたらいくつかハマったので。 環境はFedora10。 まずはmecabのインストール。 # yum install mecab* とりあえずこれだけでおもむろに形態素解析してみる。 # echo けいおん!のせいでtwitter界隈にギター買うとか宣言してる奴が増えた | mecab けい 名詞,一般,*,*,*,*,けい,ケイ,ケイ おん 名詞,一般,*,*,*,*,おん,オン,オン ! 記号,一般,*,*,*,*,!,!,! の 助詞,連体化,*,*,*,*,の,ノ,ノ せい 名詞,非自立,一般,*,*,*,せい,セイ,セイ で 助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ t * w * i * t * t * e
ブログ パスワード認証 閲覧するには管理人が設定した パスワードの入力が必要です。 管理人からのメッセージ https://mac-tegaki.comへ移転中 閲覧パスワード Copyright © since 1999 FC2 inc. All Rights Reserved.
ストーリー by reo 2009年02月13日 11時00分 Johann Gambolputty de von Ausfern- (snip) of Ulm 部門より ある人物の Wikipedia のエントリをきっかけに、以前から指摘されている Wikipedia の問題点が浮き彫りになっているそうだ (本家 /. 記事より) 。 ドイツの経済技術省の大臣に新しく就任した「von und zu Guttenberg」氏は由緒ある名門の家系の出身で、正式な名前は「Karl Theodor Maria Nikolaus Johann Jacob Philipp Franz Joseph Sylvester Freiherr von und zu Guttenberg」というそうだ。氏が大臣に就任するという話が出始めたころ、Wikipedia の同氏に関するエントリが編集され、名前に「Wi
本日は「第20回セマンティックウェブとオントロジー研究会 Wikipediaワークショップ」に参加してきた(セッションIとセッションII).立ち見続出の満員で,Wikipediaを取り巻いた研究の注目度合が感じ取れた. 辞書の構築やオントロジーの構築,異言語対訳への可能性など,Wikipediaという大規模なコーパスを存分に活用した研究だけでなく,Wikipediaの成長や信頼性を検証するという逆の視点から研究しているグループもあり,多岐に渡る可能性を秘めているWikipediaマイニングの将来に希望を感じることができた. ただ言語処理やセマンティックウェブ,情報検索など,Wikipediaが多くの分野に適用できることはわかったが,日本国内だけではなく,世界各国でもこれだけ注目されている新分野だけに,同じような取り組みをすることも考えられるし,その中でどう新しさを見出すか,秀でた成果を出す
■ Wikipedia ∩ Winny で何が判るか 毎日新聞の朝刊にこんな記事が出た。 原田ウイルス、ウィキペディアに項目 自ら作成し更新?, 毎日新聞, 2008年1月27日 容疑者(24)が、インターネット上の百科事典「ウィキペディア」日本語版に、同ウイルスの項目を自ら作成していた可能性が高いことが26日、分かった。「ウイルス対策ソフトには全く対応していない」と、性能を誇るような文章を書き込むなど、更新も頻繁にしていたとみられる。府警もこの事実を把握。 (略)容疑者が匿名で開設したホームページ(HP)「P2P−DESTROYER」に関する項目もほぼ1人で書き込んでいた。 調べてみた。 まず、「原田ウイルス」のエントリの変更履歴から、初版の内容を見ると、次などの文が気になる。 山田ウィルスの亜種なのではなかという噂があったが、実際は山田ウィルスとは全く別物といえる。 山田ウィルスと同様
米ウィキアは2008年1月7日、オープンソースで開発を進めている検索エンジン「Wikia Search」のアルファ版を公開した。処理の仕組みを公開すること、ユーザーからのフィードバックを受けて検索結果を改良していくことなどを特徴とする。ウィキアは、ユーザーの手で作られる知識共有型の百科事典サイト「Wikipedia」を創始したジミー・ウェールズ氏らが2004年に設立した会社。Wikipediaのようにユーザーの広い支持を得られれば、インターネット検索の分野で台風の目となる可能性がある。 「ウィキアの検索エンジンは、オープンで、透明性の高い、公開された方法によって、信用ある利用者のコミュニティーからのフィードバックによって作られるものと考えています」――ウィキアは、Wikia Searchの目指すところをそう説明する。 具体的には、(1)透明性(2)コミュニティー(3)品質(4)プライバシー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く