普段からコンパイラをいじめてると、「どうやったらコンピュータが困るか」が、なんとなくわかるようになるんですよね…… https://t.co/vQzX2aN8p8
普段からコンパイラをいじめてると、「どうやったらコンピュータが困るか」が、なんとなくわかるようになるんですよね…… https://t.co/vQzX2aN8p8
まずは単音のフレーズ。 全く反応がない。 次にコード。 全く反応がない。 結果。私がギターで伝えたいことはグーグルでは翻訳できない。
『名探偵コナン』(青山剛昌)で、服部平次が人前でコナンくんを「工藤」と呼んでしまい慌てて「くどい」や「躍動」など似た単語を言ったことにしてごまかすシーンがよく出てきます。では、「工藤」をごまかすときに適した単語は、他にどのようなものがあるのか。そんなニッチな一覧を、極めて論理的に算出した調査がTwitterに公開され「ガチ過ぎる」とその知識と愛に感動する声が多数寄せられています。これはもはや論文レベル! 全てはこの思いから始まった 単語を集める この一覧を作成したのは、やましたさん(@yaa_maa_520)。調査では最初に一般的な単語をIPA(情報処理振興事業協会/Information-technology Promotion Agenc)辞書から、新語や固有名詞をはてなキーワードから収集しました。収集した単語はIPA(国際音声記号/International Phonetic Alp
動画配信サービスNetflixで、字幕がシャッフルされてしまう不具合が報告されています。本編と字幕のミスマッチにより、本来作品内のキャラクターが絶対に言わないようなせりふが表示され、想像を絶するシュールさです。 Netflix公式サイト Twitterで報告された「ゴッド・ファーザー」の字幕が表示されてしまったという例では、「しまじろう」の画面に「ヤクこそは将来を支配する」という児童向けとしては刺激が強めなせりふが表示されてしまったり、「ちびまる子ちゃん」ではまる子の両親が登場する場面で「サインか 頭をふっ飛ばすか 親父が聞いた」という殺伐とした字幕表示されてしまうパターンも。本来あってはならない不具合ですが、こんな不意打ちだと逆に笑ってしまっておもしろいかも。 こうしたバグは過去にもしばしば報告されており、5月には「ドラえもん」や「日本昔ばなし」でストレートすぎる罵声字幕が表示されてしま
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 滝沢カレンのインスタグラムの文章に中毒者が続出してるらしい。 滝沢カレンの理解不能なインスタwwwwwwwwwwww 引用元: https://www.instagram.com/takizawakarenofficial/ #どのような文章構造になっているのだろう 実際に滝沢カレンの文章を読んでみると、日本語としてはなんとなく読めるのだが、文章の意味がなかなか頭に入ってこない。はじめは、何となく、ディープラーニング(RNN系かなにか)でコーパスを学習して、文生成した結果なのかとも思った。 このように感じる要因は色々あると思うのだが、言
この人天才かよ。「Big Bong」さんがYouTube上にアップしている「各国の訛りを日本語で再現」した動画「世界の発音」がすごい! 各言語のアクセントの特徴などをよく捉え、とてもユーモラスなセリフで笑いを誘っています。 出典:Ilyabolotov / iStock. by Getty Images ジローラモさん(イタリア人)やダバディさん(フランス人・元サッカー日本代表トルシエ監督の通訳)、韓流スター、パックンさん、ボビー・オロゴンさん、ゾマホンさんなど外国人タレントの訛りを思い起こします。 ロシアとかほんとにロシアだ。冷酷なイメージまで……。 「フランスはとても綺麗な国だけど、あ、日本より安全じゃない。そして、パリに住んでる人は、あ、ウフン、ロマンチックだけどそんなに優しくはない」(フランス人) 耳が良いんだろうなあ。アメリカ英語と英国英語とかちょっと面白い。ロシア語は英語はいっ
不思議の国 SEが住んでいるところ、そこは不思議な不思議なお国柄です。 新たな国民として移住してきた人、特産物のシステムを買いに来た人など色々な人がこの国には存在します。 しかしこの国で話される言葉は 独特 です。 ぱっと聞いただけでは意味がわからなかったり、よく似た表現であっても微妙にニュアンスが違っていたり。 似たような表現を使い分けるその裏に、その人の意図や省略された文脈が隠されていたりもします。 どこの国でもコミュニケーションを間違うと非常に厄介ですが、そんなことにならぬよう、 お国言葉らしきもの をまとめてみました。 SEを代表例として、このお国言葉を話す人も、話される人も、改めて言葉の意味合いを見つめなおしてみると新たな気付きが得られるかもしれません。 なお、そんなことから 「絶対にSEしか使わない用語」を集めたわけではない のでその点ご了承くださいませ。 他言語版 @micr
何言ってんのお前 Unicode コンソーシアムには里親( Adoptation )制度があり、スポンサーになると文字を一つ選択することで里親になることができる。選択した文字は Unicode コンソーシアムのサイト上 に自分の名前とセットで掲載してもらえるのだ。そこで僕は🍣を選び、1年間の期限付きではあるが🍣の里親、ブロンズスポンサーとなったのである。 どうして "はじめに言葉ありき"というように、人間はそれを指し示す言葉がなければそれを認識できない。ただそれを認識したときに人がどうそれを受け入れるかというのはかなり怪しいもので、Unicode という統一を目指す文字コード体系は最終的に言語以上に文化の壁に当たるのではないかと思っている。実際、人アイコンの肌色で揉めたりとかは事実それなりに起きているし、今「犬を食べる」という絵文字や「鯨を捕まえて食べる」みたいな絵文字が入るとしたら、
「PHPがdisられる時代は終わった~っ! いくぜおまえら~!」「PHP!」「PHP!」(PHPはこの後一回戦で敗退しました) さる2015年1月29日。横浜大さん橋ホールで行われたエンジニア勉強会イベント「CROSS 2015」にて「第一回 プログラム言語対抗綱引き」が行われた。 コンピュータの世界を支えるプログラム言語がその至高性を競い腕力でぶつかる、言語間戦争に決着をつける大会である。 40人の勇者(プログラマー)により死闘を繰り広げたのはC、Perl、PHP、Python、Ruby、JavaScript、Go、Java。 結果、Goの圧倒的勝利で幕を閉じたのだった。あらためて本記事でその全貌をレポートしていこう。 知ってた? 綱引きの掛け声の「オーエス」ってあれ、「OS(オペレーションシステム)」のことなんだぜ? 英語版もご用意しております! English article↓↓↓
Pure Go で辞書同梱な形態素解析器 kagome を公開してみました - Qiita という記事を見て、「Goで形態素解析できれば @zenra_bot もGoで作れる!」と思い、とりあえず全裸にするやつ作ってみた。 https://github.com/sugyan/go-zenra やってることは 全裸で形態素解析をするスクリプト - すぎゃーんメモ と同じで。 Kagome が MeCab と同様に形態素解析してくれる(同じ辞書を使っているらしい)ので、基本的にはそれを使って動詞の前に「全裸で」を挟み込むだけ。 $ go get github.com/sugyan/go-zenra/cmd/zenrize $ echo 'Goを書いてます' | zenrize Goを全裸で書いてます $ cat input.txt そうだ!嬉しいんだ生きる喜び たとえ胸の傷が痛んでも 何の為に
「ドーモ。自然言語処理屋=サン。形態素解析辞書チャドーです」オジギ終了後0.7秒後。ネオサイタマのドロップボックスにアップロードされた辞書のURLが示された。 「アイエエエエ! ケイタイソカイセキ!? ケイタイソカイセキナンデ!?」 小説『ニンジャスレイヤー』の日本語訳 [1] では独特の言葉遣いが使われており、俗に「忍殺語」 [2] と呼ばれている。この忍殺語の形態素解析を行うための辞書「チャドー」のバージョン1.0.0が2014年5月10日公開された。今のところ、Dropboxを通じて配付されている。 かつてニンジャが横行していた時代、日本の人々は文字を連ねるのみで、それを分かつことを知らなかった。古事記にもそう書いている。しかし、言葉の切れ目が分からないと実際不便である。このような状況に対して、平安時代の哲学剣士ミヤモト・マサシは、ジュージツの修行中に形態素解析という手法を発見した。
橘玲の『「読まなくてもいい本」の読書案内』を読んだので、感想とメモをまとめておく。 この本、タイトルは『「読まなくてもいい本」の読書案内』だが、実際には「読まなくていい本」はほとんど紹介されていない。紹介されているのは、当たり前の話かもしれないが読むべき本だ。他の読書案内本と異なっているのは、”こういう本は読まなくて良い”と、ばっさり切り捨てているところ。読むべきか・読まなくてもよいかの基準は、20世紀後半に爆発的に進歩した科学研究の成果に置いている。著者は、この時期に起きた科学研究の大幅な進歩を”知のビッグバン”、”知のパラダイム転換”と呼び、これ以前に書かれた本は(とりあえず)読む必要がないと言い切る。古いパラダイムで書かれた本は捨てて、新しいパラダイムで書かれた本を読もうという話だ。ちょっと乱暴な分け方ではあるが、1980年代に大学生だった私には案外納得できるものだった。学生時代に最
大好きな女性とのデートのとき、この人いいなと思っていても洋画のように「愛を囁く」なんてのは実際かなり気恥ずかしいものですよね。日本人だからそうなのか、僕がヘタレだからなのか分かりませんが直接的に「好きだ」なんてのはなかなか言えないのです。 しかしもし他国のものだったらどうでしょうか。日本語でいうのは恥ずかしいけれど、外国語ならあるいは口説けるかもという方は多いかもしれません。そんなわけで本日は女性を口説く時に使いたい定番のマハーラーシュトラ言語をピックアップします。 女性を口説く時に使いたい定番のマハーラーシュトラ言語 好き प्रेम (Prēma) 大好き मी प्रेम (Mī prēma) 愛している आपण प्रेम (Āpaṇa prēma) 永遠の愛を誓う चिरंतन प्रेम प्रतिज्ञा (Cirantana prēma pratijñā) 君のいない毎日な
概要 この記事は自然言語処理という分野の最新手法word2vec を利用して誰でも遊べるようにするための手順を説明するものです。 word2vecを利用すると意味の計算が実現できます。 例えば"king"から"man"を引いて"woman"を足すと"queen"が出てきたり、 "東京"から"日本"を引いて"フランス"を足すと"パリ"が出てくるという面白い手法です。 自然言語処理とは人間が日常的に用いる自然言語をコンピュータに処理させ、 翻訳や要約、文字入力支援や質問応答システムを作るなどに活用されている分野です。 自然言語処理と言うと耳慣れない言葉かもしれませんが、 実は検索や推薦などで私たちが日常的に利用しているなじみ深い技術でもあります。 自然言語処理の適用範囲や要素技術は幅広いのですが、 その中でもword2vecの特色は、 冒頭でも挙げたように「意味の計算」が出来ることです。 これ
よく訓練されたアップル信者、都元です。お役所で申請書等を書く時、その申請書の記入例に「日本 太郎」等の架空の名前があると思います。 このような名前は、実在の人物名ではなく仮名、しかも多くの人が「これは実際の名前ではなく、例示のための名前である」ということを理解している仮名を使うのが通例です。日本では古くから「名無しの権兵衛」という言い方も使われていますね。ちなみに、英語圏でこれにあたるのが「John Doe」だそうです。(参考:wikipedia) また、ちょっと口語的ですが「うんぬん」「かんぬん」という言葉も、上記と同じ様な役割を持った言葉ですね。地名としては「いろは町」「ほへと町」とか、「げんこつ町たぬき地区」なんていう事例もあるようです。 さらに、これはちょっと違うかもしれませんが、契約書等の法的な文書において、「甲乙丙丁」という文字を変数的に使ったりしますね。文書の頭で(以下、甲と
ついったーで「激おこぷんぷん丸」の国語教員による分析・品詞分解が話題になっていて、 www.yukawanet.com どうなのかなあ、みたいなことをつぶやいていたのですが、けちだけつけていてもあれなので即興で分析。 以下の内容は関連文献の調査とかしてませんので細部は結構適当なところもあります。色々叩いて遊んでみてください。 前提と方法 先頭の要素から分解しながら、その要素をどう考えるのか少し考察する。ちなみに 語:≒自由形態素。単独で句・節・文の構成要素になることができる 接辞:≒拘束形態素。単独で句・節・文の構成要素になることができず、自由形態素にくっついて現れる という粗い定義を採用している。 「激」 「激だ」「激を」などの用法は今のところ見つかっていないので接頭辞とする。 「強い」「はげしい」といった意味で漢語の構成要素となる(例:激痛、激減、激戦、…)のが一般的であると思われるが
2013年05月05日23:00 カテゴリ翠星のガルガンティア Tweet 翠星のガルガンティア 4話 「追憶の笛」 海外の感想(解読) 解読スレがあまりに盛り上がってたので、今回のみ独立させてしまいます。考察記事も 別に作る予定ですが、まあ水着回なので、今週中ぐらいの余裕を持って記事にします。 以下、4chanより引用。(公式に海外配信されています。) 不明ドクターの机の上に並んでいた書籍の言語は何だ?クメール語や派生言語に見えるけど。 不明サマリア文字やサンスクリット文字、モンゴル文字にも見えるような。 不明タイ語みたい 不明見たかぎり、タイ語ではないと思う。 不明サンスクリット語(ブラーフミー文字)の派生系に見えるね。チベット語もその息吹を残してて、この画像みたいに似たような感じだ。 不明 あれはチベット語とはまた別だ。 チベット文字の場合、ここまでうねってない。 不明 まあ、ブラー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く