Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

日本語に関するjdashのブックマーク (30)

  • AIアシスタントの力を借りてプレスリリースを磨き上げる? CopilotやChatGPTなど6つのテキスト生成AIを試してみた

    テキスト生成AIを使った文章書き換えの流れ今回の作業の流れはこちらです。 担当者(人間)にプレスリリースの原稿を作ってもらう。 その原稿を丸ごと生成AIのプロンプトに貼って問題がないかを確認してもらう。 大きな問題がなければ全体をテキスト生成AIに書き換えてもらう。 今回使ったプロンプトは2つです。 貴方はプロのセールスマーケッターです。以下のプレスリリースの文章で不適切な部分がないかを確認してください。不適切な部分は指摘してください。 最初のプロンプトで大きな問題がないかをチェックします。 指摘もしてもらうようにすることで次回プレスリリースを作るにどこを注意すべきなのかを知れます。 わかりました。プレスリリースが反響があるように書き換えてください 2つ目のプロンプトで文章全体を書き直してもらいます。 指摘してもらった内容を自分で直すのも時間がかかりますし、指摘されたことが既にわかっている

    AIアシスタントの力を借りてプレスリリースを磨き上げる? CopilotやChatGPTなど6つのテキスト生成AIを試してみた
    jdash
    jdash 2024/04/30
    ブログ書いた。テキスト生成AIのCopilot・ChatGPT・Claude 3・Llama 3・Perplexity・Geminiを使ってプレスリリースの文章をチェックしてもらい、書き直してもらいました。
  • Blueskyの投稿は日本語が一番多い🤩 (2024年2月調査)

    人はBlueskyが好きってことでしょうか。 Blueskyの中の人の調査(2024年2月22日から過去48時間)によれば、投稿されている言語でトップは日語です(笑)。 ===Edgeブラウザーの翻訳=== 位置情報はありませんが、過去48時間の投稿における言語使用の内訳(lingua-goで検出された言語に基づく)はこちらです。 上位言語: 日人:43% 英語:34% ドイツ語:6% フランス語:2% 世界各国で使われている英語に日語が9ポイント上回っていることがすごいですね。(言語のユーザー数では圧倒的に負けているのに投稿数で勝っている時点で相当な数を投稿しているということ) 今はXになったTwitterでは日人の使用時間が世界で最も長いという報告もあったくらいなので、Twitterに似たSNS(匿名・短文)が日人に好まれているといってもよいかもしれませんね。 個別の国と

    Blueskyの投稿は日本語が一番多い🤩 (2024年2月調査)
    jdash
    jdash 2024/02/26
    ブログ書いた。やはりというかなんというかな事実をブログに記録しておきました タイトル落ちしていますがw
  • 1つの HTML ファイルだけで完結する校正支援ツールの作り方

    こんにちは。LINEヤフー株式会社でテキストマイニングや自然言語処理などをやっている山下( @yto )です。 Yahoo!デベロッパーネットワークのテキスト解析 Web API が CORS(Cross-Origin Resource Sharing)対応したため、サーバがなくてもブラウザから直接 Web API にアクセスできるようになりました(参考)。 そのテキスト解析 Web API の機能の一つである「校正支援」は日語文章の品質チェック(校正)を支援するもので、文字の入力ミス、言葉の誤用、わかりにくい表記、不適切な表現などが使われていないかをチェックして、指摘します(内部の辞書データをベースとしているため完全なものではないことをご承知おきください)。 この校正支援機能のサンプルプログラムとして「HTML ファイル1つだけで完結する校正支援ツール」を作ったので紹介します。入力され

    1つの HTML ファイルだけで完結する校正支援ツールの作り方
  • 国語辞書の購入の手引き 市販15種徹底比較【1種追加】 - 四次元ことばブログ

    新学期も近づき、国語辞書を買おうと書店へ足を運んだり、ネット書店で売れ筋の辞書をチェックしたりするも、種類が多くて何がなんだかわからないという迷える子羊たちが出没する季節になりましたが、いかがお過ごしでしょうか。 あなたもそんな迷える子羊の一人でしょうか。それはちょうどいいところにいらっしゃいましたね。私もかつては迷える子羊でした。迷いに迷った挙句、新刊書店で手に入る国語辞書はとりあえず全部買うという力技で迷いから解き放たれたこの私が、それぞれの辞書の特徴をざっくりまとめてみました。辞書選びのヒントとしてご活用いただければ幸いです。 この記事では、おおよそ高校生から一般に向けて編集された小型(7万語前後を収録した辞書)のもので、新刊書店で手に入るもののみ扱います(復刻版を除く)。初版の刊行年の古い順に紹介しています。 各論に入る前に、辞書を選ぶ上で念頭に置いていただきたい4つの事実を述べて

    国語辞書の購入の手引き 市販15種徹底比較【1種追加】 - 四次元ことばブログ
    jdash
    jdash 2017/02/18
    新明解国語辞典と新潮国語辞典と明鏡国語辞典と大辞林があればいいんじゃないの(これらはすべて方向性が違うと思うわ)。(大辞林はCD-ROMでもATOKでもYahoo!辞書でもいいが)
  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
    jdash
    jdash 2016/09/12
    これでオフショアの人が日本語DTPやるときも「すまるだ!」とか「そこなんで詰めて1行にしないの?」とか言われなくて安心になるね(とか言ってみる)
  • 「脈はないと思います」――恋愛相談に人工知能が話し言葉でアドバイス 教えて!goo「オシエル」

    NTTレゾナントは9月6日、Q&Aサービス「教えて!goo」内で、恋愛相談カテゴリーに投稿された質問に人工知能AI)の「オシエル」が回答するサービスを始めた。恋の悩みを相談すると「何とも言えないですが……脈はないと思います。頑張ってくださいね」「そうだったんですね、大変でしたね……」などとAIが答えてくれる。 質問内容に対し、教えて!gooが持つ過去のQ&Aデータに基づき構成した自然言語で回答するサービス。3000万件以上のQ&Aデータから「使われている単語の意味」「質問と回答の対応関係」「質問内における文の組み合わせ」をディープラーニングで学習し、モデル(型)を作成。質問に対し、作成したモデルから「共感」「結論」「理由」を含む文を抽出して回答を生成する仕組みだ。 AIの回答に対する相談者や閲覧者の評価も学習し、次の回答に活用するという。詳細は公式ページで解説している。 このAI技術は、

    「脈はないと思います」――恋愛相談に人工知能が話し言葉でアドバイス 教えて!goo「オシエル」
    jdash
    jdash 2016/09/07
    『質問に対し、作成したモデルから「共感」「結論」「理由」を含む文を抽出して回答を生成する仕組み』文章構成が定型に沿っていれば受け入れやすい文章になるってことだな。
  • kenemic.com

    kenemic.com 2024 著作権. 不許複製 プライバシーポリシー

    kenemic.com
    jdash
    jdash 2016/08/29
    ~と思う・~という・主語・接続詞・~など/なるほど。「~という」はやってしまいがちだな…。「と思う」は他の言葉で使うこともあるけど「絶対・100%」が付けられない付けられないとき使ってしまうな。
  • 「了解しました」より「承知しました」が適切とされる理由と、その普及過程について | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

    あなたは「了解しました」と「承知しました」、どちらをよく使いますか? 【アンケート】 「了解しました」と「承知しました」、どっちを多く使いますか? — 菊池良 / Kikuchi Ryo (@kossetsu) 2016年2月25日 ツイッターでアンケートしたところ、こんな感じでした。わずかに「承知しました」の方が多いですね。 この2つの言い回しですが、「了解しました」よりも「承知しました」を使う方が正しい、とよく言われています。 僕がこれを初めて知ったとき、強い違和感を覚えました。理由は 「了解しました」をよく使っていた 日常でもビジネスでも「承知しました」を使っている人を見たことがなかった ある日、急に言われ始めた からです。「承知」が日常的な言い回しではなかったので、気になったんですね。 そこで調べてみたところ、いつから言われ始めて、どういう経路で定着したのかがある程度わかりました。

    「了解しました」より「承知しました」が適切とされる理由と、その普及過程について | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
    jdash
    jdash 2016/08/03
    これはよく調べられていて良い記事! そして最後にチラッとある「なぜその常識がバズったのか」も合わせて良いこと言っているね。
  • マンガや同人誌など、縦書きのセリフ・キャッチコピーにぴったりな日本語のフリーフォント -源暎ゴシック H-KL

    マンガや同人誌のセリフ・キャッチコピーなどの短い文にインパクトがでるよう、ひらがなとカタカナを通常より5-7%大きくデザインした日語のフリーフォントを紹介します。 マンガや同人誌向けの記号も用意されています。 もちろん、横書きでもビジネス使用でもOKです! フォント: 源暎ゴシック H-KL イラスト: 小倉あずき 源暎ゴシック H-KLは、源暎アンチック・源暎ラテゴ/ラテミンの作者様の新作で、大かな版のフォントです。「H-KL」は Heavy Kana Large の略。 紹介記事: 2017年用、日語のフリーフォント 259種類のまとめ ひらがなとカタカナが通常のフォントより目立ち、そのままで強調を表現することができます。

    マンガや同人誌など、縦書きのセリフ・キャッチコピーにぴったりな日本語のフリーフォント -源暎ゴシック H-KL
    jdash
    jdash 2016/03/05
    『ひらがなとカタカナを通常より5-7%大きくデザインした日本語』リュウミンH-KLのKLのKLと同じか。
  • FirefoxのPDF.js(内蔵PDFビュアー)はFirefox 19の時から2年でどのくらい進化したのか?

    概要 ▶ Firefoxの内蔵PDFビュアーのPDF.jsもかなりレベルアップされていますが、縦書きの文字詰め(文字間の調整)ではまだ難あり。(Firefox 37)ページはプロモーションが含まれている場合があります 2013年2月21日に「FirefoxでPDFの文字が表示されない・文字化けする場合の設定」という記事を書いてから、2年が過ぎました。 この記事では、Firefox 19から標準で動作するようになったPDF.js(内蔵PDFビュアー)が日語を含むPDFの表示が弱すぎると言うことを書きました。 縦書きを多用している新潟市の市報を表示したら、以下の画像の様に縦書き部分が正常に表示されないという、かなり厳しい感じの品質でした。PDFデータは「市報にいがた(平成25年2月17日 2399号)」(新潟市)です。 あれから、2年。 PDF.jsはどこまでレベルアップしたのか、同じデー

    FirefoxのPDF.js(内蔵PDFビュアー)はFirefox 19の時から2年でどのくらい進化したのか?
    jdash
    jdash 2015/04/14
    【書いた】プラグインなしでPDFが見れるのはすごいことだけど、あと一歩。縦書きの詰め・カーニングは難しいのかもなぁ。
  • 日本語文書における句読点 - k_ikiの雑記帳

    公式な文書ではどう表記するのが正しいのか。 学術論文では? 小説では? 同じ日語なのに、印刷物の性格によってルールの縛りに温度差があるように感じられる。 曰く、横書き文書であれば和欧混植の際の句読点を統一するため、日語文書であってもカンマとピリオドを使うべし。 曰く、横書きにおける読点はカンマを使うべきだが、句点はあくまでも「。」を使うべし。 曰く、日語文書である以上、「、」と「。」を使うべし。欧米かぶれ許すまじ。 句読点とは違うけれども、感嘆符「!」や疑問符「?」には来の意味と同時に、文章の終わりという意味を含んでいる。 これらはもともと日語になかったので、日語文書に使うべきでないとの議論も、過去には存在した。欧米かぶれ許すまじ、という議論である。 ここで、日語表記における句読点の由来を少し考えてみたい。 日語文書の場合、中世以前の正式文書は漢文だった。 中世以降、仮名書

    日本語文書における句読点 - k_ikiの雑記帳
    jdash
    jdash 2013/07/15
    そういやこういう話で誰が決めたのかわからないけど「、,」「。.」が全く同じ意味で等価変換できることになっているけど本当にそうなのだろうか?
  • 地方の印刷会社が前年比115%アップできた理由とは - Yahoo!オンビジネス

    jdash
    jdash 2010/10/14
    前年比115%アップと前年比115%は違うだろ。(前年比15%アップ=前年比115%だから115%アップは2倍位って事になるぞ)
  • 読みやすい文章を書くための技法 - RyoAnna

    『坊っちゃん』自筆原稿 読みやすい文章とは、流れるように読める文章だ。難しい言葉はいらない。気のきいた言葉もいらない。文頭から文末まで振り返ることなく読める文章が、最も美しい。 読みやすさの基準は客観的なものだ。読み手には様々な人がいる。老若男女すべての人に対して読みやすい文章を書くのは難しい。ただ、綺麗な文章を書こうとする意識は持ちたい。 文章を書く上で意識すべき技法を紹介する。 常体と敬体 常体とは「だ・である」調の文章であり、敬体とは「です・ます」調の文章を指す。それぞれにメリットとデメリットがある。 常体は、自分の意思を力強く伝える事ができるが、我の強い文章になる。敬体は、優しい印象で共感を得やすいが、まわりくどい文章になる。 常体と敬体を織り交ぜて書く手法もある。まずは自分で試してみて、書きやすい文体を見つければいい。 文章の始まりは短く 最初の一文は短いほうがいい。インパクトが

    読みやすい文章を書くための技法 - RyoAnna
    jdash
    jdash 2010/08/26
    接続語結構多用してしまうなぁ^_^;;外してもわかるものは気をつけないと。『接続語は適度に』
  • 絵文字を「語」として処理する難しさ~「ビール」と「飲み会」見分ける技術 バイドゥ「絵文字の意味検索」ができるまで(3)

    jdash
    jdash 2010/07/15
    絵文字をどのように意味づけするか。おもしろい。文脈から類推するというのは大量にデータを持っているGoogleあたりが得意そう。まぁJustSystemとかも…なのかな?
  • 「ネットやIT技術に弱いブロガー」を1秒で見分ける方法!?:けんじろう と コラボろう!:オルタナティブ・ブログ

    デジタルネイティブなどという言葉が闊歩する時代だが、それにともなって、日語文章のしきたりも変わってきている(らしい)。 先日の飲み会で 「吉田さん、実はITもネットも弱いでしょう」 と言われた。 プログラミングやインストールなどには確かに弱いけど、それがどうかしたか? と少しカチンときて開き直ったが、彼の話ではブログ記事の中身ではなく記事の書き方で,ネット慣れしていない人が見分けられると言うのだ。その方法だが、 ネットやに弱いブロガー」は、ブログ記事で 「文章の最初で字下げする」 のだそうだ。 日ごろからネットに触れていれば、ネットでの記事は英語に合わせて字下げをしないのが当然だということに自然に気がつくはずなのだが、慣れていないブロガーは昔の日文化そのままに字下げしてしまうのだという。(このブログ記事が典型だ、、) 私は小学校時代から”文書の最初は、読みやすいように一文字あけましょう

    「ネットやIT技術に弱いブロガー」を1秒で見分ける方法!?:けんじろう と コラボろう!:オルタナティブ・ブログ
    jdash
    jdash 2010/03/10
    おもしろい視点だけど1行開けがセットじゃないと読みづらそう。メルマガは1字下げしているなぁ。『「ネットやに弱いブロガー」は、ブログ記事で 「文章の最初で字下げする」のだそうだ。』
  • sasapanda.net - このウェブサイトは販売用です! -  リソースおよび情報

    このウェブサイトは販売用です! sasapanda.net は、あなたがお探しの情報の全ての最新かつ最適なソースです。一般トピックからここから検索できる内容は、sasapanda.netが全てとなります。あなたがお探しの内容が見つかることを願っています!

    jdash
    jdash 2010/02/24
    違うんじゃないかという仮説が。『本当に出版社の人たちが「しゅったい」という音を実際に使っているのかという疑問』
  • http://twitter.com/ue5/status/4989503463

    jdash
    jdash 2009/10/19
    ほーそうなのかー『日本語タグは_で閉じると効くんだ 今知った #ペプシあずき_』
  • linelabo.com - このウェブサイトは販売用です! - 組版 句読点 国語 書記史 自主規制 書評 前田 文字 リソースおよび情報

    このウェブサイトは販売用です! linelabo.com は、あなたがお探しの情報の全ての最新かつ最適なソースです。一般トピックからここから検索できる内容は、linelabo.comが全てとなります。あなたがお探しの内容が見つかることを願っています!

  • 『略字 と 大字 』

    こんばんは~ ある時 社内1 いい大学を出ている白鳥さんが 読めない漢字があって ちょっと驚きましたが ちょっと 古い使い方だったからですね。 数字の七を森の形に 3つ並べたものですが 喜 と同じ意味 です。 考えてみると日語って当に難しくて 学校では習わないと思いますが 日常で 略字っていうのを使う事が有ります。 例えば 門とか曜とか機とか 略字だから 打っても変換できなくて 表現に苦慮しますが 日曜日の曜は 旺の右を玉にした字で現わします。 減画略字 というそうです。 まあ 手書きの書類が減っていて 画数が多くても 一瞬で変換できる現代では どんどん忘れられていくのかもしれません。 で 忍さんとこの話をしていて 私が 若いひとはああいうのも どんどん知らなくなっていくんですねえと申しましたから このお話の主は 旧の漢数字が読めなかったそうで よろこぶ は読めなくてもまあいいですが

    jdash
    jdash 2009/07/06
    へー。『日曜日の曜は 旺の右を玉にした字で現わします。減画略字 というそうです。』『手形や戸籍に記載される数字は いち → 壱  に → 弐  さん → 参  じゅう →拾  画数の多い この漢字を使う
  • 日本語組版処理の要件(日本語版)

    1.1 このドキュメントの目的 すべての文化集団は,独自の言語,文字,書記システムを持つ.それゆえ,個々の書記システムをサイバースペースに移転することは,文化的資産の継承という意味で,情報通信技術にとって非常に重要な責務といえよう. この責務を実現するための基礎的な作業として,このドキュメントでは,日語という書記システムにおける組版上の問題点をまとめた.具体的な解決策を提示することではなく,要望事項の説明をすることにした.それは,実装レベルの問題を考える前提条件をまず明確にすることが重要であると考えたからある. 1.2 このドキュメントの作成方法 このドキュメントの作成は,W3C Japanese Layout Task Forceが行った.このタスクフォースは,次のようなメンバーで構成され,ユーザーコミュニティーからの要望と専門家による解決策を調和させるために様々な議論を行ってきた.

    jdash
    jdash 2009/06/16
    これは日本語組版のよい資料だ!うまくまとまっている!