タグ

2023年8月21日のブックマーク (8件)

  • Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

    デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。 Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak https://torrentfreak.com/anti-piracy-group-takes-prominent-ai-training-dataset-books3-offline-230816/ Revealed: The Authors Whose Pirated Books Are P

    Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される
    shodai
    shodai 2023/08/21
  • 「AIが生成した作品は著作権で保護される余地がない」との判決が下る

    AIによって制作された作品が著作権で保護されるかをめぐる裁判で、「著作権の主張には著作者が人間であることが必要」だとして、AIの作品の著作権登録を求めた原告の訴えを退ける判決を下しました。一方裁判を担当した判事は、AIが人によって制作された作品でトレーニングされた場合における保護の範囲など、生成AIの登場により今後難しい課題が生じてくるだろうとの予想も示しています。 Artificial Intelligence Lawsuit: AI-Generated Art Not Copyrightable – The Hollywood Reporter https://www.hollywoodreporter.com/business/business-news/ai-works-not-copyrightable-studios-1235570316/ AI-generated art c

    「AIが生成した作品は著作権で保護される余地がない」との判決が下る
    shodai
    shodai 2023/08/21
  • Llama 2 の日本語出力性能を評価してみた|Lightblue

    はじめにこんにちは、Lightblue の富岡です。 Meta から先月 (日時間2023年7月19日)発表された 「Llama 2」 ですが、その日語性能については賛否両論で、評価がまだ定まっていません。 記事では、Llama 2 (7B ・13B) の日語による質問応答性能についてまとめます。結論から言うと、Llama 2 の出力は公開モデルの中では優秀な方と言えそうです。 既存のモデルとの比較はもちろん、Llama 2 を日語でファインチューニングした独自モデルの評価も合わせて紹介します。 Llama 2 の意義「Llama 2」は、Metaが開発した7B・13B・70BパラメータのLLMです。 2023年2月に公開された「初代Llama」では商用利用は認められていませんでした。 一方で Llama 2 は、商用利用が無料で可能なライセンス形態と、ソースコードだけでなくニュ

    Llama 2 の日本語出力性能を評価してみた|Lightblue
  • 1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓! ニュースイッチ by 日刊工業新聞社

    情報通信研究機構(NICT)が1790億パラメーターの大規模言語モデル(LLM)の開発を進めている。高品質な日語データを学習させており、日社会の常識を備えたモデルになると期待される。NICTが学習データを保有しているため、データとモデルの両面から誤情報生成の対策を検証できる。これは日人工知能(AI)を使いこなし、リスクに対応していく知見になる。NICTは産学官に成果を提供する。 「学習途中だが、出来はいまいち。この苦労がLLM開発の基礎になる」―。NICTの鳥澤健太郎フェローは開発中のLLMの手応えをこう説明する。 7月に400億パラメーターのLLMを発表し、現在は1790億パラメーターのLLMを開発中だ。巨大なAIモデルの学習はリスクが高い。学習の途中で計算が破綻することがたびたび起こるのだ。 そこで破綻を防ぎつつ精度の高い計算を限られたメモリーで実行することがノウハウになる。例

    1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓! ニュースイッチ by 日刊工業新聞社
    shodai
    shodai 2023/08/21
  • AIが「理解」するから、API仕様書のコピペでアプリができあがるローコード開発環境「Flowise」を試す【イニシャルB】

    AIが「理解」するから、API仕様書のコピペでアプリができあがるローコード開発環境「Flowise」を試す【イニシャルB】
    shodai
    shodai 2023/08/21
    Low codeはこれから大きく変わるよなぁ
  • 全員懲戒 ~ 三人の市職員がのべ 967 回不正ログイン | ScanNetSecurity

    鹿児島県日置市は8月4日、コンピュータの不適正使用による3件の懲戒処分について発表した。 1件目は、同市の教育委員会 主査(36歳)が業務用パソコンから他の職員のIDとパスワードを推測し、 2023年1月1日から4月21日までの間に、 計61人、延べ697回にわたり不正ログインを行い、メール等の閲覧を行うとともに、人事評価記録書等の電子データを自身の業務用パソコンに保存したというもので、8月4日付で減給 10分の1 3月の処分を行っている。

    全員懲戒 ~ 三人の市職員がのべ 967 回不正ログイン | ScanNetSecurity
    shodai
    shodai 2023/08/21
  • 近況報告:無職になりました - IT戦記

    みなさんお元気ですか?僕は少しだけ元気ではありません。じんわりとした夏の暑さを感じながらブログを書いています。 実は、数ヶ月前にスマートニュースという会社を退職しました。 しばらく無職 しばらくは就職せずに無職でいようかなと思っています。 すぐに再就職した方がいいんだろうな〜。とは思うのですが少し疲れたかも。 いい時代になったものだ 最近は AI の進化も素晴らしく、昔ソフトウェアで出来なかったことがどんどんできるようになってるなって感じます。 Rust とか、ちょうど欲しかった感じのプログラミング言語もあるし、 ChatGPT は完璧ではないけど何か新しいことを始めるときに素晴らしい洞察を与えてくれる。 時代は確実に良くなってる。そんな時代に「自分は働いていないくていいのか」と少し不安になるけれど、自由気ままにコードを書く、そんな時間が今あってのもいいのかなって思ってます。 オフトピック

    近況報告:無職になりました - IT戦記
    shodai
    shodai 2023/08/21
  • オープンソースの定義にこだわるのはもう無意味なのか? - YAMDAS現更新履歴

    [2023年8月22日追記]:松尾研究室の投稿にあるように、問題のプレスリリースは修正がなされ、「オープンソース」の記述は削除されている。 weblab.t.u-tokyo.ac.jp 東京大学松尾研究室が大規模言語モデル(LLM)を公開というニュースが先週話題となったが、「商用利用不可のオープンソース」という記述に「商業利用できない」のであれば、オープンソースではないという突っ込みがすかさずあがり、佐渡秀治さんも「座視することが難しい」と意見表明している。 ワタシもこれらの意見に賛成である(事実そうした声を受けて、ITmedia などは記事の記述を改めている)。ただ、この話題にすっぽり重なる文章を少し前に見て、居心地が悪い思いをしていたので、それを紹介しておきたい。 www.infoworld.com 「オープンソースのライセンス戦争は終わった」というタイトルだが、どういう文章なのか?

    オープンソースの定義にこだわるのはもう無意味なのか? - YAMDAS現更新履歴
    shodai
    shodai 2023/08/21