shodaiのブックマーク / 2023年8月21日

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

デンマークの著作権侵害対策グループ「Rights Alliance」が、約20万冊にも上る書籍のデータセット「Books3」を削除するよう、ホストする「The Eye」に対して要請し、データセットの削除が行われました。Books3はMetaの開発する大規模言語モデル「LLaMA」のトレーニングにも使用されたデータセットです。 Anti-Piracy Group Takes Prominent AI Training Dataset ''Books3' Offline * TorrentFreak https://torrentfreak.com/anti-piracy-group-takes-prominent-ai-training-dataset-books3-offline-230816/ Revealed: The Authors Whose Pirated Books Are P

shodai 2023/08/21

リンク

「AIが生成した作品は著作権で保護される余地がない」との判決が下る

AIによって制作された作品が著作権で保護されるかをめぐる裁判で、「著作権の主張には著作者が人間であることが必要」だとして、AIの作品の著作権登録を求めた原告の訴えを退ける判決を下しました。一方裁判を担当した判事は、AIが人によって制作された作品でトレーニングされた場合における保護の範囲など、生成AIの登場により今後難しい課題が生じてくるだろうとの予想も示しています。 Artificial Intelligence Laws uit: AI-Generated Art Not Copyrightable – The Hollywood Reporter https://www.hollywoodreporter.com/business/business-news/ai-works-not-copyrightable-studios-1235570316/ AI-generated art c

shodai 2023/08/21

リンク

Llama 2 の日本語出力性能を評価してみた｜Lightblue

はじめにこんにちは、Lightblue の富岡です。 Meta から先月（日本時間2023年7月19日）発表された「Llama 2」ですが、その日本語性能については賛否両論で、評価がまだ定まっていません。本記事では、Llama 2 （7B ・13B）の日本語による質問応答性能についてまとめます。結論から言うと、Llama 2 の出力は公開モデルの中では優秀な方と言えそうです。既存のモデルとの比較はもちろん、Llama 2 を日本語でファインチューニングした独自モデルの評価も合わせて紹介します。 Llama 2 の意義「Llama 2」は、Metaが開発した7B・13B・70BパラメータのLLMです。 2023年2月に公開された「初代Llama」では商用利用は認められていませんでした。一方で Llama 2 は、商用利用が無料で可能なライセンス形態と、ソースコードだけでなくニュ

shodai 2023/08/21

Llama2

リンク

1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓！ニュースイッチ by 日刊工業新聞社

情報通信研究機構（ＮＩＣＴ）が１７９０億パラメーターの大規模言語モデル（ＬＬＭ）の開発を進めている。高品質な日本語データを学習させており、日本社会の常識を備えたモデルになると期待される。ＮＩＣＴが学習データを保有しているため、データとモデルの両面から誤情報生成の対策を検証できる。これは日本が人工知能（ＡＩ）を使いこなし、リスクに対応していく知見になる。ＮＩＣＴは産学官に成果を提供する。「学習途中だが、出来はいまいち。この苦労がＬＬＭ開発の基礎になる」―。ＮＩＣＴの鳥澤健太郎フェローは開発中のＬＬＭの手応えをこう説明する。７月に４００億パラメーターのＬＬＭを発表し、現在は１７９０億パラメーターのＬＬＭを開発中だ。巨大なＡＩモデルの学習はリスクが高い。学習の途中で計算が破綻することがたびたび起こるのだ。そこで破綻を防ぎつつ精度の高い計算を限られたメモリーで実行することがノウハウになる。例

shodai 2023/08/21

リンク

AIが「理解」するから、API仕様書のコピペでアプリができあがるローコード開発環境「Flowise」を試す【イニシャルB】

shodai 2023/08/21

Low codeはこれから大きく変わるよなぁ

リンク

全員懲戒～三人の市職員がのべ 967 回不正ログイン | ScanNetSecurity

鹿児島県日置市は8月4日、コンピュータの不適正使用による3件の懲戒処分について発表した。 1件目は、同市の教育委員会主査（36歳）が業務用パソコンから他の職員のIDとパスワードを推測し、 2023年1月1日から4月21日までの間に、計61人、延べ697回にわたり不正ログインを行い、メール等の閲覧を行うとともに、人事評価記録書等の電子データを自身の業務用パソコンに保存したというもので、8月4日付で減給 10分の1 3月の処分を行っている。

shodai 2023/08/21

リンク

近況報告：無職になりました - IT戦記

みなさんお元気ですか？僕は少しだけ元気ではありません。じんわりとした夏の暑さを感じながらブログを書いています。実は、数ヶ月前にスマートニュースという会社を退職しました。しばらく無職しばらくは就職せずに無職でいようかなと思っています。すぐに再就職した方がいいんだろうな〜。とは思うのですが少し疲れたかも。いい時代になったものだ最近は AI の進化も素晴らしく、昔ソフトウェアで出来なかったことがどんどんできるようになってるなって感じます。 Rust とか、ちょうど欲しかった感じのプログラミング言語もあるし、 ChatGPT は完璧ではないけど何か新しいことを始めるときに素晴らしい洞察を与えてくれる。時代は確実に良くなってる。そんな時代に「自分は働いていないくていいのか」と少し不安になるけれど、自由気ままにコードを書く、そんな時間が今あってのもいいのかなって思ってます。オフトピック

shodai 2023/08/21

リンク

オープンソースの定義にこだわるのはもう無意味なのか？ - YAMDAS現更新履歴

[2023年8月22日追記]：松尾研究室の投稿にあるように、問題のプレスリリースは修正がなされ、「オープンソース」の記述は削除されている。 weblab.t.u-tokyo.ac.jp 東京大学松尾研究室が大規模言語モデル（LLM）を公開というニュースが先週話題となったが、「商用利用不可のオープンソース」という記述に「商業利用できない」のであれば、オープンソースではないという突っ込みがすかさずあがり、佐渡秀治さんも「座視することが難しい」と意見表明している。ワタシもこれらの意見に賛成である（事実そうした声を受けて、ITmedia などは記事の記述を改めている）。ただ、この話題にすっぽり重なる文章を少し前に見て、居心地が悪い思いをしていたので、それを紹介しておきたい。 www.infoworld.com 「オープンソースのライセンス戦争は終わった」というタイトルだが、どういう文章なのか？

shodai 2023/08/21

リンク

はてなブックマーク

タグ

2023年8月21日のブックマーク (8件)

Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される

「AIが生成した作品は著作権で保護される余地がない」との判決が下る

Llama 2 の日本語出力性能を評価してみた｜Lightblue

1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓！ニュースイッチ by 日刊工業新聞社

AIが「理解」するから、API仕様書のコピペでアプリができあがるローコード開発環境「Flowise」を試す【イニシャルB】

全員懲戒～三人の市職員がのべ 967 回不正ログイン | ScanNetSecurity

近況報告：無職になりました - IT戦記

オープンソースの定義にこだわるのはもう無意味なのか？ - YAMDAS現更新履歴

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス