東京都知事選で支持を訴える安野貴博氏=東京都渋谷区で2024年6月20日午前11時5分、斎藤文太郎撮影 7月の東京都知事選に出馬したAI(人工知能)エンジニアの安野貴博氏(33)が、行政のデジタル化に取り組む都の出資団体「GovTech(ガブテック)東京」のアドバイザーに就任したことが21日、関係者への取材で判明した。13日付。小池百合子都知事と争った関係だが、小池氏が知見を「東京都でも生かしたい」と関心を寄せていた。 安野氏は東京都出身。東京大工学部でAI研究の第一人者である松尾豊教授の研究室に所属。卒業後は大手コンサルティング会社を経て、ベンチャー企業2社を創業した。 過去最多の56人が出馬した都知事選で「テクノロジーで誰も取り残さない東京へ」を主張。AIなどデジタル技術を駆使し、SNS(ネット交流サービス)に寄せられた都民の意見を公約に反映させる双方向型の選挙戦を展開し、約15万票で
どうもこんにちは、だだっこぱんだです。 「今年の最も大きなチャレンジ」 ということで、今回は夏休みにちょくちょくやっていたピアノ採譜AIを作るという挑戦について書いていきたいと思います。 ちなみに結論から言うと、一部うまくいきませんでした。けれどもまだまだ諦め切れずにはいます。もし機械学習に強い方で何か気がついたことや、アドバイス等ありましたら、ぜひ教えていただけると嬉しいです。 👇やろうと思ったきっかけになったツイート 既存の技術 まずは既存の技術を調べていきます。 これについては主にFくんに調べてもらいました。ありがとう😊 このスクラップと同じような内容になってしまいますが、再度まとめていきます。 Onsets and Frames Googleから出ているピアノ採譜AI。Onsets(各音符の開始位置)とFrames(音符が存在するすべてのフレーム)を別タスクに分けて検出すること
ひたすらタイトル通りの出来事なのですが、自分のなかでは黒船来航くらいの衝撃だったので記録しようと思います。 長文になりますので、あまりにも暇な方のみお読みになることをお勧めします。 私はアラサーの会社員で、「くしゃみに興奮する」という性的嗜好を持っています。 自己紹介もそこそこに性癖の話で恐縮です。 くしゃみをさせる対象は人間の女性キャラクターがベストですが、 男性はもちろん、人間ではない(動物などがデフォルメされた)キャラクターでも問題なく楽しめます。 小説など、文章にあらわれるくしゃみの描写にも非常に興奮します。 ただし、現実世界のくしゃみにはあまり惹かれません。 早朝の電車内で、ノーマスクの中年男性がかます爆裂ハクションには殺意に近いものを覚えます。 後で少し書きますが、なりふり構っていられないくらい供給が少ないくせに、注文や条件をつけてしまうわがままな性癖なのです。 くしゃみは一般
声優有志が許諾なき“無断生成AI”にNO 山寺宏一、梶裕貴ら声優26人が啓発動画に出演「声が勝手に売られていた」
ホーム > 新着情報:プレスリリース > 2024年09月 > AIによってナスカ調査が加速したことで、既知の具象的な地上絵の数がほぼ倍増し、地上絵の目的が明らかになった 掲載日:2024.09.24 本発表の主なポイント 山形大学ナスカ研究所とIBM研究所の共同研究プロジェクトの成果が、Proceedings of the National Academy of Sciences (PNAS) に掲載されることが決定した。 AIによって加速化された調査によって、6か月間の現地調査で新たに303個の新地上絵が特定された。これにより、ナスカ台地で確認済みの地上絵の数はほぼ倍増した。 巨大な線タイプの地上絵は、主に野生動物が描かれており、直線と台形の地上絵によって構成されるネットワークに沿って分布している。これらは、共同体レベルの儀礼活動に使用された。 小型の面タイプ(レリーフタイプ)の地上絵
先日のことですが、こんなことを放言したら思いの外伸びてしまいました。 データ可視化は一時期物凄く流行った割に今はパッとしない印象があるんだけど、それは結局のところデータ可視化が「見る人に『考えさせる』仕組み」だからだと思う。現実の世の中では、大半の人々は自分の頭で考えたくなんかなくて、確実に当たる託宣が欲しいだけ。機械学習やAIが流行るのもそれが理由— TJO (@TJO_datasci) 2024年8月28日 これはデータサイエンス実務に長年関わる身としてはごくごく当たり前の事情を述べたに過ぎなかったつもりだったのですが、意外性をもって受け止めた人も多ければ、一方で「あるある」として受け止めた人も多かったようです。 基本的に、社会においてある技術が流行って定着するかどうかは「ユーザーから見て好ましいかどうか・便利であるかどうか」に依存すると思われます。その意味でいうと、データ分析技術にと
このnoteでは現役のWebメディア編集者の目線で、 文章や写真、コンテンツ作成について語っています。 最近こんな投稿をしたところ、さまざまな反響を得られました。 このアカウント@tokakudo で古写真をアップしているんだけど、人物写真をあげると、ここ最近「AIだろ」とコメントが付くようになったわよ。 むしろAIと思われるような、現代人には不可能な表現や活動をしていた人がいたことを反応から分かって、改めて歴史って面白いなと感じている。 pic.twitter.com/kCxZFIYG81 — 勝田健太郎 (@katsuta_kentaro) July 19, 2024 この写真は昭和10年(1935年)に毎日新聞社によって撮影されたもので、 写真に映るのは今はなき有楽町更科さんです。 現代だとUberEatsの配達員さんは目にするものの、 蕎麦屋のクラシックな出前スタイルを見る光景はな
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日本の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日本語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日本語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日本語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日本社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提
「当然の時代の流れだった」と思っているという話。 最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。 あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。 それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストで食っていた。 ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。 ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGやVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。 (そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う) 絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ
(普段日記みたいな物を書かない癖に勢いで書き殴っているからすごい読みにくいと思う、また題名でお察しだが反AIに対し攻撃的な事書くから嫌な方はブラウザバック推奨) 「何でAI絵師をリツイートやフォローして回るオタクがこんなに居るんだ?気が知れなすぎる。脳に障害あるだろコイツら、それとも全員業者なのか?」 数週間前、上記のようなツイートがフォローしていた絵師のリツイートから流れてきた。 大元のツイート投稿者も絵描きで、完全に一言一句を覚えている訳ではないが「脳に障害あるだろ」という言葉はよく覚えている。 一応私はAI絵と分かる投稿垢は気分的に殆どリツイートもフォローもしていなかった。法に照らして問題は無いんだぞと言われても倫理的には別だろう、三店方式スパチャや転売等と同じであまりにやり方がモラルを欠いていると否定的な意識を抱いていた。 しかしFF内の友人達には違う者も多かった。特に親しい親友の
経済産業省では、進化・発展を続けている生成AIのコンテンツ制作への利活用の可能性に着目し、コンテンツ制作に携わる産業界のみなさまに向けて、利活用の方向性をお示しするガイドブックを作成・公表しました。 趣旨・概要 経済産業省では、進化・発展を続けている生成AIのコンテンツ産業における活用可能性に着目し、利活用の促進に向けて、特にゲーム・アニメ・広告の各産業における利活用ケースを調査し整理するとともに、政府関係省庁の各種ガイドライン等を前提として、コンテンツ制作において生成AIを利活用する際の法的留意点及び対応策を検討してまいりました。このたび、それらの調査・検討等の成果として、コンテンツ制作に携わる産業界のみなさまに向けて、知的財産権等の権利・利益の保護に十分に配慮した、コンテンツ制作における生成AIの適切な利活用の方向性をお示しするものとして、「コンテンツ制作のための生成AI利活用ガイドブ
大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く