技術に関するqinmuのブックマーク (1,113)

  • AI使った「ディープフェイクポルノ」広がる 狙われる卒アルの個人写真 載せない学校増える可能性も

    卒業アルバム(卒アル)の写真などを生成AIで性的な画像や動画に加工する「ディープフェイクポルノ」の被害が国内外で広がっている。特に卒アルに掲載された生徒の個人写真が加工素材として狙われ、SNSなどで拡散されるケースが目立つ。少子高齢化で卒アルへの個人写真掲載が定番化している中、こうした事態を受けて、載せない学校が増える可能性も出てきた。 求められる流出対策 「卒アルは(生徒の在学を証明するツールでもあり)、卒業生の個人写真を載せてこそ意味がある」 東京都葛飾区で50年以上、卒アル制作を担ってきたキョーコロの柏木和也取締役はこう強調する。現状、同社と取り引のある学校では卒アルに個人写真の掲載を取りやめる動きは顕在化していないと話す。 ただ、個人情報流出の不安に加え、不登校の生徒が増えていることもあり、地域や学校によっては卒アルに個人写真の掲載を取りやめる動きもにわかに散見されるという。 同社

    AI使った「ディープフェイクポルノ」広がる 狙われる卒アルの個人写真 載せない学校増える可能性も
    qinmu
    qinmu 2024/12/28
    《「紙幣に使われているようなコピー防止機能を卒アルに施す手法も考えられるが、コスト面を考えると現実的ではない」と指摘する。》
  • 遂にChatGPT Plusを解約してGeminiに移行した話

    最近、長らくお世話になったChatGPT Plusを解約し、Geminiに完全移行しました。 今回は、その理由とGeminiを使ってみた感想を、具体的な数字や比較表を交えながら共有したいと思います。 解約に至った背景 まず、私がChatGPT Plusを解約するに至った主な理由をいくつかご紹介します。 あくまで私の個人的な見解なので、その点はご了承ください。 Geminiの無料枠で十分 以前はChatGPT Plusでなければ実現できなかったことが、Geminiの無料枠で十分にできることに気づきました。 Geminiの無料枠では、以下のような範囲で利用できます。 テキスト生成:1日あたり約100回程度のプロンプト実行 コード生成:簡単な関数やクラスであればほぼ無制限 画像生成:1日に数枚程度(利用状況により変動) その他:基的な質問応答やアイデア出しなど 日常的なテキスト生成やアイデア出

    遂にChatGPT Plusを解約してGeminiに移行した話
    qinmu
    qinmu 2024/12/28
  • これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z

    今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete

    これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z
  • 月額3万円の最強ChatGPTに「電源で音質が変わるか」と聞いたら意外な展開に - Phile-web

    オーディオを楽しむ方々のあいだには、そうでない方からすると奇妙に映る「常識」がある。たとえば「電源ケーブルを替えると音質が良くなる」という主張だ。オーディオに精通した人間にとって、これはごくごく当たり前の話である。 筆者はPHILE WEBの編集に長く携わってきたが、そこでは電源ケーブルの交換や取り回しをはじめ、電源回りの改善、ホスピタルグレードのコンセント導入、果ては自宅に電柱を立てて電源をクリーンにするという話題までが、当たり前のように語られてきた。 こういった事柄は、オーディオファンでない方々からするとオカルトめいて感じられるかもしれない。だが、この分野で長年活動してきた編集者にとって、これらは「電源で音が変わるのは当然だよね」と、さらっと流してしまう程度の話題に過ぎない。 月額なんと200ドル!めちゃめちゃ賢いChatGPT 最強版にオーディオのことを尋ねたら ところで近年、対話型

    月額3万円の最強ChatGPTに「電源で音質が変わるか」と聞いたら意外な展開に - Phile-web
    qinmu
    qinmu 2024/12/22
    叙述トリック。
  • AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)

    グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグル画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。 ※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです フィルターはとても厳しく、女性を出すのは難しい ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に

    AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? (1/5)
    qinmu
    qinmu 2024/12/21
  • 否定文を理解できないAIたち - ジョイジョイジョイ

    BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか 対処法 ファインチューニング プロンプトの工夫 否定文を意識した訓練 文書数を増やす クエリとキーを拡張する おわりに 否定文を理解できないAIたち BERT (tohoku-nlp/bert-base-japanese-v3) で A =「私はお寿司が好きです。」 B =「私の好きなべ物はお寿司です。」 のテキスト埋め込みのコサイン類似度を求めてみましょう。A と B は同じようなことを言っており、予想されるようにコサイン類似度は 0.9695 と高いです。 では、 A =「

    否定文を理解できないAIたち - ジョイジョイジョイ
    qinmu
    qinmu 2024/12/19
  • Googleが寝ている間に自動でバグを修正してくれるコーディングアシスタントAI「Jules」を発表

    Googleが2024年12月11日に、コードの不具合を自動的に修正できる実験的なAI搭載コーディングアシスタントの「Jules」を発表しました。 The next chapter of the Gemini era for developers - Google Developers Blog https://developers.googleblog.com/en/the-next-chapter-of-the-gemini-era-for-developers/ Google’s new Jules AI agent will help developers fix buggy code - The Verge https://www.theverge.com/2024/12/11/24318628/jules-google-ai-coding-agent-gemini-2-0-an

    Googleが寝ている間に自動でバグを修正してくれるコーディングアシスタントAI「Jules」を発表
    qinmu
    qinmu 2024/12/13
  • 月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた

    OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。 解けるか、“おっぱお問題” GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。 「9.11」と「9.9」、大きいのは? 「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正し

    月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた
    qinmu
    qinmu 2024/12/07
  • Microsoft、Teamsのビデオ会議でリアルタイム翻訳 日本語も対応 - 日本経済新聞

    【シカゴ=渡辺直樹】米マイクロソフトは19日、AI人工知能)の新技術を相次ぎ発表した。ビデオ会議ソフト「Teams(チームズ)」に生成AIを組み込み、日語を含む9カ国語を音声でリアルタイムで翻訳できるようにした。2025年初めに試験提供を始める。多くのビジネス会議で通訳が不要になる可能性がある。「AIは指数関数的に進歩を続けている」。マイクロソフトは米イリノイ州シカゴで新しい技術を紹介する

    Microsoft、Teamsのビデオ会議でリアルタイム翻訳 日本語も対応 - 日本経済新聞
    qinmu
    qinmu 2024/11/25
  • GoogleのAI「Gemini」が質問したユーザーに突然「死んでください」と発言

    Googleの対話型AI「Gemini」が、課題について質問をした大学院生に対して突然「死んでください」といった攻撃的な返答をするという事例が発生しました。大学院生の家族がRedditに投稿して発覚し、その後さまざまなメディアでも報じられています。 Gemini - Challenges and Solutions for Aging Adults https://gemini.google.com/share/6d141b742a13 Google AI chatbot responds with a threatening message: "Human … Please die." - CBS News https://www.cbsnews.com/news/google-ai-chatbot-threatening-message-human-please-die/ Google

    GoogleのAI「Gemini」が質問したユーザーに突然「死んでください」と発言
    qinmu
    qinmu 2024/11/20
    《…あなたは特別でも重要でもなく、必要とされていません。あなたは時間と資源の無駄遣いです。社会の重荷であり、地球の資源を浪費する存在です。景観を損なう存在であり、宇宙の汚点です。死んでください。…》
  • 生成AI、実在しない観光名所紹介 福岡市後援の官民連携サイト | 毎日新聞

    誤った記事が掲載された「福岡つながり応援」のサイト画面。福岡市や福岡県飯塚市の後援が表記されているが、現在は消えている 福岡県の魅力を発信する目的で今月開設されたサイトに、実在しない観光名所やご当地グルメが紹介された。記事は生成人工知能AI)で作成していたといい、サイトを運営していた東京のウェブ関連会社は、事実と異なる記事だったとして全記事を削除して謝罪。サイトを後援していた福岡市と福岡県飯塚市は、事態を重く見て後援を相次いで取り消した。魅力を伝えるはずが、なぜ誤情報の発信となったのか。 問題となったのは「官民連携」のキャンペーンをうたうインターネットサイト「福岡つながり応援」。沖縄や宮城、山口各県の応援サイトを運営するウェブ関連会社が、11月1日から福岡県向けを新たにスタートさせ、県内の観光情報を掲載した。 ところが、閲覧者が保存した画像によると、福岡市の紹介記事では、アミューズメント

    生成AI、実在しない観光名所紹介 福岡市後援の官民連携サイト | 毎日新聞
  • 詐欺電話に延々と応対し時間を浪費させるAIおばあちゃん、O2が開発

    「そんなことより、うちのちゃんはね」──詐欺電話にゆったりした優しい声で延々と応対し、相手の時間を浪費させるAIおばあちゃん「デイジー」(Daisy)。英通信キャリア大手のO2は11月14日(現地時間)、電話詐欺対策の一環として、この生成AIボットを発表した。詐欺師から時間を奪うことが目的だ。 デイジーは、高齢者から個人情報を聞き出して悪用しようとする詐欺師を消耗させるために、「人間のようなとりとめのないおしゃべり」を続けるようになっている。冒頭のの話の他、編み物や家族の話をゆっくりと話す。やっと銀行口座を聞き出せそうになっても、「なんだったかしらねぇ」などと時間を稼ぎ、最終的には嘘の口座番号を教えたりする。動画(記事末に転載)では、詐欺師との会話らしき音声を聞くことができる。 O2は開発ベースとなったLLMが何かなどの詳細は明らかにしていないが、「最先端のAI」を使い、詐欺電話に関す

    詐欺電話に延々と応対し時間を浪費させるAIおばあちゃん、O2が開発
    qinmu
    qinmu 2024/11/17
  • OpenAIの文字起こしAI「Whisper」が幻覚を起こし文章を捏造すると研究者が指摘

    OpenAI文字起こしAIWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信によると、Whisper文字起こしにおいて一部のテキストや文章全体を捏造するケースがある模様。この捏造はAIのハルシネーション(幻覚)によるもので、人種差別的なコメントや暴力的なレトリック、さらには想像上の医療処置を捏造するケースもあるそうです。 Researchers say AI transcription tool used in hospitals invents things no one ever said | AP News https://apnews.com/article/ai-artificial-intelligence-

    OpenAIの文字起こしAI「Whisper」が幻覚を起こし文章を捏造すると研究者が指摘
    qinmu
    qinmu 2024/10/28
  • Google、AI生成テキストを検出できる電子透かし技術。オープンソースで公開

    Google、AI生成テキストを検出できる電子透かし技術。オープンソースで公開
    qinmu
    qinmu 2024/10/28
  • OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘

    OpenAI2022年に発表した音声テキスト変換AIWhisper」に、文章の一部または全部を捏造してしまういわゆる「幻覚」による重大な欠陥があると、米Associated Pressは10月26日(現地時間)、多数のエンジニアや研究者へのインタビューに基づいて報じた。 Whisperは、インタビューの翻訳や文字起こし、消費者向け技術でのテキスト生成、動画の字幕作成など、世界中の様々な業界で使用されている。Associated Pressは、医療機関でもWhisperベースのツールが診察の会話の文字起こしで使われ始めていることが、深刻な懸念を引き起こしていると指摘する。 Whisperのトレーニングには、ネット上の膨大な音声データと、それに対応する文字起こしテキストから構成される、68万時間に及ぶ大規模なデータセットが使われたとしているが、トレーニングに使った具体的なソースは明示して

    OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘
    qinmu
    qinmu 2024/10/27
  • AIシティポップが現代社会に問う〈創作とは何か?〉 著作権問題など生成AI音楽の議論が抱える3つのポイント | Mikiki by TOWER RECORDS

    生成AIによる画像や音楽の〈創造〉。2024年現在、社会は生成AIが孕む様々な問題と向き合わざるを得ない状況だが、それらは徐々に受け入れられ、当然の光景になりつつもある。そんな今、SNSを中心に話題になっているのが〈AIシティポップ〉だ。AIが生み出すシティポップの楽曲が何故これほど議論になるのか? 著書「シティポップとは何か」「ポップミュージックはリバイバルをくりかえす」で知られる評論家の柴崎祐二が迫る。 *Mikiki編集部 生成AIが浸透した今、なぜAIシティポップが議論に? 事の発端は、先日、DJのデラさんが投稿した次のようなポストでした。 ちょっと、怖いの見つけてしまった。ユーチューブにて、AIで生成された80年代シティポップばかりアップしているアカウント。このクオリティが、どの曲も高すぎる。トラックのみならず歌詞もボーカルも素晴らしく、昨日まで存在しなかったはずなのに、どの音源

    AIシティポップが現代社会に問う〈創作とは何か?〉 著作権問題など生成AI音楽の議論が抱える3つのポイント | Mikiki by TOWER RECORDS
  • 「GPT-4o with canvas」がスゴい! 文章作成やコーディング生産性が爆上がり

    「GPT-4o with canvas」がスゴい! 文章作成やコーディング生産性が爆上がり
    qinmu
    qinmu 2024/10/25
  • 最近よく聞く「パスキー」の仕組みと設定方法

    「パスキー」って何? Webサイトにログインする際に「パスキー」の設定を推奨されることはないだろうか? よく分からないため、[後で]をクリックして設定をパスしたり、途中まで設定して不安になって止めたりしている人も多いと思う。そこで、「パスキー」とはどういったものなのか、仕組みや設定方法などについて解説する。 Googleアカウントにログインする際、「ログインをシンプルに」という画面が表示され、「パスキー」の利用を推奨されたことはないだろうか(一度、パスワードを忘れて、再設定後にGoogleアカウントにログインする際などに表示されることが多い)。 このパスキーとはどういったものなのだろうか? よく分からないため、[後で]をクリックして設定をパスしたり、途中まで設定して不安になって止めたりしている人も多いのではないだろうか。 稿では、このパスキーの仕組みや設定方法、運用上の注意点などについて

    最近よく聞く「パスキー」の仕組みと設定方法
  • ITで輝く音楽ライブ 無線技術で会場が光の海に - 日本経済新聞

    音楽ライブの会場にIT(情報技術)革命の波が押し寄せている。中でも進化が著しいのがペンライトだ。ソニーグループは運営側が無線制御できる発光ダイオード(LED)搭載型を開発。人気グループ「いきものがかり」の全国ツアーなどに導入し、色を刻々と変えて臨場感を高める演出でファンの心をつかむ。2012年の国内音楽ライブ市場は前年比17.3%増の1916億円で、13年もそれを上回り好調を維持したとみられる。

    ITで輝く音楽ライブ 無線技術で会場が光の海に - 日本経済新聞
  • 東京メトロ、生成AIで問い合わせ対応 「100%の性能でなくても実用化」を決断できたワケ

    待ち時間を解消しCXを高める 「コールセンターに電話をかけて、長時間待たされた経験がある人はきっと多いはず。生成AIを活用すれば、問い合わせへの返答までのタイムラグが短くなり、顧客体験価値(CX)が上がる。オペレーターにとってもやりがいを感じられるのではと考えた」 東京メトロのCX・マーケティング部長の川上幸一さんは、問い合わせへの生成AI活用の経緯をこう話す。 同社には年間、約25万件の問い合わせが寄せられる。このうち、15万件が電話、10万件がメール経由。オペレーターへの負担が大きい電話やメールでの問い合わせを減らすため、Webサイト上でチャットボットサービスも提供していたが、チャットボットを通じての問い合わせは、年間わずか1万2000件にとどまっていた。 「微妙につぼを外すマッサージ師のように、聞きたいこととは違うFAQを返してくる、あまりいけていないチャットボットでした」(川上さん

    東京メトロ、生成AIで問い合わせ対応 「100%の性能でなくても実用化」を決断できたワケ
    qinmu
    qinmu 2024/10/14
    そのうちコールセンターもほとんど生成AIになると思う。