Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

AIに関するshunt_iのブックマーク (32)

  • DeepSeek狂奏曲

    DeepSeek狂奏曲 2025.01.30 Updated by Ryo Shimizu on January 30, 2025, 08:35 am JST DeepSeekという中国製のモデルが世界を席巻している。 OpenAIが有償で提供するo1より高性能だとか、OpenAIの規約に違反した方法で学習されているとか、色々あるのだが、それを噂する人々が不正確な情報に基づいてピーチクパーチクやっているだけなので基的にメディアにはほぼ出鱈目な情報しか出ていない。 まず、整理しておきたいのは、DeepSeek(特にV3とR1)とは何か、ということだ。 DeepSeek-V3は、GPT-4o相当のAIであり、オープンウェイト(AIの学習結果=重みが公開されている)で公開されている。オープンソースではない。 DeepSeek-R1は、o1相当のAIであり、こちらもオープンウェイトで公開されてい

    DeepSeek狂奏曲
    shunt_i
    shunt_i 2025/01/31
  • Geminiが変える企業調査:AIエージェントで調査費用を100分の1以下に

    TL;DR (要約) AI Agent Hackathon with Google Cloud に応募するため、Geminiを用いたAIエージェントによる企業調査Webサービスを開発しました。 約500万社の企業に対応。法人向けサービスに比べ1/100のコストでデータ取得 企業調査を、AIエージェントがわずか3分で完了させます。人力に比べて97%の時間削減。 実例: トヨタ自動車株式会社 で、精度と網羅性を確認できます。 サイトでスグに試せる: 3分で企業調査 にアクセス 技術詳細: GitHub で実装を公開 はじめに Zenn初のオンラインハッカソン、テーマは「AIエージェント」。GeminiのAIエージェントによる企業調査Webサービスを開発しました。このサービスは、仕事で不可欠な企業調査を、AIエージェントで革新的に効率化します。さらに、他サービスと比較して低コスト、同等以上の価値

    Geminiが変える企業調査:AIエージェントで調査費用を100分の1以下に
  • ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記

    タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの

    ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記
  • 最強神器「Cursor」の本当に使い方を徹底解説【知らないとヤバいレベルです】

    筆者自信、個人開発を長い間やってきた&toB含め多くの開発に携わってきました。もともと開発速度に自信があり力でねじ伏せるタイプでしたが、それでもこのCursorを使い始めて世界が変わりました。具体的には、よくあるAI驚き屋の「3分でLPが作れた」「24時間AIが自動で」とかではなく、実践的な開発で6~10倍程度のスピードが出せるようになりました。序盤は10倍どころかとんでもない速度で仕上がっていきます。 筆者はAI駆動開発にハマり、1500時間くらいCursorを使い込んできたので、その経験を踏まえて現状をしっかり解説します。 この記事を読むとわかるCursorの持つ可能性 「コードを書く」から「AIがコードを書き、開発者が補助する」すべての機能 基はProプラン$20で何でもできる 0→1開発から複雑な大規模プロジェクトまで、Composer Agent がマジでやばい ここ数年でGi

    最強神器「Cursor」の本当に使い方を徹底解説【知らないとヤバいレベルです】
  • ChatGPT新機能「タスク」

    はじめに OpenAIChatGPTにScheduled tasks(日語名:タスク)が追加されました。 生成AIをスケジュール実行していくのは、今後整備されていくであろうAIエージェントへの布石と考えられます。 AIが人間の代わりに考えながらタスクをこなしていく、これをスケジュール化していく世界観がすぐそこにやってきそうです。 使い方 モデルを「ChatGPT タスク」に設定します。 その上で、時間になったらやってほしいことを入力します。 で、初回は通知の許可設定を求められます。「許可」をクリックします。これで設定完了です! 実際にタスクが実行されて、受信したメールはこんなかんじ。「View message」をクリックするとChatGPTへ遷移して実行結果を確認できます。 遷移した結果は、こんなかんじ。 設定したタスクの確認方法 アカウントの写真や画像をクリックして、「タスク」をクリ

    ChatGPT新機能「タスク」
  • Reclineという庶民の味方!!GitHub CopilotでClineが使えるww - しとちゃぶろぐ

    Reclineの構築手順記事では、Reclineの構築手順について解説します。Reclineは、CLIおよびエディタ内で動作し、コードの作成、編集、実行を支援します。このプロジェクトはClineをフォークしたものであり、Claude 3.5 Sonnetによって真価が発揮されます。。 これ何がすごいって、VSCodeのLanguageModelAPIとCopilotを使用するため、実質月額10ドル払えば無限にClaudeがClineで使えちゃうんですよね!!!!!!!!!!(ついでにcopilotも使えちゃう) ということで、下記構築手順まとめます。 記事を作成するにあたり、以下の情報を参考にしました。 Reclineリポジトリ: https://github.com/julesmons/reclineVSCodeダウンロードページ: https://code.visualstudio

    Reclineという庶民の味方!!GitHub CopilotでClineが使えるww - しとちゃぶろぐ
  • 初心者向けの無料のAI画像生成サービス3選(実質2選)|ローゼンカバリー

    (説明不足もあったのでちょい修正したよ) AI画像生成をやってみたいけど たくさんあってどれにしようか迷ってる人 色んなところで◯選とか言いつつ やたらといっぱい紹介して選択で困りませんか? 私は3選にギュッとしました。 しかもリアル1選、イラスト1選、将来性1選なので 実質2選です。 3つともサーバーはサービス側持ちなので低スペPCや低スペスマホでも生成できるのが最大の利点です!上級者以外はハイスペPCでのローカル生成なんて不要だと思ってる。 リアルならImageFXリアルならImageFXが良いです。 GoogleのサービスなのでGoogleアカウントでも 安心して出来るのも嬉しい。 1日あたりの回数制限はあります。たぶん50回前後 前からリアル系ではトップクラスの表現力でしたが この数ヶ月でさらに急激な進化を遂げて 顔パターンや動作パターンが激増しました。 今日は成人式なので成人

    初心者向けの無料のAI画像生成サービス3選(実質2選)|ローゼンカバリー
    shunt_i
    shunt_i 2025/01/13
  • 【🚨無職発生注意報🚨】ヒトはこうして仕事を奪われる~Browser Use Tutorial~ - Qiita

    はじめに 2025年はAIエージェントの年です。注目されているAIエージェントの一つが『AIが自動で自分のPC画面を操作』するBrowser Useというツールです。 Browser Useの面白さ Browser Useを使うと、AIが自動で自身のPC画面を操作することであらかじめ決めた目的を達成をしてくれます。 簡単な指示を出すだけで、自動でAIが色々操作してくれるのはキャッチーで衝撃的ですよね。 例えば下記のように完全自動でAIが記事を検索して記事の情報を取得してくれます。 簡単な指示でAIが自分で考えて画面操作をしてくれるのは近未来感ありますよね。 しかし、現場でAIを使いこなすには「AIがすごい」のレベルではまだ足りません。 実際に触ってみて何ができるのか?逆に何が苦手なのか?という肌感覚を持つことが非常に重要です。 そこで記事は、その肌感覚を養うために実際にBrowser U

    【🚨無職発生注意報🚨】ヒトはこうして仕事を奪われる~Browser Use Tutorial~ - Qiita
    shunt_i
    shunt_i 2025/01/12
  • 【2025年版】無料で始める!AI画像生成サービス9選 - 初心者さんでも安心♪|素晴木あい@ AI絵師

    こんにちは! ブログに挿絵が欲しいけれど、AIイラストを生成するのは難しそう、お金だってかかりそう、、と悩んでいるあなたに。実は無料でカンタンに始められるんですよ☺️ 今回は、無料ですぐに使える画像生成サービスを9つご紹介させていただきます。 2025年、新しいことを始めてみませんか?💕 1️⃣ ImageFX ImageFXは、Googleが開発した画像生成AIです。 Googleアカウントを持っていれば誰でも無料で使えるんですよ。 ImageFXの使い方ウェブサイトにアクセスする アカウントを作成する ログインする 画像を生成するための言葉を考える テキストボックスに入力する 生成ボタンを押す 画像を確認する 保存する シェアする 写真みたいにリアルな画像が作れるのが特徴で、 「Imagen 3」っていう最新のAIモデルが使われています。日語でも使用可能ですが、英語の方がより良い

    【2025年版】無料で始める!AI画像生成サービス9選 - 初心者さんでも安心♪|素晴木あい@ AI絵師
    shunt_i
    shunt_i 2025/01/12
  • ドット絵を作るGPTsを作ったら反応が良かった件(GPTs配布あり)|けいすけ / AIマンガ家

    こんにちは。けいすけです。 この記事の最後にGPTs配布をしていますので、記事は良いから取りあえずGPTsがほしい!という方は最後までぐいーーーーんとスクロールプリーズ! 最近こんなポストをしました。 ChatGPTだけでキレイなドット絵が描けるようになりました。 ドット絵って簡単そうですが、AIで作ろうとすると結構難しいんですよね。 たとえば、これを見てください。 DALL-E3でドット絵を描いて!とお願いして出てきたものです。 まあ、ドット絵っぽいといえばっぽいのですが、拡大してみると違いが分かります。 こんな感じで、ピクセルの端がにじんでいたり、ピクセルの境目が直線になっていなかったりします。 で、これをどうしたかというと、pythonで加工することでちゃんとしたドット絵になるわけです。 詳しい仕組みは省きますが、ニアレストネイバー法というもので、64×64に縮小すると、割りとキレイ

    ドット絵を作るGPTsを作ったら反応が良かった件(GPTs配布あり)|けいすけ / AIマンガ家
    shunt_i
    shunt_i 2025/01/10
  • 思いつきで作ったAIツールが5000スターを獲得した話

    とにかくケチりたい、そんな気持ちで作ったツールの話です。 元々開発にCline(Claude Dev)やAiderなどの開発ツールを駆使していました。 ただ、APIの料金が常に心配で、できる限り安く済ませたい気持ちもあり、Claude Proを契約してWeb版にファイルを1つ1つアップロードする日々を過ごしていました。 ある日それが面倒になってきて「全部1ファイルにしたらいい感じに読み込んでくれるのでは?」と思い、作ってみたら思いのほかうまくいったので公開しました。 百聞は一見にしかずということで、 こちらのデモにお気に入りのGitHubリポジトリ(例: honojs/hono)を入力してみてください。 Claudeが得意とするXMLっぽいフォーマットで出力し、そのままClaudeにアップロードすることができます。 完全にAIバブルの波に乗ったとも言えるのですが、多くの競合がいる中でスター

    思いつきで作ったAIツールが5000スターを獲得した話
  • AIと個人開発したくなったらまずCursorで要件定義だ!

    はじめに こんにちは!yasunaです! 私は普段は会社員をしていてエンジニアではないのですが、趣味でプログラミングをしています! 今回はAIの力をフル活用しながら個人開発アプリの要件定義を作るまでの流れを記録しておきたいと思います。 今回作ろうとしているアプリケーションについて 「TikTok作成支援システム」というアプリケーションを作ろうとしています。ユースケース図はこんな感じになりました。 この図を作るときに役に立ったのがAI搭載エディターのCursorです。 CursorはAIがコードを生成してくれるので、コードを書くのが苦手な私のような人でもAIとチャットしながらコードを書くことができます。 こちらの図もCursorでmdファイルを作成して図に変換しました。 これはPlantUML(プラントユーエムエル)という図表作成用のマークアップ言語です。 UML(Unified Mod

    AIと個人開発したくなったらまずCursorで要件定義だ!
  • 【生成AIの学習ロードマップ】最近やたら羽振りのいいやつが生成AIを極めてた件について。 - Qiita

    はじめに 生成AIによって世の中は大きく変わります。単なるブームではないと確信しています。 研究者の間では数年で「あと人間の知能に匹敵するAIが出てくるだろう」と言われているほどです。 「生成AIって社内でもよく聞くけど何から始めればいいかわからない...」 「AIに興味はあるけど初期設定とか大変そう...」 この手順で学べば流石に初心者でも生成AIを使いこなせる人材になれるロードマップを整理しました。 誰も生成AIの大波に置いていかれないような記事を目指します。 対象読者 生成AIを学んでスキルアップしたい方 社内でAI活用してさらに活躍をしたい方 AIの波に乗って市場価値の高い人材を目指す方 記事の構成 記事は入門編と発展編に分かれています。入門編では「AIを使える人材」になるためのゼロからのロードマップを記載しています。発展編では「AIアプリを作れる人材」になるためのステップアップ

    【生成AIの学習ロードマップ】最近やたら羽振りのいいやつが生成AIを極めてた件について。 - Qiita
    shunt_i
    shunt_i 2025/01/04
  • これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z

    今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete

    これはもう実質AGIでは? AIが勝手にブラウザを操作していろいろやってくれちゃう BrowserUseが爆誕|shi3z
    shunt_i
    shunt_i 2024/12/24
  • 3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)

    動画生成AIの発展により、非常に面白い方向性が生まれてきています。最新の動画生成技術と3D技術を組み合わせることで、たった1枚の絵から、3Dデータを作れるようになる可能性が出てきているんですね。これは将来のゲーム開発や映像制作のあり方を激変させる可能性があります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI「Runway」新機能がきっかけ まず、この動画を見てください。Stable Diffusionを使って作成した1枚の画像を、いくつかの手順を実施することで、3Dモデルとして扱えることに成功している様子です。 こうしたことが実現できるようになったのは、動画生成AIサービス「Runway」に11月2日に追加された新機能「カメラコントロール機能(Advanced Camera Control)」のためです

    3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 (1/4)
  • Infinite AI Artboard - Recraft

    ai for pro designersPremium image generation and editing tool

    Infinite AI Artboard - Recraft
    shunt_i
    shunt_i 2024/11/01
  • AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能

    AI企業のAnthropicは10月23日、大規模言語モデル「Claude 3.5 Sonnet」の刷新と、新モデル「Claude 3.5 Haiku」の導入を発表した。Claude 3.5 Sonnetには、AIモデルが人間のようにコンピューターを操作できるようになる新機能「コンピューター使用」が追加された。 アップデート版のClaude 3.5 Sonnetは、特にコーディング分野で大きく性能を伸ばし、業界ベンチマークで広範囲にわたる改善を示した。SWE-benchの検証済みタスクでは、前バージョンの33.4%から49.0%へと性能が向上し、他のすべての公開モデルを上回る結果となった。 新たに導入されるClaude 3.5 Haikuは、前世代の最大モデルであるClaude 3 Opusと同等の性能を持ちながら、コストと速度は前世代のHaikuと同等を維持している。特にコーディングタス

    AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能
  • 可愛すぎかよ! ハッカーの新しい相棒 コマンドラインからLLMを使えるgptme|shi3z

    こういうのが欲しかったんだよ。マジで。 コマンドラインからLLMを呼び出せるgptmeというツールがアツい これは、gptmeコマンドを追加するというもの。 環境変数としてOPENAI_API_KEYとかAnthropicのキーとかを設定しておくと勝手にAPIを呼び出してくれる。もちろん、クラウドに送信するとかけしからんという勢にはローカルLLMでも対応できる。 こいつはコマンドライン版ChatGPTのようなものなので、コマンドラインで動くのだが、その真価は例えばパイプで繋いだ時とかに発揮される。 $ du -d 1|gptme "一番容量をってるフォル ダは何Gバイト使ってんの?" Found OpenAI API key, using OpenAI provider [10:13:32] No model specified, using recommended model for

    可愛すぎかよ! ハッカーの新しい相棒 コマンドラインからLLMを使えるgptme|shi3z
  • 無料で使える最高のAIノート『NotebookLM』使い方と活用事例|AI-Bridge Lab

    こんにちは!最近、ChatGPTと話しすぎてAI風の口調がうつってきたAI-Bridge Labのこばです!👋 今回の記事はGoogleのサービス『NotebookLM』(ノートブックLM)について 1.NotebookLMの概要 2.使い方 3.具体例として過去のnote記事を全部読ませた結果どうなったか この3点を分かりやすくご紹介します! 先に結論だけお伝えするとかなり実用性が高くオススメのツールです! そしてこの記事を読んで頂ければご自身での活用法が想像できるようになると思いますので、ぜひ最後まで読んで頂けますと幸いです! 1.NotebookLMの概要公式サイト:https://notebooklm.google.com/ NotebookLMは、Googleが提供する生成AIサービスで、ユーザーのメモ書きやアップロードした資料を基に情報を整理し、質問に答えることができる革新的

    無料で使える最高のAIノート『NotebookLM』使い方と活用事例|AI-Bridge Lab
    shunt_i
    shunt_i 2024/06/10
  • LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由|erukiti

    もしあなたがLLMを使ったプロダクトを何かしら開発している、もしくは興味があるのなら、メモリを大量に積んだMac Studioの購入を検討すべきです。 対象読者NVIDIAが絶対にいいという人はこの記事の対象読者ではありません。また、用途によって、ローカルマシンによるローカルLLMが向いてる・向いてないは明確にあるので、向いてない用途にしか使わない人も対象読者ではありません。あしからず。 また、この記事は別にNVIDIAをdisる意図はありません。みんな違っていい。NVIDIAもいい選択肢ですが、Mac Studioも悪くないですよ、と言いたい。 結論LLMプロダクト開発において、今年はもはやローカルLLMを無視できない、してはいけない状況です。 LLMプロダクト開発をする会社の視点でいえば、是非とも80GB以上の十分なGPUメモリを積んだマシンを用意できるようなアジリティを持つのが望まし

    LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由|erukiti
    shunt_i
    shunt_i 2024/04/25
    LLMがこのままメジャーになればVRAM特化のGPUとか出るのかなと思ってる、ホントに流れが早いから今後どうなるか楽しみ