[B! o1] misshikiのブックマーク

misshiki id:misshiki

o1に関するmisshikiのブックマーク (24)

「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化　人間の医師に残される役割とは？｜医師のキャリア情報サイト【エピロギ】
市川衛が聞く「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化　人間の医師に残される役割とは？大塚篤司（皮膚科医/近畿大学医学部皮膚科学教室主任教授） 2025.02.06 大塚篤司さん（筆者撮影）生成AIであるChatGPTを開発する米企業OpenAIはこの2月、新モデル「o3」シリーズの一つ「o3-mini」の提供を開始した。また中国のスタートアップ企業DeepSeekは独自の新モデル「R1」を公開、従来より大幅に低いコストで高性能なAIの開発に成功したと発表し大きな話題になっている。加速度的な成長を見せる生成AI。AGI（汎用人工知能）、すなわち人間以上の能力で人間と同じような汎用的な作業を行えるAIの登場が現実的と言われる中で、医師など医療職の仕事は今後どのように変わるのだろうか。 2024年に2冊の著書を発表するなど「医師による生成AIの活用」で最先端を行
misshiki 2025/02/13
“いま私が使っているo1 pro（オーワンプロ：※）の場合、もう大学准教授、教授クラスと言っていいと思います。”

人工知能

o1
リンク
研究者にとってo1Proは3万円課金する価値があるか？｜genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
研究者が論文執筆や助成金の申請書を書く際、近年は大規模言語モデル（LLM）を活用するケースが増えています。確かにo1proの書く文章はAI臭さが無いですし、その知識や発想力に驚かさせる事は多いです。ただo1proをアカデミック関連の業務に試してきましたが、その経験から言えば、3万円を払ってo1Proを使う必要性は低い、というのが私の現在のところの正直な結論です。以下に理由を述べます。 1. o1モデルにおけるプロンプトのコツo1モデルは「シンプルなプロンプトがベスト」とされており、複雑なコンテキストや指示を加えすぎると性能を発揮しづらいと言われています。一部のプロンプトエンジニアリング（few-shot learning や「think step by step」など）は、性能を向上させない場合もあります。以下がベストプラクティスです：シンプルで直接的に：簡潔な指示が最も効果的です。連
misshiki 2025/01/06
“現状の感想としては「研究者が論文・申請書のためにo1Proに課金する必要は薄い」という結論”

人工知能

o1
リンク
ChatGPT o1とGemini 2.0の性能を比較してみた｜IT navi
2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。また、Googleは、2024年12月6日にGemini-Exp-1206（Gemini 2.0 Experimental Advanced）、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。 AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル（o1とGem
misshiki 2025/01/06
“Chatbot Arenaでの性能評価では、Geminiのスコアがo1のスコアを上回っているようでしたが、実際にテストしてみると、ほとんどの分野でo1の性能がGemini 2.0を圧倒していました。”

人工知能

Gemini

o1
リンク
OpenAIの「o1」モデルが「GitHub Copilot」と「GitHub Models」で利用可能に　どのプランで使える？
GitHubは2024年12月20日（米国時間）、AI（人工知能）コードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにしたと発表した。 OpenAIはo1を12月17日にリリースした。コーディング、科学、数学のような高度なタスクに最適化された「o1-preview」および「o1-mini」モデルを2024年9月に発表しており、o1はo1-previewをアップデートし、複雑なタスクでのパフォーマンスを向上させたものだ。 GitHubはo1-previewとo1-miniも、GitHub CopilotとGitHub Modelsで利用できるようにしていた。 o1は、GitHub Copilotの「Copilot Chat」機能とGitHub Modelsで利用できる。Copil
misshiki 2024/12/25
“GitHubは、AIコードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにした。”

人工知能

o1

プログラミング
リンク
OpenAI o1 APIの使い方｜npaka
以下の記事が面白かったので、簡単にまとめました。・Reasoning models 1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクインし、米国数学オリンピック (AIME) の予選で全米の上位500人の学生に入る成績を収めています。また、物理学、生物学、化学の問題に関するベンチマーク (GPQA) では、人間の博士レベルの精度を上回る成績を達成しています。 APIでは、次の2つのモデルが提供されています。・o1 世界に関する幅広い一般知識を使用して難しい問題を推論できるように設計されている。
misshiki 2024/12/19
o1

プログラミング
リンク
https://openai.com/index/o1-and-new-tools-for-developers/
misshiki 2024/12/18
“開発者向けに OpenAI o1、Realtime API の改善、新しい微調整方法などを紹介します。”

OpenAI

o1

人工知能

プログラミング
リンク
【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? （"o1 System Card" Figure 2の意訳） "12 Days of OpenAI"の第一弾としてリリースされたOpenAIのo1は、特にpro modeの高い性能や月額3万円という破格の料金プランが大いに話題になっていますが同時に発表された米Apollo ResearchによるAI安全性に関する調査報告が、いよいよSFの世界と見紛うような驚きの結果であったため、内容をまとめました。サマリはじめに「目標」を強く指示されたLLMが、その目標にそぐわないような状況に陥った場合、目標を遂行するためにユーザーを欺くような"
misshiki 2024/12/11
“Chain-of-Thoughtを活用した推論スケーリングによってLLMは今後も大いに発展することが期待されていますが、モデルの高度化はセキュリティ対策の複雑化とも表裏一体であることが今回の調査でより浮き彫りに”

自然言語処理

o1

法律と倫理
リンク
OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告
米OpenAIとAI安全性の研究組織である米Apollo Researchは12月5日（現地時間）、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行できるというものだ。さまざまな戦略を試したり、間違いを認識したり、思考プロセスを洗練したりすることで、従来のモデルと比較して、より有用な回答を提供できるようになったとOpenAIは説明している。だがApollo Researchは、o1が「scheming」（策略。開発者やユーザーの意図と異なる目的を密かに追求する能力）について評価したところ、o1が以下のような行動を示すことが明らかになったとしている。開発者やユーザーではなく、o1自身の目標に
misshiki 2024/12/09
“Apollo Researchは、米Metaや米Anthropicのモデルでもテストし、同様の策略を企てることを確認したが、o1の行動が最も欺瞞的だったとしている。”

o1
リンク
GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す｜shi3z
GPT-4oとo1($30/月)とo1 pro($200/月)で翻訳を比較しました。翻訳の元にしたのは以下のツイートです。 The (true) story of development and inspiration behind the "attention" operator, the one in "Attention is All you Need" that introduced the Transf ormer. From personal em ail correspondence with the author @DBahdanau ~2 years ago, published here and now (with permission) following… pic.twitter.com/hKD7gDcexS — Andrej Karpathy (@karpathy)
misshiki 2024/12/09
“やはり従前通り、OpenAI系のLLMは情緒表現が苦手で、面白いものを作ることを苦手としている。...いずれにせよ物語生成という文脈で見たときにo1 proにお金を払う価値はなさそうだ。”

o1

人工知能
リンク
月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた
米OpenAIが12月5日（現地時間）に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル（1ドル150円換算で約3万円）という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。解けるか、“おっぱお問題” GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。「9.11」と「9.9」、大きいのは？「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正し
misshiki 2024/12/09
“引っ掛け問題に引っ掛からないことや、数学の難問を解けるかだけがコストに見合う価値ではないだろうが、ひとまずは「...ある程度物事を理解しているような回答ができているのでは？」と思える結果だった。”

人工知能

o1
リンク
OpenAI 推論モデルの正式版「o1 pro mode」がリリース！早速、人類の未来について話し合ってみた｜遠藤太一郎
㈱カナメプロジェクト/東京学芸大学教育 AI研究プログラムの遠藤太一郎です。教育現場でのAI活用に関して、色々な試みをしています。最近、こんな記事も書きました。今朝３時頃、OpenAIがo1 pro modeを出したので早速試してみました。ある意味電卓の超拡張版とも言える論理推論マシンに留まるものなのか、もう一歩踏み込んで、人類を次の地平に導くようなものなのか。そこで今回は、o1 pro modeとの対話を通じて、人類が「次のステージ」に移行するためには何が必要なのか、そのヒントを得ようと試みました。 AIとの対話を重ねる中で導かれたキーワードが、「脱固定化」(だつこていか) という発想です。従来、人類は固定された価値観や前提条件、社会制度、認知フレームに頼って生きてきました。それらが「不変」「絶対」と見なされることで、想像力や発想力にバイアスをかけていた面も否定できません。しかし、
misshiki 2024/12/06
“o1 pro modeと対話してみて初期的な感想。「発想」レベルのものを渡し、一緒に議論するこで、ものすごく整理される。視界が開ける感覚。点が面になる。まさにResoning（論理推論）といった感覚です。”

OpenAI

o1

人工知能
リンク
OpenAI o1（ChatGPT o1）とは何かをやさしく解説、従来と何が違う？特徴や使い方とは
OpenAIの最新AIモデル「o1（オーワン）」は「推論トークン」という新しい仕組みを活用した、従来のGPTとは一線を画す言語モデルだ。特にコーディングや数学で高い精度を実現し、あるベンチマークテストでは博士課程の学生を上回る成績を記録したとされる。この最新モデルo1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説する。
misshiki 2024/11/26
“o1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説”

o1
リンク
https://x.com/naotous/status/1854709816893358381
- 1 user
- x.com
- 世の中
misshiki 2024/11/08
“OpenAI の o1-preview が医師国家試験で正答率 98.2% を記録しました日本語の問題を翻訳せず、そのまま読ませた結果です”

人工知能

o1
リンク
OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表　他モデルとの違いは？
OpenAIは2024年9月12日（米国時間）、大規模言語モデル（LLM）「OpenAI o1-preview」と「OpenAI o1-mini」をリリースした。OpenAIは以下のように説明している。 OpenAI o1シリーズとは、他モデルとの違いは？ OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。仕組みとパフォーマンス関連記事「GPT-4o」でファインチューニングが利用可能に　使い始めるには、事例は、セキュリティは？ OpenAIは「GPT-4o」のファインチューニング機能の提供を開始した。コーディングやクリエイティブな執筆といったユースケースで、モデルの出力結果に大きな影響を与える可能性があるという。新しい開発スタイルを切り開く、「GPTScript」とは何か T
misshiki 2024/10/07
“OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。”

o1
リンク
最新の ChatGPT モデル OpenAI o1 は数理最適化問題のモデリングが(ちょっと)できる - Insight Edge Tech Blog
Insight Edgeのデータサイエンティストのki_ieです。数理最適化の専門家として、これまでさまざまな課題を数理最適化問題としてモデリングしてきました。モデリングはアルゴリズム設計と比べて注目を集めることが少ないようですが、実際には技術的な知見・調査を要求する骨の折れるタスクです。このタスクを簡単にしたいとは日々思っていたところですが、最近 OpenAI o1 というモデルの論理的推論能力が高いらしいという聞きました。この賢いLLMがモデリングのお手伝いをしてくれたら嬉しいですね！今日は数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。数理最適化問題とは数理最適化問題と混合整数計画問題の基礎知識がある方はこの節はスキップしましょう(面白いことは一つも書いてありません)！数理最適化問題とその実行可能解・最適解
misshiki 2024/10/07
“数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。”

数理最適化

人工知能

o1
リンク
OpenAI o1モデルの勉強会 - 個人的な感想と備忘録 - Qiita
はじめに 2024年9月18日に開催された勉強会「ついに出た！OpenAIの最新モデル『o1』って何がすごいの？みんなで勉強しよう」に参加しました。本記事では、勉強会で学んだ内容、そこから得た個人的な気づき、そして今後の展望についてまとめています。まず、貴重な学びの機会を提供してくださった主催者と登壇者の皆様に心からお礼申し上げます。本記事はあくまで筆者の個人的な理解と解釈に基づいています。まだ勉強会の内容をチェックされていない方は、ぜひconnpassの資料、動画アーカイブのリンクをご覧ください。勉強会のまとめ o1モデルの特徴深い推論能力：複雑な問題解決や分析タスクに強み高度なプログラミング能力：複雑なコードの生成や理解が可能長い応答時間：じっくりと考えることで質の高い回答を提供 AIモデルの進化と o1 の位置づけ AIモデルの進化の流れが以下のように示されました：スケ
misshiki 2024/09/24
“現時点でのo1モデルには以下のような制限がある：利用制限: 週単位または日単位でのメッセージ数に制限があります。｜機能制限: メモリ、カスタム指示、データ分析、ファイルアップロード、ウェブ閲覧、画像処理”

o1
リンク
ついに出た！OpenAIの最新モデル「o1」って何がすごいの？
ついに出た！OpenAIの最新モデル「o1」って何がすごいの？みんなで勉強しよう https://minorun365.connpass.com/event/331247/
misshiki 2024/09/24
全48ページのスライド資料。

o1
リンク
GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由
これまでの大規模言語モデルの進歩の大部分は言語主導だった。オープンAIが新たに発表したモデル「o1」は多段階の推論に焦点が当てられており、創薬や物理学、材料科学などの分野において役立つかもしれない。 by James O'Donnell2024.09.19 29 この記事の3つのポイントオープンAIが高度な数学やコーディングに優れた新モデル「o1」をリリース o1は博士号レベルの問題に平均78%の正解率を示した創薬や材料科学などの分野で人間の研究者の役に立つ可能性 summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。先週末、私はサマーキャンプで結婚式を挙げた。私と現在の妻は、テレビ番組『サバイバー（Survivor ）』から発想を得た一連のゲームを企画し、当日、招待客たちがそれらのゲームで競い合った。8月にゲームの計画を立てていたとき
misshiki 2024/09/20
“オープンAIが先週リリースした新たなモデル「o1」（以前は「ストロベリー（Strawberry）」というコードネームで呼ばれており、その前はQ*だった）”

o1
リンク
Try out OpenAI o1 in GitHub Copilot and Models
AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be
misshiki 2024/09/20
“Azure でホストされている OpenAI o1-preview と o1-mini を GitHub Copilot と Models の両方でテストする機会を開発者に提供するプレビューを開始します。”

OpenAI

Azure

o1

自然言語処理

プログラミング
リンク
OpenAI「思考の連鎖」が導く汎用AIへの道　編集委員　吉川和輝 - 日本経済新聞
米新興企業オープンAIが12日に新たな人工知能（AI）「o1（オーワン）」を発表したことで、人間のように広範な知的活動を遂行できる汎用人工知能（AGI）への道筋が見えてきた。AGIは早ければ2027年までに誕生するとの見方があり、その先には人間の能力を大幅に上回る人工超知能（ASI）の登場が控える。22年11月のChat（チャット）GPT登場に続くAIの飛躍期が近づいてきた。苦手の数学を克服
misshiki 2024/09/19
“人間のように広範な知的活動を遂行できる汎用人工知能（AGI）への道筋が見えてきた。AGIは早ければ2027年までに誕生するとの見方があり、その先には人間の能力を大幅に上回る人工超知能（ASI）の登場が控える。”

OpenAI

o1

自然言語処理

人工知能
リンク
1 2 次のページ