例えば、こちらのブログですが、グラフィカルな解説部分が、画像になっています。 Claudeはマルチモーダルに対応しているので、画像を添付した状態で「文字を抽出して」というと文字を抽出してくれますが、日本語で要約して回答したり、元の文章を正確に抽出する のは、意外と難しいと感じていました。 以下は、Claude.aiを使って「添付画像から文字を抽出して」と依頼した際の結果です。 原文そのままを正確に抽出したいときってありますよね?それを解決する方法を編み出しました。 方法は、「 HTMLで再現させる 」です! 本投稿の先頭の画像を添付して「添付画像をHTMLで再現して」と依頼した際の結果がこちらです。 感動!!! (注:右側が画像をもとに生成したHTMLを、プレビューした状態です。Claude.aiのArtifactsという機能です) アイコンがちょっと違うとか省略されてるとかはありますが、
こんにちは、アタラ合同会社コンサルタントの川田貴俊です。 前回の記事ではNotionを使ったタスク管理と、それをチーム内でどのように運用しているかをご紹介しました。 連載第2回の今回は、NotionのデータをDomoに取り込んでダッシュボードにしたものをご紹介し、どのように活用しているかをご紹介します。 こちらがダッシュボードの全体像です。 それぞれのカードが何を表しているかを下図に示します。 Notionの“データ”を活用しつくすNotionで記事執筆の状況を管理してみて、表形式に比べてとても直感的に操作できると感じました。しかし、日々の業務の中でBIツールを使っていると、 データの可視化(グラフ化)・分析をしたい 他のデータと掛け合わせて見たい(記事×PV数) という要望が出てきました。 データの可視化・分析第1回でご紹介した通り、ボードビューを使ってタスク管理と状況共有ができるのはN
#はじめに ローカルネットワーク内のホスト名でのアクセスはNetBIOS時代から試みてきたものの、WindowsとmacOSの間は統一された規格がなく相互通信が出来ない状態が続いてきた。 突然消失するかもしれないブログさんの記事の説明を拝借 その状態が、Windows10 1803(April 2018 Update/Redstone 4/RS4)が出荷されたことで、ようやくmDNSという規格により統一され、Windows macOS Linux間のホスト名でのアクセスが可能になりました。 mDNSはDNSの代わりにIPアドレスを返してくれるため、今までローカルにDNSサーバーを立て、ローカルエリア内の名前解決をされていた方はDNSサーバーの撤去が出来ます。 Windows10 1803でもほぼ動作に支障ない状態でしたが、Windows10 1909(Windows 10 November
はじめに カミナシでソフトウェアエンジニアとしてサービスの開発をしている Taku (X アカウント) です。 帰国後の体調不良等あり公開が遅くなってしまったのですが、先日ラスベガスで開催された AWS re:Invent に2年振り2回目の参加をしてきた際のレポです。 今回の re:Invent で私は 生成 AI 系のワークショップを中心に受けており、前回の Amazon Bedrock のワークショップに続き Amazon Q Business のワークショップも受けましたので両方受けて思ったことを書かせていただきたいと思います。 筆者は生成 AI にそこまで精通しているわけでありませんので、もし誤り等あればご指摘いただけますと幸いです。 Amazon Q Businessとは Amazon Q は AWS の生成 AI 系サービスの一つで、生成 AI を利用したアシスタントです。
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? NTTテクノクロス株式会社の渡邉洋平です。 今回はClineとClaudeの連携をAnazon Bedrockで試していきます。Clineの記事はいくつかありますが、今回はAWSユーザをスコープにした記事です。 Cline? Meet Cline, an AI assistant that can use your CLI aNd Editor. Clineは開発者用のAIアシスタントツール。VSCodeなどにプラグインとして導入することで、コーディングの強力な相棒になってくれる。Cursor無し、特別なライセンス無しでもVSCodeで
変わり身はやっ。マイクロソフトが「DeepSeek」を提供開始2025.01.30 21:3087,030 satomi OpenAIひとすじと思ったら大間違い。 彗星のごとく現れた中国のAI「DeepSeek(ディープシーク)」に一番はしゃいでるのは、Microsoft(マイクロソフト)のサティア・ナデラCEOかもしれません。OpenAIのデータをDeepSeekに無断で使用された疑いで調査を進めるのと同時進行で、DeepSeek最新モデルR1をAzure AI Foundryのカタログにちゃっかり加えて提供を開始しました。 以下は公式ブログからの抜粋です。 「DeepSeek R1にアクセスできるようになりました。Azure AI Foundry経由でなら、企業は信頼性の高いスケーラブルな法人対応のプラットフォーム上で、SLA、セキュリティ、責任あるAIのコミットメントの要件を満たしな
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは。 普段、エンジニア向けの研修講師をしている都合上、「おすすめの本を教えてください」といつも聞かれるので、2025年中に全て読破したい本をピックアップしました。2025年、あと11ヶ月くらいあるので、1ヶ月に1冊読めば読破できるはず!! ①マスタリングTCP/IP ネットワークエンジニアのバイブルといえばこれでしょう。逆をいえば、これ以上は読まなくてもいいし、これ以下では足りない。そんな一冊です。OSI参照モデルにおいて、ほとんどの人が「3層:ネットワーク層」しか理解していない中で、この本を読めば7層全てが明らかになります。
サンフランシスコベースのスタートアップ Riffusionが同名のAI作曲サービスのパブリックベータを公開しました。 Riffusionは元々Stable Diffusionの画像から音楽を生成するというちょっと変わったプロジェクトから2年前にスタートしたのですが、それがText to Musicのメインストリームサービスとなって登場。今回は「FUZZ」という新しい生成モデルを使っています。 これがいきなりなかなかの出来。プロンプトに日本語も使えて日本語歌詞の楽曲も生成できて、品質も高いのです。品質で言えばSunoやUdioを一部凌駕しているかもしれません。 完成度が高いのに現在のところ無料で無制限という大盤振る舞いなのです(パブリックベータなので)。 まず、Sunoでよく使っているプロンプトを使ってみました。 J-POP, Japanese lyrics, female vocalist
ついに予告通りo3-miniが公開された。 何より特筆すべきはそのコーディング能力の高さ。 ちょっと触っただけでも、マインクラフトクローンを爆速で書いてくれたり、3Dのマリオっぽいゲームを自動生成したり、僕が長年頭を悩ませていてついに作れなかった四次元球のポリゴン表現や四次元フラクタルのリアルタイム描画など、サンプルコードが存在すらしていないような難問を次々と解決してしまう。もう面倒だから結果だけ見てくれ マイクラもどき ちゃんとブロックを追加したりできる3Dマリオっぽいゲーム。ちゃんとジャンプして床を渡ることができる。ステージは自動生成四次元球体の三次元断面のポリゴン表現 オレには一生書けないと思っていたその驚異的な性能については、もう動画で解説したので無料部分だけでも見てくれい それで、この凄すぎるo3-miniを使いこなすのに人間一人の力では無理があることを悟ったので、明日の午後から
まだ人間が議事録書いてるの? 日本語特化の文字起こしAI『kotoba-whisper-v2.0』がスゴいらしい 企業の業務の中でも会議やプレゼンなどの議事録作成は効率化したい作業の上位に挙がってくるのではないでしょうか。実際、2023年8月にソースネクスト株式会社が行った「議事録に関する意識調査」によると、議事録の作成には平均50.4分の時間が費やされており、また部下の75.8%が会議中の議事録の作成によって発言しにくいと感じることがあるといいます。 そこで利用を検討したいのが、AIによる自動音声認識を利用した議事録の作成です。本記事では、日本語に特化して高い精度と速度を誇ると話題を呼んだ『kotoba-whisper-v2.0』を主に取り上げ、AIによる議事録作成の最前線をご紹介します。 日本語特化の文字起こしAI『kotoba-whisper-v2.0』とは? 『kotoba-whi
米OpenAIは1月31日(現地時間)、昨年12月に発表した推論AIモデル「o3」の軽量版「o3-mini」をリリースしたと発表した。ChatGPTとAPIで同日から利用できる。 昨年9月にリリースした「o1-mini」の低コストと低レイテンシを維持しつつ、科学、数学、コーディングに特に優れた機能を提供し、小規模モデルが達成できる限界を押し上げるとしている。 ChatGPTのGov以外のプランで利用可能になる見込みだ。Plus、Team、Proプランでは同日から、Enterpriseプランでは1週間後に利用可能になる。これらのプランでは、モデル選択画面でo3-miniとo3-mini-highを選択できる(o1-miniは提供終了)。Proプランでは無制限に使えるが、PlusとTeamプランでは、1日当たり150メッセージまでというレート制限がある(o1-miniより3倍利用できるようにな
こんにちは。Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。 英語力を上げたいと思った時に、必ずアドバイスされるのが、英語の「多読」です。なるべくたくさんの英文を読むことで、自然と英語脳になっていくという考え方です。 「まずは 100 万語を目指しましょう!」 このように話すのは、英語の習得をスピードアップできるような英語学習法を研究・発信している Kumiko さんです。100 万語というと、一般的な洋書を 10 冊 〜 15 冊ほど読む必要がある量です。 「そんなにたくさん読むのは無理」だと思われるかもしれませんが、生成 AI を活用すると、これまでよりも圧倒的に、100 万語の達成が楽になると言います。 具体的にどうやって進めていけばいいのか、今回も、Gemini アドバイザー・けんすうさんとの対談を通じて、Gemini を活用した英語の「多読」の可能
前提 この記事では、「Symbolic Knowledge Distillation: from General Language Models to Commonsense Models」という論文で提案されている 記号知識蒸留 を、ローカルLLMで日本語で実験する。 詳細 知識蒸留 (Knowledge Distillation) とは、大きなモデル (教師) から小さなモデル (生徒) に知識を転送する手法である 具体的には、LLMの蒸留と言えば、大きなモデルが出力する確率分布(ソフトターゲット)を利用して、小さいモデルを学習させる手法が用いられていた しかし、本論文では、「象徴的」な知識蒸留として、単に数値的な蒸留ではなく、 テキスト (symbolic knowledge) の形で知識を抽出し転送すること を提案している 必要な知識と開発環境 ollamaとPythonとLang
OpenAIが推論特化モデル「OpenAI o3-mini」を2025年1月31日にリリースしました。OpenAI o3-miniはOpenAIの推論モデルの中で最もコスト効率の高いモデルとのことで、OpenAI o1よりも高い性能を備えつつ低いコストで動作することがアピールされています。また、OpenAIの推論モデルとしては初めてChatGPTの無料ユーザーでも使えるようになっています。 OpenAI o3-mini | OpenAI https://openai.com/index/openai-o3-mini/ 「OpenAI o1-preview」「OpenAI o1」「OpenAI o1-mini」「OpenAI o3-mini」の数学性能を比べたグラフが以下。OpenAI o3-miniの性能は推論に費やす労力ごとに「low(低)」「medium(中)」「high(高)」の3種
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く