Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

タグ

AIに関するaufhebenのブックマーク (11)

  • [Dify]現状Difyができないこと - Qiita

    前提 Difyのバージョンは Dify:0.6.11 Dify:0.6.13です。 今の最新バージョンで現状できないことをまとめてみました。 いろんな人がXでDifyでできることをあげていってくれていますが、あまりできないことをまとめている人はいなかったのでまとめた次第です。 「探索に時間を費やしたけど結局できなかった...」となる人が少なくなること祈って書いています。 ループ処理の制限 現在のDifyでは、特定の条件を満たすまでループを回す処理の実装が困難です。例えば、Self-RAGのような自己反復型のRAGの実装ができません。 一時的解決策 現状見つかっていないです。実装方法あったら教えてください。 モニタリングツール(LangSmith、Langfuse)との連携 (0.6.12からできるようになりました) できるようになったので、混乱を与えないため内容は削除しました。 AIモデル

    [Dify]現状Difyができないこと - Qiita
  • Dify初心者向け講座|伊志嶺(LLMで業務改善する人)|note

    【Dify初心者講座】RAGの作り方 RAG(Retrieval Augmented Generation)とはLLMに情報検索機能を与え、特定の情報源を元に回答を生成させる手法です。 RAGによって特定のWebページや資料を元にハルシネーションの危険性を最小限に抑えた回答をさせることができます。 DifyにはRAGを簡単に構築する機能が備わっています。 ここではRAGを使った簡単なチャットボットとワークフローを作成し、その作り方を学んでいきます。 ナレッジデータベースの作り方まず、RAGに必要なナレッジデ

    Dify初心者向け講座|伊志嶺(LLMで業務改善する人)|note
  • インフラ視点で Dify のアーキテクチャを理解する(v0.13.1) - mazyu36の日記

    記事は Qiita Dify Advent Calendar 2024 の 5日目の記事です。 最近OSSのLLM開発プラットフォームであるDifyをちょいちょい触っています。 github.com AWS上でホストしたり、Difyにコントリビュートし始めたりしているのですが、今後 Deep Dive するためにDifyのアーキテクチャを理解しておこう、ということで自分なりに整理してみました。 なおインフラ視点での整理のため、AP実装には深くは踏み込みません。 今回の記事の内容は主にGitHubのソースコードや、Docsを元にしています。 docs.dify.ai また設定パラメータがいくつか存在しますが .env.example を見ると非常にわかりやすく理解が進むのでおすすめです。 github.com 目次 目次 Difyのアーキテクチャ 1. Reverse Proxy 2. F

    インフラ視点で Dify のアーキテクチャを理解する(v0.13.1) - mazyu36の日記
  • Difyとは?できることや使い方・料金体系を解説!商用利用時の注意点も | AI総合研究所

    この記事のポイント Difyはプログラミング不要で直感的にAIアプリを作成できるプラットフォーム豊富なAIモデル、外部ツール連携、RAG機能など多彩な機能を搭載無料プランから格開発向け有料プランまで幅広い料金体系を提供条件付きで商用利用可能、ただし制限事項にも注意が必要チャットボット、テキスト生成、検索自動化など様々なアプリケーション開発が可能 Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのITWeb3事業の創業と経営を経て、LinkX Japan株式会社を創業。 Dify(Dify.AI)は、プログラミングスキルが不要で、誰でも直感的にAIアプリを作成

  • ノルムの意味とL1,L2,L∞ノルム | 高校数学の美しい物語

    nnn 次元ベクトルは(この記事では)実数を nnn 個並べたものだと考えて下さい。 高校数学で習う2次元ベクトル(平面ベクトル),3次元ベクトル(空間ベクトル)の一般化です。 (実数上のベクトル空間 VVV に対して) 任意の xundefined,yundefined∈V\overrightarrow{x},\overrightarrow{y}\in Vx,y​∈V と任意の実数 aaa に対して以下の3つの性質を満たす関数 ∥∗∥\|*\|∥∗∥ をノルムと呼ぶ: ∥xundefined∥=0  ⟺  xundefined=0undefined\|\overrightarrow{x}\|=0\iff \overrightarrow{x}=\overrightarrow{0}∥x∥=0⟺x=0 ∥axundefined∥=∣a∣∥xundefined∥\|a\overrightarro

    ノルムの意味とL1,L2,L∞ノルム | 高校数学の美しい物語
  • 【機械学習】LPノルムってなんだっけ? - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

    【機械学習】LPノルムってなんだっけ? - Qiita
  • RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた | DevelopersIO

    はじめに 新規事業部 山です。 ChatGPTOpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい情報に関して回答

    RAGを使った社内情報を回答できる生成AIボットで業務効率化してみた | DevelopersIO
  • RAGにフレームワークは必須か?LlamaIndex使用有無で比較検証|ドドテクノ

    以前、以下のような記事を書きました。 https://dodotechno.com/llamaindex-wikipedia-chat/ 簡単に説明すると「AIは知らない事を聞いた時に嘘をつく(ハルシネーション:幻覚)のでプロンプトで質問と一緒に正確な知識を渡せばいいよね」という記事です。 この方法はRAG(Retrieval-Augmented Generation)というもので、AIが知らないような専門的な知識について回答させたい場合に、専門知識が記載されたドキュメントやWEBページの情報などをプロンプトに一緒に与えることによって、正確な情報を得る方法です。 ただ、この記事で使用したLlamaindexというフレームワークの仕様が変更されて現在のバージョンでは記事投稿時のソースが動作しません。(後、記事中の説明のための用語の使い方が微妙・・) そのような理由から最新のバージョンでソース

    RAGにフレームワークは必須か?LlamaIndex使用有無で比較検証|ドドテクノ
  • サクッと始めるRAG開発【LangChain / Python】

    このでは、初心者・入門者の方に向けて、RAGの知識や使い方を体系的にまとめました。少し難易度の高い内容になりますが、書の中で事前に学んでおくべき項目を示しているため、ご安心ください。 【概要】 ・内容:RAGの概要【入門者向けの基礎知識】、RAGの処理フロー【In-Context Learning / Embedding / Vector Search】、RAGのビジネス活用ロードマップ【大企業向け】、RAGの実装アプローチ、RAGの大分類【Document RAG】、RAGの大分類【SQL RAG】、RAGの大分類【Graph RAG】、RAGの精度評価アプローチ、RAGの精度評価方法【LangChain Evaluation】、RAGの精度評価方法【Ragas】、RAGの精度改善手法【データ品質 / プロンプト品質 / ベクトル検索】、RAGの精度改善のためのLLMOps概論、LL

    サクッと始めるRAG開発【LangChain / Python】
  • | GitHub Copilot Patterns & Exercises

    About ようこそプロジェクトに貢献するにはGeneral コード補完コメントからコードを生成コードからコメントの自動生成GitHub CopilotとのクイックQ&A正規表現プログラミング言語間の翻訳タイプヒンティング構造化データからのオブジェクト生成コードからドキュメントへClient Side Tips Copilot スニペットハンドリングGitHub Copilot ショートカット定義に移動便利なファイルのピン留めDesign Patterns AI が理解可能な命名規則一貫性のあるコーディングスタイルハイレベルアーキテクチャを先に小さなコードチャンクで作業するコンテキストレス・アーキテクチャ微細な OSS 依存関係の排除Collaboration AIフレンドリーなドキュメンテーションプロンプトとコード生成プロセスのコーチングTesting ユニットテストの作成テストコード生

    aufheben
    aufheben 2024/09/27
  • AI検索エンジン「Perplexity」が調べ物に便利 ユーザーの代わりにWebを検索→簡単に要約して教えてくれる

    会話型検索エンジン「Perplexity」が、近ごろ注目を集めています。AIがユーザーの代わりにWebを検索し、内容を要約して表示。出典も明記してくれるため内容の正確さを判断しやすく、深掘りもしやすい点が大きな特徴です。 Perplexity 試しにねとらぼについて聞いてみたところ。結果は英文だったが、運営元の情報含め、Webメディアだと回答された 使い方は検索窓に質問や調べたいものの名前を入力するだけ。回答文は英語で出力されがちですが、「○○について日語で教えてください」などと聞き方を工夫すると、日語の答えが出やすいようです。 例えば徳川家康について聞くと、「室町時代後期から江戸時代初期の日の武将であり、戦国大名」「江戸幕府を開いた武将として知られており、天下人として名高い」などと、Wikipediaや学習サイトなどをもとに回答。参照元として添えられたリンクを踏めば、より詳しい情報

    AI検索エンジン「Perplexity」が調べ物に便利 ユーザーの代わりにWebを検索→簡単に要約して教えてくれる
  • 1