こんにちは、機械学習スペシャリストソリューションアーキテクトの本橋です。みなさんは日々の業務の中で生成 AI を活用していますか? 大規模言語モデル (LLM) を企業のナレッジベースと組み合わせて活用する際、一般的なアプローチとして RAG (Retrieval-Augmented Generation) が注目されています。RAG は、質問に関連する文書をベクトル検索などで取得し、その情報を LLM に提供することで、より正確な回答の生成を可能にします。 しかし、従来のベクトル検索ベースの RAG には、いくつかの課題があることが指摘されています。特に以下の点が重要な課題として挙げられます。 関係性の分断 : 文書をチャンク (断片) に分割する際に、エンティティ間の関係性が失われてしまい、「XX が YY にどのように影響したか」といった因果関係を説明する質問に対して十分な回答が困難