NTTコミュニケーションズは2025年2月19日、ExcelやPDFファイルなどの非構造化データを構造化データに変換する技術「rokadoc(ロカドック)」を発表した。一般に広く公開して誰でも試用可能とする「パブリックベータ版」として公開する。 企業が保有する各種ドキュメントを生成AI(人工知能)が扱えるデータ構造に変換することで、RAG(検索拡張生成)の精度を高める。ベクトル検索から得られた関連ドキュメントが期待通りである場合に1を示す「NDCGスコア」を用いて検証したところ、rokadocのスコアは0.918と、他社製品2つに比べて高い精度を示したという。
