ナレッジベースのPDF解析に新機能が追加されたのでどう読めているのか確認していきます。 データオートメーションパーサーは手書きを含めたPDF等から構造化データに変換します。ホントに? ファンデーションモデルパーサーは基盤モデルを使ってテキストと画像を含めた情報を元に処理を行う…と書いてあるような気がします。去年の夏頃から「Use foundation model for parsing」というパースモードがありましたが、あとで触れますがそれが機能強化されています。 使用するドキュメント IPAのデジタルスキル標準のPDFを使用します。 データオートメーションパーサーの方は20ページまでしか使用できないので先頭20ページを切り出して使います。 Amazon Bedrock データオートメーション パーサー 日本語ドキュメント