[B! PDF] flatbirdのブックマーク

Amazon Bedrock Knowledge Bases の新機能で PDF を読む - Qiita

ナレッジベースのPDF解析に新機能が追加されたのでどう読めているのか確認していきます。データオートメーションパーサーは手書きを含めたPDF等から構造化データに変換します。ホントに？ファンデーションモデルパーサーは基盤モデルを使ってテキストと画像を含めた情報を元に処理を行う…と書いてあるような気がします。去年の夏頃から「Use foundation model for parsing」というパースモードがありましたが、あとで触れますがそれが機能強化されています。使用するドキュメント IPAのデジタルスキル標準のPDFを使用します。データオートメーションパーサーの方は20ページまでしか使用できないので先頭20ページを切り出して使います。 Amazon Bedrock データオートメーションパーサー日本語ドキュメント

flatbird 2025/01/08

pdf
llm

リンク

PDFドキュメントを画像のまま検索できるColQwen2でマルチモーダル検索を試す - Taste of Tech Topics

こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。完全に年末ですが、最後まで油断せずに年を越したいですね。このブログは、LLM・LLM活用 Advent Calendar 2024の25日目になります。 qiita.com 今年は1年間RAGを扱う多くの事例に触れさせていただきましたが、どこでも難しいのが図や画像が使われているドキュメントですね。ただのPDFであれば、pdfminerなどのライブラリを使用して文字を読み取り検索すればよいですが、画像が使われるとそう簡単にもいきません。画像部分からはOCRを使って文字を取り出すなど、工夫が必要になります。今回はドキュメントを画像にした状態で検索可能にするColQwen2というモデルを使って日本語ドキュメントの検索を試してみます。 ColQwen2とは実験環境 PDFドキュメントのEmbeddi

flatbird 2024/12/26

llm
pdf

リンク

Microsoftによる“なんでもMarkdownにしてくれるライブラリ”が話題、手軽なWebアプリもさっそく登場／PDF、Word、Excel、PowerPoint、音声・画像までカバー【やじうまの杜】

flatbird 2024/12/17

リンク

Claudeの新PDF解析機能が凄い！『Visual PDFs』視覚的特徴も捉える革命的な文書解析！ - Qiita

3. Claudeが解決する具体的な課題 ClaudeのPDF解析機能は、さまざまな場面での課題を解決する可能性を秘めています。以下に代表的な課題を挙げ、それぞれの解決策を説明します。 3.1. 視覚的な情報の損失従来のツールでは、PDF内の画像や図表が無視されるため、情報が欠落していました。Claudeは、これを解析し、文脈に沿った情報を抽出できます。例: 投資レポート投資レポートに含まれるグラフを解析し、投資トレンドを抽出。「このグラフが示す傾向を教えてください」と質問するだけで、具体的な回答を得られます。 3.2. スキャン文書への対応古いスキャン文書や斜めに傾いた文書は、従来ツールでは処理が困難でした。Claudeは、これらの文書も正確に解析します。例: 医療分野の手書きカルテ手書きのスキャン文書をアップロード。「患者の診断結果を要約してください」と質問すると、関連

flatbird 2024/11/20

llm
pdf

リンク

論文解説をGPT-4oを使って自動的に生成してみる - Qiita

Prompt Tokensはテキストの15%になっています。計算しやすいようにCompletion Tokensをどちらも1,000とすると、画像として処理した場合は0.022595ドル=3.55円テキスト抽出して処理した場合は0.065995ドル=10.38 円と約3倍もの開きがあります。一方で処理時間は1.5倍に増加しています。実装紹介: 論文から解説生成落合陽一さんが紹介したサーベイの方法論を使い、論文解説を生成します。処理手順 arXiv URLからプレプリントをダウンロード base64形式に変換後 GPT-4oに渡して解説を生成実装 def download_paper(arxiv_url: str, save_dir: str) -> str: """ arXivから論文をダウンロードする関数 Args: arxiv_url (str): ダウンロードする論

flatbird 2024/06/15

リンク

diff-pdfでPDFファイルの視覚的差分を取るGitHub Action - やらなイカ？

diff-pdfは、オープンソースのPDFファイル比較ツールです。これをGitHub Actionsワークフローから使用するためのDockerイメージ及びActionを作りましたので紹介します。 github.com diff-pdfには、指定するオプションによって大きく2通りの用途があります。 PDFを出力するシステムの検証のため、出力されたPDFが期待するものと等しいものかを検証する（ビジュアルリグレッションテスト、ゴールデンテスト） Re:VIEWやMarpのようなテキストベースの原稿をPDFなどにレンダリングするツールを使用して執筆している場合に、テキストでなくレンダリング結果の差分*1を確認するためのPDFを生成する以下、それぞれの用途に向けたワークフローの記述例を紹介します。 PDFが期待するものと等しいかを検証するあらかじめ用意したexpected.pdfと、システムで

flatbird 2024/01/24

リンク

ChatPDF - Chat with any PDF - #1 Free PDF AI

PDF Join millions of students, researchers and professionals to instantly answer questions and understand research with AI

flatbird 2023/05/07

ChatGPT
PDF

リンク

ブロードリンク社の再発防止対策PDFに学ぶ、iLovePDF利用のリスク。（大元隆志） - エキスパート - Yahoo!ニュース

顧客から廃棄依頼の有ったハードディスクを従業員が不正に販売していたことで、ブロードリンク社が再発防止策を発表した。しかし、この再発防止策のPDFファイルの黒塗り部分が、ファイル変換ツールで取り外せると話題になった。 ■何が起きたか?　2019年12月9日、ブロードリンク社が従業員による不正行為に対する再発防止策を発表。しかし、この再発防止策の一部にID、氏名と記載された黒塗り部分があり、この黒塗り部分がファイル変換ツール等を利用することで取り外せると話題になった。ワード等で「図形」を塗りつぶして、見せたくない文書の上に「図形」を置き、PDFに変換し「黒塗りした」と思っていても、ファイル変換ツール等で元のファイルに戻すと、その図形部分を取り除くことが出来てしまうことがある。黒塗り部分が取り外させると話題になった箇所。現在は改善されている。引用:ブロードリンク社「再発防止対策について」。　

flatbird 2019/12/17

リンク

すごいIPv6本を無料配布！:Geekなぺーじ

2021年12月20日追記：第2版できました！ IPv6を解説した「プロフェッショナルIPv6」をラムダノート株式会社から出版しました。初版は456ページになりました。紙版の厚さは23mmになる予定です。現時点で、IPv6に関して世界で最もまとまっているIPv6 本であると個人的に考えています。「プロフェッショナルIPv6」は、株式会社日本レジストリサービス様、BBIX株式会社様、NTTコミュニケーションズ株式会社様、日本ネットワークイネイブラー株式会社様、クラウドファンディング(「すごい技術書を一緒に作ろう。」という企画です)でのみなさまによるサポートにより実現しました。 IPv6に関する技術情報を広く公開するという趣旨に賛同いただき、本書の執筆と制作、公開にあたって多大な協賛をいただきました。ありがとうございます！！！「プロフェッショナルIPv6」は、通常の書籍として5000円で

flatbird 2018/07/05

リンク

76歳の編集者挑む“科学古典のデジタル文書化”――現役時代に夢見た「科学知識を万人へ」

「科学的知識は万人によって共有されるべきもの」とトップに掲げるそのWebサイトには、北里柴三郎、志賀潔、寺田寅彦、本居宣長、九鬼周造といった日本の科学者・哲学者・偉人や、アルベルト・アインシュタイン、ルイ・パスツール、マックス・プランク、ヴィルヘルム・オストヴァルトなど海外の著名な科学者たちの著作がPDF形式で公開されている。いずれも著作権者の許諾を得て掲載しているという。その数、500冊以上。PDFは、本をそのまま画像で取り込んだものではなく、組版（くみはん）用のマークアップ言語「TeX」で1冊1冊組版したものだ。実際にPDFを見てみると、丁寧に組版されており、昔の著作でも読みやすい。文章のコピーもできるため、単語の検索も容易に感じた。一体誰が作ったのか。Webサイトには本人のプロフィールらしきものもない。Webサイト内にあったメールフォームから連絡を取ったところ、返信があった。なん

flatbird 2017/08/13

science
PDF

リンク

【新アプリ】Adobe ScanでスマートフォンがOCR付きデジタルスキャナーに！（Android/iPhone）

Adobeは6月1日に、スマートフォンのカメラを使ったOCR付きデジタルスキャナーアプリ「Adobe Scan」を公開しました。名刺や領収書などの紙の文書をスマホのカメラで撮影すれば、文字の検索も可能なPDFファイルを作成できます。使い方をチェックしておきましょう。名刺や契約書などの文書を簡単デジタル化！ Adobeは2017年6月1日、無償のスマートフォンアプリ「Adobe Scan」を公開しました（Android/iOS版）。名刺や契約書、領収書などの文書をスマートフォンのカメラで撮影することで、紙のドキュメントを簡単にPDF化できるデジタルスキャナーアプリです。OCR機能も備えるため、取り込んだデータに書かれているテキスト情報を検索することもできます。［Adobe Scan］アプリの主な特徴は以下のとおりです。・OCR（光学式文字認識）で画像内のテキストが検索可能・カメラで撮

flatbird 2017/06/09

Adobe
PDF

リンク

Adobe、iOS/Androidで撮影した文書をPDF化できる「Adobe Scan」を無償提供／“Adobe Sensei”で自動補正。OCRによるテキストの認識にも対応

flatbird 2017/06/03

リンク

Google Chrome PDFエンジンがオープンソース化

Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

flatbird 2014/07/01

PDF
google

リンク

PDFに関する小粋なツールが集まった『Small PDF』 | 100SHIKI

きれいにまとまったサイトなのでご紹介。 Small PDFでは、PDFに関する小粋なツール群を提供している。 PDFを圧縮したり、JPGに変換したり、さらに複数ファイルをまとめる機能もある。他にも似たようなツールはあるが、まとまっているのがありがたい。覚えておいても損はないかもですな。

flatbird 2014/06/26

リンク

JavaScriptでOfficeやPDF文書をWebページに埋め込む「BoxView」をBoxが発表

DropboxやOneDrive（旧SkyDrive）のようなクラウドストレージサービスを提供するBoxが、WebページにOffice文書やPDF文書を貼り付けられる新機能「BoxView」を発表しました。 BoxViewは、Box内に保存したファイルを変換し、APIで呼び出せるというもの。JavaScriptによるビューアを使うことでWebページに貼り付けられるほか、モバイルアプリケーションなどからもAPI経由で利用できます。 Webページへの貼り付けは、あらかじめデベロッパートークンや対象ドキュメントのセッションIDなどを取得する必要があるため、SlideShareなどのようなサービスと較べると手間がかかりますが、Boxの共有範囲のみといった制限ができること、APIによりアプリケーションからも利用できる点などが特徴。 Boxは同社のクラウドストレージサービスを企業向けサービスとして展開

flatbird 2014/04/01

リンク

github.comをgitprint.comにするだけでマークダウン文書をPDFに変換『GitPrint』 | 100SHIKI

なにこれ便利。 GitPrintでは、github.comのURLにちょいと細工するだけでマークダウン文書（.md）をPDFにしてくれる。使い方は簡単で、github.comをgitprint.comにするだけだ。ちゃんとコード部分にはアイコンがついたり、見出しには下線がついたら、読みやすいし、印刷フレンドリーでもある。もちろんPDFにはリンクも組み込まれている。かなり便利だと思うのだがいかがだろう？

flatbird 2014/03/17

github
pdf

リンク

samulife.com - このウェブサイトは販売用です！ - リソースおよび情報

このウェブサイトは販売用です！ samulife.com は、あなたがお探しの情報の全ての最新かつ最適なソースです。一般トピックからここから検索できる内容は、samulife.comが全てとなります。あなたがお探しの内容が見つかることを願っています！

flatbird 2014/02/04

リンク

これがHTML？と言いたくなるようなPDF変換ソフトウェア·pdf2htmlEX MOONGIFT

pdf2htmlEXはレイアウトの再現性を極めたPDFからHTMLへの変換ソフトウェアです。 PDFはそのままでは容易に編集できないフォーマットです。そこが利点でもあり欠点でもあります。PDFを別フォーマットに変換するソフトウェアは幾つかありますが、今回は驚いてしまうくらい品質高いHTML変換を行うpdf2htmlEXを紹介します。これがHTMLだと思えないくらいの再現度です。計算式にも対応。段組み、画像埋め込みも問題なし。白黒に限らず扱えます。中国語。マルチバイト対応です。まるで素のPDFを表示しているかのような再現度の高さがpdf2htmlEXの売りです。PDFを一つのHTMLファイルとして出力し、色や文字の装飾も反映します。リンクもそのまま使えます。なお、Type3のフォントには対応しておらず、テキスト以外のオブジェクトは画像としてレンダリングされるようになっています。

flatbird 2013/10/24

リンク

実行可能ファイルかつPDFファイルかつJarファイルかつHTMLファイルとして認識されるファイル

mix CorkaMIX(Windows用)、CorkaMInuX(GNU/Linux用)、CorkaM-OsX(Mac OS X用)は、それぞれ、Windows、GNU/Linux、Mac OS Xにおいて、実行可能ファイル、PDFファイル、Jarファイル、HTMLファイルとして認識されるファイルである。ファイルはプラットフォーム別になっている。それぞれのプラットフォームで、実行可能ファイル（OSからネイティブコードのためのファイルフォーマットとして認識され実行できる）、PDFファイル（そのプラットフォームのPDFビューワーで表示可能なPDFファイル）、Jarファイル(ZIP内にクラスとマニフェストを含むファイル)、HTMLファイル（JavaScriptでAlertを実行）実行可能ファイルとは、それぞれのプラットフォーム用のファイルが、OSから、x86のPE/ELF/Mach-Oと認

flatbird 2013/10/01

リンク

CNET Japan

人気の記事 1スマホ決済「PayPay」をビックカメラで使ってみた--還元額や使い勝手は 2018年12月04日 21頭のライオンが20頭のハイエナに立ち向かう--BBCの動画が再生600万回超える 2018年12月04日 3ビックカメラ、12月4日よりPayPay決済に対応--100億円還元キャンペーン開始にあわせ 2018年12月03日 4「ヤフオク!」などでPayPayが利用可能に--「期間固定Tポイント」もPayPay残高に変更へ 2018年11月30日 5スマホで検眼して眼鏡を注文できる「VisionCheck」--近視、遠視、乱視、遠近両用 2018年12月04日 6JDI、ディスプレイ専業からの脱却--センサー開発に本腰、着脱可能のヘルメット用HUDも 2018年12月04日 75G対応「iPhone」、登場は2020年以降との報道 2018年12月04日 8PayPay利用

flatbird 2013/09/09

リンク

はてなブックマーク

タグ

関連タグで絞り込む (30)

PDFに関するflatbirdのブックマーク (22)

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

今週のはてなブックマーク数ランキング（2025年2月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス