エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
MarkItDownでひたすらいろんなファイルをmarkdownにしてみた - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
MarkItDownでひたすらいろんなファイルをmarkdownにしてみた - Qiita
MarkItDownという「なんでもMarkdownにしてくれるライブラリ」が話題になっています。 先日の記事にも書... MarkItDownという「なんでもMarkdownにしてくれるライブラリ」が話題になっています。 先日の記事にも書いたんですが、内製チャットボットでは外部ファイルをどうAIが解釈可能な文字列として読み込ませるか悩むことが多いです。 すでにQiitaにも記事はあって若干煎じなんですが、もう少し社内のユースケースにありそうなものを試してみようと思います。 先にまとめ Unstructuredではライブラリそのものや機械学習モデルのサイズが大きいのに対して、MarkItDownでは一般的なライブラリのみです。画像や音声はOpenAI APIに頼っています。 Unstructuredを使っているとどうしてもデプロイに時間がかかったり、モデルダウンロード時の問題が発生したり困ることが多かったので。 pdfminer内でOCRモデル使っていたのでこのメリットは小さそうでした🥺 また、HTMLの構造