本文抽出の人気記事 2件 - はてなブックマーク

1 - 2 件 / 2件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

本文抽出の検索結果1 - 2 件 / 2件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

本文抽出に関するエントリは2件あります。 python、 html、 golang などが関連タグです。人気エントリには『Scrapyでクロールし、S3へアップロードしたhtmlファイルを本文抽出して、Elasticsearchのインデックスへ保存したい。』などがあります。

Scrapyでクロールし、S3へアップロードしたhtmlファイルを本文抽出して、Elasticsearchのインデックスへ保存したい。
- 5 users
- teratail.com
- テクノロジー
- 2020/07/26
質問をすることでしか得られない、回答やアドバイスがある。15分調べてもわからないことは、質問しよう！新規登録して質問してみよう
- aws
- html
- python
- あとで読む
go-readabilityをwasmにしてCloudflare Workersで本文抽出する - *iroi*
- 5 users
- blog.chairoi.me
- テクノロジー
- 2024/06/28
先日Cloudflare Workersでウェブページの本文を抽出したくなったことがありました。本文抽出といえば、@mozilla/readabilityが使えそうです。しかし依存に含まれるnwsapiにはFunctionコンストラクタが多用されており*1、Cloudflare Workersでは動作しません。これを修正するのも大変そうです。そこで、TinyGoを使用してgo-readabilityをwasmにコンパイルしてみることにしました。 TinyGo のドキュメントUsing WASM | TinyGo のままではCloudflare Workersでは動かなかったので、TinyGoに含まれるwasm_exec.jsを少し修正したり*2、 import側もwasmファイルをfetchしているのを変更したり*3すると無事動きました。動作するコードは https://github.
- golang
- article

新着記事

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx