Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

現在地

ホーム

ウェブアーカイブ

大規模言語モデル「GPT-4o」を用いたウェブアーカイブのメタデータ作成:シンガポール国立図書館庁(NLB)の事例(文献紹介)

2024年11月8日付けでプレプリントサーバーarXivに、大規模言語モデル(LLM)のGPT-4oを用いたウェブアーカイブのメタデータ作成に関する記事“Web Archives Metadata Generation with GPT-4o: Challenges and Insights”が掲載されています。著者はシンガポール国立図書館庁(NLB)のAbigail Yongping Huang氏らです。 記事では、NLBが提供するウェブアーカイブ“Web Arch...

Internet Archive、文化的記録の消失に関する報告書“Vanishing Culture: A Report on Our Fragile Cultural Record”を公開

2024年10月30日、Internet Archiveが、文化的記録の消失に関する報告書“Vanishing Culture: A Report on Our Fragile Cultural Record”を公開したと発表しました。 報告書は、文化的記録の消失の動向について近年の事例を紹介しつつ解説し、一般市民、クリエイター、政策立案者等に情報を提供することを目的として作成されたとあります。 第1部では、ウェブページ、ソフトウェア等の消失に関する近年の研究の...

E2747 – 消失するインターネット上のコンテンツに関する調査(米国)

カレントアウェアネス-E No.490 2024.10.31 E2747 消失するインターネット上のコンテンツに関する調査(米国) 関西館電子図書館課・志村努(しむらつとむ) ●はじめに 2024年5月、米国の調査機関Pew Research Centerはインターネット上のコンテンツの消失に関する調査結果を公開した。調査では、ウェブページ、ウェブページ中のリンク、ソーシャルメディア上の投稿、という3種類のインターネット上のコンテンツに対して、消失するまで...

スペイン国立図書館(BNE)、バスク州のドメイン「.eus」のウェブコンテンツの2度目の収集が終了したと発表

2024年10月3日、スペイン国立図書館(BNE)が、バスク電子図書館(Biblioteca Digital de Euskadi)の協力によりバスク州のドメイン「.eus」のウェブコンテンツの収集(バルク収集)が終了したと発表しました。 BNEによる「.eus」ドメインの収集は2023年に次いで2度目で、1万3,000を超えるドメインについて、15テラバイトの情報が保存されたとあります。 BNEでは、デンマーク王立図書館が開発した自動収集ソフトNetarchi...

静岡県立中央図書館、クローラを用いて自動収集した行政資料のPDFを公開

2024年10月4日、静岡県立中央図書館が、クローラを用いて自動収集した行政資料のPDFを公開したと発表しました。 同館では、2021年度に開始した図書館DXに係る実証実験の一環として、クローラを用いて県内自治体のウェブサイトに掲載されたPDFを自動収集するシステムを地元企業の株式会社Geolocation Technologyと共同開発しました。 収集されたPDFはGoogleドライブ上に保存されており、同館のウェブページ「自動収集システムによる行政資料PDF...

米・アイビー・プラス図書館連合(IPLC)、南アジアの政府刊行物のウェブアーカイブを公開

2024年9月26日、米・アイビー・プラス図書館連合(IPLC)が、南アジアの5か国の政府刊行物のウェブアーカイブ“South Asian Governmental Publications”を公開したと発表しました。 オープンアクセス(OA)のオンライン形式の南アジアの政府刊行物を収集・保存することが目的とされます。人口統計データから立法手続まで、バングラデシュ、インド、ネパール、パキスタン、スリランカのあらゆる主題の政府刊行物が対象となっています。 IPLC...

国立情報学研究所(NII)、大規模言語モデルのプレビュー版「LLM-jp-3 172B beta1」を公開

2024年9月17日、国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が、大規模言語モデルのプレビュー版「LLM-jp-3 172B beta1」を公開しました。 LLMCでは、オープンかつ日本語に強いGPT-3級大規模言語モデル「LLM-jp-3 172B」の開発を進めています。プレビュー版は目標学習量の約三分の一まで行った段階のもので、「LLM-jp-3 172B」の公開は2024年12月頃を予定しているとあります。 なお、モデルの構...

Wayback Machineに保存されたウェブページにGoogle検索の結果から直接アクセスできる機能が追加

2024年9月11日、Internet Archiveが、Wayback Machineに保存されたウェブページにGoogle検索の結果から直接アクセスできる機能が追加されたと発表しました。 発表によると、Googleでの検索結果の横に表示されるアイコンをクリックして“More About This Page”を開くと、Wayback Machineに保存されている当該ウェブページへのリンクが表示されるようになりました。これにより、ウェブページの以前のバージョンを参照...

E2724 – 2024年IIPC総会・ウェブアーカイビング会議<報告>

カレントアウェアネス-E No.485 2024.08.08 E2724 2024年IIPC総会・ウェブアーカイビング会議<報告> 関西館電子図書館課・安藤一博(あんどうかずひろ) 国際インターネット保存コンソーシアム(IIPC;CA1893参照)の総会及びウェブアーカイビング会議(WAC;E2615ほか参照)が、2024年4月24日から26日まで、フランスのパリにあるフランス国立図書館(BnF)で開催された。国立国会図書館(NDL)からは筆者が参加した。...

オランダ国立図書館(KB)、同館のコレクション構築に関する2024年から2030年までの戦略を発表

2024年6月10日、オランダ国立図書館(KB)が同館のコレクション構築に関する2024年から2030年までの戦略を発表しました。 同戦略は、オンライン出版物の増加といった近年の出版文化の変化に対応するために策定されたもので、コレクションの収集、保存、アクセスの提供に関する九つの基本原則を示しています。 発表の中では、戦略において、出版物の定義を従来の書籍や定期刊行物から拡張したこと、紙版よりデジタル版での収集を優先するという近年採用してきたデジタルファーストの...