ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフーで画像処理エンジニアをしている吉橋です。この記事ではヤフーのさまざまなサービスで使われている独自の画像文字認識(OCR)技術と、特に最近のPayPayフリマ「本棚一括持ち物追加機能」での活用事例をご紹介します。 画像文字認識とは 皆さん、ウェブサイトを見ていて「このキーワード気になるな……よしコピーしてヤフーで検索してみよう! と思ったらこれ画像じゃん、コピーできないよ……」なんて困ったことはありませんか? ウェブで私たちが目にする情報は“テキスト”と“画像”の2種類が主なものです。 テキスト: 文字列としての情報を保持したデータであり、コピーやウェブ検索に利用したり解析したり、容易に活用できます。 画像データ:
凸版印刷ではこの課題を解決するため、2015年から国文学研究資料館と共同研究を開始。古文書対応のAI-OCRの開発に取り組んできた。その中で「手元の古文書を手軽に読みたい」という一般利用者向けのサービスに対する多数の要望があり、今回のアプリ開発に至ったとしている。 凸版印刷は今後、2025年度までにAPI提供や関連事業を含め、一般利用者や教育機関、博物館・資料館、地方自治体などのサービス提供を拡大し、約3億円の売り上げを目指す。 関連記事 ライトを当てると文字や絵が現れるホログラム 凸版が開発 スマホライトで真贋判定 強い光(点光源)を当てると、立体的な画像が現れる新たなホログラム「イルミグラム」を凸版が開発。スマートフォンのライトなどで誰でも簡単・正確に真贋判定できる。 メタバースでのなりすましを防ぐ 3Dアバターの本人証明ができるセキュリティ基盤 凸版印刷が開発 凸版印刷が、メタバース
画面内に写っている文字列を、プレーンテキストとしてコピー可能にするシンプルな OCR ツール。 マウスドラッグで囲んだ領域内に写っている文字列を、プレーンテキストとしてクリップボードにコピーできるようにしてくれます。 「NormCap」は、クロスプラットフォーム(Windows / Linux / MacOS)に対応した OCR ツールです。 オープンソースの OCR エンジン “ Tesseract ” を利用したシンプルな OCR ツールで、画面内に写っている文字列を簡単な操作でクリップボード内にコピーできるようにしてくれます。 ソフトを実行すると即キャプチャが開始され、そのまま読み取りたい文字列をマウスドラッグして囲むだけで使えるようになっています※1。 1 ただし、デフォルトでは日本語の読み取りに対応していないので、日本語テキストを読み取りたい場合は少々設定が必要となる。 画像内に
Project Naptha highlight, copy, and translate text from any image. Project Naptha automatically applies state-of-the-art computer vision algorithms on every image you see while browsing the web. The result is a seamless and intuitive experience, where you can highlight as well as copy and paste and even edit and translate the text formerly trapped within an image. Unfortunately, your browser is no
iOS 14では、「メモ」アプリから書類をスキャンして保存することが可能です。使い方をチェックしましょう。 「メモ」を開くと、キーボードの上部にカメラのアイコンが確認できると思います。カメラのアイコンをタップし、ポップアップメニューから「書類をスキャン」をタップしましょう。 カメラが立ち上がるので、スキャンしたい書類にカメラを向けます。書類の範囲が自動的に選択され、薄い黄色で表示されます。スキャン時、書類を置く場所は、書類とはっきり色が異なる方が、うまくスキャンしやすいようです。 シャッターが自動的に切れるので、うまく撮れている場合は「スキャンを保持」を、撮影しなおしたい場合は「再撮影」をタップ。 「スキャンを保持」を選択すると、右下に「保存」というボタンが表示されるので、タップすると、スキャン済みの書類が保存されます。連続で複数前の書類をスキャンし、まとめて保存することも可能です。
画像ファイルからテキストを抽出したい場合、何らかのOCR(光学式文字認識)ソフトウェアを利用するのが一般的だ。しかし、BetaNewsは1月6日(米国時間)、「Windows 10 has a secret way to grab text from images」において、特定のソフトウェアを使わずに、Windows 10に付属する標準機能だけでテキストの抽出を行う方法を伝えた。なお、この方法は現在のところ英語のテキストにしか対応しておらず、残念ながら日本語は読み取ることができない。 Windowsの標準機能といっても、何らかのORCツールが標準でインストールされているというわけではない。したがって、スタートメニューのアプリケーション一覧を探しても該当する機能は見つからない。Betanewsで紹介されているのは、Windowsの検索ユーティリティとスクリーンショットを取得するための「切り
Created by the owner of the listed website. The publisher has a good record with no history of violations. Learn more Highlight, copy, edit, and translate text from any image on the web. Live Demo: http://projectnaptha.com/ Project Naptha automatically applies state-of-the-art computer vision algorithms on every image you see while browsing the web. The result is a seamless and intuitive experienc
最近、訳あってアメリカの特許情報を調べているのだが、何とも嘆かわしいことに、ここで公開されているPDFファイルには文字情報が含まれていない。 つまり画像をPDFにしただけなので文字としてコピーできず、資料にまとめようとしても手で入力し直さないといけない。流石に手間がかかりすぎる。 (↑一例。文字のように見えるが画像データなので文字をコピーできない) そこで色々とググっててみたら、便利なChrome拡張機能を見つけた。 Copyfish Free OCR Software - Chrome ウェブストア その名の通りOCRソフトウェアなのだが、Chrome上に表示しているものなら何でも文字認識してくれる優れもの。 (しかもChrome外のものも文字認識できるオプションもある) 使い方は非常に簡単 使い方はとっても簡単。 ①この拡張機能をChromeにインストールし ②OCR文字検出したいペー
「パソコンとスマホの基本ワザ」は、パソコンやスマートフォンに関する基本ワザや知っておくと便利な機能をていねいに紹介する連載です。“超”が付くほど簡単な使い方から、中上級者でも知っておくと役に立つ情報をお届けしていきます。第63回は、「Google ドキュメント」を使った、画像の文字をテキストデータ化する方法を紹介します。 「Google ドキュメント」を使えば、紙の書類のデジタル化が超簡単 紙の書類を渡されたけど、それをパソコンのデータとして扱いたい。そんなときに便利なのが、画像の中の文字を認識してテキストデータにする、いわゆる文字認識機能だ。この機能をもつアプリはいろいろあるが、アプリをインストールすることなく、「Google Drive」の機能で行う方法もある。 その方法とは、Google Driveに画像をアップロードし、その画像を「Google ドキュメント」で開くだけ。そうすると
約2カ月前、あるニュースに目が釘付けになった。凸版印刷が、江戸時代以前のくずし字を自動解読し、テキストデータ化する「くずし字OCR」なる技術を開発した、というのだ。多くの人にとっては日常的なニュースの一つかもしれない。しかし、大学時代に日本史を専攻・研究していた筆者にとっては驚くべき事態だ。 くずし字は、そう簡単に読めるものではない。少なくとも筆者はマスターできなかった。いくらテクノロジーの進化が日進月歩とはいえ、OCRで自動解読できるとは、にわかに信じがたいことだ。真相を探るべく、凸版印刷に向かった。出迎えてくれたのは、同社情報コミュニケーション事業本部の大澤留次郎氏と山本純子氏だ(写真)。
旅行中にもらった領収証や、ホワイトボードの板書の内容、封筒に描いたスケッチなどを保存したい時は、スマートフォンのスキャナアプリを使えば簡単です。本記事でご紹介するオススメのアプリなら、紙資料のスナップショットを撮って、クラウド上に保存できるので、スキャンしたデータを後で別のデバイスからも参照できます(文字認識も可能です)。 それでは、領収証や板書、手書きのメモなどの記録に役立つ選りすぐりのスマートフォン用スキャナアプリを5つご紹介しましょう。 重要な情報が書かれた紙切れをポケットにくしゃくしゃに丸めて入れておくのはイヤだし、黒板をノートに書き写す前に消されてしまったら困りますよね。そこで米Lifehackerは先ごろ、どのスキャナアプリを使用して書類をスマートフォンに保存しているかをテーマにした読者対象のアンケートを実施しました。 その結果、あらゆるモバイルプラットフォームを網羅した膨大な
誰もが一度はイラっとさせられたであろう文字認証「CAPTCHA」。ユーザがコンピュータで無いことを確認するセキュリティ機能のひとつですが、近年、これを解読することは「本のテキスト化」に協力することと同義になりました。同システムの開発者でクラウドソーシングも発案した起業家、Luis von Ahn(ルイス・フォン・アン)氏が、7億5,000万人が参加するプロジェクトが生まれたキッカケを語ります。(TEDxCMU 2011より) 誰もが一度はイラっとさせられるCAPTCHA(キャプチャ) ルイス・フォン・アン氏:このように、ゆがめられた文字の並びを読んで埋めるタイプのウェブフォームを見たことのある人は何人いますか? これを見て本当にいらいらすると感じた人は何人いますか? はい、すばらしいですね。私がこれを発明しました。私がこれを発明したメンバーの1人です。 (会場笑) これはCAPTCHAと呼
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く