タグ

opencvに関するclavierのブックマーク (54)

  • pythonで画像認識してクリックするプログラムの完成 - やりたいことをやるだけさ

    ここ二、三日ずっとプログラムを考えていて pyautoguiを使って、画像認識して クリックするプログラム あるサイトをスクレイピングするのに 今までは単純に要素を find elementで調べてクリックすれば よかったのだが 最近の仕様変更で クリックする対象が #shadow rootの中にネストされてしまい findできなくなってしまったのだ shadowの中から対象の要素を探す方法を ずうっと考えていたのだが それは諦めることにした できないことないような気もするが じゃあどうしたかというと 人間がその、オブジェクトを探してクリック するという挙動をプログラムにするしかないと そこで思いついたのが pyautoguiで 対象の画像をスクショして ペイントでトリミングして それをデスクトップに保存しておく pythonも一応3.10までバージョンアップし pyautoguiに必要な

    pythonで画像認識してクリックするプログラムの完成 - やりたいことをやるだけさ
  • OCR前処理としてのOpenCV超解像 - OPTiM TECH BLOG

    R&D チームの徳田(@dakuton)です。 最近は画像とテキストの狭間にいます。 今回記事のまとめ 簡単にまとめると以下のとおりです。 いくつかの超解像(高解像度化)モデルがOpenCV extra modules(opencv_contrib)インストール + コード数行記述で導入可能 超解像に限らず、文字が一定サイズ以上になるような前処理 -> OCR解析 を実施すると、OCR精度改善につながることがある 超解像による見た目の滑らかさに比例して、OCR精度改善につながるわけではない 低計算コストな画像拡大から超解像に変更する恩恵は発生しにくい テスト条件を変えた場合、違った結果になる可能性あり(用いるOCRエンジン、画像の劣化条件、OpenCV未提供の後発モデル利用など) 実験内容 利用するOCRエンジンの実行条件は変えずに、前処理部分のみ変更した場合のOCR精度・速度変化を調べま

    OCR前処理としてのOpenCV超解像 - OPTiM TECH BLOG
  • Real-time Object Detection with Phoenix and Python

    This article is not just about Machine Learning and Object Detection, it’s about Elixir interoperability and how we can take advantage of the Python’s fantastic set of ML libraries, bringing their features into the Elixir world. We see how to bring YOLO, a state-of-the-art real-time object detection system, in a Phoenix web app. We start with Python, by building a small app which does the actual o

    Real-time Object Detection with Phoenix and Python
  • opencv-python画像処理入門 - Qiita

    機械学習用の画像の前処理方法を調べたのを書いていきます。 中途半端な内容ですが、今後書き足していくと思います。 試行環境 Windows10 python 3.6 opencv-python 4.1.2.30 閾値処理: cv.Threshold(src, threshold, maxValue, thresholdType) opencvドキュメント http://labs.eecs.tottori-u.ac.jp/sd/Member/oyamada/OpenCV/html/py_tutorials/py_imgproc/py_thresholding/py_thresholding.html 閾値を指定して二値化 適当なグラデーション画像を作って二値化してみます # make gray scale picture im_gray = np.array([np.arange(0, 256

    opencv-python画像処理入門 - Qiita
  • Pythonの画像処理ライブラリPillow(PIL)の使い方 | note.nkmk.me

    Pillowは、開発が停止しているPIL(Python Image Library)からフォークされた画像処理ライブラリ。 Pillow is the “friendly PIL fork” by Alex Clark and Contributors. PIL is the Python Imaging Library by Fredrik Lundh and Contributors. Pillow — Pillow (PIL Fork) 6.1.0 documentation OpenCVのようにコンピュータービジョン系の高度な画像処理(顔検出やオプティカルフローなど)はできないが、リサイズ(拡大・縮小)や回転、トリミング(部分切り出し)のような単純な処理が簡単にできる。 (好みの問題ではあるが)PillowのほうがOpenCVよりコードがシンプルでとっつきやすいので、目的によって使

    Pythonの画像処理ライブラリPillow(PIL)の使い方 | note.nkmk.me
  • OpenCVやDlibの使い方で失敗した諸点 - Qiita

    OpenCVやDlibを使ってみて、人の顔の動画を処理することをやっています。 ここでは、これまでに失敗した点を、いくつか残しておきます。Qiitaをはじめ、画像処理関係でいろいろ検索すると、OpenCVのこれこれが使えるよという投稿が多いです。が、実際に使い込んでみたら結局使えなかったという情報も、役立つと思うので。 顔の特徴点を得るのに、DlibのLandmark68が有名ですが、これは顔の上半分が全然使えません。DlibのLandmarkは、西洋人のデータでTrainingされていて、東洋人の目周辺のLandmarkの質が低いです(2018.10.30更新->東洋人のデータも使ってTrainingするかとDlibの作者のDavid Kingが書いてました、そのうち解決される)。また、眼鏡をかけていると、目と眼鏡をよく取り違える。目回りのFeature Point検出は、自力で書くか、

    OpenCVやDlibの使い方で失敗した諸点 - Qiita
  • OpenCVをインストールしてみよう

    OpenCVとは、非常に強力なオープンソースの画像動画ライブラリだ。今回は、PythonからOpenCVを利用して、簡単な画像処理を行う方法を紹介する。特に、画像に様々なフィルタ処理を施す方法を見てみよう。 OpenCVを用いて画像にいろいろな処理を行ったところ OpenCVについて OpenCV(Open Source Computer Vision Library)は、画像や動画を処理するのに必要な様々な機能を提供するライブラリだ。画像の変換やフィルタ処理や変形、物体判定や物体認識や顔認識、カメラの入出力など豊富な機能が備わっている。そのため、画像や動画に関係する処理をするときに大変役に立つライブラリだ。 しかも、名前に『オープン』を関しているだけあって、オープンソース(BSDライセンス)であり、商用利用も可能なので、幅広く利用されている。加えて、マルチプラットフォームで、Window

    OpenCVをインストールしてみよう
  • TensorFlowで顔検出器を自作する - すぎゃーんメモ

    19日に行われた Kyoto.なんか #3 で発表・デモをさせていただいた内容まとめです。 はじめに: 検出器の重要性 アイドル顔識別 をずっとやっている中で、顔の識別・分類(Classification)はCNNを使って出来ているけれど まだ上手く出来ていない別のタスクがあって。 それが画像内からの顔領域の検出 (Detection, Localization)。 「画像内に写っている人物が誰であるか」を識別するためには、まずはその画像に写っている「顔」を検出する必要がある。 その検出された顔それぞれについて分類器にかけて「この顔は○○さん」「この顔は××さん」と分類していくことになるわけで。 分類器に与える入力画像を切り抜いて抽出するのにもまず顔領域を検出する必要があるし、その分類器を学習させるためのデータセットも、様々な画像から顔領域を検出して切り抜いてそれぞれに対してラベル付けする

    TensorFlowで顔検出器を自作する - すぎゃーんメモ
  • iOS swift で OpenCV を使う

    OpenCV のインストール 一旦 Xcode の Project を閉じます。 再びターミナルに戻って Project の xcodeproj が入っているディレクトリ内で Podfile を作り、OpenCV をインストールします。 対応する iOS のバージョンは 7.0 以上にしました。 6.x 以下に対応させようとすると泥沼化します。 iMac: ~ $ cd FaceRecogApp iMac:FaceRecogApp $ vi Podfile iMac:FaceRecogApp $ cat Podfile target "FaceRecogApp" do echo 'platform :ios, "7.0" pod 'OpenCV' > Podfile end iMac:FaceRecogApp $ pod install 結構時間が掛かりますがエラーなく終了すればインストー

    iOS swift で OpenCV を使う
  • これまでの講義内容のまとめ

    最終課題に向けて、サンプルコードを実際に実行しながら、これまでの内容をふりかえります。各回の内容をもう一度把握することで、課題制作の参考にしていってください。 最終課題について 最終課題提出FORM : 最終課題を発表する方は下記のFORMに内容を記入してください (聴講の方もぜひ!)。 これまでの講義内容とサンプルファイル サンプルファイル一括ダウンロード(Zip) 01. イントロダクション – Creative Codingとは? Processsing について サンプルなし 02. かたちとコード – Processingで図形を描くには? 01.基図形を描く 02.色の設定 03.透明度を設定 04.色の塗り分け 05.クイズ1 06.クイズ2 03. 反復と乱数 01.四角形 02.変数の使用 03.for文によるくりかえし 04.反復による入れ子構造1 05.反復による入

    これまでの講義内容のまとめ
  • 第3回 「ニコ生主でもつかえるIkaLog」を目指してのWindows対応 | gihyo.jp

    ところで、最初のバージョンのIkaLogは、画像認識処理(ステージ名、ルール名、勝敗)が100行、各種アクションの実装が500行、合計で600行のPythonスクリプトでした。 一方、現在のIkaLogは、関連スクリプトを含めて23,000行を超えています。開発開始から約1年で、初回リリースと比べて38倍の規模にまで大きなソフトウェアになったようです。 しかし、反応は思わしくなく…… IkaLogを公開はしてみたものの、反応は思った以上に冷ややかでした。Twitterのタイムラインにスプラトゥーンのプレイ記録がどんどん流れるような夢(妄想?)を見ていたのですが、実際にはそうはなりませんでした。実際問題として、多くの方が無秩序にスプラトゥーンのプレイ記録を投稿すれば、Twitterのタイムラインがノイズだらけになり、それはそれで困惑するでしょう。リバースエンジニアリングなしで実装したいという

    第3回 「ニコ生主でもつかえるIkaLog」を目指してのWindows対応 | gihyo.jp
  • 画像処理ライブラリ OpenCV で 出来ること・出来ないこと

    2. 経歴 – 2004 名古屋大学 卒業(村瀬研究室) – 2009 名古屋大学大学院 博士課程 修了(谷研究室) – 2009 名古屋工業大学 助教 – 2015 名古屋工業大学 准教授 – http://fukushima.web.nitech.ac.jp/ 著書,記事など – コンピュータビジョン~アルゴリズムと応用 – Qiita:OpenCV Advent Calendar 2015 – OpenCV.jp(の一部) 略歴 2 3. 専門 – 画像処理 • 画像符号化,映像符号化 • 画像のノイズ除去 • エッジ保存平滑化フィルタの高速化 – 3次元画像処理 • ステレオマッチング • 任意視点画像合成 • デプスマップのデノイズ • デプスセンサのキャリブレーション • マルチカメラアレイ • AR,VR – 並列画像処理 • 画像処理のベクトル化・並列化 • 画像処

    画像処理ライブラリ OpenCV で 出来ること・出来ないこと
  • ゲーム開発におけるデバッグ作業の自動化 ~ OpenCVの「眼」で捉え、Pythonの「脳」が思考し、Appiumの「指」で動かす

    2016/08/26 CEDEC 2016

    ゲーム開発におけるデバッグ作業の自動化 ~ OpenCVの「眼」で捉え、Pythonの「脳」が思考し、Appiumの「指」で動かす
  • 機械学習で用いる顔画像データセットの一作り方(1:WebAPIサービスを用いて候補画像取得) - Qiita

    DNN等の機械学習を用いて画像認識・分類を行う場合、学習実行時に大量の訓練用画像が必要となるため、 web等で公開されているデータセット(画像集合)を用いるケースが多くあるかとあります。 しかし顔画像分類・認識の場合には肖像権等の問題もあるためにフリーで公開されてるデータセットが少なく、 結果として学習画像を集めるのに苦慮されてる方も多いと思います。 そこで顔画像データセットを自作する一方法をここで紹介しておきます。 #今回用いた開発環境 MacOS X El Capitan 10.11.4 Python 3.5 OpenCV 3.1 #候補画像の取得 まず目的となる顔が写っている可能性がある画像(以下、候補画像と呼ぶ)を収集します。 考えられる収集方法としては以下の手法があります。 一般公開されているWebAPIサービスを用いて収集 動画をフレーム解析して収集 webページをスクレイピン

    機械学習で用いる顔画像データセットの一作り方(1:WebAPIサービスを用いて候補画像取得) - Qiita
  • 画像内の不要部分を取り除き、修復する(OpenCV / iOS) - Qiita

    写真に意図せず写りこんでしまった物体等を取り除き、それによって欠損した領域を自動修復する技術を、画像修復/画像補間/インペインティング(Inpainting)と呼びます。 で、OpenCV にその機能があったので iOS で実装してみました。 関数 inpaint は,選択された画像領域を,その領域境界付近のピクセルを利用して再構成します.この関数は,スキャンされた写真からごみや傷を除去したり,静止画や動画から不要な物体を削除したりするために利用されます. (opencv documentationより) ##実装方法 基的には inpaint() 関数を呼ぶだけです。OpenCV 3.0.0 における inpaint 関数のリファレンス によると、次のように定義されています。 Parameters: src – Input 8-bit 1-channel or 3-channel im

    画像内の不要部分を取り除き、修復する(OpenCV / iOS) - Qiita
  • ディープラーニングで「顔が似ているAV女優を教えてくれるbot」を構築 - Qiita

    概要 Facebook Messenger APIを利用して、 画像をアップロードすると、似ているAV女優を教えてくれるbotを実装しました。 システム構成 Bot応答を行うサーバは諸般の都合によりGo、画像判別はPython(顔検出はOpenCV、分類用の畳込みニューラルネットワークはTensorFlow)で作成しています。 尚、言語間のI/FはgRPCGoからPythonにRPCを行っています。 実装 Go側 Facebook MessengerからのWebhookを受信して、bot応答を行うWorkerプロセスです。 Messenger Bot Server WebサーバにはGinを利用しています。 難しい事は特にないですが、トラフィックが増えた際、複数のユーザからのメッセージをまとめてWebhookにPOSTする事があるようなので、 エンタープライズで利用するならそのあたりを注意

    ディープラーニングで「顔が似ているAV女優を教えてくれるbot」を構築 - Qiita
  • OpenCVでの物体検出器作成 - kivantium活動日記

    OpenCVのオブジェクト検出器作成方法についての解説です。 学習データの作成 まず最初にオブジェクト検出器の学習に使う教師データを用意する必要があります。そのためにまずGUIでオブジェクトの位置を指定するGUIツールを作りました。 PythonOpenCVを使います。 #!/usr/bin/env python #! -*- coding: utf-8 -*- import cv2 import numpy as np import sys drawing = False sx, sy = 0, 0 gx, gy = 0, 0 rectangles = [] ok = False def draw_circle(event,x,y,flags,param): global sx, sy, gx, gy, drawing if event == cv2.EVENT_LBUTTONDOWN

    OpenCVでの物体検出器作成 - kivantium活動日記
  • 画像処理入門講座 : OpenCVとPythonで始める画像処理 | POSTD

    この記事を書くに至ったきっかけ Recruse Centerでは、私は、画像処理の勉強に時間を費やしていました。独学をし始めた頃は、何をするものなのか全く理解しておらず、ただ、文字や輪郭、模様などを識別するのに役立ち、これらで面白いことができる、ということくらいの知識しかありませんでした。 私の情報源は、主にWikipediaや書籍、公開されている大学の講義ノートです。これらの資料に慣れ親しんでくるにつれ、画像処理の世界における基礎を伝えられる「入門向け画像処理」を望むようになりました。 これが、この記事を書こうと思ったきっかけです。 前提条件 この記事は、Pythonが扱えるということを前提に書いています。その他の事前知識は必要ありませんが、NumPyや行列計算に慣れていると理解しやすいでしょう。 初めに 使用するのは、PythonOpenCVPython 2.7 ^(1) 、iPy

    画像処理入門講座 : OpenCVとPythonで始める画像処理 | POSTD
  • [OpenCV] いまさら局所特徴量で物体検出!? - Qiita

    #1.はじめに OpenCVには,様々な処理が用意されています。画像処理,映像解析,カメラキャリブレーション,特徴点抽出,物体検出,機械学習,コンピュテーショナルフォトグラフィ,3D可視化などが基モジュールで用意されています。さらに,エクストラモジュールを追加することで,より豊富うな処理が利用できます。[1] OpenCV 3.x系を中心に話をします。 今回は,OpenCVの局所特徴量がどの程度簡単に使えるのか興味があり,局所特徴量を利用した物体検出を作成しました。 最近世間では,ディープな物体認識で盛り上がっていますが。 特徴点抽出に関する詳しい説明は,検索すれば多数ありますので,ここでは割愛します。 藤吉先生 (中部大学)のスライド「画像局所特徴量SIFTとそれ以降のアプローチ」は,とてもわかり易く説明されています。 #2.特徴点検出と特徴量記述 特徴点検出と特徴量記述は,featu

    [OpenCV] いまさら局所特徴量で物体検出!? - Qiita
  • 画像処理の数式を見て石になった時のための、金の針 - Qiita

    $k$は定数で、だいたい0.04~0.06くらいです。Rの値によって以下のように分類できます。 Rが大きい: corner Rが小さい: flat R < 0: edge 図にすると、以下のようになります。 CSE/EE486 Computer Vision I, Lecture 06, Corner Detection, p22 これで手早くcornerを検出できるようになりました。ここで、corner検出についてまとめておきます。 cornerは複数のedgeが集まる箇所と定義できる 変化量をまとめた行列の固有ベクトルからedgeの向き、固有値の大きさから変化量の大きさ(edgeらしさ)がわかる 2つの固有値の値を基に、edge、corner、flatを判定できる 固有値の計算は手間であるため、判定式を利用し計算を簡略化する なお、Harrisはedgeの向きである固有ベクトルを考慮す

    画像処理の数式を見て石になった時のための、金の針 - Qiita