Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
第3回全日本CV勉強会 CVPR2020読み会(前編)
BSP-Net: Generating Compact Meshes via
Binary Space Partitioning
2020/07/04 takmin
自己紹介
2
株式会社ビジョン&ITラボ 代表取締役
皆川 卓也(みながわ たくや)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事(2018年法人化)
http://visitlab.jp
ビジョン
技術の町医者
AIビジネスについて、気軽に相談できる
事業内容
1. R&Dコンサルティング
2. 受託研究/開発
3. 開発マネジメント
4. 開発コンサルティング
5. ビジネス化コンサルティング
4

Recommended for you

Visual slam
Visual slamVisual slam
Visual slam

第51回コンピュータビジョン勉強会@関東「コンピュータビジョン - 広がる要素技術と応用 - 」読み会 "4.4 未知な環境下におけるカメラの位置姿勢推定"発表資料

cvsaisentancomputer visionaugmented reality
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary

Visual SLAM研究について、カメラだけでなく、RGB-DやIMUを用いた手法について、個人的に重要と思われる研究に絞って紹介しました。

computer visionslamar
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術

調べた

computer visionautonomous driving
深層学習 (Deep Learning)
5
深層学習についてのコンサルティングや開発支援などを
行います。
 画像識別
 物体検出
 領域分割
 人物姿勢推定
 画像変換
 画像生成(GAN)
 etc
Virtual Reality/Augmented Reality
6
御社がVirtual RealityやAugmented Realityを用いたビジネ
スを行う上で必要な、総合的な技術コンサルティングや開
発/プロダクトを提供します。
 特定物体認識
 Visual SLAM
 三次元スキャン
 Face Tracking
ナンバープレート認識:
License Plate Recognizer
 画像や動画からナンバープレートを読み取ります
入力画像/動画 文字+座標
License Plate
Recognizer
練馬444
ま 1564
• Web APIまたはSDKで提供可能
• SDK
• LinuxまたはWindows
• C++またはPython
• アルファベット分類番号および図柄入りナンバープレートにも対応
• GPU不要でロバストかつ高速な認識
詳解する論文
8
BSP-Net: Generating Compact
Meshes via Binary Space
Partitioning
 Chen, Z.,Tagliasacchi,A., & Zhang, H.
Best Student Paper!

Recommended for you

20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading

2018/05/27の3D Vision勉強会@関東の発表資料です。 ORB-SLAMコードリーディング

slamcomputer visionorb
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について

SfM Learner系の深度推定手法のまとめ 手法解説と派生モデルの紹介

deeplearningdepth esitimationsfm
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet

2018/07/07に開催された「コンピュータビジョン勉強会@関東 CVPR2018読み会(後編)」で発表した資料です。CVPR2018で発表されたPoint CloudをCNNで扱うための手法についてまとめ、特にSPLATNetについて詳細に解説しています。

cvprcvsaisentancomputer vision
3D Shapeの表現
9
Figure from “Occupancy Networks: Learning 3D Reconstruction in Function Space”
Voxel Point Cloud Mesh
+Simple
-Cubic Memory
-Manhattan world
+Fast and Easy
-No connectivity
-Lossy Postprocessing
+Natural
-Require Template
(topology)
-Self-intersections
3D Shapeの表現
10
Voxel Point Cloud Mesh Implicit Function
+Infinite Resolution
+Arbitrary Topologies
+Watertight Meshes
Figure from “Occupancy Networks: Learning 3D Reconstruction in Function Space”
+Simple
-Cubic Memory
-Manhattan world
+Fast and Easy
-No connectivity
-Lossy Postprocessing
+Natural
-Require Template
(topology)
-Self-intersections
3D Shapeの表現
11
陰関数(Implicit Function)をDeep Learningで表現
(いずれもCVPR2019)
 IM-NET
 Learning Implicit Fields for Generative Shape Modeling
 OccNET
 Occupancy Networks: Learning 3D Reconstruction in
Function Space
 DeepSDF
 DeepSDF: Learning Continuous Signed Distance
Functions for Shape Representation
https://www.slideshare.net/takmin/20190706cvpr20193dshaperepresentation-153989245
3D Shapeの表現
12
 3Dをレンダリングするためには、メッシュ表現が使われる
 陰関数を用いた3Dの表現では、Voxel表現に変換された後、
Marching Cube法などによってメッシュへ変換する必要がある。
 そこで、DNNを用いて直接メッシュを用いた3D表現を行う手
法を提案

Recommended for you

SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介

第6回 3D勉強会@関東 発表スライド https://3dvision.connpass.com/event/156241/

slamtesting
Dataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene UnderstandingDataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene Understanding

第35回コンピュータビジョン勉強会@関東「CVPR2016読み会(後編)」発表資料。 CVPR2016で発表された、都市交通環境のSemantic Segmentationに関する5本の論文・データセットをまとめています。 Speaker Deck版: https://speakerdeck.com/shinya7y/dataset-for-semantic-urban-scene-understanding

第2回cv勉強会@九州 LSD-SLAM
第2回cv勉強会@九州   LSD-SLAM第2回cv勉強会@九州   LSD-SLAM
第2回cv勉強会@九州 LSD-SLAM

第2回 CV勉強会@九州 ECCV'14 読み会 LSD-SLAM: Large-Scale Direct Monocular SLAM Jakob Engel, Thomas Schöps, Prof. Dr. Daniel Cremers

slamcomputer visionmonocular slam
BSP-Netによるメッシュ表現
13
 平面の組み合わせで凸多面体を表現
BSP-Netによるメッシュ表現
14
超平面:𝑎𝑥 + 𝑏𝑦 + 𝑐𝑧 + 𝑑 = 0
 特徴量𝐟からMLPで𝑝個の平面のパラメータ𝑷 𝑝×4を推定
BSP-Netによるメッシュ表現
15
 𝑐個の凸多面体𝑪を、平面𝑷の組み合わせを表す二値行列𝑻 𝑝×𝑐
BSP-Netによるメッシュ表現
16
 凸多面体𝑪の集合として3D Shapeを表現

Recommended for you

Deformable Part Modelとその発展
Deformable Part Modelとその発展Deformable Part Modelとその発展
Deformable Part Modelとその発展

文献紹介です。

三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ

Ver. 2を公開しました: https://speakerdeck.com/nnchiba/point-cloud-deep-learning-survey-ver-2 PointNet前後~ECCV2018の点群深層学習関連の論文についてまとめました. 間違いなどあればご指摘頂けるとありがたいです.

pointclouddeeplearning点群深層学習
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)

3次元点群に対するレジストレーション(位置合わせ)手法について解説する。 3次元レジストレーション手法の概要の把握。 ICP程度の手法を実装できるスキルの取得。 1. レジストレーションとは:2次元のレジストレーションの例から始めて,3次元レジストレーションの基礎を学ぶ。最小二乗法,最適化,Procrustes analysis 2. ICPとその変種:基本的なアルゴリズムであるICP(Iterative Closest Point)と,その拡張を学ぶ。ICP,Softassign,EM-ICP 3.さまざまなレジストレーション手法を学ぶ.剛体レジストレーション,非剛体レジストレーション

3d point cloud3d registrationレジストレーション
ネットワーク構造
17
ネットワーク構造
18
学習したいパラメータ
ネットワーク構造
19
ResNet(画像)
3D CNN (Voxel)
PointNet (Point Cloud)
etc
ネットワーク構造
20
𝑝個の平面

Recommended for you

[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...

2019/03/01 Deep Learning JP: http://deeplearning.jp/seminar-2/

deep learning
20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print

introduction of sfm learner (cvpr2017) and vid2depth (cvpr2018)

Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation

サーベイ論文の解説+α

computer vision
ネットワーク構造
21
𝑛個の三次元斉次座標
𝐱の各平面への符号付
き距離𝑫
ネットワーク構造
22
二値行列𝐓で𝑐個の凸
多面体への距離𝑪を計
算
ネットワーク構造
23
凸多面体への距離 𝑪の、
𝑾による重み付き和で
Shape 𝑺+
を表現
(Stage-1)
ネットワーク構造
24
凸多面体への距離𝑪の
最小値でShape 𝑺∗
を表
現(Stage-2)

Recommended for you

非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料

お仕事で作った資料。 全体紹介の資料としてはバランス悪いですが、どなたかのお役に立てれば。

computer
20160717 dikf
20160717 dikf20160717 dikf
20160717 dikf

2016/07/17 第35コンピュータビジョン勉強会@関東「CVPR2016読み会(前編)」発表資料

computer visioncvsaisentan
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization

2017/08/06に開催した第41回コンピュータビジョン勉強会@関東「CVPR2017読み会(前編)」資料です。

computer visioncvsaisentanpoint cloud
Layer2: 各凸多面体への距離算出
25
Layer2: 各凸多面体への距離算出
26
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝐱
Layer2: 各凸多面体への距離算出
27
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝐱
𝑇00
𝑇10
𝑇20
𝐷0
𝐷1
𝐷2
𝐶0
∗
(𝐱) = 𝐷1
*𝐷0, 𝐷2は負
Layer2: 各凸多面体への距離算出
28
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝐱
𝑇31 𝑇41
𝑇51
𝑇61
𝐷4
𝐷5
𝐷6
𝐶1
∗
(𝐱) = 𝐷3
*𝐷4, 𝐷5, 𝐷6は負
𝐷3

Recommended for you

ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf

2022/05/15に開催された、第10回全日本コンピュータビジョン勉強会「生成モデル縛り論文読み会」発表資料 https://kantocv.connpass.com/event/243586/

japancviclrcomputer vision
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning

2016/02/06に開催されたCV勉強会@関東「ICCV2015読み会」発表資料です。

computer visioncvsaisentaniccv
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点

MIRU2020チュートリアル講演資料

深層学習機械学習deep learning
Layer2: 各凸多面体への距離算出
29
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝐱
Layer2: 各凸多面体への距離算出
30
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝑇00
𝑇10
𝑇20
𝐷0
𝐷1
𝐷2
𝐶0
∗
(𝐱) = 𝐷1
*𝐷0, 𝐷1, 𝐷2は負
𝐱
Layer2: 各凸多面体への距離算出
31
𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗
𝑇31 𝑇41
𝑇51
𝑇61
𝐷4
𝐷5
𝐷6
𝐶1
∗
(𝐱) = 𝐷3
*𝐷4, 𝐷5 は負
𝐷3
𝐱
Layer2: 学習のためmax-poolingの緩和
32
 𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗 (1)
 𝐱が凸多面体の外の場合は正、内の場合は負
 学習時、勾配がmaxを取った超平面にしか伝播されない

Recommended for you

パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩

パターン認識モデル初歩の初歩

pattern recognitionstatisticsr
20170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.520170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.5

2017年4月8日開催のコンピュータビジョン勉強会@関東「最先端ガイド6第2章 幾何学的推定のための最適化手法:最小化を超えて」発表資料

cvsaisentancomputer vision
大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法

機械学習などに現われる大規模凸計画に対する近接勾配法,射影勾配法などの勾配型手法についての解説 2011年 情報論的学習理論ワークショップ 講演資料 京都大学大学院情報学研究科 数理工学専攻 最適化数理分野(研究室) http://www-optima.amp.i.kyoto-u.ac.jp

データマイニングproximal gradient methodfista
Layer2: 学習のためmax-poolingの緩和
33
 𝐶𝑗
∗
(𝐱) = max
𝑖
𝐷𝑖 𝑇𝑖𝑗 (1)
 𝐱が凸多面体の外の場合は正、内の場合は負
 学習時、勾配がmaxを取った超平面にしか伝播されない
 𝐶𝑗
+
(𝐱) = σ𝑖 relu 𝐷𝑖 𝑇𝑖𝑗 (2)
 𝐱が凸多面体の外の場合は正、内の場合はゼロ
 学習効率を高めるため、𝐶𝑗
∗
(𝐱)の条件を緩和
Layer2: 各凸多面体への距離算出
34
𝐶𝑗
+
(𝐱) = ෍
𝑖
relu 𝐷𝑖 𝑇𝑖𝑗
𝐱
Layer2: 各凸多面体への距離算出
35
𝐶𝑗
+
(𝐱) = ෍
𝑖
relu 𝐷𝑖 𝑇𝑖𝑗
𝑇00
𝑇10
𝑇20
𝐷0
𝐷1
𝐷2
𝐶0
+
(𝐱) = 0
*𝐷0, 𝐷1, 𝐷2は負
𝐱
Layer2: 各凸多面体への距離算出
36
𝐶𝑗
+
(𝐱) = ෍
𝑖
relu 𝐷𝑖 𝑇𝑖𝑗
𝑇31 𝑇41
𝑇51
𝑇61
𝐷4
𝐷5
𝐷6
𝐶1
+
(𝐱) = 𝐷3 + 𝐷6
*𝐷4, 𝐷5 は負
𝐷3
𝐱

Recommended for you

Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2

Semantic Segmentationのサーベイ その2

cityscapes benchmarkcomputer visioninstance level segmentation
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介

第7回ADVENTURE定期セミナー発表資料

adventure定期セミナー
Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出

Hough forestを用いた物体検出

Layer3: 凸多面体を座標𝐱へ割り当て
37
Layer3: 凸多面体を座標𝐱へ割り当て
38
 𝑆∗(𝐱) = min
𝑗
𝐶𝑗
+
(𝐱) (3)
 𝐱が凸多面体の外の場合は正、内の場合はゼロ
 学習時、勾配がminを取った凸多面体にしか伝播されない
Layer3: 凸多面体を座標𝐱へ割り当て
39
 𝑆∗(𝐱) = min
𝑗
𝐶𝑗
+
(𝐱) (3)
 𝐱が凸多面体の外の場合は正、内の場合はゼロ
 学習時、勾配がminを取った凸多面体にしか伝播されない
 𝑆+(𝐱) = σ 𝑗 𝑊𝑗 1 − 𝐶𝑗
+
(𝐱)
0,1 0,1
(4)
 ∙ 0,1 :クリッピング, 𝐖 ≈ 1
 学習効率を高めるため、 𝑆∗
(𝐱)の条件を緩和
 𝐱が凸多面体の外の場合は[0,1) 、内の場合は1となるよう
に学習
Layer3: 凸多面体を座標𝐱へ割り当て
40
𝐶0
+
(𝐱) = 0
𝐱
𝑆∗(𝐱) = min
𝑗
𝐶𝑗
+
(𝐱)
𝐶1
+
(𝐱) = 𝐷3 + 𝐷6
𝑆∗(𝐱) = 𝐶0
+
(𝐱) = 0
座標𝐱から最も近い凸多面体までの距離

Recommended for you

Rを用いたGIS
Rを用いたGISRを用いたGIS
Rを用いたGIS

Rを用いたGISの講習資料です。

rgis
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法

SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法 6月10日 (木) 11:00 - 12:30 メイン会場(vimeo + sli.do) 登壇者:松井 孝太 氏(名古屋大学) 概要:転移学習とは、解きたいタスクに対して、それと異なるが似ている他のタスクからの知識(データ、特徴、モデルなど)を利用するための方法を与える機械学習のフレームワークです。深層モデルの学習方法として広く普及している事前学習モデルの利用は、この広義の転移学習の一つの実現形態とみなせます。本発表では、まず何をいつ転移するのか (what/when to transfer) といった転移学習の基本概念と定式化を説明し、具体的な転移学習の主要なアプローチとしてドメイン適応、メタ学習について解説します。

 
by SSII
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven exploration

2018/02/04 第44回CV勉強会「強化学習論文読み会」発表資料です。”Curiosity-driven Exploration by Self-supervised Prediction”

machine learningreinforcement learningcvsaisentan
Layer3: 凸多面体を座標𝐱へ割り当て
41
𝐶0
+
(𝐱) = 0
𝐱
𝑆+
(𝐱) = ෍
𝑗
𝑊𝑗 1 − 𝐶𝑗
+
(𝐱)
0,1
0,1
𝐶1
+
(𝐱) = 𝐷3 + 𝐷6
𝑆+
𝐱 = 𝑊0 1 − 𝐶0
+
𝐱 0,1 + 𝑊1 1 − 𝐶1
+
𝐱 0,1 0,1
= 𝑊0 + 𝑊1 1 − 𝐷3 − 𝐷6 0,1 0,1
𝑆∗を重み𝐖𝑐×1で緩和
連続と離散の2-Stage学習
42
Training Stage 1 – Continuous
 超平面を推定するパラメータ 𝜔と、凸多面体を構成する
超平面の組み合わせ 𝐓を学習し、 𝑆+
(𝐱)を最適化
 𝐓は二値行列ではなく、連続値として学習
連続と離散の2-Stage学習
43
Training Stage 1 – Continuous
 超平面を推定するパラメータ 𝜔と、凸多面体を構成する
超平面の組み合わせ 𝐓を学習し、 𝑆+
(𝐱)を最適化
 𝐓は二値行列ではなく、連続値として学習
Training Stage 2 – Discrete
 𝐓を閾値 𝜆で二値化し固定
 超平面を推定するパラメータ 𝜔のみ学習し、 𝑆∗
(𝐱)を最適
化
連続と離散の2-Stage学習
44
Training Stage 1 – Continuous
 超平面を推定するパラメータ 𝜔と、凸多面体を構成する
超平面の組み合わせ 𝐓を学習し、 𝑆+
(𝐱)を最適化
 𝐓は二値行列ではなく、連続値として学習
(5)
3D座標𝐱の3D Shape内外判定
をGround Truthと一致させる項
行列𝐓の各要素に0から1の間を取
らせるための正規化項
𝐖 ≈ 1とするための正規化項
argmin
𝜔,𝐓,𝐖
ℒrec
+
+ ℒ 𝐓
+
+ ℒ 𝐖
+

Recommended for you

点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study

cvpaper.challenge2019のMeta Study Groupでの発表スライド 点群深層学習についてのサーベイ ( https://www.slideshare.net/naoyachiba18/ss-120302579 )を経た上でのMeta Study

pointclouddeeplearning点群深層学習
Taking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmTaking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional Algorithm

2019/02/23 3D勉強会@関東の発表資料です

畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開 畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開

映像情報メディア学会メディア工学研究会 日時:2020年5月28日(木) 10:50~11:40 題目:[特別講演]畳み込みネットワークによる高次元信号復元と異分野融合への展開 ~ スパースモデリングと畳み込み辞書学習 ~

スパースモデリングフィルタバンク信号処理
連続と離散の2-Stage学習
45
Training Stage 1 – Continuous
 超平面を推定するパラメータ 𝜔と、凸多面体を構成する
超平面の組み合わせ 𝐓を学習し、 𝑆+
(𝐱)を最適化
 𝐓は二値行列ではなく、連続値として学習
(5)argmin
𝜔,𝐓,𝐖
ℒrec
+
+ ℒ 𝐓
+
+ ℒ 𝐖
+
ℒrec
+
= Ε 𝐱~G 𝑆+
𝐱 − 𝐹(𝐱|G) 2
𝐱が凸多面体の外の場合
は[0,1) 、内の場合は1
𝐱が凸多面体の外の場
合は0 、内の場合は1
G : Ground Truth
連続と離散の2-Stage学習
46
Training Stage 2 – Discrete
 𝐓を閾値 𝜆 = 0.01で二値化
 特徴量 𝐟から超平面を推定するパラメータ 𝜔のみ学習し、
𝑆∗(𝐱)を最適化
(9)argmin
𝜔
ℒrecon
∗ + ℒoverlap
∗
3D座標𝐱の3D Shape内外判定
をGround Truthと一致させる項
凸多面体の重複を避ける
ための項
連続と離散の2-Stage学習
47
Training Stage 2 – Discrete
 𝐓を閾値 𝜆 = 0.01で二値化
 特徴量 𝐟から超平面を推定するパラメータ 𝜔のみ学習し、
𝑆∗(𝐱)を最適化
(9)argmin
𝜔
ℒrecon
∗ + ℒoverlap
∗
ℒrecon
∗ = Ε 𝐱~G 𝐹(𝐱|G) ∙ max 𝑆∗ 𝐱 , 0
+Ε 𝐱~G 1 − 𝐹(𝐱|G) ∙ 1 − min 𝑆∗ 𝐱 , 1
𝑆∗
𝐱 : 𝐱が凸多面体の外の場合は> 0 、内の場合は0
𝐹 𝐱 G : 𝐱が凸多面体の外の場合は0 、内の場合は1
連続と離散の2-Stage学習
48
Training Stage 2 – Discrete
 𝐓を閾値 𝜆 = 0.01で二値化
 特徴量 𝐟から超平面を推定するパラメータ 𝜔のみ学習し、
𝑆∗(𝐱)を最適化
(9)argmin
𝜔
ℒrecon
∗ + ℒoverlap
∗
ℒrecon
∗ = Ε 𝐱~G 𝐹(𝐱|G) ∙ max 𝑆∗ 𝐱 , 0
+Ε 𝐱~G 1 − 𝐹(𝐱|G) ∙ 1 − min 𝑆∗ 𝐱 , 1
𝑆∗
𝐱 : 𝐱が凸多面体の外の場合は> 0 、内の場合は0
𝐹 𝐱 G : 𝐱が凸多面体の外の場合は0 、内の場合は1
多面体内のLoss

Recommended for you

Kantocv 2-1-calibration publish
Kantocv 2-1-calibration publishKantocv 2-1-calibration publish
Kantocv 2-1-calibration publish

コンンピュータビジョン―広がる要素技術と応用― 第2章カメラキャリブレーション 2.1章 カメラキャリブレーションとは

cvsaisentanopencvcamera calibration
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開

MIRU2016 でのチュートリアル講演のスライドです。深層学習フレームワークの一般的な構成から、Chainer の解説、深層学習における OSS 開発の例と学生・研究者がそこにどのように関わっていくかについて書いています。

machine learningdeep learning
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」

第5回3D勉強会@関東 論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」

連続と離散の2-Stage学習
49
Training Stage 2 – Discrete
 𝐓を閾値 𝜆 = 0.01で二値化
 特徴量 𝐟から超平面を推定するパラメータ 𝜔のみ学習し、
𝑆∗(𝐱)を最適化
(9)argmin
𝜔
ℒrecon
∗ + ℒoverlap
∗
ℒrecon
∗ = Ε 𝐱~G 𝐹(𝐱|G) ∙ max 𝑆∗ 𝐱 , 0
+Ε 𝐱~G 1 − 𝐹(𝐱|G) ∙ 1 − min 𝑆∗ 𝐱 , 1
𝑆∗
𝐱 : 𝐱が凸多面体の外の場合は> 0 、内の場合は0
𝐹 𝐱 G : 𝐱が凸多面体の外の場合は0 、内の場合は1
多面体外のLoss
連続と離散の2-Stage学習
50
Training Stage 2 – Discrete
 𝐓を閾値 𝜆 = 0.01で二値化
 特徴量 𝐟から超平面を推定するパラメータ 𝜔のみ学習し、
𝑆∗(𝐱)を最適化
(9)argmin
𝜔
ℒrecon
∗ + ℒoverlap
∗
𝑆∗
𝐱 : 𝐱が凸多面体の外の場合は> 0 、内の場合は0
𝑀 𝐱 : 𝐱が1つ以上の凸多面体の内の場合は1
ℒoverlap
∗
= −Ε 𝐱~G 𝑀(𝐱)𝑆∗
𝐱
実験で使用したパラメータ
51
 2D
 直線数: p=256
 凸多角形数: c=64
 encoder: ResNet-18
 3D
 平面数: p=4096
 凸多面体数: c=256
 encoder: 3D CNN (for voxel data)
Auto-encoding 2D shapes
52
 2Dの合成画像データセット
 64x64画像上に左から四角、クロス、中空の四角を並べた画
像
 Stage-2の方が1よりも良い結果
 Overlap Lossがコンパクトな表現に寄与

Recommended for you

オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)

第34回全脳アーキテクチャ若手の会 勉強会「実世界応用のための深層学習」with エクサウィザーズ の発表資料です。オープンセット認識、オープンワールド認識の基礎と代表的手法を紹介しています。 https://wbawakate.connpass.com/event/80290/

machine learning
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras

第61回コンピュータビジョン勉強会@関東「CVPR2024読み会」(前編)発表資料 https://kantocv.connpass.com/event/321174/

computer visioncvprcvsaisentan
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)

IoT縛りの勉強会! IoTLT vol.112 @FIXER https://iotlt.connpass.com/event/320609/ 発表資料

iot
Auto-encoding 2D shapes
53
 凸多面体を表現するために使用された平面の例
Auto-encoding 3D Shapes
54
3D Shapeを入力とし、メッシュ生成
 ShapeNet (Part) Dataset
 air-plane, car, chair, lamp, tableの5クラス
 1クラスごとに1モデル学習
 以下のパフォーマンスを評価
 Reconstruction
 Segmentation
Auto-encoding 3D Shapes
55
パーツへ分割する既存研究と比較
 Volumetric Primitives (VP)
 Tulsiani, S., Su, H., Guibas, L. J., Efros,A.A., & Malik, J. (2017). Learning
shape abstractions by assembling volumetric primitives. In Conference on
ComputerVision and Pattern Recognition.
 3D ShapeをPrimitive Shapeの集合で表現
 Super Quadrics (SQ)
 Paschalidou, D., Ulusoy,A. O., & Geiger,A. (2019). Superquadrics revisited:
Learning 3D shape parsing beyond cuboids. IEEE Conference on Computer
Vision and Pattern Recognition, 2019-June, 10336–10345.
 3D Shapeを超楕円体 (Super Quadrics)の集合で表現
 Branched Auto Encoders (BAE)
 Chen, Z.,Yin, K., Fisher, M., Chaudhuri, S., & Zhang, H. (2019). BAE-NET :
Branched Autoencoder for Shape Co-Segmentation. In International
Conference on ComputerVision.
 3D Shapeを陰関数で表現したパーツの集合で表現
Auto-encoding 3D Shapes
56
 Semantic Segmentationの結果
 GroundTruthについたパーツごとのラベル情報を元に投票
 同じSemanticの凸多面体をグルーピングして色付け

Recommended for you

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture

2024年3月3日開催 第12回全日本コンピュータビジョン勉強会(JapanCV)「データセット関連読み会」の発表資料です。 https://kantocv.connpass.com/event/307177/ Machine Learning Operations (MLOps): Overview, Definition, and Architecture 読みました。 https://arxiv.org/abs/2205.02302

computer visionkantocvmlops
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF

第59回コンピュータビジョン勉強会@関東「CVPR2023読み会(前編)」発表資料 https://kantocv.connpass.com/event/288899/

cvsaisentancomputer visionnerf
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ

主に点群に対してSemantic Segmentationを行うことを目的としてTransformerを適用した研究のサーベイ

transformerpoint cloudcomputer vision
Auto-encoding 3D Shapes
57
 SegmentationとReconstruction結果の比較
Auto-encoding 3D Shapes (定量評価)
58
 Surface Reconstructionの定量評価
 Chamfer Distance (CD)
 Normal Consistency (NC)
 Light Field Distance (LFD)
Auto-encoding 3D Shapes (定量評価)
59
 Segmentationの定量評価
 ラベルごとのIoU
Single View Reconstruction (SVR)
60
1枚の画像から3次元モデル生成
 ShapeNetの1000以上の形状から3D-R2N2という手法を
用いてViewを描画
 1つのモデルですべてのカテゴリを学習

Recommended for you

Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems

2022/08/07に開催された第11回全日本コンピュータビジョン勉強会「CVPR2022読み会」(前編)で発表した資料です。 https://kantocv.connpass.com/event/253622/

computer visioncvprjapancv
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事

2021/10/09にPRMUとの共催で開催された第8回全日本コンピュータビジョン勉強会(JapanCV)「コンピュータビジョンのお仕事」の発表資料です。

computer visionkantocvnagoyacv
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P

This document summarizes a paper titled "DeepI2P: Image-to-Point Cloud Registration via Deep Classification". The paper proposes a method for estimating the camera pose within a point cloud map using a deep learning model. The model first classifies whether points in the point cloud fall within the camera's frustum or image grid. It then performs pose optimization to estimate the camera pose by minimizing the projection error of inlier points onto the image. The method achieves more accurate camera pose estimation compared to existing techniques based on feature matching or depth estimation. It provides a new approach for camera localization using point cloud maps without requiring cross-modal feature learning.

computer visioncvprjapancv
Single View Reconstruction (SVR)
61
以下の手法と比較
 Atlasnet
 Groueix,T., Fisher, M., Kim,V. G., Russell, B. C., & Aubry, M. (2018).A
Papier-Mache Approach to Learning 3D Surface Generation. In
Conference on ComputerVision and Pattern Recognition.
 OccNet
 Mescheder, L., Oechsle, M., Niemeyer, M., Nowozin, S., & Geiger,A.
(2019). Occupancy Networks: Learning 3D Reconstruction in
Function Space. Conference on ComputerVision and Pattern Recognition.
 IM-NET
 Chen, Z. (2019). Learning Implicit Fields for Generative Shape
Modeling. Conference on ComputerVision and Pattern Recognition.
Single View Reconstruction (SVR)
62
 定量評価
 Atlas0: 1つの球形パッチ使用
 Atlas25: 25個の正方形パッチを使用
Single View Reconstruction (SVR)
63
 全カテゴリでの平均
 #V: 頂点数
 #F: 三角メッシュ数
Single View Reconstruction (SVR)
64
 同じSemanticを持つパートを色付けした例

Recommended for you

20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)

2020/09/10 12:00-(日本時間)に開催されたJPTA Tech Talk講演資料 https://www.meetup.com/ja-JP/JTPA-Japanese-Technology-Professionals-Association/events/272748322/ 深層学習がコンピュータビジョンの世界をどう変えたか

computer visiondeep learningjpta
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv

第50回コンピュータビジョン勉強会@関東「CVで使えるツールLT大会2」発表資料です。

computer visioncvsaisentandeep learning
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam

第一回AI Code Review発表資料

slamcomputer visionaugmented reality
結論と課題
65
 凸多面体の集合として、3Dメッシュを生成するBSP-Netを
提案
 平面の集合として凸多面体を学習
 既存手法と比較し、定量的な性能を落とすことなく、
シャープな形状を表現できるなど、定性的に優れている
 凸多面体の集合で表せないような形状(例:コーヒーカッ
プのような凹面を持つもの)は苦手
 推論は早いが学習は遅い
 SVRタスクですべてのカテゴリを学習するのにRTX2080Tiで6
日

More Related Content

What's hot

20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
Takuya Minagawa
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
Takuya Minagawa
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
Takuya Minagawa
 
Visual slam
Visual slamVisual slam
Visual slam
Takuya Minagawa
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
Takuya Minagawa
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
Takuya Minagawa
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
Takuya Minagawa
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
Ryutaro Yamauchi
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
Takuya Minagawa
 
SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介
miyanegi
 
Dataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene UnderstandingDataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene Understanding
Yosuke Shinya
 
第2回cv勉強会@九州 LSD-SLAM
第2回cv勉強会@九州   LSD-SLAM第2回cv勉強会@九州   LSD-SLAM
第2回cv勉強会@九州 LSD-SLAM
Satoshi Fujimoto
 
Deformable Part Modelとその発展
Deformable Part Modelとその発展Deformable Part Modelとその発展
Deformable Part Modelとその発展
Takao Yamanaka
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
Toru Tamaki
 
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
Deep Learning JP
 
20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print
KUMIKO Suzuki
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
Takuya Minagawa
 
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
Takuya Minagawa
 
20160717 dikf
20160717 dikf20160717 dikf
20160717 dikf
Takuya Minagawa
 

What's hot (20)

20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介
 
Dataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene UnderstandingDataset for Semantic Urban Scene Understanding
Dataset for Semantic Urban Scene Understanding
 
第2回cv勉強会@九州 LSD-SLAM
第2回cv勉強会@九州   LSD-SLAM第2回cv勉強会@九州   LSD-SLAM
第2回cv勉強会@九州 LSD-SLAM
 
Deformable Part Modelとその発展
Deformable Part Modelとその発展Deformable Part Modelとその発展
Deformable Part Modelとその発展
 
三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
 
20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print20180929 sfm learner&vid2_depth_print
20180929 sfm learner&vid2_depth_print
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料非技術者でもわかる(?)コンピュータビジョン紹介資料
非技術者でもわかる(?)コンピュータビジョン紹介資料
 
20160717 dikf
20160717 dikf20160717 dikf
20160717 dikf
 

Similar to 20200704 bsp net

20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
Takuya Minagawa
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
Takuya Minagawa
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
Takuya Minagawa
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
Taiji Suzuki
 
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
t_ichioka_sg
 
20170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.520170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.5
Takuya Minagawa
 
大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法
京都大学大学院情報学研究科数理工学専攻
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
Takuya Minagawa
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTURE Project
 
Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出
MPRG_Chubu_University
 
Rを用いたGIS
Rを用いたGISRを用いたGIS
Rを用いたGIS
Mizutani Takayuki
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII
 
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven exploration
Takuya Minagawa
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study
Naoya Chiba
 
Taking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmTaking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional Algorithm
Mai Nishimura
 
畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開 畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開
Shogo Muramatsu
 
Kantocv 2-1-calibration publish
Kantocv 2-1-calibration publishKantocv 2-1-calibration publish
Kantocv 2-1-calibration publish
tomoaki0705
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開
Seiya Tokui
 
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
Naoya Chiba
 
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
Takuma Yagi
 

Similar to 20200704 bsp net (20)

20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
 
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
 
20170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.520170408cvsaisentan6 2 4.3-4.5
20170408cvsaisentan6 2 4.3-4.5
 
大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法大規模凸最適化問題に対する勾配法
大規模凸最適化問題に対する勾配法
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
Hough forestを用いた物体検出
Hough forestを用いた物体検出Hough forestを用いた物体検出
Hough forestを用いた物体検出
 
Rを用いたGIS
Rを用いたGISRを用いたGIS
Rを用いたGIS
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
Curiosity driven exploration
Curiosity driven explorationCuriosity driven exploration
Curiosity driven exploration
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study
 
Taking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional AlgorithmTaking a Deeper Look at the Inverse Compositional Algorithm
Taking a Deeper Look at the Inverse Compositional Algorithm
 
畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開 畳み込みネットワークによる高次元信号復元と異分野融合への展開
畳み込みネットワークによる高次元信号復元と異分野融合への展開
 
Kantocv 2-1-calibration publish
Kantocv 2-1-calibration publishKantocv 2-1-calibration publish
Kantocv 2-1-calibration publish
 
深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開深層学習フレームワーク Chainer の開発と今後の展開
深層学習フレームワーク Chainer の開発と今後の展開
 
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
 
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
 

More from Takuya Minagawa

第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
Takuya Minagawa
 
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)
Takuya Minagawa
 
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Takuya Minagawa
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
Takuya Minagawa
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
Takuya Minagawa
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
Takuya Minagawa
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
Takuya Minagawa
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
Takuya Minagawa
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
Takuya Minagawa
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
Takuya Minagawa
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
Takuya Minagawa
 

More from Takuya Minagawa (12)

第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
第61回CV勉強会「CVPR2024読み会」(前編)発表資料:State Space Models for Event Cameras
 
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT  vol112 発表資料)
ろくに電子工作もしたことない人間がIoT用ミドルウェアを作った話(IoTLT vol112 発表資料)
 
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
 
「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
 

Recently uploaded

MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
iPride Co., Ltd.
 
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
 
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
Tatsuya Ishikawa
 
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
Fast Retailing Co., Ltd.
 
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
Toru Tamaki
 
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
company21
 
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツールMOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
TsuyoshiSaito7
 
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
嶋 是一 (Yoshikazu SHIMA)
 
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
TsuyoshiSaito7
 
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
Tetsuya Nihonmatsu
 
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
NTT DATA Technology & Innovation
 
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
Hironori Washizaki
 

Recently uploaded (12)

MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
MySQLの文字コードと照合順序について 2024/07/05の勉強会で発表されたものです。
 
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PostGISの落とし穴 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
 
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
2024/07/04 Blazor+ローコードで実現する.NET資産のモダナイズ
 
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
内製化 × グローバル化を通じた 世界水準の IT 組織づくり - ファーストリテイリング・デジタル変革の挑戦
 
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
論文紹介:Coarse-to-Fine Amodal Segmentation with Shape Prior
 
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
VRM*VOICEVOX*GoogleCloudを使って自分だけのAIパートナーを作る話
 
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツールMOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
MOSHI: 革新的な音声AI QAIが開発した次世代のコミュニケーションツール
 
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
第10回 Gen AI 勉強会「人材育成・教育WG活動報告」とChatGPTでピアノライブ♪
 
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
【GPT4-o越えのリアルタイム会話AI】kyutai labsのMoshiデモ動画を解説
 
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
能動的サイバー防御の時代へ - GPTsから垣間見えた私達と未来のAIについて
 
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
pg_stat_activityの不可解な観測結果の謎 (第47回 PostgreSQLアンカンファレンス@オンライン 発表資料)
 
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
「スマートエスイー」におけるスマートシステム&サービスおよびDX推進人材の産学連携育成ならびに参照モデルに基づく育成プログラム分析
 

20200704 bsp net