このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
米ワシントン大学、米スタンフォード大学、米Adobe Researchによる研究チームが開発した「Lifespan Age Transformation Synthesis」は、1枚の顔写真から過去と未来の経年変化を推定する深層学習フレームワークだ。0歳から70歳までの頭部全体を予測する。
加齢をシミュレーションする既存手法の多くは質感の変化に限定されており、人間の老化や成長過程で生じる頭部形状の変化を見落としている。そのため、質の高い結果は得られていない。
この課題に挑戦するための理想的なモデルは、同一人物による1歳ごとのペア画像を用いて教師あり学習をすることだが、経年変化を捉えた大規模データセットは存在しないという。
今回は、1歳ごとに再現するのではなく、6つの年齢クラス(0〜2、3〜6、7〜9、15〜19、30〜39、50〜69歳)を連続的に表現することで、全年齢の変換をカバーするアプローチを採用。人の外見は年齢とともに変化するが、アイデンティティーは固定されたままであると仮定し、年齢とアイデンティティーの特徴を別々に符号化している。
Conditional GAN(敵対的生成ネットワーク) を使用し、1枚の写真から0〜70歳までの全頭部像を予測、成長過程の頭部の形状とテクスチャの両方を変化させることを学習する。
訓練データには、GAN向けの人間の顔写真データセットであるFlickr-Faces-HQから年齢、性別、セマンティックセグメンテーションをラベル付けしたものを使用。 セマンティックセグメンテーションにより、画像から背景や衣服などのアイテムを除去する。
この手法により人物のアイデンティティーと属性を維持したまま、広い範囲の年齢にわたる、現実に則した頭像を出力できるようになった。さまざまなデータセットを用いて出力を比較した結果、最新の類似技術よりも精度が高いことを示したという。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR