Self-Supervised Vision Transformer for Enhanced Virtual Clothes Try-On

Lu, Lingxiao; Wu, Shengyi; Sun, Haoxuan; Gou, Junhong; Si, Jianlou; Qian, Chen; Zhang, Jianfu; Zhang, Liqing

Computer Science > Computer Vision and Pattern Recognition

arXiv:2406.10539 (cs)

[Submitted on 15 Jun 2024]

Title:Self-Supervised Vision Transformer for Enhanced Virtual Clothes Try-On

Authors:Lingxiao Lu, Shengyi Wu, Haoxuan Sun, Junhong Gou, Jianlou Si, Chen Qian, Jianfu Zhang, Liqing Zhang

View PDF HTML (experimental)

Abstract:Virtual clothes try-on has emerged as a vital feature in online shopping, offering consumers a critical tool to visualize how clothing fits. In our research, we introduce an innovative approach for virtual clothes try-on, utilizing a self-supervised Vision Transformer (ViT) coupled with a diffusion model. Our method emphasizes detail enhancement by contrasting local clothing image embeddings, generated by ViT, with their global counterparts. Techniques such as conditional guidance and focus on key regions have been integrated into our approach. These combined strategies empower the diffusion model to reproduce clothing details with increased clarity and realism. The experimental results showcase substantial advancements in the realism and precision of details in virtual try-on experiences, significantly surpassing the capabilities of existing technologies.

Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2406.10539 [cs.CV]
	(or arXiv:2406.10539v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2406.10539

Submission history

From: Lingxiao Lu [view email]
[v1] Sat, 15 Jun 2024 07:46:22 UTC (13,248 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Self-Supervised Vision Transformer for Enhanced Virtual Clothes Try-On

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Self-Supervised Vision Transformer for Enhanced Virtual Clothes Try-On

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators