Convolutional Neural Network Compression Based on Low-Rank Decomposition

He, Yaping; Jiang, Linhao; Wu, Di

Computer Science > Computer Vision and Pattern Recognition

arXiv:2408.16289 (cs)

[Submitted on 29 Aug 2024]

Title:Convolutional Neural Network Compression Based on Low-Rank Decomposition

Authors:Yaping He, Linhao Jiang, Di Wu

View PDF

Abstract:Deep neural networks typically impose significant computational loads and memory consumption. Moreover, the large parameters pose constraints on deploying the model on edge devices such as embedded systems. Tensor decomposition offers a clear advantage in compressing large-scale weight tensors. Nevertheless, direct utilization of low-rank decomposition typically leads to significant accuracy loss. This paper proposes a model compression method that integrates Variational Bayesian Matrix Factorization (VBMF) with orthogonal regularization. Initially, the model undergoes over-parameterization and training, with orthogonal regularization applied to enhance its likelihood of achieving the accuracy of the original model. Secondly, VBMF is employed to estimate the rank of the weight tensor at each layer. Our framework is sufficiently general to apply to other convolutional neural networks and easily adaptable to incorporate other tensor decomposition methods. Experimental results show that for both high and low compression ratios, our compression model exhibits advanced performance.

Comments:	10 pages, 1 figures
Subjects:	Computer Vision and Pattern Recognition (cs.CV)
Cite as:	arXiv:2408.16289 [cs.CV]
	(or arXiv:2408.16289v1 [cs.CV] for this version)
	https://doi.org/10.48550/arXiv.2408.16289

Submission history

From: He Yaping [view email]
[v1] Thu, 29 Aug 2024 06:40:34 UTC (1,070 KB)

Computer Science > Computer Vision and Pattern Recognition

Title:Convolutional Neural Network Compression Based on Low-Rank Decomposition

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Computer Science > Computer Vision and Pattern Recognition

Title:Convolutional Neural Network Compression Based on Low-Rank Decomposition

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators