ICASSP'22 Training Strategies for Improved Lip-Reading; ICASSP'21 Towards Practical Lipreading with Distilled and Efficient Models; ICASSP'20 Lipreading using Temporal Convolutional Networks

Python 388 100 Updated May 18, 2023

pyannote / pyannote-audio

Neural building blocks for speaker diarization: speech activity detection, speaker change detection, overlapped speech detection, speaker embedding

Jupyter Notebook 6,163 764 Updated Oct 18, 2024

kamalesh0406 / Audio-Classification

Pytorch code for "Rethinking CNN Models for Audio Classification"

Python 122 30 Updated Mar 25, 2021

kevinkwshin / Audio-Classifier

CNN based audio classifier by pytorch (LeNet / VGG / ResNet)

Jupyter Notebook 7 1 Updated Dec 6, 2019

Ryuk17 / SpeechAlgorithms

You can find the speech algorithms you want here

C 749 245 Updated Oct 21, 2024

wq2012 / awesome-diarization

A curated list of awesome Speaker Diarization papers, libraries, datasets, and other resources.

1,594 225 Updated Oct 16, 2024

Rehan-Ahmad / MultimodalDiarization

Multimodal speaker diarization using pre-trained audio-visual synchronization model

Python 9 6 Updated May 12, 2020

vicolab / ml-pyxis

Tool for reading and writing datasets of tensors in a Lightning Memory-Mapped Database (LMDB). Designed to manage machine learning datasets with fast reading speeds.

Python 117 17 Updated Sep 18, 2020

tjmoon0104 / Tiny-ImageNet-Classifier

Tiny-ImageNet Classifier using Pytorch

Jupyter Notebook 82 28 Updated Nov 1, 2018

iariav / End-to-End-VAD

an Audio-Visual Voice Activity Detection using Deep Learning

Python 48 11 Updated Apr 7, 2019

Xflick / EEND_PyTorch

A PyTorch implementation of End-to-End Neural Diarization

Python 98 15 Updated Jun 19, 2023

gcunhase / AMICorpusXML

Extracts Transcript and Summary (Abstractive and Extractive) from the AMI Meeting Corpus

Python 52 30 Updated Dec 4, 2019

Eurus-Holmes / Awesome-Multimodal-Research

A curated list of Multimodal Related Research.

Python 1,306 150 Updated Aug 5, 2023

visionshao / LSTM-CRF

implement of LSTM+CRF with pytorch

Python 44 8 Updated Jul 9, 2020

yaohungt / Gated-Spatio-Temporal-Energy-Graph

[CVPR'19] [PyTorch] Gated Spatio Temporal Energy Graph

Python 151 25 Updated Feb 20, 2020

Scalsol / mega.pytorch

Memory Enhanced Global-Local Aggregation for Video Object Detection, CVPR2020

Python 566 115 Updated May 13, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

melttt melttt

Achievements

Achievements

Block or report melttt

Stars

melttt / parse_algorithm

steveLauwh / SGI-STL

lishuhuakai / Parser

Cpp-Club / Cxx_HOPL4_zh

nttcslab-sp / EEND-vector-clustering

dorairajsanjay / hmm_tutorial

wq2012 / VB_diarization

BUTSpeechFIT / VBx

okankop / ASDNet

clovaai / voxceleb_trainer

nryant / dscore

abewley / sort

m-lyon / face-comparison

locuslab / TCN

mpc001 / Lipreading_using_Temporal_Convolutional_Networks