Wav2Vec2 Finetuning for Music Genre Classification

A small, end-to-end project that finetunes a Hugging Face Wav2Vec2 model on the classic GTZAN dataset to classify music genres.

Highlights

Self-supervised Wav2Vec2 finetuned for 10 GTZAN genres
Best validation accuracy: 87%
Training with transformers.Trainer (HF)
Gradio web UI to upload an audio file and get predictions

Quickstart: Inference with the Hub

from transformers import pipeline

model_id = "hangnguyen25/wav2vec2-base-finetuned-gtzan"
pipe = pipeline(
    "audio-classification",
    model=model_id
    )

preds = pipe("path/to/your/audio.wav")
print(preds)

Acknowledgements

Dataset: GTZAN
Libraries: Hugging Face transformers, datasets, evaluate, accelerate; librosa; gradio; PyTorch

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
demo.py		demo.py
music_genre_classifier_finetuning_pretrained_model.ipynb		music_genre_classifier_finetuning_pretrained_model.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Wav2Vec2 Finetuning for Music Genre Classification

Highlights

Quickstart: Inference with the Hub

Acknowledgements

About

Uh oh!

Releases

Packages

Languages

hangngdata/music_genre_classifier

Folders and files

Latest commit

History

Repository files navigation

Wav2Vec2 Finetuning for Music Genre Classification

Highlights

Quickstart: Inference with the Hub

Acknowledgements

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages