WorkoutTracker - AI-Powered Exercise Recognition

An intelligent workout tracking system that uses computer vision and machine learning to automatically detect and count exercise repetitions in real-time videos.

�� Overview

WorkoutTracker combines MediaPipe pose detection with a Temporal Convolutional Network (TCN) to perform two main tasks:

Exercise Classification: Identify the type of exercise (push-ups, squats, pull-ups, dips, no-exercise)
Repetition Segmentation: Detect and count individual repetitions within the exercise

🏗️ Architecture

Data Pipeline

Raw Videos → MediaPipe pose extraction → Joint angle features
Manual Labels → CSV files with repetition start markers
Gaussian Augmentation → Smooth temporal labels around rep markers
Multitask Dataset → Combined features + classification + segmentation labels

Model Architecture

TCN Backbone: 8-layer temporal convolutional network with residual connections
Multi-Head Attention: Captures global temporal dependencies
Dual Outputs: Classification head + segmentation head
Balanced Training: Focal loss with class balancing for better recall

📁 Project Structure

WorkoutTracker/
├── data/
│   ├── raw/                    # Original exercise videos
│   │   ├── push-ups/          # Push-up videos
│   │   ├── squats/            # Squat videos
│   │   ├── pull-ups/          # Pull-up videos
│   │   ├── dips/              # Dip videos
│   │   └── no-exercise/       # Non-exercise videos
│   ├── labels/                # Manual CSV labels
│   │   ├── push-ups/          # Push-up labels
│   │   ├── squats/            # Squat labels
│   │   ├── pull-ups/          # Pull-up labels
│   │   ├── dips/              # Dip labels
│   │   └── no_exercise/       # No-exercise labels
│   └── processed/             # Generated datasets
│       └── multitask_dataset.npz
├── models/                    # Trained models
│   └── main/                  # Current best model
│       ├── main.keras         # Model weights
│       └── training_history.npy
├── src/
│   ├── core/                  # Dataset building
│   │   ├── dataset_builder.py
│   │   └── improved_dataset_builder.py
│   ├── training/              # Model training
│   │   ├── trainer.py
│   │   ├── model.py
│   │   └── balanced_generator.py
│   ├── demo/                  # Demo applications
│   │   ├── demo.py
│   │   └── live/
│   └── utils/                 # Utilities
│       ├── video_labeler.py
│       └── csv_format_converter.py
├── demo_output/               # Demo results
└── requirements.txt

🚀 Quick Start

1. Setup Environment

# Clone the repository
git clone <repository-url>
cd WorkoutTracker

# Create virtual environment
python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

# Install dependencies
pip install -r requirements.txt

2. Prepare Data

Place your exercise videos in the appropriate directories:

data/raw/push-ups/ - Push-up videos
data/raw/squats/ - Squat videos
data/raw/pull-ups/ - Pull-up videos
data/raw/dips/ - Dip videos
data/raw/no-exercise/ - Non-exercise videos

3. Label Your Data

Use the video labeling tool to create CSV files with repetition markers:

python src/utils/video_labeler.py data/raw/push-ups/video1.mp4

This creates data/labels/push-ups/video1.csv with frame-by-frame labels.

4. Build Dataset

Create the dataset from your labeled videos:

python build_dataset.py

This generates data/processed/multitask_dataset.npz with:

Features: (N, 30, 25) - 30-frame windows of 25 joint angles
Classification labels: (N,) - Exercise type (0-4)
Segmentation labels: (N, 30) - Per-frame repetition probability

5. Train Model

Train the model:

python train.py

This creates models/main/main.keras with the trained model.

6. Run Demos

Video Analysis Demo

Analyze a video and generate results:

python src/demo/demo.py --video data/test_videos/test0.mp4 --output demo_output

Live Demo

Real-time exercise detection from webcam:

cd src/demo/live
./start_live_demo.sh

📊 Dataset Details

Multitask Dataset Creation

The multitask_dataset.npz is created by:

Feature Extraction: MediaPipe pose detection → 25 joint angles per frame
Temporal Windowing: 30-frame sliding windows (1 second at 30 FPS)
Label Augmentation: Gaussian smoothing around repetition markers
Class Balancing: Includes no-exercise samples for better generalization

Label Augmentation

Instead of binary 0/1 labels, we use Gaussian augmentation:

Center (rep start): Probability = 1.0
±4 frames: Probability = 0.5
±12 frames: Probability ≈ 0.1
Creates smooth temporal patterns for better training

Dataset Statistics

Total Sequences: ~46,700
Window Size: 30 frames (1 second)
Features: 25 joint angles per frame
Classes: 5 (push-ups, squats, pull-ups, dips, no-exercise)
Positive Samples: ~9.9% (repetition frames)

🧠 Model Details

Architecture

Input: (batch_size, 30, 25) - 30 frames × 25 joint angles
TCN Backbone: 8 residual blocks with dilated convolutions
Attention: Multi-head attention for global temporal dependencies
Outputs:
- Classification: 5 classes (softmax)
- Segmentation: 30 probabilities (sigmoid)

Training Configuration

Optimizer: Adam (lr=5e-4)
Loss: Focal Loss (γ=1.0, α=0.5) + Binary Crossentropy
Balanced Sampling: 20% positive, 80% negative samples
Augmentation: Gaussian label smoothing
Regularization: Dropout (0.25), Early stopping (patience=20)

🎮 Demo Applications

1. Video Analysis Demo (`src/demo/demo.py`)

Analyzes pre-recorded videos and generates:

Annotated video with detected repetitions
Analysis plot showing exercise classification and repetition detection
Repetition count and confidence scores

Usage:

python src/demo/demo.py --video path/to/video.mp4 --output output_directory

2. Live Demo (`src/demo/live/`)

Real-time exercise detection from webcam:

Live pose detection and skeleton overlay
Real-time repetition counting
Exercise type classification

Usage:

cd src/demo/live
./start_live_demo.sh

## 📈 Performance

### Current Model Metrics
- **Classification Accuracy**: ~99.9%
- **Segmentation Precision**: ~97%
- **Segmentation Recall**: ~38%
- **AUC**: ~0.93

### Model Comparison
- **Robust Model**: Better generalization, fewer false positives
- **Gaussian Filtered**: Improved temporal consistency
- **Improved Recall**: Better detection of repetitions

## 🔧 Configuration

### Dataset Building
Edit `build_dataset.py` to modify:
- Window size (default: 30 frames)
- Gaussian augmentation parameters
- No-exercise ratio

### Model Training
Edit `src/training/trainer.py` to modify:
- Model architecture (filters, layers, dropout)
- Loss function parameters
- Training hyperparameters

### Demo Settings
Edit `src/demo/demo.py` to modify:
- Model path
- Output format
- Visualization settings

## 📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
data		data
models/main		models/main
src		src
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
build_dataset.py		build_dataset.py
label_videos.sh		label_videos.sh
model_architecture.png		model_architecture.png
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

WorkoutTracker - AI-Powered Exercise Recognition

�� Overview

🏗️ Architecture

Data Pipeline

Model Architecture

📁 Project Structure

🚀 Quick Start

1. Setup Environment

2. Prepare Data

3. Label Your Data

4. Build Dataset

5. Train Model

6. Run Demos

Video Analysis Demo

Live Demo

📊 Dataset Details

Multitask Dataset Creation

Label Augmentation

Dataset Statistics

🧠 Model Details

Architecture

Training Configuration

🎮 Demo Applications

1. Video Analysis Demo (`src/demo/demo.py`)

2. Live Demo (`src/demo/live/`)

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

calimiro-ai/WorkoutTracker

Folders and files

Latest commit

History

Repository files navigation

WorkoutTracker - AI-Powered Exercise Recognition

�� Overview

🏗️ Architecture

Data Pipeline

Model Architecture

📁 Project Structure

🚀 Quick Start

1. Setup Environment

2. Prepare Data

3. Label Your Data

4. Build Dataset

5. Train Model

6. Run Demos

Video Analysis Demo

Live Demo

📊 Dataset Details

Multitask Dataset Creation

Label Augmentation

Dataset Statistics

🧠 Model Details

Architecture

Training Configuration

🎮 Demo Applications

1. Video Analysis Demo (src/demo/demo.py)

2. Live Demo (src/demo/live/)

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

1. Video Analysis Demo (`src/demo/demo.py`)

2. Live Demo (`src/demo/live/`)

Packages