Usa https://github.com/mlc-ai/web-llm para cargar el modelo en el navegador.
Carga el modelo Qwen2.5-Coder-3B-Instruct, tienes más información aquí: https://mlc.ai/models
Haz que el autocompletado funcione en todos los editores.
Carga el modelo en segundo plano, y haz que se pueda usar cuando ya esté cargado.