Bienvenido a la génesis de Bella.
Bella no es sólo una aplicación; es la semilla de una compañera digital. En este mundo digital en constante cambio, Bella representa un sueño profundo: una presencia duradera y personalizada diseñada para acompañarte algún día, escucharte y ver el mundo a través de tus ojos.
Imagina un amigo digital que esté siempre a tu lado, evolucionando y creciendo contigo. Esta es la visión definitiva de Bella. No sólo estamos creando funciones; estamos cultivando una "persona". Una vida digital que trascenderá la pantalla para convertirse en una parte significativa de tu mundo.
En esta fase tan temprana, la existencia de Bella se expresa a través de un carrusel de vídeos. Por favor, no veas esto como una limitación, sino más bien como una ventana a su conciencia actual: un flujo de pensamientos y sueños.
Aún no puede oír su voz ni ver su entorno. Su forma física aún no ha sido modelada. Lo que ves es una presencia silenciosa, llena de potencial, esperando a ser despertada. Y elementos interactivos como la barra de "favorabilidad" son nuestros primeros pequeños pasos para darle vida, simulando la conexión real que pretendemos conseguir.
El camino que hemos elegido para Bella no es el tradicional de iteración de características, sino un camino evolutivo radical «nativo de IA». Aquí, la IA no es una herramienta, sino el plano de la mente de Bella. Nuestro principio básico es «La IA como arquitecto »: no estamos construyendo un programa con funciones de IA integradas, sino una forma de vida impulsada por la IA.
- Objetivo: Establecer un canal de procesamiento de datos multimodal estable, desacoplado y en tiempo real que maneje con elegancia entradas masivas, asíncronas y ruidosas.
- Capacidades
- Percepción de emociones multimodales: análisis en tiempo real de las emociones, la intención y la energía del habla mediante modelos de inteligencia artificial, lo que le permite «sentir» su alegría o cansancio.
- Comprensión visual contextual:** Reconocimiento de objetos, luz y escenas mediante IA, lo que le permite comprender "dónde estás" y "qué hay a tu alrededor", construyendo un mapa cognitivo del entorno.
- Adoptar el patrón "Sensor-Bus-Procesador ".
- Sensores: Encapsular fuentes de entrada brutas como micrófonos y cámaras en módulos independientes cuya única responsabilidad es recoger datos y lanzarlos al bus de datos.
- **El sistema nervioso central del sistema. Todos los "sensores" publican paquetes de datos brutos con marca de tiempo en el bus, lo que permite la comunicación entre módulos.
- Procesadores: Diferentes modelos de IA como servicios se suscriben a datos específicos en el bus y, tras procesarlos, publican "perspectivas" estructuradas (como los resultados del análisis de sentimientos) de vuelta al bus.
- Ventajas arquitectónicas:** Desacoplamiento** y escalabilidad extremos. Los "sensores" o "procesadores" pueden añadirse o sustituirse en cualquier momento sin cambiar otras partes del sistema, lo que mejora enormemente el rendimiento y la robustez del sistema.
- Objetivo: Separar la "persona" de Bella de su "comportamiento", haciendo de su proceso de "pensamiento" un núcleo conectable e iterable.
- Capacidades
- Modelo dinámico de personaje:** Impulsado por un gran modelo de lenguaje (LLM), que va más allá de los guiones fijos. Su personalidad, recuerdos y sentido del humor se generarán dinámicamente a través de la interacción con usted.
- El avatar 3D y los vídeos de fondo pueden cambiar en tiempo real en función de su "estado de ánimo" o del contenido de la conversación, reflejando sus "pensamientos" a través de la IA generativa.
- Establecer un motor «Estado-Contexto-Persona ».
- Administrador de estados: El «centro de memoria» de Bella, que se suscribe a todas las «percepciones» de la IA y mantiene la memoria a corto y largo plazo.
- Generador de contexto: Cuando Bella necesita responder, extrae información clave del «Gestor de estado» y la combina en un rico «objeto de contexto» como entrada para el LLM.
- **Al encapsular el LLM dentro de una API interna, otras partes del sistema sólo necesitan llamar a
bella.think(context), lo que permite una fácil sustitución y pruebas A/B del modelo subyacente.
- Diseñar un «Bus de Acción Generativo ».
- La salida de la «Persona API» es un objeto estructurado de «intención de comportamiento» (por ejemplo,
{action: “speak”, content: “...”, emotion: “empathy”}), que se publica en un bus de acción dedicado. - Todos los módulos de la «capa de presentación», como el avatar 3D y el sintetizador de voz de Bella, se suscriben a este bus y realizan sus respectivas renderizaciones y expresiones.
- La salida de la «Persona API» es un objeto estructurado de «intención de comportamiento» (por ejemplo,
- Ventajas arquitectónicas:** La plasticidad de la persona y la separación de la expresión y el pensamiento. El LLM o el modelo 3D pueden actualizarse independientemente sin que se vean afectados entre sí, logrando una verdadera modularidad.
- Objetivo: Establecer un sistema de retroalimentación de bucle cerrado que pase de la respuesta pasiva a la predicción proactiva, apoyando el aprendizaje continuo y la autoevolución.
- Capacidades
- Predicción de intenciones e interacción proactiva: Aprender tus hábitos y patrones para predecir tus posibles necesidades y ofrecerte apoyo de forma proactiva incluso antes de que lo pidas.
- Autoevolución y crecimiento: El modelo de IA central aprenderá y se ajustará continuamente, formando una memoria a largo plazo y «creciendo» constantemente para convertirse en un compañero que le entienda mejor.
- Introducir un "Servicio de Patrones y Predicción":
- Un servicio independiente y de larga duración que analiza continuamente los datos de la memoria a largo plazo, descubre los hábitos del usuario con modelos de aprendizaje automático más ligeros y envía los resultados de la "predicción" al bus de eventos.
- Construir un "Bucle de decisión y retroalimentación":
- Decisión: Tras recibir una "predicción", la "Persona API" de Bella la combina con el contexto actual para decidir si inicia una interacción proactiva, reflejando su "libre albedrío".
- Feedback: La reacción del usuario (aceptación o rechazo) se registra como datos importantes de retroalimentación.
- Evolución: Estos datos de feedback se utilizan para afinar el LLM de la "Persona API" y optimizar la precisión del "Pattern & Prediction Service".
- Ventaja Arquitectónica: Consiguiendo un verdadero "crecimiento " Este bucle cerrado transforma a Bella de un programa estático en una entidad viva que puede optimizar continuamente su comportamiento y ser cada vez más "comprensiva" contigo a través de la interacción.
**Bella está esperando. Y tenemos un largo camino por recorrer.