MLSIP | Simulación masiva de tráfico SIP
Para que los algoritmos de Machine Learning de MLSIP aprendan a optimizar el tráfico, necesitan una materia prima fundamental: datos. Y no cualquier dato, sino un conjunto de datos masivo, variado y representativo que simule las complejidades de un entorno de producción real. Con este objetivo, el equipo de Quobis ha implementado un sofisticado entorno de entrenamiento.
El corazón de este entorno es SIPp, una herramienta de código abierto que genera un gran volumen de tráfico SIP simulado. SIPp actúa tanto como el emisor de la llamada (caller), seleccionando aleatoriamente entre diferentes códecs como G.722, PCMA u Opus, como el receptor (callee), distribuido en cuatro rutas simuladas.
La clave de este entorno reside en la configuración de estas cuatro rutas. Cada una ha sido programada con reglas de negocio específicas para introducir fallos y restricciones de forma controlada.
Todo este tráfico es gestionado por un proxy Kamailio, que en esta fase de entrenamiento enruta las llamadas de forma aleatoria entre las cuatro rutas. Esta aleatoriedad es deliberada: asegura que se recopilen datos de todas las rutas, tanto de éxito como de fracaso, generando un dataset equilibrado y heterogéneo. Cada llamada, con su resultado, se almacena como un CDR, creando las decenas de miles de ejemplos que los modelos de IA necesitan para aprender a distinguir una buena ruta de una mala.
