FT-Transformer: Una mirada a la arquitectura de Deep Learning de MLSIP
Mientras que Random Forest representa un enfoque clásico y robusto, el proyecto MLSIP también ha explorado la vanguardia del Machine Learning con la implementación de FT-Transformer (Feature Tokenizer + Transformer). Este modelo, basado en la misma arquitectura Transformer que ha revolucionado el procesamiento del lenguaje natural (impulsando modelos como ChatGPT), ha sido adaptado para trabajar con los datos tabulares y estructurados de las comunicaciones SIP.
La principal innovación de FT-Transformer es cómo procesa las variables de entrada. A diferencia de los árboles de decisión, que dividen los datos basándose en reglas, FT-Transformer utiliza un componente llamado Feature Tokenizer para convertir cada variable (sea numérica como la hora, o categórica como el códec) en una representación matemática densa llamada embedding. Este proceso permite al modelo capturar relaciones mucho más complejas y sutiles entre las características.
Una vez que todas las variables de entrada se han transformado en estos tokens o embeddings, pasan a través de una serie de capas Transformer. Cada una de estas capas utiliza mecanismos de «atención» para ponderar la importancia de cada variable en relación con las demás, aprendiendo qué combinaciones son las más predictivas para determinar el éxito o fracaso de una llamada. Esta capacidad de aprender interacciones complejas de forma flexible le otorga, en teoría, un potencial mayor que los modelos basados en árboles, especialmente con grandes volúmenes de datos.
Aunque los resultados iniciales del proyecto MLSIP mostraron un rendimiento muy similar entre FT-Transformer y Random Forest, la inclusión de este modelo avanzado posiciona a la solución a la vanguardia tecnológica. Mantiene abierta la puerta para que, a medida que se incorporen conjuntos de datos más grandes y complejos (como los de un operador real), la arquitectura de Deep Learning pueda descubrir patrones que los modelos clásicos no detectan, llevando la optimización del enrutamiento a un nuevo nivel de precisión.
