Nuestra solución utiliza el teorema de Bayes y algunas hipótesis simplificadoras adicionales para realizar la clasificación. Una de estas hipótesis es la independencia entre las variables predictoras, lo que le da el nombre de "ingenuo" o "naive" en inglés. Y este clasificador bayesiano naive se entrenó con un conjunto de datos muy grande recopilados de forma privada a partir de varias fuentes. Es importante destacar que hemos protegido al filtro bayesiano contra el conocido envenenamiento bayesiano, una técnica utilizada por los remitentes de mensajes para degradar la efectividad de los filtros basados en este método.
El clasificador bayesiano se entrena procesando mensajes de correos electrónicos no deseados, mensajes cortos (SMS) y cualquier otro tipo de mensaje que se desee incorporar. Para esta detección el clasificador se basa en palabras tokenizadas y derivadas.
Hemos desarrollado un enfoque robusto para la detección de phishing. Este se centra en evitar el intercambio de dominios y los ataques homógrafos de IDN con el objetivo de identificar y prevenir los intentos de phishing, que son ataques donde los atacantes intentan engañar a los usuarios para que revelen información confidencial, como contraseñas o datos bancarios. Los atacantes suelen utilizar diversos métodos para evitar el análisis automático y la detección de las páginas falsas que envían, por ejemplo, utilizan la ofuscación, distorsión del código fuente y el ocultamiento. Para esto nosotros hemos implementado mecanismos IA en el análisis automático de las páginas falsas que no son detectados por los atacantes. Esto, unido al aprendizaje y la aplicación de algoritmos avanzados para detectar patrones y características comunes de los ataques de phishing nos permite proporcionar una protección efectiva contra este tipo de amenazas y minimizar los riesgos.