Securing Federated Sensitive Topic Classification against Poisoning Attacks
mayo 20, 2024
El Grupo de Transparencia de los Datos de IMDEA Networks Institute Networks ya ha empezado a producir artículos relevantes sobre aprendizaje federado (FL) en los principales foros de ciencias de la computación. El pasado marzo de 2023, nuestra colega Tianyue Chu presentó la ponencia «Securing Federated Sensitive Topic Classification against Poisoning Attacks» en la conferencia NDSS (clasificada como A* según el baremo CORE2023) en San Diego, California. Esta ponencia está relacionada con el componente de investigación FedSecure del proyecto, que testará la solución propuesta sobre la plataforma de FL de la empresa Acuratio.
En él se presenta una solución FL para construir un clasificador distribuido capaz de detectar URLs con contenido sensible (ej. relacionado con categorías como la salud, las creencias políticas, la orientación sexual, etc), y se desarrolla un esquema de agregación robusto basado en lógica subjetiva y detección de ataques basados en residuos para identificar usuarios maliciosos que difundan actualizaciones defectuosas del modelo.. Mediante una combinación de análisis teórico, simulación basada en trazas y validación experimental mediante prototipo y usuarios reales, el trabajo demuestra que el clasificador puede detectar contenidos sensibles con gran precisión, aprender nuevas etiquetas con rapidez y seguir siendo robusto frente a ataques de envenenamiento por parte de usuarios malintencionados, así como frente a entradas imperfectas de usuarios bienintencionados.