MLEDGE: Cloud and Edge Machine Learning

IMDEA Networks es el beneficiario de este proyecto.

Financiado por: Ministerio de Asuntos Económicos y Transformación Digital, Union Europea NextGeneration-EU REGAGE22e00052829516

Duración: Enero 2023 – Junio 2025

Contacto: Nikolaos LAOUTARISInvestigador Principal IMDEA Networks

 

Objetivos del proyecto:

La toma de decisiones basada en datos e impulsada por algoritmos de Aprendizaje Automático o Machine Learning (ML) está cambiando la forma en que funcionan la sociedad y la economía, y está teniendo un profundo impacto positivo en nuestra vida cotidiana. De hecho, las aplicaciones de ML se están volviendo aún más ubicuas e integradas, a menudo de manera invisible, en nuestras actividades diarias, logrando un impacto directo en cosas como la forma en la que nos orientamos en una ciudad, el cómo decidimos qué comprar o dónde comer, mientras que al mismo tiempo nos podemos mantener a salvo de fraudes financieros, o disponemos de herramientas que nos recuerdan tomar los medicamentos o que nos sugieren nuevos hábitos personalizados para un estilo de vida más saludable.

Sin embargo, para que las soluciones basadas en ML sean efectivas en tales tareas, a menudo se tienen que procesar datos cerca del usuario final. Además, dichos datos pueden ser privados y de naturaleza confidencial. El Aprendizaje Distribuido y, en particular, el Aprendizaje Federado (FL: Federated Learning) emerge como un paradigma líder dentro de la rama del ML satisfaciendo estas dos propiedades. FL ha crecido en paralelo con la expansión de la nube hacia el borde (CloudEdge) pero, curiosamente, ambos paradigmas se han desarrollado en su mayoría de forma independiente, a pesar de su paralelismo natural y sus posibles ganancias sinérgicas.

En el presente proyecto, trabajaremos para habilitar un ecosistema próspero de servicios de FL en el borde, seguros y eficientes, capaces de facilitar el uso de datos personales y B2B confidenciales para entrenar modelos de ML para consumidores mientras se protege la privacidad de los datos y de sus propietarios. Estudios recientes en el ámbito de la “Estrategia europea de datos” estimaron que la economía de los datos alcanzará un impacto de 827.000 millones de euros para los UE27 ya en 2025. Sin embargo, aún hoy en día las preocupaciones sobre la privacidad y la propiedad obstaculizan su pleno desarrollo. MLEDGE contribuirá decisivamente a aumentar estas proyecciones en el período 2025-2030.

Objetivos técnicos / científicos:

Para alcanzar este objetivo, se han catalogado una serie de objetivos técnicos específicos del proyecto que se resumen en los siguientes:

  1. Diseñar un marco de desarrollo de servicios de aprendizaje federado (FLaaS) en el borde de la nube y componentes que ayuden a popularizar este tipo de servicios
  2. Diseñar y desarrollar soluciones de seguridad (FedSecure) contra ataques de envenenamiento o inferencia lanzados desde servidores de borde rebeldes y/o nodos de agregación “honestos pero curiosos”.
  3. Gestionar los desafíos de la portabilidad de datos en el borde de la red (DataEdge)
  4. Crear un esquema de marca de agua (FedWM) para proteger contra la redistribución de los datos o metadatos que se intercambien entre servidores en el borde en el marco del FLaaS.
  5. Crear una capa de lógica económica y de negocio (FLaaS Manager) que implemente una distribución justa de costes e ingresos entre las partes cuando colaboren en el entrenamiento de modelos de ML.

Arquitectura MLEDGE

El diagrama mostrado en la figura siguiente resume la arquitectura de MLEDGE y los bloques del proyecto que se presentó como propuesta del proyecto.

Figura 1. Diagrama de bloques de MLEDGE

La arquitectura de MLEDGE se articula en torno a tres capas:

  • La capa de infraestructuras dispone los recursos de computación y comunicación necesarios para la ejecución del proyecto. Dicha capa de infraestructuras puede incluir recursos a diferentes niveles de la red, incluyendo clouds públicas o privadas “centralizadas” en el núcleo de la nube, nodos de computación en el borde de la nube, e incluso infraestructuras en casa o terminales de los usuarios.
  • La capa de servicios MLEDGE busca integrar una serie de componentes que habiliten servicios FLaaS en el borde de la nube, y que puedan integrar componentes innovadores que provengan del desarrollo de los objetivos científicos del proyecto.
  • La capa de demostración incluye casos de uso reales de empresas de la economía tradicional y digital, así como un caso de uso específico de optimización de infraestructuras cloud. Los casos de uso buscarán demostrar el uso del aprendizaje federado en el borde de la nube y de los componentes de MLEDGE en escenarios reales y con datos reales. Para ello, durante los primeros seis meses de proyecto se ha realizado un screening de empresa y se han elaborado pliegos para realizar licitaciones de estos tres casos de uso a empresas españolas externas a IMDEA.

Paquetes de Trabajo MLEDGE

El proyecto MLEDGE aprendizaje automático (ML) en la nube y en el borde tiene como objetivo implementar el aprendizaje federado como una capa intersectorial independiente pero optimizada sobre CloudEdge. Para ello, el trabajo se estructura en 7 paquetes de actividades (P0-P6). P0 cubre la gestión del proyecto, y P1 tiene como objetivo definir los requisitos de los casos de uso y el diseño de la arquitectura del proyecto. Adicionalmente, se prevén 4 paquetes de trabajo técnicos (P2-P5), y un último paquete (P6) orientado a mostrar las pruebas de concepto, y a la diseminación, explotación y comunicación de los resultados del proyecto. Es importante destacar que el trabajo desarrollado en el marco de MLEDGE se beneficiará de lecciones aprendidas y desarrollos técnicos previos de otros proyectos europeos, como por ejemplo PIMCITY, SMOOTH, DataBri-X o TRUSTS.