¿Hasta qué punto los datos sintéticos pueden evitar la re-identificación?

Lotta-4912-yAPZ2S · « **en:** 08 Marzo , 2025, 19:57:05 pm »

¡Hola! Soy Lotta del Colegio Montserrat.

He estado pensando en los datos sintéticos como solución para la privacidad.

En teoría, usar datos generados en lugar de datos reales evita que se exponga información personal. Pero me surge la pregunta: ¿hasta qué punto los datos sintéticos pueden evitar la re-identificación?

Sabemos que algunos modelos pueden generar datos tan parecidos a los reales que, sin darse cuenta, podrían revelar información sensible. Si los datos sintéticos se crean a partir de conjuntos de datos originales, ¿qué garantía tenemos de que no puedan ser rastreados hasta personas reales?

Por otro lado, si alguien tiene acceso a herramientas avanzadas, ¿no podría reconstruir ciertos patrones y descubrir información que debería estar protegida?

Entonces, ¿realmente los datos sintéticos son la solución definitiva para la privacidad, o seguimos teniendo riesgos que no hemos resuelto del todo? ¿Qué opináis?

¿Hasta qué punto los datos sintéticos pueden evitar la re-identificación?

Lotta-4912-yAPZ2S

¿Hasta qué punto los datos sintéticos pueden evitar la re-identificación?