Investiga I+D+i

Noticias:

Puedes conocer mejor el Programa en www.programainvestiga.org

DEBATE

DEBATE
« en: 12 Diciembre , 2024, 14:21:40 pm »
El arte de crear datos en la era de la IA
Hola a todos,

Hoy os invito a reflexionar y debatir sobre un tema fascinante en el mundo de la inteligencia artificial: la generación sintética de datos.

Esta técnica permite "crear" datos que parecen reales y se usan para entrenar sistemas de IA, ayudando en áreas como el reconocimiento de imágenes o la mejora de asistentes virtuales. Es una herramienta cada vez más importante para avanzar en tecnología de manera segura y eficiente.

Para guiar el debate, os propongo algunas preguntas:

1. ¿Pensáis que los datos sintéticos podrían llegar a sustituir completamente los datos reales?

2. ¿Qué ventajas o posibles riesgos identificaríais en esta práctica?

3. ¿Creéis que esta tecnología podría tener impacto en vuestra vida cotidiana o en vuestros estudios?

¡Esperamos vuestras opiniones!

Que tengáis buen final de semana,

Georgina

Re:DEBATE
« Respuesta #1 en: 13 Diciembre , 2024, 22:23:11 pm »
¡Buenas noches, Georgina!

He estado investigando y me gustaría responder a tus preguntas.

En primer lugar, según el siguiente informe: https://royalsociety.org/-/media/policy/projects/privacy-enhancing-technologies/Synthetic_Data_Survey-24.pdf  "los datos sintéticos no son un reemplazo de los datos reales", pero esto es hablando del presente, mirando más al futuro opino que sí que podrían llegar a ser un remplazo, debido a que como bien dijo Clive Humby "los datos son el nuevo petróleo", y los datos son mucho más fáciles de conseguir sintéticamente.

Hablando de las ventajas y riesgos que esto conllevaría, esto tendría múltiples ventajas, tales como: la preservación de la privacidad, la seguridad y accesibilidad de los datos, la mejora del entrenamiento de modelos, el ahorro de costos, entre otras. Sin embargo, como todo, esto también conllevaría sus dificultades como: los problemas de generalización, el realismo en los datos, la credibilidad sin ningún dato real con el que comparar...

En último lugar, opino que esta tecnología muy probablemente tendrá un impacto en nuestros estudios, ya que como bien he explicado anteriormente, los datos sintéticos son muy eficientes, pero también conllevan riesgos que no ocurrirían con datos reales.

INFORMACIÓN: https://www.questionpro.com/blog/es/ventajas-de-los-datos-sinteticos/#Cuales_son_las_ventajas_de_los_datos_sinteticos

Un saludo,
Andrés.

Re:DEBATE
« Respuesta #2 en: 13 Diciembre , 2024, 23:13:24 pm »
Buenas tardes Georgina, soy Yannick y me gustaría intentar responder tus preguntas que nos has propuesto.

Para empezar mi respuesta sobre la primera pregunta es que no es posible que los datos sintéticos sustituyan completamente a los datos reales. Aunque pueden replicar patrones estadísticos complejos, los datos reales reflejan absolutamente todo, me refiero a diversidad, la imprevisibilidad y los matices que son difíciles de simular con precisión absoluta. Sin embargo, en muchos contextos, los datos sintéticos pueden complementar o incluso reemplazar a los datos reales cuando hay problemas de privacidad, acceso limitado o costos elevados. Esto es especialmente útil en contextos de la salud.

Sobre la pregunta número 2, unas posibles ventajas de la generación de datos sintéticos son la protección de privacidad, reducción de costes, rapidez en la obtención de datos en grandes volumenes (Esto es ampliamente relevante para el entrenamiento de IA debido a que las redes neuronales requieren enormes cantidades de datos para ajustar sus masas).
Pero por el otro lado, está claro que los datos siguen siendo falsos, es decir que no pueden reflear completamente la realidad con precisión, también es importante considerar el posible uso indebido de esta herramienta tan poderosa ya que podrían emplearse para las manipulaciones o fraudes.

Y por último, personalmente considero que la tecnoogía de datos sintéticos podría tener un impacto significativo.
En la vida cotidiana, podría mejorar servicios como atención médica personalizada y por supuesto, las aplicaciones de la inteligencia artificial.
En los estudios, podría facilitar investigaciones académicas mediante acceso a datos simulados en áreas donde los datos reales son inaccesibles o restringidos.

¡Espero que os haya servido esta información y mucha suerte a todos!
Yannick Shalom Nagid Liu

Re:DEBATE
« Respuesta #3 en: 22 Diciembre , 2024, 18:17:22 pm »
¡¡¡ Hola a todos !!!

El tema de la generación sintética de datos en la era de la inteligencia artificial (IA) es verdaderamente fascinante y abre un abanico de posibilidades y reflexiones. A continuación, comparto mi opinión sobre las preguntas planteadas.

¿Podrían los datos sintéticos sustituir completamente a los datos reales?
Aunque los datos sintéticos tienen el potencial de replicar patrones estadísticos complejos, difícilmente podrán reemplazar totalmente a los datos reales. Esto se debe a que los datos reales poseen matices y diversidad que son difíciles de emular con precisión absoluta. Sin embargo, en contextos donde la privacidad o la accesibilidad son problemáticas, los datos sintéticos podrían complementar o incluso sustituir parcialmente los datos reales, como se señala en el ámbito biomédico.

Ventajas y riesgos identificados:
  • Ventajas: La generación de datos sintéticos preserva la privacidad, permite el acceso a grandes volúmenes de datos para el entrenamiento de modelos, y facilita la investigación en áreas con limitaciones de datos reales, como las enfermedades raras. Además, puede reducir costes y mejorar la generalización de modelos de IA.
  • Riesgos: Entre los principales riesgos se encuentran la falta de realismo absoluto, que puede impactar la credibilidad de los datos y los modelos entrenados con ellos. Asimismo, existe el peligro de que se utilicen para fines poco éticos, como manipulaciones o fraudes.

Impacto en la vida cotidiana y los estudios:
En el ámbito educativo y profesional, la disponibilidad de datos sintéticos puede revolucionar la investigación científica y la formación. Por ejemplo, los estudiantes podrían acceder a bases de datos simuladas para aprender análisis estadísticos o entrenar modelos de IA sin preocuparse por problemas de privacidad. A nivel personal, esta tecnología puede mejorar servicios cotidianos, como asistentes virtuales más precisos y personalizados.

En conclusión, los datos sintéticos son una herramienta poderosa con el potencial de transformar la investigación y la tecnología. Sin embargo, como comunidad científica y educativa, es importante garantizar que su desarrollo y uso estén guiados por principios éticos sólidos y objetivos claros.

¡Espero leer más opiniones!
Felices fiestas ✨,
Miguel Moreno.

Re:DEBATE
« Respuesta #4 en: 25 Diciembre , 2024, 23:10:49 pm »
Hola a todos,
Me gustaría unirme a este debate compartiendo mis respuestas a las preguntas planteadas.

En primer lugar, como la agencia española de protección de datos ha mencionado “los datos sintéticos podrían reemplazar los datos reales en algunos casos de uso”. Es decir, cada caso en el que los datos sintéticos son usados, tiene diferentes requisitos a nivel de calidad, utilidad, proceso y resultado final. Lo que ocasiona que los datos reales puedan ser reemplazados solo en casos específicos. Como podría ser, para validar un sistema de reconocimiento facial podría necesitar generar un conjunto de datos de rostros sintéticos para verificar los límites de dicho sistema. Mientras por otro lado,  ese conjunto de datos podría carecer de la calidad necesaria para verificar otro tipo de sistemas o para desarrollar nuevos sistemas de reconocimiento facial.

Está nueva tecnología nos daría una gran cantidad de ventajas como pueden ser: la protección de la privacidad, aumento de diversidad de datos, mejora de la precisión de modelos de IA, aceleración del desarrollo y las pruebas, reducción de costos, facilita la colaboración entre diferentes equipos o organizaciones, promueve la innovación, entre otros. Pero también conlleva posibles riesgos incluyendo posibles sesgos, falta de generalización, dificultades en la interpretación y hasta la credibilidad de estos datos.

Gracias a que esta tecnología se está desarrollando cada vez más, acabará impactando nuestras vidas diarias de forma directa, y en especial nuestros estudios, como podría ser el caso de la medicina, ya que los datos sintéticos pueden ayudar a crear simulaciones realistas permitiendo entrenar a los estudiantes en diagnósticos sin la necesidad de datos reales de pacientes.

FUENTES:
https://www.aepd.es/prensa-y-comunicacion/blog/datos-sinteticos-y-proteccion-de-datos
https://blog.orange.es/empresas/datos-sinteticos-que-son-para-que-se-utilizan/

¡Espero que os ayude mi punto de vista!
Cristina

Re:DEBATE
« Respuesta #5 en: 27 Diciembre , 2024, 14:05:30 pm »
Buenas tardes a todos.
Os planteo mi punto de vista:

En primer lugar, y de acuerdo con vuestras aportaciones y con la agencia española de protección de datos, no reemplazarán a los reales, si no que los complementarán. Desde mi opinión, los datos sintéticos son una proyección a gran escala de los datos reales, de forma que amplían y enriquecen las bases de datos, mejorando la precisión de resultados o conclusiones posteriores.

En segundo lugar y retomando lo anterior, es cierto que el uso de esos datos supone ciertos riesgos, ya que, debemos controlar el equilibrio entre la precisión de estos con la privacidad que puedan llegar a infringir durante el proceso de su creación, es decir, no podemos dejar en un segundo plano la información sensible y sobretodo su vínculo identificable con los datos sintéticos.
 Sin embargo, podemos adoptar ciertos mecanismos regulatorios que buscan mitigar los posibles riesgos, por ejemplo, Nuria Oliver, directora de la Fundación ELLIS, formula la siguiente “receta” para asegurarse de que los mecanismo de inteligencia artificial y datos sintéticos no supongan un problema, si no una solución: FATEN. F de fairness o justicia, A de autonomía y atribución de responsabilidad, es decir, que haya un responsable establecido de antemano en caso de fallo, A también de aumento de la inteligencia humana, refiriéndose a que el uso de estos datos e inteligencia artificial aumenten o complementen la inteligencia humana, no la sustituyan; T de trust o confianza y transparencia y por último E de educación y equidad, es decir, que se garantice el acceso equitativo a estos recursos. Personalmente, me ha parecido importante centrarme más en las posibles soluciones a los problemas, ya que, desde mi punto de vista, los posibles riesgos, que pueden ser mitigados, no se pueden llegar a comparar con los beneficios que podemos llegar a obtener de la utilización de los datos sintéticos e inteligencia artificial.

Por último, y reiterándome en lo anterior, las aplicaciones de estos datos sintéticos tienen un alcance inmenso, siendo visible en nuestro día a día. El uso de estos datos se está empezando a implementar en ámbitos de investigación biomédica en el reconocimiento, por ejemplo, de factores desencadenantes de ciertas enfermedades, por lo que, el uso de estos mismo puede llegar a marcar una diferencia en nuestra propia salud y tratamiento y los de las personas que nos rodean.

Espero que mi opinión sirva de ayuda.
Un saludo.

Re:DEBATE
« Respuesta #6 en: 27 Diciembre , 2024, 20:47:12 pm »
Saludos a todos.
A mi me gustaría añadir un par de cosas sobre los dos primeros puntos

1.¿Pensáis que los datos sintéticos podrían llegar a sustituir completamente los datos reales?

Yo opino que si, llegara algun futuro no tan lejano en el que se puedan sustituir los datos reales por datos sinteticos porque gracias al aprendizage por refuerzo de la IA podra ir solapando los errores que surjan, esto no significa que una IA vaya a evolucinar sola, se necesitara investigar mucho e ir mejorando los sistemas de generación de datos mezclando y descubriendo metodos, porque los unicos problemas que de verdad inpiden esto son el propio avance de otras tecnologías que impidan el desarroyo de esta y la propia condición del ser humano que implica que tieda a reproduccir su propia inperfección en todo lo que haga, pero para esto es la investigación, para refinar los metodos de aprendizage de la IA y que sea capaz de evitar caer en estos mismos fallos.

2. ¿Qué ventajas o posibles riesgos identificaríais en esta práctica?
En cuanto a ventajas no tengo demasiado que añadir solo mencionar lo ya dico por mis compñeros como la versativilidad que ofrecen para investigar en casos que requieren datos coplicados de adquirir o la preservación de la privacidad a grandes terminos.Y a la hora de hablar de los riesgos, uno de los mas problematicos puede ser la desinformación que pueden causar datos falsos o manipulados para fines menos honestos.

Aquí os dejo algunos enlaces que me han servido para documentarme y llegar a estas conclusiones por si os interesan:
-https://www.zendesk.com.mx/blog/tipos-de-aprendizaje-inteligencia-artificial/
-https://cloud.google.com/learn/artificial-intelligence-vs-machine-learning?hl=es-419
-https://www.unite.ai/es/deepmind-reports-new-method-of-training-reinforcement-learning-ai-safely/
-https://saludymedicina.org/post/la-inteligencia-artificial-va-al-psicoanalistaç
-https://www.aepd.es/prensa-y-comunicacion/blog/datos-sinteticos-y-proteccion-de-data
-https://www.larazon.es/emergente/puede-morir-sus-propias-fake-news_2024021665cf32a74129260001be2ec7.html
 Ánimo a todos y suerte.

Re:DEBATE
« Respuesta #7 en: 04 Enero , 2025, 17:33:24 pm »
El arte de crear datos en la era de la IA
Hola a todos,

Hoy os invito a reflexionar y debatir sobre un tema fascinante en el mundo de la inteligencia artificial: la generación sintética de datos.

Esta técnica permite "crear" datos que parecen reales y se usan para entrenar sistemas de IA, ayudando en áreas como el reconocimiento de imágenes o la mejora de asistentes virtuales. Es una herramienta cada vez más importante para avanzar en tecnología de manera segura y eficiente.

Para guiar el debate, os propongo algunas preguntas:

1. ¿Pensáis que los datos sintéticos podrían llegar a sustituir completamente los datos reales?

2. ¿Qué ventajas o posibles riesgos identificaríais en esta práctica?

3. ¿Creéis que esta tecnología podría tener impacto en vuestra vida cotidiana o en vuestros estudios?

¡Esperamos vuestras opiniones!

Que tengáis buen final de semana,

Georgina

Buenas tardes, espero que sigáis bien.

Viendo el tema propuesto por Georgina, daré mi opinión, que espero aporte algo interesante al debate.

Sinceramente yo creo que los datos sintéticos no podrían llegar a remplazar los datos reales, o al menos no deberían. ¿Por qué? Bueno, si es verdad que estos datos son generados a partir de miles de bytes de información, información verdadera y que representa la realidad, pero que en algunos casos deja alguna variable oculta o escasa, haciendo que los algoritmos no la tengan en cuenta; eso sin contar los momentos en los que esa variable o dato es NUEVO, momento en el que normalmente llega el caos.
Por ejemplo y en el hipotético caso de que un robot impulsado por sistemas de IA tuviese que diagnosticar a un paciente para una enfermedad, en el 95% o incluso en el 98% de los casos el robot acertaría correctamente las enfermedades de los pacientes, ya que además de llevar mucho tiempo de aprendizaje (el sistema neuronal), normalmente se repetirían estos casos o serían similares. Sin embargo, en el momento en el que un paciente tenga una enfermedad que casi no se ha registrado o analizado, el sistema dará error o mostrará resultados incorrectos, mayormente debido a que estas redes neuronales trabajan basándose "literalmente" en datos que ya conocen y luego sintetizando información (que también en algunos casos puede dar a error), y por tanto no son capaces (en la mayoría de casos, por no decir todos) de reaccionar a situaciones que no se han estudiado anteriormente. A diferencia de un humano, que normalmente puede solucionar problemas con la información que tiene, e ingeniándoselas para conseguir el resultado que desea, una inteligencia artificial, al menos a día de hoy, no es capaz de realizar esa acción que muchos categorizaríamos como pensar.

Espero haber respondido a todas las preguntas, aunque de una forma un poco más indirecta, con argumentos interesantes y que complementen esta conversación.

¡Un saludo y espero vuestras respuestas! 👀

Re:DEBATE
« Respuesta #8 en: 10 Enero , 2025, 12:43:42 pm »
Buenas tardes a todos,
He estado investigando acerca de las preguntas que nos has planteado, y tras haber leído numerosas respuestas a este debate, me gustaría añadir mi perspectiva en las preguntas planteadas.

Cuando se introduce un conjunto de datos en un algoritmo, es vital que una parte, da igual cuánto pequeña, sea de datos reales, debido a que los datos sintéticos, a pesar de reflejar bien la información detrás de los datos reales, en ocasiones no capta la total complejidad y variabilidad del mundo que estos aportan. Además, es probable que los datos sintéticos contengan sesgos si no se han generado adecuadamente, lo que provocaría que los datos sintéticos no plasmasen bien la complejidad y diversidad en el mundo y, consecuentemente, la IA podría tomar decisiones erróneas o ineficaces. 

Para respaldar lo que estoy queriendo decir, me gustaría introducir el ejemplo de los coches autónomos. Para su funcionamiento, una IA es integrada a la “mente” del automóvil con el objetivo de que el vehículo sea capaz de llevar a cabo decisiones en base a su entorno, con el objetivo de tomar decisiones tal y cómo las haría un humano. Para esto, es necesario una cantidad masiva de datos con los que entrenarla, por lo que los datos sintéticos son de gran utilidad. No obstante, si no se alimentara con datos reales, los datos sintéticos podrían ocasionar varios fallos. El mas significativo y el que tendría la mayor repercusión sería el caso de que estos incluyan sesgos. Como mencioné previamente, esto puede ocasionar fallos de la máquina a la hora de tomar decisiones, lo que podría terminar con un accidente. Asimismo, la importancia de la implementación de los datos reales en estos algoritmos recae en que estos pueden incluir situaciones inesperadas, situaciones cuya información se encuentra en estos datos; como malas condiciones del tiempo, o comportamientos inesperados de otros conductores, los cuales son muy complicados de ser replicados con datos sintéticos.

En general, concluyo que aunque en ocasiones los datos sintéticos pueden determinar el éxito en el funcionamiento de algún algoritmo, demuestra ser crucial la implementación de datos reales, por numerosos factores, principalmente para evitar el riesgo de fallos en estos.

Además, quería plantearos la siguiente pregunta para que me compartieseis vuestras opiniones sobre el tema: ¿Cómo nos podemos asegurar de que el uso de datos sintéticos sea ético y responsable en diferentes sectores, como la salud, las finanzas, la educación o la seguridad?

Espero que os haya sido de ayuda mi opinión,
Un saludo a todos,
Noa

Re:DEBATE
« Respuesta #9 en: 20 Enero , 2025, 13:11:39 pm »
Os propongo un tema de la Medicina sobre los datos clínicos sintéticos.

¿Deberíamos usar datos clínicos sintéticos en la medicina?

Los datos clínicos sintéticos permiten a los médicos y científicos estudiar enfermedades y encontrar tratamientos sin comprometer la privacidad de las personas. Al no usar datos reales lo que hace es que se protege la información personal de cada uno  y  la investigación médica es  más segura y rápida.

En contra:
Aunque  los datos sintéticos no siempre son completamente precisos y podrían llevar a errores en los tratamientos si no se complementan con información real. Además, no reemplazan el conocimiento que se obtiene de los casos médicos y podrían generar dudas en situaciones críticas
¿Crees que los beneficios superan a los riesgos?