Buenas tardes,
La verdad que a falta de una pregunta clara estoy un poco en blanco respecto a que responder, sobre todo en un tema tan amplio como la generación sintéticas de datos. Como no se que el lo que te gustaría saber, supongo que lo mejor sería responder enfocándome en lo general.
1. Posibilidades de los datos sintéticos: Los datos sintéticos, al menos en lo que mi trabajo se ha enfocado, son muy utiles para el Machine Learning, el entrenamiento de modelos de inteligencia artificial. Estos datos son casi necesarios porque hacer que un sistema como los GANs (Redes Generativas Antagónicas) aprenda a crear cosas partiendo de la nada, es una tarea que requiere un volumen de muestras gigantesco, ya que no se le puede explicar al discriminador como es lo que tiene que aprender a reconocer, si no que debe aprender a reconocerlo por si mismo con una muestra de, por ejemplo, imágenes. Los datos sintéticos permiten aumentar muchísimo el volumen de datos que pueden utilizarse para el Machine Learning, sobre todo a pequeña escala, donde la cantidad de información suele ser escasa y poco representativa de la realidad general.
2. Problemas a resolver con los datos sintéticos: Me voy a limitar a hablar de un solo problema, ya que es en el que me he centrado en mi investigación, la creación de sesgos. Cuando los datos no son lo suficientemente representativos de la realidad o la información que presentan es sesgada, los modelos de Machine Learning se entrenan mal.
Sinceramente no se si esta es la información que estas buscando, ya que es muy poco específica y habiendo terminado tu trabajo esto ya lo sabrás. En cualquier caso, los datos sintéticos, en mi opinión, son una rama muy compleja que debe ser cuidada y modificada con mucho cuidado para no poner en riesgo la fiabilidad de nuestros datos.
Me alegro de que hayas terminado tu trabajo, ¿lo has terminado del todo? si todavía te falta algo, por poco que sea, te deseo mucha suerte.
Un saludo, Miguel.