Browsing by Author "Romero Jofré, Pamela Ignacia"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
- ItemA methodology for developing dermatological datasets: lessons from retrospective data collection for AI-based applications(2025) Pedro Pérez, Alma Alheli; Romero Jofré, Pamela Ignacia; Vidaurre, Soledad; Cabanas, Ana M.; Galaz, Atsuko; Hidalgo Acuña, Leonel Esteban; Carrasco, Karina; Tamez-Peña, José Gerardo; Díaz-Domínguez, Ricardo; Navarrete Dechent, Cristian Patricio; Mery Quiroz, Domingo ArturoPurpose The integration of artificial intelligence into dermatological research has underscored the need for robust and well-structured dermatological datasets. However, these datasets vary widely in their development processes, and there is currently no standard methodology to create such datasets. This work identifies three pressing needs for the building of dermatological datasets focus on skin tumor classification: the need for multimodal datasets, the definition of minimum metadata requirements, and the inclusion of underrepresented populations to address the scarcity of health data. Methods We propose a practical methodology to create dermatological datasets from clinical records, incorporating both images and patient metadata. The process consists of four key stages: getting the institutional review board approval and analysis of clinical information sources, data recording and structuring, processing of clinical data and images, and quality assessment. This methodology was derived from hands-on experience in building two datasets from Chilean and Mexican populations, respectively. Results The methodology allows the creation of well-structured datasets by simplifying data organization and enabling replication. Each step includes practical guidance for dealing with typical challenges, such as image metadata categorization and technical validation by dermatologists and computer scientists. Conclusion Our contribution offers a reproducible, scalable, and interdisciplinary framework for creating dermatological datasets, especially useful for countries initiating dataset creation. In addition to the methodological proposal, we highlight common pitfalls and offer recommendations to mitigate them.
- ItemSkin lesions recognition using federated and swarm learning: a case study in Chile(2024) Romero Jofré, Pamela Ignacia; Mery Quiroz, Domingo; Pontificia Universidad Católica de Chile. Escuela de IngenieríaEl diagnóstico correcto de tumores y lesiones de la piel es de suma importancia. Los modelos de aprendizaje profundo (DL) se pueden utilizar como herramientas de diagnóstico en dermatología, ya que ayudan en el diagnóstico del cáncer de piel con resultados comparables al de los expertos. Para entrenar estos modelos de DL, se requiere una gran cantidad de datos y que estos sean diversos. Esto se convierte en una barrera para instituciones con escasos datos locales. Además, existe una creciente preocupación por los problemas de privacidad relacionados con el intercambio de datos. Este estudio busca evaluar el desempeño de modelos de DL (AlexNet, VGG, GoogLeNet, ResNet, Vision Transformer, y VMamba) en el diagnóstico de imágenes dermatoscópicas a través de 4 diferentes algoritmos de aprendizaje: Primero, el aprendizaje local, donde no se comparten datos ni parámetros del modelo. En segundo lugar, el aprendizaje central, en el que se comparten tanto los datos como los parámetros de los modelos. En tercer lugar, el aprendizaje federado, donde los parámetros se comparten, pero no los datos (un servidor central permite administrar y distribuir los parámetros). Finalmente se probó el aprendizaje de enjambre, donde se comparten los parámetros pero no los datos y no cuenta con un servidor central. El aprendizaje federado y de enjambre pueden permitir la colaboración entre diferentes instituciones, reduciendo los problemas de privacidad. Realizamos un análisis en 2 conjuntos de datos públicos provenientes del conjunto de datos del Hospital Italiano de Buenos Aires (HIBA), de Argentina, y en el conjunto de datos del International Skin Imaging Collaboration (ISIC). También se utilizó un tercer conjunto de datos no público con imágenes de nuestra institución (TRAWA-S). Desarrollamos dos métodos, el primero utilizando únicamente ISIC dividido en 3 conjuntos de datos (ISIC 1, ISIC 2, e ISIC 3) y el segundo, con los conjuntos de datos HIBA, ISIC y TRAWA-S. Las estrategias de aprendizaje federado y de enjambre mejoran los resultados de las métricas de desempeño (AUROC, AUPRC, accuracy y F1-score) en el conjunto de prueba con respecto al aprendizaje local en ISIC 1: 16%, 36%, 8.57%, y 31.71%; ISIC 2: 10%, 19%, 5.72%, y 22.41%; ISIC 3: 7%, 18%, 4.9%, y 18.61%; HIBA: 9%, 9%, 4.8%, y 11.22%; ISIC: 7%, 10%, 3.2%, y 6.46%; TRAWA-S: 5%, 9%, 5.6%, y 18.59%. A través del aprendizaje federado y de enjambre, se obtienen mejores resultados para predecir el tipo de lesión de la piel en conjuntos de datos locales. Estos algoritmos de aprendizaje ayudan a disminuir el sesgo y aumentar la variabilidad en el sistema.
