Menu Content/Inhalt
Inicio arrow Investigación arrow Trabajos arrow Diagnóstico de clusters de microcalcificaciones en Mamografías

Investigación

GeneralPublicaciones
Diagnóstico de clusters de microcalcificaciones en Mamografías PDF
Escrito por Ramón Gallardo Caballero   
Índice
Diagnóstico de clusters de microcalcificaciones en Mamografías
Nuestra propuesta
Metodología empleada
Implementación práctica
Resultados
Futuros desarrollos

Metodología empleada

La base actual de nuestro trabajo es la la base de datos mamográfica conocida como Digital Database for Screening Mammography (DDSM) . Desarrollada por el grupo Island Vision de la Universidad del sur de Florida es quizá la base de datos de libre distribución más extensa y de mejor calidad. Comprende aproximadamente 2500 casos completos. Es decir, proporciona las cuatro vistas típicas de un estudio mamográfico (Craneo Caudal derecha e izquierda y Medio Lateral Oblicua derecha e izquierda). Adicionalmente suministra información del caso en cuestión como por ejemplo la edad, tipo de película mamográfica, escáner, etc. Pero lo que resulta más interesante a la hora de afrontar nuestro trabajo es el hecho de que proporciona lo que podemos denominar zona de certeza (ground truth) cuando en un pecho existe algún tipo de anormalidad verificada histológicamente; especificando el tipo y la distribución de ésta en la nomenclatura internacional conocida como BIRADS de la ACR.

Existen otras bases de datos en este campo como puede ser MIAS o Nijmegen, pero o bien ya no son accesibles o no son gratuitas. La primera de ellas proporciona una versión reducida libre de cargo (miniMIAS), pero dada su escasa resolución espacial y espectral resulta muy poco útil a la hora de afrontar un problema de detección de microcalcificaciones.

La fuente de datos

Aunque la base de datos escogida (DDSM) parece muy completa, presenta una serie de características que consideramos conveniente modificar. La primera de ellas, aunque fácilmente solventable, es el hecho de que toda la información relativa a cada caso se proporciona en forma de archivos de texto. Dado el gran número de casos y mamogramas disponibles, este no parece ser el mejor formato. Por lo que uno de los primeros pasos fue la inserción de toda la información proporcionada por la DDSM en una base de datos relacional.

La segunda de las características a modificar no resulta tan inmediata. Los casos que contiene DDSM proceden de varios centros médicos estadounidenses. La digitalización se realizó en los propios centros con el hardware disponible en estos, por lo que tenemos cuatro tipos distintos de casos en función del escáner utilizado. Los mamogramas se proporcionan en formato bruto (raw), es decir se proporciona el valor de gris capturado por el escáner. Pero cada escáner presenta un valor de gris distinto en función de su calibración. Además uno de los escáneres, a diferencia de los otros 3 lineales, presenta un comportamiento logarítmico; lo que conlleva una mayor precisión en una zona del espectro que en el resto. Debido a estas diferencias el primero de los procedimientos a realizar en este trabajo fue una conversión de los mamogramas a una magnitud común: densidad óptica. Éste es un parámetro con significación física ampliamente utilizado al que podemos convertir los distintos mamogramas gracias a las tablas de calibración de éstos.

Generación del conjunto de prototipos

Este fue quizá uno de los pasos más lentos del desarrollo dado que en nuestra propuesta como primera aproximación realizamos un diagnóstico a nivel de píxel. Por ello, con ayuda de un experto radiólogo realizamos un etiquetado de píxeles de una serie de clases predefinidas sobre regiones de los mamogramas, una vez expresados éstos en densidad óptica.

El conjunto de clases a estudiar incluye no solo microcalcificaciones pertenecientes a un clúster (y por tanto indicativas de malignidad) sino también microcalcificaciones benignas, calcificaciones de centro transparente o uniformes, varillas, tejido saludable y varios tipos de artefactos detectados como por ejemplo los efectos del rodillo de la reveladora de mamogramas.

En total generamos un conjunto de entrenamiento con más de 4600 prototipos de microcalcificación maligna, más de 6700 prototipos de microcalcificación benigna y más de 100000 prototipos de tejido saludable o estructuras benignas.

Dada la gran cantidad de prototipos disponibles, y teniendo en cuenta el posterior proceso de entrenamiento del clasificador neuronal, decidimos generar varios conjuntos de entrenamientos en los que los porcentajes de prototipos de cada clase apareciesen distribuidos de distinta forma siempre primando la aparición de prototipos de la clase que presenta más interés (microcalcificación benigna). Estos conjuntos de prototipos se utilizarán en los distintos procesos de entrenamiento que se llevan a cabo a continuación. 

Obtención de las bases ICA

El extractor de características ICA necesita generarse en base a muestras del espacio que debe modelar (mamogramas). Estas muestras son ventanas cuadradas cuyo lado marca la dimensión del análisis ICA. La estrategia típica de modelado consiste en tomar muestras aleatorias, pero en este caso después de varias pruebas y dada la extensión de las zonas normales respecto de las anormalidades en los mamogramas, decidimos centrar las muestras en píxeles pertenecientes al conjunto de prototipos.

Una vez se dispone de las matrices ICA la tarea de obtención de características se reduce a realizar operaciones de multiplicación matricial. Así por ejemplo en la imagen siguiente se muestra la descomposición ICA de un pequeño clúster de microcalcificaciones.

<!--[if !vml]-->Expansión ICA<!--[endif]-->

Entrenamiento de clasificadores neuronales

El entrenamiento se lleva a cabo sobre conjuntos de prototipos preestablecidos que garantizan la posibilidad de obtener una muestra (patch) de al menos 51 píxeles de dimensión. Cada uno de estos conjuntos trata de modelar una característica específica, pero todos ellos incorporan la totalidad de los píxeles malignos.

El entrenamiento se lleva a cabo en el clúster distribuido, lo que nos permite realizar unos 42 entrenamientos simultáneos. La estructura neuronal seleccionada es un perceptrón multicapa con una única capa oculta cuyo tamaño oscila entre 50 y 200 neuronas. El procedimiento conlleva varias repeticiones a número de neuronas constante y crecimiento neuronal hasta llegar al máximo número de neuronas establecido. La red óptima junto con sus parámetros de rendimiento se almacena para uso posterior.

Evaluación de rendimiento

La evaluación de rendimiento se lleva a cabo a tres niveles distintos. El primero de ellos se realiza a nivel de prototipos, de forma que se evalúa la tasa de acierto global y sobre la clase objetivo (microcalcificaciones).

El segundo nivel evalúa el rendimiento del sistema en base al diagnóstico de overlays completos, comparando resultados con los diagnósticos reales almacenados en la base de datos. En este caso así como en el tercer nivel necesitamos una herramienta básica que se encarga de auto generar lo que se conoce como regiones de interés.

Una región de interés (ROI) es una marca rectangular, circular o libre que delimita la zona en la que se extiende la anormalidad indicada. En nuestro caso la generación de regiones de interés presenta diversas fases:

  • Individualización de calcificaciones.
  • Generación de mapa de densidad.
  • Filtrado del mapa de densidad.
  • Individualización de ROIs.

Para la evaluación de rendimiento de ROIs hemos propuesto dos criterios distintos. El primero de ellos más grosero es considerar el diagnóstico acertado si el overlay presenta al menos una región de interés marcada por el especialista y nuestro sistema diagnostica al menos una ROI. El segundo exige además que exista solapamiento entre la ROI indicada por el especialista y la generada para considerar acertado el diagnóstico. Siendo este último criterio más restrictivo hemos decidido utilizarlo en lugar del primero.

En cuanto al diagnóstico de mamogramas completos, el procedimiento de generación de ROIs es idéntico al utilizado en el diagnóstico de overlays, variando únicamente los criterios de diagnóstico. Nuevamente hemos establecido dos criterios distintos. En el primero de ellos consideramos que una ROI generada es correcta si se solapa con la ROI marcada por el especialista (si ésta existe) y en el segundo exigimos que la ROI generada incluya completamente a la ROI establecida por el especialista. El segundo de ellos presenta dificultades de aplicación, dado que en ocasiones la ROI generada es lo suficientemente pequeña como para no incluir la ROI marcada por el especialista y sin embargo visualmente se detecta una ubicación totalmente correcta.



Última modificación ( jueves, 25 de noviembre de 2010 )