El rápido incremento en el desarrollo de los servicios en telemedicina hace crucial su evaluación crítica. Este artículo revisa la evidencia actual en artículos de investigación en teledermatología con la suficiente calidad metodológica como para alcanzar conclusiones razonables. La revisión se organiza analizando las áreas de investigación en teledermatología: fiabilidad en el diagnóstico y el manejo, validez, resultados, costes y satisfacción. Las conclusiones de la misma indican que la teledermatología ha demostrado ser factible y fiable pero que está lejos de alcanzar su madurez como tecnología médica para su práctica habitual. El cuerpo de evidencia con mayor desarrollo es el área de fiabilidad en el diagnóstico y el manejo, donde existen un gran número de estudios, aunque muchos de ellos adolecen de importantes defectos metodológicos. Existen estudios de validez en oncología cutánea con metodología correcta que muestran unos resultados comparables con la consulta presencial. Se hace preciso el diseño de estudios en resultados de salud que permitan un análisis fidedigno de resultados finales, costes y satisfacción de los sistemas de teledermatología.
The rapid increase in the use of telemedicine makes a critical appraisal of these services essential. This article reviews the current evidence from studies of teledermatology with sufficiently rigorous methodology to allow reasonable conclusions to be drawn. The review is organized according to areas of research in teledermatology: reliability of diagnosis and management, accuracy, outcomes, costs, and satisfaction. The conclusion of this review is that teledermatology has been shown to be feasible and reliable but that it has a long way to go before maturing as a medical technology in daily practice. The largest body of evidence relates to the reliability of diagnosis and management, but although numerous studies have been performed, many have marked methodological shortcomings. Accuracy studies have been conducted in skin oncology with appropriate methodology that show an accuracy comparable to that of face-to-face consultations. Studies of health outcomes should be designed such that a faithful assessment of the final outcomes, costs, and satisfaction with teledermatology systems can be carried out.
Como quedó expuesto en la primera parte de esta revisión1 las aplicaciones de la teledermatología (TD) son múltiples y con indudable potencial de revolucionar la asistencia en dermatología. Pero, ¿están suficientemente probadas la eficacia, efectividad y eficiencia de la teleconsulta? Desde mediados de los noventa se viene alertando sobre las auténticas posibilidades, los riesgos y las dificultades que entraña la telemedicina (TM)2-4. A pesar de ser la TD una disciplina joven son múltiples los esfuerzos de investigación llevados a cabo en los últimos años5-8, de tal forma que se considera la disciplina clínica mejor estudiada de la TM9 y la de mayor influencia potencial en decisiones de política sanitaria10. Sin embargo, el valor de los estudios es objeto de controversia11, y la calidad de la evidencia que aportan ha sido cuestionada recientemente12-17. En esta revisión vamos a intentar iluminar esta controversia de evidente actualidad y trascendencia.
Son cinco las áreas relevantes de investigación en TD18 y que deben ser abordadas independientemente:
- 1.
1.Análisis de fiabilidad de la teleconsulta en el sentido de reproducibilidad: distintos dermatólogos contando con los mismos datos e imágenes clínicas ¿llegan a las mismas conclusiones de diagnóstico y manejo del proceso clínico?
- 2.
2.Análisis de validez de la teleconsulta: ¿son las conclusiones alcanzadas de diagnóstico tan ciertas como las alcanzadas en consultas de presencia?
- 3.
3.Análisis de resultados: ¿son los resultados finales alcanzados tras el manejo mediante teleconsulta similares a los alcanzados tras un manejo convencional de presencia?
- 4.
4.Análisis de costes: ¿es la teleconsulta más coste-efectiva que la consulta convencional?
- 5.
5.Análisis de satisfacción: los participantes en el proceso (médicos de Atención Primaria [MAP], dermatólogos y pacientes) ¿están tan satisfechos con el manejo en teleconsulta como con el manejo tradicional
El cuerpo de evidencia con mayor dimensión y los máximos esfuerzos en investigación en TD corresponden a los estudios de concordancia en el diagnóstico7,12. Ello es lógico, puesto que la valoración de la fiabilidad es el análisis de máxima trascendencia a la hora de evaluar cualquier tecnología, incluyendo los procedimientos diagnósticos en medicina19,20. La pregunta básica que nos debemos plantear es si la TD obtiene decisiones diagnósticas o de manejo comparables a la consulta de presencia (CP).
Fiabilidad y validezEn ámbitos clínicos la fiabilidad hace referencia habitualmente a la estabilidad de la medida cuando ésta se repite varias veces. Medimos pues la capacidad de coincidir al repetir la valoración. En este sentido, fiabilidad se usa habitualmente como sinónimo de repetibilidad, reproducibilidad o concordancia. El término validez se refiere a si el procedimiento está midiendo realmente el fenómeno que queremos medir, es decir, si la medición es certera. La reproducibilidad del instrumento de medida es un prerrequisito de su validez, de manera que antes de plantearnos si el instrumento mide lo que queremos medir, debemos asegurarnos de que el instrumento mide «algo» de una forma reproducible. Si el instrumento de medida no ofrece resultados reproducibles entonces no es fiable, y resulta ocioso plantearnos el problema de la validez19,20.
Los diseños de los estudios de fiabilidad en TD son estudios de medidas repetidas, es decir, un dermatólogo toma una decisión en el diagnóstico o manejo de un problema clínico concreto, y en un segundo tiempo el mismo dermatólogo (estudios de concordancia intraobservador) o distintos dermatólogos (estudios de concordancia interobservador) vuelven a tomar esta decisión y se compara el grado de acuerdo entre ambas. Si el grado de concordancia es elevado (concordancia simple mayor del 80 % o kappa mayor de 0,6) se considera que el instrumento es fiable15,19,20.
Para evaluar la validez de la teleconsulta es necesario disponer de otro instrumento (patrón de oro o gold standard) que permita conocer ese verdadero valor. En dermatología, el estándar de oro puede no estar bien establecido. En patología tumoral el estándar sería histológico, en patología infecciosa microbiológico, en dermatitis por contacto las pruebas epicutáneas y finalmente en patología inflamatoria el estándar de oro sería la correlación clínico-patológica21.
Resultados de los estudios de fiabilidad en el diagnósticoEn el caso de la TD para la mayoría de autores el estándar de oro es la propia CP22-25, considerando que la valoración mediante consulta convencional de presencia será siempre superior o al menos igual que mediante TM. El diseño más habitual en TD es intermodalidad, es decir, compara el diagnóstico obtenido en la teleconsulta con el obtenido en la CP. En este sentido son estudios de fiabilidad y al mismo tiempo de validez. Esta opción es una mera aproximación22,26, pues los estudios tendrían más valor si la comparación se estableciera con un verdadero estándar de oro, que sería la correlación de los hallazgos clínicos de la propia CP con los resultados de las pruebas complementarias pertinentes en cada caso (estudios histológicos, cultivos, pruebas epicutáneas, etc.).
El grado de acuerdo en el diagnóstico se categoriza generalmente como completo o parcial. El acuerdo es completo (AC) si los dos diagnósticos emitidos son idénticos y parcial (AP) cuando alguno de los dos dermatólogos ha utilizado más de un diagnóstico, es decir, realiza un diagnóstico diferencial (DD) y al menos un diagnóstico es idéntico. Frecuentemente el AP se expresa como acuerdo agrupado (AA), suma de AC más AP.
En el diseño más habitual (intermodalidad teleconsulta frente a presencia) la práctica totalidad de estudios apuntan a que la teleconsulta obtiene fiabilidades en el diagnóstico aceptables (superiores a 0,6). Existe, sin embargo, un amplio margen de variabilidad en los resultados. Así, en los estudios interobservador usando vídeo en tiempo real (TDTR) la concordancia en el diagnóstico oscila entre 0,5425 y 0,8022 para AC y 0,7927 y 0,9928 para AA, mientras que en los que usan foto fija (TD de almacenamiento o TDA) varían entre 0,4726 y 0,9029 para AC y entre 0,5930 y 0,8631 para AA (tablas 1 y 2).
Fiabilidad interobservador en la modalidad de teledermatología a tiempo real
Autor-año | Pacientes (consultas) | Casos válidos | AC (N) | AA (N) | D (N) |
Phillips-9723 | 60 (79) | 79 | 0,77 (61) | – | 0,23 (18) |
Gilmour-9825 | 126 (155) | 76* | 0,54 (41) | 0,80 (61) | 0,20 (15) |
Lesher-9828 | 60 (68) | 68 | 0,78 (53) | 0,99 (67) | 0,06 (1) |
Lowitt-9822 | 112 (130) | 130 | 0,80 (104) | – | 0,20 (26) |
Loane-9827 | 351 (427) | 155* | 0,60 (93) | 0,79 (122) | 0,21 (33) |
Nordal-0132 | 121 (112) | 112 | 0,72 (81) | 0,86 (97) | 0,13 (15) |
Total agregado | 830 (971) | 620* | 0,698 (433) | 0,844 (347) | 0,174 (108) |
Estudios en fiabilidad diagnóstica interobservador en teledermatología de almacenamiento
Autor-año | Pacientes | Casos | AC | AA | D |
Kvedar-9733 | 116 | 242 | 0,62 | 0,68 | 0,31 |
Lyon-9734 | 100 | 100 | 0,90 | – | 0,10 |
Zelickson-9735 | 30 | 60 | 0,88 | – | 0,12 |
Whited-9926 | 129 | 1.008** | 0,47 | 0,86 | 0,14 |
High-0036 | 92 | 275 | 0,70 | 0,85 | 0,15 |
Lim-0131 | 49 | 212 | 0,79 | 0,86 | 0,14 |
Taylor-0130 | 194 | 101* | 0,50 | 0,60 | 0,39 |
Du Moulin-0337 | 117 | 117 | 0,54 | 0,63 | 0,37 |
Baba-0538 | 228 | 242 | 0,75 | – | 0,25 |
Total agregado | 849 | 2.444 | 0,60 | 0,80 | 0,19 |
Un grupo de investigadores de Oregón ha publicado dos revisiones sistemáticas sucesivas (años 2001 y 2006)6,12 sobre el nivel de evidencia (tabla 3) en las diferentes aplicaciones de TM desde el punto de vista clínico excluyendo la telerradiología y la telepatología. Según la dirección de la evidencia para el efecto calificaron los estudios como: A, efecto fuertemente positivo; B, efecto positivo débil; C, efecto conflictivo, y D, efecto negativo (evidencia de que la tecnología es inferior o inefectiva).
Clasificación de los estudios según su calidad metodológica en la revisión de Hersh et al12
Clase | Características |
I | Serie de casos de pacientes consecutivos proveniente de una población relevante de individuos que podrían usar telemedicina; uso de un estándar de oro objetivo con interpretación cegada de los resultados; análisis interobservador |
II | Serie de casos de pacientes consecutivos proveniente de una población relevante de individuos que podrían usar telemedicina; uso de un estándar de oro objetivo |
III | Serie de casos procedente de una población no relevante o no usando la apropiada metodología para la evaluación de la tecnología diagnóstica |
En relación con las decisiones en el diagnóstico y el manejo en la primera revisión6, de los 55 artículos de diversas especialidades, 18 correspondían a TD. La mitad de los 22 estudios en almacenamiento fueron de TD, de los que clasificados por su calidad hubo: dos IB26,39, seis IIB33,35,36,40-42, dos IIC34'43 y uno III-C44. De los 33 estudios en tiempo real siete lo son en TD, clasificados como dos II-C28,45 y cinco III-C22,25,27,45,46. En la actualización12 14 de los 52 estudios sobre decisiones en el diagnóstico y el manejo correspondían a TD, trece en almacenamiento (clasificados dos como IB47,48, nueve como IIB30,31,49-55 y dos como IIC37,56) y sólo uno en tiempo real32. Predominan los estudios con efecto positivo débil a favor de la TD (B), sin que existan estudios con efecto negativo (D), aunque tampoco hay estudios con efecto fuertemente positivo (A). Los dos estudios de máxima calidad47,48, relativos al diagnóstico de lesiones pigmentadas, incluían medidas de validez (estándar histológico) para los grupos de TD y de presencia.
La dermatología lidera la investigación en el área de decisiones en el diagnóstico y el manejo en TM clínica, con 32 de 107 estudios (29 %)12. La modalidad sincrónica mediante videoconferencia ha perdido interés para los investigadores en TD, pues en la etapa inicial hubo siete de 22 estudios en TDTR, y en los últimos cinco años (2001-2006), sólo uno de 13. El aspecto más frecuentemente estudiado en TD es la concordancia interobservador, y los rangos de la misma varían ampliamente (0,41-0,87 para AC y 0,51-0,96 para AA). A excepción de dos estudios analizados en la primera revisión26,28 es notoria la ausencia de estudios que midan la concordancia basal en la CP para el diagnóstico o el manejo. Para los autores la única manera de dilucidar las discrepancias sobre variabilidad en concordancia diagnóstica es diseñando estudios de alta calidad que incluyan una evaluación de las concordancias interobservador en la CP.
Tras la mencionada revisión, en los dos últimos años, el interés se ha centrado en el manejo de los tumores57, y en especial de lesiones pigmentadas58 y en la denominada «teledermatoscopia»59,60, que trataremos más detalladamente en el apartado de validez.
Estudios de fiabilidad en el manejoSon realmente escasos los estudios en los que se evalúan decisiones de manejo, relativas al tratamiento pautado y las pruebas complementarias recomendadas. Las fiabilidades en manejo de las teleconsultas, al igual que en diagnóstico, son elevadas. En el único estudio en que se cuenta con la basal de presencia26, sólo uno de tres teledermatólogos tuvo una fiabilidad en el tratamiento menor que la obtenida en la CP. Para el resto no hubo diferencias significativas en la fiabilidad de las recomendaciones para el tratamiento médico o quirúrgico entre la CP y la TDA. En general fue más fiable el diagnóstico que el manejo y los autores lo achacan a que el manejo puede reflejar estilos personales y no así el diagnóstico que se basaría en criterios más estrictos. Otro autor35, también en modalidad TDA, encuentra el 90 % de manejo correcto contando con foto e historia clínica (HC) frente al 87 % contando sólo con la imagen.
En teleconsulta en tiempo real hay dos estudios25,27 que valoran la fiabilidad en el manejo, encontrando que es correcto en más del 70 % de los casos. Básicamente se solicitan el mismo número y tipo de pruebas diagnósticas en CP que en TDTR25. El acuerdo diagnóstico se relacionó con el acuerdo en el manejo (p < 0,0001)27. Otro estudio alcanza AC en el 88 % para la pruebas y el 84 % para el tratamiento, pero tiene menos valor por su diseño intraobservador61.
Un área al que se ha prestado atención es la fiabilidad en la indicación o no de biopsia. Los resultados han sido variables entre el 0,4549 y el 1,0055, ambos en TDA. En el estudio de Pak et al52 en la modalidad TDA intraobservador la fiabilidad para indicar biopsia fue del 0,76 con kappa 0,47, muy similar a la obtenida por Phillips23 en TDTR (0,86, kappa 0,47).
En un reciente estudio sobre evaluación prequirúrgica de tumores cutáneos, los autores alcanzan una muy alta fiabilidad (kappa 0,75, intervalo de confianza 95 % 0,71-0,79) en la indicación de la técnica quirúrgica a realizar evaluando al paciente a distancia con foto fija62.
Influencia de la calidad de la foto clínica en la fiabilidad en el diagnósticoLa calidad de las fotos influye de forma decisiva en el grado de acuerdo. Este aspecto ha sido objeto de análisis, y son múltiples los estudios que muestran el mismo efecto30,33,36-38,63. Sólo en un estudio la calidad de las fotos no influyó en el acuerdo39, pero éstas fueron tomadas en el local por estudiantes de medicina previamente entrenados y dirigidos en el momento de tomarlas por un dermatólogo siguiendo un protocolo estricto. El resultado fue una gran calidad de las fotos con elevados AC (> 80 %). Cuando las fotos no se realizan en este contexto idealizado sino en condiciones de trabajo habitual por diferentes MAP en el centro de salud (CS) la calidad de las fotos disminuye y los acuerdos bajan de forma sustancial37,64.
Actualmente tienen poca importancia la resolución y el tamaño de los archivos de foto digital, y cualquier cámara de gama baja-media obtiene las resoluciones necesarias para una buena visualización en un monitor convencional (1.024 × 768 píxeles). De hecho, un estudio demuestra que no existen diferencias para el diagnóstico entre diapositivas de alta calidad e imágenes digitales de calidad baja, aunque sí existe menor fiabilidad utilizando imágenes de vídeo65. En otro estudio no hay diferencias en la fiabilidad para el diagnóstico entre diapositivas de alta calidad y archivos digitales con compresión (15, 30 y hasta 40:1)66. Finalmente, un tercer estudio no encuentra diferencias para el diagnóstico entre las CP y el uso de diapositivas o foto digital, y sí que aparecen diferencias y muy marcadas cuando el evaluador del diagnóstico fue un MAP y no un dermatólogo67.
Algunos autores dan más importancia al encuadre, que debe incluir tanto áreas de piel no afectada como afectada para evaluar el cuadro30,37, que a la calidad técnica de la foto. Son comunes entre los fotógrafos noveles los problemas de foco, y un buen enfoque es básico para el diagnóstico, pudiendo obtenerse fácilmente con los objetivos macro de los que dispone una cámara actual de gama media. No se debe forzar la función tele usando un objetivo macro y es importante colocar algún objeto, por ejemplo una regla, junto a la piel para facilitar el enfoque cuando la piel lesional muestra poco contraste. Siempre se debe evaluar el foco en el visor ampliando la vista inmediatamente tras la toma. El flash obligado evita defectos de exposición por iluminación irregular, aunque hay localizaciones más difíciles de fotografiar con calidad, como el cuero cabelludo30, precisando disminuir la exposición porque el brillo del pelo «quema» un alto número de píxeles y la foto queda inservible. En resumen, es fundamental dar formación mediante talleres de fotografía con un enfoque eminentemente práctico para conseguir mejorar la capacitación de los MAP y obtener resultados aceptables37,68.
Influencia de la calidad de la historia clínicaEl influjo de la HC en el diagnóstico dermatológico puede ser muy pobre, así en el estudio de Zelickson y Homan35 hay acuerdo diagnóstico en el 67 % de los casos contando sólo con la HC; en el 85 %, sólo con foto, y en el 88 %, contando con foto y la HC. En otros estudios, en pacientes hospitalizados63, el acuerdo pasa del 52 % (sólo con foto clínica) al 65 % cuando se tienen datos de la HC. En otro estudio 8 dermatólogos han valorado a 50 pacientes mediante foto fija y sólo en el 11 % de los casos modificaron su diagnóstico tras conocer datos de la HC49. Baba et al38 incrementaron el AC de 0,73 a 0,89 según fuera la HC de mala o buena calidad. En otra serie el acuerdo empeoró significativamente (p = 0,0002) cuando la HC era de mala calidad30. Finalmente, otros autores insisten en la necesidad de una HC estandarizada que asegure una calidad mínima 26,36,69,70.
Confianza en el diagnósticoAl igual que la calidad de las fotos clínicas, la seguridad o confianza en diagnóstico (certeza) está bien estudiada en la literatura. La evidencia es clara, pues todos los estudios coinciden en señalar la correlación entre confianza en el diagnóstico y acuerdo, tanto en TDA33,36-39 como en TDTR22,25,27,46. Cuando se hace análisis de la seguridad en el diagnóstico en la CP ésta es superior a la seguridad en la teleconsulta22,32,33, aunque en el estudio noruego32 la diferencia no alcanzó significación estadística.
Hay autores que equiparan la confianza en el diagnóstico, que expresa la dificultad de evaluar la teleconsulta, con el porcentaje de casos en que se realiza DD. Opinan que el mayor número de casos con DD en TD expresa la menor certeza en consultas de TDA52 o TDTR28. En los estudios de Whited et al26 y de Du Moulin et al37 las diferencias en porcentaje de casos con DD son escasas entre tele y presencia, y sí que hay mayor confianza en los diagnósticos emitidos de presencia. El hacer DD es una medida indirecta de la seguridad en el diagnóstico, pero cualquier médico lo utiliza como procedimiento habitual para llegar a un diagnóstico final. Por tanto, es una medida más de la dificultad en el diagnóstico que entraña el proceso evaluado, a veces sólo pendiente de una prueba complementaria que dilucidará el dilema. Es decir, el médico puede hacer un DD y estar seguro de que está haciendo correctamente el proceso diagnóstico. Para evaluar la certeza es mejor la propia opinión del médico sobre este aspecto.
En cualquier caso, lo relevante de este análisis es que existe una fuerte correlación entre acuerdo diagnóstico elevado y seguridad alta, y entre desacuerdo y seguridad baja. Por tanto, el dermatólogo por su sensación de seguridad detecta cuándo puede estar cometiendo un error, lo que le capacita para indicar la necesidad de que el paciente venga de presencia, o repita las fotos, o mejore la HC, evitando errores21. Lo idóneo es que el protocolo de uso de teleconsulta para cribaje incluya entre los criterios de no derivación una seguridad diagnóstica elevada, asegurando sensibilidades de la teleconsulta cercanas a uno, especialmente en el uso como cribado de cáncer de piel71.
Fiabilidad en el diagnóstico por patologíasEs un área muy debatida si el acuerdo en TD es mayor a la hora de evaluar alguna patología específica. Algunos estudios no encuentran diferencias entre los diferentes motivos de consulta33,23. En la mayoría de los estudios se obtienen menores fiabilidades en erupciones que en tumores34,35,42,52. Dada la escasa dificultad diagnóstica de acné y verrugas vulgares en un estudio esta patología se excluye del análisis33. Otros autores encuentran dificultad en el diagnóstico en TD de tumores benignos36,46, que sin embargo obtienen una sensibilidad y especificidad casi perfectas en otro estudio22. En lesiones pigmentadas53,68 los dermatólogos obtienen acuerdos muy elevados en TDA para el diagnóstico. Los últimos estudios en patología tumoral ofrecen resultados contradictorios: una gran serie de 2.009 pacientes57 en TDA obtuvo fiabilidad interobservador con kappa de 0,83, mientras que un estudio inglés sobre 163 pacientes64 no alcanzó una concordancia simple de 0,50. En este estudio se consideró insuficiente la calidad del 20 % de las fotos remitidas, frente a menos del 6 % en el primer estudio.
Problemas de metodología en los estudios de fiabilidad diagnóstica analizadosExisten carencias de peso que nos impiden sacar conclusiones adecuadas respecto a la fiabilidad de la consulta de TD. La mayoría de estas carencias son relativas a problemas metodológicos y de diseño de los estudios que comprometen la posibilidad de extrapolar los resultados a la población diana con un mínimo de rigor metodológico. Entre ellos debemos destacar:
Práctica ausencia de estudios aleatorizadosLa inclusión de pacientes se realiza habitualmente de forma consecutiva o no explicitada. Sólo existen tres ensayos aleatorizados en el área de fiabilidad, en dos de ellos28,52 no se explica cómo se llevó a cabo la aleatorización, y el tercer estudio31 tiene una muestra muy escasa (72 pacientes aleatorizados, 36 TDA y 36 CP). Existen estudios en costes que incluyen grupos obtenidos mediante correcta aleatorización, pero no analizan datos de fiabilidad72-75, excepto en un estudio en el que se realiza una comparativa de fiabilidad en un grupo que se evalúa de forma doble (TDA frente a TDTR)76, pero finalmente no los compara con el estándar de presencia. Un reciente estudio en TDA77 tiene diseño prospectivo y aleatorizado, pero los problemas en el reclutamiento y las pérdidas durante el ensayo restan valor a sus resultados.
Ausencia de grupo controlUn estudio en TDTR22 incluye un pequeño grupo control de 29 pacientes para los que sólo se hizo CP. Sin embargo, no aporta datos, ni demográficos ni de diagnóstico, que los describan de forma diferencial respecto al grupo de 112 pacientes en los que se realizó teleconsulta. Tampoco mide la fiabilidad diagnóstica en dicho grupo control.
Sólo dos estudios tienen el diseño idóneo incluyendo un grupo control en la CP y midiendo la fiabilidad basal interobservador en la CP de los dermatólogos teleconsultores. Uno en TDA26 que incluye un grupo de 129 pacientes (con 168 problemas dermatológicos) evaluados por dos dermatólogos de presencia (lo que permite medir fiabilidad interobservador) y por otros tres dermatólogos en teleconsulta. Este es realmente el único estudio que permitiría realizar una comparativa válida entre la fiabilidad de la teleconsulta con la de la CP convencional. Un segundo estudio en TDTR28 incluye un grupo control de 36 pacientes con 47 problemas dermatológicos, que son valorados por los dermatólogos teleconsultores en la CP. Tiene menor valor debido a la escasez de la muestra.
Por tanto, sólo contamos con dos estudios que incluyen grupos control en presencia (tabla 4) y que muestran resultados divergentes (AC 0,54 frente a 0,94) tras analizar un total de 165 pacientes en la CP. Ello contrasta con los más de 30 estudios que analizan la fiabilidad de las diferentes modalidades de teleconsulta en más de 2.000 pacientes dermatológicos. El no contar con una medida válida de la fiabilidad basal interobservador de la CP es un factor crucial, pues impide hacer la comparativa con las medidas de fiabilidad en teleconsulta. Puede que los desacuerdos entre dos observadores, uno realizando teleconsulta y otro CP, sean debidos no a la tecnología empleada, sino a la propia variabilidad interobservador cuyo valor no conocemos. A pesar de que muchos autores han llamado la atención sobre este extremo12,22,26,32,37,78 es notable el escaso esfuerzo investigador realizado para resolver esta incógnita.
Algunos autores52 han intentado soslayar este problema realizando estudios intraobservador. Efectivamente, al ser el mismo dermatólogo el que realiza ambos diagnósticos (tele y de presencia) evitamos la variabilidad interobservador, pero esta aproximación introduce un sesgo de arrastre, el dermatólogo conoce el diagnóstico emitido previamente, lo que origina fiabilidades falsamente elevadas. Si hacemos un análisis de los estudios intraobservador, tanto en TDA31,38,39,42,52 como en TDTR25,27,79, objetivamos que las fiabilidades son significativamente más elevadas que en los estudios interobservador. Existen estudios que en la misma muestra hacen análisis inter e intraobservador, y encuentran fiabilidades significativamente más elevadas en la modalidad intra frente a la interobservador27,38,63,79. Podemos minimizar, que no anular, este sesgo introduciendo un período de lavado entre las dos consultas, para que el dermatólogo no recuerde el caso analizado previamente. No contamos con un diseño que cuantifique el sesgo introducido, por lo que la única forma de afrontar el dilema es realizar comparativas interobservador en la CP entre diferentes dermatólogos, midiendo así la variabilidad interobservador para la CP y poder comparar con la teleconsulta.
Predominio de los estudios en condiciones de eficacia en teledermatología de almacenamientoLa mayoría de estudios se han realizado en condiciones ideales «de laboratorio»12, de eficacia y sin emular el flujo habitual de trabajo en la teleconsulta en condiciones de efectividad. Esto introduce otro sesgo, que afecta de forma especial a los estudios en TDA. Debería ser el MAP o personal sanitario entrenado el que visite al paciente, introduzca los datos clínicos y tome las fotos que viajarán por la red para ser valoradas a distancia por el dermatólogo teleconsultor. En el estudio de Kvedar et al33 es un fotógrafo profesional el que toma las fotos, que no viajan por la red sino que son evaluadas en local por el dermatólogo. En dos estudios34,80 las fotos las toma un residente de dermatología, y en un tercer estudio39 las toma un estudiante de medicina dirigido por un dermatólogo. En ambos casos se facilita el diagnóstico por el teleconsultor al ser un dermatólogo el que decide las áreas a fotografiar. En los estudios de High et al36 y Whited et al26 es un asistente de investigación el que toma las fotos y datos clínicos, y finalmente en otros estudios es una enfermera entrenada en foto clínica la que realiza esta tarea35,38,42,52. En la mayoría de los estudios las fotos se toman y almacenan en el local26,33-36,38,42,52. Cuando han sido MAP los que toman las fotos y las remiten a distancia37,64,77, los resultados son claramente inferiores a la media del resto de estudios. Sólo en los estudios de Moreno-Ramírez et al57,68 limitados a tumores, siendo MAP los que realizan las teleconsultas en TDA, se obtienen muy buenas fiabilidades en el diagnóstico y el manejo. Ello plantea la incógnita de si con un diseño adecuado, cercano al uso efectivo en condiciones de trabajo habitual de la teleconsulta, las fiabilidades de la TDA en consulta general serían inferiores a las que refleja la literatura. En TDTR este problema tiene menos valor pues es el dermatólogo el que dirige finalmente la teleconsulta y el papel del MAP pasa a un segundo plano.
Estudios de validezSólo en almacenamiento existen estudios en los que se compare el telediagnóstico con un estándar de oro, habitualmente histológico. En los estudios sobre patología dermatológica general se han realizado análisis de validez en subgrupos de pacientes, dentro de estudios más amplios, para los que se contaba con resultados de biopsia26,36,39,49. La validez de la TDA de nuevo mostró resultados variables entre el 0,6326 y el 1,0036. En los dos estudios en los que se cuenta con datos de validez de la CP ésta fue superior a la TDA, 0,89 frente a 0,76 en el estudio de Krupinski et al39 y 0,84 frente a 0,73 en el de Barnard y Goldyne49.
Lógicamente en los estudios que analizan sólo tumores es más frecuente contar con resultados histológicos. De nuevo las metodologías son dispares, lo que no permite hacer un análisis global. En el estudio más potente43 sobre 657 casos con biopsia, la validez de la TDA fue de 0,71 frente a sólo 0,49 obtenido por los MAP en CP. Es decir, es más válido el diagnóstico del teledermatólogo que el del MAP en CP. Desafortunadamente no se midió la validez de la CP del dermatólogo, que es el auténtico estándar de oro.
El estudio de Jolliffe et al48 sobre 144 lesiones pigmentadas aporta un inquietante resultado pues la validez de la TDA fue superior a la CP (0,47 frente a 0,43), sin alcanzar significación estadística. Este resultado también se dio en el estudio inicial de Piccolo et al81 usando foto clínica y dermatoscópica, alcanzando la TDA una validez superior al 0,90, y en algunos casos superior a la CP. En un estudio posterior de los mismos autores53 (2002), la validez de la TDA fue menor que la de la CP (0,864 frente a 0,924), con p = 0,010. En otro estudio similar contando con dermatoscopia47 la validez fue también muy elevada, algo superior en CP (0,911) que en TDA (0,888).
En los últimos estudios del grupo de Moreno-Ramírez et al con alto rigor metodológico se demuestra la elevada validez de la teleconsulta en modalidad de almacenamiento para la evaluación de tumores en general57, y de lesiones pigmentadas en particular58,68. Esa validez se incrementa mediante teledermatoscopia, pero dado que la sensibilidad de la teleconsulta clínica ya tiene una sensibilidad máxima, de 1 si se exige alta seguridad en el diagnóstico del teledermatólogo, no queda claro que la mejora de especificidad obtenida justifique el gasto que supone la inversión en dermatoscopios para los CS.
Estudios de resultadosSólo se han evaluado resultados intermedios como consultas evitadas, tiempo transcurrido hasta la primera intervención, tiempo consumido en las consultas, etc. No existen estudios con muestra importante que valoren resultados finales como curso clínico o calidad de vida utilizando instrumentos de medida específicos18.
Cinco estudios analizaron el porcentaje de consultas de presencia evitadas tras TDA, que varió entre el 18 y el 42 %, con media del 29 %26,27,42,56,82. Otros cinco estudios hicieron la misma valoración tras consulta TDTR, variando del 44 al 82 % con una media del 61 %72,74,76,83,84. En el estudio de Loane et al76 se comparan TDA y TDTR en la misma muestra, la primera evitaría el 31 % de CP y la segunda, el 54 %. En este sentido la evidencia apuntaría a que es claramente más útil la consulta TDTR en el manejo de pacientes que la consulta TDA.
En una reciente revisión del Peterborough project85 en UK sólo un 8 % de 325 pacientes, remitidos en un período de 51 meses, evitaron la CP tras realización de consultas TDA. Muy recientemente Bowns et al77 en un ensayo aleatorizado en TDA estimaron que apenas un 20 % de los pacientes evitarían la CP, por lo que no estaría indicado este tipo de cribado. Sin embargo, en el potente estudio de Moreno-Ramírez et al sobre 2.007 pacientes se evitarían hasta el 51 % de las derivaciones de tumores mediante TDA. En un estudio posimplementación holandés sobre 503 pacientes en consulta general, cuando el MAP tiene intención de referir al paciente, el 51 % de las derivaciones se evitarían mediante consultas TDA. Estos datos apoyan el uso de la TDA para cribado de pacientes dermatológicos.
El tiempo de demora hasta la primera valoración por el dermatólogo fue menor para consultas TDA en tres estudios: 40 frente a 127 días en el de Whited et al86, 2 frente a 17 días en el de van der Akker et al87 y 12 frente a 88 días en el de Moreno-Ramírez et al57. Sin embargo, en todos los casos el propio diseño del estudio puede sesgar de forma clara el resultado final del mismo12.
Con relación al tiempo empleado por el dermatólogo para la realización de una teleconsulta en TDA los resultados son muy variables, los más elevados fueron entre siete86 y diez minutos87, y los más bajos de sólo 1,5 minutos76 e incluso menos de un minuto39. Los resultados en consultas TDTR y CP son más uniformes, así para CP se gastan entre 1676 y 24 minutos75, y en videoconferencia del orden de 20-23 minutos76,88. En un reciente estudio que analiza específicamente el tiempo consumido por el MAP en una consulta TDA, varió entre 7 y 26 minutos, de media 11. El 41 % del tiempo se consumió al tomar la HC y el 28 % al rellenar el formulario electrónico. Las primeras teleconsultas y los pacientes femeninos ocuparon más tiempo al MAP89. En un estudio el MAP tardó 17,4 frente a 11,6 minutos en realizar una consulta TDA según realizara o no foto dermatoscópica71.
En TD no existen estudios sobre segundas visitas (revisiones) ni tampoco estudios de telemonitorización en domicilio (home-based)12. Sólo hay un estudio que evalúe los resultados del manejo, en concreto a los tres meses de la consulta, sin que existan diferencias sobre la eficacia del tratamiento pautado en CP frente al aplicado tras una teleconsulta de almacenamiento, con el valor añadido de ser un estudio aleatorizado90.
Estudios económicosHay dos estudio de costes en TDA que concluyen que la teleconsulta ahorra costes en el manejo del cáncer de piel91 y de pacientes ingresados en instituciones35. En un tercer estudio la TDA resulta más cara que la CP para el servicio de salud (36 $ frente a 21 $ por paciente), pero se hace más coste-efectiva desde el punto de vista social, tomando en cuenta los gastos ocasionados al paciente en viajes y tiempo de trabajo perdido75.
Los estudios iniciales en TDTR concluían que este tipo de consulta es más cara que la convencional (tabla 5), pero puede resultar más coste-efectiva en ámbitos rurales (dependiendo en especial de la distancia entre el CS y el hospital) y para la atención de pacientes ingresados en instituciones (especialmente residencias de ancianos o prisiones). Se debe recalcar que los costes salvados lo son para los propios pacientes (viajes, tiempo de trabajo perdido, etc.) y no para el sistema de salud, para el que generalmente resultará más gravoso el sistema de TD que la CP.
Análisis económico en teledermatología
Autor-año | Análisis | Coste TD | Coste CP | Teleconsulta | Ámbito |
Zelickson-9735 | Costes | 71,45 $ pp | 105 $ pp | TDA | Residencia |
Wootton-0072 | Coste-beneficio | 132 £ pp | 49 £ pp | TDTR | General |
Loane-0174 | Coste-beneficio | 146 £ pp | 47 £ pp | TDTR | Urbano |
Loane-0174 | Coste-beneficio | 180 £ pp | 49 £ pp | TDTR | Rural |
Laminen-0083 | Coste | 18,6 FM ct | 18 FM ct | TDTR | General |
Bergmo-0093 | Coste-minimización | 470 NKr ct | 635 NKr ct | TDTR | General |
Chan-0061 | Coste | 57 HK$ pp | 322 HK$ pp | TDTR | Residencia |
Loane-0173 | Coste-minimización | 279 NZ$ pp | 283 NZ$ pp | TDTR | Rural |
Whited-0375 | Coste-efectividad | 36,40$ pp | 21,40$ pp | TDA | General |
Armstrong-0792 | Coste-minimización | 274$ ph | 346$ ph | TDTR | Rural |
ct: coste total; FM: marco finlandés; HK$: dólares Hon-Kong; £: libras británicas; NKr: coronas noruegas; NZ$: dólares neozelandeses; ph: por hora; pp: por paciente; TDA: teledermatología de almacenamiento; TDTR: teledermatología en tiempo real.
Estos estudios se publicaron hace seis o más años, y el precio de la tecnología de ordenadores personales y de redes ha bajado considerablemente, aparte de que ya en cada centro se cuenta con potentes equipos informáticos y redes de telecomunicaciones para múltiples menesteres. En la actualidad la inversión en equipamiento se minimiza sobremanera. De hecho, el último estudio publicado indica que la TDTR92 sería más coste-efectiva que la CP.
Estudios de satisfacciónHay que recalcar que no existen instrumentos validados específicos para medir la satisfacción de médicos y pacientes en esta área.
Los pacientes (tabla 6) no muestran preferencias claras, ya sea por la teleconsulta ya sea por la consulta convencional, ni en TDA94-96 ni en TDTR25,32,97,98. En las revisiones sistemáticas a este respecto se destaca que los estudios apuntan a un grado aceptable de satisfacción de los pacientes, pero adolecen de claros defectos metodológicos94,99,100.
Sumario sobre estudios de satisfacción de pacientes
Modalidad | Autor-año | Hechos positivos | Hechos negativos |
TDA | Weinstock-02101 | El 75 % recomendaría la TD | El 37 % consideró pobre el sistema; larga espera para conocer el resultado |
Pak-99102 | El 42 % prefiere TD | El 47 % sin seguimiento tras consulta | |
Kvedar-99103 | Satisfacción global el 93% | El 30 % disconforme con no poder hablar con el dermatólogo | |
TDTR | Nordal-0132 | El 61 % no encuentra desventajas | El 14 % ve la ausencia de palpación como limitación |
Loane-9897 y Gilmour-9825 | Del 59 al 66 % ve la TD tan buena como la CP | Del 13 al 18 % se siente incómodo con la cámara de vídeo | |
Artiles-0498 | Más del 93 % recomendaría el sistema y lo usaría de nuevo | El 28 % se sintió incómodo |
CP: consulta de presencia; TDA: teledermatología de almacenamiento; TDTR: teledermatología en tiempo real.
Con relación a los MAP (tabla 7), en un estudio se hace mención expresa de la escasa aceptación de un sistema TDA en el que los médicos tenían que recabar datos clínicos, tomar fotos clínicas y remitir esta información al dermatólogo95. Esta sobrecarga de trabajo llevó a que sólo un 23 % de los MAP considerara el uso futuro de la TD. Esta queja también se advierte en algunos estudios101,103, pero no en otros52,96, y en general los MAP seguirían utilizando el sistema en el futuro96,101,103. Los MAP habitualmente advierten un beneficio en formación médica tanto en TDA 87,104 como en TDTR 25,105.
Sumario sobre estudios de satisfacción de médicos (de Atención Primaria y dermatólogos)
Modalidad y médico | Autor-año | Hechos positivos | Hechos negativos |
TDA/MAP | Weinstock-02101 | El 74 % recomendaría TD | El proceso de teleconsulta lleva mucho tiempo |
Pak-99102 | Mejora en FMC | ||
Kvedar-99103 | Continuarían usando la TD. La ven como método conveniente | Requerimiento de tiempo en rellenar la teleconsulta | |
Van den Akker-0187 | Beneficio en FMC | ||
TDTR/MAP | Gilmour-9825 | El 75 % beneficio en FMC | Problemas de calidad de sonido e imagen |
Jones-96105 | Beneficio en FMC | Tiempo consumido en consultas | |
TDA/dermatólogo | Pak-99102 | El 70 % de las consultas son de suficiente calidad | Menor confianza en el diagnóstico que en la CP |
Van den Akker-0187 | Menor confianza en el diagnóstico que en la CP | ||
TDTR/dermatólogo | Lowitt-9822 | El 98 % permitía buena comunicación con el paciente | Menor confianza en el diagnóstico que en la CP |
Nordal-0132 | El 80 % similar a la CP | Mejor contacto con pacientes en la CP | |
Artiles-0498 | El 71 % satisfecho con la interacción conseguida | El 48 % habría obtenido más información en la CP |
CP: consulta de presencia; FMC: formación médica continuada; MAP: médico de Atención Primaria; TD: teledermatología; TDA: teledermatología de almacenamiento; TDTR: teledermatología en tiempo real.
Los dermatólogos (tabla 7) consideran suficiente el sistema para diagnóstico tanto en TDA52,87 como en TDTR22,32, aunque también con ambos sistemas se sienten menos seguros que con la CP22,32,52,96.
Análisis finalLa TD ha demostrado ser factible y fiable, pero aún está lejos de alcanzar su madurez como tecnología médica para su práctica habitual. El área mejor estudiada es la de fiabilidad en el diagnóstico y el manejo, donde existen un gran número de estudios, aunque muchos de ellos adolecen de importantes defectos metodológicos. Existen estudios de validez en oncología cutánea con metodología correcta que demuestran una validez comparable con la CP.
Es difícil mantener la tensión entre implementación y validación de sistemas en TM106. Se hace preciso el diseño de estudios en resultados de salud que permitan un análisis fidedigno de resultados finales, costes y satisfacción de los sistemas de TD.
Conflicto de intereses
Declaramos no tener ningún conflicto de intereses.