Aunque existen múltiples estudios de fiabilidad diagnóstica en teledermatología de almacenamiento (TDA), aún no se ha demostrado una fiabilidad elevada para enfermedad general cutánea en un escenario real. DERMATEL-2 fue un estudio aleatorizado de concordancia diagnóstica en TDA en condiciones de práctica clínica.
Material y métodosPacientes remitidos desde atención primaria fueron aleatorizados en 3 grupos: TDA; híbrida videoconferencia-almacenamiento (VC-TDA) y grupo control (GC). Este artículo se centra en el grupo de almacenamiento. Médicos de atención primaria tomaron datos y fotografías clínicas remitiéndolas a distancia. Cada consulta de TDA fue evaluada por 3 dermatólogos diferentes (D1,D2,D3). Todos los pacientes fueron finalmente vistos por el mismo dermatólogo (D1) en la consulta presencial (CP). Dos dermatólogos adicionales (D4, D5) evaluaron las concordancias TDA-CP.
ResultadosSe aleatorizaron un total de 457 pacientes 4-4-2: 192 TDA, 176 VC-TDA y 89 GC; 200 varones y 257 mujeres, 0-86 años. Se incuyó enfermedad tumoral (49,4%), inflamatoria (25,7%), anexial (11%), infecciosa (9,4%) y otros (4,4%). Hubo 170 pacientes de TDA válidos para el análisis, rindiendo 510 teleconsultas-TDA. La imagen (71,2%), la historia clínica (91,2%) y la confianza diagnóstica (81,4%) fueron de calidad alta. En el 58,4% fue posible el manejo exclusivo on-line. Los acuerdos interobservador (completo/agregado) TDA-CP fueron 0,72/0,90 para el diagnóstico y 0,61/0,80 en el tratamiento. El acuerdo diagnóstico se correlacionó con la calidad de la imagen (p<0,001), la confianza diagnóstica (p<0,001), la necesidad de consulta presencial (p<0,001) y la calidad de la historia clínica (p=0,013).
ConclusiónLa fiabilidad diagnóstica de la TDA en condiciones de práctica clínica es elevada. Los dermatólogos pueden predecir errores diagnósticos analizando su confianza diagnóstica y la calidad de las fotografías.
Although many studies have evaluated the diagnostic reliability of store-and-forward (SF) teledermatology, the reliability of the technique for the diagnosis of general skin conditions in a clinical practice setting has never been demonstrated. We evaluated the reliability of SF teledermatology in clinical practice by analyzing the diagnostic agreement achieved in a subgroup of patients from the DERMATEL-2 study.
Material and methodsPatients referred from primary care settings were randomized to 3 groups: SF, a combination of videoconferencing and SF technology (VC-SF), and a control group. This article focuses on the SF group. Clinical data were recorded and photographs taken by primary care physicians, who forwarded the data electronically. Each SF consultation package was assessed by 3 dermatologists (D1,D2,D3). Subsequently all the patients were assessed by a single dermatologist (D1) in a face-to-face consultation. Finally, 2 other dermatologists (D4,D5) assessed the agreement between the diagnoses obtained by SF and FF.
ResultsIn total, 457 patients (200 males and 257 females) aged between 2 months and 86 years were randomized (192 to SF, 176 to VC-SF, and 89 to the control group). The diagnostic categories were as follows: tumors (49.4%), inflammatory (25.7%), adnexal (11%), infectious (9.4%) and other processes (4.4%) Since 170 patients had consultations deemed valid for analysis, the study included a total of 510 SF assessments. Most of the images and clinical records were of high quality (71.2% and 91.2% respectively), and diagnostic confidence was high in 81.4% of the cases studied.
In 58.4% of cases the condition was managed exclusively by teledermatology. Levels of complete and aggregate interobserver agreement between SF and face-to-face evaluators were 0,72 and 0.90, respectively, for diagnosis and 0.61 and 0.80 for treatment. Diagnostic agreement correlated with the image quality (P < .001), diagnostic confidence (P<.001), felt need for conventional consultation (P<.001), and the quality of the clinical record (P=.013).
ConclusionThe interobserver reliability of SF diagnosis in clinical practice is good. Dermatologists are able to predict errors in diagnosis by analyzing their own diagnostic confidence and evaluating the quality of the images.
Pacientes, médicos e instituciones utilizan cada vez más los servicios de telemedicina1, esperándose un crecimiento para el mercado mundial de telemedicina de 9,8 mil millones de dólares en 2010 a 27,3 mil millones de dólares en 20162. La dermatología es una disciplina que parece ideal para la telemedicina3, de hecho es la especialidad clínica que cuenta con un mayor número de estudios en telemedicina1. La teledermatología (TD) se lleva a cabo por medio de sistemas de videoconferencia en tiempo real (VC) o mediante la transmisión y almacenamiento de imágenes fijas para la evaluación en un segundo tiempo (sistemas de teledermatología de almacenamiento [TDA]). La VC exige mayor coordinación consumiendo tiempo y recursos4,5 y puede ser más cara que la consulta de presencia física (CP)6. Aunque la VC permite interacción directa con el paciente, su fiabilidad (acuerdos en diagnóstico) puede ser similar a la de los sistemas TDA4,7,8. Por ello estos sistemas TDA se consideran cada vez más rentables y convenientes por profesionales sanitarios y proveedores de salud9.
La telemedicina es una intervención compleja que depende de múltiples interacciones, así como de variaciones locales en la administración y organización. Ello complica la realización de estudios con alto nivel de evidencia, como son los ensayos clínicos aleatorizados (ECA). Una revisión sistemática concluyó que la TD está lejos de la madurez10, siendo necesarios más estudios aleatorizados con pacientes reales para proporcionar niveles altos de evidencia.
Los estudios de fiabilidad (concordancia diagnóstica) constituyen el campo de mayor producción científica en TD11. Estos estudios usualmente distinguen entre acuerdos completos (para un único diagnóstico emitido) y agregados (incluyendo algún diagnóstico diferencial [tabla 1]). Aunque la fiabilidad diagnóstica puede ser alta, varía ampliamente, desde 47-90% para el acuerdo completo (AC) al 60-99% para el acuerdo agregado (AA)1,11. En TDA, a pesar del gran número de estudios de fiabilidad diagnóstica, no hay estudios controlados aleatorizados y la práctica totalidad de ellos se realizaron en un entorno experimental y no de práctica clínica10.
Formularios y escalas de acuerdo en DERMATEL
A) Datos recogidos en el formulario de consulta del médico de atención primaria |
1. Antecedentes personales y familiares |
2. Motivo de consulta |
3. Tiempo de evolución del proceso clínico |
4. Localización de las lesiones |
5. Síntomas (prurito, dolor, otros) |
6. Diagnóstico |
7. Tratamiento |
B) Datos recogidos en el formulario de consulta del dermatólogo |
1. Diagnóstico: recogido como un único diagnóstico más probable o como diagnóstico diferencial. Se utilizó la codificación CIE-9 modificada para dermatología |
2. Tratamiento recomendado |
3. Pruebas diagnósticas recomendadas, incluyendo biopsia, microbiología, analítica y otras |
4. Necesidad de seguimiento (sí o no) |
5. Calidad de las fotografías digitales transmitidas (buena o mala) |
6. Calidad de la historia clínica referida por el MAP (buena o mala) |
7. Confianza del dermatólogo en su telediagnóstico, categorizado en la escala de Likert (5 items, ver texto) |
8. Necesidad de consulta presencial convencional después de la evaluación de la teleconsulta, categorizada como: no necesaria, necesaria para el diagnóstico, necesaria para el manejo y necesaria para el diagnóstico y el manejo |
C) Escalas de acuerdo |
I. Acuerdo diagnóstico |
1. Acuerdo completo (AC): un único diagnóstico emitido y es concordante |
2. Acuerdo parcial (AP): se emite diagnóstico diferencial y al menos un diagnóstico es concordante |
3. Acuerdo agregado (AA): suma de AC y AP |
4. Desacuerdo: diagnósticos no concordantes, independientemente de si se emitió o no un diagnóstico diferencial |
II. Acuerdo en tratamiento |
1. AC: tratamiento idéntico en ambas modalidades de consulta |
2. AP: pequeñas diferencias entre las 2 modalidades de consulta, incluida la variabilidad aceptada en terapia |
3. AA: suma de AC y AP |
4. Desacuerdo (D): tratamientos diferentes (variabilidad no aceptada en terapia) |
En la práctica de rutina es el médico de atención primaria u otro profesional de la salud el que a distancia del hospital, normalmente en el centro de salud, ve al paciente, registra la información clínica y toma las fotografías que son enviadas a través de una intranet o de Internet. A posteriori los datos son evaluados a distancia por el teledermatólogo en el hospital. Sin embargo, en la práctica totalidad de estudios de fiabilidad de TDA publicados, los datos y fotos clínicas fueron tomados localmente en el propio hospital (no a distancia) y no por médicos de atención primaria, sino por expertos, ya sea dermatólogos, residentes de dermatología, fotógrafos profesionales o asistentes de investigación11,12. Este sesgo podría incrementar falsamente la fiabilidad.
De hecho no existe ningún estudio que muestre una elevada fiabilidad de la TDA para enfermedad cutánea general en un escenario real de práctica clínica habitual. Este fue el principal objetivo del presente estudio: evaluar la fiabilidad interobservador de un sistema TDA remoto en condiciones de práctica clínica habitual. Un objetivo secundario fue analizar si en este entorno el teledermatólogo puede o no predecir sus propios errores diagnósticos.
Material y métodosDiseño del estudioDERMATEL fue un estudio prospectivo, aleatorizado, controlado, experimental de concordancia diagnóstica, utilizando un diseño de medidas repetidas. El único criterio de inclusión fue que el paciente fuera a ser derivado desde atención primaria a especializada por un problema dermatológico no previamente evaluado por un dermatólogo. Los pacientes que aceptaron participar firmaron un consentimiento informado aprobado por el comité de investigación del hospital.
Se remitieron pacientes desde 6 centros de salud entre junio de 2004 a diciembre de 2005, incluyéndose un total 457 pacientes. Para aleatorizar a los pacientes se utilizó un algoritmo 4:4:2 computarizado y centralizado a través de Internet: 192 en el grupo de TDA, 176 en el grupo híbrido VC-TDA y 89 en el grupo control (GC). Los resultados del grupo VC ya han sido publicados4, y este artículo se centra en el grupo de TDA.
Participaron 5 dermatólogos y 18 médicos de atención primaria (MAP), 12 generalistas y 6 pediatras. Todos ellos recibieron formación en el uso del software y se realizaron talleres de fotografía con los MAP. Se insistió en la necesidad de tomar al menos 2-3 imágenes, incluyendo planos generales para identificar el sitio y la distribución lesional y tomas de detalle. Se dieron instrucciones para una buena iluminación de la sala y flash obligado en todas las tomas. Los dermatólogos eran adjuntos con un promedio de 8 años de experiencia clínica, y solo uno tenía experiencia en TD (3 años) en el momento del estudio.
Tras la aleatorización los médicos de atención primaria tomaron las fotografías clínicas y completaron el formulario de consulta preestablecido para todos los pacientes, enviando la información a la web del hospital. Tres dermatólogos (D1, D2 y D3) evaluaron on-line a cada uno de los pacientes del grupo de TDA. Un único dermatólogo (D1), 2 días tras realizar la teleconsulta, vio de nuevo a todos los pacientes en la consulta presencial, considerada el estándar de referencia. El GC solo se evaluó en la modalidad de consulta presencial. El manejo del grupo híbrido VC-TDA forma parte de otro estudio cuyos resultados ya han sido publicados4.
Aspectos técnicos y recopilación de datosSe desarrolló un software para consulta a distancia especialmente diseñado (DERMARED) basado en una aplicación web con base de datos centralizada en la intranet del Servicio de Salud de Castilla la Mancha (SESCAM). Los médicos utilizaron cámaras digitales de gama media (Cybershot DSC-F717 [Sony, Tokio, Japón] o Coolpix 4500 [Nikon, Tokio, Japón]) con compresión JPEG.
Se utilizaron 4 formularios por paciente (tabla 1), incluyendo datos demográficos, datos clínicos referidos por el médico de cabecera, datos recogidos por el dermatólogo y un formulario de comparación entre consultas según las escalas de acuerdo predefinidas.
Análisis de los datosPara evaluar la confianza del dermatólogo en el diagnóstico emitido se utilizó la escala de Likert, adecuada para la medición de las actitudes. En esta escala los individuos eligen entre una serie continua de alternativas que van desde el máximo al mínimo, siendo clasificada la confianza en el diagnóstico emitido como muy alta, alta, media, baja o muy baja.
Los formularios fueron procesados con el programa estadístico SPSS (SPSS Inc, Chicago, IL, EE. UU.). Dos dermatólogos independientes (D4 y D5) establecieron el grado de concordancia entre los datos recogidos en la consulta remota y presencial para cada paciente. El análisis se realizó mediante la prueba de Chi-cuadrado para las tablas×2. Para analizar si el teledermatólogo puede predecir sus propios errores, los porcentajes del acuerdo fueron estratificados por grado de confianza mostrado por el dermatólogo en el diagnóstico, calidad de la imagen, calidad de la historia clínica referida por el médico de cabecera y necesidad de consulta presencial para la evaluación del paciente.
ResultadosDescripción de la muestraSe incluyeron 457 pacientes: 200 varones (44%) y 257 mujeres (56%) con una edad media de 36 años (rango: 2 meses-86 años). La distribución por categoría diagnóstica fue la siguiente: tumoral (49,4%), inflamatoria (25,7%), anexial (11%), infecciosas (9,4%) y otros (4,4%). No hubo diferencias significativas entre los grupos de TDA, VC-TDA y GC en términos de edad (ANOVA p=0,057), sexo (Chi-cuadrado 2,13, p=0,334) y categoría diagnóstica (Chi-cuadrado 14,538 y p=0,268).
No acudió a consulta presencial el 11,4% de los pacientes del grupo de TDA y el 10,2% del grupo híbrido VC-TDA (diferencia sin significación, con p=0,417). Fueron válidos para el análisis 170 de los 192 pacientes aleatorizados del grupo de TDA sobre el que se centra este artículo. La triple evaluación por cada uno de los 3 dermatólogos participantes supone una muestra de un total de 510 teleconsultas de almacenamiento.
Acuerdos en diagnósticoLa tabla 2 expresa los acuerdos diagnósticos entre dermatólogos intermodalidad (teleconsulta vs presencia) e intramodalidad (teleconsulta vs teleconsulta). Los acuerdos completos y agregados (AC/AA) en la comparativa interobservador (D2-D1 y D3-D1) entre teleconsulta y CP fueron elevados tanto para el diagnóstico (0,72/0,90) como para el tratamiento (0,61/0,80). La concordancia diagnóstica intraobservador (D1 vs D1) fue significativamente mayor que el acuerdo entre observadores (p=0,0001).
Acuerdo diagnóstico intermodalidad (TDA vs CP) e intramodalidad (TDA vs TDA) en porcentajes entre los tres dermatólogos (D1, D2 y D3)
Acuerdo diagnóstico | Intermodalidad: TDA vs CP (validez) | |||
TDA D2-CP D1N=170 | TDA D3-CP D1N=170 | TDA D1-CP D1N=170 | TDA-CP ×3 (IC 95%) | |
Completo | 72,9 | 72,4 | 88,2 | 77,8 (74,1-81,4) |
Parcial | 15,3 | 20,0 | 7,6 | 14,3 (11,2-17,3) |
Desacuerdo | 11,8 | 7,6 | 4,1 | 7,8 (5,4-10,1) |
Acuerdo diagnóstico | Intramodalidad: TDA vs TDA (fiabilidad) | |||
TDA D1- TDA D2N=170 | TDA D1-TDA D3N=170 | TDA D2-TDA D3N=170 | TDA- TDA ×3 (IC 95%) | |
Completo | 69,4 | 72,9 | 67,1 | 69,8 (65,8-73,7) |
Parcial | 15,3 | 15,9 | 19,4 | 16,9 (13,6-20,1) |
Desacuerdo | 15,3 | 11,2 | 13,5 | 13,3 (10,3-16,2) |
Tras la teleconsulta de almacenamiento los dermatólogos consideraron que el 18% de los pacientes contaban con fotografías de mala calidad, y un 8,8% de las historias clínicas remitidas fueron calificadas como deficientes. Un 58% de los pacientes evaluados no requeriría consulta presencial (tabla 3). La seguridad en el diagnóstico percibida por el dermatólogo fue alta en un 81% de los casos. La evaluación fue diferente entre los dermatólogos (p<0,001) para los 4 ítems. El más joven (D2) fue más exigente con la calidad de las fotos y menos con la historia clínica. D2 fue también el más inseguro con el diagnóstico y la gestión on-line exclusiva. El dermatólogo con experiencia en TD (D1) tuvo mayor confianza en sus diagnósticos y consideró necesarias menos consultas presenciales.
Necesidad de consulta presencial en las 510 teleconsultas del grupo TDA
Necesidad de consulta presencial | TDA-D1 | TDA-D2 | TDA-D3 | Total |
Para diagnóstico | 23 (13,5%) | 30 (17,6%) | 36 (21,2%) | 89 (16,3%) |
Para manejo | 4 (2,4%) | 40 (23,5%) | 34 (20,0%) | 78 (13,5%) |
Para diagnóstico y manejo | 14 (8,2%) | 32 (18,8%) | 16 (9,4%) | 62 (11,8%) |
No necesaria | 129 (75,9%) | 68 (40,0%) | 84 (49,4%) | 281 (58,4%) |
Total | 170 (100,0%) | 170 (100,0%) | 170 (100,0%) | 510 (100,0%) |
Los acuerdos diagnósticos correlacionaron de forma estadísticamente significativa con la confianza diagnóstica, la estimación de necesidad de consulta presencial, la calidad de las imágenes transmitidas y, en menor medida, con la calidad de la historia clínica (tabla 4). En el grupo de pacientes sin necesidad de CP para diagnóstico el AC fue superior al 78%. Sin embargo, esta cifra se redujo al 43% cuando se consideró necesaria la CP para lograr un diagnóstico válido (Chi-cuadrado 64,301, p<0,001).
Factores modificadores del acuerdo diagnóstico en TDA
Factores modificadores | Acuerdo en diagnóstico (%) | Análisis | ||||
Factores | Nivel | Completo | Parcial | Desacuerdo | Chi-cuadrado | p |
Confianza diagnóstica | Baja | 47,2 | 18,1 | 34,7 | 34,960 | 0,000 |
Alta | 73,5 | 16,7 | 9,8 | |||
Necesidad de consulta presencial | Sí | 43,1 | 25,2 | 31,7 | 64,301 | 0,000 |
No | 78,3 | 14,2 | 7,5 | |||
Calidad imagen | Mala | 57,6 | 17,4 | 25,0 | 22,029 | 0,000 |
Buena | 74,1 | 16,7 | 9,3 | |||
Calidad historia clínica | Mala | 46,7 | 33,3 | 20,0 | 8,635 | p=0,013 |
Buena | 71,3 | 15,8 | 12,9 |
El AC fue mayor para el acné (0,905) y las infecciones (0,804) que incluían las verrugas vulgares. La diferencia fue significativa para el acné (p=0,03), pero no para las infecciones (p=0,083). El AC fue similar para tumores (0,69) que para enfermedad inflamatoria (0,65), con p=0,4421.
Análisis de acuerdos y erroresEn relación con la presencia de errores graves solo uno de los 3 dermatólogos hizo el diagnóstico por teleconsulta de un carcinoma de lengua. No obstante, los 3 teleconsultores recomendaron consulta presencial y toma de biopsia. Las imágenes del caso fueron consideradas de forma unánime de mala calidad, aunque permitieron en los 3 casos calificar la lesión elemental como úlcera.
En contraposición, los 3 dermatólogos diagnosticaron de forma correcta por teleconsulta los 9 casos de cáncer de piel no melanoma que incluía la muestra: 6 carcinomas basocelulares, un carcinoma epidermoide de piel, otro de labio y un queratoacantoma. No hubo melanomas en la muestra. Solo 3 de 170 casos no fueron diagnosticados correctamente por teleconsulta por ninguno de los 3 teledermatólogos: una pitiriasis rosada, un nevus acrómico y un xantogranuloma juvenil. En otros 4 casos había discrepancias notables (tabla 5). Por el contrario, la concordancia diagnóstica agregada fue perfecta (tabla 6) entre las 4 valoraciones, las 3 teleconsultas y la consulta presencial, en 137 de los 170 pacientes (80,5%).
Casos ilustrativos con discrepancias entre las 4 valoraciones, 3 por teleconsulta (D1, D2, D3) y la presencial (D1)
Casos | CP D1 | TDA-D1 | TDA-D2 | TDA-D3 | AP | NCP | CD | CF |
Caso 1 | Pilomatrixoma | Dermatofibroma vs quiste epidérmico | Quiste epidérmico | Dermatofibroma vs angioleiomioma | Xantogranuloma juvenil | Sí | Baja | Mala |
Caso 2 | Pitiriasis rosada | Dermatitis seborreica | Eccema agudo vs dermatitis seborreica | Dermatitis seborreica | NA | Sí | Baja | Mala |
Caso 3 | Nevus acrómico | Liquen escleroatrófico vs vitíligo | Vitíligo vs liquen escleroatrófico | Vitíligo | NA | Sí | Baja | Mala |
Caso 4 | Granuloma anular vs verruga vulgar | Verruga vulgar en mosaico | Verruga vulgar | Granuloma anular | Granuloma anular | Sí | Baja | Media |
Caso 5 | Carcinoma lingual | Carcinoma lingual | Aftosis major vs úlcera traumática | Úlcera eosinofílica | Carcinoma lingual | Sí | Baja | Mala |
Caso 6 | Alopecia en lupus discoide | Alopecia areata | Alopecia cicatricial | Alopecia | Lupus discoide | Sí | Baja | Mala |
Caso 7 | LE inducido por drogas | LE inducido por drogas | LE subagudo vs LE inducido por drogas | Fotoeccema | Lupus eritematoso | Sí | Alta | Buena |
AP: anatomía patológica; CD: confianza diagnóstica; CF: calidad de fotos; LE: lupus eritematoso; NA: no aplicable; NCP: necesidad de consulta de presencia;
Número de casos con acuerdo diagnóstico agregado perfecto entre las 4 valoraciones (3 teleconsultas y la presencial): total 137/170 casos (80,5%)
Tumoral benigna (56): nevus melanocíticos (17 adquiridos, 4 congénitos, un halo), queratosis seborreica (14), quistes epidérmicos (4), dermatofibroma (3), angioma capilar (2), nevus sebáceo (2), queratosis seborreica irritada (una), acrocordón (uno), lentigo solar (uno), xantelasma (uno), quiste mucoso digital (uno), xantogranuloma juvenil (uno), nevus epidérmico verrugoso (uno), mastocitoma solitario (uno), poroqueratosis actínica superficial (uno) |
Inflamatoria (28): dermatitis atópica (5), psoriasis vulgar (5), dermatitis de contacto (3), dermatitis de estasis (2), pitiriasis amiantácea (2), púrpura pigmentaria (2), pitiriasis alba (uno), urticaria aguda (uno), picadura de insectos (uno), granuloma anular (uno), prurito sine materia (uno), morfea (uno), liquen plano (uno), liquen escleroatrófico (uno), penfigoide ampolloso (uno) |
Infecciosa (19): verruga vulgar (8), molusco contagioso (4), condiloma acuminado (2), pitiriasis versicolor (2), verruga plantar (una), herpes zoster (uno), intértrigo candidiásico (uno) |
Tumoral maligno (15): carcinoma basocelular (6), queratosis actínica (5), queratosis actínica hipertrófica (uno), queratoacantoma (uno), carcinoma epidermoide de piel (uno), carcinoma epidermoide de labio (uno) |
ANEXIAL (15): acné vulgar (6), alopecia androgenética (4), rosácea (2), acné conglobata (uno), onicodistrofia (uno), hematoma subungueal (uno) |
Otros (4): melasma (uno), hipomelanosis de Ito (uno), estrías de distensión (uno), araña vascular (uno) |
El grado de acuerdo entre los dermatólogos en teleconsulta fue muy alto, tanto en la solicitud de pruebas de diagnóstico (concordantes en>80%) como en la necesidad o no de seguimiento del paciente (concordantes en>70% de los casos). El tratamiento fue idéntico en el 51,3% y similar en un 20,8% (tabla 7). Por tanto, el desacuerdo en el tratamiento (27,8%) fue claramente mayor que en el diagnóstico (13,3%).
Acuerdos en tratamiento intermodalidad (TDA vs CP) e intramodalidad (TDA vs CP) en porcentajes
Acuerdos en tratamiento | Intermodalidad: TDA vs CP (validez) | |||
TDA D2-CP D1N=170 | TDA D3-CP D1N=170 | TDA D1-CP D1N=170 | TDA-CP ×3 (IC 95%) | |
Completo | 57,1 | 65,9 | 85,3 | 69,4 (74,1-81,4) |
Parcial | 20,0 | 17,6 | 7,1 | 14,9 (11,2-17,3) |
Desacuerdo | 22,9 | 16,5 | 7,6 | 15,6 (5,4-10,1) |
Acuerdos en tratamiento | Intramodalidad: TDA vs TDA (fiabilidad) | |||
TDA D1- TDA D2N=170 | TDA D1-TDA D3N=170 | TDA D2-TDA D3N=170 | TDA-TDA ×3 (IC 95%) | |
Completo | 44,1 | 52,4 | 57,6 | 51,3 (65,8-73,7) |
Parcial | 17,1 | 25,9 | 19,4 | 20,8 (13,6-20,1) |
Desacuerdo | 38,8 | 21,8 | 22,9 | 27,8 (10,3-16,2) |
En un escenario real en condiciones de práctica clínica habitual nuestros datos de acuerdo diagnóstico (AC/AA) superan el 75/90% para comparativas intermodalidad (TDA vs CP) y 70/85% intramodalidad (TDA vs TDA). Estos datos son comparables a las fiabilidades más altas entre las publicadas en más de 40 estudios sobre fiabilidad de la TDA5 y demuestran la elevada fiabilidad de la TDA en un escenario real.
Si bien la evidencia acumulada en esta área es de calidad, puede verse comprometida por algunos sesgos1,13 que en parte hemos intentado soslayar en el presente estudio. DERMATEL es un estudio prospectivo, aleatorizado e incluye comparativas inter-observador. La muestra fue representativa de la población general, pues incluye todo tipo de enfermedades (no solo los tumores), con adecuada distribución por edad y sexo. La muestra para comparativas de TDA fue alta, con 510 teleconsultas (170×3), y lo más importante es que se desarrolló en un entorno habitual: desde los centros de salud y a distancia, 18 médicos de atención primaria tomaron fotografías y datos clínicos y los enviaron a través de Internet. Todas estas características proporcionan una alta validez interna y externa1.
La mayoría de los estudios de TDA previos evaluaron la fiabilidad en condiciones ideales de «laboratorio», no comparables a la del flujo de trabajo de rutina en una clínica normal1,10,11. En el estudio de Krupinski14 las fotos de los pacientes fueron tomadas por un estudiante de medicina dirigido por un dermatólogo, y en el de Lyon15 por un residente en dermatología. En un estudio16 es un fotógrafo profesional, en otros un asistente de investigación17,18 y, por último, en otros, es una enfermera entrenada en fotografía clínica7,19–21. En la mayoría de los estudios se toman las imágenes y datos clínicos en local, en el propio hospital, donde son evaluados7,15–21 por el «tele» dermatólogo. Esta sistemática facilita la realización del estudio, pero puede introducir algunos sesgos.
De hecho, cuando son diferentes MAP los que toman las fotografías y los datos clínicos, y los remiten desde una ubicación remota los resultados no son tan buenos12,22,23. Solo 2 estudios de TDA son similares a DERMATEL, evaluando todo tipo de enfermedad (tumoral y no tumoral) y emulando la práctica clínica habitual12,22. El estudio británico22 no permitió conclusiones válidas debido a problemas de diseño. Los resultados del otro estudio12 son los más bajos de los 41 estudios de TDA publicados con un 54% de AC y un 63% AA13. Los autores atribuyen sus malos resultados precisamente a las condiciones reales de su estudio frente a las condiciones ideales de los otros estudios12. Hay estudios centrados en enfermedad tumoral que sí alcanzan elevadas fiabilidades en un entorno práctico, lo que apoya nuestros resultados24. Era un objetivo importante demostrar la fiabilidad diagnóstica de la TDA en un escenario real para enfermedad dermatológica general, no solo tumoral.
DERMATEL fue diseñado con el uso de un formulario preestablecido de historia clínica que contiene una serie de ítems claros, algunos obligados, dando formación a los MAP con talleres de fotografía digital y centralizando la recopilación de datos en el hospital. Estas características pueden explicar por qué nuestros resultados superan la media de los comunicados en la literatura.
Nuestra concordancia diagnóstica intraobservador es muy alta y se solapa con el estudio que marcó las fiabilidades más elevadas25. Finalmente nuestros resultados de fiabilidad (acuerdo interobservador intramodalidad TDA vs TDA) son similares a los publicados7,14,16,17.
En DERMATEL (tabla 2) los acuerdos en el diagnóstico dependen de la confianza en el diagnóstico y la estimación de la necesidad de consulta presencial por el teledermatólogo, y en menor medida de la calidad de las imágenes y de la historia clínica remitidas. Evaluando estos ítems el teledermatólogo puede estimar la posibilidad de error diagnóstico y evitarlo recomendando consultas presenciales. Si bien la correlación entre acuerdo y confianza diagnóstica ha sido bien estudiada en la literatura 7,14,18, este no es el caso de la correlación entre el acuerdo diagnóstico y la decisión para indicar consulta presencial, no informada previamente4.
El análisis estadístico en nuestro estudio demuestra con elevada significación (p<0,000 y Chi-cuadrado>34,9) que el teledermatólogo puede predecir y prevenir errores de diagnóstico (tabla 4). Si considera que la fotografía es de calidad, la historia clínica es suficiente y tiene confianza en su diagnóstico el potencial de error es muy bajo. Cuando piensa que la fotografía es de mala calidad, la historia clínica es insuficiente o su certeza diagnóstica es baja puede indicar la necesidad de ver al paciente en consulta presencial, y así evitar el error de diagnóstico.
DERMATEL también muestra que el dermatólogo como morfólogo experto puede fácilmente hacer el diagnóstico cuando el caso clínico es característico y tiene una buena imagen clínica. Lógicamente, si el caso no es clínicamente típico o es complejo (por ejemplo, enfermedad autoinmune, psoriasis severa o eczema de contacto) es preciso ver al paciente presencialmente en la clínica para el manejo.
El análisis de errores muestra que muy diversa patología (tabla 6) se puede diagnosticar con alta fiabilidad. Esto incluye la patología banal y común (verruga vulgar o nevus melanocítico), enfermedades raras (poroqueratosis actínica superficial o mastocitoma solitario) y también casos potencialmente graves (cáncer de piel no melanoma o enfermedades ampollosas). Los desacuerdos (tabla 5) pueden ilustrar algunas limitaciones típicas de la TD. Se ha sugerido26 la dificultad en el diagnóstico de lesiones intraorales (caso 5) o de cuero cabelludo (caso 6) más difíciles de fotografiar, así como en lesiones nodulares que lógicamente requieren la palpación (caso 1). En todos los casos de desacuerdos significativos las fotos fueron de mala calidad y los dermatólogos recomendaron consulta presencial.
Un grupo importante de pacientes pueden ser manejados on-line, evitando consultas de presencia. En muchos casos, a pesar del correcto diagnóstico, será necesario ver presencialmente al paciente para su manejo, ya sea para pruebas diagnósticas o procedimientos de terapia (tabla 3). Esto condiciona que la TDA solo prevenga un 50% de las derivaciones presenciales27. Hacer una gestión pre-quirúrgica on-line28 puede evitar un 15% adicional de CP de pacientes que irían directamente al quirófano tras la teleconsulta.
DERMATEL se completó en 2007. Desde entonces nuestro grupo ha desarrollado un software (DERCAM) que integra la imagen digital en el PACS de radiología y permite la realización de TDA. Con este sistema, introducido en 2009 en nuestro hospital, 4 dermatólogos han visto más de 2.000 pacientes, el 53% de los cuales evitaron la CP. Hemos seguido midiendo la calidad de las fotografías y la confianza en el diagnóstico del dermatólogo. Los resultados reales son comparables a los experimentales en DERMATEL: confianza diagnóstica alta en el 74% y alta calidad de la foto en el 81%.
Una revisión sistemática mostró la necesidad de más estudios de calidad en TD para proporcionar un alto nivel de evidencia antes de su aplicación como práctica clínica habitual10. Creemos que el presente estudio y otros recientes29–32 aportan pruebas que apoyan el uso rutinario de la TD. Un ensayo clínico aleatorizado mostró que la TDA constituye una estrategia de ahorro de costes en la prestación de cuidados en dermatología30 y produce similares resultados clínicos cuando se compara con la consulta convencional31. Un trabajo reciente muestra que la TDA es factible a gran escala29: 1.820 MAP y 166 dermatólogos realizaron más de 37.000 consultas a distancia entre 2007 y 2010, evitando un 74% de CP, llegando a la conclusión de que la TDA debería considerarse como una vía alternativa de derivación a atención especializada desde primaria; nuestro punto de vista es similar.
La validez diagnóstica de la TDA para tumores cutáneos respecto al patrón oro histológico es muy alta, pero aún es mayor en la consulta presencial5. DERMATEL muestra que el telermatólogo podría prever y prevenir estos errores indicando consultas presenciales ante la duda. Un ejemplo: el análisis de la literatura muestra la mayor capacidad de diagnóstico de la CP frente a la TD para las lesiones pigmentadas33, pero recientemente se ha demostrado en un entorno práctico un mejor diagnóstico precoz del melanoma maligno con el uso rutinario de TDA32, al contar con la colaboración de los MAP. La TD podría ofrecer algunas ventajas adicionales sobre la CP: accesibilidad, rapidez, costes, menos desplazamientos o mejoras en formación para los MAP. Algunas ventajas ya se han demostrado, no así otras. Son pues necesarios más estudios en resultados de salud en este ámbito1,5.
Una limitación del estudio, a nuestro juicio menor, es que solo contamos con la confirmación histológica en los pacientes con enfermedad tumoral maligna, una minoría. Sí que se realizó estudio histológico de los pacientes que plantearon dudas diagnósticas, ya fuera enfermedad inflamatoria o tumoral, lo que sirvió para aclarar las discrepancias (tabla 5). Sin embargo, y en especial para la enfermedad común no tumoral, como dermatitis seborreica o acné, el estándar oro práctico para el diagnóstico no es la histología, sino la opinión clínica del experto. En este sentido, una limitación de este y muchos otros estudios de TD es la falta de una medición válida de la fiabilidad interobservador entre los dermatólogos para la CP. Sería un factor crucial al medir la fiabilidad diagnóstica, pues es posible que los desacuerdos entre observadores (un teledermatólogo y dermatólogo en CP) no sean resultado de la tecnología utilizada en cada caso (teleconsulta vs presencia), sino de la propia variabilidad interobservador. Los resultados de los únicos 2 estudios que incluyeron esta medida son muy dispares17,34. Aunque muchos autores han llamado la atención sobre este problema1,12,17,35, sorprendentemente se ha llevado a cabo poca actividad investigadora para resolver la cuestión.
Para concluir, resaltar que nuestro estudio demuestra que la TDA es fiable en un escenario real. La independencia total en la prestación del servicio dermatológico, tanto en tiempo como en el espacio, hacen de la TDA una herramienta de enorme atractivo. Nuestros resultados enfatizan la importancia de utilizar una historia clínica estandarizada con ítems obligados y la necesidad de formación en talleres de fotografía digital. Lógicamente los dermatólogos deben ser conscientes de la gravedad potencial del proceso que evalúan. Siempre que la fotografía sea de mala calidad, o su confianza en el diagnóstico baja, deben recomendar la visita presencial o la repetición de la teleconsulta. Gradualmente se está acumulando evidencia de calidad que apoya el uso rutinario de la TD como vía alternativa a considerar en la derivación de pacientes a la atención especializada.
Responsabilidades éticasProtección de personas y animalesLos autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.
Confidencialidad de los datosLos autores declaran que han seguido los protocolos de su centro de trabajo sobre la publicación de datos de pacientes y que todos los pacientes incluidos en el estudio han recibido información suficiente y han dado su consentimiento informado por escrito para participar en dicho estudio.
Derecho a la privacidad y consentimiento informadoLos autores declaran que en este artículo no aparecen datos de pacientes.
Conflicto de interesesLos autores declaran que no tienen ningún conflicto de intereses.
FinanciaciónEste trabajo ha sido financiado dentro del Programa de Investigación Biomédica y en Ciencias de la Salud del Ministerio de Sanidad y Consumo del Fondo de Investigación Sanitaria (FIS), Expediente PI021695, cofinanciado con fondos FEDER y contando asimismo con la colaboración presupuestaria de la Fundación para la Investigación Sanitaria en Castilla-La Mancha (FISCAM).