Captchas y Accesibilidad

Sunday 2 de October, 2005, 0:11

Captchas y accesibilidad

Captchas y Accesibilidad.

Un problema frecuente en las aplicaciones web abiertas al público es el de los scripts automatizados que tratan de explotar algunas de sus caraterísticas para propósitos diversos, normalmente ilegítimos. Desde los robots que ingresan comentarios spam a los blogs por miles, hasta aquéllos que intentan abusar de los servicios de correo como MSN, Yahoo! y más recientemente Gmail, el factor común es que se trata de scripts o programas relativamente pequeños que se diseñan para abusar específicamente de ciertos sistemas.

Los spammers de blogs apuntan en particular a los comentarios, normalmente abiertos al público, para dejar vínculos que pretenden sacar partido de los buscadores que valoran positivamente la cantidad de referencias a un sitio. Los wikis, con su esencial característica de edición colectiva, son vulnerables también a estos problemas.

Una forma específica de enfrentar el problema, es utilizar un mecanismo que permita garantizar que quien realiza una acción es un humano y no un robot programado. La técnica más común es el uso de imágenes distorsionadas que para los humanos resultan relativamente simples de leer, pero que para un programa es muy difícil procesar. Estas imágenes son conocidas como captchas.

Captchas

Captcha con el texto 'SMWM'

Ejemplo de una imagen captcha (imagen de dominio público, publicada en Wikipedia).

Partamos por la definición del nombre: éste es una abreviación de Completely Automated Public Turing Tests to Tell Computers and Humans Apart, algo así como Prueba Turing Pública Completamente Automatizada para Diferenciar Humanos y Máquinas y fue acuñada por un equipo de IBM en el año 2000.

Esta técnica, desarrollada originalmente por AltaVista en 1997, busca distinguir claramente a un humano de un proceso programático, mediante el uso de imágenes distorsionadas de un modo que haga imposible el que sean leídas por algo que no sea un humano. Quien esté familiarizado con los escáneres de imágenes, probablemente conocerá también la tecnología OCR, Optical Character Recognition, que permite escanear páginas de texto como imágenes y transformarlas a texto. La tecnología OCR permite reconocer caracteres desde imágenes mediante análisis de inteligencia artificial, y demuestra que si bien se puede programar un sitema para que reconozca imágenes, deben existir ciertas condiciones para que el reconocimiento de los caracteres sea más fácil. Por lo mismo, los captchas distorsionan la imagen de un modo que hace imposible que que las tecnologías OCR actuales identifiquen su significado. Algunas de las técnicas para ocultar el texto en la imagen son el uso de tipografías poco usuales, distorsionadas, irregulares, junto con diferentes colores y elementos de ruido visual. Vale hacer notar que con un esfuerzo considerable es posible programar sisteas que sean capaces de leer captchas, pero normalmente el costo de esto es muy alto.

La técnica completa de los captchas consiste en presentar una imagen al usuario y solicitarle que ingrese el texto que reconoce en ella en un campo, normalmente una mezcla de caracteres alfanuméricos, y luego se comparan ambos para verificar si coinciden. Un script automátizado no pasará la prueba, en tanto un humano sí. ¿Sí?

Accesibilidad y Captcha

La base de la técnica de captcha se basa en que los humanos podemos leer. Pues bien, la mayoría lo hace, pero no todos podemos leer. Sí, me refiero a los ciegos. Esto establece un problema de accesibilidad concreto, que de no ser corregido, significa discriminación. La buena noticia, es que los captchas no sólo se pueden realizar con imágenes, es posible también utilizar audio para entregar información que sólo será diferenciable para humanos. La técnica es similar: se presenta la grabación de una serie aleatoria de letras y números en con ruido auditivo y cierta distorsión. Lo ideal es tener ambos sistemas, captcha de imagen y de audio, para permitir que todos los usuarios puedan ciertamente pasar la prueba de discriminación de humanos y máquinas.

En el Mundo Real

En muchos casos he encontrado captchas de imagen en sitios públicos como Yahoo! o incluso más recientemente en Gmail. Pero en todos los casos se omitía el problema de accesibilidad. En Gmail parecen tener planes al respecto, porque junto a cada imagen captcha se encuentra un gráfico pequeño con el símbolo de discapacidad, aunque la solución ofrecida es actualmente bastante pobre: abre una ventana nueva usando JavaScript, la ventana tiene el mismo captcha con texto en el atributo ALT que dice algo como usted no puede ver la imagen porque las tiene desactivadas en el navegado. Cómico, si lo quieres tomar con humor.

Captchas en Gmail.

Gmail utiliza captchas en su proceso de recuperación de claves perdidas.

Captchas en Yahoo!

El registro de nuevos usuarios de Yahoo! hace uso de captchas.

Sin embargo, hace uns días me llevé una sorpresa, que fue la que me motivó a escribir este ya extenso post: en MSN utilizan captchas de imagen y audio. Las siguientes imágenes muestran parte del proceso de creación de nueva cuenta y al final hay un ejemplo del captcha de audio.

Captchas en MSN.

MSN utiliza captchas en el proceso de creación de nuevas cuentas de usuarios. A la derecha del captcha de imagen, se pude observar un ícono de sonido, que permite acceder a un captcha de audio para aquellos usuarios que lo necesiten.

Captchas de audio en MSN

Al seleccionar el ícono de audio, MSN presenta un botón que permite oir un captcha sonoro.

El captcha de audio presentado por MSN es una lectura distorsionada de una serie de números que se oye así (WAV, 64Kb.). Vale hacer notar también que la grabación del captcha se presenta en castellano, como corresponde a un sitio mulilingüe.

Nota: El audio se presenta sólo para efectos ilustrativos, y cumplo con señalar que es de propiedad de MSN.

Más Información

Si el tema te interesa, te recomiendo algunos lugares para buscar más información sobre captchas:

Comentarios para 'Captchas y Accesibilidad'

  1. 1URIFederico, Sunday 2 de October, 2005, 1:44

    No creo que a un ciego le haga mucha gracia que lo estén señalando con un dedo cada vez que se menciona la palabra accesibilidad.
    Los captchas representan un problema para cualquier que no tenga acceso a las imagenes; eso incluye, en algunos casos, navegadores en modo texto, gente que deshabilita las imagenes y no sabe que hay un captcha para revisar, y quienes tengan la mala suerte de aparecer el día en que el servidor anda mal y no publica las imagenes.

  2. 2URItorresburriel, Sunday 2 de October, 2005, 6:08

    En cualquier caso, y ,disquisiciones acerca del alcance de las acciones que fomentan la accesibilidad, me parece un post excelente.

    Queda perfectamente explicado lo que son los captchas y la forma de hacerlos acesibles.

    Enhorabuena, Nelson.

  3. 3URItorresburriel.com » La relación entre Captchas y Accesibilidad, Sunday 2 de October, 2005, 6:13

    […] No lo digo yo, lo hace Nelson Rodríguez Peña en El Factor Humano. Y lo hace bastante bien: Captchas y Accesibilidad. captcha, accesibilidad, UX […]

  4. 4URILa Naturaleza del Software, Sunday 2 de October, 2005, 15:21

    Turing Inverso y Accesibilidad

    Los Test de Turing Inverso, o CAPTCHAS se han convertido en una desagradable práctica que espero desaparezca pronto. La verdad, es que frente a varios CAPTCHAS me he sentido como un verdadero idiota, a tal grado que dudo si mi…

  5. 5URIMc, Sunday 2 de October, 2005, 17:31

    Buen artículo, ahora solo falta que los servidores que usan el captcha apliquen soluciones.

    Cabe destacar que se están desarrollando sistemas de visión por computador capaces de analizar el captcha con bastante efectividad, así que cabe esperar que en poco tiempo este sistema de distinción hombre-máquina deje de ser efectivo.
    Tal vez sea el momento de plantear otro sistema más eficaz para entonces y más accesible, para todos.

    Saludos

  6. 6URInelson, Sunday 2 de October, 2005, 18:07

    Federico, cuando por primera vez me enfrenté a un ciego para hablar de accesibilidad, me di cuenta de que nosotros, los videntes, tenemos muchas más aprehensiones que ellos respecto a su condición. Estoy de acuerdo con tu precisión de que los captchas de imagen no sólo afectan a los ciegos, pero a la larga, ellos no tienen otra alternativa.

    Dani, gracias por tu comentario. Sobre el comentario de La Naturaleza del Software, creo que en rigor, lo más desabradable es tener que utilizar cualquier mecanismo para evitar que inescrupulosos abusen de lo que no es suyo. Los captchas sólo son una forma de solucionar esto. Mi punto en el post es mencionar cómo esto puede ser, además, accesible.

    Finalmente, Mc comenta algo concreto: que es perfectamente posible descifrar los captchas y se ha demostrado suficientemente. En esto, y otras cosas, el ciclo es permanente: se desarrolla una solución, otros la desarticulan, ésta se hace más fuerte, y así permanentemente. Pero en muchos casos, cuando lo que se protege no es tan importante, como los comentarios en un blog, es improbable que alguien se tome el trabajo de dedicarle tanto tiempo a esta tarea.

  7. 7URIEsther Croudo, Wednesday 5 de October, 2005, 11:23

    Excelente comentario, tanto por el tema tratado, como por la forma de explicar un contenido muchas complejo.
    Quedé muy al día…

  8. 8URIkonus, Thursday 6 de October, 2005, 2:19

    ¿Acaso no le llaman HIPs? (Human Interaction Proofs)… han habido un par de conferencias en las que se investiga cómo desarrollar los mejores HIPs o Captchas. Microsoft se matriculó con un par de papers en eso con la implementación de sus soluciones.

  9. 9URInelson, Thursday 6 de October, 2005, 10:14

    Hola Konus, en ese contexto, los captchas son una forma de HIP, más arriba preciso que es una abreviación de Completely Automated Public Turing Tests to Tell Computers and Humans Apart, en que la parte relevante aquí es lo de para diferenciar computadoras y humanos.

  10. 10URICarlos, Saturday 8 de October, 2005, 20:38

    Super interesante el artículo! Justo hoy me estaba preguntando que hacen personas que usan navegadores de texto/ciegos con los captchas.

    Gracias!

  11. 11URIivogomes.com » “Captchas” e Acessibilidade, Wednesday 12 de October, 2005, 12:02

    […] Estive a ler um artigo publicado no site El Factor Humano sobre “captchas” e acessibilidade e achei excelente. A análise feita pelo Nelso Rodriguez-Peña foi muito bem feita e tendo em conta o estado actual de SPAM nos comentários, cada vez mais sites usam este tipo de protecção. No entanto, em termos de acessibilidade a utilização de “captchas” pode ser uma verdadeira barreira. […]

  12. 12URILos 10 peores captchas | aNieto2K, Thursday 13 de March, 2008, 14:47

    […] Imaginemos los que usuarios que únicamente usan el PC esporádicamente y se encuentran con eso… Compártelo # « Destripando el código de Internet Explorer8 […]