lunes, 7 de octubre de 2013

Captcha, reCaptcha y otros infiernos

Después de la vorágine de la semana de las Jpod13 creí que mi primera entrada del blog sería sobre el evento, pero lamentablemente hoy he perdido varios minutos de mi vida con el Captcha/reCaptcha así que voy a dedicar esta vuelta al trabajo a acordarme de los ancestros de los inventores de esta tecnología.


Si has estado fuera del planeta Tierra los último años, no sabrás que es un Captcha. Es un chequeo que un humano puede leer (teóricamente) y un ordenador no puede (teóricamente). Con ello se evita que programas de SPAM se dediquen a meter comentarios en el blog o en foros indiscriminadamente.

El problema son los "teóricamente". Teóricamente una persona puede leerlos. Teóricamente un ordenador no. Pero la realidad es que a mi (y a más gente que conozco) nos cuesta un horror y tengo un programa llamado JDownloader que accede a páginas que me consta que tienen Captcha y que los resuelve no se como.

Así que ahí te ves poniendo ojos de chino tratando de determinar si un churro es una "t", una "r" o un arañazo en el monitor.

Captcha es una marca registrada, pero la palabra se usa ahora para referirse a cualquier validación de este tipo. Por ejemplo en WINTABLET.INFO para poner un comentario tienes que resolver una operación sencilla de suma o resta, por ejemplo 1 + X = 3 y poner el valor de la X.

Actualmente Captcha sacó un proyecto llamado reCaptcha (algo así como Captcha 2.0) que lo que muestra son dos palabras, una con el sistema antiguo bastante enrevesada y otra que es sorprendentemente fácil. La idea es que pongas las dos y la "fácil" es para ayudar a programas OCR a resolver palabras que no se entendieron. De hecho en ocasiones puedes poner directamente mal a propósito la "fácil" y te deja entrar.

Esa es la hermosa teoría. Pero...

Esta tarde, he perdido bastante tiempo en la página web "El poder de un Quiero" de BBVA.ES pues quería poner un comentario al artículo para indicar que en la nueva página de BBVA.ES ahora funciona fatal el acceso a la zona de clientes y además han metido demasiada "multimierda" que hace que funcione mal en muchos (si no todos) navegadores.

Intenté poner las palabras una vez, error, y otra, error, y otra, error... pulsé el botón que tiene que refresca la imagen para mostrarte otra buscando una "sencilla", la puse, error, busqué otra "sencilla", error, otra más, error.

¿Saben cuantas probé? Probé 30... ¡no conseguí entrar! A ver, el sistema NO funciona, les pongo ejemplos de las que fallé a ver si es que me he vuelto más idiota de lo que ya estaba... De verdad, si alguno ve otra cosa que lo que yo he puesto ahí en estas 5 que son las más "fáciles" que lo diga en los comentarios.






En todos los casos el resultado fue este:


Ojo que el tamaño real en pantalla no es el que habéis visto en esta entrada, el tamaño real era este:


Lo cual empeora la situación. Pero claro tienes el botón para el "plan B". Como veis arriba a la izquierda aparecen tres iconitos. El primero es para refrescar y que saque otra imagen. El segundo es un altavoz y el tercero es para acordarse de la madre de Captcha (luego hablamos de este).

El "plan B" es escuchar un audio en el que dicen unos números que tienes que descifrar. La primera en la frente es que los números son en inglés. Me precio de saber inglés, pero el audio es una auténtica psicofonía de esas que escuchas lo que quieres entender. Vamos para el programa Cuarto Milenio de cabeza.

Podéis escucharlo desde mi área pública de Skydrive haciendo click aquí. Yo entendí los tres primeros números y el primer y último número de los dos grupos siguientes. Si dices "¡ah, pero hay grupos!" después de escucharlo una vez, te pasó como a mi.

Así que si con la imagen no y con la psicofonía aun menos... pues al final me rendí y no puse el comentario.

¿Lo peor? Que el tema de Captcha y reCaptcha ya se usa en todas las webs y en algunas funciona a veces, pero cuando se pone en que no...

Pues si se pone en que no, pulsas el tercer iconito, el de la interrogación y sale una pantalla explicando como funciona. Ya te digo yo como funciona... MAL.


Ahí se explica por cierto lo del reCaptcha y el OCR. Pero vi un "ponte en contacto con nosotros" y me dije "allá voy" mientras en mi cabeza sonaba el toque de trompeta de carga del Septimo Regimiento de Caballería de los EEUU.

Aparece esto:


¿No os parece tremendamente sospechosa la opción 2? "Cada vez que escribo las palabras, se me indica que son incorrectas, pero estoy seguro de que no lo son".

Yo he puesto esa en el formulario el cual he procedido a rellenar con el email de la empresa incluido e indicando la página donde he tenido el problema. En los comentarios he puesto cosas que no puedo repetir en horario infantil.

Ni me respondieron ni lo espero, pero si contestan les pondré el enlace a esta entrada y pondré aquí la contestación.

De postre decir que entre las páginas donde sufro a los HP (no es Hewlett Packard) de Captcha y reCaptcha está la página para acceder al correo de la empresa donde trabajo cuando estoy fuera de la oficina así que lo sufro, aunque ya no en silencio, cual problema de hemorroides.

Por cierto vean la cara de este señor:


No, no es la cara de idiota que se te queda cuando crees haber puesto bien un Captcha y se salta mal, no, es la cara idiota del idiota HP (y no es Hewlett Packard) que lo inventó.

Te odio y no me conoces chaval... pero te odio profundamente.

Seguiremos informando... del tema Captcha, no de las hemorroides, aunque la frase "pain in the ass" me viene a la cabeza al pensar en estos tíos.



No hay comentarios: