Home > Arxius, Internet, Seguretat > Els arxivers, reCAPTCHA i Google

Els arxivers, reCAPTCHA i Google

octubre 19th, 2009

captcha_3Els arxivers que treballen en arxius històrics dediquen part del seu temps a desxifrar documents antics que apareixen sovint amb caràcters deformats, irregulars, mig esborrats, atenuats per la humitat, parcialment tacats… Vaig pensar de seguida en aquesta feina difícil i lenta el dia que en Jordi Pont em va parlar de ReCaptcha (moltes gràcies Jordi!). Des d’aleshores m’he mirat els CAPTCHA amb altres ulls, amb dificultats, que d’això es tracta, però amb més bons ulls. Com és ben sabut els CAPTCHA es fan servir  per a frenar l’accés de robots a determinats llocs o serveis de la xarxa, i evitar intromissions malicioses. Només un humà, en principi, els pot desxifrar i no sempre de manera fàcil. Fins aquí arriben els CAPTCHA  però el sistema pensat pels creadors de ReCAPTCHA va més enllà d’utilitzar aquesta idea o funció. ReCAPTCHA va idear la utilització de dos CAPTCHA en paral·lel: un d’inventat i un altre que és la reproducció d’un text digitalitzat que presenta problemes de transcripció. El primer, l’inventat, serveix per comprovar l’habilitat de l’usuari en aquella classe o tipus de defecte del text, de manera que si el resol amb encert es converteix en un col·laborador inconscient i utilíssim en la tasca de desxifrar el text real, l’altre que haurà de transcriure abans d’accedir al servei o recurs web.

En el temps de les digitalitzacions massives que estem vivint, disposar d’un exèrcit de desxifradors de textos poc clars no és poca broma, sobretot si aquests col·laboradors no cobren, no demanenrecaptcha-example augment de sou, no es queixen… La idea és certament genial. És aprofitar l’energia, l’esforç mental, que els humans esmerçaríem igualment treballant a la xarxa, i reutilitzar-ho per a una altra finalitat. Una idea, en aquest sentit, ben ecològica.

I aquí arriba Google, és clar, que ha comprat inesperadament però, ben mirat, molt lògicament, l’empresa reCAPTCHA. Google ho anunciava el 16 de setembre en el seu blog oficial (gràcies Google compra reCAPTCHA novament Jordi) explicant que efectivament li interessava no només pensant en la seguretat sinó com una eina auxiliar per als seus mastodòntics projectes (realitats ja) de digitalització, com Google News Archive Search o Google Llibres. Ho anunciaven posant en el titular de la notícia aquest CAPTCHA, per tal que ho llegíssim primer els humans que els robots.

Per la meva banda no tinc cap inconvenient en seguir col·laborant altruistament (quin remei!) en aquesta activitat i seguir fent, ara en benefici de Google, de desxifrador. No estaria gens malament que a canvi els nous propietaris de reCAPTCHA donessin la referència (l’origen, data…) del text que ajudem a fer comprensible. Així aprendríem almenys alguna cosa més. Els arxivers bé que ho fan quan demanen col·laboració a usuaris dels seus centres.

Arxius, Internet, Seguretat , ,