Google compra reCaptcha, sistema de verificación OCR

admin/ Septiembre 19, 2009/ Datos del sector/ 0 comments

google

Google añade una nueva adquisición a la lista de empresas que ha comprado o fagocitado.

La compañía reCAPTCHA es conocida por ofrecer uno de los sistemas de verificación de identidad más conocidos en el mundo de internet. Se basa en un sistema de imágenes con texto (mediante OCR) que el usuario tiene que escribir correctamente. Es uno de los sistemas más habituales en foros y páginas web para evitar la tremenda oleada de SPAM que nos inunda.

Desde el ámbito de los especialistas en empresas informáticas se afirma que la compra tiene mucho sentido, ya que Google podrá emplear su tecnología en dos amplios campos de su propio mercado. En primer lugar en la ya mencionada lucha contra el SPAM, para evitar que bots vayan creando cuentas que utilizar posteriormente para SPAM. En segundo lugar les permitirá ofrecer un sistema de corrección para el servicio de Google Libros, con palabras que no estén claras para OCR.

Este sistmea de verificación fue creado en su momento como parte de un proyecto para la digitalización de libros y documentos escaneados del Internet Archive de la escuela de Ciencias de la computación de la Universidad de Carnegie Mellon (Nueva York).

Quizá su vertiente más conocida por el público en general es la de reconocer que el proceso informático lo está solicitando una persona concreta (y no otra aplicación informática). Pero es precisamente su utilidad como corrector del proceso OCR donde tiene su principal desarrollo y versatilidad.

Con la introducción del texto correcto se va afianzando de forma automática la palabra en cuestión, algo que posteriormente pasa a formar parte del archivo final. La importancia y utilidad que le van a poder sacar en Google Books y Google News Archive Search, es realmente llamativa.

Share

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>
*
*