Hiển thị các bài đăng có nhãn texto. Hiển thị tất cả bài đăng
Hiển thị các bài đăng có nhãn texto. Hiển thị tất cả bài đăng

Reconocimiento de rostros,de letras en imágenes, personas famosas, edades de las personas


En este interesante artículo vamos a ver un proyecto que está haciendo Microsoft que está en prueba que permite reconocer objetos de fotografía. Si eres programador, el enlace muestra la API y código. Si no eres programador, puedes usar el enlace para hacer reconocimiento de texto, imágenes de forma gratuita.

El sistema tiene diferentes secciones como ser:




Usted puede acceder al programa en el siguiente enlace:

https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/

Reconocimiento de imágenes (describir una foto, detectar edad, sexo)

Por ejemplo, la siguiente imagen tiene pan y trigo:



El programa al analizar la imagen detecta lo siguiente:



El sistema describe la foto y encuentra los siguientes elementos table (mesa), food (comida), indoor (interior), sitting (sentado), top (arriba), doughnut (donuts), small (pequeño), plate (plato), donut, wooden (de madera), white (blanco), sandwich.

En vez de pan, el sistema inteligente detecta donuts, por los colores le parece ver madera y cree ver algunos platos. Creer que es un sandwich es incorrecto, pero un error aceptable considerando que hay pan. La presencia de madera la asume por el color y ver comida.

Si ponemos una foto, al mover el cursos sobre los rostros, el sistema trata de detectar el sexo (gender) y la edad (AGE)


Por ejemplo si ponemos el cursor sobre la mujer, detecta la edad de 60 años y sexo femenino.
En la sección de faces muestra las edades y el sexo:



Voy a mandar mi foto al sistema para ver que dice:


Dice person (persona), man (hombre), indoor (interior), shirt(camisa), camera (cámara), holding (agarrando), looking (mirando), glasses (lentes), wearing (vistiendo), posing (posando).

En descripción dice: Un hombre mirando a la cámara.



Que dice si agarro un lapicero:


La descripción dice un hombre agarrando un cepillo de dientes. Se da cuenta el sistema que hay una mano, pero por la forma en que agarra el lapicero, piensa que es un cepillo de dientes:



Reconocimiento de texto
Le tomé la foto a un folder de capacitación y el sistema pudo leer el texto de la foto y convertirlo en texto a pesar de que estaba en español:




El sistema tiene algunos errores. Por ejemplo en la palabra OURSELVES, no detecta bien la E:

Como puede ver hay algunos errores al reconocer el texto:


Reconocimiento de letra escrita a mano

Otro ejemplo interesante es el reconocimiento de letra escrita a mano. Primeramente le mandé una foto de mi letra a mano en español:


Prácticamente no reconoció nada. Decidí tratar de que reconozca texto en inglés escrito a mano:


El resultado fue satisfactorio. Solo cometió un error.
El siguiente ejemplo muestra una tarjeta inclinada. No tiene muchos errores, pero requiere una revisión a mano:


Reconocimiento de gente famosa
Otro característica importante es la opción de poder reconocer a personas famosas. Por ejemplo puede reconocer al CEO de Microsoft Satya Nadella:


Si le pasamos la foto de Donald Trump, lo reconoce?


Si, a ver un personaje de Bolivia:


Evo Morales, reconocido. Ahora un cantante famoso que vivió en la Argentina y antiguo que convirtió al Tango en casi el himno de Argentina:



Carlos Gardel. Reconocido por el sistema. Hasta ahora muy bien. ¿Será que puede distinguir un blogger famoso de Bolivia?


No, no me reconoce. Mmmm...no es tan bueno. Pero bueno, está aprendiendo.

Otros (reconocimiento de escenas en video, imagenes en miniatura)

También se puede hacer reconocimiento de imágenes de video. Cada escena puede llegar a ser descrita con letras:


La otra opción es la de thumbnails que permite a partir de una imagen crear imágenes en diferentes tamaños y orientación:








Convertir texto escaneado o de imágenes o fotos en PDF a MS Word


Muchas veces tenemos fotografías con texto o documentos escaneados que los queremos convertir a un formato digital.

Existen varios programas que hacen eso, pero uno que me gustó mucho es:
OnlineOCR

Usted puede visitar su página usando el siguiente enlace:

http://www.onlineocr.net/dashboard

Lo que me gusta de este software es lo siguiente:


  1. No necesitas instalar nada en tu máquina (lo que te ahorra espacio, virus, SPAM cuando el sitio no es confiable).
  2. Es un reconocimiento de texto inteligente ya que verifica que las palabras sean coherentes dependiendo el idioma.
  3. Funciona para múltiples idiomas, lo que garantiza un reconocimiento de caracteres raros característicos del idioma (como la ñ en español).
  4. Puedes convertir el texto escaneado o foto con texto en Word, PDF, Excel, Texto (txt), RTF.
  5. Te trata de mantener el formato lo más parecido posible incluyendo imágenes y tablas. Esto es muy útil y ahorra mucho tiempo cuando el documento escaneado tiene un formato especial con varias celdas y tablas de diferentes tamaños.
Veamos como funciona.

Para apreciar toda la funcionalidad presiona SIGN UP:


Escriba un nombre de usuario no existente, una contraseña, la confirmación de contraseña y su correo electrónico o email. Captcha code es copiar los números que vea. En este caso 433414:

Presione LOGIN para ingresar con sus datos mostrados arriba:


Seleccione el idioma en que está el texto. En este ejemplo seleccionamos español (spanish en inglés). El formato de salida es Microsoft Word. Queremos que los datos escaneados se conviertan a un formato digital en MS Word: 



Con la opción Select File, usted puede escoger el archivo escaneado. En este ejemplo, es un pdf escaneado:


Finalmente el botón convert lo convierte al formato deseado:

Si todo salió bien, el archivo Word está listo para ser descargado: