Con el tiempo, se ha convertido en una actividad muy común para documentos o textos digitales que anteriormente se encontraban en estado físico. Un claro ejemplo de esto son las notas o notas que tienes en el papel.
¿Sabes cómo poner tu documento o texto en dígitos? . Por supuesto, la mayoría de la gente no conoce este tema, pero la buena noticia es que existen herramientas como Google Vision que facilitan la tarea. De esta forma tienes toda la información que necesitas de forma digital.
En esta publicación, hablaremos en detalle sobre cómo convertir sus notas y notas en papel en un formato digital usando Google Vision. a través de útiles instrucciones paso a paso. También explicamos por qué.
¿Qué es Google Vision y para qué sirve esta gran herramienta web?
Google Vision es un excelente sistema de reconocimiento de imágenes para cualquier desarrollador que desee editar el contenido de una gran cantidad de imágenes automáticamente. Esta herramienta puede detectar todos los elementos de la imagen y también saber todo sobre todos los elementos de la imagen en Google.
La API de Google Cloud Vision proporciona a los usuarios una variedad de modelos de aprendizaje automático que se pueden usar para etiquetar imágenes rápidamente y organizarlas en una variedad de categorías predefinidas. Como resultado, puede reconocer objetos y rostros, y leer textos impresos y escritos a mano.
Cuando se trata de convertir notas y notas a un formato digital, trabajar con Google Vision es una gran idea porque puede renderizar el texto en la imagen para sincronizarlo sin tener que hacerlo usted mismo. En este caso, puede usarlo para extraer texto de imágenes y también para identificar y extraer texto de imágenes. Si quieres aprender a hacerlo, debes seguir leyendo.
Aprenda paso a paso cómo convertir sus notas en papel y notas adhesivas en formato digital con Google Vision
El proceso de cambiar sus notas en papel y su memo a formato digital es un poco tedioso y puede parecer complicado al principio. Pero si está satisfecho con su funcionamiento, puede obtener aún más beneficios de esta herramienta.
Veamos lo siguiente:
Regístrese en Google Cloud
El primer paso para utilizar el servicio de Google es el registro. En ese caso, debe crear su cuenta de Google Cloud en el siguiente enlace «https://cloud.google.com» y luego ingresar « Comenzar gratis » . El siguiente paso es incluir su cuenta de Google, es decir, en su cuenta de Gmail, para registrarse. Seleccione el país y acepte las condiciones de uso.
Luego configure su cuenta con la información del cliente, que incluye:
- Tipo de cuenta (comercial o personal).
- Nombre y domicilio.
- Forma de pago (crédito o tarjeta bancaria).
Al iniciar sesión en la que Google nube, tendrá que seleccionar el «Crear nuevo proyecto» opción . Una vez que haya aprovechado al máximo, es cuando sea apropiado donde se encienda la visión de API de Google para su proyecto.
Habilite la API de Google Vision
Para Google API Visión a habilitar, haga clic en el menú en la parte superior izquierda de la pantalla. Hay una lista de servicios proporcionados por Google Cloud. Tienes que desplazarte hacia abajo en esta lista hasta que obtengas la opción Visión. También recomendamos seguir el enlace «https://console.cloud.google.com/apis/api/vision.googleapis.com/overview» para habilitar la API de Google Vision . Luego haga clic en «Activar API».
Una vez que haya hecho esto, deberá continuar con la verificación. Continúe de la siguiente manera:
- Ve al menú de la parte superior izquierda.
- En Administrador de IAM, haga clic en Cuentas de servicio. «
- Haga clic en «Crear una cuenta de servicio».
- Complete al menos la sección requerida «Nombre de la cuenta de servicio».
Ingrese el nombre que desea para su proyecto en la opción de «Nombre de la cuenta del servicio».
Crea una clave de identificación
Si la sección anterior está instalada, es hora de crear una clave privada para las etiquetas solicitadas. Para hacer esto, debe ir a la lista de cuentas de servicio (vaya a IAM y cuentas de administración / servicios). Cree la clave que desee allí. Entonces necesitas descargar la clave como JSON.
Ingrese ahora la variable ambiental GOOGLE_APPLICATION_CREDENTIALS en la ruta del archivo a JSON actualizado , que es la clave de su cuenta de servicio. Tenga en cuenta que esta variación solo se aplica a la sesión de shell actual. Esto significa que cuando abra una nueva sesión tendrá que reorganizar las diferencias.
Entonces el procedimiento es el siguiente:
- En Linux o macOS: cambie PATH con la ruta del archivo JSON que contiene la clave de la cuenta de servicio. Por ejemplo (Transferir GOOGLE_APPLICATION_CREDENTIALS = »/home/user/Downloads/service-account-file.json»).
- En Windows, se debe cambiar la PATH con la ruta del archivo JSON , que contiene la clave de su cuenta de servicio. Por ejemplo, con PowerShell ($ env: GOOGLE_APPLICATION_CREDENTIALS = »C: Nombre de usuario descargado my-key.json»).
Instalación del SDK de Google Cloud
El SDK de Google Cloud no es más que un conjunto de herramientas que puede utilizar para administrar sus aplicaciones y recursos de alojamiento de Google Cloud. Todos estos incluyen herramientas de línea de comandos de gcloud, gsutil y bq. Tenga en cuenta que la herramienta de línea de comandos gcloud junto con el SDK de la nube se ha descargado .
Las instrucciones de instalación dependen de la computadora desde la que inicie sesión:
- Descarga el instalador del SDK de Cloud. También puede abrir una terminal de PowerShell y ejecutar los siguientes comandos:
- (New-Object Net.WebClient).Descargar archivo (“https://dl.google.com/dl/cloudsdk/channels/rapid/GoogleCloudSDKInstaller.exe”, “$ env: Temp GoogleCloudSDKinstaller.exe”) $ env: Temp GoogleCloudSDKIInstaller.exe
- Inicie el programa de instalación y siga todas las instrucciones. Debe saber que el SDK de Cloud requiere Python.
- Las versiones disponibles son: 3.5 a 3.7 y 2.7.9 o versiones más recientes.
- Luego, se establecen todas las dependencias necesarias, junto con la versión correspondiente de Python. Aunque el SDK de Cloud actualmente usa Python 3 de forma predeterminada, puedes inhabilitar la opción de instalación del paquete de Python para usar la instalación existente.
- Cuando se complete la instalación, debe aceptar las opciones para iniciar el SDK de Cloud Shell y ejecutar gcloud init. Luego, el programa de instalación abre una ventana desde la ventana y ejecuta el comando «gcloud init».
- Por último, la instalación básica no incluye las extensiones de Software Engine necesarias para ejecutar aplicaciones con los comandos de gcloud. Estas funciones pueden utilizar el SDK de control de funciones para la instalación en la nube .
Ingrese el código exacto
- El siguiente paso es escribir el código real. Antes de poder hacer esto, debe instalar Node.js “https://nodejs.org/en/download”.
- Entonces necesitas crear una carpeta:
- mkdir googlevision cd googlevision / npm init -is
- Ingrese a la biblioteca de Google Vision: npm install @ google-cloud / vision.
- Cree un punto de entrada de la aplicación Node: toque googlevision.js.
- En la misma carpeta, agregue una imagen que contenga el texto que desea.
- Si desea asegurarse de estar en el camino correcto, intente obtener un texto claro de su imagen agregando el siguiente código en googlevision.js:
- const vision = need (‘@google -cloud / vision’); software de rendimiento asincrónico () { cliente regular = nueva visión.ImageAnnotatorClient (); const nombre de archivo = ‘pic2.jpg’; const [resultado] = esperar por client.documentTextDetection (nombre de archivo); const fullTextAnnotation = result.fullTextAnnotation; console.log (`Resultados: $ {fullTextAnnotation.text}`); } Aplicaciones ();
- Cuando se ejecuta, debe encontrar: nodo googlevision.js.
- Ahora puede comenzar a crear HTML. Para hacer esto, necesita crear una función auxiliar (convertToHtml). Debe cambiar la línea console.log en su método de envío con esto: convertToHtml (fullTextAnnotation.text);.
- Debajo de la aplicación () cree la ruta:
- Función de conversión a HTML (texto) { }
Finalmente, debe recordar que antes de poder producir HTML, debe limpiar el código generado por la API de Google Vision. Una vez que hagas esto, tendrás un texto digital limpio. Por supuesto, usar una biblioteca de ojos de comportamiento cognitivo ( OCR) con la persona creativa puede dar resultados asombrosos. ¡Intente convertir sus notas y notas en un formato digital! .