Caso de uso: Solución de Business Intelligence utilizando Machine Learning en Google Cloud Platform aplicado al sector industrial (Parte I )

En esta serie de articulos vamos a describir el proceso de desarrollo de una solución de Business Intelligence utilizando Machine Learning en Google Cloud Platform aplicado al sector industrial

La solucion que vamos a implementar durante esta serie de post se basa en una solucion desarrollada por Evenbytes en uno de nuestro clientes. En el siguiente vinculo se puede comprobar la implementacion de la solucion final.

Para entender un poco el conexto, a continuacion se describen unas supuestas necesidades del cliente en las que se va a basar nuestra solucion.

Descripción del proyecto a implementar

Se necesita la monitorizar y extraer de datos acerca de la actividad en una de las pistas de embarque del aeropuerto. El principal objetivo des esta monitorizacion es generar un reporte con una serie de indicadores requeridos por el cliente para comprobar el correcto desarrollo de la misma.

Como datos de entrada únicamente disponemos de una cámara en directo que muestra la zona de estacionamiento de un aeropuerto.

Se va a monitorizar unicamente de las puertas de embarque del aeropuerto. Se necesita monitorizar las siguientes acciones:

  • Tiempo estacionado de los aviones
  • Duración del repostaje
  • Duración de la carga / descarga de equipajes
  • Compañía del avión
  • Modelo del avion

Se requiere que el proceso esté completamente automatizado y no requiere intervención humana.

Los datos monitorizados serán explotados de dos maneras diferentes:

  • Monitorization de los datos en tiempo real (Con un retraso máximo de 30 seg)
  • Reporte diario para generación de gráficos con estadísticas

Arquitectura de la solución

La arquitectura diseñadad para la implemtacion de la solución consta de 3 partes claramente diferenciadas, que son: captura de datos, análisis de las imágenes y explotación de datos.

Diagrama del proyecto

Como datos de entrada para el primer bloque (captura de datos), disponemos de un flujo de datos accesible a traves de la url http://kamery.airport.gdansk.pl:1935/EPGD/pps3.stream/playlist.m3u8,  que nos proporciona la cámara del aeropuerto. Esta se encuentra grabando las 24 horas sobre el estado de la pista. A partir de esta fuente, obtenemos una secuencia de imágenes fijas o fotos que seran guardarlos en un bucket creado en GCP para un procesado posterior. (Fuente de los datos extraida de https://www.airport.gdansk.pl/lotnisko/kamery-internetowe-p30.html)

El segundo bloque (analisis de datos), gestionara las imágenes almacenadas en el bucket. Este proceso se encarga del analisis y procesamiento de las imágenes, haciendo uso de los modelos de aprendizaje automatico previamente entrenados. Este proceso de analisis de imagenes es realizado gracias al uso de una maquina virtual corriendo en GCP. Como resultado de este proceso obtendremos una serie de etiquetas o metadatados que seran almacenados en BigQuery para un analisis y procesado posterior. Esas mismas etiquetas son almacenadas en una base de datos de Firebase para que puedan ser consultadas en tiempo real por la Web de monitorizacion.

Finalmente, en el ultimo bloque (explotacion de datos), se generada un reporte BI creado en Datastudio para mostrar los datos más relevantes e indicadores, como pueden ser el tiempo de estancia de cada avión, el número de compañías en un día, la media de vuelos al mes..etc. y poder visualizar y navegar por los datos de una manera mas eficiente.