En el entorno digital es frecuente escuchar términos o conceptos que se popularizan pero cuyo verdadero significado no es del todo comprendido o se aplican de forma errónea, generando ciertas confusiones, en especial en quienes se introducen en este mundo o estudiantes de marketing y publicidad. Entre estos términos abordamos tres que mantienen una relación: big data, machine learning y deep learning.
Big Data
Si bien el término Big Data ha ganado popularidad en los últimos años, el origen de este se remonta a la primera década del 2000. Big Data hace referencia a una gran cantidad de información o datos que son recopilados de forma masiva, es decir, en una cantidad tan amplia que no es posible analizar o medir sin utilizar herramientas desarrolladas específicamente para esta tarea, hablamos de información que abarca desde Terabytes hasta Petabytes de datos. Doug Laney, quien acuñó el término Big Data menciona tres aspectos clave que son:
- Volumen: hace referencia a la cantidad de datos recopilados, provenientes de distintas fuentes como motores de búsqueda, redes sociales, aplicaciones, entre otras.
- Velocidad: se refiere a la rapidez con que los sistemas de Big Data recopilan, procesan y envían la información, que mayormente se hace en tiempo real, por ejemplo las transacciones financieras.
- Variedad: al recopilar información de distintas fuentes, estos datos vienen también en diferentes formatos, estos pueden ser textos, números, imágenes, de distintos tamaños, estructurados o no estructurados.
Machine learning
Machine learning se puede traducir como aprendizaje automatizado y es una de las ramas de la inteligencia artificial. En otras palabras machine learning hace referencia a sistemas que identifican y analizan patrones y obtienen aprendizajes sin necesidad de intervención humana.
Quien genera este aprendizaje es un algoritmo, que predice comportamientos futuros con base en la información recopilada y también mejora sus procesos con el tiempo.
Deep learning
El deep learning o aprendizaje profundo es una de las ramas del machine learning, está compuesto por una serie de algoritmos inspirados en el cerebro humano llamados redes neuronales. Este se encarga de hacer tareas o actividades e ir aprendiendo de estas, comunicándose entre sí, identificando patrones y haciendo mejoras por su propia cuenta. El deep learning tiene aplicaciones desde la selección de miniaturas de las películas o series en las plataformas de streaming, hasta en la tecnología de los vehículos automatizados.
Las diferencias
Las tres involucran enormes cantidades de datos, las cuales el cerebro humano no es capaz de dimensionar mucho menos analizar u ordenar por cuenta propia, la diferencia radica en que el big data se encarga solamente de la recopilación de estos datos, no de analizar ni organizar.
Por su parte el machine learning sí se encarga de organizar y analizar toda esta información para identificar patrones y aplicar mejoras y para esta tarea puede apalancarse del deep learning, dado que la segunda es un subconjunto de la primera, en el machine learning un algoritmos aprende en el deep learning varios algoritmos que aprenden trabajan en conjunto.