Big Data es un término que desde el 2010 se viene usado para describir un gran volumen de datos, proveniente de diferentes fuentes, de forma estructurada o no, pero ¿para qué nos sirve?.
La recopilación de grandes cantidades de datos y la búsqueda de preferencias dentro de los datos permiten a las organizaciones establecer tendencias, entender comportamientos y hacer predicciones. También permite eliminar las áreas problemáticas antes de que los problemas acaben con sus beneficios o su reputación.
La era de los datos
En un artículo de Xataka, publicado en el 2011 se informaba que para esa fecha (hace más de 10 años) se estimaban unos 600 exabytes de datos almacenados en el mundo y hace una explicación gráfica diciendo que sería igual a que cada ser humano poseyera 162 bibliotecas de Alejandría enteras. Si esa información estuviera de forma física, no habría suficiente espacio en el planeta para almacenarla.
Hoy en día, cada ser humano emite información que está contabilizada en la base de datos de alguna empresa. Nada más con nuestros dispositivos móviles y las apps que están instaladas, se puede saber dónde trabaja una persona, donde está su hogar, con qué personas se relaciona más, a qué hora duerme, tiempo que pasa frente al móvil, las noticias que le interesan, las redes sociales de preferencia, frecuencia de uso y muchísimos más datos.
Las fuentes de datos de Big Data
Ya vimos que pueden ser muy diversas, sin embargo, aquí dejamos algunas ideas que ilustran por dónde empezar.
- Datos de internet y móviles.
- Datos de Internet de las Cosas (IoT).
- Datos sectoriales recopilados por empresas especializadas.
- Datos experimentales.
Y los tipos de datos también lo son:
- Tipos de datos no estructurados: documentos, vídeos, audios, etc.
- Tipos de datos semi-estructurados: software, hojas de cálculo, informes.
- Tipos de datos estructurados: El resultado de los cuestionarios o formularios con opciones cerradas, datos recopilados de manera uniforme.
Algunos usos del Big Data
Como vemos el desafío ya no es la obtención de los datos, sino el poder relacionar toda esa información proveniente de redes sociales, internet, experiencias con la organización, comportamientos de compra, bases de datos propias, información del clima, satélites y muchas más fuentes.
- Big Data en marketing y ventas: los datos de los clientes se analizan y procesan obteniendo información relativa a sus gustos, preferencias, comportamientos. Así se pueden clasificar o segmentar y utilizar modelos predictivos. Facebook, Amazon y Google hacen uso de la información que manejan para el manejo de sus Ads.
- Big Data en política: el documental Nada es privado de Netflix ejemplifica el caso de la consultora política británica Cambridge Analytica, y el uso de los datos de los usuarios de redes con fines políticos o comerciales.
- Big Data en el transporte público: el análisis de grandes volúmenes de datos de la movilización de vehículos en zonas metropolitanas, ha permitido a los gobiernos locales hacer políticas públicas para mejorar la movilidad en zonas congestionadas y proponer alternativas eficientes. Pueden ver aquí un manual del BID de cómo aplicarla en este sector.
- Big Data para la lucha contra el crimen: En algunos países, los cuerpos y fuerzas de seguridad disponen de aplicaciones que predicen la probabilidad con que se puede producir un crimen en una zona determinada gracias al manejo de grandes volúmenes de información. Colombia ya lo está aplicando en 6 ciudades y ha obtenido excelentes resultados.
- Big Data en salud: Se utiliza el Big Data y analítica avanzada para la prevención de enfermedades, por ejemplo el Tablero de la OMS para seguimiento del Covid-19 donde los datos resultaron fundamentales en la gestión de la pandemia, posibilitando el análisis de la evolución de los contagios y fallecimientos.
Sitios web públicos con Big Data
Hay muchos sitios web, sobre todo de los estados que están poniendo a la disposición de todos los usuarios los datos que poseen para el desarrollo. Gobiernos han creando sitios de datos abiertos que pueden ser consultados en todo momento para extraer información de ellos.
Aquí te dejamos algunas recomendaciones de los más consultados:
- Datos para el Desarrollo: Es un sitio web del Banco Interamericano de Desarrollo donde pone de manera pública datos de los países con los que trabaja para usos públicos.
- Índice de Progreso Social: que es un sitio se asocia con líderes en todos los sectores (gobierno, empresas y sociedad civil) para procesar datos que atiendan las necesidades apremiantes de las comunidades y equiparlas con la información adecuada para enfrentar desafíos globales urgentes.
- CEPAL: ha desarrollado diversos sistemas de información relacionados con el desarrollo económico y social de la región latinoamericana y del Caribe. Estos sistemas se encuentran disponibles para quienes soliciten información, pero también tiene otros datos públicos.
Sin duda estamos viviendo la era de los datos, están allí en algún lugar de nube disponibles para que hagas uso de ellos para tus proyectos sociales.
Es importante tener dentro del equipo o voluntarios profesionales de Data Science o Analistas de datos para que integres los datos propios (levantados por tu organización) con los que internet recopila, y así podrás crear proyectos que permitan proponer soluciones ajustadas a las realidades de tus beneficiarios.
Recomendaciones:
Cursos:
- Datos para la efectividad de las políticas públicas
- Webinario ¿cómo conectar mejor nuestras fuentes de datos?
- Curador de Datos
Publicación:
Autor: Marianella Santiago
Coordinador de Innovación y Voluntariado