Què hi ha més enllà de les dades massives?

4 minute read

Published:

Published in .ambiental (La revista del Col·legi d’Ambientòlegs de Catalunya).

Author: Jordi Vitrià

El món de la tecnologia es procliu a generar paraules que, en els millors dels casos, actuen com a paraigües de conceptes complexes però difusos. Si bé durant els primers anys d’aquest segle el concepte “mòbil” era el líder mediàtic indiscutible (aplicacions mòbils, plataformes mòbils, computació mòbil, etc.), durant els darrers anys el “Big Data” i més recentment la “Data Science” li han pres el protagonisme. Què hi ha darrera d’aquests conceptes?

Dades massives

El processament de dades massives (Big Data) és un concepte molt usat en el món de l’empresa que en la seva versió més estricte no denota res més que una sèrie de tecnologies informàtiques que ens permeten, mitjançant l’ús de xarxes d’ordinadors, abordar el processament de gran volums d’informació. Aquesta necessitat s’ha generat a causa d’un fenomen d’abast global que s’ha anomenat datificació: la capacitat de guardar en format digital una sèrie d’elements informatius que fa uns quants anys eren impensables. Qui podia pensar fa uns anys que pràcticament totes les fotografies que es fan al món estarien en format digital i moltes d’elles accessibles en línia? O que es podrien capturar els patrons de consum de música a partir de les plataformes digitals? O que les ciutats intel·ligents ens donarien informació en temps real sobre el seu funcionament? Però la capacitat de procés no justifica el ressò mediàtic del terme, ni explica les posicions polaritzades que genera. Aquests factors estan principalment lligats a dos aspectes. El primer és que en molts casos les dades massives són dades personals que defineixen les característiques, els gustos, els desitjos o el comportament de les persones. És evident que el mal ús d’aquestes dades és un tema greu i per tant requereixen un tractament específic i fins i tot una legislació més avançada que l’actual. El segon factor és més subtil i té relació amb les possibilitats que s’obren quan les dades, personals o no, assoleixen una certa massa crítica. Aquestes possibilitats plantegen canvis en els models de gestió i presa de decisions a l’empresa, canvis en els models de planificació i rendiment de comptes als governs, canvis en el sistema econòmic, que passa per tenir un sector estratègic basat en la indústria del coneixement, i fins i tot canvis en el model de generació de coneixement basat en el mètode científic.

Ciència de dades

La disposició de grans quantitats de dades i de la capacitat de processar-la no implica necessàriament que les conclusions que generem a partir d’elles siguin correctes. Per assegurar aquest aspecte ens cal un enfocament metodològic, no molt diferent del mètode científic que fa segles que estem usant, que sigui aplicable a gran escala i en àmbits molt diversos. Aquesta és la tasca de la Ciència de Dades, un nou àmbit professional centrat en aquests aspectes. El científic de dades serà en poc temps una figura ubiqua a empreses i administracions que avaluarà la qualitat de les dades en el seu origen, definirà polítiques de governança de les dades que assegurin el seu cicle de vida, proposarà models analítics que responguin preguntes rellevants i validarà les respostes tant des del punt de vista del problema com des del punt de vista ètic o legal.

Intel·ligència artificial

El binomi format per les dades massives i la ciència de dades s’ha vist impulsat darrerament per un tercer concepte: la intel·ligència artificial. Lluny de representar un concepte d’intel·ligència assimilable a un humà, aquest terme s’ha fet servir per representar un seguit de resultats científics recents que permeten a les màquines aprendre a partir de l’experiència i extreure informació útil de fonts d’informació complexes (imatges, senyals d’àudio, etc.). Aquests avanços faran viable en pocs anys el cotxe autònom però també altres aplicacions menys visibles com l’anàlisi massiva d’imatges de satèl·lit d’alta resolució o la interpretació de les imatges mèdiques.

El futur que ens espera

Les aplicacions futures en el camp de les ciències ambientals quan pensem en la combinació de dades massives, ciència de dades i intel·ligència artificial són moltes. Aquesta combinació ens obre la porta a pensar en la comprensió de la dinàmica de sistemes acoblats en els que interaccionen humans i sistemes naturals. Fins i tot podem pensar en models de simulació que ens permetin avaluar intervencions en aquests sistemes. Problemes com el canvi climàtic, l’extinció de la fauna i l’anàlisi de xarxes ecològiques prenen una altra dimensió quan són considerats des d’aquesta perspectiva, que ens permet integrar milions de sensors ambientals, la monitorització a partir de drons (aeris o marins) i constel·lacions de centenars de microsatèl·lits.