Som una Fundació que exercim el periodisme en obert, sense murs de pagament. Però no ho podem fer sols, com expliquem en aquest editorial.
Clica aquí i ajuda'ns!
Donem per fet, una mica a la lleugera, que l’actual acumulació massiva de dades és una font valuosa d’informació, coneixement, riquesa i poder. Certament, les noves tecnologies són capaces d’emmagatzemar un volum increïble de dades sobre les persones, les coses i tot tipus de fets. Les dades són la matèria primera amb què operen les ciències, i d’aquí es deriva en part el seu prestigi, però ocupen un lloc cada vegada més rellevant en la política i les empreses. La metàfora que presenta les dades com el nou petroli de l’economia digital és doblement encertada, ja que permet entreveure l’existència de “pous” o bases de dades sense refinar i la consegüent “febre” per processar aquest inesgotable combustible informatiu. Tal com va passar amb la febre de l’or i la del petroli, en aquest nou ‘El Dorado’ del big data, no és or tot el que llueix.
Tot i que el concepte de dada és imprecís i previ als ordinadors, resulta indissociable de l’existència de bases de dades i el seu tractament informàtic. Estadísticament, una dada és qualsevol valor d’una variable quantitativa o qualitativa, ja sigui la nacionalitat d’una persona, el correu electrònic que escriu o la pàgina que visita a Internet. El registre de dades massius no es limita a la investigació d’assumptes complexos, com el clima, el genoma i les recerques per internet, sinó que s’estén al comerç, la comunicació, la salut i altres àmbits. Un telèfon, un rellotge amb funcions biomètriques i tants altres artefactes personals subministren una quantitat ingent de dades. La novetat resideix tant en l’ampliació dels àmbits registrats com en el volum de dades, l’escala descomunal i creixent obliga a ampliar cada poc d’unitats de mesura.
La idea és que l’anàlisi d’aquestes macrodades permetrà extreure informació i realitzar prediccions. Pensem, per exemple, en el que comprarà una persona, el partit al qual votarà o els seus riscos d’emmalaltir. Aquesta informació és molt valuosa. Per aquest motiu la gratuïtat de molts serveis no és tal: paguem amb les dades que subministrem. I per això les escoles de negocis presten una atenció creixent al big data, fins al punt que els MSA (Màsters of Science in Analytics) podrien arribar a ser competència dels clàssics MBA, com apuntava recentment The Economist. El valor de les dades resideix en la seva promesa de predicció i influència, però aquesta possibilitat té les seves dificultats i limitacions (l’economia és un dels seus santuaris, i ja coneixem la seva limitada capacitat predictiva).
D’entrada, les dades en brut són codis sense significat. Extreure informació d’ells requereix coneixements i capacitat d’interpretació. Les eines d’anàlisi i visualització de macrodades poden facilitar la feina, però necessiten una orientació experta. Perquè veure i llegir és sempre reconèixer; d’una altra manera, les coses i les dades associades a elles són masses amorfes sense sentit. Els macrodades poden ajudar a entendre i predir, però no estan lliures de biaixos que desenfoquen la realitat. A més, la persona i la personalitat no semblen completament reductibles a dades, per més que alguns d’ells siguin textuals. Tampoc ho són la salut, la malaltia i altres conceptes complexos. Pensar que serem capaços de governar les dades per prendre decisions té un punt de fervor irracional en la capacitat de reduir la vida humana i la complexitat a un algoritme. El big data pot ser molt útil, és clar, però aquest dataisme també pot conduir-nos a alguns disbarats i despropòsits. Sense anar més lluny, en el camp de la salut.
Aquest text és una columna publicada originalment als webs d’IntraMed i la Fundació Esteve.