Societat

RICARDO BAEZA-YATES

VICEPRESIDENT D'INVESTIGACIÓ A YAHOO LABS

“Sabrem abans que tu allò nou que t'agradarà”

“No té límits i és molt més gran del que ens imaginem, però encara estem en una fase inicial”

“Una de les coses que mirem és quina mena de moviments fem amb el ratolí mentre naveguem”

El xilè Ricardo Baeza, especialista en mineria de dades i responsable d'investigació a Yahoo, on lidera diversos laboratoris a banda i banda de l'Atlàntic, va ser recentment a Barcelona oferint una classe magistral en el congrés sobre dades massives

La sensació és que aquest camp té un gran potencial en molts àmbits, però que de moment només l'aprofita el sector empresarial i vetlla pels seus interessos...
Això és el que pot semblar des de fora, però en realitat els usuaris també noten beneficis derivats de les big data. Per exemple, tenint serveis com el correu electrònic, l'accés al núvol o les xarxes socials, que funcionen cada cop millor i que són totalment gratuïts. I ho són per a tothom perquè uns quants usuaris els mantenen fent clic a les publicitats que els presentem d'acord amb els seus interessos, segons el que sabem utilitzant les big data. Sí que és cert, però, que hi ha altres camps, com ara la medicina personalitzada, en què també hi pot jugar un gran paper i encara no ens hi hem posat.
Tenia entès que això requeria molta capacitat de computació...
Correcte, però al final la diferència entre això i les big data és molt difícil d'establir. On situem els límits? En un petabyte? Les big data no tenen límits i són molt més grans del que ens podem imaginar, però tot just ara comencem a explotar-les...
La gent pot pensar que als serveis web els interessa on fem clic, però la realitat és que investiguen el que fem molt més enllà, oi?
Sí. El fet que la gent cliqui el primer resultat del cercador a nosaltres no ens aporta res. En canvi, que ho faci en el 33 sí que és molt més valuós. A més, ens fixem en moltes altres coses, com per exemple si es fa scroll per veure la pàgina sencera o no, el temps que s'hi està i també quins moviments fa l'usuari amb el ratolí.
Quina informació aporta això?
Tot ens dóna informació sobre els perfils d'usuaris, i hi ha diversos estudis de mouse tracking. És curiós veure com hi ha gent que quan navega necessita anar ajudant-se del cursor fent-lo passar per les frases que llegeix, d'altres que no el toquen gaire, uns altres que els mouen compulsivament com si es morissin de ganes de fer el següent clic... de tot se n'aprèn, sobretot creuant les dades.
Així doncs, els gegants d'internet poden arribar a tenir un perfil molt exhaustiu sobre els usuaris. Fins i tot podria ser que els coneguessin millor del que ho fan ells mateixos?
Sí. De fet aquesta és la idea d'algun dels projectes que nosaltres tenim en marxa i que ja ha donat alguns fruits. Ens interessa, per exemple, saber abans que tu quines coses t'agradaran en un futur, però no les relacionades amb les coses que ja ho fan ara, sinó en camps que ni tan sols coneixes. M'explico: presentar-te propostes relacionades amb el que ja has demostrat que t'interessen és relativament senzill. Ara el següent pas és mirar entre la gent que és com tu perquè li agrada el mateix, quins altres interessos tenen que tu encara no has descobert, per poder-te'ls introduir.
Davant d'aquest panorama, encara s'entén més que la gent pateixi per la seguretat i la privacitat de les seves dades...
Clar que s'entén, però han de saber que a Yahoo, i suposo que a la resta de llocs, tenim el departament que anomenem de “paranoics” que es dediquen a vetllar precisament per això. Mentre les dades no surtin de les empreses que les gestionen, poden estar tranquils. Els problemes, per exemple d'identificació de persones a partir de dades anònimes, han vingut quan s'han ofert, amb bons propòsits, les dades a tercers.



Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.

Simón defensa que cal incrementar les restriccions a Madrid i demana a la població que respecti les mesures

Madrid

Argimon diu que és “necessari” perimetrar Madrid: “És un nus de comunicacions molt important”

barcelona

Salut ha comprat un milió de tests d’antígens i els començarà a repartir quan el CatSalut doni llum verda

barcelona

Espanya registra 9.419 nous positius per Covid-19 i suma 182 morts més

Madrid

Grífols compra per 460 milions de dòlars unes instal·lacions al Canadà i una xarxa d’onze centres de plasma als EUA

barcelona

Els MIR i tots els grups parlamentaris exigeixen la implicació política de Salut en les negociacions de la vaga

barcelona

Sánchez reclama als governs autonòmics “allunyar” la gestió de la Covid-19 del “debat partidista”

Brussel·les

L’Agència Europea del Medicament comença a estudiar els resultats dels assajos de laboratori de la vacuna d’Oxford

Brussel·les

Vic i Manlleu veuen les restriccions com una “oportunitat” per revertir la corba

Vic