Big Data a été le mot de 2013. Des centaines d’experts et des milliers d’articles de journaux prévoyaient l’importance de plus en plus grande du big data, c’est-à-dire la capacité de gérer et analyser informatiquement de très nombreuses données sur à peu près tous les sujets, dans notre vie, et donc évidemment pour ce qui concerne la santé. Pourtant une nouvelle étude publier dans la revue scientifique Science vient doucher quelque peu les espoirs placés dans cette nouvelle approche.
Des cas de grippe largement sur-estimés
Le plus grand exemple de l’utilisation des Big Data dans le domaine de la santé est peut-être le Google Flu Trend (GFT) : la firme de Moutain View met en effet à disposition une courbe sensée représenter le nombre de cas de grippe dans le monde. Construit en se basant sur le nombre de recherches d’internautes liées à la grippe, le GFT s’est en fait avéré complètement faux. Le GFT a systématiquement surestimé le nombre de cas de grippe pour les années 2012-2013 et 2011-2012 de plus de 50% par rapport aux chiffres des Centres pour le Contrôle des Maladies et la Prévention (CDC), qui basent leurs estimations sur les rapports de surveillance de laboratoires partout aux Etats-Unis. Pire encire, entre août 2011 et septembre 2013, les résultats du GFT étaient erronés 100 semaines sur 108 !
Google a pêché par orgueil...
Comme le note Time magazine qui relaie l'information, il s’agit ici d’un cas typique de “big data hubris (exemple d'arrogance du big data, NDLR). Ce n’est pas parce que des entreprises comme Google peuvent amasser un nombre incroyable d’informations autour du monde qu’elles sont capables de les analyser correctement afin de produire une image nette de ce qui se passe (dans le monde).”
Sans compter les changements incessants de l’algorithme de recherche de Google, ce afin d’améliorer encore davantage sa rentabilité, qui ont faussé les résultats du GFT. Surtout que ce fameux algorithme et la manière dont Google produit la courbe de tendance de la grippe restent très opaque, à l’opposé d’un travail scientifique classique où les expériences sont vérifiables et réfutables.
Cependant le magazine américain note que le GFT et plus globalement le big data peuvent être utiles, mais seulement s’ils sont couplés avec ce que les chercheurs de Science appellent le “small data” (“petites données”, par opposition aux “grosses données” du big data), c’est-à-dire les formes traditionnelles de collecte d’information. "Mettez les deux ensemble et vous pouvez obtenir un excellent modèle représentant le monde tel qu’il est vraiment," juge ainsi Time magazine.