Article publié dans l'édition printemps 2017 de Gestion

De l’intelligence artificielle aux médias sociaux, la technologie révolutionne tout sur son passage en favorisant l’éclosion des idées et en libérant les énergies. La quatrième révolution industrielle est en marche. Et l’humain, dans tout cela ? Entre possibilités et risques, il doit trouver son nouvel équilibre... et ce, rapidement.

Au cours des trois dernières décennies, la technologie a considérablement changé les manières dont nous faisons des affaires, interagissons socialement et analysons le monde. Qu’il s’agisse des téléphones intelligents et des ordinateurs personnels – de plus en plus petits mais de plus en plus puissants – ou qu’il s’agisse d’Internet et des médias sociaux, la technologie a redessiné les frontières de la société moderne de multiples façons.  Chaque seconde, les organisations et les individus connectés génèrent des milliards d’observations dont le contenu informationnel diffère de celui créé lors de la seconde précédente. Le cœur de la science économique et de la finance, c’est l’information. Il va donc sans dire que ces milliards d’informations constituent des occasions incroyables de réduire les incertitudes. Elles représentent aussi une chance inouïe de partager l’information et de réduire les inefficacités dans la coordination des actions humaines, qui sont attribuables à ces asymétries en matière d’information.


LIRE AUSSI: L'exploitation intelligente des données: une stratégie payante


Ces données qu’on qualifie de massives ont des répercussions non seulement sur les opérations dans les entreprises, sur les procédés d’affaires et sur les stratégies des entreprises mais aussi sur les institutions gouvernementales et sur les choix des individus. L’explosion des données affecte de nombreux domaines, par exemple les secteurs de la finance, de la santé, de l’énergie et des transports. Au-delà de la quantité, ces données se caractérisent également par leur variété, leur vélocité, leur véracité et leur valeur.

Les mégadonnées sont un phénomène inhérent à la quatrième révolution industrielle que nous vivons à l’heure actuelle. Cette révolution industrielle se définit selon quatre dimensions : 1- l’accès aux données ; 2- l’accès à la puissance de calcul ; 3- l’accès aux algorithmes ; 4- l’accès aux outils mathématiques d’analyse des données. La naissance et l’amplification des médias sociaux constituent un exemple concret de cette révolution. L’analyse des données issues des médias sociaux peut être d’une grande utilité, car elles sont le reflet de la société et des thématiques jugées importantes par les individus et les organisations qui débattent dans ces réseaux.

Données massives et risques émergents

Les données sont générées dans un cadre juridique dont les politiques industrielles ont été pensées au 20e siècle. Il y a donc une probabilité non nulle selon laquelle il existe une dichotomie entre les innovations issues de la révolution industrielle actuelle et le cadre juridique en vigueur. C’est cette dichotomie qui donne naissance à ce qu’on appelle communément les risques émergents. Par exemple, en 2015, Laurent Cytermann, conseiller au ministère français du Travail, de l’Emploi, de la Formation professionnelle et du Dialogue social, a donné un exemple qui peut illustrer ce phénomène : « Au milieu des années 1990, la compagnie d’assurance santé des employés de l’État du Massachusetts a décidé de rendre gratuitement accessible, à tout chercheur en faisant la demande, le fichier exhaustif des séjours hospitaliers des assurés. Le gouverneur de l’État a alors assuré qu’il n’y avait aucun risque pour la vie privée, les fichiers ayant été rendus anonymes. Pourtant, quelques semaines plus tard, une étudiante, Latanya Sweeney, lui a fait parvenir son dossier complet à son domicile. Il lui avait suffi, pour le trouver, de croiser le fichier de l’assureur avec les listes électorales en indiquant sa date de naissance, son sexe et son code postal. »

L’humanité s’est toujours adaptée aux révolutions. Pourquoi cela serait-il différent cette fois-ci ? Eh bien, parce qu’il y a une forte probabilité que les risques – par définition mesurables – soient en réalité des risques catastrophiques, c’est-à-dire qu’il y ait une faible probabilité d’occurrence associée à des dommages énormes si ce risque survient. Le facteur important ici est la vitesse à laquelle cette révolution se produit. C’est d’autant plus probable lorsqu’on prend en compte la quantité de données générée chaque jour non seulement par les machines et les objets mais aussi par les êtres humains, qui représentent une formidable source de nouvelles données à chaque moment de leur existence, celle-ci étant évidemment différente d’un individu à l’autre.

Certaines données sont partagées par les gouvernements, des entreprises et des organisations non gouvernementales. Plus de 40 pays ont créé des plateformes afin de donner libre accès à des données fondamentales. Selon l’Open Data Index de la World Wide Web Foundation, les cinq pays les plus performants en matière de diffusion de leurs données sont les États-Unis, le Mexique, Singapour, le Royaume-Uni et la Nouvelle-Zélande. 

L’augmentation de la variété des données est tout aussi importante. Examinons tout d’abord la variété des modes de collecte. Longtemps réservée aux institutions (administrations, entreprises ou associations), la production de données personnelles est de plus en plus le fait des usagers eux-mêmes (par exemple dans les médias sociaux, où les individus produisent des informations sur eux-mêmes ou sur leurs pairs), voire de machines et d’objets connectés procédant à des collectes automatisées. On observe aussi cet accroissement de la variété dans les types de données : les données recueillies ne sont plus restreintes à de simples caractéristiques administratives mais s’étendent maintenant à nos goûts et à nos centres d’intérêt (révélés par notre navigation sur Internet ou par les renseignements inscrits dans notre agenda), à nos déplacements, à nos relations (livrées par nos carnets d’adresses numériques et par notre fréquentation des médias sociaux), à nos paramètres biologiques (si on utilise par exemple un bracelet connecté) et même à nos humeurs. Aujourd’hui, nos données disent presque tout de notre personnalité et de notre intimité.

N’avez-vous pas déjà reçu, dans votre téléphone intelligent, un message disant que si vous ne partiez pas dans les cinq prochaines minutes, vous risquiez d’être en retard à votre prochain rendez-vous en raison de la congestion routière ? Pourtant, vous n’aviez rien demandé à votre téléphone, mais soudain, il a fait irruption dans votre vie privée. Vous aviez seulement entré l’heure et le lieu du rendez-vous dans votre agenda électronique, et votre téléphone a permis de vous localiser. Mais en y pensant bien, vous avez probablement été ravi, car l’information transmise vous a permis de ne pas arriver en retard à votre rendez-vous. De plus, votre téléphone intelligent peut vous indiquer l’itinéraire le plus court, vous proposer d’appeler la personne avec qui vous avez rendez-vous pour la prévenir d’un retard éventuel (car votre appareil aura trouvé, dans un courriel, un numéro qui semble lui correspondre !), etc. Mais en chemin, vous vous demandez ceci : à qui d’autre ces données personnelles peuvent-elles être transmises ? Sont-elles stockées dans le grand nuage informatique ? Tout cela est-il bien sécuritaire ?


LIRE AUSSI: Big data: le Québec haut placé sur la grille de départ!


La diffusion de ces données ne porterait guère atteinte à notre vie privée si elles restaient dispersées. Cependant, avec les nouvelles puissances de calcul et d’archivage informatiques, il est maintenant possible de les recouper. Cette capacité d’agrégation est aujourd’hui mise en application dans un cadre juridique issu du 20e siècle. De plus en plus d’études exposent les risques en ce qui concerne la protection de la vie privée. Par exemple, les clauses de protection de la vie privée en ligne que les utilisateurs acceptent lors de leur enregistrement à un site Internet sont souvent discutables. Une étude de 2005 portant sur 500 entreprises en ligne a ainsi mis en lumière les risques et les limites de l’autoréglementation1. Il existe aussi toute une littérature scientifique sur la perception des utilisateurs à propos des contrats électroniques signés en ligne. Certaines études concluent même que les violations de la vie privée sont perçues de la même façon qu’une rupture de contrat (livraison d’un produit avec un défaut, etc.2).

De plus, dans un tel contexte, l’ampleur des bénéfices et des risques perçus peut influencer l’acceptabilité des technologies connectées et leur usage au quotidien. Les résultats du baromètre CIRANO 2017 sur la perception des risques au Québec montrent que 73 % des Québécois sont favorables à l’utilisation des objets connectés et que 45 % d’entre eux considèrent que l’utilisation de ces objets connectés est plutôt ou très bénéfique. Toutefois, lorsqu’on aborde la question du partage de données avec un assureur, des réticences apparaissent : 71 % des Québécois se disent mal à l’aise par rapport aux intrusions dans leur vie privée alors que 51 % d’entre eux éprouvent des craintes liées à la confidentialité et à la sécurité des données. Les gens risquent ainsi de résister aux changements technologiques qui s’opèrent et de refuser de partager leurs données.
 
 
La quatrième révolution industrielle se définit selon quatre dimensions :
  1. L'accès aux données

  2. L'accès à la puissance de calcul

  3. L'accès aux algorithmes

  4. L'accès aux outils mathématiques d'analyse des données

Les solutions

Il faut donc que les législations actuelles et futures atteignent le double objectif de redonner du pouvoir aux individus et de mettre les données au service de l’intérêt général. Quelques principes généraux de bon sens sont déjà intégrés dans le droit ou pourraient l’être assez facilement. Le premier de ces principes consiste à respecter le caractère personnel des données. Ainsi, lorsqu’on observe ce qui se fait en France par exemple, l’article 2 de la loi « Informatique et libertés » de 1978 définit la donnée à caractère personnel comme « toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres ». Le deuxième principe stipule que la collecte des données doit être encadrée et avoir des fins « déterminées, explicites et légitimes » et que les traitements ultérieurs doivent être compatibles avec ces finalités. Le troisième principe précise que la collecte et la durée de conservation des données doivent être proportionnelles à ces mêmes finalités. Enfin, le quatrième principe affirme que tout traitement doit recueillir le consentement de la personne.

Nous pouvons donc formuler la conclusion suivante : dès lors qu’une personne demeure identifiable, les données sont personnelles et relèvent du champ d’application du droit. Et avec les moyens technologiques actuels, il est de plus en plus facile de reconstruire des profils individuels et d’identifier les personnes à partir de leurs traces numériques. Rappelons enfin que les personnes elles-mêmes sont souvent celles qui donnent les informations permettant de faire ces recoupements.
 

De formidables possibilités

Ainsi, dans ce contexte, il va sans dire que les risques sont élevés non seulement pour les personnes physiques mais aussi pour les personnes morales (organisations, entreprises, etc.). Cependant, il ne faut pas oublier les formidables possibilités que cette révolution est en train d’offrir à l’humanité. On cite habituellement les domaines de la santé et des transports, mais toutes les activités humaines vont profiter des effets positifs de cette révolution : le secteur de la finance, l’agriculture, l’éducation, l’environnement, etc. Nous n’en sommes qu’au début. À l’humanité de bien comprendre les enjeux et les possibilités et de faire en sorte – tout en faisant évoluer les organisations et les institutions – que les technologies positives se développent et aident l’être humain dans sa vie quotidienne tout en tenant compte de l’héritage à laisser aux générations futures. Entre risques et possibilités, celui-ci doit trouver son nouvel équilibre… et ce, rapidement. Toutefois, on aura beau disposer d’une puissance de calcul considérable, si les individus résistent en raison des risques perçus, l’équilibre sera sous-optimal.


Pour aller plus loin

  • Warin, T., et de Marcellis-Warin, N., « Un état des lieux sur les données massives », Rapport Bourgogne (n° 2014RB-01), CIRANO, juin 2014.
  • Cytermann, L., « Promesses et risques de l’open et du big data : les réponses du droit », Informations sociales, n° 191, vol. 5, mai 2015, p. 80-90.
  • Ohm, P., « Broken Promises of Privacy : Responding to the Surprising Failure of Anonymization », UCLA Law Review, vol. 57, 2010, p. 1701.
  • De Marcellis-Warin, N., et Peignier, I., Perceptions des risques au Québec – Baromètre CIRANO 2017, Montréal, Presses internationales de Polytechnique, 2017, 81 pages.
  • De Marcellis-Warin, N., Sanger, W., et Warin, T., « A Network Analysis of Financial Conversations on Twitter », International Journal of Web Based Communities (à paraître en 2017).

Notes

1. Ashrafi, N., et Kuilboer, J. P., « Online Privacy Policies : An Empirical Perspective on Self-Regulatory Practices », Journal of Electronic Commerce in Organizations, vol. 3, n° 4, 2005, p. 61-74.

2. Flavian, C., et Guinaliu, M., « Consumer Trust, Perceived Security and Privacy Policy : Three Basic Elements of Loyalty to a Web Site », Industrial Management & Data Systems, vol. 106, n° 5, 2006, p. 601-620.