Page 8 - Mégadonnées, apprentissage automatique, protection des usagers et confidentialité
P. 8
Résumé
Le présent document étudie les difficultés rencon- tion. Ces lois sont mises à rude épreuve à l'ère des
trées dans les domaines de la législation et de la mégadonnées et de l'apprentissage automatique. Il
réglementation en matière de protection des usagers est difficile de se conformer à l'obligation d'informer
et de confidentialité des données en ce qui concerne les usagers de la finalité de la collecte de données
les techniques liées aux mégadonnées et à l'appren- lorsque, comme dans le cas de l'apprentissage auto-
tissage automatique, en particulier lorsque celles-ci matique, celle-ci n'est pas toujours connue à l'étape
sont utilisées prendre des décisions relatives aux de notification. Le consentement est quant à lui dif-
services proposés aux usagers. ficile à obtenir lorsque la complexité des systèmes
L'avantage que représentent les données pour le de mégadonnées et d'apprentissage automatique
développement est largement reconnu, notamment dépasse l'entendement des usagers. La notion de
pour la prestation de services financiers numériques. minimisation des données (recueillir uniquement
Les fournisseurs de services peuvent s'appuyer sur les les données nécessaires à un objectif donné, et les
mégadonnées pour dresser le profil personnel détail- conserver le moins longtemps possible) va à l'en-
lé d'un individu, qui renseignera notamment sur son contre du modus operandi du secteur, qui met l'ac-
comportement (par exemple, ses préférences, ses cent sur la maximisation des volumes de collecte de
activités et ses déplacements), lequel peut être utili- données dans le temps. Comme l'indique un rapport
sé pour adapter les offres commerciales. Les méga- remis au Président des États-Unis en 2014, l'infor-
données et l'apprentissage automatique contribuent mation et le consentement sont compromis par les
de plus en plus à l'inclusion financière, non seulement avantages mêmes offerts par les mégadonnées: des
dans les nations riches, mais aussi dans les pays en méthodes d'utilisation nouvelles, imprévues et éton-
développement. Ces nouvelles technologies com- namment puissantes des données.
portent également des risques, ou des "tendances" Certains suggèrent que les attentes en matière
comme diront certains (par exemple, partialité du de confidentialité sont fortement liées au contexte.
processus décisionnel, discrimination, atteinte à la Des restrictions plus sévères en matière de collecte,
vie privée). d'utilisation et de partage des données à caractère
L'intelligence artificielle implique des tech- personnel dans certaines situations (et un consente-
niques qui cherchent à imiter certains aspects de ment à plusieurs niveaux qui différencie les types de
la cognition humaine ou animale au moyen d'appa- données en fonction de leur utilisation ou de l'entité
reils informatiques. L'apprentissage automatique susceptible de les utiliser) ont été envisagées. Des
désigne la capacité d'un système à améliorer ses dispositions de temporisation prévoyant l'expiration
performances, en dégageant des motifs à partir de du consentement de l'individu à l'utilisation de ses
grands ensembles de données. Les mégadonnées données personnelles (et un renouvellement poten-
reposent sur un traitement informatique impliquant tiel) ont également été suggérées. Des efforts sont
des volumes élevés et plusieurs variétés de types de également déployés pour mettre au point des tech-
données interconnectées et traitées à grande vitesse nologies et des services permettant de mieux gérer
(les "trois V", qui sont parfois au nombre de quatre le consentement. Il semble exister une véritable
avec l'ajout de l'aspect lié à la "véracité"). En règle opportunité commerciale d'investissement et d'inno-
générale, c'est également ce qui les définit. vation dans l'amélioration de la gestion du consente-
La protection des usagers implique l'intervention ment des usagers.
de l'État, qui met en place des lois et des procédures Le bon fonctionnement des modèles d'apprentis-
régissant ce qui serait autrement une relation privée sage automatique et la précision de leurs résultats
entre l'usager et le fournisseur. Elle vise à compen- dépendent de la qualité des données d'entrée. Les
ser les asymétries d'information, de négociation et lois sur la protection des données et de la vie pri-
de ressources perçues entre les fournisseurs et les vée imposent de plus en plus aux entreprises l'obli-
usagers. gation légale de garantir l'exactitude des données
De plus en plus, les pays légifèrent pour proté- qu'elles détiennent et manipulent. Cependant, elles
ger les données personnelles et la vie privée des n'abordent pas la précision des résultats des sys-
personnes concernées, en leur accordant des droits tèmes de mégadonnées et d'apprentissage auto-
qui leur donnent plus de pouvoir quant à leur utilisa- matique. Cela soulève plusieurs questions quant aux
6 Mégadonnées, apprentissage automatique, protection des usagers et confidentialité