Auteur | Licence | Source | Â Modification |
Calimaq | CC 0 | Scinfolex | Auteur, rédaction |
 sirchamallow | CC 0 | sir.chamallow.com | reformatage, ajout: gif |
Jâai eu la chance rĂ©cemment dâĂȘtre invitĂ© pour intervenir lors des rencontres 2017 de la communautĂ© Scenari (un logiciel libre permettant de crĂ©er des chaĂźnes Ă©ditoriales pour produire â entre autres â des ressources pĂ©dagogiques). On mâavait demandĂ© Ă cette occasion de traiter le sujet des Learning Analytics (analyse des donnĂ©es dâapprentissage, en français) dans leurs liens avec la protection des donnĂ©es personnelles et je vous propose la prĂ©sentation ci-dessous, qui essaie de balayer les divers aspects de la question.
Les Learning Analytics constituent un enjeu important du numĂ©rique appliquĂ© aux activitĂ©s pĂ©dagogiques, que ce soit Ă lâĂ©cole, Ă lâuniversitĂ© ou dans le secteur privĂ©. Câest typiquement le genre de technologies prĂ©sentant une nature « pharmacologique » â pour reprendre la notion de Pharmakon dĂ©veloppĂ©e par Bernard Stiegler. A la fois remĂšde est poison, lâanalyse des traces laissĂ©es par les utilisateurs des ressources pĂ©dagogiques offre des perspectives rĂ©volutionnaires dâaccompagnement et de personnalisation des enseignements, de maniĂšre Ă ce que chacun puisse bĂ©nĂ©ficier au mieux des contenus numĂ©riques en fonction de son profil et de ses besoins.
Mais Ă©videmment, ces outils technologiques peuvent aussi se rĂ©vĂ©ler passablement intrusifs et porter atteinte Ă la vie privĂ©e des utilisateurs, en favorisant le fichage ou le profilage des individus, ainsi que la marchandisation des donnĂ©es quâils produisent en contexte dâapprentissage. La CNIL a dâailleurs publiĂ© le mois dernier un article intĂ©ressant sur la question des Learning Analytics qui souligne bien cette nature ambivalente :
Si elles sont utiles Ă lâamĂ©lioration globale de la plateforme, la production et la rĂ©utilisation de ces donnĂ©es interrogent : elles pourraient tout aussi bien ĂȘtre utilisĂ©es pour prĂ©dire des situations dâĂ©chec, dĂ©tecter des Ă©lĂšves Ă risque, enfermer les Ă©lĂšves dans des parcours scolaires « adaptĂ©s Ă leur profil »,  prĂ©dire les abandons dans les Moocs, voire mĂȘme fournir des profils adaptĂ©s Ă des employeurs potentiels⊠Des finalitĂ©s qui pour certaines, si elles ne sont pas encadrĂ©es, pourraient aboutir Ă des formes de discrimination.
[âŠ] Au-delĂ de lâaspect juridique, des questions seront certainement Ă soulever du cĂŽtĂ© de lâĂ©thique, dĂšs lors que lâon cherchera Ă classer les Ă©lĂšves dĂšs leur plus jeune Ăąge pour repĂ©rer des cas de dĂ©viance, avec le risque de les enfermer dans des bulles dâĂ©chec. Pour que les donnĂ©es de leur enfance ne les poursuivent pas tout au long de leur vie.
Le (controversĂ©) rapport « Enseignement supĂ©rieur et numĂ©rique », publiĂ© il y a quelques semaines par lâInstitut Montaigne, accorde lui aussi une large place aux Learning Analytics, en lien avec lâenjeu du pilotage des Ă©tablissements acadĂ©miques :
Lâanalyse des donnĂ©es dâapprentissage (learning analytics) a Ă©galement une importance capitale, puisquâelle permet Ă la fois aux professeurs de connaĂźtre les attentes de leurs Ă©tudiants et leurs difficultĂ©s, et aux Ă©tudiants dâindividualiser leurs parcours, dâidentifier leurs faiblesses et de bĂ©nĂ©ficier dâune pĂ©dagogie sur mesure. La gĂ©nĂ©ralisation de cette analyse quantitative pourrait notamment ĂȘtre un moyen de lutter efficacement contre le dĂ©crochage en licence. Rappelons en effet que prĂšs de 60 % des inscrits en premiĂšre annĂ©e de licence ne passent pas en deuxiĂšme annĂ©e. Plus globalement, elle constitue un rĂ©el levier pour amĂ©liorer la performance gĂ©nĂ©rale du systĂšme Ă©ducatif.
Il y a donc beaucoup de gains Ă attendre des Learning Analytics, mais elles risquent aussi de gĂ©nĂ©rer de redoutables externalitĂ©s nĂ©gatives, notamment si les communautĂ©s dâapprentissage ne maĂźtrisent pas les outils et lâenvironnement numĂ©rique oĂč ces pratiques auront lieu (oui, je pense trĂšs fort au partenariat entre Microsoft et lâĂ©ducation nationale en Ă©crivant ces lignesâŠ).
Dans la prĂ©sentation ci-dessus, jâessaie de passer en revue quelles sont les rĂšgles de protection des donnĂ©es personnelles applicables Ă ce type de traitements, dans le cadre de la rĂ©glementation CNIL actuellement en vigueur. Mais je mâefforce aussi dâanticiper des Ă©volutions importantes Ă venir, notamment celle de lâentrĂ©e en vigueur lâannĂ©e prochaine du RĂšglement GĂ©nĂ©ral de Protection des DonnĂ©es (RGPD) dâorigine europĂ©enne, qui va profondĂ©ment bouleverser la matiĂšre.
LĂ oĂč la lĂ©gislation française reposait essentiellement sur des formalitĂ©s prĂ©alables de dĂ©claration Ă la CNIL, le rĂšglement europĂ©en les supprime pour mettre en place un principe de « redevabilité » (accountability) qui va imposer aux Ă©tablissements de dĂ©finir a priori des politiques de protection des donnĂ©es (Ă©tudes dâimpact, privacy by design, sĂ©curisation, etc.). Par ailleurs, le rĂšglement va dĂ©sormais nĂ©cessiter de recueillir le consentement Ă©clairĂ© des personnes intĂ©ressĂ©es par un traitement des donnĂ©es personnelles, lĂ oĂč la loi française antĂ©rieure ne rĂ©servait cette obligation quâĂ des hypothĂšses bien dĂ©terminĂ©es (donnĂ©es sensibles, cookies, prospection commerciale) et se limitait en dehors de ces cas Ă un devoir dâinformation prĂ©alable des individus. Si le rĂšglement paraĂźt globalement renforcer la protection des donnĂ©es et consacrer de nouveaux droits (comme celui Ă la portabilitĂ© des donnĂ©es), il a aussi des effets plus ambigus dans la mesure oĂč certains acquis du cadre français paraissent fragilisĂ©s (lâexigence dâanonymisation des donnĂ©es par exemple est remplacĂ©e par une simple pseudonymisation moins protectrice). Le rĂšglement permet aussi de mettre en place des pratiques de profilage prĂ©dictif du comportement des individus, qui peuvent avoir leur intĂ©rĂȘt dans le cadre des Learning Analytics, mais dont le caractĂšre intrusif pose aussi de nombreuses questions.
Au-delĂ du RĂšglement europĂ©en, jâessaie Ă©galement de voir quelles vont ĂȘtre les incidences de la loi numĂ©rique sur les Learning Analytics. A priori, ces donnĂ©es devraient ĂȘtre concernĂ©es par lâobligation dâOpen Data par dĂ©faut que la loi Lemaire impose aux administrations (y compris les universitĂ©s). Cela signifie quâelles devront mettre en ligne et rendre librement rĂ©utilisables les donnĂ©es dâapprentissage, sans pouvoir fixer de redevances de rĂ©utilisation (y compris pour les Ă©ventuels usages commerciaux rĂ©alisĂ©s par des entreprises). Mais ces principes ne vaudront que pour les donnĂ©es anonymisĂ©es, car lâOpen Data par dĂ©faut ne sâapplique pas aux documents contenant des informations Ă caractĂšre personnel. Et cela ne concerna pas non plus le contenu des ressources pĂ©dagogiques elles-mĂȘmes, lorsquâil est protĂ©gĂ© par le droit dâauteur. Une licence libre peut bien sĂ»r ĂȘtre appliquĂ© pour entrer dans la logique des Ressources Educatives Libres (REL), mais ce nâest pas une obligation pour les Ă©tablissements.
Au final, le cadre juridique nâempĂȘche pas bien sĂ»r pas de dĂ©ployer des technologies de Learning Analytics, mais il impose de prendre des prĂ©cautions pour garantir les droits des individus concernĂ©s (information, consentement, accĂšs, effacement, portabilitĂ©) et la maĂźtrise de leurs donnĂ©es. La mise en place peut ĂȘtre relativement simple si lâon se contente de traiter des donnĂ©es anonymisĂ©es (Ă condition de garantir que les rĂ©identifications indirectes soient impossibles, ce qui peut ne pas ĂȘtre si Ă©vident). Mais il faudra Ă©tablir des politiques de protection prĂ©cises et spĂ©cifiques pour ĂȘtre en mesure dâeffectuer des traitements de donnĂ©es personnelles, ce qui paraĂźt inĂ©vitable si lâon veut bĂ©nĂ©ficier Ă plein du potentiel des Learning Analytics.
Ce sujet est extrĂȘmement intĂ©ressant, car il se trouve au carrefour de plusieurs Ă©volutions juridiques importantes â et parfois contradictoires, puisque les administrations vont bientĂŽt se retrouver Ă devoir gĂ©rer en mĂȘme temps des exigences accrues de protection, mais aussi dâouverture. Il faudra sans doute du temps et beaucoup dâexpĂ©rimentations pour trouver oĂč positionner le curseur de maniĂšre Ă tirer le meilleur parti de ces technologies, sans fragiliser les droits des individus.