Données enquêtes sciences sociales


#1

Je propose d’initier un gros chantier : ouvrir les données d’enquêtes de sciences sociales, telles celles de l’ADISP.
Il me semble que les bases de données produites par les administrations sont des documents administratifs communicables, si quelqu’un en sait davantage, ça serait bien de s’assurer que le règlement de diffusion des enquêtes de sciences sociales contrevient bien au droit, avant de demander l’ouverture.
Ces données sont gérées par un opérateur centralisé, progedo, qui réunit notamment l’ADISP, le CDSP et l’INED.
Il y a des données d’enquêtes (INSEE) sur gros échantillons (>100k personnes), pour lesquelles une identification de certains individus est possible. Il ne s’agit pas de demander l’ouverture de telles enquêtes, mais uniquement des plus petites (disons <100k observations), pour lesquelles aucune identification n’est faisable.
Il y a énormément de jeux de données, et ça serait bien qu’on puisse tous les faire d’un coup.


#2

Je me suis renseigné, et il n’y a a priori aucune raison que les données d’enquête soient protégées. Je propose donc d’envoyer la demande suivante à Progedo, qui coordonne la diffusion de toutes ces données.

info@progedo.fr

Objet : demande d’ouverture des bases de données

Bonjour,

le code des relations entre le public et l’administration fixe aux articles L311 et L132 les conditions dans lesquels les documents administratifs sont communiqués aux citoyens. En particulier, dès qu’une personne en fait la demande, tout document administratif doit être mis en ligne de façon à être accessible à chacun.e (article L311-9), et ce dans leurs version mis à jour (article L312-1-1). En particulier, les bases de données sont des documents administratifs communicables (article L312-1-1).

Afin que les personnes curieuses puissent exploiter les bases de données que vous mettez à disposition des chercheur.e.s, nous vous serions reconnaissants de publier en ligne toutes ces bases de données qui ne sont pas encore ouvertes, dans leur version mise à jour, dès lors que leur communication ne porterait pas atteinte à la protection de la vie privée (article L311-6).

En cas de refus de votre administration, nous n’hésiterons pas à effectuer les recours juridiques qui se révéleraient nécessaires pour exercer notre droit.

Nous vous prions d’agréer l’expression de nos salutations distinguées,

L’association Ouvre-boîte
RNA W751238177
https://ouvre-boite.org

PS : Progedo comporte bien plus de 50 équivalents temps plein, comme on peut le voir p. 18 de ce document.

PPS : cette démarche aurait sûrement plus de poids, et serait plus efficace, si elle était portée par une députée.


#3

Ça vous semble solide comme démarche ? J’envoie le mail ?


#4

Bonjour @bixiou.

A mon avis il faudrait justifier pourquoi ces données ne sont pas susceptible de porter atteinte à la protection de la vie privée ou de faire apparaître le comportement d’une personne, dès lors que la divulgation de ce comportement pourrait lui porter préjudice. (L311-6)

Pour cela, il serait plus simple de se concentrer sur un jeu en particulier qui ne fait pas de doute. La jurisprudence n’en serait que plus rapide et facile à établir. Ensuite, libre à nous de faire les autres demandes avec l’appui de ce premier jugement.


#5

Hello bixiou,

Super initiative, mais c’est un peu la face Nord : il y a tellement de données de recherche fermées sans raison valable, celles des enquêtes de sciences sociales ont une probabilité plus fortes de contenir des données à caractères personnel que celles des autres domaines (on ne rencontrera pas de problème avec la vie privée des belettes, des électrons ou des météorites).

Je ne suis pas sur de bien comprendre en quoi la taille de l’échantillon serait un indicateur fiable du risque de réidentification.

Pour ce qui est du contenu du courrier, je le trouve parfait.

Je m’interroge néanmoins, de manière générale, sur la nécessité (ou non) de menacer de recours (“recours” tout court plutôt que “recours juridiques”, d’ailleurs). Notre site web devrait suffire à annoncer la couleur sans qu’on ait besoin d’être explicitement menaçant dans les courriers amha.


#6

Ok, ce sont de bonnes objections. Je vous propose de passer en revue les jeux de données, et de joindre au mail une annexe contentant les jeux de données qu’on demande. Ainsi je m’assurerai qu’aucun ne contient de données personnelles.


#7

Ok, alors au vu de la dernière réunion de l’asso, je vous propose d’envoyer une demande “test” sur trois jeux de données :

On pourrait en rajouter bien d’autres, mais l’idée est d’en prendre quelques unes en exemple, et de diversifier les producteurs de données pour que chacun fasse face à une demande.

Je propose donc d’envoyer dans quelques jours un mail à progedo, à l’adisp, au CDSP, à l’INSEE et à l’INED pour les demandes correspondantes, avec une formulation de ce style là :

Objet : demande de publication de données d’enquêtes pour les sciences sociales
Bonjour,

le code des relations entre le public et l’administration fixe à l’article L311 les conditions dans lesquels les documents administratifs sont communiqués aux citoyens. En particulier, dès qu’une personne en fait la demande, tout document administratif doit être mis en ligne de façon à être accessible à chacun.e (article L311-9), et ce dans leurs version mis à jour (article L312-1-1).

Afin que les personnes curieuses puissent exploiter vos enquêtes, nous vous serions reconnaissants publier en ligne les enquêtes **** dans tous les formats disponibles et assortis de tous les documents afférents : documentation, retraitement et utilisation des données (par exemple les codes pour produire des graphiques, s’il y en a).

En cas de refus de votre administration, nous n’hésiterons pas à effectuer les recours juridiques qui se révéleraient nécessaires pour exercer notre droit.

Nous vous prions d’agréer l’expression de nos salutations distinguées,

L’association Ouvre-boîte
RNA W751238177
https://ouvre-boite.org 3


#8

Pour la même raison que pour les modèles économiques, je préférerais que ce soit quelqu’un d’autre que moi qui fasse la demande. @limpidateur, @Herisson, vous êtes volontaires ? Je peux vous pré-rédiger les mails et trouver les bonnes adresses si vous voulez.


#9

Bonjour @bixiou,

J’ai quelques remarques :

Ce ne sont pas tous les documents administratifs, car il y a des exceptions.

De plus, il est peut-être utile de rajouter dans ce cas que nous estimons que les jeux de données demandés ne sont pas couverts par un secret. Ca évitera peut-être un allez-retour avec la CADA.

Pour les destinataires, il me semble qu’il vaut mieux faire une demande par destinataire.


#10

Je suis d’accord avec tes remarques. On peut rajouter “(sauf exception)” avant “tout document administratif” ou bien “tout document administratif non couvert par un secret”. Et rajouter ce que tu suggères. Quelqu’un s’est porté volontaire pour faire la demande ?


#11

Demandes envoyées :