Le questionnaire « données et science ouverte » a été réalisé suite aux deux premières phases qualitatives. Ci-dessous nous présentons quelques résultats principaux du questionnaire qui ont servi à la production du rapport final synthétique (lien). L’ensemble de l’analyse effectuée a été documenté dans une démarche de science ouverte (cf. lien).
429 réponses ont été obtenues donnant un aperçu des pratiques actuelles des professionnel·le·s de la recherche1. Les questions fermées (35 questions sur 43) ont fait l’objet d’une analyse statistique descriptive univariée (tris à plat et tris croisés) suivie d’une analyse descriptive multivariée (ACM puis HCPC).
Population
Genre : 47,8 % et 44,8 % (autre : 7,4 %).
Fonction principale : essentiellement des enseignant·e.s-chercheu.r.se.s « permanent » (55 %) et « non permanent » (20 %).
Ancienneté : Majoritairement plus de 10 ans (65,5 %) (voir graphique ci-dessous) avec un statut de fonctionnaire (68,7 %).
Pondération des résultats effectuée en fonction des catégories disciplinaires pour être représentatif des données 2019-2020 (état de l’enseignement supérieur, de la Recherche et de l’Innovation en France n°14)2.
Pratiques de « mise à disposition » de données et obligations
Le partage restreint pour un public ciblé et connu reste la pratique majoritaire (78,5 %) (voir graphique ci-dessous).
Le partage en ligne avec la proposition d’une licence ouverte (open data) représente un peu plus de 20 % des pratiques (voir graphique ci-dessous).
Pour les obligations de mise à disposition, celles-ci sont peu connues et concernent surtout des obligations de la part d’un comité éditorial ou éthique (par exemple, en recherche biomédicale).
Réutilisation des données et limites pour la mise à disposition
Près de 50 % des personnes interrogées indiquent réutiliser souvent et/ou parfois des données déjà produites ou publiées.
Plus de 45 % de personnes interrogées considèrent que leurs données seraient potentiellement réutilisables.
Les raisons principales limitant la mise à disposition des données sont essentiellement (voir graphique ci-dessous) :
le manque d’habitude de ces pratiques (63 %) ;
un temps trop important nécessaire (49 %) ;
une volonté de valoriser les données pour garder un avantage compétitif (48 %).
Stockage des données
Le stockage des données est majoritairement réalisé sur des supports externes (59%) et des ordinateurs professionnels (57,5%).
Il y a peu d’appel à des services d’archives (7,5 %) (voir graphique ci-dessous).
Outils employés associés aux données
Utilisation majoritaire de logiciels de type tableurs (Excel, Calc) (74,5 %).
Plus de 40 % utilisent des solutions basées sur l’usage de langage de programmation (R, Python).
QGIS est un des logiciels d’analyse et de visualisation de données (24 %) fréquemment cité.
Les logiciels/plateformes de base de données intégrées (18 %) souvent cités sont FileMaker, PostgreSQL, MySQL.
Les plateformes d’entrepôts de données n’ont été utilisées que par 12 % des répondant·e·s.
Le système d’exploitation le plus largement employé est Windows (62 %) contre 26 % pour MacOS et 12 % pour Linux et autres Unix.
Pratiques collaboratives
Des outils de prises de notes partagées sont employés par 40 % des personnes ayant répondu au questionnaire.
L’utilisation d’outils non institutionnels est fréquente (DropBox, GDrive, etc.).
Besoins et accompagnement
La majorité des personnes interrogées a connaissance d’aides disponibles (plus de 55 %).
Les personnes ayant bénéficié d’aides sont généralement satisfaits (plus de 60 %).
Les accompagnements nécessaires associés aux données concernent en premier lieu les étapes de stockage et de conservation des données (48 %), puis leur mise à disposition (40 %).
La présence de spécialistes au sein d’établissement (58 %) et de référents au sein de laboratoires/équipes de recherche (46 %) sont les modalités d’accompagnement les plus plébiscités (voir graphique ci-dessous).