La science ouverte : définition et objectif
« La science ouverte est la diffusion sans entrave des résultats, des méthodes et des produits de la recherche scientifique. Elle s’appuie sur l’opportunité que représente la mutation numérique pour développer l’accès ouvert aux publications et – autant que possible – aux données, aux codes sources et aux méthodes de la recherche. »
Deuxième Plan National pour la science ouverte – 2018
La science ouverte s’applique à tous les domaines scientifiques et concerne l’ensemble des productions scientifiques : les publications, les données de recherche mais aussi les codes sources et logiciels. Sa pratique ne diffère pas de la science traditionnelle mais elle vise à un plus grand partage des résultats scientifiques, une plus grande transparence des processus de création des données de recherche et l’émergence de nouvelles formes de diffusion et d’élaboration des connaissances. Ce mouvement est fortement soutenu au niveau national par le ministère de la Recherche et de l’enseignement supérieur, notamment avec l’écosystème Recherche Data Gouv et le Comité pour la science ouverte, et au niveau européen par le programme Horizon Europe.
Le but de la science ouverte
Faciliter l’accès aux productions scientifiques
Un accès ouvert à tous sans barrière, c’est-à-dire sans authentification, sans embargo ou accès payant est un des piliers de la science ouverte. Cet accès ouvert, ou open access s’applique aux publications scientifiques, aux données de recherche, aux codes sources et logiciels. Des exceptions existent concernant les données à caractère sensible, les secrets, les brevets encours, etc. En règle générale, l’accès aux données doit être « aussi ouvert que possible, aussi fermé que nécessaire ».
Rendre la science reproductible et réutilisable pour les autres et pour soi
La science ouverte permet de s’assurer de la reproductibilité de ses résultats par la mise à disposition des jeux de données et des méthodes utilisées. Au moment de la publication de la loi pour une République Numérique de 2016, il a été constaté que plus la réutilisation d’une donnée est éloignée de sa création plus il est difficile de retrouver et d’interpréter cette donnée, même pour la personne qui en est à l’origine. Le premier bénéficiaire de données inscrites dans la science ouverte est donc son créateur. Outre la nécessité de reproductibilité dans le domaine scientifique, il est essentiel que la science permette la réutilisation des données dans d’autres projets de recherche afin d’améliorer la cumulativité des connaissances.
La science ouverte dans la pratique
Des pratiques prises en comptes par les financeurs
Au niveau national et international, la science ouverte devient un critère essentiel dans l’évaluation des projets. L’Agence nationale de la recherche (ANR) a publié une politique science ouverte qui encourage la publication des articles dans des revues nativement en accès ouvert et demande aux chercheurs de placer leurs publications sous licence Creative Commons. Elle demande également l’élaboration de plan de gestion de données pour les projets financés depuis 2019. De manière générale, l’ANR recommande d’adopter le principe « aussi ouvert que possible, aussi fermé que nécessaire » concernant la publication des données. Au niveau européen, Horizon Europe prend désormais en compte dans ses critères d’évaluation des projets soumis et dans les indicateurs de bilan l’intégration des projets dans la science ouverte.
Offrir une alternative aux plateformes commerciales
Mettre en ligne des publications scientifiques en open access permet de ne pas s’appuyer sur les plateformes commerciales qui font reposer le poids économique de l’édition scientifique sur les auteurs et les lecteurs. Cette appropriation des connaissances par des acteurs privés empêche la libre circulation des connaissances en conditionnant leur accès et leur réutilisation. La même logique est peut-être appliquée concernant les données et les codes sources et logiciels : en les mettant en libre accès, ils ne sont pas captés par des entreprises privées qui font ensuite payer l’accès à ceux-ci. Dans le cadre de la validation d’article scientifique, le dépôt des données dans des archives ouvertes est de plus en plus demandé par les comités de lecture, ce qui montre bien la nécessité de publier les données en open access. La science ouverte permet à la communauté scientifique de se réapproprier une diffusion pleine et entière des connaissances en son sein.
Des données mieux protéger, conservées et plus visibles
Mettre des données mises en ligne en open access permet de s’assurer un accès durable et sécurisé aux résultats de la recherche. Cela permet de se prémunir de la fraude scientifique, de promouvoir les résultats de la recherche et d’être cité, car les données rentrent dans le processus d’édition scientifique. L’ouverture des données à l’ensemble de la communauté scientifique peut également amener au réexamen des résultats initiaux et ouvre la voie à des nouvelles méthodes d’exploitation.
Comment s’intégrer au mieux dans la science ouverte ?
L’un des premiers aspects consiste en la mise en ligne en libre accès des publications de recherche. Elles peuvent prendre des formes différentes et à chaque type de productions correspond un outil spécifique :
- Les publications scientifiques sont déposées dans des archives ouvertes comme HAL, arXiv, etc.
- Les données de recherche sont déposées dans des entrepôts de données thématiques et quand il n’en existe pas dans l’entrepôt Recherche Data Gouv
- Les codes sources et logiciels sont conservés via des forges logiciels pendant le projet puis dans l’archive en ligne dédiée : Software Heritage
La réflexion autour des données produites et utilisées lors d’une activité de recherche est essentielle pour s’inscrire au mieux dans les principes de la science ouverte. Pour penser au mieux la production, la transformation, l’enrichissement, le stockage et l’archivage des données, il convient de réaliser des Plans de Gestions de Données (PGD) ou Data Management Plan (DMP). Ces PGD sont rédigés tout au long des projets de recherche afin de documenter au mieux les données utilisées et produites pendant une activité de recherche.
L’un des derniers points à prendre compte pour s’inscrire au mieux dans la science ouverte est de produire des données qui soient en accord avec les principes FAIR. A chacune des lettres du mot FAIR est associée une bonne pratique de gestion des données : Facile à trouver, Accessible, Interopérable et Réutilisable. Dans la pratique, l’une des briques essentielles des principes FAIR consistent en l’utilisation de standards, d’ontologies, de vocabulaires contrôlés et d’enrichissement sémantique des données.
En savoir plus
La science ouverte à l’échelle nationale et locale
Les Plans Nationaux pour une science ouverte
Le ministère de l’Enseignement supérieur de la Recherche et de l’Innovation reconnaissant l’intérêt de promouvoir la Science Ouverte auprès de la communauté scientifique a lancé un premier Plan national pour la science ouverte qui a duré entre 2018 et 2021 puis un Second Plan National pour la science ouverte pour la période 2021 à 2024.
Le premier Plan national avait pour objectif de généraliser l’accès ouvert aux publications, structurer et ouvrir les données de la recherche et de s’inscrire dans une dynamique durable européenne et internationale. Le second Plan national, lancé en 2021, étend son périmètre aux codes sources issus de la recherche, prévoie la création de la plateforme Recherche Data Gouv et vise à généraliser les pratiques de la science ouverte.
En savoir plus
Les déclinaisons en région
Les différents partenaires d’ADCVL ont publiés des plans et des offres de services axés sur les domaines de la science ouverte, ils sont accessibles via les liens suivants :
Centre National de la recherche scientifique (CNRS)
Insitut National des Sciences Appliquées – Centre-Val de Loire (INSA)
Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE)
Bureau de recherches géologiques et minières – Centre-Val de Loire (BRGM)
Institut national de la santé et de la recherche médicale (INSERM)
L’Atelier de la donnée et l’écosystème Recherche Data Gouv
Recherche Data Gouv
Le projet a été lancé dans le cadre de la loi pour une République numérique de 2016 avec pour but d’ouvrir l’ensemble des produits et méthodes de la recherche tels que les publications, les données et les codes sources. Les objectifs de l’écosystème Recherche Data Gouv sont de fournir une solution aux équipes de recherche pour s’inscrire le plus possible dans la science ouverte et de faire de l’accompagnement la valeur centrale. C’est pour répondre à ces besoins qu’un maillage d’offres d’accompagnement en proximité de la recherche a été mis en place comprenant notamment les ateliers de la données et la mise en place d’une offre souveraine de dépôt, de publication et de signalement de données en complémentarité des entrepôts de données existants. Cette offre vise également à être une alternative à la publication sur des plateformes commerciales ou ne répondant pas à des critères de confiance.
La science ouverte et l’Atelier de la donnée Centre-Val de Loire
L’Atelier de la donnée Centre-Val de Loire, labellisé par Recherche Data Gouv en décembre 2022, a pour vocation d’être le point d’entrée de proximité à destination des équipes de recherche de la région pour toute question relative à la science ouverte, à la gestion et à la diffusion des données de la recherche. L’ADCVL propose une offre de service sur différentes thématiques pour couvrir l’ensemble de ces questionnements :
- L’accompagnement au dépôt des jeux de données qui concerne le choix d’un entrepôt de données thématique ouvert et fiable (national ou international) en fonction de votre domaine de recherche
- Les aspects éthiques et juridiques : données sensibles et/ou personnelles, licences, etc.
- La FAIRisation des données pour adopter les bonnes pratiques de description des données en fonction des disciplines
- Les Plans de gestion de données
- La préservation et la sécurité des données pour adopter les bonnes pratiques en matière de stockage et de sécurisation des données
- Des actions de sensibilisation à la science ouverte et une offre de formation