La ciencia abierta o Open Science es un movimiento que busca garantizar la accesibilidad de las investigaciones científicas para toda la sociedad. Sin embargo, este movimiento no consiste únicamente en la publicación en abierto de los resultados finales de las investigaciones, sino de una transparencia total y transversal durante todo el proceso de investigación, haciendo públicos los datos empleados, los experimentos intermedios o el software desarrollado.
Esta tendencia está ganando popularidad entre los nuevos investigadores debido a las ventajas que tiene esta forma de difundir las investigaciones. Por un lado, al compartir todos los datos de una investigación se suele mantener una mayor organización de la misma, y es más fácil que el feedback recibido de la comunidad científica permita al investigador reconocerlos posibles errores en etapas más tempranas.
Asimismo, el hecho de hacer público todos los desarrollos intermedios de la investigación se da la posibilidad de conocer experimentos fallidos y reutilizar datasets o software para otras investigaciones, evitando tener que repetir el mismo trabajo que otros investigadores ya han realizado. De esta forma, se agiliza la producción científica y no se malgasta esfuerzo y fondos en replicar trabajos hechos con anterioridad.
Además de las ventajas ya mencionadas, practicar la Open Science aporta al investigador una mayor visibilidad de su trabajo, dotándolo de transparencia y siendo más sencillo la identificación de plagios y fraudes. A su vez, el hecho de publicar en abierto todas las fases de la investigación convierten los resultados en algo reproducible, aumentando su credibilidad como investigador y devolviendo a la sociedad la posibilidad de utilizar los resultados de su investigación, habitualmente financiados con fondos públicos, para aplicarlos en soluciones que mejoren la vida de las personas.
Herramientas para una investigación abierta
Durante el seminario THOR Bootcamp: Open Data, atribución e impacto, se ha dedicado parte de la jornada a ver algunas de las plataformas o herramientas existentes que tratan de establecer unos estándares de publicación dentro del movimiento Open Science, facilitando así la labor del investigador.
En primer lugar se nos ha presentado el DOI (Digital Object Identifier), que consiste en un sistema de identificación de publicaciones científicas de cualquier tipo. Dentro de las ventajas que ofrecen los DOIs destaca que constituye un enlace persistente que identifica de manera global y única una publicación. Además, es utilizado globalmente por gran cantidad de revistas, congresos y editores, facilitando la citación de publicaciones y garantizando un enlace a las mismas permanente en el tiempo.
En segundo lugar, se ha presentado ORCID, un sistema de identificación único y permanente para los investigadores (el DOI de los investigadores). Los objetivos de este ID digital son la desambiguación de los investigadores con nombres similares, la facilitación de los procesos de publicación reutilizando la información personal de los autores, así como permitir al investigador tener un perfil público donde se recogen todas sus publicaciones. Además, si se utiliza en conjunción con plataformas de generación de DOIs como DataCite o Crossref se consigue la automatización de ciertos procesos de publicación y enlazado de obras y autores, así como la monitorización de las referencias a las publicaciones.
Como parte de la formación en Open Science, se ha presentado la plataforma Github (que ya conocía), un servicio de hosting de código en abierto que permite el control de versiones y la fácil colaboración de múltiples desarrolladores en un mismo proyecto. En este caso, el objetivo principal de esta herramienta es la creación de software en abierto, así como fomentar la interacción entre desarrolladores y la comunidad. Dentro del marco de la ciencia abierta, plataformas como GitHub facilitan al investigador la tarea de compartir el código y permiten a otros miembros de la comunidad ofrecer feedback, realizar aportaciones al proyecto y reproducir fácilmente los resultados publicados.
Como complemento a GitHub, existen servicios como Zenodo que ofrecen la posibilidad de generar un DOI para el software desarrollado, y, por tanto, recibir cŕedito por el mismo, permitiendo así a los investigadores aumentar la visibilidad de su investigación y dotar de mayor transparencia y credibilidad a sus investigaciones.
La estandarización de estas dos últimas herramientas es clave dentro del marco de la ciencia abierta, dado que es imprescindible que el software se empiece a considerar como resultados de investigación para, de esta manera, promover la publicación del código en abierto que permita reproducir los resultados de investigación, así como detectar errores o evitar que otros tengan que rehacer el mismo trabajo para poder comparar sus algoritmos.
Poniendo en práctica los conceptos aprendidos
Como parte de la evaluación de este seminario, se ha llevado un ejercicio consistente en la creación de una cuenta ORCID con el objetivo de completar nuestro perfil y aprender a enlazar nuestras publicaciones con la plataforma. En mi caso, he decidido subir un dataset recientemente desarrollado que consiste en una colección de imágenes etiquetadas para entrenamiento y validación de algoritmos de segmentación y clasificación de elementos en un campus universitario mediante visión por computador. El dataset (ver DOI al final del post) ha sido publicado en la plataforma Zenodo con el propósito de obtener un DOI que permitiese citarlo en posteriores publicaciones, ganando de este modo visibilidad, así como llevar un seguimiento del mismo vía ORCID. Ambos procesos, el de publicación en Zenodo y el de integración con ORCID, han sido muy sencillos e intuitivos.
Sin embargo, considero que la gran cantidad de plataformas implicadas en el proceso de apertura de los resultados de investigación puede ser una brecha de entrada a la práctica de la ciencia abierta, dado el tiempo requerido para aprender el funcionamiento de cada aplicación y la necesaria adaptación de los actuales procesos individuales a estas nuevas herramientas.
El momento perfecto para este seminario
Considero que el contenido de las exposiciones que componían el seminario ha sido muy relevante en mi recién estrenada carrera investigadora. He aprendido conceptos muy interesantes relacionados con las ventajas de una ciencia más abierta y la posibilidad de compartir públicamente no sólo las conclusiones finales de la investigación, sino todas las etapas del proceso, aportandole así mayor credibilidad y transparencia.
Por tanto, puesto que me encuentro al inicio de mi doctorado, este seminario me ha dado la oportunidad de estructurar el desarrollo de mi tesis en función de los valores de Open Science, aprovechando así las ventajas de compartir mi proceso investigador con la comunidad científica y la sociedad.