Páginas

viernes, 26 de agosto de 2016

Excel (y el autocorrector): los trolls de la investigación genética

"Tienen grandes obras que hacer, establecer un nuevo cielo y una nueva tierra entre nosotros, y las grandes obras tienen grandes enemigos"

Seguro que cuando Stephen Marshall escribió esta frase en 1641 no se imaginaba que las grandes obras serían las investigaciones en genética y los grandes enemigos, el Excel y, sí, el maldito autocorrector.

Sé que suena raro. Pero un grupo de investigadores del Instituto Baker IDI de Melbourne ha descubierto que un alto porcentaje de investigaciones sobre genética podrían tener fallos producto de las opciones por defecto de la famosa hoja de cálculo. Ya va siendo hora de que alguien le pare los pies a los autocorrectores del mundo.

Los autocorrectores vuelven a la carga
En 2004, investigadores del NIH norteamericano ya se dieron cuenta de que, en análisis que usaban el nombre de los genes (o sus identificadores), el uso de Excel podía provocar serios problemas en la investigación y en las bases de datos.
Básicamente, el programa convierte los nombres de los genes en fechas o números con coma flotante de forma automática y sin que nadie se dé cuenta. De esta forma, nombres como SEPT2 se convierten automáticamente en "2-Sep" o "02-09-2016". Lo mismo pasa con el gen MARCH1 y con más de 30 genes (algunos muy importantes).


Este problema afecta sobre todo a los archivos suplementarios. Cuando se publica un artículo, buena parte de la información se adjunta a modo de anexos donde se pueden encontrar los datos en detalle. Esos son los archivos suplementarios. Son documentos que recogen información muy importante para el desarrollo y la revisión de los descubrimientos y, por eso mismo, se usan (y se vuelven a usar) muy a menudo. Aunque, visto lo visto, se revisan poco.

Un problema más generalizado de lo que parece
Se revisaron 35175 archivos de Excel de más de 18 revistas académicas. Los investigadores fueron capaces de encontrar 3597 listas de genes de las que 987 contenían errores. Casi un 20%. Revistas como Nature, Science o PLoS no se libran de los errores de Excel. Nature, de hecho, encabeza la lista de porcentaje de artículos afectados con más de un 30 por ciento.

Aunque, por su uso extendido, Excel es el más problemático, el asunto no sólo le afecta a él. Otras hojas de cálculo como las de OpenOffice o LibreOffice también se ven afectadas. En cambio, según los investigadores, Google Sheets no daba problemas de este tipo.

Todos hemos sufrido alguna vez la inoportuna acción de un autocorrector. Normalmente no pasa nada grave más allá de la vergüenza del momento. Pero en este caso, es bastante más grave. Pese a que hace más de diez años desde que se descubrió el problema, Excel sigue convirtiendo las bases de datos en calendarios llenos de fechas. Y sin un poco de interés por parte de autores, editores y revisores, seguirá haciéndolo.




No hay comentarios.: