De autorías científicas y Big Data

El Big Data es el término de moda. Pero me voy a poner un poco gili y voy a hablar de Bases de Datos, porque el Big Data a fin de cuentas no es más que la acumulación y manipulación de datos, a una escala muy grande o de una complejidad excesiva. Pero una base de datos a fin de cuentas, aunque el límite entre una y otra es difuso.

Lo bueno de estas bases de datos es que permiten automatizar la manipulación y el postproceso de sus componentes, con aplicaciones con variantes desde el control de stock en una compañía hasta la biblioteconomía. Y el caso concreto del que vengo a hablar es el de la autoría en artículos científicos y su manipulación automática en las bases de datos académicas.

Bibliografía y referencias

Los artículos científicos rara vez son completamente originales y se basan en trabajos previos que pueden haber sido replicados (o no). Para que los revisores y lectores del artículo sepan de donde se parte, se añaden, habitualmente en la introducción, referencias bibliográficas: notas al pie con los artículos que se han usado como referencia. Estas publicaciones se listan al final del artículo, en la Bibliografía. Aquí se dan todos los datos necesarios para que cada artículo sea reconocido y localizado sin dar pie a confusiones: autores, título, revista, año de publicación… Lo malo es que cada editorial, incluso cada revista, tiene su propio formato para dichas publicaciones. Por poner algunos ejemplos de formatos:

Formato Cell:

Casanueva, C., Doulgerakis, E., Jönsson, P.-A., and Stichel, S. (2014). Influence of switches and crossings on wheel profile evolution in freight vehicles. Vehicle System Dynamics 52, 317–337.

Formato IEEE:

[1] C. Casanueva, E. Doulgerakis, P.-A. Jönsson, and S. Stichel, “Influence of switches and crossings on wheel profile evolution in freight vehicles,” Vehicle System Dynamics, vol. 52, no. sup1, pp. 317–337, 2014.

Formato Nature:

1. Casanueva, C., Doulgerakis, E., Jönsson, P.-A. & Stichel, S. Influence of switches and crossings on wheel profile evolution in freight vehicles. Vehicle System Dynamics 52, 317–337 (2014).

Ya veis que hay ligeras variaciones, como la inicial que cambia de sitio, la fecha que puede ir en cualquier lugar… y sin embargo, si publicas en diferentes revistas con diferente formato bibliográfico, es posible encontrar todas tus publicaciones porque todo se guarda como metadatos. Y por esto, también es posible encontrar automáticamente cuándo alguien ha hecho referencia a tu artículo, véase Google Scholar que lo hace automáticamente para tí, aunque hay cientos de bases de datos separadas por especialidades. (Ah, y lo sque sepáis qué es el índice h, tenéis prohibido hacer comentarios sobre mi h=2. Ala.)

Y dónde está el problema?

Mi nombre científico es bastante aséptico en cuanto a bases de datos se refiere: Carlos Casanueva. Un nombre, un apellido, las bases de datos están encantadas. Pero como la mayoría de los españoles, normalmente uso dos apellidos. Hay algunos autores que los incluyen en los artículos científicos, y las bases de datos lo pueden confundir con el middle name inglés. Por ejemplo, si yo firmara mis artículos como Carlos Casanueva Pérez, la abreviatura correcta sería Casanueva Pérez, C., pero las bases de datos son (o eran) mayoritariamente americanas así que mi nombre quedaría amputado como Pérez, C.C. Esto per se no tiene porqué ser malo, pero si resulta que la gente hace referencia a tu artículo con distintos formatos se puede montar un pequeño lío: puedes tener referencias que no sabes que tienes. O que las bases de datos no lo saben. Y en un mundo tan competitivo como la actual academia, mejor que todas las citas acaben en números, para que puedas fardar de ellas cuando pidas financiación para tus proyectos.

Un momento, aún hay más! En España y sobre todo en Latinoamérica solemos poner nombres compuestos. Pongamos que yo me llamara Juan Carlos Casanueva Pérez. Qué es para la base de datos el nombre, y qué el apellido? Quizá haya un middle name?

Queréis otro problema anglosajón? La gente se cambia el apellido cuando se casa. En los países clasicotes como EEUU la mujer toma el apellido del hombre. En los modernetes como Suecia, la pareja se pone de acuerdo y normalmente se traduce en un apellido completamente nuevo para ambos (aunque creo que en los primeros también es posible hacer esto, no estoy seguro). Entonces tus, pongamos, tres primeros papers científicos firmarás como Casanueva, C., pero a partir de ahí como Nyhus, C. De nuevo, ésto puede chirriar a los buscadores que, cuando intentan calcular tu íncide h, creen que sois dos personas diferentes.

La solución

Probablemente no haya una soblución única, pero se ha de pensar en ello por adelantado porque una vez publicado es extremadamente dificil cambiarlo. Por ejemplo:

  • Firmar con un solo apellido para evitar el conflicto del doble apellido (mi caso)
  • Si estás muy orgulloso de tu apellido materno, firmar con los dos apellidos separados por un guión. Así las bases de datos lo considerarán como uno solo.
  • Para el cambio de apellido, y en caso de que hayas publicado con anterioridad con tu apellido de soltero, usar éste como middle name. Luego sigues firmando los artículos como al principio. De esta manera, usas es tu nombre “legal” en las solicitudes de financiación mientras que usas nombre + middle name en los artículos, por consistencia.

Para los nombres compuestos:

  • No inclulir el primero de ellos si no lo usas habitualmente, por ejemplo muchos de los “María” que acompañan a nombres de mujeres.
  • Incluir el segundo sólo con la inicial, de manera que se considere un middle name y no se confunda con los apellidos.
  • Incluir el susodicho guión.

Ahora es tu turno. Imagínate que te llamas Juan Ramón Ortiz de Landázuri García-Santos. Cómo lo reducirías? Y no creáis que es me he inventado un nombre especialmente rebuscado: la siguiente es una solución de un caso similar en España, donde la simplificación fue debida (probablemente) al impacto mediático. El nombre completo del expresidente del gobierno de España Leopoldo Calvo-Sotelo (con formato de paper perfecto) era Leopoldo Ramón Pedro Calvo-Sotelo y Bustelo. Como para no reducirlo…

Para una lista más exhaustiva de las opciones, tenéis la Propuesta de manual de ayuda a los investigadores españoles para la normalización del nombre de autores e instituciones en las publicaciones científicas, de la FECYT.

Anuncios

Un comentario en “De autorías científicas y Big Data

  1. Pingback: Tercer Blogiversario | Haciéndome el Sueco

Los comentarios están cerrados.