Hiperautoría y autores honorarios en ciencias sociales. Una cuestión de estilo.

Actualización: La investigación del yacimiento tartésico de Casas deTuruñuelo (en Guareña, Badajoz) implica a once instituciones diferentes; si bien es verdad que  en los cuatro trabajos de investigación publicados sobre ese yacimiento (todos en 2017) no se sobrepasa la cifra de cuatro firmantes.

A finales del 2000, Blaise Cronin sometió al Journal of the American Society for Information Science and Technology un magistral trabajo sobre el creciente número de autores en los artículos de investigación. En el título utilizó el término “Hyperauthorship”, un neologismo que definía simplemente como “niveles masivos de autoría”.
A finales de 2016, mi compañero NicolásRG y yo supimos de una decisión administrativa que consideramos arbitraria. Una agencia oficial de evaluación había decidido minusvalorar o penalizar a los trabajos de investigación en ciencias sociales publicados por más de cuatro autores. En pocos meses realizamos las observaciones y pusimos a punto un manuscrito donde demostramos que el número cuatro era un límite arbitrario y que el número de firmantes de los trabajos en ciencias sociales estaba relacionado con la colaboración con grupos internacionales y conducía a un impacto mayor de las investigaciones realizadas.
Tras medio año de incomprensible retraso, se acaba de publicar nuestro artículo y en su título se afirma que no existe “inflación de autores” en los documentos que hemos analizado. Inflación de autores es una cosa, nosotros nos referíamos más bien a inflación en el número de autores. Yo hubiera preferido emplear el neologismo de Cronin. Y no es el único detalle de estilo que hubiera corregido.
La redacción final del trabajo es buena y no sólo se ajusta al formato que se espera de un original de investigación: además de conveniente es convencional y, aunque Nicolás hizo en esto una gran aportación yo, que siempre me he sentido constreñido por lo estereotipado de los textos científicos, me comporté con mucha mayor libertad en mis borradores, casi tanta libertad como la que disfruto cuando redacto estas notas.
Si a alguien le interesa el trabajo y quiere aprovechar sus resultados, debe leer la versión en la Revista Española de Documentación Científica. Pero si alguien quiere hacer eso que se llama una “lectura en diagonal” o se mueve por simple curiosidad, encontrará mayor fluidez en el texto de mi borrador: aquí, sin tablas ni gráfica sin referencias, que sí se encuentran en la versión publicada.
Y ya que es viernes, un día propicio a la cerveza y a los rubios, venga: un poquito de Dinamarca, que no se diga.

 

 

Advertisements

Vergonzoso de tan simple: de RIS a csv vía Zotero

En más de 30 años dedicado al análisis cuantitativo de los procesos de comunicación y publicación científicas (vulgo análisis bibliométrico) la frase que más he escuchado has sido “el Science Citation Index no cubre la producción científica española” que, andando el tiempo, ha actualizado su contenido, aunque no su significado: “Web of Science no refleja a producción científica española”, “Scopus no cubre la producción científica española” y demás frases equivalentes.
Todas ellas son ciertas, aunque son más verdaderas cuando se matizan: Scopus, WoS (por Web of Science) reflejan en buena medida la producción española en STM: ciencias, tecnología y medicina. También en algunas áreas de las ciencias sociales, como las ciencias económicas y de la conducta. Esto es lógico, puesto que hace tiempo que se obliga a los investigadores españoles a publicar sus trabajos en revistas incluídas en la cobertura de alguno de esos sistemas o los dos: en 2017, WoS incluyó más de 85.000 trabajos publicados en 12.128 revistas diferentes con contribución de grupos de investigación españoles. Pero los investigadores y académicos españoles son mucho más productivos que todo eso.

2017-08-24 11.10.42

Vale, un tanto perjudicada, pero la Feldhase von Dürer

 

El ejemplo de la Historia Moderna

Hará un año que CarolinaC me pidió ayuda para determinar la producción científica de un par de departamentos universitarios de Historia Moderna/Contemporánea. Cuando examiné las fuentes, no me sorprendió averiguar que el investigador más prolífico había publicado dos trabajos según Scopus y nueve según el WoS… pero era autor de 288 publicaciones según Dialnet, el gran sistema bibliográfico español. Parecido contraste existía con los casi 5.000 autores restantes. Descargué los registros de Dialnet en formato RIS y, gracias a un script preparado por FrançoisP obtuve las tablas SQL adecuadas para el análisis de esa información. Si alguien está especialmente interesado, aquí tiene mi contribución.

Un embrollo de siglas

Los archivos csv (comma separated values, o simplemente delimitados por coma) son archivos de texto eran un formato ideal para su transcripción a tarjetas perforadas y para su manejo en los programas de cálculo pioneros, allá por los años 70 y primeros ochenta. Son ideales para representar registros, cada uno presentado como una secuencia de atributos que ocupa una línea. Entre unos y otros atributos, vale cualquier cosa: coma, punto y coma, tabulador y demás. Nunca entenderé por qué sólo algunos sistemas de información bibliográfica y muy pocos gestores personales de esa misma información aceptan el formato csv como soporte de intercambio de registros. Hay quien (como el Hellenic National Documentation Centre) monta APIS y entornos en Java para posibilitar el intercambio entre diferentes sistemas bibliográficos. Hay quien, consciente de las limitaciones de Mendeley, recurre a otro gestor bibliográfico (JabRef) para exportar y eventualmente compartir sus registros a través de csv.Yo soy mucho más limitado.

Aunque es un formato propietario de ISI ResearchSoft (originalmente Research Information Systems) RIS se ha extendido y es admitido y empleado por la práctica totalidad de gestores personales de información bibliográfica, además de por un gran número de bibliotecas digitales y sistemas de información bibliográfica. RIS es lo que se llama un formato “etiquetado” porque presenta en cada línea un elemento precedido de una etiqueta que lo define; así, TY es el tipo de referencia, AU precede a los autores y demás.

ris1

Registros en formato RIS, con las etiquetas de campo precediendo los diferentes atributos. La etiqueta ER (end of record) cierra cada registro y TY (type of record) abre el siguiente.

Dialnet admite la descarga de registros en formato RIS. ¿ Cómo delimitarlos por coma para poder importarlos a tablas SQL y analizarlos sin recurrir a compañeros con sobrecarga de trabajo y sin ahogarse en una sopa de siglas y acrónimos ?

Como siempre: Zotero

Aunque parezca increíble, a veces a uno se le olvida sumar: Zotero puede exportar registros en formato delimitado por comas. Zotero admite la importación de registros en 20 formatos diferentes ¿ So ?. Basta con descargar los registros en RIS, importarlos en Zotero y exportarlos luego en csv para poder capturarlos en tablas SQL. Las fases de este sencillo proceso se muestran a continuación.

zotero2

Desplegable con la lista de formatos que Zotero admite y, al fondo, la lista de registros capturados

Tras la carga en Zotero, basta seleccionar los registros y (botón derecho del ratón) exportar los registros seleccionados. Es muy rica la variedad de formatos de exportación.

 

zotero4

Entre los formatos a que Zotero puede exportar está, claro, el delimitado por comas.

El resultado de la exportación resulta algo decepcionante porque no hay manera de elegir los elementos bibliográficos a exportar y el Dublin Core es muyyyyyyy amplio.

 

csv1

Los registros exportados desde Zotero en formato csv. Las comas simples y las dobles comillas se pueden cambiar con un adecuado procesador de textos.

Finalmente, los registros se pueden incorporar a un sistema de gestión de bases de datos (DBase, Access, FileMaker o, como en este caso, MySQL) para su procesamiento.

 

SQL1

Fragmento de la tabla que contiene los registros.

Siempre será posible, no obstante, eliminar de la definición de tabla los elementos no deseados.

No hay excusas

He iniciado esta nota con un rodeo: hay que manejar varias fuentes para obtener un corpus de documentos que refleje con cierta fidelidad el objeto de estudio. A pesar de las objeciones de sus administradores, Dialnet es una buena fuente de información sobre la investigación española que no está contenida en publicaciones STM. Y sus registros se pueden descargar con facilidad: vía libre para un análisis más exahustivo y fiable de la comunicación y la publicación científica española. Por cierto, una última imagen con alguno de los resultados sobre los investigadores de Historia Moderna.

 

Figure 2

 

Caliente, tanto que la cosa está que arde

Soy gran amante de la molicie, pero no hasta el extremo de apuntar a dos o tres recursos y sitios Web y seguir cultivando primorosamente mi pereza ¿ O sí ?. Dejémoslo en un “podría ser” y consideremos estas notas sólo una supuesta excepción a una pretendida regla.

bocassa

Vale, no es el símbolo de John Pasche para los Rolling, pero para el caso…

Hacia principio de los 2000 comencé a sentir en carne propia los efectos de los “big deal“, esos contratos que luego se revelaron draconianos y que a la larga obligaron a cancelar suscripciones a las ediciones impresas de las revistas científicas, sustituyéndolas por los accesos a sus versiones electrónicas. De repente, una serie  de fascículos, ininterrumpida desde los años 40, se truncaba y era sustituida por algo intangible que podía, llegado el caso, desaparecer del panorama, dejando a las mejores bibliotecas y a sus usuarios compuestos y sin “papers“.

El secretismo que rodeaba esos acuerdos o contratos y, sobre todo, sus importes, se empezó a cuestionar en 2014, cuando un gran equipo de investigación, encabezado por Theodore C. Bergstrom, del departamento de Economía de la University of California, en Santa Barbara y echando mano de la ley americana de liberta de información, la Freedom of Information Act, publicó un estudio demoledor. Fue éste el estudio cuyos cálculos resultaron en el famoso 36 por ciento:

There is ample evidence that large publishers practice price discrimination and that they have been able to set prices well above average costs. In 2011, the journal-publishing divisions of Elsevier, Springer, and Wiley reported profits equal to 36%, 33.9%, and 42%, respectively, of their sales revenue…

Un paso más acá en el tiempo y en el espacio y nos encontramos con el extraordinario reportaje de Stephen Buranyi sobre las interioridades del negocio de la edición científica, incluyendo un repaso biográfico al garn “halcón” del sector, Robert Maxwell (nada que ver con James Maxwell y el electromagnetismo). Yo no leí su reportaje, lo oí, pero existe versión legible en las páginas de ciencia de The Guardian.

La siguiente estación nos pilla de lleno, nos quema: es el informe de Antonio Villarreal con datos de Jesús Escudero sobre la factura que Elsevier presenta cada año a las instituciones españolas de investigación. Los malos suelen venir en banda y a Elsevier, señalado en este trabajo perodístico, cabría añadir a Springer, Wiley y demás multinacionales.

Aplaudo la iniciativa y el trabajo de los periodistas, pero me entristece y avergüenza que, en aras de una pretendida “racionalidad de los recursos” el sistema español de ciencia, educación y tecnología se baje los pantalones antes auténticos desalmados de los negocios. Y que ni uno de los representantes electos se haya significado con la más mínima declaración…

Primera actualización

Esta última frase ha dejado de ser cierta. Dos diputados del partido Ciudadanos, Marta Martín Llaguno y Rodrigo Gómez, han presentado en el Parlamento Español una serie de preguntas dirigidas al Gobierno y centradas en el importe del gasto, el contraste con las cifras de otros países europeos y los posibles mecanismos de ahorro.

Segunda actualización

Lo periodistas de Teknautas están exprimiendo el tema. En esta entrega, sin embargo, han deslizado varios errores de bulto y, sobre todo, una acusación que no sostienen. Afirman que “Elsevier paralizó una ley clave” para proteger su negocio. Se refieren a uno de los artículos de la Ley de la Ciencia y no veo que su texto soporte una afirmación tan grave. A cambio, informan de algunas iniciativas nacionales sobre repositorios (Scipedia) y de otras de edición de artículos y revistas de acceso abierto (MDPI).

 

 

 

P.U.R.I., la indicadora

 

Introducción
Cada investigador intenta seguir y leer los trabajos de las revistas que le merecen confianza. Cada investigador publica (o lo intenta) en las revistas que sigue y lee. De estas premisas se sigue que la publicación esa muestra de confianza y que, cuanto mayor es el número de investigadores o grupos que publican en una revista, mayor es el crédito que le conceden como fuente de información científica.

NOwak

Nevado y de Till Nowak (como el video). No podéis pedir más para estas fechas del año…

Las revistas, entonces, son más influyentes cuanto mayor es su popularidad, medida por el número de grupos de investigación que les someten sus trabajos.

Según Pablo Tusset, lo mejor que le puede pasar a un cruasán (sic, Lengua de Trapo, 2001) es que lo unten con mantequilla. Según casi todos los demás, lo peor que le puede pasar a una revista científica es ser librillo de pocos maestrillos.

Método
Esta PopUlaridad de las Revistas de Investigación (P.U.R.I.) es un cociente de cálculo simplón: tómese el número de instituciones diferentes que han contribuido trabajos a la revista en un periodo dado y divídase por el número de trabajos publicados en ese periodo. Yo he calculado la PURI para la Revista Clínica Española y para Medicina Clínica, ambas revistas españolas de Medicina Interna, fundadas en los años 40 y en poder de Elsevier desde hace algunos años.

Resultados
Medicina Clínica publicó 332 trabajos en 2016, casi tres veces más que la Revista Clínica Española, que publicó 121. Por comodidad, he tomado como denominador sólo aquellos trabajos con contribución de centros españoles y como numerador el número de instituciones diferentes (españolas o no) donde se han realizado esos trabajos.
La PURI de Medicina Clínica es 594/301 = 1,97 y la de Revista Clínica Española de 275/114 = 2,41. Sorprendente, pero real.

Conclusión
Dejo para otra ocasión la comparación entre, pongamos, la Revista Colombiana de Educación y la titulada Actualidades Investigativas en Educación, que queda como trabajo pendiente. Y planteo que PURI no sólo está llamada a participar en el baile de cuantos Latindex, CIRC, ERHI, CARHUS, DICE, MIAR son, sino que será, con diferencia, la más guapa de ese baile, gran cotilla denunciadora de endogamias y chiringuitos.
Lo que suscribo hoy, que es 28 de diciembre, y acompaño de una recomendación especial, no sólo musical.

Una de Hichtcock (con plumas)

El averío lo empezó Elsevier, que no tuvo otra idea que elegir, para su sistema de información bibliográfica, el nombre científico del avemartillo. Dicen fuentes bien informadas— y suscribo yo— que cuando se juega al gigantismo es razonable emplear el nombre del pajarraco que mayores nidos construye para denominar el sistema con la mayor cobertura de los existentes, Scopus. La jugada fue buena: siempre he sospechado que Scopus concede ventaja a las 2969 revistas que como editorial publica la propia Elsevier.
Peero llegó el cuervo, mi querido cuervo, a revolucionar el corral: Sci-Hub, el repositorio que, desafiando a los grandes comerciantes de la información y las revistas científicas, ha resuelto en buena medida los problemas de acceso al documento de millones de investigadores. Picotazo a picotazo, todas las grandes empresas comerciales de edición científica se están viendo afectadas por el cuervo que sujeta la llave y que, de momento, evita la jaula— aunque penosamente— saltando de dominio en dominio.

piolin

Pues bien, hay pájaro nuevo en la bandada: en Junio de 2017, Peter Vincent comunicó la puesta en marcha de Canary Haz, que hasta donde yo sé significa canario flauta. Sin duda tratando de evitar algún que otro malentendido, a este pequeño piolín le han mudado el nombre a otro más pretencioso: ahora se llama Kopernio.
Se trata de otro sistema más que parte de referencias de artículos científicos y obtiene los correspondientes documentos íntegros Lo que es conseguir PDFs, vamos. Pero no lo hace cargando precios abusivos por unas pocas páginas, como las editoriales comerciales que Sci-Hub fustiga; ni a la brava, almacenando PDFs a manos llenas y distribuyéndolos bajo demanda de forma (que decía el otro) “dudosamente legal”. Consigue no sólo acceso libre a los documentos gratuitos, también a aquellos otros cuyo acceso está contratado por la biblioteca de cada institución.
Para ponerlo en funcionamiento, son necesarios tres pasos.
El primero es la instalación de un pequeño programa que se adapta al navegador como extensión (o plugin). Cada vez que obtenemos los resultados de búsqueda en sistemas como Google Académico o PubMed, un rótulo nos informa de la posibilidad de buscar los PDF.
El segundo es el registro personal y gratuito en el sistema. Eso incluye, además del nombre y una contraseña, la dirección de correo electrónico institucional. ¿ Por qué ? Pues porque en el tercer paso o requisito, que consiste en seleccionar la universidad o centro a los que cada uno está afiliado, Kopernio nos identificará como miembros de la institución, averiguará las credenciales y permisos del sistema bibliotecario en cuestión y de esa forma permitirá el acceso a los PDFs de los artículos y revistas incluidos en las suscripciones institucionales, tanto on- como off-campus.

¿ Alguien recuerda con qué cariño Melanie Daniels (Tippi Hendren) compra un pajarito al principio y con qué lastimero aspecto queda malparada  al final en Los Pájaros ? Bueno, pues en nuestro corral también hay sus peros.
Conseguí instalar el plugin y registrarme personalmente en piolín (Kopernio, abreviando) pero no pude identificar ninguna de mis filiaciones institucionales en su lista de autorizadas. Nada extraño teniendo en cuenta que el sistema se encuentra aún en la fase alfa de desarrollo.
Por otra parte, para identificar y obtener los PDF, piolín recurre a revistas de acceso abierto, repositorios institucionales, servidores de preprints… exactamente igual que hacen PubMed (a través de su conexión con PubMed Central) o Google Académico, que enlaza con Arxiv, BioArxiv y otros servidores, además de extraer documentos de plataformas tipo ResearchGate e incluso de páginas personales. Si podemos recurrir a todo eso y, vía VPN, conectar off-campus con los recursos contratados por nuestra institución ¿ Tiene sentido piolín ? Probablemente no. Aunque hablemos de investigadores en situación realmente precaria, con recursos de información limitados o nulos, me cuesta creer que Kopernio vaya a resolverles la papeleta más que la combinación de los recursos ya existentes, incluyendo los de “dudosa legalidad”.
De verdad que no lo veo.

REDoC, TESEO y otras hierbas

Hace tiempo que vengo aplazando mis críticas a la Revista Española de Documentación Científica (REDoC) de la que hay muchas cosas que no me gustan. Mientras las maduro, dedico aquí algunos comentarios sólo al contenido de su número más reciente. Igual interesan a otros.
De los ocho artículos que contiene, seis son de estilo bibliométrico, con tres de ellos centrados en la evaluación; los otros dos trabajos proceden del campo de la biblioteconomía.

oxigeno
El grupo “Políticas de información, Tecnologías de la Documentación y Comunicación Científica” de la Universidad Complutense de Madrid firma el trabajo más interesante de los de estilo cuantitativo. Su artículo me parece valioso porque aborda el manejo de la base de datos TESEO, un registro de las tesis doctorales aprobadas en las universidades españolas que, con ser público, es de utilidad muy limitada y de escaso aprovechamiento. El problema es que no contempla la descarga masiva de registros y, así, se dificulta el análisis de su contenido. Empleando minería de datos, los autores han obtenido algo menos de 200.000 registros de otras tantas tesis y realizan un estudio descriptivo que abarca 37 años. Critican adecuadamente la calidad de su fuente; ponderan razonablemente sus resultados y presentan datos interesantes que algo avanzan sobre las estadísticas oficiales de las tesis doctorales españolas disponibles. Su mérito hubiera sido mayor si pusieran a disposición de otros investigadores los registros que han descargado. Quizá así se consiguiera que el Servicio de Coordinación y Seguimiento Universitario o quien sea responsable del registro de las tesis aprobadas en las universidades españolas lo haga público de verdad.
Los dos trabajos del grupo de la Facultad de Comunicación y Documentación de la Universidad de Granada siguen la práctica de aprovechar la aparición de nuevos recursos de información para explorar su utilidad como fuentes de datos bibliométricos. Enrique Orduña y su grupo insisten en Google Scholar mientras Rafael Repiso centra su trabajo en dos colecciones recientemente añadidas a la Web of Science.
El análisis de las publicaciones españolas sobre investigación de la comunicación radiofónica y el examen de las listas de revistas “autorizadas” (una traducción demasiado libre de la expresión de Alesia Zuccala) cierran el apartado de trabajos bibliométricos.

Mi compañera JuliaO y su equipo han examinado la publicación de trabajos de los investigadores que forman parte de los comités editoriales de revistas de Psicología en esas mismas revistas. Por lo que parece, hay beneficios para ambas partes: los investigadores publican más y con mayor rapidez y esos artículos atraen más citas para las revistas. Miel sobre hojuelas.
Sobre la promoción de la lectura o la motivación a la lectura se vienen publicando entre 40 y 50 artículos por año en revistas internacionales. En España han aparecido más de 40 libros, más de 100 tesis y cerca de 500 trabajos sobre el tema. Gemma Lluch y Sandra Sánchez realizan una revisión de estos trabajos muy limitada, tanto que sus conclusiones apenas tienen validez. Sin embargo, me parece estupendo que la Revista Española de Documentación Científica publique revisiones, incluso que anime o encargue su elaboración. Podría así atraer la atención de más lectores, ejercer mayor influencia en su entorno y traducir eso (que es lo que realmente importa) en una mayor cantidad de citas (que sólo son un reflejo de lo que importa).

Debilidad por el cuervo

Nadie me creyó cuando afirmé que los cuervos de Berlín no eran negros y marcaban el paso de la oca, así que me faltó tiempo para captar a uno en uno de sus paseos.

cuervoberlines
Tomo la anécdota como excusa para referirme muy brevemente a una noticia que supe ayer: la casa editorial Elsevier demanda a Sci-Hub y LibGen el pago de 15 millones de dólares. Y veréis por qué.
Sci-Hub almacena 62 millones de copias de artículos de investigación y bastantes libros. Cualquiera, desde cualquier parte, puede obtener una de ellas sin coste adicional alguno.
Supongo que la actividad de Sci-Hub puede no ser legal. Supongo que la actividad de Elsevier es legal. También creo que la actividad de Sci-Hub no debería perseguirse y que se deberían cuestionar las maneras de Elsevier. Como frente a otras diatribas, no me he formado una opinión, pero he adoptado una postura. Desde estas notas he enlazado con frecuencia las versiones electrónicas de artículos de investigación. En ocasiones, y ante la sospecha fundada de que algunos trabajos no serían accesibles a todo el mundo, he empleado el enlace que me proporcionaba Sci-Hub cuyo anagrama es (qué coincidencia) un cuervo que sostiene una llave.
La fundadora de Sci-Hub, Alexandra Elbakyan, aún no ha cumplido los 30 y ha sido considerada una personalidad relevante para la ciencia y mencionada junto a Edward Snowden, quien ha sido y es relevante para todo el mundo. De momento, el destino de Alexandra es diferente al de Aaron Swartz, un campeón de los formatos libres en Internet, que fue hallado muerto poco tiempo después de ser acusado de una descarga masiva de archivos PDF almacenados en JSTOR.

No dejan de repetirme que la investigación científica es desinteresada y no tiene fronteras. Suelo responder con mi sonrisa más cínica: del trabajo desinteresado de los científicos hay quien  extrae un grandísimo interés y, por mucho que se cacaree lo de la “república de las letras”, todos los premios Nobel tienen pasaporte.

Sabemos lo que pasa cuando el grajo vuela bajo, así que más vale que el cuervo siga marcando el paso de la oca largo tiempo.