Open Access, open data, open science: ¿ Qué se vislumbra al otro lado de la puerta ?

He asistido como observador al lanzamiento de un proyecto de diseño de indicadores sobre investigación e innovación responsables (RRI). Tuve que apresurarme a obtener una buena definición y la que sigue me parece suficiente:

RRI “refers to the comprehensive approach of proceeding in research and innovation in ways that allow all stakeholders (…) to obtain relevant knowledge on the consequences of the outcomes (…) and to effectively evaluate both outcomes and options in terms of societal needs (…) and to use these considerations as functional requirements for design and development of new research, products and services.”

Según parece, la RRI incluye las iniciativas de apertura— Open Access, Open Data, Open Science— que tratan de promover la distribución gratuita de productos académicos y de investigación para que otros profesionales o la sociedad los reutilicen. No estoy totalmente familiarizado con estas iniciativas, pero quiero transmitir algunas reflexiones que quizá resulten de utilidad. Las he dividido en tres partes. La primera contiene algunas referencias al pasado reciente, muy abundante en acrónimos.

Os_taxonomy

La oferta de trabajos académicos y de investigación es muy parcial.

“Open Access” se refiere a la distribución online gratuita y sin trabas de los resultados de la investigación, de forma que se promueva su reutilización. Los resultados principales y más abundantes de la investigación y la actividad académica son las publicaciones científicas. Vale, un poco de historia.
En los años 70, la fundación de la CTNE para el desarrollo social de las comunicaciones en España (FUNDESCO) animó la creación de grandes estructuras informativas. Una de sus filiales, FUINCA, inició en 1977 las actividades la Red INCA (de Información Científica Automatizada) con participación de varios centros del CSIC. Poco después, estos centros abordaron la automatización de los registros de la literatura científica española y crearon las bases de datos IME (Indice Médico Español), ICYT (Indice Español de Ciencia y Tecnología) e ISOC (Indice Español de Ciencias Sociales). Algo posterior es el programa PIC (Puntos de Información Cultural) que permitía que el público en general consultara bases de datos bibliográficas y de contenido cultural variado. Resulta curioso que los PIC, que nacieron en Septiembre de 1980, se propusieran “el libre acceso de los ciudadanos a los bienes culturales (… y) la participación activa de los mismos en su creación o disfrute”.
Al desmantelamiento de FUNDESCO a finales de los años 90 siguió la decadencia de los grandes sistemas españoles de bibliografía científica. Este progresivo deterioro obedeció a la confluencia de factores administrativos, económicos, políticos y creo que también técnicos. Algunos fueron la conversión de institutos de servicio en institutos de investigación del CSIC y la falta de apoyo administrativo al personal de soporte de esas infraestructuras; otro la liquidación de las empresas editoras de revistas científicas españolas, el último y quizá más importante, la exigencia de internacionalizar la publicación de los trabajos españoles de investigación. Algunos datos: en 1990 se publicaron 11.816 artículos médicos en revistas españolas (IME) y 3.524 en revistas extranjeras (WoS). En 2011, su último año operativo, IME incluía 1.933 registros publicados en España mientras WoS registraba más de 16.000 artículos médicos con contribución española y MEDLINE, el principal sistema bibliográfico que abarca la Biomedicina global, contiene casi 22.000 trabajos con contribución española ese mismo año, pero sólo 1363 publicados en revistas españolas. De los 22.000 trabajos mencionados, por cierto, sólo 4478 son universal y libremente accesibles. Y que conste que la Biomedicina es un ejemplo muy fácil.
Datos tan fragmentarios no sólo impiden determinar la proporción de la literatura científica española accesible, sino también el montante total de publicaciones españolas, porque esas publicaciones parecen distribuirse en dos ámbitos separados, uno nacional y otro internacional, cuyas fuentes bibliográficas de elección podrían ser en la actualidad Dialnet, un sistema nacional operativo desde principios de 2002 , y diversos sistemas internacionales Web of Science, Scopus, MEDLINE y demás.
Además de los sistemas de información bibliográfica, hay otros de tipo administrativo. Por una parte, los sistemas CRIS (Current Research Information Systems) para almacenar y gestionar datos sobre la investigación llevada a cabo en cada institución y, por otra parte, los repositorios institucionales, destinados a la conservación de copias digitales de los documentos académicos o de investigación producidos, nuevamente, en cada institución. En relación con los primeros, sería posible coordinar sus contenidos y crear un CRIS nacional, del mismo modo que existe un catálogo colectivo de las bibliotecas universitarias españolas.
Respecto de los repositorios, también existen servicios que recopilan el contenido y favorecen la consulta y el acceso de manera combinada a varios o todos ellos. En julio de 2008 había 43 repositorios académicos y de investigación. Ocho años más tarde, Lucía Morcillo ha analizado 49 repositorios universitarios. Aunque en algunos los documentos se cuentan por cientos de miles, no parece que los investigadores sean especialmente diligentes depositando copias de sus trabajos. Muchos prefieren enviarlas a una red social académica o a un repositorio temático (Arxiv, PMC u otros) antes que embarcarse en el proceso de registrarlas, de por sí farragoso. Así que tanto los CRIS como los repositorios institucionales son muy incompletos. Algunos datos más: un conocido centro español de investigación ha participado en la realización de 286 tesis doctorales a lo largo de su trayectoria. De ellas, sólo 80 están registradas como tales en el catálogo colectivo de la organización y sólo se dispone de copia de 20 en el correspondiente repositorio.

¿ Qué ofrecen todas estas colecciones a los profesionales o aficionados que deseen reutilizar sus contenidos ? Una parte de las publicaciones españolas académicas y de investigación que, además, sólo en parte están disponibles para su “reutilización”.

La expresión “Open data” se debería abandonar

Datos abiertos no equivale a datos de investigación. La mayor y mejor fuente de datos sobre la realidad española es el Instituto Nacional de Estadística. Cabe afirmar lo mismo de cualquier país con un sistema decente de registros.
Que en España hubiera algo menos de 29 millones de cerdos en 2017; que el nombre masculino y el apellido más frecuentes sean respectivamente José y García, o que el cáncer de mama fuera responsable de 137.000 ingresos hospitalarios en 2016 son datos, sí; accesibles a todo el mundo a través de una conexión online, sí pero… son datos fruto de operaciones de registro administrativo en diversos ámbitos y no datos resultantes de la actividad científica. De los 284.225 conjuntos de datos que la administración estadounidense ofrece, sólo algunos proceden de centros educativos o de investigación. Y parece que también son datos administrativos.
Es posible que la expresión “data sharing and reuse”, que se puede traducir por “intercambio de datos” sea más apropiada que “open data” para designar una actividad que hace tiempo forma parte de las rutinas de la investigación.
Este énfasis en la terminología no es gratuito: los datos científicos, resultantes de la actividad investigadora, sólo son útiles a quienes pueden comprender sun utilidad: otros científicos.
Hay muy pocas personas fuera de los ámbitos académicos que sepan manejarse en el panorama de las bases de datos de proteínas o de biología molecular. La interpretación de datos antropométricos y la utilización de plásmidos están reservadas también a especialistas, personas capacitadas para su comprensión. Juzgar estos datos de cara a su aplicación o estimar su validez o su ajuste a objetivos sociales no parecen tareas fáciles.
Es muy difícil que un lego comprenda el contenido de un trabajo de investigación, no digamos que interprete correctamente los datos resultantes.

A la apertura de publicaciones, recursos académicos y datos, la “Ciencia abierta” añade la de los códigos (open source) y los métodos. Ni que decir tiene que esta propuesta está tan limitada como las anteriores a las comunidades investigadoras y quizá también a las académicas. A veces he llegado a sospechar que el índice E (de egocentrismo) mucho más elevado que el índice H, está detrás de algunos intentos por alcanzar un protagonismo innecesario, si no inmerecido.
He escrito todo lo anterior sin disimular mi escepticismo. Hace dos días Jon Tennant se publicó el mejor documento hasta la fecha sobre lo que agrupa bajo el término genérico de “Open Scholarship”. Me comprometo a examinarlo y volver luego a escribir sobre estos movimientos. De momento, mi pronóstico es reservado pero, para que ningún ceño quede fruncido, ahí tenéis una música que deberían haber compuesto para una película de Monsieur Hulot, aunque se adelantó a 1930. Ya sabéis: fröhliche Feiertage !

Advertisements

Hiperautoría y autores honorarios en ciencias sociales. Una cuestión de estilo.

Actualización: La investigación del yacimiento tartésico de Casas deTuruñuelo (en Guareña, Badajoz) implica a once instituciones diferentes; si bien es verdad que  en los cuatro trabajos de investigación publicados sobre ese yacimiento (todos en 2017) no se sobrepasa la cifra de cuatro firmantes.

A finales del 2000, Blaise Cronin sometió al Journal of the American Society for Information Science and Technology un magistral trabajo sobre el creciente número de autores en los artículos de investigación. En el título utilizó el término “Hyperauthorship”, un neologismo que definía simplemente como “niveles masivos de autoría”.
A finales de 2016, mi compañero NicolásRG y yo supimos de una decisión administrativa que consideramos arbitraria. Una agencia oficial de evaluación había decidido minusvalorar o penalizar a los trabajos de investigación en ciencias sociales publicados por más de cuatro autores. En pocos meses realizamos las observaciones y pusimos a punto un manuscrito donde demostramos que el número cuatro era un límite arbitrario y que el número de firmantes de los trabajos en ciencias sociales estaba relacionado con la colaboración con grupos internacionales y conducía a un impacto mayor de las investigaciones realizadas.
Tras medio año de incomprensible retraso, se acaba de publicar nuestro artículo y en su título se afirma que no existe “inflación de autores” en los documentos que hemos analizado. Inflación de autores es una cosa, nosotros nos referíamos más bien a inflación en el número de autores. Yo hubiera preferido emplear el neologismo de Cronin. Y no es el único detalle de estilo que hubiera corregido.
La redacción final del trabajo es buena y no sólo se ajusta al formato que se espera de un original de investigación: además de conveniente es convencional y, aunque Nicolás hizo en esto una gran aportación yo, que siempre me he sentido constreñido por lo estereotipado de los textos científicos, me comporté con mucha mayor libertad en mis borradores, casi tanta libertad como la que disfruto cuando redacto estas notas.
Si a alguien le interesa el trabajo y quiere aprovechar sus resultados, debe leer la versión en la Revista Española de Documentación Científica. Pero si alguien quiere hacer eso que se llama una “lectura en diagonal” o se mueve por simple curiosidad, encontrará mayor fluidez en el texto de mi borrador: aquí, sin tablas ni gráfica sin referencias, que sí se encuentran en la versión publicada.
Y ya que es viernes, un día propicio a la cerveza y a los rubios, venga: un poquito de Dinamarca, que no se diga.

 

 

Vergonzoso de tan simple: de RIS a csv vía Zotero

En más de 30 años dedicado al análisis cuantitativo de los procesos de comunicación y publicación científicas (vulgo análisis bibliométrico) la frase que más he escuchado has sido “el Science Citation Index no cubre la producción científica española” que, andando el tiempo, ha actualizado su contenido, aunque no su significado: “Web of Science no refleja a producción científica española”, “Scopus no cubre la producción científica española” y demás frases equivalentes.
Todas ellas son ciertas, aunque son más verdaderas cuando se matizan: Scopus, WoS (por Web of Science) reflejan en buena medida la producción española en STM: ciencias, tecnología y medicina. También en algunas áreas de las ciencias sociales, como las ciencias económicas y de la conducta. Esto es lógico, puesto que hace tiempo que se obliga a los investigadores españoles a publicar sus trabajos en revistas incluídas en la cobertura de alguno de esos sistemas o los dos: en 2017, WoS incluyó más de 85.000 trabajos publicados en 12.128 revistas diferentes con contribución de grupos de investigación españoles. Pero los investigadores y académicos españoles son mucho más productivos que todo eso.

2017-08-24 11.10.42

Vale, un tanto perjudicada, pero la Feldhase von Dürer

 

El ejemplo de la Historia Moderna

Hará un año que CarolinaC me pidió ayuda para determinar la producción científica de un par de departamentos universitarios de Historia Moderna/Contemporánea. Cuando examiné las fuentes, no me sorprendió averiguar que el investigador más prolífico había publicado dos trabajos según Scopus y nueve según el WoS… pero era autor de 288 publicaciones según Dialnet, el gran sistema bibliográfico español. Parecido contraste existía con los casi 5.000 autores restantes. Descargué los registros de Dialnet en formato RIS y, gracias a un script preparado por FrançoisP obtuve las tablas SQL adecuadas para el análisis de esa información. Si alguien está especialmente interesado, aquí tiene mi contribución.

Un embrollo de siglas

Los archivos csv (comma separated values, o simplemente delimitados por coma) son archivos de texto eran un formato ideal para su transcripción a tarjetas perforadas y para su manejo en los programas de cálculo pioneros, allá por los años 70 y primeros ochenta. Son ideales para representar registros, cada uno presentado como una secuencia de atributos que ocupa una línea. Entre unos y otros atributos, vale cualquier cosa: coma, punto y coma, tabulador y demás. Nunca entenderé por qué sólo algunos sistemas de información bibliográfica y muy pocos gestores personales de esa misma información aceptan el formato csv como soporte de intercambio de registros. Hay quien (como el Hellenic National Documentation Centre) monta APIS y entornos en Java para posibilitar el intercambio entre diferentes sistemas bibliográficos. Hay quien, consciente de las limitaciones de Mendeley, recurre a otro gestor bibliográfico (JabRef) para exportar y eventualmente compartir sus registros a través de csv.Yo soy mucho más limitado.

Aunque es un formato propietario de ISI ResearchSoft (originalmente Research Information Systems) RIS se ha extendido y es admitido y empleado por la práctica totalidad de gestores personales de información bibliográfica, además de por un gran número de bibliotecas digitales y sistemas de información bibliográfica. RIS es lo que se llama un formato “etiquetado” porque presenta en cada línea un elemento precedido de una etiqueta que lo define; así, TY es el tipo de referencia, AU precede a los autores y demás.

ris1

Registros en formato RIS, con las etiquetas de campo precediendo los diferentes atributos. La etiqueta ER (end of record) cierra cada registro y TY (type of record) abre el siguiente.

Dialnet admite la descarga de registros en formato RIS. ¿ Cómo delimitarlos por coma para poder importarlos a tablas SQL y analizarlos sin recurrir a compañeros con sobrecarga de trabajo y sin ahogarse en una sopa de siglas y acrónimos ?

Como siempre: Zotero

Aunque parezca increíble, a veces a uno se le olvida sumar: Zotero puede exportar registros en formato delimitado por comas. Zotero admite la importación de registros en 20 formatos diferentes ¿ So ?. Basta con descargar los registros en RIS, importarlos en Zotero y exportarlos luego en csv para poder capturarlos en tablas SQL. Las fases de este sencillo proceso se muestran a continuación.

zotero2

Desplegable con la lista de formatos que Zotero admite y, al fondo, la lista de registros capturados

Tras la carga en Zotero, basta seleccionar los registros y (botón derecho del ratón) exportar los registros seleccionados. Es muy rica la variedad de formatos de exportación.

 

zotero4

Entre los formatos a que Zotero puede exportar está, claro, el delimitado por comas.

El resultado de la exportación resulta algo decepcionante porque no hay manera de elegir los elementos bibliográficos a exportar y el Dublin Core es muyyyyyyy amplio.

 

csv1

Los registros exportados desde Zotero en formato csv. Las comas simples y las dobles comillas se pueden cambiar con un adecuado procesador de textos.

Finalmente, los registros se pueden incorporar a un sistema de gestión de bases de datos (DBase, Access, FileMaker o, como en este caso, MySQL) para su procesamiento.

 

SQL1

Fragmento de la tabla que contiene los registros.

Siempre será posible, no obstante, eliminar de la definición de tabla los elementos no deseados.

No hay excusas

He iniciado esta nota con un rodeo: hay que manejar varias fuentes para obtener un corpus de documentos que refleje con cierta fidelidad el objeto de estudio. A pesar de las objeciones de sus administradores, Dialnet es una buena fuente de información sobre la investigación española que no está contenida en publicaciones STM. Y sus registros se pueden descargar con facilidad: vía libre para un análisis más exahustivo y fiable de la comunicación y la publicación científica española. Por cierto, una última imagen con alguno de los resultados sobre los investigadores de Historia Moderna.

 

Figure 2

 

Sólo para músicos: los misterios de Leopoldo Magenti y sus “Estampes Mediterrànies”

Hace mucho que interpreté por primera vez la suite sinfónica de Leopoldo Magenti “Estampas Mediterráneas (Estampes Mediterrànies)” y aún no he conseguido resolver un par de misterios o de interrogantes a propósito de esta obrita, aunque aporto aquí un modesto remedio a uno de ellos.

Certamen

De pianista prometedor y futuro solista, Magenti se quedó en director, profesor, crítico y compositor tardío de una obra necesariamente corta. La entrada de la edición en español de Wikipedia no le hace justicia— ni siquiera relaciona la obra a la que me estoy refiriendo. Un viejo artículo de Begoña Jorques me ha puesto en la pista de las dos tesis doctorales que tratan su figura como compositor y como crítico. Manuel Olmos Gil le dedica su estudio Leopoldo Magenti Chelvi (1894-1969). Retrospectiva musical d’un home polifacètic y en 2008, Rafael Polanco Olmos trató su actividad crítica en La crítica musical en la prensa diaria valenciana: 1912-1923.
Apostilla breve: uno de estos días, alguien tendrá que dedicarle un pasodoble a Román de la Calle, director de muchas y buenas tesis sobre historia y estética de la música. Fin de la apostilla.

Tendré que leerlas para mejorar, si es posible, esa entrada y, de paso, tratar e resolver los interrogantes sobre la obra. El primero de ellos se refiere a su ejecución: aunque la suite tiene cuatro partes, casi siempre se interpretan las dos primeras y la última. Sólo conozco una interpretación que escape a esta regla— la de la Unión Musical de Liria de Julio de 2011— y es la excepción que la confirma. Ese segundo tiempo se titula “Idilio en el peñón de Ifach” y, francamente, no me parece que suene tan horrible. El caso es que la obra, que completa alcanza casi los 15 minutos, se suele quedar el 10.
El otro pequeño misterio me atañe. Según escribe Sixto Ferrero en su artículo biográfico, Magenti compuso la suite para piano solo en 1951, la orquestó al año siguiente y en 1956 apareció la versión para banda. Según la la edición de 2003 de Piles y el Instituto Valenciano de la Música, está orquestada para las maderas habituales (sin oboes, curioso, pero con contrafagot) metales algo hipertrofiados (cuatro trombones son muchos trombones) una percusión mínima y el habitual quinteto de cuerda. Hasta ahí vale pero ¿ De dónde demonios sale en la versión para banda sinfónica una parte en Si bemol para la tuba ?. La edición de 1988 de la Diputación de Valencia contiene sólo la parte en esa tonalidad– que ya no es habitual en España– así que todas las bandas añaden una transposición manuscrita que cuesta desentrañar. Esto es raro: en la transcripción para banda sinfónica de una partitura orquestal, la parte de tuba se suele extraer de la destinada an los contrabajos, que se afinan en Do. ¿ Entonces ?
En fin, aquí está mi pequeño remedio, mi grano de arena: una partitura de Estampes Mediterránies para Tuba en Do que no es que sea perfecta (aún no domino tanto MuseScore) pero, vaya, se puede leer. Y, claro ¡ Sólo comprende los tres tiempos que habitualmente se interpretan !
Como siempre, que aproveche a quien corresponda.

Caliente, tanto que la cosa está que arde

Soy gran amante de la molicie, pero no hasta el extremo de apuntar a dos o tres recursos y sitios Web y seguir cultivando primorosamente mi pereza ¿ O sí ?. Dejémoslo en un “podría ser” y consideremos estas notas sólo una supuesta excepción a una pretendida regla.

bocassa

Vale, no es el símbolo de John Pasche para los Rolling, pero para el caso…

Hacia principio de los 2000 comencé a sentir en carne propia los efectos de los “big deal“, esos contratos que luego se revelaron draconianos y que a la larga obligaron a cancelar suscripciones a las ediciones impresas de las revistas científicas, sustituyéndolas por los accesos a sus versiones electrónicas. De repente, una serie  de fascículos, ininterrumpida desde los años 40, se truncaba y era sustituida por algo intangible que podía, llegado el caso, desaparecer del panorama, dejando a las mejores bibliotecas y a sus usuarios compuestos y sin “papers“.

El secretismo que rodeaba esos acuerdos o contratos y, sobre todo, sus importes, se empezó a cuestionar en 2014, cuando un gran equipo de investigación, encabezado por Theodore C. Bergstrom, del departamento de Economía de la University of California, en Santa Barbara y echando mano de la ley americana de liberta de información, la Freedom of Information Act, publicó un estudio demoledor. Fue éste el estudio cuyos cálculos resultaron en el famoso 36 por ciento:

There is ample evidence that large publishers practice price discrimination and that they have been able to set prices well above average costs. In 2011, the journal-publishing divisions of Elsevier, Springer, and Wiley reported profits equal to 36%, 33.9%, and 42%, respectively, of their sales revenue…

Un paso más acá en el tiempo y en el espacio y nos encontramos con el extraordinario reportaje de Stephen Buranyi sobre las interioridades del negocio de la edición científica, incluyendo un repaso biográfico al garn “halcón” del sector, Robert Maxwell (nada que ver con James Maxwell y el electromagnetismo). Yo no leí su reportaje, lo oí, pero existe versión legible en las páginas de ciencia de The Guardian.

La siguiente estación nos pilla de lleno, nos quema: es el informe de Antonio Villarreal con datos de Jesús Escudero sobre la factura que Elsevier presenta cada año a las instituciones españolas de investigación. Los malos suelen venir en banda y a Elsevier, señalado en este trabajo perodístico, cabría añadir a Springer, Wiley y demás multinacionales.

Aplaudo la iniciativa y el trabajo de los periodistas, pero me entristece y avergüenza que, en aras de una pretendida “racionalidad de los recursos” el sistema español de ciencia, educación y tecnología se baje los pantalones antes auténticos desalmados de los negocios. Y que ni uno de los representantes electos se haya significado con la más mínima declaración…

Primera actualización

Esta última frase ha dejado de ser cierta. Dos diputados del partido Ciudadanos, Marta Martín Llaguno y Rodrigo Gómez, han presentado en el Parlamento Español una serie de preguntas dirigidas al Gobierno y centradas en el importe del gasto, el contraste con las cifras de otros países europeos y los posibles mecanismos de ahorro.

Segunda actualización

Lo periodistas de Teknautas están exprimiendo el tema. En esta entrega, sin embargo, han deslizado varios errores de bulto y, sobre todo, una acusación que no sostienen. Afirman que “Elsevier paralizó una ley clave” para proteger su negocio. Se refieren a uno de los artículos de la Ley de la Ciencia y no veo que su texto soporte una afirmación tan grave. A cambio, informan de algunas iniciativas nacionales sobre repositorios (Scipedia) y de otras de edición de artículos y revistas de acceso abierto (MDPI).

 

 

 

P.U.R.I., la indicadora

 

Introducción
Cada investigador intenta seguir y leer los trabajos de las revistas que le merecen confianza. Cada investigador publica (o lo intenta) en las revistas que sigue y lee. De estas premisas se sigue que la publicación esa muestra de confianza y que, cuanto mayor es el número de investigadores o grupos que publican en una revista, mayor es el crédito que le conceden como fuente de información científica.

NOwak

Nevado y de Till Nowak (como el video). No podéis pedir más para estas fechas del año…

Las revistas, entonces, son más influyentes cuanto mayor es su popularidad, medida por el número de grupos de investigación que les someten sus trabajos.

Según Pablo Tusset, lo mejor que le puede pasar a un cruasán (sic, Lengua de Trapo, 2001) es que lo unten con mantequilla. Según casi todos los demás, lo peor que le puede pasar a una revista científica es ser librillo de pocos maestrillos.

Método
Esta PopUlaridad de las Revistas de Investigación (P.U.R.I.) es un cociente de cálculo simplón: tómese el número de instituciones diferentes que han contribuido trabajos a la revista en un periodo dado y divídase por el número de trabajos publicados en ese periodo. Yo he calculado la PURI para la Revista Clínica Española y para Medicina Clínica, ambas revistas españolas de Medicina Interna, fundadas en los años 40 y en poder de Elsevier desde hace algunos años.

Resultados
Medicina Clínica publicó 332 trabajos en 2016, casi tres veces más que la Revista Clínica Española, que publicó 121. Por comodidad, he tomado como denominador sólo aquellos trabajos con contribución de centros españoles y como numerador el número de instituciones diferentes (españolas o no) donde se han realizado esos trabajos.
La PURI de Medicina Clínica es 594/301 = 1,97 y la de Revista Clínica Española de 275/114 = 2,41. Sorprendente, pero real.

Conclusión
Dejo para otra ocasión la comparación entre, pongamos, la Revista Colombiana de Educación y la titulada Actualidades Investigativas en Educación, que queda como trabajo pendiente. Y planteo que PURI no sólo está llamada a participar en el baile de cuantos Latindex, CIRC, ERHI, CARHUS, DICE, MIAR son, sino que será, con diferencia, la más guapa de ese baile, gran cotilla denunciadora de endogamias y chiringuitos.
Lo que suscribo hoy, que es 28 de diciembre, y acompaño de una recomendación especial, no sólo musical.

Una de Hichtcock (con plumas)

El averío lo empezó Elsevier, que no tuvo otra idea que elegir, para su sistema de información bibliográfica, el nombre científico del avemartillo. Dicen fuentes bien informadas— y suscribo yo— que cuando se juega al gigantismo es razonable emplear el nombre del pajarraco que mayores nidos construye para denominar el sistema con la mayor cobertura de los existentes, Scopus. La jugada fue buena: siempre he sospechado que Scopus concede ventaja a las 2969 revistas que como editorial publica la propia Elsevier.
Peero llegó el cuervo, mi querido cuervo, a revolucionar el corral: Sci-Hub, el repositorio que, desafiando a los grandes comerciantes de la información y las revistas científicas, ha resuelto en buena medida los problemas de acceso al documento de millones de investigadores. Picotazo a picotazo, todas las grandes empresas comerciales de edición científica se están viendo afectadas por el cuervo que sujeta la llave y que, de momento, evita la jaula— aunque penosamente— saltando de dominio en dominio.

piolin

Pues bien, hay pájaro nuevo en la bandada: en Junio de 2017, Peter Vincent comunicó la puesta en marcha de Canary Haz, que hasta donde yo sé significa canario flauta. Sin duda tratando de evitar algún que otro malentendido, a este pequeño piolín le han mudado el nombre a otro más pretencioso: ahora se llama Kopernio.
Se trata de otro sistema más que parte de referencias de artículos científicos y obtiene los correspondientes documentos íntegros Lo que es conseguir PDFs, vamos. Pero no lo hace cargando precios abusivos por unas pocas páginas, como las editoriales comerciales que Sci-Hub fustiga; ni a la brava, almacenando PDFs a manos llenas y distribuyéndolos bajo demanda de forma (que decía el otro) “dudosamente legal”. Consigue no sólo acceso libre a los documentos gratuitos, también a aquellos otros cuyo acceso está contratado por la biblioteca de cada institución.
Para ponerlo en funcionamiento, son necesarios tres pasos.
El primero es la instalación de un pequeño programa que se adapta al navegador como extensión (o plugin). Cada vez que obtenemos los resultados de búsqueda en sistemas como Google Académico o PubMed, un rótulo nos informa de la posibilidad de buscar los PDF.
El segundo es el registro personal y gratuito en el sistema. Eso incluye, además del nombre y una contraseña, la dirección de correo electrónico institucional. ¿ Por qué ? Pues porque en el tercer paso o requisito, que consiste en seleccionar la universidad o centro a los que cada uno está afiliado, Kopernio nos identificará como miembros de la institución, averiguará las credenciales y permisos del sistema bibliotecario en cuestión y de esa forma permitirá el acceso a los PDFs de los artículos y revistas incluidos en las suscripciones institucionales, tanto on- como off-campus.

¿ Alguien recuerda con qué cariño Melanie Daniels (Tippi Hendren) compra un pajarito al principio y con qué lastimero aspecto queda malparada  al final en Los Pájaros ? Bueno, pues en nuestro corral también hay sus peros.
Conseguí instalar el plugin y registrarme personalmente en piolín (Kopernio, abreviando) pero no pude identificar ninguna de mis filiaciones institucionales en su lista de autorizadas. Nada extraño teniendo en cuenta que el sistema se encuentra aún en la fase alfa de desarrollo.
Por otra parte, para identificar y obtener los PDF, piolín recurre a revistas de acceso abierto, repositorios institucionales, servidores de preprints… exactamente igual que hacen PubMed (a través de su conexión con PubMed Central) o Google Académico, que enlaza con Arxiv, BioArxiv y otros servidores, además de extraer documentos de plataformas tipo ResearchGate e incluso de páginas personales. Si podemos recurrir a todo eso y, vía VPN, conectar off-campus con los recursos contratados por nuestra institución ¿ Tiene sentido piolín ? Probablemente no. Aunque hablemos de investigadores en situación realmente precaria, con recursos de información limitados o nulos, me cuesta creer que Kopernio vaya a resolverles la papeleta más que la combinación de los recursos ya existentes, incluyendo los de “dudosa legalidad”.
De verdad que no lo veo.