Hallow-e’en (a particular homage)

As a kid, I used to spend most of my summer holidays at my grands. Back then, everything was new and every day brought a discovery. A newborn lamb that Alfredo, the son of the shepherd, showed me; the magic of the Chinese balloons, ascending like phantom lanterns in the fresh air at dawn; the recoil of a rifle that threw me back and down to the  ground; the sparking stones, shining at night when hit with each other.
As a stationmaster, my grandad lived with my granny at a railway station, a small one with very light traffic: no more than four trains per shift stopped by. It was a perfect place for a man who had abandoned public life and whose greater hobby was hunting or, rather, hiking through the loneliness of the countryside.
The white building with its red roof was surrounded by fields of almond and some scattered carob trees. Of these, the oldest had been the one my grand chose to build a swing, hanging a log from the upper branches held by thick ropes. What an irony !: One of my favourite places, my best playground ever, would become the stage of my worst experience, the source of nightmares that had to last for years.

algarrobo
Older people are not early birds and some days, tired of waiting for my granny to call me for breakfast, I got out of the bed and the station to visit the old tree.  It was amazing to climb the stem and ride some branch, listening to the soft coo of the doves, the funny calls of the blackbirds and the chirp of the sparrows while smelling the carob pods, surrounded by leaves filtering the first rays of the Sun. But one day, everything changed as a snake begun to encircle the log of the tree while I was on an upper branch. Almost still, mimicking the rough surface of the tree bark, I could see her eyes, although not her tongue. Was she sleeping ?. Have I awoke her while climbing, maybe stepped on her ? And so, was she ready to strangle me, to bite me ? Even now, I don’t know why I thought of the snake as a female creature. What I did know was that she was, for sure, of a poisonous kind.
I was not afraid, she didn’t scared the shit out of me (if I may put it this way). No. I wasn’t terrified or thrilled either— mostly because I was unable of the least movement. Instead, I panicked and nearly passed out. It was a logical reaction: ‘If I don’t see you— I thought— you can’t attack me; you can even disappear’. My eyes closed, I could feel my heart beating, the sweat soaking my clothes, but not my breathing as I’ve decided holding it hoping the beast didn’t hear me. I didn’t dare even shallow my own saliva !. The worst signal was that birds were not singing any more. It was as though they were waiting for some quick reaction, as though the silence was announcing a violent, wild outcome. How long did that take I don’t know. No passers by at such an early hour, no awaken grandparents either. I couldn’t take the risk of crying for some help.
Somehow (maybe it was just a matter of fatigue) I managed to move my hand without alerting the snake as she remained still around the stem. My next move along the branch was also unnoticed. All of a sudden, I had the creepy sensation that my hand had touched one of the baby snakes. I encouraged myself and opened the eyes. What I touched was the swing rope and my only opportunity to escape such a monster !
I roped down until my feet found the swing log and run as fast as I could (snakes are pretty far, you know). I never told my grands about my horrible experience because, among other reasons, I’m not sure, even now, about the snake. Did she really exist ?. Could have it been a lightning effect ? Were snake’s eyes mere insects roaming the tree bark ?
Never mind. What was real and persisted for a long time was the fear, which I knew back then, in that happy time.

Cheers and have a good loooooong weekend

Advertisements

Una de chinos

Me resulta sorprendente que, en algunas épocas o en algunas temporadas o incluso en ciertos días se acumulen varias experiencias que se refieren a un mismo ambiente, a una misma cultura o a los rastros e influencias que esa cultura ha ido impregnando alrededor.

dscn1910

Pues no, no es un bosque de bambú, pero a primera vista…

La palabra “chino” se ha convertido en una palabra contenedor que usamos para referirnos a un montón de cosas, personas y geografía que antes agrupábamos  como “orientales”. Pero precisamente el hecho de que dispongamos de esa palabra genérica pone de manifiesto que la influencia de la cultura o los productos de Japón, de China o de cualquier país de los del Sudeste de Asia es más que palpable.
Tenemos restaurantes chinos, tiendas de chinos, películas de chinos y cada vez más personas chinas alrededor. Y eso es fenomenal. Yo, que me siento por eso privilegiado, tengo además “música de chinos”.
Estos días, mi primer encuentro con algo de “ambiente chino” es musical. Tras ensayos a lo largo de un par de meses he colaborado con la banda del CEM en la interpretación de Shanghai. Esta obra es una obertura subtitulada “asiática” para banda sinfónica.  La compuso Oscar Navarro, un músico alicantino que cumple los 35 este año, por encargo del Certamen de Bandas de 2010. La obra muestra oficio, una estructura clara con tres secciones que alternan con ritornellos en el duo de flautas, un excelente colorido instrumental y cierta dificultad en el presto final de las maderas (algunos clarinetistas enrojecen de forma alarmante en esos compases) como corresponde a la obra obligada de un concurso.
Y ahora de China a Japón.
A pesar de eso o quizá precisamente por las reminiscencias orientales que contiene su armonía , mi cabeza estaba en otra música durante los ensayos: en la que Ryuichi Sakamoto compuso en 1983 para la película Feliz Navidad, Mr Lawrence, una película de Nagisa Ôshima que aún hace que se me humedezcan los ojos.
Y de Japón a Vietnam, ya puestos…
Cuando he querido recuperar la delicada pieza inicial, he dudado entre la versión del propio Sakamoto, la de Elena Mattiuzzi, una joven italiana que también la interpreta al piano solo, sin arreglos electrónicos, y la de un mochilero que la utiliza por toda banda sonora en un corto sobre su viaje a Vietnam. Y mira tú por dónde, a pesar de que su video dura menos de tres minutos (la pieza de Sakamoto se acerca a los cinco) sus imágenes son tan atractivas que hasta le han valido a Pedro Saavedra, el mochilero, una propuesta de matrimonio (sí).
Por razones personales Vietnam me toca muy, muy de cerca. Porque soy un sentimental, la película de Lawrence, con su trama y su música japonesas, me toca la fibra. Me alegro de que Oscar Navarro y su música me hayan permitido embobarme otra vez con esos temas.

En fin, os dejo con mi disculpa por no haber escrito estas notas en Viernes y con las imágenes de Pedro Saavedra, que ya debe de haber perecido víctima de la morena…

Vietnam from Pedro J. Saavedra on Vimeo.

A vueltas con los títulos de los trabajos de investigación

Me sorprende y me gusta que las revistas dedicadas al análisis cuantitativo de los procesos de comunicación en ciencia, lo que habitualmente se conoce por bibliometría, se desvíen de tanto en tanto e incluyan trabajos sobre algunos aspectos de la escritura científica. Por mi parte, no es la primera vez que trato el tema…

En su último número (volumen 109, número 2, con fecha de publicación Noviembre de 2016) la revista Scientometrics vuelve a incluir uno de esos trabajos. He escrito vuelve porque no hace mucho (en Abril de 2015) mi querido James Hartley publicó una brevísima nota al editor en que criticaba otro trabajo anterior. O más exactamente, criticaba que en ese trabajo se tuviera por defectuosos y se considerara inapropiados los títulos que contenían signos de interrogación, acrónimos y otras variaciones estilísticas. La opinión de Harley era que “the examples of the title genres that they criticise present a rich tapestry of variation and opportunity. Titles vary in length, format, and purpose. Some formats are more popular in different disciplines, and no one format will meet all situations”.

dscn2027

Nada como un observatorio para captar las lecciones de la realidad. En la imagen, el antiguo observatorio astronómico de la Facultad de Ciencias (hoy Rectorado) de la Universidad de Valencia (Perdón por la suciedad de los cristales del despacho)

 

Hartley no sólo tenía razón por su sabiduría de viejo profesor y por el peso de los argumentos y referencias que aportaba. Además, es uno de los autores que más ha frecuentado el tema de los títulos de los trabajos de investigación. Y también el de los resúmenes estructurados. Hace ya once años que también en Scientometrics apareció su trabajo sobre el número de palabras y la presencia del signo “:” en los títulos de los trabajos de investigación (un signo que delata el carácter compuesto  del título) así que a su autoridad se suma su experiencia.

(By the way, James, I’ve had fun in seeing how your original title has been “transliterated” with a surprising ampersand sign instead of your abbreviation. Spanish jargon calls these Chinese characters !):

sin-titulo

 

Por si la experiencia y autoridad de James Hartley no fuera suficiente, la realidad sigue siendo una gran maestra.

El trabajo al que dedico esta nota se titula “An analysis of the titles of papers submitted to the UK REF in 2014: authors, disciplines, and stylistic details” y ofrece varias lecciones a partir de la observación de más de 155.500 artículos sometidos en 2014 al escrutinio del Research Excellence Framework, la versión británica de los procesos periódicos de evaluación de la actividad científica. Este título contiene dos acrónimos y los dos puntos, pero nos interesan más su contenido.

El objetivo del trabajo es determinar la incidencia del número de autores sobre la sintaxis de los títulos. En concreto sobre la redacción de títulos compuestos (con dos puntos) y con interrogantes. Además, se propone observar la influencia sobre el número de citas recibidas por cada trabajo. Transcribo algunas frases de sus conclusiones:

…it is clear that multiple authorship leaves a footprint on the style at least of the title, and thus also perhaps the style of the paper itself.”

En relación con la influencia de las variables analizadas sobre el impacto, observada en diferentes áeas temáticas (UoAs o paneles) se afirma:

The positive impact of the number of authors on title length is evident in most UoAs across all panels. The negative impact of using colons and question marks is less consistent.

Pero a lo que vamos: más del 55 por ciento de los títulos de los trabajos de autor único  son compuestos (con dos puntos) y más del diez por ciento contienen un interrogante. Los porcentajes son inferiores en otros tramos del número de autores pero, en el de los 7633 trabajos que tienen 49 o más autores, los títulos compuestos son más del 40 por cien y casi el ocho por cien contienen signos de interrogación.

El trabajo es mucho más rico en contenido y riguroso en su planteamiento de lo que lo he pintado, pero me conformo con haberos animado a su lectura atenta.

 

 

 

Should You “Revise and Resubmit”? — El retraso editorial en versión The Scholarly Kitchen

With everyone in a rush to get work published quickly, authors are sometimes torn on what to do when major revisions are requested. The post examines the pros and cons of seeing the process through, or cutting bait mid way.

via Should You “Revise and Resubmit”? — The Scholarly Kitchen

Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas (II)

[Esta es la segunda entrega de una serie de cuatro, que se inició con ésta.]

Para seguir con nuestro ejemplo en concreto: todo lo que necesitamos para obtener los registros del Web of Science equivalentes a los que ya habíamos identificado en PubMed es descargar la lista de PMIDs y emplearla como perfil de búsqueda.  La Figura siguiente detalla cómo se activa ese formato de descarga:

adreno-pmid

Descarga de una simple lista de identificadores de PubMed a un fichero

y, como se puede ver en el pequeño recuadro adyacente, lo que se obtiene es una lista que se puede incorporar a un procesador de textos y convertir en un perfil de búsqueda apto para consultar en web of science. Basta con sustituir cada retorno de carro por la expresión “ OR “.

adreno-pmid-2

Tras las consulta y las descargas en PubMed/MEDLINE disponemos de dos ficheros. El primero contiene todos los registros completos de los trabajos sobre adrenoleucodistrofia y el segundo sus identificadores en PubMed. Cuando este segundo fichero se ha empleado para construir el perfil en WoS, se puede desechar, pero yo nunca lo hago.
El formato, los elementos de cada registro que se descarga y  la forma en que están etiquetados, son de extrema importancia y se han de elegir cuidadosamente en este fase. Como veremos a continuación, los sistemas que ayudan a trazar las redes de citas obligan a que las descargas tengan un formato determinado.

 

Descarga desde índices de citas

Los dos índices principales de citas son Web of Science and Scopus. Ambos permiten la conexión con PubMed utilizando el PMID y con muchos otros sistemas empleando el DOI. Yo prefiero emplear el Web of Science porque sus descargas se pueden tratar con HistCite tanto como con CiteNetExplorer y otras aplicaciones y, por otra parte, dispongo de rutinas para procesar los registros en ese formato. Pero no se trata sólo de un capricho, Tethene, una gran aplicación en python para el análisis de redes de citas, también toma los datos del WoS. Lo mismo sucede con CiteSpace  o con las BiblioTools  de Sebastian Grauwin y muchas otras aplicaciones.
HistCite requiere la descarga de registros en el formato que se muestra en la segunda de las figuras que he incluido en esta nota. Se obtiene aplicando a las páginas de resultados en WoS la siguiente secuencia:

Save to other file formats
Number of Records: 1-500
Record Content: Full Record and Cited References
File Format: Plain Text

El resultado es uno o varios archivos de texto plano con la extensión “.txt”. Cuando los resultados son muy numerosos, las descargas se realizan en varios lotes de un máximo de 500 documentos. Por fortuna, tanto HistCite como CiteNetExplorer los acumulan hasta importar todos los registros resultantes de cada búsqueda. Veremos a continuación cómo los tratan.

Uso de HistCite (y dos observaciones importantes)

Soy un gran partidario de HistCite, pero su uso presenta varios problemas. Uno de ellos es que sólo funciona con sistemas Windows y con Internet Explorer (IE). Otro es que a partir de la versión 8 de IE el comportamiento de la aplicación es algo errático y requiere de ajustes adicionales. A pesar de que es una aplicación que ya no se desarrolla, HistCite tiene una gran funcionalidad, descrita en el correspondiente Manual y abreviada en las páginas de Eugene Garfield. Como todo lo que pretendemos de HistCite es que “empaquete” nuestro archivo de red, lo mejor es importar los registros, trazar la red y a continuación exportarla como archivo de Pajek. Los pasos son:

Carga (importación) de los registros
En el menú principal de la aplicación, añadir el fichero del primer lote:
File > Add File > navegar hasta encontrarlo y > Open
Repetir la operación con los restantes lotes.

Tras cada carga, se actualiza un contador de registros, lo que permite controlar que se importan todos sin novedad.
HistCite realiza una serie de análisis y cálculos con los datos. De las variables que genera, sólo nos interesa aquí lo que llama Global y Local Citation Score (GCS y LCS respectivamente). Estas puntuaciones reflejan el número de citas recibidas por cada trabajo en toda la colección de la Web of Science— la base de datos origen, de ahí lo de global— y en el contexto de los trabajos que hemos seleccionado e incluido en nuestro análisis. Más adelante me refiero al resto de datos y cálculos. Por el momento, baste decir que cada trabajo se representa en la red por un circulo cuyo diámetro es proporcional al LCS o al GCS.

[Este es el final de la segunda parte de la serie sobre Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas]

 

 

 

 

Ahora que se intenta crear listas autorizadas de todo… A Taxonomy of University Presses Today

University presses bring a diversity not only of costs, scale, and business models, but also of organizational capacity, incentives, and objectives. As efforts are mounted to transition monograph publishing to open access, it is vital that we recognize the richness and complexity of this community.

via A Taxonomy of University Presses Today — The Scholarly Kitchen

Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas (I)

Esta es la primera de una serie de cuatro entregas sobre los procedimientos para obtener redes de citas entre trabajos científicos que sean adecuadas para su visualización y análisis. Las siguientes entradas las ofreceré con frecuencia irregular, pero irán llegando.

De hecho, ya he publicado la segunda entrega.

Los documentos científicos hacen mención expresa del uso de las ideas, los métodos, los resultados y otros elementos que toman de trabajos anteriores. Estas menciones se traducen en listas de referencias bibliográficas que enumeran esos trabajos. Las referencias permiten establecer tres tipos de relaciones de cita entre los trabajos fuente (que hacen la referencia) y los trabajos citados.

ebola

El componente gigante de la red de cita directa entre trabajos de investigación del virus Ebola desde 1977. Las comunidades se han coloreado y el tamaño de los vértices el proporcional al grado de entrada (Gephi con Force Atlas 2)

La relación de cita directa se establece entre un trabajo fuente y todos aquellos que menciona y aparecen en su bibliografía.
El enlace bibliográfico relaciona aquellos trabajos fuente con alguna referencia bibliográfica común.
La co-citación se establece entre aquellos trabajos citados que aparecen conjuntamente en las referencias de otros posteriores.
El siguiente esquema ayuda a comprender estos conceptos.

citationnetworks

Las principales relaciones de citas en un esquema original del proyecto Tethne

Las relaciones de citas se pueden representar mediante diagramas o redes de citas. El análisis de estas redes permite averiguar cuál es el significado de las relaciones en un contexto determinado y, eventualmente, avanzar en la descripción e incluso la valoración de los procesos descubiertos.
Los datos bibliográficos necesarios para trazar redes de citas se obtienen mediante tres operaciones básicas:

La definición del conjunto de registros
La identificación de sus relaciones y
La obtención de la red

Además, en una segunda fase se procede a

La visualización de la red y
El análisis numérico de la red y sus componentes.

A continuación introduzco esas operaciones y, después, ofrezco el estudio de un caso para detallar el procedimiento completo.

Obtención de los datos (las operaciones básicas).

El primer paso es definir la disciplina, área o línea de investigación que interesa y luego identificar los conjuntos de documentos que la conforman. En casi todos los casos,  la definición inicial pasa por enumerar un conjunto mayor o menor de términos y construir con ellos perfiles de búsqueda en uno u otro sistema.
Tras obtener, en una o varias rondas, el conjunto de documentos deseados, es necesario obtener también las listas de referencias bibliográficas de cada uno. Si se ha recurrido a un sistema bibliográfico que las incorpora, estupendo. Si se ha recurrido a otro sistema, será necesario conectar de algún modo cada registro obtenido con  su versión en un sistema que incorpore sus referencias. Esta operación concluye con el almacenamiento de los registros en tablas SQL o en otro tipo de soporte estructurado.
La tercera operación consiste en trazar la red de citas entre los documentos recuperados. Y aquí se ofrecen dos opciones. La opción más complicada es elaborar la red por nosotros mismos, partiendo de los registros que hemos descargado en tablas SQL o similar. La opción más cómoda es emplear algún programa que por sí mismo trace la red. Más adelante me referiré a tres o cuatro.

La visualización y el análisis (las operaciones adicionales)

Tras la obtención de los datos, es necesario proceder al examen de la red obtenida y a su análisis cuantitativo, en busca de rasgos que nos permitan caracterizarla.
El punto de partida es un simple archivo de texto que contiene una relación de los nodos (o vértices) de la red, con su identificación y su nombre o etiqueta y una lista de las conexiones (o aristas) entre esos nodos, eventualmente acompañada de valores que indican la intensidad de cada conexión. Este formato recibe el nombre de “formato Pajek” y la extensión “.net”. Es el formato más habitual del archivo resultante de los programas o las aplicaciones que más adelante mencionaré. Si, por el contrario, el archivo es resultante del procesamiento de registros en SQL, la extensión se la adjudicamos nosotros y santas pascuas.
Prácticamente todos los programas de visualización de redes admiten el formato Pajek en la entrada de datos. Y lo mismo sucede entre los formatos de salida.
Con ser importante y muy gratificante la obtención de una buena representación gráfica de nuestra red, sólo es eso: una representación más o menos atractiva. La manipulación de algunos de sus componentes puede arrojar algunas luces sobre su composición y el por qué de su topología, pero para el análisis numérico bien vale recurrir a otro tipo de aplicaciones. Veremos una de ellas a continuación, cuando desentrañemos el caso práctico que he seleccionado.

El tema: la adrenoleucodistrofia

La definición

Mediado 1910, dos médicos  vieneses describieron una esclerosis difusa de la medula espinal en un niño de seis años. Tres años más tarde se comunicó el hallazgo en su cerebro de lo que se definió como “encefalitis periaxial difusa” y, en 1923 E. Siemerling y Hans Gerhard Creutfledt (sí, el mismo de la “enfermedad de las vacas locas”) asociaron a la sintomatología nerviosa la afectación de la médula suprarrenal. Estos datos sólo me sirven para expresar que el tema tiene cierto recorrido histórico además de tratarse, evidentemente, de un tema médico.
Al haber elegido una enfermedad, es lógico recurrir al principal sistema de bibliografía médica, a PubMed.
La ventaja de PubMed, además de su gratuidad, es que es un recurso completo, y puede proporcionarnos información adicional muy útil sobre los temas que manejamos antes de abordar una búsqueda bibliográfica pura y dura. Yo he consultado un par de sus recursos asociados: los encabezamientos de materias médicas (MeSH) y el compendio de descripciones de genes y genotipos OMIM. Sin entrar en excesivos detalles, esto me ha permitido enriquecer mi perfil de búsqueda y asociar los siguientes términos:

Adrenoleukodystrophy (el término principal)
Adrénomyéloneuropathy (el término para la afectación en adultos) y
ABCD1 (el código del gen afectado)

El resultado de la combinación (la suma lógica) de los tres términos es un conjunto de 2168 registros correspondientes a otros tantos artículos de investigación sobre la enfermedad.

La combinación de sistemas

Los sistemas bibliográficos difieren no sólo en su orientación temática; también en el tipo de documentos que incluyen y la forma en que representan su contenido. PubMed aprovecha una larga tradición y una gran experiencia para describir temáticamente el contenido de los trabajos. En la figura siguiente,  la flecha señala una serie de términos etiquetados como MH, encabezamientos médicos que expresan la temática de ese artículo en cuestión. Resulta de grandísima utilidad contar con ellos pero, tal y como advertíamos en los párrafos introductores, es necesario también obtener las referencias bibliográficas, que conectarán cada artículo mediante la relación de citas y referencias.

medline

Un registro de MEDLINE en el formato así llamado donde aparecen los descriptores temáticos asignados al trabajo y el código PMID inicial.

Dos sistemas bibliográficos proporcionan las referencias de casi todos sus registros: Web of Science y Scopus. Ninguno de ellos es gratuito, pero resultan accesibles en muchos países a través de contratos nacionales o institucionales. Es posible identificar un registro procedente de PubMed en estos dos sistemas porque los dos incluyen el código único que identifica cada registro de PubMed. Este código numérico se puede identificar en la primera línea de cada registro (vedlo en el de la figura precedente) con la etiqueta PMID.  La figura siguiente muestra la versión del Web of Science del mismo registro y, justo antes de la etiqueta del final de registro (ER) he señalado con una flecha el código, que aquí se etiqueta con la expresión ‘PM’.

wos

El mismo registro en la Web of Science con el código de identificación de PubMed

Este es el fin de la primera parte de la obtención de datos bibliométricos para el trazado de redes de citas.