Autoría científica: ¿ baile de vampiros o merienda de negros ?

Hace tiempo que no me topaba con John Walsh. Junto a su pupila Li Tang, este profesor del Georgia Institute of Technology propuso en 2010 un método para resolver la homonimia de los autores de trabajos de investigación mediante el análisis de sus listas de referencias bibliográficas. Recuerdo haber criticado el método sin ninguna base sólida, pero con la sospecha de que los cambios en las líneas de investigación se podrían traducir en cambios en la base de conocimiento de los autores y, en consecuencia, en su perfil de referencias. Hace tiempo que las limitaciones de la capacidad de cálculo en los ordenadores a mi alcance me hicieron renunciar a comprobar empíricamente mis objeciones.

OBaileDosVampiros-02

Dance of the Vampires (Roman Polansky, 1967)

Ahora vuelvo a coincidir con Walsh porque, mientras he concluido estos días un primer trabajo sobre autoría y me dispongo a analizar los resultados de otro sobre parecido tema, me he topado con que, junto a su colaboradora Sahra Jabbehdari, ha publicado un artículo sobre el mismo tema. Y me parece muy, muy bueno.
En “Authorship Norms and Project Structures in Science” Walsh y Jabbehdari examinan la correspondencia entre la contribución de cada investigador en el desarrollo de un proyecto científico y su aparición en (o exclusión de)  las listas de autores de las publicaciones resultantes siguiendo las normas convencionales de autoría. Su objetivo principal es:

…to develop an understanding of some of the drivers of authorship lists (and how those vary systematically by field and by project characteristics net of field) in order to address concerns in the sociology of science and in science policy about the meaning of authorship lists for the evaluation and carees in science.

La introducción del cualquier artículo científico exige un balance entre las definiciones, los razonamientos retóricos y la bibliografía. Las definiciones responden a la pregunta ¿ Qué se investiga ? Los razonamientos responden a la cuestión ¿ Por qué se investiga ? y las referencias bibliografías tratan de responder a la pregunta ¿ Para quién es relevante la investigación de ese tema concreto ? La retórica de una buena introducción requiere de un balance exquisito entre las tres respuestas. En el trabajo de Walsh, sin embargo, el equilibro se rompe en favor de una revisión bibliográfica que a mí me parece excesiva. Las tres ideas básicas de esta sección son: 1) existen criterios para “elevar” a un colaborador al rango de autor; 2) esos criterios no siempre se respetan, y 3) la aplicación de los criterios depende de la cultura de cada grupo o especialidad científicos.
La tercera sección de la introducción discute si las expectativas de un alto impacto del trabajo, los visos de su aplicación comercial y el grado de colaboración institucional que ha exigido su realización pueden predecir la inclusión de más o menos autores en los artículos.
Tras seleccionar una muestra de trabajos de investigación, Walsh y Jabbehdari someten a sus autores correspondientes a una encuesta para que determinen el papel que los firmantes de los trabajos han desempeñado. Los resultados del trabajo son espléndidos, muy robustos, pero sus conclusiones no albergan muchas sorpresas. Ya sabíamos que

authorship lists are the result of a complicated process involving negotiations, field norms, and differences in visibility and that these vary across projects in systematic ways

Y también que

authorship practices may be changing in the age of bureaucratic science. Hence, there is a need for authorship policies and norms that are fitted to this new bureaucratic science structure

La  terminología de Jabbehdari y Walsh me resulta ambigua. Llamar especialistas a aquellos autores que realizan aportaciones puntuales al trabajo no tiene nada de particular, pero hacer equivalentes estos specialist authors a los “guest” authors, autores honoríficos, no me cuadra. Del mismo modo, también me choca que se denominen “nonauthor collaborators” a los autores denominados fantasma (ghost) o negros. Pero recomiendo encarecidamente la lectura del trabajo y agradezco muchísimo que hayan ampliado el estudio de la autoría de trabajos científicos e introducido la forma de identificar o investigar esas dos figuras.
No soy ingenuo: las continuas revelaciones de falta de ética, plagio, reinados de taifa y otras perversiones me hacen suponer que no cesará la picaresca de los investigadores. Pero no conozco actividad humana que no tenga aprovechados, precarios, chupasangres, negros y fantasmas. Trabajos como el de Jabbehdari y Walsh, sin embargo, pueden contribuir a mejorar las directrices y los criterios de una honesta autoría.

Autoría múltiple y complejidad de las investigaciones

Por razones que se me escapan, una alerta bibliográfica de esta misma semana me ha hecho llegar un trabajo publicado a mediados (y paginado a finales) de  2015. Confieso que he tardado en caer en la cuenta, es lo que tiene la fórmula falta de vacaciones + principios de Septiembre.

DSCN2005

Una recreación de la biblioteca en el gabinete de Lope de Vega

El caso es que el trabajo es muy interesante y, por segunda vez, trata de relacionar las complejidades del proceso de investigación con el número de personas que en ella intervienen y, finalmente, figuran como contribuidores y firmantes del artículo resultante. Su título es Authorship Inflation in Medical Publications y apareció en la revista Inquiry, que se autodefine como “The Journal of Health Care Organization, Provision and Financing. Los autores, que trabajan en la Harvard Medical School y los National Institutes of Health, tratan de decidir entre una alternativa simple:

It is unknown, however, whether authorship has grown over time due to growing complexity of published academic articles, in which case growth could be warranted, or whether it has grown due to pressures of funding and academic promotion, which have created “authorship inflation”

Para hallar una respuesta se centran en las tres principales revistas clínicas del mundo: British Medical Journal, JAMA y New England Journal of Medicine. Sólo por impresionar, la primera tiene un factor de impacto de 19,7; la segunda anda por 37 y pico y la última casi llega a 60.
Después seleccionan 50 originales publicados por cada una en los años de inicio de cada década entre 1960 y 2010. A continuación calculan el número de autores de cada trabajo, clasifican los originales según su metodología, desde estudios observacionales a ensayos clínicos multicéntricos y emplean el número de casos como un indicador de la complejidad mayor o menor del estudio.
Con anterioridad (en Junio de 2008) un grupo de epidemiólogos encabezados por el gran John Ioannidis abordó el mismo problema con una metodología similar, introduciendo en su estudio muchas más variables de tipo “cultural” como el país de procedencia de los trabajos o el factor de impacto de las revistas y siendo menos rigurosos al definir la tipología de los estudios. Pero ambos trabajos llegan a parecidas conclusiones; en el caso del más antiguo, esto concluye Ioannidis:

Overall, authorship may be shaped by the interplay of ‘‘publish or perish’’ pressures, collaborative needs, the visibility of research, and cultural norms (…) Even though we fully acknowledge the possibility of residual unexplained confounding, our analysis suggests that the increased number of authors over time has not been just an issue of increasing complexity of research.

Por lo que respecta al trabajo de 2015… pues igualico, igualico:

In summary, the average number of authors per publication in leading medical journals has grown dramatically in the last five decades. Increasing effort required to analyze and publish research is unlikely to be an adequate explanation. Instead, authorship “inflation” due to increasing academic pressure to publish, combined with a relative paucity of incentives to authors to reduce multiple-authorship, appears more consistent with the observed data.

La distribución por especialidades del número de firmantes en los trabajos españoles de investigación médica reveló que era mayor en Cardiología que en otras áreas y pude plantear un trabajo, que  nunca realicé, sobre la relación con la complejidad de las investigaciones. Mi idea, que quizá retome algún día, es expresar la complejidad mediante dos indicadores: una complejidad “instrumental” atendiendo a las técnicas analíticas o terapéuticas desplegadas y una complejidad “cognitiva” que parte de la diversidad de conceptos puestos en juego en la investigación.
De momento, permitidme que me calle las pistas sobre los indicadores, los proxies y las fuentes que se utilizarían.

Resúmenes de trabajos de investigación: ¿ Cómo se confeccionan y de dónde proceden sus frases ?

Debo al Journal of Documentation una parte de lo que sé. Y no es una parte pequeña. Reconozco esa deuda sobre todo en la breve nota en que Alan Pritchard acuño el término “Bibliometrics” para referirse al análisis de los procesos de comunicación científica a través del estudio cuantitativo de los trabajos de investigación. Llegué a aquel trabajo del último trimestre de 1969 mucho después de que se publicase. En cambio, leí y casi memoricé la revisión de Stephen Robertson sobre las teorías y modelos en recuperación de información muy poco después de su publicación, en Febrero de 1977. He olvidado la recuperación de información y he avanzado mucho (espero) en bibliometría, pero persiste en mí la influencia de esos dos maestros, de sus trabajos y de la revista que los publicó.

 

Cámaras

Cámaras convencionales en Los Encantes. Ninguna relación con los resúmenes y su confección.

El número más reciente del Journal of Documentation contiene un buen trabajo que, además, es muy relevante para la escritura y la comunicación científicas que son objeto (no siempre) de este mismo blog, al menos de su “cara B”. La primera firmante es Iana Atanassova, una investigadora búlgara con formación básica en Matemáticas y muy amplia formación complementaria en lingüística computacional y recuperación de información. Tras su paso por las universidades de Sofia y París (Sorbonne) aparece ahora afiliada con la Universidad del Franco-Condado en Besançon. Desde allí ha colaborado con dos investigadores de Montreal. Uno de ellos, Vicent Lariviére, es otro caso de hiperactividad aplicada a la bibliometría; para que os hagáis una idea, en lo que llevamos de año ya ha publicado seis trabajos de investigación. El autor restante, Marc Bertin, es el autor “entrepanes”, el del medio, una de las posiciones más odiadas. Hasta ahora ha hecho pocas cosas, pero muy interesantes. Veamos esta última.
El trabajo de Atanassova, Bertin y Lariviére se titula “On the composition of Scientific Abstracts” y se propone:

“… to measure the similarity between sentences that appear in abstracts and sentences that are found in the body of articles. Locating the zones in a paper that are used as sources for constructing the abstract, either by direct re-use of their sentences or by reformulations, will give us a better understanding on the parts of an article that are considered as most important by the authors and that, according to them, cover the key elements of the text”

De este objetivo general se desprenden dos preguntas de investigación. La primera es simple: ¿ Qué proporción del resumen surge de la copia literal o aproximada de frases del texto del trabajo íntegro ?. Esta primera pregunta se relaciona con la cuestión de hasta qué punto un resumen refleja adecuadamente el contenido del artículo que condensa. La segunda pregunta tiene, por así decir, trampa: Teniendo en cuenta la estructura retórica de los trabajos de investigación ¿ En qué parte del texto se sitúan las frases que constituyen el resumen ?. La trampa de esta pregunta se refiere a la posibilidad de aplicar los resultados del estudio al diseño de procedimientos automáticos de condensación. ¡ Ahí es nada !.
A la hora de la verdad, los autores emplean un conjunto de datos al que ya han recurrido más de una vez, compuesto de más de 85.000 artículos publicados en las distintas cabeceras de PLoS. Tras algunas comprobaciones y precisiones, desglosan los textos y los resúmenes en frases y aplican tres medidas de similitud al conjunto.

Los resultados muestran que un 16 por ciento de los resúmenes cuentan con frases totalmente originales y que el restante 84 % están confeccionados con al menos una frase procedente del cuerpo del artículo correspondiente. Casi en la cuarta parte de los trabajos analizados se detecta una reutilización de frases del texto en los resúmenes con niveles de similitud superiores a 0.6. Por otra parte, por término medio los resúmenes de los trabajos se han confeccionado con frases procedentes en un cuatro por ciento de las introducciones y en casi un ocho por ciento con frases de la discusión (la lectura de la gráfica correspondiente no es sencilla).
Recomiendo encarecidamente la lectura de este trabajo. Sus resultados son de la mayor relevancia para la escritura científica y su aprendizaje.

Mi interés por el Journal of Documentation es mantenido. Sin embargo, algo está causando que decaiga mi atención sobre dos revistas españolas que hasta la fecha he seguido con interés: los últimos sumarios de la Revista Española de Documentación Científica parecen indicar una ampliación de su cobertura, que cada vez se refiere menos a documentos y procesos de comunicación científica. Otro tanto sucede con El Profesional de la Información (EPI) cuya deriva hacia los estudios de Comunicación es patente. El último número se centra en “Metamedios y Audiencias” (¿?) .

Se diría que las dos rvistas están perdiendo algo de su identidad y, en esta sociedad donde las pérdidas llaman unas a otras, esa se puede traducir en una pérdida de interés de los lectores de ambas cabeceras. Sería otra noticia muy mala.

Títulos, impacto, resúmenes y James

Hacía tiempo que no aparecían contemporáneamente trabajos originales interesantes sobre escritura científica. Quiero reseñar aquí algunos publicados (con la excepción de uno) recientemente. Versan sobre la relación entre el impacto y el formato de los títulos y sobre un tipo especial de resúmenes. Al final comentaré el último trabajo de James Hartley, a quien tanto debo.

Sobre los títulos

El último número de Scientometrics (Junio de 2016) contiene el trabajo “What makes a ‘good’ title and (how) does it matter for citations? A review and general model of article title attributes in management science” de Lakshmi Balachandran Nair y Michael Gibbert, los dos profesores de Comunicación en Suiza, por extraño que parezca. Su objetivo es determinar cuáles son las características de un “buen título” y cómo afectan a su futuro impacto. Distinguen hasta cinco tipos diferentes de atributos en los títulos de trabajos de investigación sobre Gestión: longitud, uso de caracteres no alfabéticos, estructura en una o varias frases, contenido de información contextual y atributos lingüísticos (como el uso de acrónimos). Y aquí viene el “spoiler”: ni la longitud, ni el contexto ni los atributos lingüísticos tienen influencia sobre la posterior frecuencia de citas de cada trabajo.
El segundo número de 2015 de la Revista de Lenguas para Fines Específicos aún no ha llegado a Dialnet y es una pena porque es una buena publicación con trabajos interesantes. El que firman Johanna Entralgo y Françoise Salager-Meyer, de la Universidad venezolana de Los Andes, en colaboración con Marianela Luzardo, de mi querida Universidad Pontificia Bolivariana de Medellín (¡ saludos Lina !) es un buen ejemplo. Se titula “¿Cuán gramaticalmente complejos son los títulos de los artículos científicos en las ciencias naturales?” y se centra en el vocabulario que se utiliza en los títulos de trabajos (anglosajones) de Biología y Ciencias Físicas. Su objetivo es obtener orientación sobre los materiales pedagógicos a emplear en los estudios de postgrado y creo que estas autoras están muy bien encaminadas.

Sobre los resúmenes

Muchas de las veces que presto atención a lo que se publica sobre resúmenes me encuentro con el mismo oxímoron. Al igual que es contradictorio hablar de resúmenes “ampliados” cuando nos referimos a resúmenes para congresos, el trabajo “Amplifying scientific paper’s abstract by leveraging data-weighted reconstruction” se propone

… to generate amplified scientific paper’s abstract, which can illustrate the most influential aspects of paper. We achieve this goal through data-weighted reconstruction approach which consists of weight learning and salient sentence selection. Citation sentences’ semantic information and social struc- ture are taken into consideration in the process of sentences’ weight learning”.

¿ Ampliar o extender lo que resulta de una condensación y contracción ? Pues vale.
Francamente, veo lo que Shansong Yang y sus colegas de la china Zhejiang University hacen y, sofisticaciones matemáticas aparte, no encuentro mucha diferencia con el fundamento de las KeyWord Plus incorporadas al Science Citation Index desde hace medio siglo. Entonces se trataba de aprovechar los textos de los trabajos citados para proporcionar nuevos elementos de acceso y recuperación temática. En la idea de ahora se aprovecha el contexto que rodea la mención de cada referencia en el texto y eso también recuerda poderosamente uno de los puntos de partida de Google.
Por su parte, Ruth Breeze, que ahora trabaja en el Instituto Cultura y Sociedad, dependiente de la Universidad de Navarra, ha publicado un análisis precioso sobre lo que ella llama “author summary”. Lo define como un nuevo genero y se propone, primero evidenciar en qué se diferencia de los resúmenes convencionales y, además, valorar si esos resúmenes efectivamente contribuyen a que los estudiantes comprendan el contenido de los trabajos.
El trabajo se titula “Tracing the development of an emergent part-genre: The author summary” y en él Ruth toma su material empírico de algunas revistas del sistema PLoS donde, en efecto, se publican bajo el nombre de “author summary” lo que en otros casos se llama “lay summaries” y se aproxima mucho a las “significance statements” de publicaciones como PNAS o al batiburrillo de contenidos de la página de resúmenes de cada artículo de Science. La idea es elaborar un brave texto comprensible para el no especialista y hasta cierto punto justificativo. De todos los trabajos que comento aquí, éste sin duda es el más relevante y recomendable para los interesados en la comunicación y la escritura científicas.

…Y James

Hace poco recibí un avance de un trabajo de James Hartley que muy poco después ha aparecido en Scientometrics. Con su humor habitual, este viejo profesor (emérito en la Facultad de Psicología de la coqueta Keele University, en Staffordshire) discute la validez de uno de los índices de legibilidad de textos en inglés, el de Flesch. Es admirable como, en sólo tres páginas, James proclama y demuestra la poca fiabilidad y la inconveniencia de un método que ya ha cumplido los 70 años.
James Hartley ha publicado un trabajo por trimestre los dos últimos años. Leedlos todos porque se centran en la escritura científica y porque no tienen desperdicio.

Extended abstracts: ni resúmenes ni ampliados

An extended abstract is a research paper whose ideas and significance can be understood in less than an hour. Writing an extended abstract can be more demanding than writing a research paper… An ideal submission should have a reviewer intrigued within the first 5 minutes of reading, excited within 15 minutes and satisfied within 45 minutes
(Pugh, 1993; énfasis original)

Siempre me ha llamado la atención el termino “extended abstract”, igual de equívoco que “resumen ampliado”, su traducción más habitual. Hay en él algo de oxímoron porque la característica esencial del resumen, la brevedad, contradice la exigencia o la intención de ampliar o alargar.

Posters

Una sesión de posters en un congreso internacional. Empleo esta imagen con mucha frecuencia en mis clases, pero no consigo recordar dónde la obtuve y a qué congreso corresponde. So sorry.

 

¿ De donde proviene ese término y, lo que importa más, qué sentido tiene ?

Hasta donde yo sé, el término lo utilizó por primera vez un estadístico que se llamaba Shayle Robert Searle (Cornell University) en 1973. Partiendo de un repaso a las características negativas de la comunicación científica en la época, propuso un cambio: las revistas científicas sólo debían publicar dos tipos de trabajos, los “extended abstracts of research papers” y los “full-length review style papers”. A los resúmenes les adjudicaba una extensión de dos, tres o cuatro páginas y el artículo completo correspondiente a cada uno de esos resúmenes sería accesible, por una modesta tarifa, en un repositorio dependiente de cada revista o grupo de revistas.
Hasta aquí, todo va bien: un resumen representa el contenido de un artículo completo y el esquema propuesto por Searle cumple esa condición. Sin embargo, lo de “ampliado” resulta menos claro.
Quizá podamos ahondar en el concepto y el significado de los extended abstracts si los situamos  en su contexto más actual. Cualquiera que busque información empleando el término “extended abstract” está condenado a la desesperación más profunda: obtendrá
miles de resultados. Veamos un ejemplo. Esta es la distribución por áreas temáticas de los 11568 documentos que se obtienen en Scopus en respuesta a esa consulta:

Resumenes

Según parece, este género era y sigue siendo muy común en ámbitos de Ingeniería y Computación. Por otra parte, de esos 11568, resulta que 9943 (cerca del 90 por ciento) corresponden a comunicaciones en congresos. De hecho, dos de los trabajos que he utilizado como fuentes están relacionados con SIGPLAN (Special Interest Group on Programming LANguages de la Association for Computing Machinery). Veamos entonces cuál es la dinámica de la comunicación en congresos y su eventual relación con este tipo de resúmenes.

¿ Cuál es la mecánica habitual de la comunicación en un congreso científico ?

Primero, la organización del congreso, que usualmente depende de una sociedad científica o profesional, publica la convocatoria general mediante insertos en revistas especializadas y, en su caso, a través de mensajes de correo electrónico o avisos en foros. Esta convocatoria contiene fechas, lugares de celebración y, lo que más importa, el objetivo del congreso (su lema o tema principal) y las áreas de interés. Segundo, más pronto que tarde también se solicitan comunicaciones (que, curiosamente, se suele denominar call for abstracts) con detalles sobre el tipo de comunicaciones y sus formatos. Este es un ejemplo de la convocatoria del próximo congreso de la American Society of Information Science and Technology.

La participación en un congreso admite cuatro modalidades: (1) ponencia, (2) comunicación oral, (3) poster y (4) turismo. Dejemos de lado la última y veamos.
Es habitual que la organización de un congreso designe a una persona como ponente teniendo en cuenta su autoridad en el tema en cuestión. Por tanto, la participación como ponente se produce por invitación y el contenido de esa intervención no se somete al juicio de expertos. Para que os hagáis una idea, el “keynote speaker” del próximo Digital Production Symposium (Anaheim, CA) es nada menos que Jason Smith, el director de efectos visuales de la empresa Industrial Light and Magic.
Las comunicaciones orales y la presentación de posters que se van recibiendo sí se someten al escrutinio del comité científico de cada congreso o reunión, que juzga su validez y relevancia. Ved si no las “tribulaciones” que Mark Wegman relata a propósito de coordinar el comité científico del simposium Principles of Programming Languages (POPL)
Precisamente, el objetivo inicial del resumen ampliado, que propongo que llamemos a partir de ahora resumen para congreso (conference abstract) es permitir al comité científico del congreso decidir si tu trabajo merece ser comunicado en el congreso y en qué formato. Con esto último quiero decir que muchos congresos no ofrecen inicialmente la posibilidad de elegir entre presentar un poster o una comunicación oral. Es el propio comité quien decide, a la vista del interés de la  comunicación, que se exponga oralmente o quede relegada a una presentación como poster.

En cualquier caso, algo debe de quedar claro: un resumen ampliado no surge de la ampliación de un resumen sino de la condensación de un artículo. Más vale entonces, insisto, que a partir de ahora nos refiramos a estos resúmenes como “resúmenes para congresos”, en lugar de resúmenes ampliados o extendidos. A continuación expongo algunos criterios, trucos y técnicas que sirven para la elaboración de este tipo de publicaciones.

Resúmenes para congresos, cartas al editor y originales breves

Para empezar, un resumen para congreso tiene la misma estructura que un artículo científico o técnico convencional y, desde un punto de vista cuantitativo, un número de caracteres similar al de una carta al director o a un poster. Es verdad que en algunos casos las cosas se llevan al extremo. Por ejemplo, en PNAS, una de mis revistas favoritas, sólo se admiten cartas que comenten los originales ya publicados y se aconseja:

“Letters are limited to 500 words and five references, and must be submitted within 3 months of the online publication date of the subject article”.

De más ayuda resultan las instrucciones sobre las cartas dirigidas a la revista Nature:

“They do not normally exceed 4 pages of Nature, and have no more than 30 references. They begin with a fully referenced paragraph, ideally of about 200 words, but certainly no more than 300 words, aimed at readers in other disciplines. This paragraph starts with a 2-3 sentence basic introduction to the field; followed by a one-sentence statement of the main conclusions starting ‘Here we show’ or equivalent phrase; and finally, 2-3 sentences putting the main findings into general context so it is clear how the results described in the paper have moved the field forwards.”

Me descubro ante lasinstrucciones sobre la redacción de ese párrafo introductorio que la misma revista proporciona pero, sobre todo, las aprovecho para discutir su utilidad. Antes de eso, dejemos acabar las instrucciones de esta revista

“The rest of the text is typically about 1,500 words long. Any discussion at the end of the text should be as succinct as possible, not repeating previous summary/introduction material, to briefly convey the general relevance of the work.
Letters typically have 3 or 4 small display items (figures or tables).”

Una página A4 impresa con un cuerpo normal (digamos 12 puntos) contiene unas 500 palabras, así que las cuentas salen cuando pensamos que una típica carta publicada en Nature tiene de 2000 a 2500 caracteres. La verdad es que estas dimensiones son similares a las que se exigen a los informes (“reports”) publicados en Science.
He mencionado en el primer párrafo de esta sección los posters y con razón: pregunté a varios colegas sobre la extensión de los textos que formaban parte de los posters presentados a congresos recientes y las cifras variaban entre 1800 palabras y una media de 900, dependiendo de si el trabajo contenía más o menos parte gráfica si los autores eran más o menos “extrovertidos”.
Finalmente, he observado que en convocatorias más modernas se sustituye la expresión “extended abstract” por la de “short paper”, con una extensión que ronda las 3000 palabras y también se admiten comunicaciones sobre “research in progress” con extensión máxima de 1.500 palabras.

¿ Cómo se elabora un resumen para congreso ?

Yo estoy convencido de que para producir el texto de un resumen para congreso con coherencia ni hay que  “inflar” un resumen previo (práctica habitual en los charlatanes) ni “reducir” un trabajo original en curso (¡ ah ! el deporte favorito de los jíbaros). Tan sólo es necesario tener las ideas claras y desarrollarlas en una estructura coherente, como la del párrafo introductorio que Nature demanda.
A grandes rasgos, un resumen para congreso contiene una introducción; un cuerpo, que abarca la parte metodológica, los resultados y la discusión a veces sin solución de continuidad, y finalmente las conclusiones. Además, cuenta también con elementos adicionales como resumen, bibliografía, tablas y figuras.
Veamos cuáles son las características diferenciales de cada una de estas partes.

La introducción

Es habitual que la introducción de un texto de investigación contenga (1) una parte definitoria, describiendo el tema o asunto que se va a investigar (2) una parte narrativa que enumera y analiza los trabajos que se han publicado con anterioridad sobre ese mismo tema y (3) una formulación de hipótesis u objetivos donde los autores declaran sus intenciones. En el caso de los resúmenes para congresos la introducción es breve porque las referencias bibliográficas que soportan tanto la definición del asunto como su tratamiento previo se reducen al mínimo esencial. Además, he observado que en ciertos casos ni siquiera existe definición y esas frases se sustituyen por meras enumeraciones. Obsérvese el siguiente ejemplo:

“The recent proliferation of online social networking system such as Facebook, Dodgeball and MySpace, has provided researchers with platforms for carrying out research into online social behaviour.  Typically in the HCI domain such studies have looked at the effect of social incentives and contextual information on the use of public transportation [e.g. 1], the relationship between users’ online profiles and their online behaviour [e.g. 4], and the various trust issues that emerge from using such systems [e.g. 7].”

Donde no aparece por ninguna parte la definición de “red social” o de “comportamiento social” mientras se mencionan tres ejemplos. Por otra parte, sólo se hace referencia tres trabajos previos. En cambio, la formulación de objetivos resulta imprescindible (mucho más en las publicaciones se tipo técnico). En el caso anterior:

“In this paper we describe the development of the Cityware platform, which aims to bridge the gap between online and physical social networks.  It allows users to explore an amalgamation of their online and physical social networks.  The key strength of our platform is that it allows the collection of vast amounts of quantitative data, both from the online and real worlds, which is immediately linked, synchronised, and available for further analysis.  Here we describe the architecture of our platform, the types of data it makes available to users and researchers, the typical user-
oriented scenarios that are beginning to emerge, and our planned research-oriented scenarios.”

Este resumen para congreso se reeditó posteriormente como capítulo de libro. La introducción pasó entonces de las 290 palabras de aquí a 665.

La parte de los métodos

La parte metodológica es muy variable. He observado casos en que prácticamente no existe. En otros, el método ocupa la práctica totalidad de la publicación. De éstos, he encontrado casos realmente atractivos entre los resúmenes presentados a los Digital Production Symposium, popularmente conocidos por DigiPro (lo he mencionado antes) donde las principales compañías de animación y creación digital de efectos visuales presentan sus novedades.
Cualquier sección de métodos contiene habitualmente un relato estructurado de los procedimientos intelectuales, analíticos o de otro tipo, que han conducido a la obtención de los resultados. Se propone (1) identificar los materiales (o los sujetos) utilizados en la realización de la investigación y los criterios seguidos para seleccionarlos (2) describir los métodos o equipos y las condiciones en que se han utilizado y (3) las pruebas estadísticas realizadas para garantizar la validez de los resultados.
Un trabajo original se plantea una serie de objetivos intermedios, para cada uno de los cuales describo el uso de una técnica o un método determinado. En los resúmenes para congresos se aborda usualmente un único problema y, así, la exposición del método seguido se abrevia y no se produce la “cadena de procedimientos” típica de los trabajos extensos.
Por otra parte, tal y como sucede en la introducción que prescinde de definiciones, se debe pensar que la audiencia de un congreso es muy especializada y comparte con el autor de un trabajo muchos conocimientos generales en el área, así que no se detalla en exceso las condiciones de realización de las observaciones.

Los resultados y las conclusiones

Otro tanto sucede con los resultados pero, precisamente aquí, he de hacer una observación muy importante. Lo que distingue al resumen para congreso del resumen convencional es que no es un resumen.

Me explico: en primer lugar, un resumen para congreso no representa ni sustituye ni precede a la lectura de un trabajo original más extenso; en segundo lugar, tal y como hemos visto con los shorts papers y research in progress mencionados anteriormente, los resultados que estos documentos presentan bien pueden ser parciales y provisionales. Una muestra de hasta qué punto son preliminares los resultados presentados está en el ejemplo de Extended Virtual Presence of Therapists through Home Service Robots. Esto forma parte de la mecánica habitual de los encuentros científicos, donde los investigadores jóvenes acuden con frecuencia en busca de orientación, más allá de los rituales sociales típicos de “conocer y hacerse conocer” (olvidad por un momento el sentido bíblico) y también agradecen que investigadores senior confirmen la validez de sus propósitos, ya que no todavía de sus resultados definitivos y mucho menos de sus conclusiones.
Sobre resultados y conclusiones cabe decir algo parecido a lo que he afirmado sobre los métodos: hay que limitarse a algunos. Y a veces es conveniente no “enseñar las cartas” antes de tiempo y dejar los hallazgos más importantes para mejores y más altas empresas: para los artículos originales que vendrán.
Sobre la limitación en el número de referencias bibliográficas, de tablas y de figuras, por otra parte más que lógica en los resúmenes para congresos, no tengo gran cosa que añadir.
Los resúmenes para congresos representan con frecuencia el debú de un joven investigador en la comunicación científica. Este primer contacto debería producirse con discreción y contención. Ni las falsas expectativas, ni la autocomplacencia ni la confianza excesiva son buenos consejeros. Al fin y al cabo ¿ hay alguien que siempre triunfe en una primera cita ?.

Me he basado en estos trabajos:

Pugh, W. (1993). Advice to Authors of Extended Abstracts. Sigplan Notices, 26(6), 353-356.
Searle, S. R. (1973). On Publishing Extended Abstracts, and Reviews. The American Statistician, 27(4), 155-157.
Silyn-Roberts, H. (2012). Writing for Science and Engineering: Papers, Presentations and Reports. Second Edition. Amsterdam: Elsevier. Especialmente los capítulos 3 (An Abstract, a Summary, an Executive Summary) 14 (A Conference Poster) y 19 (A Seminar or Conference Presentation)
Wegman, M. N. (1986). What It’s Like to Be a POPL Referee; or How to Write an Extended Abstract So That It is More Likely to Be Accepted. SIGPLAN Not., 21(5), 91–95. Es posible que el enlace al texto completo no sea posible off campus. El registro en la biblioteca digital de la ACM está en: http://doi.org/10.1145/14947.14955.

Y que conste, este texto tiene 2593 palabras.

 

Vísteme despacio, que tengo prisa

Algunos temas me persiguen. Y no creo ser un caso único. Esto funciona como en la interpretación de películas o  de teatro y muchísimo más de series de televisión: a uno lo encasillan y ya no se libra de la etiqueta. Mi más reciente encasillamiento ha sido en torno al retraso de publicación. Se entiende la tardanza con que los artículos de investigación aparecen publicados en revistas científicas.

_MG_6088

Reactivos en un laboratorio del Instituto de Agroquímica y Tecnología de Alimentos (IATA) del CSIC. La foto la tomó Pedro Díaz en 2005.

Bien pensado, tengo pocos motivos de queja. El tema me ha reportado cierta visibilidad, recibo consultas sobre investigaciones de otros, colaboro con trabajos que tratan de arrojar nueva luz sobre ese proceso o problema y, a cada nueva incursión, aprovecho para refinar mi pensamiento (una forma pija de decir “devanarme los sesos”) sobre el cuánto y el porqué los artículos de investigación tardan tanto (algunos tan poco) en publicarse en revistas.
Allá por los negros días de noviembre, y tras la lectura de un trabajo de Ronald Vale, dediqué una entrada al retraso de publicación. Si ahora vuelvo sobre el tema es por dos razones: el trabajo de fin de grado que Silvia MQ dedica el retraso editorial en las revistas de investigación en Pediatría y la aparición, hace un par de semanas, de un nuevo reportaje sobre ese tema en Nature. Empecemos por éste último.

Waiting

La infografía (algo truculenta, de inspiración milenarista) que presenta el reportaje de Kendall Powell para Nature

Las tres páginas que Kendall Powell dedica a lo que titula “El Juego de la Espera” no tienen desperdicio. En su buen estilo periodístico, aporta casos muy interesantes y manifestaciones de tirios y troyanos principalmente sobre el retraso editorial. Además, descubre la existencia de un trabajo realmente valioso sobre el mismo. Los tirios son los investigadores que atraviesan un auténtico viacrucis, paso previo a un calvario, claro, que eventualmente conduce a la publicación efectiva de sus trabajos. El reportaje arranca con la experiencia de una investigadora canadiense que, tras casi dos años de envíos, revisiones, rechazos, nuevos envíos y más modificaciones, consiguió publicar un artículo sobre la relación entre el régimen de lluvias y la diversidad y distribución de los mamíferos de América del Norte hace más de 60 millones de años. Y no es el único tirio cuya nefasta experiencia se relata. En cuanto a los troyanos, los editores de revistas científicas más o menos prestigiosas, pongamos que se defienden como pueden y echan balones fuera achacando el problema al exceso de artículos sometidos a revisión y a la escasez de revisores dispuestos a valorarlos. Olé.
El trabajo realmente valioso que Powell menciona y en cuyos resultados se apoya es obra de Daniel Himmelstein, un chavalín que prepara su tesis doctoral en la Universidad de California en San Francisco. Sí, es un estudiante de primer año de doctorado pero ya cuenta con un major (licenciatura previas) en Bioestadística mezclado con genómica y computación. ¡ Qué bruto !
No es de extrañar, desde luego, que este otro tirio haya realizado, por propia iniciativa y tras sentirse otra víctima del retraso de publicación, el análisis más masivo del tema. Para abrir boca, en Junio del año pasado analizó las cifras de los siete títulos de la Public Library of Science (PLoS) y 3482 revistas más incluídas en PubMed, el mayor y mejor sistema bibliográfico centrado en la investigación biomédica. Cuando la Powell le contactó, se estiró algo más analizando el retraso editorial de 3.330.333 (sí, tres millones etc) de artículos publicados desde 1965 a 2015 y el retraso técnico (él lo llama publishing delay y Kendall production delay, que me parece mejor término) de solo 2.765.750 trabajos publicados desde 1997 a 2015. En este estudio su idea es seguir la evolución de las cifras de retraso y ¡ Oh sorpresa ! no se ha producido un aumento generalizado de los retrasos y la mediana del retraso editorial se mantiene alrededor de los 100 días. Como Daniel sigue pensando que lo razonable serían dos meses, recomienda la publicación online de preprints en sistemas como ThinkLab, la plataforma fundada por Jesse Spaulding para la discusión abierta, online y en tiempo real de los trabajos científicos.
Y ahora al trabajo de fin de grado.
Los retrasos en la publicación de artículos científicos no son un tema menor. Por un lado, contradicen la “norma de prioridad”; por otro, amenazan el sistema de recompensa y la consiguiente promoción. Lo explico en el siguiente párrafo.
La norma de prioridad, tal y como la formula Michel Strevens (New York University) se refiere a que todo el mérito y reconocimiento en ciencia se adjudica al primero en realizar un descubrimiento o un avance. En Biomedicina, los epónimos que se adjudican a enfermedades (anemia de Fanconi) a estructuras anatómicas (trompas de Falopio) y a otros conceptos reflejan este reconocimiento: Gabriele Falloppio describió las trompas uterinas en el siglo XVI, Fanconi la panmielopatía hereditaria en 1927. Por otra parte, el hecho de que cada nueva aportación científica se deba someter a un proceso aparentemente inacabable de verificaciones hace que su publicación se dilate más allá de los plazos razonables en que se ha de presentar como mérito en un curriculum o ante un tribunal. En otras palabras: uno no puede ser doctor en tres años si el conjunto de trabajos que forman parte de su tesis tardan cuatro en publicarse.
La aportación de Silvia MQ al estudio del retraso de publicación tiene algunos aspectos originales que yo mismo he deseado estudiar hace tiempo. Como tanto ella como otros han demostrado que es el retraso editorial (la distancia entre recepción y aceptación de un manuscrito) lo que más cuenta, vamos a poner esa distancia en relación con dos indicadores de la complejidad de un trabajo: el primero se refiere a la diversidad intelectual, al número de temas que el trabajo trata. El segundo se refiere a la complejidad instrumental, al número de pruebas y procedimientos que se realizan a lo largo del trabajo. Hay otras variables también en juego y espero que el estudio, que está muy avanzado, reporte a su autora una gran licenciatura.
Y a tiempo, claro está.

De nuevo las revisiones y trabajos de síntesis: la taxonomía de Harris Cooper

No he sido sistemático al tratar las revisiones sistemáticas. Es la tercera vez en poco tiempo que les dedico una entrada. Esta vez no reflejo la abundancia de revisiones sobre revisiones ni prevengo a los alumnos de doctorado de la conveniencia y aún necesidad de que realicen revisiones sistemáticas. Esta vez pido disculpas: más importante que realizar revisiones sistemáticas es ser sistemático al revisar.
Mi colega Pachu A. tras leer la entrada de la pasada semana, me ha hecho llegar el magnífico y amplio artículo que Justus Randolph dedica a las revisiones en el contexto de la realización de la tesis doctoral. Más oportuno, imposible.
El trabajo se inicia contestando a la pregunta ¿ Por qué se realiza una revisión de la literatura ?. La respuesta es ésta:

“Realizar una revisión de la literatura es la forma en que su autor obtiene conocimiento sobre un campo de estudio determinado, incluyendo su vocabulario, sus teorías, sus variables y fenómenos clave y sus métodos y desarrollo histórico. También informa al estudiante sobre los grupos e investigadores influyentes en esa línea de investigación”.

Randolph enumera muchas más razones que justifican la realización de las revisiones y concluye la sección con una frase de Perogrullo, pero definitiva:

“Es imposible establecer que la investigación que nos proponemos supone un avance sobre lo anterior sin determinar el estado de las investigaciones previas”.

La segunda sección del trabajo, que titula “Taxonomy of Literature Reviews”, se centra en comentar una clasificación de las revisiones que Harris Cooper viene desarrollando desde mediados de los años ochenta. De hecho, el facsímil de su comunicación al Annual Meeting of the American Educational Research Association es absolutamente pre-Google (1985).

Muchos años después, se puede encontrar su taxonomía en el capítulo introductorio al Manual de trabajos de síntesis (de 2009, ved las referencias).
Cooper distingue cinco facetas o aspectos que configuran cómo va a ser la revisión que se pretende.

El énfasis (focus): qué orientación tienen los trabajos que se revisan
El objetivo (goal): qué se propone el autor de la revisión
El enfoque (perspective): qué actitud adopta el autor de la revisión
La cobertura (coverage): qué alcance, número y tipo de trabajos se incluirán inicialmente
La organización: en qué formato y orden se exponen los trabajos revisados y
La audiencia: quiénes son los destinatarios de la revisión

Nadie es tan ingenuo como para pretender tener un diseño establecido desde le primer momento. Los intereses pueden variar y en la misma medida el formato de la revisión. Pero es necesario actuar con orden desde el primer momento. A continuación repaso las categorías y los criterios que cada faceta admite. Lo hago repitiendo las ideas y los comentarios de Randolph al esquema de Cooper.

El énfasis

Quien revisa un trabajo original puede hacer énfasis en sus resultados, o en sus métodos, o en las teorías de las que parte (o en las que defiende) o en sus posibilidades de aplicación. Pero la mayoría de las revisiones se centran en los resultados de los trabajos originales. De hecho, una revisión de la literatura se ha definido como “una síntesis y un análisis de la información centrada en los hallazgos (y no una simple acumulación de bibliografía) que compendia el contenido de la altura y extrae conclusiones de ella.
Desde el punto de vista de los fundamentos de una investigación, una revisión centrada en los resultados ayuda a identificar la falta de información sobre un resultado determinado, justificando así la necesidad del estudio que nos proponemos.
En una revisión metodológica, los métodos en el campo de investigación en cuestión se investigan para identificar variables, mediciones y métodos de análisis que se emplean en la investigación orientada a los resultados.
Y está claro que, por mucho que una tesis tenga un objetivo principal, la revisión que se sitúa en su punto de partida también ha de tratar los demás enfoques.

El objetivo

Lo que muchos revisores pretenden es integrar y generalizar hallazgos de estudios originales o bien resolver un debate en un área determinada o armonizar conceptos que proceden de campos diferentes. Sin embargo, el doctorando usa la revisión de la literatura para identificar una hueco en el conocimiento y acometer la resolución de ese defecto en su tesis.

El enfoque

En investigaciones cualitativas, los autores de revisiones con frecuencia deciden revelar sus prejuicios, sus sesgos previos y discutir de qué modo pueden haber afectado a la revisión. En la investigación cuantitativa los autores intentan ceñirse a los datos y adoptar una actitud neutral. La decisión depende de cada caso, pero es bueno que los doctorandos se esfuercen por alejarse de prejuicios ajenos y no alimenten los propios. A pesar de su aura de objetividad, la ciencia, esa otra hoguera de vanidades, también está hecha de filias y fobias.

La cobertura

Decidir sobre el alcance es una de las fases en la realización de revisiones sistemáticas pero, antes de abordarla, conviene medir las propias fuerzas y no pretender abarcar demasiado. Cooper propone cuatro variedades posibles. En una revisión exhaustiva, el revisor se propone localizar y considerar (leer, cuanto  menos) cada documento disponible sobre el tema en cuestión, esté publicado o no. Pero esto lleva mucho tiempo y es preferible que se definan unos límites para la selección de documentos primarios; amplios, sí, pero límites al fin. A esta segunda variedad Cooper la llama revisión exhaustiva con referencias seleccionadas. Una tercera posibilidad es considerar una muestra representativa y hacer generalizaciones a partir de ella. Esto ya os imagináis que resulta peligroso y no está exento de sesgos. La última variedad es la llamada “muestra intencional” que parte de una selección previa de los trabajos en un área. El criterio de selección aquí puede resultar controvertido pero declarar que se trata, por ejemplo, de los trabajos con gran impacto o de los publicados en las revistas centrales o de los trabajos que, a su vez, son de revisión, ayuda a despejar dudas.

La organización de la revisión

De los formatos posibles que se puede conferir al texto de una revisión, los más usuales son el histórico, el conceptual y el sistemático. En las revisiones de formato histórico, se disponen los trabajos originales en orden cronológico. La intención de este tipo de organización es enfatizar el desarrollo del conocimiento en un campo o sobre determinado problema. En la organización conceptual, se identifican una serie de conceptos y después de asocia a cada uno los trabajos originales, en una especie de paralelismo. De la organización sistemática de una revisión ya hemos tenido suficientes ejemplos en mi tratamiento anterior del tema.

La audiencia

Otra vez conviene no pecar de ambiciosos. La revisión que un doctorando realiza previa a su tesis tiene como primer y principal destinatario a su director de tesis. A continuación, sus compañeros y quizás algunos otros investigadores seniors. La idea es que critiquen la revisión y la mejoren, porque es la mejor guía de investigación que el doctorando tendrá en los siguientes años. Nada de lenguaje coloquial y tratamiento ligero: queda aún mucho camino hasta divulgar los resultados de una investigación que se está iniciando ahora, precisamente con una revisión de la literatura.

2015-10-03 22.28.13

Un maravilloso garito berlinés donde se pincha blues y se fuma libremente

Y mis fuentes:
Randolph, J. J. (2009). A guide to writing the dissertation literature review. Practical Assessment, Research & Evaluation, 14(13), 1-13.
Cooper, H., & Hedges, L. V. (2009). Research synthesis as a scientific process. En Cooper, H., Hedges, L. V., & Valentine, J. C. (Eds.)The handbook of research synthesis and meta-analysis.