Resúmenes de trabajos de investigación: ¿ Cómo se confeccionan y de dónde proceden sus frases ?

Debo al Journal of Documentation una parte de lo que sé. Y no es una parte pequeña. Reconozco esa deuda sobre todo en la breve nota en que Alan Pritchard acuño el término “Bibliometrics” para referirse al análisis de los procesos de comunicación científica a través del estudio cuantitativo de los trabajos de investigación. Llegué a aquel trabajo del último trimestre de 1969 mucho después de que se publicase. En cambio, leí y casi memoricé la revisión de Stephen Robertson sobre las teorías y modelos en recuperación de información muy poco después de su publicación, en Febrero de 1977. He olvidado la recuperación de información y he avanzado mucho (espero) en bibliometría, pero persiste en mí la influencia de esos dos maestros, de sus trabajos y de la revista que los publicó.

 

Cámaras

Cámaras convencionales en Los Encantes. Ninguna relación con los resúmenes y su confección.

El número más reciente del Journal of Documentation contiene un buen trabajo que, además, es muy relevante para la escritura y la comunicación científicas que son objeto (no siempre) de este mismo blog, al menos de su “cara B”. La primera firmante es Iana Atanassova, una investigadora búlgara con formación básica en Matemáticas y muy amplia formación complementaria en lingüística computacional y recuperación de información. Tras su paso por las universidades de Sofia y París (Sorbonne) aparece ahora afiliada con la Universidad del Franco-Condado en Besançon. Desde allí ha colaborado con dos investigadores de Montreal. Uno de ellos, Vicent Lariviére, es otro caso de hiperactividad aplicada a la bibliometría; para que os hagáis una idea, en lo que llevamos de año ya ha publicado seis trabajos de investigación. El autor restante, Marc Bertin, es el autor “entrepanes”, el del medio, una de las posiciones más odiadas. Hasta ahora ha hecho pocas cosas, pero muy interesantes. Veamos esta última.
El trabajo de Atanassova, Bertin y Lariviére se titula “On the composition of Scientific Abstracts” y se propone:

“… to measure the similarity between sentences that appear in abstracts and sentences that are found in the body of articles. Locating the zones in a paper that are used as sources for constructing the abstract, either by direct re-use of their sentences or by reformulations, will give us a better understanding on the parts of an article that are considered as most important by the authors and that, according to them, cover the key elements of the text”

De este objetivo general se desprenden dos preguntas de investigación. La primera es simple: ¿ Qué proporción del resumen surge de la copia literal o aproximada de frases del texto del trabajo íntegro ?. Esta primera pregunta se relaciona con la cuestión de hasta qué punto un resumen refleja adecuadamente el contenido del artículo que condensa. La segunda pregunta tiene, por así decir, trampa: Teniendo en cuenta la estructura retórica de los trabajos de investigación ¿ En qué parte del texto se sitúan las frases que constituyen el resumen ?. La trampa de esta pregunta se refiere a la posibilidad de aplicar los resultados del estudio al diseño de procedimientos automáticos de condensación. ¡ Ahí es nada !.
A la hora de la verdad, los autores emplean un conjunto de datos al que ya han recurrido más de una vez, compuesto de más de 85.000 artículos publicados en las distintas cabeceras de PLoS. Tras algunas comprobaciones y precisiones, desglosan los textos y los resúmenes en frases y aplican tres medidas de similitud al conjunto.

Los resultados muestran que un 16 por ciento de los resúmenes cuentan con frases totalmente originales y que el restante 84 % están confeccionados con al menos una frase procedente del cuerpo del artículo correspondiente. Casi en la cuarta parte de los trabajos analizados se detecta una reutilización de frases del texto en los resúmenes con niveles de similitud superiores a 0.6. Por otra parte, por término medio los resúmenes de los trabajos se han confeccionado con frases procedentes en un cuatro por ciento de las introducciones y en casi un ocho por ciento con frases de la discusión (la lectura de la gráfica correspondiente no es sencilla).
Recomiendo encarecidamente la lectura de este trabajo. Sus resultados son de la mayor relevancia para la escritura científica y su aprendizaje.

Mi interés por el Journal of Documentation es mantenido. Sin embargo, algo está causando que decaiga mi atención sobre dos revistas españolas que hasta la fecha he seguido con interés: los últimos sumarios de la Revista Española de Documentación Científica parecen indicar una ampliación de su cobertura, que cada vez se refiere menos a documentos y procesos de comunicación científica. Otro tanto sucede con El Profesional de la Información (EPI) cuya deriva hacia los estudios de Comunicación es patente. El último número se centra en “Metamedios y Audiencias” (¿?) .

Se diría que las dos rvistas están perdiendo algo de su identidad y, en esta sociedad donde las pérdidas llaman unas a otras, esa se puede traducir en una pérdida de interés de los lectores de ambas cabeceras. Sería otra noticia muy mala.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s