Conceptos fundamentales sobre redes: un nuevo e importante recurso

¿ Qué debería saber cualquier persona del siglo XXI sobre redes en el momento de acabar su educación secundaria ? A esta pregunta han tratado de contestar un quinteto de investigadores de las universidades de Oxford y pública de Nueva York, el museo New York Hall of Science y la academia militar de West Point.

Tras la conferencia NetSci de 2014, iniciaron un proceso que implicó durante un año a profesores y estudiantes de análisis de redes e incluyó  iniciales tormentas de ideas, comparaciones entre grupos a continuación y finalmente la propuesta de una lista final de conceptos esenciales. Este proceso completo se ha descrito en un trabajo de último número de Journal of Complex Networks (una de mis fuentes preferidas, como expuse hace poco) que se titula What are essential concepts about networks?.

network-1

La portada del panfleto (18 páginas) que contiene los conceptos básicos sobre redes.

 

 

 

 

El resultado es un magnífico panfleto que, con brevedad y gran riqueza gráfica, resume en siete puntos las ideas centrales y el conocimiento básico sobre las redes sociales. Quienes hayan leído el arranque del libro de Freeman sobre el desarrollo del análisis de redes sociales se sentirán muy familiarizados con los puntos que este panfleto divulga. Voy a añadir este panfleto a la literatura básica sobre análisis de redes sociales. Haced lo mismo con vuestras bibliografías. Los estudiantes sabrán apreciarlo.

Y para que la cosa no quede tan sosa, añado un video sobre la “belleza” de las redes cuyo protagonista está pidiendo a gritos un papel en The Big Bang Theory…

 

 

Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas (II)

[Esta es la segunda entrega de una serie de cuatro, que se inició con ésta.]

Para seguir con nuestro ejemplo en concreto: todo lo que necesitamos para obtener los registros del Web of Science equivalentes a los que ya habíamos identificado en PubMed es descargar la lista de PMIDs y emplearla como perfil de búsqueda.  La Figura siguiente detalla cómo se activa ese formato de descarga:

adreno-pmid

Descarga de una simple lista de identificadores de PubMed a un fichero

y, como se puede ver en el pequeño recuadro adyacente, lo que se obtiene es una lista que se puede incorporar a un procesador de textos y convertir en un perfil de búsqueda apto para consultar en web of science. Basta con sustituir cada retorno de carro por la expresión “ OR “.

adreno-pmid-2

Tras las consulta y las descargas en PubMed/MEDLINE disponemos de dos ficheros. El primero contiene todos los registros completos de los trabajos sobre adrenoleucodistrofia y el segundo sus identificadores en PubMed. Cuando este segundo fichero se ha empleado para construir el perfil en WoS, se puede desechar, pero yo nunca lo hago.
El formato, los elementos de cada registro que se descarga y  la forma en que están etiquetados, son de extrema importancia y se han de elegir cuidadosamente en este fase. Como veremos a continuación, los sistemas que ayudan a trazar las redes de citas obligan a que las descargas tengan un formato determinado.

 

Descarga desde índices de citas

Los dos índices principales de citas son Web of Science and Scopus. Ambos permiten la conexión con PubMed utilizando el PMID y con muchos otros sistemas empleando el DOI. Yo prefiero emplear el Web of Science porque sus descargas se pueden tratar con HistCite tanto como con CiteNetExplorer y otras aplicaciones y, por otra parte, dispongo de rutinas para procesar los registros en ese formato. Pero no se trata sólo de un capricho, Tethene, una gran aplicación en python para el análisis de redes de citas, también toma los datos del WoS. Lo mismo sucede con CiteSpace  o con las BiblioTools  de Sebastian Grauwin y muchas otras aplicaciones.
HistCite requiere la descarga de registros en el formato que se muestra en la segunda de las figuras que he incluido en esta nota. Se obtiene aplicando a las páginas de resultados en WoS la siguiente secuencia:

Save to other file formats
Number of Records: 1-500
Record Content: Full Record and Cited References
File Format: Plain Text

El resultado es uno o varios archivos de texto plano con la extensión “.txt”. Cuando los resultados son muy numerosos, las descargas se realizan en varios lotes de un máximo de 500 documentos. Por fortuna, tanto HistCite como CiteNetExplorer los acumulan hasta importar todos los registros resultantes de cada búsqueda. Veremos a continuación cómo los tratan.

Uso de HistCite (y dos observaciones importantes)

Soy un gran partidario de HistCite, pero su uso presenta varios problemas. Uno de ellos es que sólo funciona con sistemas Windows y con Internet Explorer (IE). Otro es que a partir de la versión 8 de IE el comportamiento de la aplicación es algo errático y requiere de ajustes adicionales. A pesar de que es una aplicación que ya no se desarrolla, HistCite tiene una gran funcionalidad, descrita en el correspondiente Manual y abreviada en las páginas de Eugene Garfield. Como todo lo que pretendemos de HistCite es que “empaquete” nuestro archivo de red, lo mejor es importar los registros, trazar la red y a continuación exportarla como archivo de Pajek. Los pasos son:

Carga (importación) de los registros
En el menú principal de la aplicación, añadir el fichero del primer lote:
File > Add File > navegar hasta encontrarlo y > Open
Repetir la operación con los restantes lotes.

Tras cada carga, se actualiza un contador de registros, lo que permite controlar que se importan todos sin novedad.
HistCite realiza una serie de análisis y cálculos con los datos. De las variables que genera, sólo nos interesa aquí lo que llama Global y Local Citation Score (GCS y LCS respectivamente). Estas puntuaciones reflejan el número de citas recibidas por cada trabajo en toda la colección de la Web of Science— la base de datos origen, de ahí lo de global— y en el contexto de los trabajos que hemos seleccionado e incluido en nuestro análisis. Más adelante me refiero al resto de datos y cálculos. Por el momento, baste decir que cada trabajo se representa en la red por un circulo cuyo diámetro es proporcional al LCS o al GCS.

[Este es el final de la segunda parte de la serie sobre Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas]

 

 

 

 

Cómo obtener datos bibliométricos/bibliográficos para el trazado de redes de citas (I)

Esta es la primera de una serie de cuatro entregas sobre los procedimientos para obtener redes de citas entre trabajos científicos que sean adecuadas para su visualización y análisis. Las siguientes entradas las ofreceré con frecuencia irregular, pero irán llegando.

De hecho, ya he publicado la segunda entrega.

Los documentos científicos hacen mención expresa del uso de las ideas, los métodos, los resultados y otros elementos que toman de trabajos anteriores. Estas menciones se traducen en listas de referencias bibliográficas que enumeran esos trabajos. Las referencias permiten establecer tres tipos de relaciones de cita entre los trabajos fuente (que hacen la referencia) y los trabajos citados.

ebola

El componente gigante de la red de cita directa entre trabajos de investigación del virus Ebola desde 1977. Las comunidades se han coloreado y el tamaño de los vértices el proporcional al grado de entrada (Gephi con Force Atlas 2)

La relación de cita directa se establece entre un trabajo fuente y todos aquellos que menciona y aparecen en su bibliografía.
El enlace bibliográfico relaciona aquellos trabajos fuente con alguna referencia bibliográfica común.
La co-citación se establece entre aquellos trabajos citados que aparecen conjuntamente en las referencias de otros posteriores.
El siguiente esquema ayuda a comprender estos conceptos.

citationnetworks

Las principales relaciones de citas en un esquema original del proyecto Tethne

Las relaciones de citas se pueden representar mediante diagramas o redes de citas. El análisis de estas redes permite averiguar cuál es el significado de las relaciones en un contexto determinado y, eventualmente, avanzar en la descripción e incluso la valoración de los procesos descubiertos.
Los datos bibliográficos necesarios para trazar redes de citas se obtienen mediante tres operaciones básicas:

La definición del conjunto de registros
La identificación de sus relaciones y
La obtención de la red

Además, en una segunda fase se procede a

La visualización de la red y
El análisis numérico de la red y sus componentes.

A continuación introduzco esas operaciones y, después, ofrezco el estudio de un caso para detallar el procedimiento completo.

Obtención de los datos (las operaciones básicas).

El primer paso es definir la disciplina, área o línea de investigación que interesa y luego identificar los conjuntos de documentos que la conforman. En casi todos los casos,  la definición inicial pasa por enumerar un conjunto mayor o menor de términos y construir con ellos perfiles de búsqueda en uno u otro sistema.
Tras obtener, en una o varias rondas, el conjunto de documentos deseados, es necesario obtener también las listas de referencias bibliográficas de cada uno. Si se ha recurrido a un sistema bibliográfico que las incorpora, estupendo. Si se ha recurrido a otro sistema, será necesario conectar de algún modo cada registro obtenido con  su versión en un sistema que incorpore sus referencias. Esta operación concluye con el almacenamiento de los registros en tablas SQL o en otro tipo de soporte estructurado.
La tercera operación consiste en trazar la red de citas entre los documentos recuperados. Y aquí se ofrecen dos opciones. La opción más complicada es elaborar la red por nosotros mismos, partiendo de los registros que hemos descargado en tablas SQL o similar. La opción más cómoda es emplear algún programa que por sí mismo trace la red. Más adelante me referiré a tres o cuatro.

La visualización y el análisis (las operaciones adicionales)

Tras la obtención de los datos, es necesario proceder al examen de la red obtenida y a su análisis cuantitativo, en busca de rasgos que nos permitan caracterizarla.
El punto de partida es un simple archivo de texto que contiene una relación de los nodos (o vértices) de la red, con su identificación y su nombre o etiqueta y una lista de las conexiones (o aristas) entre esos nodos, eventualmente acompañada de valores que indican la intensidad de cada conexión. Este formato recibe el nombre de “formato Pajek” y la extensión “.net”. Es el formato más habitual del archivo resultante de los programas o las aplicaciones que más adelante mencionaré. Si, por el contrario, el archivo es resultante del procesamiento de registros en SQL, la extensión se la adjudicamos nosotros y santas pascuas.
Prácticamente todos los programas de visualización de redes admiten el formato Pajek en la entrada de datos. Y lo mismo sucede entre los formatos de salida.
Con ser importante y muy gratificante la obtención de una buena representación gráfica de nuestra red, sólo es eso: una representación más o menos atractiva. La manipulación de algunos de sus componentes puede arrojar algunas luces sobre su composición y el por qué de su topología, pero para el análisis numérico bien vale recurrir a otro tipo de aplicaciones. Veremos una de ellas a continuación, cuando desentrañemos el caso práctico que he seleccionado.

El tema: la adrenoleucodistrofia

La definición

Mediado 1910, dos médicos  vieneses describieron una esclerosis difusa de la medula espinal en un niño de seis años. Tres años más tarde se comunicó el hallazgo en su cerebro de lo que se definió como “encefalitis periaxial difusa” y, en 1923 E. Siemerling y Hans Gerhard Creutfledt (sí, el mismo de la “enfermedad de las vacas locas”) asociaron a la sintomatología nerviosa la afectación de la médula suprarrenal. Estos datos sólo me sirven para expresar que el tema tiene cierto recorrido histórico además de tratarse, evidentemente, de un tema médico.
Al haber elegido una enfermedad, es lógico recurrir al principal sistema de bibliografía médica, a PubMed.
La ventaja de PubMed, además de su gratuidad, es que es un recurso completo, y puede proporcionarnos información adicional muy útil sobre los temas que manejamos antes de abordar una búsqueda bibliográfica pura y dura. Yo he consultado un par de sus recursos asociados: los encabezamientos de materias médicas (MeSH) y el compendio de descripciones de genes y genotipos OMIM. Sin entrar en excesivos detalles, esto me ha permitido enriquecer mi perfil de búsqueda y asociar los siguientes términos:

Adrenoleukodystrophy (el término principal)
Adrénomyéloneuropathy (el término para la afectación en adultos) y
ABCD1 (el código del gen afectado)

El resultado de la combinación (la suma lógica) de los tres términos es un conjunto de 2168 registros correspondientes a otros tantos artículos de investigación sobre la enfermedad.

La combinación de sistemas

Los sistemas bibliográficos difieren no sólo en su orientación temática; también en el tipo de documentos que incluyen y la forma en que representan su contenido. PubMed aprovecha una larga tradición y una gran experiencia para describir temáticamente el contenido de los trabajos. En la figura siguiente,  la flecha señala una serie de términos etiquetados como MH, encabezamientos médicos que expresan la temática de ese artículo en cuestión. Resulta de grandísima utilidad contar con ellos pero, tal y como advertíamos en los párrafos introductores, es necesario también obtener las referencias bibliográficas, que conectarán cada artículo mediante la relación de citas y referencias.

medline

Un registro de MEDLINE en el formato así llamado donde aparecen los descriptores temáticos asignados al trabajo y el código PMID inicial.

Dos sistemas bibliográficos proporcionan las referencias de casi todos sus registros: Web of Science y Scopus. Ninguno de ellos es gratuito, pero resultan accesibles en muchos países a través de contratos nacionales o institucionales. Es posible identificar un registro procedente de PubMed en estos dos sistemas porque los dos incluyen el código único que identifica cada registro de PubMed. Este código numérico se puede identificar en la primera línea de cada registro (vedlo en el de la figura precedente) con la etiqueta PMID.  La figura siguiente muestra la versión del Web of Science del mismo registro y, justo antes de la etiqueta del final de registro (ER) he señalado con una flecha el código, que aquí se etiqueta con la expresión ‘PM’.

wos

El mismo registro en la Web of Science con el código de identificación de PubMed

Este es el fin de la primera parte de la obtención de datos bibliométricos para el trazado de redes de citas.

Más análisis de redes sociales: las revistas sobre redes

Si hemos de atenernos a la teoría, uno se inicia en un tema o en un área o en una linea de investigación leyendo algunos libros fundamentales. Después, cuando ha elegido los problemas que piensa abordar y con suerte resolver, realiza búsquedas de documentos específicos, pongamos revisiones y artículos originales de investigación. Como el conocimiento no es estático, sino que se renueva continuamente, algo habrá que hacer para “seguir” la literatura sobre los temas de interés de cada uno.
La selección de los textos básicos sobre una disciplina o una línea de investigación suele ser cosa de un tutor académico, llámese director de tesis u otra cosa. Para la recopilación de información científica sobre un problema lo mejor es combinar buenas fuentes documentales y buenos bibliotecarios especializados. A  pesar de los pesares, el trabajo del especialista en información, especialmente en información científica, sigue teniendo un papel destacado en esas operaciones. Para la actualización informativa se han ideado los sistemas de alerta y, de éstos, la alerta de sumarios siempre me ha parecido más ventajosa que las alertas temáticas. La alerta de sumarios (suele aparecer en las páginas web de las revistas como “TOC (por table of contents) alert”) se basa en suscribir y recibir por correo electrónico el sumario de cada nuevo número de una revista. La alerta temática depende de la elaboración de un perfil de búsqueda en algún sistema de información bibliográfica y su ejecución periódica, en busca de nuevos trabajos que puedan resultar de interés. El problema con la alerta temática y la razón por la que prefiero la alerta de sumario es que el lenguaje científico cambia con cierta rapidez y una expresión de búsqueda válida en su día puede haber caído en desuso algún tiempo después. Por otra parte no hay que subestimar la chiripa (en pijo, serendipia) el hallazgo de trabajos relevantes como por casualidad.
Supongamos que somos de los que aplican el análisis de redes (sociales y de otro tipo) para desentrañar problemas en nuestro campo de actividad. Supongamos a continuación que hemos asimilado el contenido de los manuales básicos del ARS y que disponemos de una buena bibliografía sobre nuestra línea de investigación. Además, queremos estar actualizados mediante el seguimiento de algunas revistas. En ese caso, tenemos un problema.

DSCN0386

Una de las formas de afrontar el problema a que aludo. La otra es seguir leyendo

 

Y es que el análisis de redes sociales ha resultado tan útil y ha cobrado tal auge que lo impregna todo, que son demasiadas las publicaciones que podrían ofrecernos información útil. Un par de ejemplos recientes: el trabajo Current innovations and future challenges of network motif detection (que revisa una técnica de análisis estructural de primer orden) se publicó el año pasado en la revista Briefing in Bioinformatics; por su parte, la revista PLoS One, un auténtico cajón de sastre, publicó en 2012 otro sobre la jerarquía de estructuras temáticas en redes de artículos científicos.

El análisis de redes sociales, el análisis estructural y el estudio de sistemas complejos suelen clasificarse en el sistema Web of Science como “Aplicaciones interdisciplinares de las matemáticas”, un epígrafe tan nebuloso que no es posible seleccionar de un plumazo las revistas que incluye. Además, intentar obtener una lista manejable de publicaciones periódicas utilizando la palabra “networks” para interrogar el directorio Ulrich u otra fuente similar es algo que no recomiendo a nadie.
Yo he examinado algunos títulos que relaciono  y comento a continuación. Os prevengo que no he examinado estas revistas como posibles destinatarias de manuscritos, sino como meras fuentes de información. Ojalá que esta minima bibliografía os sirva de orientación.

1. Redes
Subtitulada “Revista hispana para el análisis de redes sociales”, esta revista apareció en 2002 y se define a sí misma como una “revista académica orientada a ofrecer resultados de investigación sobre redes sociales y contribuciones teóricas con una perspectiva reticular (sic) especialmente desde y para el mundo iberoamericano”. La dirigen conjuntamente dos buenos investigadores españoles: Isidro Maya (Departamento de Psicología Social, Universidad de Sevilla) y José Luis Molina, autor de uno de los libros introductores más importantes y director del Departamento de Antropología Social de la Universidad Autónoma de Barcelona.
La revista sólo publica dos números ordinarios al año, los meses de Junio y Diciembre y su contenido es a menudo monográfico. Los trabajos están escritos en español y algunos en portugués y es cierto que las investigaciones latinoamericanas están muy presentes.

2. Dos títulos que no debemos tener en cuenta
Yo descartaría las revistas Networks (Wiley) y Ad Hoc Networks (Elsevier). La primera se centra en las redes informáticas, la segunda en redes de sensores. He examinado algunos números y no he encontrado trabajos de validez general, aunque deben de resultar muy importantes para los ingenieros.

3. La gran clásica: Social Networks
Esta revista es clásica desde su primer volumen, que arrancó en Agosto de 1978 y contiene el famoso trabajo en dos partes Centrality in Social Networks. Su director fue inicialmente nada menos que Linton Freeman, secundado por Clyde Mitchell y Rolf Ziegler. La descripción de la revista es suficientemente explícita acerca de su perfil multidisciplinario:

“It provides a common forum for representatives of anthropology, sociology, history, social psychology, political science, human geography, biology, economics, communications science and other disciplines who share an interest in the study of the empirical structure of social relations and associations that may be expressed in network form. It publishes both theoretical and substantive papers. Critical reviews of major theoretical or methodological approaches using the notion of networks in the analysis of social behaviour are also included, as are reviews of recent books dealing with social networks and social structure.”

Por otra parte, algunos de los últimos artículos publicados refuerzan su interés:
Detecting large cohesive subgroups with high clustering coefficients in social networks
Strong ties promote the evolution of cooperation in dynamic networks o
Weaving the fabric of science: Dynamic network models of science’s unfolding structure

Social Networks, en suma, es una fuente imprescindible.

4. Sí pero no: el extraño caso de Physical Review E

La quinta serie de las Physical Reviews publica “recent developments in biological and soft matter physics including granular materials, colloids, complex fluids, liquid crystals, and polymers”. Hasta ahí, nada que ver con las redes. Pero un estrambote añade: “The journal covers fluid dynamics and plasma physics and includes sections on computational and interdisciplinary physics, for example, complex networks.”
Yo me sé de alguien que habrá rechinado los dientes al leer eso de “interdisciplinary physics, for example, complex networks”. Pero lo cierto es que sí, que cada número de PRE contiene una sección que llama “Networks and Complex Systems” y que, tomando como ejemplo el número más reciente (Junio de 2016) contiene trabajos del estilo de
Reconstruction of evolved dynamic networks from degree correlations o de

Riemannian-geometric entropy for measuring network complexity

El sello de la Física Estadística y todas sus complicaciones matemáticas no hay quien se lo quite, pero los sistemas complejos están para eso: para complicarse la vida estudiándolos.

5. Las revistas de la INSNA: Connections y Journal of Social Structure

La International Network for Social Network Analysis, presidida en su día por Freeman y en la actualidad nada menos que por Steve Bogartti, publica estas dos revistas de gran interés y, por añadidura, accesibles a todo el mundo.
Una prueba de su relevancia está en trabajos como:

Explorative Visualization of Citation Patterns in Social Network Research (Journal of Social Structure, 2011) o como
Co-authorship in Italian Workshops on Population Studies: An Analysis with a Network Approach (Connections, April 2010).

Aunque el número de trabajos no es muy elevado, ambas revistas publican artículos extensos y revisiones de gran interés.

6. Dos revistas menores
Tanto International Journal of Social Network Mining (InderScience) como Journal of Graphs Algorithms and Applications (Universidad de Perugia) me parecen revistas menores o periféricas, seguramente por que no las he seguido el tiempo suficiente. Y el caso es que, mientras la primera apareció en 2012, la segunda comenzó a publicarse en 1997. Aún así, sus contenidos no han logrado interesarme hasta el momento. Puedo decir, en todo caso, que el International Journal… cuenta con Perfecto Herrera (Universidad Pompeu Fabra) y Fatos Shafa (Politécnica de Barcelona) en su comité de redacción.

7. English scholars strike back !

La conocida frase “ponga un informático en su vida” se puede parafrasear en el caso de las editoriales académicas como “ponga una revista de redes en su catalogo”. Tanto Oxford University Press como la editorial universitaria de Cambridge han lanzado títulos. Y muy interesantes.
Cambridge University Press, que ya venía editando la serie de monografías Structural Analysis in the Social Sciences, publica desde 2013 la revista Network Science, que insiste en el argumento de la interdisciplinariedad:

“While we think of social network analysis, methods, and theory as the central components of network science, the discipline has grown well beyond the “social” context. Networks were first studied quantitatively by behavioral scientists but are now modeled by many different types of researchers. The discipline is ready for a comprehensive journal, open to papers from all relevant areas.This journal aims to give that diverse community of researchers an outlet to share new discoveries and talk to one another.”
La lista de sus editores, encabezados por Ulrich Brandes, es impresionante. En su último número publica, por ejemplo, “Network Patterns of Legislative Collaboration in Twenty Parliaments” ¿ Alguien da más ?.
Por su parte, Journal of Complex Networks, que se publica desde Junio de 2013,  está dirigida por Ernesto Estrada, el matemático de origen cubano que, tras un periodo en España, se ha
afincado en Glasgow. Me interesan muchísimo los números de esa revista que, con cierta frecuencia, presenta excelentes trabajos de revisión, además de originales tan atractivos como “Clustering function: another view on clustering coefficient”.

8. La revista de Springer

La poderosa editorial Springer siente debilidad por el análisis de redes pero, hasta hace cinco años se dedicaba más a publicar libros editados y actas de congresos sobre ARS. Afortunadamente comenzó en 2011 la publicación de Social Network Analysis and Mining, que contiene trabajos realmente pintorescos, del estilo de “Empirical analysis of the Portuguese governments social network” junto a otros que están llamados a tener gran influencia, como “A new approach to role and position detection in networks”. Es una publicación poderosa y de gran volumen (más de 40 trabajos en el número más reciente). De seguimiento obligatorio también.

9. Complejidades (demasiadas)

Complexity, una revista editada por Wiley, “covers methodological themes as chaos, genetic algorithms, cellular automata, neural networks, and evolutionary game theory”. Por su parte,  Advances in Complex Systems “aims to provide a unique medium of communication for multidisciplinary approaches, either empirical or theoretical, to the study of complex systems. The latter are seen as systems comprised of multiple interacting components, or agents. Nonlinear feedback processes, stochastic influences, specific conditions for the supply of energy, matter, or information may lead to the emergence of new system qualities on the macroscopic scale that cannot be reduced to the dynamics of the agents.”

Ante tanto enredo, os dejo con un ejemplo de sencillez y modestia, un pregunta y respuesta con Bogartti (aferrado a UNICET, cómo no) que no tiene desperdicio.

Y, bueno, hará bien quien interprete la fotografía “de cabecera” como una insinuación.

Las redes sociales y su análisis: una bibliografía comentada

Estamos en abril y las jacarandas, esas mimosas que renegaron del color amarillo, envuelven en un tenue aroma todos los libros del mundo. Antes de dejarme llevar por ese canto y confesar mis lecturas más recientes, las que de verdad importan, estoy obligado a dedicar una entrada a la UTC (ya sabéis, the usual technical crap)
Me adentré en el análisis de redes sociales (ARS es un acrónimo precioso) como Dante en su selva oscura o Burton en el Africa oriental: sin tener mucha idea de lo que me esperaba. Han pasado los años y no he agotado los círculos del Averno ni he descubierto las fuentes del Nilo, pero sí he conseguido un mínimo de claridad sobre el sentido, los métodos y los resultados esperables de este método. Y le he sacado partido, desde luego.

Figure 6n

Tres instantáneas de la evolución de una red de co-autoría de artículos científicos que estudié en mi último trabajo. He utilizado el algoritmo de visualización de “doble círculo” incorporado a Gephi.

Los libros de divulgación

Hay algunos textos que divulgan el concepto y los métodos del ARS. El título pionero fue este texto breve (124 páginas) de José Luis Molina que leí con atención hace bastante tiempo:

Molina, J. L. (2001). El análisis de redes sociales: una introducción. Bellaterra (Barcelona) Universidad Autónoma. ISBN: 978-8472901605.

Es más reciente la obra de dos físicos con buenas aportaciones originales y con sentido de la divulgación. Si este libro supera el título de José Luis Molina, quizá sea porque se publicó más de diez años después. Apareció primero en inglés y se ha traducido después al castellano:

2a. Guido Caldarelli y Michelle Catanzaro (2012): Networks: a very short introduction. Oxford University Press. ISBN: 978-0199588077 y
2b. Guido Caldarelli y Michelle Catanzaro (2014): Redes: una breve introducción. Madrid, Alianza Editorial. ISBN: 978-8420686172.

Los grandes nombres del análisis de redes han escrito también textos introductores y divulgativos. Mi colega Nicolás R me ha recomendado la lectura del de Watts, que tiene toda la pinta de ser completo y comprensible, además de estar escrito con estilo. Barabási, a pesar de sus títulos algo místicos, tiene un esquema expositivo que me interesa y que, según aprecio, ha sido imitado por Caldarelli y Catanzaro. Sus capítulos tienen unas 20 páginas de extensión y la lectura resulta sorprendentemente fácil y fluida para ser obra de un húngaro nacido y formado en Bucarest y Budapest,  que sólo a los 27 años consiguió una tesis en física en Boston.

3. Albert-László Barabási (2002). Linked: the new science of networks.Cambridge (MA) Perseus Books Group.
4. Duncan J Watts (2004). Six degrees: The science of a connected age. New York, WW Norton & Company. ISBN: 978-0-393-32542-3.

La obra fundamental

Antes de cualquiera de las lecturas que hasta hora he recomendado y de cualquier otro libro sobre ARS (o como mucho de forma simultánea) me parece que es conveniente y hasta imprescindible la lectura del relato de Linton Freeman sobre el desarrollo de los conceptos, las técnicas, las pruebas y el conocimiento de las redes sociales. Su punto de partida es impecable y muy sólido; su visión, muy completa y su reivindicación (que los sociólogos formularon inicialmente lo que los físicos después redescubrieron) plenamente justificada. Del original canadiense, publicado en 2004, existe una versión española de 2012:

5a. Linton C Freeman (2004): The Development of Social Network Analysis: A Study in the Sociology of Science. Vancouver, Empirical Press. ISBN: 978-1594577147.
5b. Linton C Freeman (2012): El Desarrollo del Análisis de Redes Sociales: Un Estudio de Sociología de La Ciencia. Bloomington (IN) Palibro. ISBN: 978-1463330859.

Un paso más

Después de esa obra y de cualquiera de los libros de divulgación que he mencionado, suelo pedir a mis estudiantes que se adentren en la parte más técnica del ARS. En este apartado dejo que elijan entre dos obras de Mark Newman y otras tres de otros autores.
De Mark Newman, el grandísimo Mark Newman, no me gusta su revisión para la revista de la Sociedad (Americana) de Matemática Industrial y Aplicada. Es breve, pero demasiado esquemática. Y los estudiantes no captan del todo los conceptos fundamentales. Por el contrario, me parece que su libro es central en el estudio de los conceptos y técnicas del ARS. Da gusto la claridad con que expresa cuestiones algo intrincadas:

6. Mark E.J. Newman (2003). The structure and function of complex networks. SIAM Review, 45, 167–256.
7. Newman, M. (2010). Networks: an introduction. Oxford, University Press. ISBN: 978-0-19-920665-0

El Centro de Investigaciones Sociológicas ha publicado versiones en castellano de dos de las obras que incluyo en este grupo. La más importante es un auténtico tratado:

8a. Stanley Wassermann y Katherine Faust (1994): Social Network Analysis: Methods and Applications. Cambridge, University Press. ISBN: 978-0521387071. La obra es muy completa, se considera una Biblia aunque sólo sea por su extensión (algo más de 825 páginas) resulta muy útil a pesar de su antigüedad y ha sido reeditada en 2012 en formato electrónico.

Otro libro magníficamente estructurado y compuesto es
9a. Charles Kadushin (2012) Understanding Social Networks: theories, concepts and findings. New York, Oxford University Press. ISBN: 978-0-19-537947-1

Y las versiones en español a las que me he referido son:

8b. Stanley Wassermann y Katherine Faust (2013): Análisis de redes sociales. Métodos y aplicaciones. Madrid, Centro de Investigaciones Sociológicas. ISBN: 978-8474766318  y
9b. Charles Kadushin (2013): Comprender las redes sociales: Teorías, conceptos y hallazgos. Madrid, Centro de Investigaciones Sociológicas. ISBN: 978-8474766325.

estradaNo me resisto a mencionar a uno de los recién llegados a este grupo: el tratado de Ernesto Estrada sobre las redes complejas. Confieso que lo recibí con algo de recelo pero, a medida que pasa el tiempo, recurro a él con mayor frecuencia. Me encanta, además, que este matemático cubano afincado hace poco en Escocia, dedique su libro a “Gissell, Doris, and Puri” ¿ No es enternecedor ? En todo caso, estoy mucho más familiarizado con la primera parte de la obra, dedicada a la teoría, que con la segunda, donde explica las aplicaciones a redes de diversos tipos. La referencia es:

10. Estrada, E. (2011). The Structure of Complex Networks: Theory and Applications. Oxford, University Press. ISBN: 978-0-19-959175-6.

Algunas obras más técnicas (y otro gran clásico)

El desarrollo del ARS se ha basado, por una parte (gracias, Linton) en la teoría matemática de grafos y, por otra, en técnicas y herramientas de visualización de información y datos que refuerzan su carácter exploratorio. Del primer grupo de obras me permito seleccionar cuatro. La primera es obra de dos matemáticos indios. Dos años después de la publicación de la primera edición, en 2000,  se produjo el fallecimiento de K Ranganathan, según parece de forma inesperada; pero su colega ha querido rendirle homenaje en esta segunda edición:

11. R. Balakrishnan y K. Ranganathan (2012): A Textbook of Graph Theory. 2dn edition. Springer New York. ISBN: 978-1-4614-4528-9.

Los capítulos de esta obra están muy centrados y, aunque la estructura de los textos es “demasiado matemática”, con una sucesión de definiciones con su base matemática apoyadas, eso sí, por gran cantidad de figuras y diagramas, me parece una obra recomendable para aquellos dispuestos a dedicarla el suficiente tiempo.
En 2005 apareció el libro “Network Analysis: Methodological Foundations”. Se trata de una obra editada, es decir, con capítulos aportados por autores diferentes. Del dedicado a los indicadores de centralidad he entresacado esta definición:

Let G = (V, E) be a weighted, directed or undirected multigraph and let X represent the set of vertices or edges of G, respectively. A real-valued function s is called a structural index if and only if the following condition is satisfied: ∀x ∈ X: G ≃ H =⇒ sG(x) = sH(φ(x)), where sG(x) denotes the value of s(x) in G.

Sólo para que se aprecie el nivel, algo más complejo que el de la obra que he mencionado anteriormente.

12. Brandes, U., & Erlebach, T. (Eds.). (2005). Network Analysis Methodological Foundations. Springer. ISBN: 978-3-540-24979-5

Las dos obras restantes están basadas en la aplicación de R y sus diversos módulos al ARS. La primera es un completo tratado sobre iGraph, un conjunto de rutinas para el análisis de grados simples y redes complejas, escrito en colaboración con su creador, Gabor Csardi:

13. Eric D Kolaczyk y Gabor Csardi (2014). Statistical Analysis of Network Data with R. New York, Springer. ISBN: 978-1-4939-0982-7

El segundo no sólo cubre iGraph sino otras aplicaciones, también en el entorno de R, que se aplican al ARS.

14. Douglas A. Luke (2015): A User’s Guide to Network Analysis in R. New York, Springer. ISBN: 978-3-319-23882-1.
Por último, en 2012  ha aparecido la segunda edición de lo que cabe definir como “el manual” de Pajek:

Pajek
15. Wouter de Nooy, Vladimir Batagelj y Andrej Orvar (2011). Exploratory Social Network Analysis with Pajek. 2nd edition. Cambridge, University Press. ISBN: 978-1-107-00238-8
Desde su aparición en Diciembre de 1996, este programa ha sido una de las herramientas de elección (junto con UCInet, quizá) para el análisis de redes. Y hay que reconocer que sigue en plena forma, a pesar de que cuenta con versión exclusivamente para el entorno Windows y de que su interface sigue haciéndome sentir… obtuso.

La visualización de grafos y redes
Los libros sobre visualización de información y exploración de redes sociales son muy numerosos. Además, mientras algunos son generales, otros (no sé si la mayoría) se dedican a aspectos más concretos, a áreas y tareas determinadas. Traigo aquí de nuevo a Linton Freeman porque  es fantástico su capítulo sobre visualización de redes sociales en la casi-enciclopedia Computational Complexity:
16. Freeman, L. C. (2012). Social Network Visualization, Methods of. En Robert A. Meyers (Ed.): Computational Complexity (pp. 2981-2998). Springer New York. ISBN:  978-1-4614-1800-9 (Online)
Dejando esa revisión aparte, me inclino a ser práctico, a acogerme al “learning by doing” y a recomendar tres obras sobre Gephi, el programa que prefiero para trazar redes (en mi caso bibliométricas). La primera es el artículo casi promocional que uno de sus creadores ha incluido en la Encyclopedia of Social Network Analysis and Mining:
17. Sébastien Heymann (2014): Gephi en Reda Alhajj y Jon Rokne (Eds) Encyclopedia of Social Network Analysis and Mining. Springer New York, pages 612-625. ISBN: 978-1-4614-6170-8 (Online)
De las otras dos, que son libros, he leído, he criticado y utilizo el recetario de Khokhar y no he leído (aunque no tardaré en hacerlo) el segundo libro que Ken Cherven dedica a este excelente programa:
18. Devangana Khokhar (2015): Gephi Cookbook. Birmingham, Packt publishing. ISBN 978-1-78398-740-5.
19. Cherven, K. (2015). Mastering Gephi Network Visualization. Birmingham: Packt Publishing Ltd. ISBN: 978-1-78398-734-4.

GephiCook
Hasta aquí mis recomendaciones. Como he indicado en el título de esta entrada, se trataba de comentar libros cuya utilidad reconozco. Existen también selecciones de artículos y una de ellas la ha comentado recientemente el colombiano Jorge Palacio (la recopilación que critica es de 2014):

Palacio Sañudo, J.E.(2015): 7 lecturas para iniciarse en el análisis de redes sociales. Una selección de REDES. Redes, 26(1): 220-226.

Finalmente, el director del Centro de Investigaciones Sociológicas, Félix Requena, publicó estos últimos años una colección de “de aportaciones que hacen referencia a los orígenes y las teorías que han dado lugar al paradigma del análisis de redes sociales, también llamado análisis estructural, así como algunas de sus múltiples aplicaciones”:
Félix Requena Santos (2012): Análisis de redes sociales: Orígenes, teorías y aplicaciones. Madrid, CIS. ISBN: 978-84-7476-347-8

¿ Suficientemente aburrido para vosotros ?