Analisis Infométrico PDF

Big Data− Análisis informétrico
de documentos indexados
en Scopus y Web of Science
Celso Martínez Musiño*
Artículo recibido: Resumen

9 de octubre de 2018
Artículo aceptado: El fenómeno Big Data es reciente, como lo demuestran
9 de abril de 2019 las escasas publicaciones sobre el tema, lo cual incen-
tiva esta investigación cuyos objetivos son compilar y
Artículo de investigación referenciar documentos académicos incluidos en las
bases de datos Scopus y Web of Science y analizar los
contenidos. El método empleado es la investigación
descriptiva, de primera aproximación, que consistió en
la búsqueda y recuperación de información en Scopus y
Web of Science en el periodo 2008-2018. Se analizaron
39 documentos, los cuales corresponden a 70 autores
distribuidos en 14 títulos de revistas científicas, cu-
yo tipo de contribución se distribuye en 19 artículos,
10 comentarios, seis cartas al editor y cuatro reseñas.
* Dokumenta Consultoría e Integraciones, México cmartinez@colmex.mx
INVESTIGACIÓN BIBLIOTECOLÓGICA, vol. 34, núm. 82, enero/marzo, 2020, México, ISSN:

2448-8321 pp. 87-102 87
INVESTIGACIÓN BIBLIOTECOLÓGICA, vol. 34, núm. 82, enero/marzo, 2020, México, ISSN: 2448-8321, pp. 87-102 Otro de los resultados relevantes es que hay una alta
concentración de publicaciones en Science y Nature.
Los fenómenos Big Data y la CI son de reciente cuño
y se encuentran en redefiniciones y conformaciones de
dominios de estudios constantes. Encontramos un in-
terés por las investigaciones Big Data; por otra parte,
después de un análisis conceptual, proponemos una
definición de Big Data.
Palabras clave: Big Data; Scopus; Web of Science;

Informetría
Big Data Informetric Analysis of Documents Indexed in

Scopus and Web of Science
Celso Martínez Musiño
Abstract
The Big Data phenomenon is recent, as shown by the

scarce publications over this matter, a fact which in-
centives this research whose objective is to compile
and make reference to academic documents included
in the data bases Scopus and Web of Science, as well as
to analyze its contents. The method used was the de-
scriptive research of first approach, which consisted in
the search and retrieval of information in Scopus and
Web of Science during the period 2008-2018. 39 of the
analyzed documents, corresponds to 70 authors dis-
tributed in 14 titles of scientific journals, whose type of
contribution is allocated in 19 articles, 10 comments,
6 letters to the editor and 4 reviews. Another relevant
result is that there exists a high concentration of pub-
lications in Science and Nature. Big Data and IC phe-
nomena have been recently introduced and are found
in redefinitions and conformations of constant study
domains. We found an interest in Big Data research,
yet on the other hand, after a conceptual analysis, we
propose the definition of Big Data.
Keywords: Big Data; Scopus; Web of Science; Informetrics
88
BIG DATA-ANÁLISIS INFORMÉTRICO DE DOCUMENTOS INDEXADOS...
Introducción
DOI: http://dx.doi.org/10.22201/iibi.24488321xe.2020.82.58035
E l fenómeno del exceso de información no es reciente, pues se publicó
una gran producción de documentos impresos cuando se rediseñó la
imprenta con tipos móviles, y mucho mayor número de licencias papales se
distribuyeron, lo que terminó la concentración del poder eclesial y se desa-
rrollaron otras formas de expresión religiosa. Posteriormente, con la indus-
trialización y la concentración de la población en las ciudades, los habitantes
alfabetizados requerían de datos e información expresados en los diarios, e
incluso periódicos de doble tiraje (matutinos y vespertinos). Recientemen-
te, debido a las dos grandes guerras, la ciencia y la tecnología catapultaron
la medición y publicación de resultados de investigación, tanto en boletines,
revistas (magazines) y journals, principalmente en formatos impresos, origi-
nando así una “explosión de información”.
La fácil edición y distribución de documentos electrónicos, aunado al de-
sarrollo y comercialización de la computadora personal, detonaron en la se-
gunda mitad del siglo XX el fenómeno denominado “sociedad de la informa-
ción”, que se distingue de las otras formas de producción (primitiva, agrícola
e industrial) tanto por la generación de información (documental) como por
su distribución masiva, a través de internet, mediante computadoras o dispo-
sitivos móviles. Esto la convierte, además, en una fuente de ingresos por la
comercialización de equipo y sus aditamentos, software y aquellos servicios
de administración y mantenimiento de sistemas automatizados, transfor-
mando las relaciones económicas y las interacciones sociales y culturales casi
a nivel global.
El mundo globalizado, el fenómeno de la sociedad de la información en
transición hacia las sociedades del conocimiento, la facilidad en el acceso a
dispositivos móviles y la disponibilidad de programas o aplicaciones para pu-
blicar documentos en distintos formatos (texto, imágenes, sonido, video o la
combinación de estos elementos) son el caldo de cultivo para la generación
masiva de datos. A la masificación en la producción de datos se le ha denomi-
nado Big Data, término que no sólo se circunscribe a la generación de volúme-
nes de datos, sino que desde principios del siglo XXI casi todas las áreas del
conocimiento han empleado tiempo, espacio y dedicación para su estudio.
No obstante la facilidad para publicar y distribuir la información en in-
ternet, encontramos los siguientes problemas: a) difícil acceso a las bases de
datos especializadas, con excepción de las unidades instituciones de educa-
ción superior; b) proliferación de fuentes de información y oferta de cursos
de capacitación de dudoso origen o calidad; c) preponderancia de la lengua
inglesa para la comunicación científica; d) proliferación de noticias falsas
89
INVESTIGACIÓN BIBLIOTECOLÓGICA, vol. 34, núm. 82, enero/marzo, 2020, México, ISSN: 2448-8321, pp. 87-102
(fake news), fenómeno que puede alcanzar, afectar o interferir la comunica-
ción científica, y e) escasa o nula cantidad de estudios acerca de la temática
de nuestra investigación. Nos proponemos como objetivos de este trabajo
compilar y referenciar documentos académicos incluidos en las bases de da-
tos Scopus y Web of Science con el fin de analizar los contenidos (títulos de
documentos y temáticamente) y cuantificar los resultados obtenidos.
La ciencia de la información, Big Data e informetría
La ciencia de la información y su objeto de estudio

La investigación se circunscribe a los parámetros de la ciencia de la informa-
ción (CI), área del conocimiento que se dedica al estudio del fenómeno de la
información, es decir, la forma cómo ésta se produce, manifiesta, distribuye
y utiliza. Sólo por mencionar una definición de información a partir de la CI,
Faibisoff y Ely (1976) señalan que, además de contener datos, la información
se encuentra constituida por ideas, símbolos o un conjunto de símbolos con
un significado potencial. A partir de esta conceptualización encontramos la
vinculación y la justificación de nuestra investigación, donde se observa que
los datos son componente esencial de la información, y ésta a su vez objeto de
análisis de la CI.
Big Data y sus características

Como fenómeno reciente del siglo XXI, para fines de nuestro estudio rescatamos
algunas referencias conceptuales de Big Data de los mismos documentos recu-
perados tanto en la base de datos Scopus como de Web of Science. La mayoría de
las definiciones se centran en el tamaño de los datos almacenados (Russom y Big
Data Analytics, 2011: 6; Ward y Barker, 2013), o bien, las perspectivas particula-
res como las finanzas o las áreas de servicios, donde Big Data “se refiere al creci-
miento de los datos y cómo se usa para optimizar los procesos comerciales, crear
valor para el cliente y mitigar los riesgos” (Desouza, 2014: 10).
El tamaño de los datos es importante, pero hay otros atributos; si se aña-
den, además del volumen, la variedad y la velocidad entonces se constituye
una definición integral (Russom y Big Data Analytics, 2011: 6) o casi total.
Desouza (2014: 11) añade a las características mencionadas la viscosidad (mi-
de la resistencia al flujo de datos), la variabilidad (calcula la tasa de cambio
de flujo), la veracidad (cuenta los sesgos, el ruido, la anormalidad, etc.) y la
volatilidad (indica por cuánto tiempo son válidos los datos y tiempo de alma-
90 cenamiento).
La informetría para el análisis de contenidos textuales
Los estudios informétricos expresan una nueva forma de análisis de la CI para
el estudio científico de los flujos de información (Wormell, 1998: 211); nosotros
añadiríamos, también, el análisis de los datos en tanto que éstos son el compo-
nente principal para conformar la información. Así, el término informetría se
propuso “para designar el conjunto de las actividades métricas relativas a la in-
formación, cubriendo tanto la bibliometría y la cientometría” (Egge y Rousseau,
en Santos y Kobashi, 2009: 159). En la actualidad la informetría ha extendido
su utilización a los estudios métricos en la web (webmetrics).
El término informetría en sí mismo “abarca el estudio de los aspectos
cuantitativos de la información, independientemente de la forma en que
aparezca registrada y del modo en que se genere” (Tague-Sutcliffe, 1994; Al-
mind e Ingwersen, 1997: 405). Por otra parte, de acuerdo a su objeto de es-
tudio, la información, es aplicable al análisis de variados aspectos tales como
características de la productividad de autores, el análisis de citas, el uso de la
información a partir de su demanda y uso, la obsolescencia de la literatura.
Para fines de nuestro estudio justificamos y nos adherimos al concepto en
tanto que “La informetría es el estudio de los aspectos cuantitativos de la
información en cualquier forma […]” (Macías-Chapula, 2001: 36). De la in-
formación seleccionamos a la información escrita, y de ésta, particularmente
las palabras.
Método
Empleamos la investigación descriptiva, de primera aproximación, cuyo pro-

cedimiento fue la búsqueda y recuperación de información en las bases de
datos Scopus y Web of Science, el sustento se encontró en la ciencia de la in-
formación mediante la informetría. La configuración de búsqueda se ejecutó
con los términos “big” and “data” en el campo Título de las bases menciona-
das, el periodo de búsqueda fue de enero de 2007 a marzo de 2018. Posterior
a la selección de los documentos se procedió al análisis, para lo cual usamos
el programa Adobe Acrobat Pro DC para la extracción de los textos, el pro-
grama Microsoft Word para la depuración de los textos y Voyant-tools para
el estudio cuantitativo. Enseguida nos dedicamos a la redacción de los resul-
tados, la discusión y las conclusiones. No se incluyen en el estudio documen-
tos indexados, pero no son cartas, artículos o reseñas sino presentaciones
con diapositivas, producto de discusiones o conferencias (webinars).
91
Resultados
Para el periodo seleccionado, la cantidad de documentos recuperados y ana-

lizados fue 39, los cuales corresponden a 70 autores presentes en 14 títulos
de revistas científicas, distribuidos de la siguiente manera: Science (18), Na-
ture (8), Neuroscience (2), Advances in Astronomy (1), Computing in Science
& Engineering (1), ECONTENT (1), Information Fusion (1), Light: Science &
Applications (1), Journal of Big Data (1), Nature biotechnology (1), Scientific
Reports (1), Scientific American (1), Science translational medicine (1) y Review
of Policy Research (1). Por tipo de contribución tenemos 19 artículos, 10 co-
mentarios, seis cartas al editor y cuatro reseñas (Anexo).
Artículos
En el periodo estudiado se localizaron 19 artículos, de los cuales seis son de au-
toría individual: Susan Athey (2017); Atul J. Butte, (2017); Yves Frégnac (2017);
Johannes Söding (2017); Jacques Bughin (2016); Nicholas B. Turk-Browne
(2013). Los 13 artículos restantes son multiautorales, en los cuales la cantidad
de autores fluctúa entre dos y cinco elementos con la peculiaridad de que nin-
gún individuo repite responsabilidad autoral. Los artículos localizados corres-
ponden a 11 títulos de journals distribuidos de la siguiente manera: Science (8),
Nature neuroscience (2), Advances in Astronomy (1), Computing in Science &
Engineering (1), Information Fusion (1), Journal of Big Data (1), Light: Science &
Applications (1), Nature biotechnology (1), Review of Policy Research (1), Science
translational medicine (1) y Scientific Reports (1). Como se puede observar, casi
la mitad de los artículos se concentran en la publicación Science, los demás do-
cumentos se distribuyen equitativamente en los demás journals.
Ahora bien, si ordenamos y relacionamos cronológicamente, desde el más
reciente, los artículos con sus respectivos autores, en primer lugar encontra-
mos a Sergio Ramírez-Gallego, Alberto Fernández, Salvador García, Min
Chen y Francisco Herrera (2018), les siguen Susan Athey (2017), Atul J. Butte
(2017), Yves Frégnac (2017), Johannes Söding (2017), Jacques Bughin (2016),
Matthew S. Lebo, Sutti Sheila y Robert C. Green (2016), Nataša Pržulj y Noël
Malod-Dognin (2016), Periklis Papakonstantinou, David P. Woodruff y Guang
Yang (2016), Julian Borrill, Reijo Keskitalo y Theodore Kisner (2015), Liran Ei-
nav y Jonathan Levin (2014), Adam R. Ferguson, Jessica L. Nielson, Melissa H.
Cragin, Anita E. Bandrowski y Maryann E. Martone (2014), Min Gu, Xiang-
ping Li y Yaoyu Cao (2014), Connie L. McNeely y Jong‐on Hahm (2014), Muin
J. Khoury y John P. A. Ioannidis (2014), David Lazer, Ryan Kennedy, Gary King
92 y Alessandro Vespignani (2014a), Jeff W. Lichtman, Hanspeter Pfister y Nir
Shavit (2014), Nicholas B. Turk-Browne (2013), y Meyer Z. Pesenson, Isaac Z.
Pesenson y Bruce McCollum (2010). En el rubro de la distribución de autores
verificamos que ninguno repite autoría; la mitad de las publicaciones se registra-
ron en el periodo 2015 y lo que va de 2018 al momento de ejecutar la búsqueda y
recuperación de la información.
La suma de palabras de los títulos de los 19 artículos muestra un total de
174 palabras, pero si omitimos los artículos, los verbos, los pronombres y los
nexos o preposiciones, y contando únicamente los sustantivos, adjetivos y ad-
verbios, tenemos como resultado 114 unidades lingüísticas (palabras); si con-
sideramos que algunas se repiten, contabilizamos únicamente 59 palabras,
de las cuales big y data son las que aparecen con más frecuencia y suman 45
menciones, de allí el resto de los términos sólo contabilizan una o dos apari-
ciones (Anexo).
Comentarios
Este tipo de documentos no son una editorial, artículos o reseñas de libros,
se trata de mensajes breves de especialistas que usualmente tratan la temática
del número o volumen correspondiente a la revista académica en la que se
incluyen. De este tipo de contribución encontramos 10 títulos: “Big Data, big
picture: Metabolomics meets systems biology” (May, 2017); “The State of Big
Data” (Kho, 2016); “Big Data: The power of petabytes” (Eisenstein, 2015);
“Dealing with Big Data” (Osborne, 2015); “Big Data stalking. Data brokers
cannot be trusted to regulate themselves” (Crawford, 2014); “Life science te-
chnologies: Big biological impacts from Big Data” (May, 2014); “The human
face of Big Data” (Smolan, 2013); “Saving Big Data from Itself” (Pentland,
2014); “Big Data: Distilling meaning from data” (Frankel y Reid, 2008), y
“Big Data: Data wrangling” (Goldston, 2008). En esta relación de autores
comentaristas, a diferencia de los artículos, Mike May repite con dos docu-
mentos: “Big Data, big picture: Metabolomics meets systems biology” (2017)
y “Life science technologies: Big biological impacts from Big Data” (2014);
ambos se publicaron en Science.
De los 10 títulos encontrados, omitiendo los artículos, preposiciones y ver-
bos, tenemos 26 palabras con 47 menciones (Anexo), entre las que predominan
Big y Data; el resto de las palabras sólo reciben una mención. Por otra parte, y a
diferencia de los artículos, donde encontrábamos mayormente los títulos de las
revistas científicas Nature y Science, en los comentarios hay más variedad, así
podemos mencionar ECONTENT y Scientific American donde publicaron Nan-
cy Davis Kho (2016) y Kate Crawford (2014), respectivamente.
93
Cartas al editor
Las cartas al editor son participaciones, generalmente cortas, en las cuales se
hacen aclaraciones, sugerencias o crítica a documentos ya publicados ante-
riormente. De este tipo de contribuciones encontramos seis cartas, escritas
por Isaac Chun-Hai Fung, Zion Tsz Ho Tse y King-Wa Fu (2015); David An-
dre Broniatowski, Michael J. Paul y Mark Dredze, (2014); David Lazer, Ryan
Kennedy, Gary King y Alessandro Vespignani (2014b); Ben Shneiderman
(2014); Hubert Gijzen (2013), y Bernardo A. Huberman (2012). Estos auto-
res publicaron en Science (Fung, Tse y Fu, 2015; Broniatowski, Paul y Dre-
dze, 2014; Lazer et al., 2014b; Shneiderman, 2014) y Nature (Gijzen, 2013;
Huberman, 2012). De esta relación de autores, David Lazer, Ryan Kennedy,
Gary King y Alessandro Vespignani (2014a) han publicado el artículo “The
parable of Google Flu: traps in Dig Data analysis” también en Science. Si
compilamos sólo los títulos de las cartas al editor, al igual que en los artículos
y los comentarios, si omitimos artículos, verbos, pronombres y nexos, dejan-
do únicamente los sustantivos, adjetivos y adverbios, tenemos 31 palabras;
si consideramos que varias de éstas se repiten, contabilizamos solamente 18
palabras (Anexo).
Reseñas de libros
La menor cantidad de documentos recuperados con el registro Big Data en el
título fueron cuatro reseñas de libros: “Big Data meets human health” (Fa-
rrington, 2016); “Big Data: The revolution is digitized” (Seife, 2015); “Big
Data: Stealth control” (Aftergood, 2015), y “The Big Data debate” (Cate,
2014). El primer documento hace referencia a dos libros: Self-Tracking (Neft
y Nafus, 2016) y Crowdsourced Health How What You Do on the Internet Will
Improve Medicine (Yom-Tov, 2016); las reseñas de Charles Seife (2015) son
también de dos títulos: Big Data, Little Data, No Data: Scholarship in the Ne-
tworked World (Borgman, 2015) y Data-ism: The Revolution Transforming
Decision Making, Consumer Behavior and Almost Everything Else (Lohr,
2015). Por su parte, Steven Aftergood (2015) reseña el libro The Black Box
Society: The Secret Algorithms That Control Money and Information (Pasqua-
le, 2015). Finalmente, Fred H. Cate (2014) alude al libro Privacy, Big Data,
and the Public Good Frameworks for Engagement (Lane et al., 2014) (Tabla 1).
94
Títulos de artículos Libros referenciados
“Big Data meets human health” Self-Tracking

Crowdsourced Health How What You Do on the
Internet Will Improve Medicine
“Big Data: The revolution is digitized” Big Data, Little Data, No Data: Scholarship in the
Networked World
Data-ism: The Revolution Transforming Deci-
sion Making, Consumer Behavior and Almost
Everything Else
“Big Data: Stealth control” The Black Box Society: The Secret Algorithms
That Control Money and Information
“The Big Data debate” Privacy, Big Data, and the Public Good Fra-
meworks for Engagement
Tabla 1. Reseñas de libros

Fuente: elaboración propia
La Tabla 1 muestra que los títulos de libros referenciados no necesariamente

contienen el binomio Big Data y la cantidad de palabras en los títulos de los
libros no sólo es mayor, sino que es más diversa que aquellas palabras en los
títulos de los artículos. Si sumamos las palabras de los títulos y de las reseñas
de libros y les damos el mismo tratamiento que a los artículos, los comenta-
rios y las cartas al editor, tenemos como resultado 10 palabras con 16 mencio-
nes, de las cuales una tercera parte corresponde a la dupla Big Data, en tanto
que en las dos terceras parte restantes sólo se mencionan en una ocasión.
El resultado es contundente, en la medida en que la configuración de la
búsqueda fue Big Data la consecuencia natural es que en todos los tipos de
documentos se reflejan esos términos. En lo que se debe puntualizar, enton-
ces, es en la presencia o ausencia temática para encontrar oportunidades in-
vestigativas. Así, es interesante descubrir que existe una revista cuyo título
es precisamente Journal of Big Data en la cual se puede encontrar un destino
para la generación de nuevos conocimientos. Por otra parte, respecto a la alta
concentración de publicaciones en Science y Nature, es posible afirmar que
estas revistas científicas se mantienen en la punta porque incluyen temas no-
vedosos y actuales. Por otro lado, si en los títulos cuyas inclusiones de algún
tipo de contribución (artículo, comentario, cartas al editor o reseña) se in-
cluyen cantidades mínimas, entonces, esos títulos puedan ser, también, un
destino para contribuciones (Advances in Astronomy, Computing in Science &
Engineering, ECONTENT, Information Fusion, Light: Science & Applications,
Nature biotechnology, Review of Policy Research, Science translational medici-
ne, Scientific American y Scientific Reports).
95
Desde el punto de vista de los buscadores y las redes sociales, Google sólo
ha sido mencionado por David Lazer, Ryan Kennedy, Gary King y Alessan-
dro Vespignani (2014a) en el documento “The parable of Google Flu: traps
in Big Data analysis” en la revista Science. Por otra parte, Twitter sólo ha sido
atendido en el artículo “Twitter: Big Data opportunities” por David Andre
Broniatowski, Michael J. Paul y Mark Dredze (2014) en Science y en la sec-
ción de cartas al editor repiten los autores Lazer et al., (2014b) con “Twitter:
Big Data opportunities—response” en el mismo título del journal el mismo
año. Contrariamente, no se reflejan estudios en las bases de datos científicas
(Scopus y Web of Science) acerca de Whatsapp, Facebook o Instagram que
son ausencias notorias dada su alta participación en la creación, la edición, la
reedición o la distribución de contenidos.
Discusión
Desde el punto de vista conceptual, tanto Big Data como CI son de reciente
cuño y se encuentran en redefinición constante. Por un lado, Muin J. Khoury
y John P. A. Ioannidis (2014: 1054) se expresan respecto a la dupla Big Data
como el concepto, donde los datos pueden ser vinculados con la información.
Desde el enfoque de la CI, los datos son los elementos clave para la conforma-
ción de la información después de un proceso de análisis. En la búsqueda de
una definición de Big Data y de CI podemos afirmar que, en ambos casos, se
encuentran en proceso de reconformación de sus dominios o campos de es-
tudios (Elankavi, Kalaiprasath y Udayakumar, 2017: 560). Observamos, ade-
más, que los datos son unidades mínimas que crecen exponencialmente y son
vehículo para conformar la información, en consecuencia, el fenómeno Big
Data es sujeto de análisis por la CI y sus herramientas, como la informetría o la
cientometría (Egge y Rousseau, en Santos y Kobashi, 2009: 159), entre otras.
Entonces, una vez examinadas las propuestas conceptuales, por Big Data re-
planteamos y proponemos la siguiente definición: el fenómeno de generación
masiva y constante de datos, cuyo tratamiento y organización requieren tanto de
recursos tecnológicos como de programas especializados de computadora y herra-
mientas de interpretación y análisis para lograr la cientificidad.
De acuerdo con los resultados obtenidos es posible, para futuras inves-
tigaciones, profundizar en el análisis interno de cada documento recupera-
do para encontrar la densidad del vocabulario o el análisis del discurso. En
otro orden, con la misma relación de artículos, comentarios, cartas al editor
y reseñas, proponemos indagar el factor de impacto o identificar la calidad
de las revistas científicas, o bien, plantear los cuestionamientos siguientes:
96
¿tiene o debe tener la misma validez una reseña, los comentarios o las cartas
al editor que los artículos científicos? Continuando con las derivaciones de
esta investigación, se hallaron fortalezas y debilidades. Por ejemplo, hay una
concentración de documentos recuperados en Science y Nature que el Journal
Citation Report categoriza como publicaciones multidisciplinarias. En este
rubro multitemático, aunque con menor de cantidad de escritos que Science y
Nature, identificamos las revistas Scientific Reports y Scientific American, y en
un sentido interdisciplinar, también con escasos artículos, podemos mencio-
nar los journals Big Data, Computing in Science & Engineering e Information
Fusion, en los cuales se circunscriben varios temas: ciencia, teoría y métodos
computacionales o aplicaciones interdisciplinarias, o la inteligencia artificial.
Por otra parte, encontramos títulos de revistas académicas con tópicos
muy especializados que tratan temas como neurociencias, biotecnología o
microbiología aplicada (Nature biotechnology), biología celular o medicina
(Science Translational Medicine), óptica (Light-Science & Applications), as-
tronomía o astrofísica (Advances in Astronomy), ciencia política o adminis-
tración pública (Review of Policy Research), ciencia bibliotecaria y de la in-
formación (ECONTENT). Además, al localizar sólo un artículo de economía,
pueden sugerirse, para posteriores investigaciones, estudios cuantitativos o
bien la compilación y aplicación de herramientas para la extracción de ma-
crodatos y sus respectivos análisis e interpretación, por ejemplo, la econome-
tría (Varian, 2014: 5), o la combinación e integración de diferentes utensilios
y modelos como sugieren Kambatla et al. (2014: 2568), lo cual puede redun-
dar en nuevas oportunidades y retos (Tabares y Hernández, 2014: 1).
La CI y estudios de Big Data identifican, respectivamente, a la informa-
ción y los datos como elementos u objetos de estudio, pero hay voces, como
las de Silvia Martínez-Martínez y Pablo Lara-Navarra (2014), que sugieren
analizar los medios sociales, con lo cual estamos de acuerdo. Finalmente,
podemos formular otras propuestas investigativas y cuestionamientos. En
primer lugar, proponemos considerar la demografía y plantear las relaciones
intergeneracionales, la migración o los estudios de género, por mencionar al-
gunos subtemas; en segundo término, podemos formular las siguientes pre-
guntas: ¿cuál es el documento científico más citado?, ¿cuál será el porvenir
y por cuánto tiempo se seguirá investigando el fenómeno Big Data? ¿Dicha
dupla se consolidará como ciencia de los datos o sólo es una moda pasajera?
¿Se establecerá una confrontación, desplazamiento o complemento, tanto de
la CI y la ciencia de los datos?
97
Conclusiones
Los objetivos de compilar y referenciar documentos académicos incluidos en

las bases de datos Scopus y Web of Science y analizar los contenidos (títulos
de documentos y temáticamente) se han cumplido. Podemos entonces con-
cluir lo siguiente: Big Data es un fenómeno reciente, la publicación y la in-
clusión de documentos de distinto tipo (artículos, cartas al editor y reseñas
de libros) indexados en bases de datos de alto impacto destinadas para las
comunidades científicas demuestran que hay interés por la temática de esta
investigación.
Los tópicos analizados muestran que hay una intersección de la temática
Big Data con otras materias, en un grado mayor se opta por aquellas revistas
académicas del tipo multi o interdisciplinar, y en mucho menor medida se
eligen las publicaciones de carácter especializado, por ejemplo, las ciencias
computacionales, la economía, la astronomía, la astrofísica y la óptica, por
mencionar algunas. La diferenciación, la concentración de ciertas publica-
ciones o la ausencia de publicaciones en journals especializados nos permiten
valorar los vacíos y por lo tanto detectar las oportunidades investigativas o
destinos para publicar.
Los hallazgos encontrados nos muestran que el idioma inglés y la revista
científica son los vehículos de la comunicación científica. La inclusión, la cla-
sificación para la asignación de puntajes (factor de impacto) de variadas sec-
ciones en este tipo de publicaciones pueden abrir un debate, no es la misma
inversión en un artículo que una reseña de libros. Otro dilema puede presen-
tarse en relación al acceso a las bases de datos, aquellas de tipo cerrado con
otras de acceso abierto.
Referencias
Aftergood, Steven. 2015. “Big Data: Stealth control”. Nature 517 (7535): 435.
Almind, Tomas C. y Peter Ingwersen. 1997. “Informetric analyses on the world wide
web: methodological approaches to ‘webometrics’”. Journal of documentation 53
(4): 404-426.
Athey, Susan. 2017.“Beyond prediction: Using Big Data for policy problems”. Science
355 (6324): 483-485.
Borgman, Christine L. 2015. Big Data, Little Data, No Data: Scholarship in the Ne-
tworked World. Cambdridge, MA; London, England: MIT Press.
Borrill, Julian, Reijo Keskitalo y Theodore Kisner. 2015. “Big bang, big data, big
iron: fifteen years of cosmic microwave background data analysis at NERSC”.
Computing in Science & Engineering 17 (3): 22-29.
98
Broniatowski, David Andre, Michael J. Paul y Mark Dredze. 2014. “Twitter: Big Data
opportunities”. Science 345 (6193): 148-148.
Bughin, Jacques. 2016. “Big Data, Big bang?” Journal of Big Data 3 (1): 2.
Butte, Atul J. 2017. “Big Data opens a window onto wellness”. Nature biotechnology
35 (8): 720.
Cate, Fred H. 2014. “The Big Data debate”. Science 346 (6211): 818.
Crawford, Kate. 2014. “Big Data stalking. Data brokers cannot be trusted to regulate
themselves”. Scientific American 310 (4): 14-14.
Desouza, Kevin. 2014. Realizing the promise of Big Data. Washington, DC: IBM Cen-
ter for the Business of Government.
Einav, Liran y Jonathan Levin. 2014. “Economics in the age of Big Data”. Science 346
(6210): 1243089.
Eisenstein, Michael. 2015. “Big Data: The power of petabytes”. Nature 527 (7576): S2.
Elankavi, R., R. Kalaiprasath y R. Udayakumar. 2017. “Data Mining with Big Data
Revolution Hybrid”. International Journal on Smart Sensing & Intelligent Systems
10: 560-573.
Faibisoff, Sylvia G. y Donald P. Ely. 1976. “Information and information needs”.
Information Reports and Bibliographies 5 (5): 2-16.
Farrington, Conor. 2016. “Big Data meets human health”. Science 353 (6296): 227.
Ferguson, Adam R., Jessica L. Nielson, Melissa H. Cragin, Anita E. Bandrowski y
Maryann E. Martone. 2014. “Big Data from small data: data-sharing in the’long
tail’of neuroscience”. Nature neuroscience 17 (11): 1442.
Frankel, Felice y Rosalind Reid. 2008. “Big Data: Distilling meaning from data”. Nature
455 (7209): 30.
Frégnac, Yves. 2017. “Big Data and the industrialization of neuroscience: A safe
roadmap for understanding the brain?” Science 358 (6362): 470-477.
Fung, Isaac Chun-Hai, Zion Tsz Ho Tse y King-Wa Fu. 2015. “Converting Big Data
into public health”. Science 347 (6222): 620-620.
Gijzen, Hubert. 2013. “Development: Big Data for a sustainable future”. Nature 502
(7469): 38.
Goldston, David. 2008. “Big Data: Data wrangling”. Nature News 455 (7209): 15-15.
Gu, Min, Xiangping Li y Yaoyu Cao. 2014. “Optical storage arrays: a perspective for
future Big Data storage”. Light: Science & Applications 3 (5): e177.
Huberman, Bernardo A. 2012. “Sociology of science: Big Data deserve a bigger au-
dience”. Nature 482 (7385): 308.
Kambatla, Karthik, Giorgos Kollias, Vipin Kumar y Ananth Grama. 2014. “Trends
in big data analytics”. Journal of Parallel and Distributed Computing 74 (7): 2561-
2573.
Kho, Nancy Davis. 2016. “The State of Big Data”. ECONTENT 39 (1): 28-29.
Khoury, Muin J. y John P.A. Ioannidis. 2014. “Big Data meets public health”. Science
346 (6213): 1054-1055.
Lane, Julia, Victoria Stodden, Stefan Bender y Helen Nissenbaum, eds. 2014. Priva-
cy, Big Data, and the Public Good Frameworks for Engagement. Cambridge, MA:
Cambridge University Press.
Lazer, David, Ryan Kennedy, Gary King y Alessandro Vespignani. 2014a. “The para-
ble of Google Flu: traps in Big Data analysis”. Science 343 (6176): 1203-1205.
99
Lazer, David, Ryan Kennedy, Gary King y Alessandro Vespignani. 2014b. “Twitter:
Big Data opportunities—response”. Science 345 (6193): 148-149.
Lebo, Matthew S., Sheila Sutti y Robert C. Green. 2016. “Big Data gets personal”.
Science Translational Medicine 8 (322): 322fs3-322fs3.
Lichtman, Jeff W., Hanspeter Pfister y Nir Shavit. 2014. “The Big Data challenges of
connectomics”. Nature Neuroscience 17 (11): 1448.
Lohr, Steve. 2015. Data-ism: The Revolution Transforming Decision Making, Consu-
mer Behavior and Almost Everything Else. New York, NY: Harper Business.
Macías-Chapula, César A. 2001. “Papel de la informetría y de la cienciometría y su
perspectiva nacional e internacional”. Acimed 9: 35-41.
Martínez-Martínez, Silvia y Pablo Lara-Navarra. 2014. “El Big Data transforma la inter-
pretación de los medios sociales”. El Profesional de la Información 23 (6): 575-581.
May, Mike. 2014. “Life science technologies: Big biological impacts from Big Data”.
Science 344 (6189): 1298-1300.
May, Mike. 2017. “Big Data, big picture: Metabolomics meets systems biology”.
Science 356 (6338): 646-648.
McNeely, Connie L. y Jong‐on Hahm. 2014. “The Big (Data) bang: Policy, prospects,
and challenges”. Review of Policy Research 31 (4): 304-310.
Neft, Gina y Dawn Nafus. 2016. Self-Tracking. Cambridge, MA: MIT Press.
Osborne, Ian S. 2015. “Dealing with Big Data”. Science 349 (6247): 491-492.
Papakonstantinou, Periklis A., David P. Woodruff y Guang Yang. 2016. “True Ran-
domness from Big Data”. Scientific Reports 6: 33740.
Pasquale, Frank. 2015. The Black Box Society: The Secret Algorithms That Control Money
and Information. Cambridge, MA; London, England: Harvard University Press.
Pentland, Alex. 2014. “Saving Big Data from Itself”. Nature 314 (2): 64-67.
Pesenson, Meyer Z., Isaac Z. Pesenson y Bruce McCollum. 2010. “The data big bang
and the expanding digital universe: High-dimensional, complex and massive da-
ta sets in an inflationary epoch”. Advances in Astronomy, Article ID 350891, 1-16.
Pržulj, Nataša y Noël Malod-Dognin. 2016. “Network analytics in the age of Big Da-
ta”. Science 353 (6295): 123-124.
Ramírez-Gallego, Sergio, Alberto Fernández, Salvador García, Min Chen y Francis-
co Herrera. 2018. “Big Data: Tutorial and guidelines on information and process
fusion for analytics algorithms with MapReduce”. Information Fusion 42: 51-61.
Russom, Philip y Big Data Analytics. 2011. TDWI best practices report. Fourth Quarter
19 (4): 1-34.
Santos, Raimundo Nonato Macedo dos y Nair Yumiko Kobashi. 2009. “Bibliome-
tria, cientometria, infometria: conceitos e aplicações”. Pesquisa Brasileira em
Ciência da Informação (Brasília) 2 (1): 155-172.
Seife, Charles. 2015. “Big Data: The revolution is digitized”. Nature 518 (7540): 480.
Shneiderman, Ben. 2014. “The big picture for Big Data: Visualization”. Science 343
(6172): 730-730.
Smolan, Rick. 2013. “The human face of Big Data”. Science 351 (6274): 673.
Söding, Johannes. 2017. “Big-Data approaches to protein structure prediction”.
Science 355 (6322): 248-249.
Tabares, Luis F. y Jhonatan. F. Hernández. 2014. Big Data Analytics: Oportunidades,
Retos y Tendencias.
https://www.academia.edu/15043636/Big_Data_Analytics_Oportunidades_
Retos_y_Tendencias
100
Tague-Sutcliffe, Jean. 1994. “Introducción a la informetría”. Acimed 2 (3): 26-35.
Turk-Browne, Nicholas B. 2013. “Functional interactions as Big Data in the human
brain”. Science 342 (6158): 580-584.
Varian, Hal R. 2014. “Big data: New tricks for econometrics”. Journal of Economic
Perspectives 28 (2): 3-28.
Ward, Jonathan S. y Adam Barker. 2013. “Undefined by data: a survey of big data de-
finitions”. Preprint, presentado el 20 de septiembre de 2013.
https://arxiv.org/abs/1309.5821
Wormell, Irene. 1998. “Informetria: explorando bases de dados como instrumentos
de análise”. Ciência da Informação 27 (2): 210-216.
Yom-Tov, Elad. 2016. Crowdsourced Health How What You Do on the Internet Will
Improve Medicine. Cambridge, MA; London, England: MIT Press.
Para citar este texto:

Martínez Musiño, Celso. 2020. “Big Data-Análisis informétrico de docu-
mentos indexados en Scopus y Web of Science”. Investigación Bibliotecoló-
gica: archivonomía, bibliotecología e información 34 (82): 87-102.
http://dx.doi.org/10.22201/iibi.24488321xe.2020.82.58035
101
102
Anexo
Palabras de tipo de documento y su frecuencia de aparición en los títulos

Analisis Infométrico PDF

Cargado por

Copyright:

Formatos disponibles

Analisis Infométrico PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis Infométrico PDF

Cargado por

Copyright:

Formatos disponibles

Big Data− Análisis informétrico

Celso Martínez Musiño*

Artículo recibido: Resumen

* Dokumenta Consultoría e Integraciones, México cmartinez@colmex.mx

INVESTIGACIÓN BIBLIOTECOLÓGICA, vol. 34, núm. 82, enero/marzo, 2020, México, ISSN:

Palabras clave: Big Data; Scopus; Web of Science;

Big Data Informetric Analysis of Documents Indexed in

The Big Data phenomenon is recent, as shown by the

Keywords: Big Data; Scopus; Web of Science; Informetrics

La ciencia de la información, Big Data e informetría

La ciencia de la información y su objeto de estudio

Big Data y sus características

Empleamos la investigación descriptiva, de primera aproximación, cuyo pro-

Para el periodo seleccionado, la cantidad de documentos recuperados y ana-

Shavit (2014), Nicholas B. Turk-Browne (2013), y Meyer Z. Pesenson, Isaac Z.

“Big Data meets human health” Self-Tracking

Tabla 1. Reseñas de libros

La Tabla 1 muestra que los títulos de libros referenciados no necesariamente

Los objetivos de compilar y referenciar documentos académicos incluidos en

Tague-Sutcliffe, Jean. 1994. “Introducción a la informetría”. Acimed 2 (3): 26-35.

Para citar este texto:

También podría gustarte