GeoAcademy: plataforma web y algoritmo para la detección automática y localización de coordenadas geográficas en artículos científicos

Autores/as

DOI:

https://doi.org/10.3989/redc.2023.4.1393

Palabras clave:

geolocalización automática, coordenadas geográficas, topónimos, algoritmo, artículos científicos, Scopus

Resumen


El siguiente estudio describe las cualidades y usos del proyecto GeoAcademy, un programa diseñado con el objetivo de geolocalizar artículos científicos automáticamente, dichos artículos se descargarían de bases de datos científicas generales como Scopus o Web of Science. Esta geolocalización se realiza sobre el contenido del documento, ya sea mediante la captura de posibles coordenadas geográficas que tenga el documento, o topónimos que puedan aparecer en el documento a través de un algoritmo creado a tal efecto. En la metodología explicamos los pasos que se han dado en este proyecto para crear una base de datos de muestra con artículos que tratan sobre Sierra Nevada (España) y la creación y diseño del algoritmo. Los resultados muestran los datos técnicos de la aplicación del algoritmo sobre la base de datos y su tasa de éxito, así como una descripción de la plataforma creada para visualizar gráficamente los documentos geolocalizados en un mapa web. Finalmente, en la discusión, definimos las dificultades encontradas, las posibles aplicaciones bibliométricas y su utilidad como herramienta de consulta y recuperación de información.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Acheson, E., & Purves, R. S. (2021). Extracting and modeling geographic information from scientific articles. PloS one, 16(1), e0244918. https://doi.org/10.1371/journal.pone.0244918 PMid:33406109 PMCid:PMC7787447

Bordogna, G., Ghisalberti, G., & Psaila, G. (2012). Geographic Information Retrieval: Modeling Uncertainty of User's Context. Fuzzy Sets and Systems, 196, 105-124. https://doi.org/10.1016/j.fss.2011.04.005

Bornmann, L., Leydesdorff, L., Walch-Solimena, C., & Ettl, C. (2011). Mapping excellence in the geography of science: An approach based on Scopus data. Journal of Informetrics, 5(4), 537-546. https://doi.org/10.1016/j.joi.2011.05.005

Bornmann, L., Mutz, R., Haunschild, R., Moya-Anegon, F., Clemente, M., & Stefaner, M. (2021). Mapping the impact of papers on various status groups in excellencemapping.net: a new release of the excellence mapping tool based on citation and reader scores. Scientometric, 126, 9305-9331. https://doi.org/10.1007/s11192-021-04141-4

Buscaldi, D., & Magnini, B. (2010). Grounding toponyms in an italian local news corpus. Proceedings of the 6th workshop on geographic information retrieval, 1-5. https://doi.org/10.1145/1722080.1722099

Cascón-Katchadourian, J., & Ruiz Rodríguez, A. Á. (2016). Descripción y valoración del software MapTiler: Del mapa escaneado a la capa interactiva publicada en la web. Profesional de la Información, 25(6), 970978. https://doi.org/10.3145/epi.2016.nov.13

Cascón-Katchadourian, J., López-Herrera, A. G., Ruiz-Rodríguez, A. Á., & Herrera-Viedma, E. (2019). Proyecto Histocarto: aplicación de SIGs (georreferenciación y geolocalización) para mejorar la recuperación de la documentación histórica gráfica. Profesional de la Información, 28(4). https://doi.org/10.3145/epi.2019.jul.16

Catini, R., Karamshuk, D., Penner, O., & Riccaboni, M. (2015). Identifying geographic clusters: A network analytic approach. Research policy, 44(9), 1749-1762. https://doi.org/10.1016/j.respol.2015.01.011

Clarivate. (2022). Incites. Available at: https://incites.clarivate.com/#/landing.

Cobo, M. J., López-Herrera, A. G., Herrera-Viedma, E., & Herrera, F. (2012). SciMAT: A new science mapping analysis software tool. Journal of the American Society for Information Science and Technology, 63(8), 1609-1630. https://doi.org/10.1002/asi.22688

Cortés-José, J. (2001). El documento cartográfico. In J. Jiménez-Pelayo, J. Monteagudo-López-Menchero, & F. J. Bonachera-Cano, La documentación cartográfica : Tratamiento, gestión y uso, 37-113. Huelva: Universidad de Huelva.

CWTS. (2022). CWTS Leiden Ranking 2022. Available at: https://www.leidenranking.com/.

D'Ignazio, C., Bhargava, R., Zuckerman, E., & Beck, L. (2014). Cliff-clavin: Determining geographic focus for news articles. DSpace@MIT. Available at: https://hdl.handle.net/1721.1/123451.

Dredze, M., Paul, M. J., Bergsma, S., & Tran, H. (2013). Carmen: A twitter geolocation system with applications to public health. Workshops at the twenty-seventh AAAI conference on artificial intelligence.

Instituto de Estadística y Cartografía de Andalucía. (2022). Toponimía-Nomenclátor. Available at: https://www.juntadeandalucia.es/institutodeestadisticaycartografia/prodCartografia/toponimia/index.htm#:~:text=El%20Nomencl%C3%A1tor%20Geogr%C3%A1fico%20de%20Andaluc%C3%ADa,%2C%20extractivas%2C%20servicios%20y%20equipamientos.

Fisher, R., Radford, B. T., Knowlton, N., Brainard, R. E., Michaelis, F. B., & Caley, M. J. (2011). Global mismatch between research effort and conservation needs of tropical coral reefs. Conservation Letters, 4(1), 64-72. https://doi.org/10.1111/j.1755-263X.2010.00146.x

Geoacademy. (2022). Geoacademy. Available at: https://geoacademy.everyware.es/.

GEOUP4 (2022). GEOUP4. Las universidades en el territorio. Geolocalización de la producción científica. Available at: http://geo.up4.es/.

Gerstner, K., Moreno-Mateos, D., Gurevitch, J., Beckmann, M., Kambach, S., Jones, H. P., & Seppelt, R. (2017). Will your paper be used in a meta-analysis? Make the reach of your research broader and longer lasting. Methods in Ecology and Evolution, 8(6), 777-784. https://doi.org/10.1111/2041-210X.12758

Gritta, M., Pilehvar, M. T., Limsopatham, N., & Collier, N. (2018). What's missing in geographical parsing? Language Resources and Evaluation, 52(2), 603-623. https://doi.org/10.1007/s10579-017-9385-8 PMid:31258456 PMCid:PMC6560650

Imani, M. B., Chandra, S., Ma, S., Khan, L., & Thuraisingham, B. (2017). Focus location extraction from political news reports with bias correction. 2017 IEEE International Conference on Big Data (Big Data) 1956-1964. https://doi.org/10.1109/BigData.2017.8258141

Inoue, H., Nakajima, K., & Saito, Y. U. (2019). Localization of collaborations in knowledge creation. The Annals of Regional Science, 62(1), 119-140. https://doi.org/10.1007/s00168-018-0889-y

JournalMap (2022). JournalMap. Available at: https://www.journalmap.org/.

Karl, J. W. (2019). Mining location information from life-and earth-sciences studies to facilitate knowledge discovery. Journal of Librarianship and Information Science, 51(4), 1007-1021. https://doi.org/10.1177/0961000618759413

Karl, J. W., Unnasch, R. S., Herrick, J. E., & Gillan, J. (2012). JournalMap: geo-semantic searching for relevant knowledge. In Ecological Society of America Proceedings.

Kmoch, A., Uuemaa, E., Klug, H., & Cameron, S. G. (2018). Enhancing location-related hydrogeological knowledge. ISPRS International Journal of Geo-Information, 7(4), 132. https://doi.org/10.3390/ijgi7040132

Leveling, J. (2015). Tagging of temporal expressions and geological features in scientific articles. Proceedings of the 9th Workshop on Geographic Information Retrieval, 1-10. https://doi.org/10.1145/2837689.2837701

Mapping Research Excellence. (2022). Excellence Maps v2. Available at: https://www.excellencemapping.net/

Martin, L. J., Blossey, B., & Ellis, E. (2012). Mapping where ecologists work: Biases in the global distribution of terrestrial ecological observations. Frontiers in Ecology and the Environment, 10(4), 195-201. https://doi.org/10.1890/110154

Middleton, S. E., Kordopatis-Zilos, G., Papadopoulos, S., & Kompatsiaris, Y. (2018). Location extraction from social media: Geoparsing, location disambiguation, and geotagging. ACM Transactions on Information. Systems (TOIS), 36(4), 1-27. https://doi.org/10.1145/3202662

Ministerio para la transición ecológica y el reto demográfico. (2022). Programa de investigación. Convocatoria 2022. Available at: https://www.miteco.gob.es/es/red-parques-nacionales/programa-investigacion/convocatoria2022.aspx

Page, R. D. (2010). Enhanced display of scientific articles using extended metadata. Web Semantics: Science, Services and Agents on the World Wide Web, 8(2-3), 190-195. https://doi.org/10.1016/j.websem.2010.03.004

Ramos-Vacca, I. D., & Bucheli-Guerrero, V. A.. (2015). Automatic geolocation of the scientific knowledge: Geolocarti. 10th Computing Colombian Conference (10CCC), 416-424. https://doi.org/10.1109/ColumbianCC.2015.7333454

Scimago. (2022). Ranking Methodology. Available at: https://www.scimagoir.com/methodology.php.

ShanghaiRanking. (2022). ShanghaiRanking. Available at: https://www.shanghairanking.com/rankings/arwu/2021.

Tamames, J., & de Lorenzo, V. (2010). EnvMine: A text-mining system for the automatic extraction of contextual information. BMC bioinformatics, 11(1), 1-10. https://doi.org/10.1186/1471-2105-11-294 PMid:20515448 PMCid:PMC2901371

Teitler, B. E., Lieberman, M. D., Panozzo, D., Sankaranarayanan, J., Samet, H., & Sperling, J. (2008). NewsStand: A new view on news. Proceedings of the 16th ACM SIGSPATIAL international conference on Advances in geographic information systems, 1-10. https://doi.org/10.1145/1463434.1463458

Umultirank. (2022). Umultirank. Universities compared. Your way. Available at:https://www.umultirank.org/.

Van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping, Scientometrics, 84(2), 523-538. https://doi.org/10.1007/s11192-009-0146-3 PMid:20585380 PMCid:PMC2883932

Zhang, W., & Gelernter, J. (2014). Geocoding location expressions in Twitter messages: A preference learning method. Journal of Spatial Information Science, 9, 37-70. https://doi.org/10.5311/JOSIS.2014.9.170

Publicado

2023-10-02

Cómo citar

Cascón Katchadourian, J., Rodríguez Domínguez, C., Carranza García, F., & Torres Salinas, D. (2023). GeoAcademy: plataforma web y algoritmo para la detección automática y localización de coordenadas geográficas en artículos científicos. Revista Española De Documentación Científica, 46(4), e370. https://doi.org/10.3989/redc.2023.4.1393

Número

Sección

Estudios

Datos de los fondos

Universidad de Granada
Números de la subvención MLAB2019-02