GeoAcademy: plataforma web y algoritmo para la detección automática y localización de coordenadas geográficas en artículos científicos
DOI:
https://doi.org/10.3989/redc.2023.4.1393Palabras clave:
geolocalización automática, coordenadas geográficas, topónimos, algoritmo, artículos científicos, ScopusResumen
El siguiente estudio describe las cualidades y usos del proyecto GeoAcademy, un programa diseñado con el objetivo de geolocalizar artículos científicos automáticamente, dichos artículos se descargarían de bases de datos científicas generales como Scopus o Web of Science. Esta geolocalización se realiza sobre el contenido del documento, ya sea mediante la captura de posibles coordenadas geográficas que tenga el documento, o topónimos que puedan aparecer en el documento a través de un algoritmo creado a tal efecto. En la metodología explicamos los pasos que se han dado en este proyecto para crear una base de datos de muestra con artículos que tratan sobre Sierra Nevada (España) y la creación y diseño del algoritmo. Los resultados muestran los datos técnicos de la aplicación del algoritmo sobre la base de datos y su tasa de éxito, así como una descripción de la plataforma creada para visualizar gráficamente los documentos geolocalizados en un mapa web. Finalmente, en la discusión, definimos las dificultades encontradas, las posibles aplicaciones bibliométricas y su utilidad como herramienta de consulta y recuperación de información.
Descargas
Citas
Acheson, E., & Purves, R. S. (2021). Extracting and modeling geographic information from scientific articles. PloS one, 16(1), e0244918. https://doi.org/10.1371/journal.pone.0244918 PMid:33406109 PMCid:PMC7787447
Bordogna, G., Ghisalberti, G., & Psaila, G. (2012). Geographic Information Retrieval: Modeling Uncertainty of User's Context. Fuzzy Sets and Systems, 196, 105-124. https://doi.org/10.1016/j.fss.2011.04.005
Bornmann, L., Leydesdorff, L., Walch-Solimena, C., & Ettl, C. (2011). Mapping excellence in the geography of science: An approach based on Scopus data. Journal of Informetrics, 5(4), 537-546. https://doi.org/10.1016/j.joi.2011.05.005
Bornmann, L., Mutz, R., Haunschild, R., Moya-Anegon, F., Clemente, M., & Stefaner, M. (2021). Mapping the impact of papers on various status groups in excellencemapping.net: a new release of the excellence mapping tool based on citation and reader scores. Scientometric, 126, 9305-9331. https://doi.org/10.1007/s11192-021-04141-4
Buscaldi, D., & Magnini, B. (2010). Grounding toponyms in an italian local news corpus. Proceedings of the 6th workshop on geographic information retrieval, 1-5. https://doi.org/10.1145/1722080.1722099
Cascón-Katchadourian, J., & Ruiz Rodríguez, A. Á. (2016). Descripción y valoración del software MapTiler: Del mapa escaneado a la capa interactiva publicada en la web. Profesional de la Información, 25(6), 970978. https://doi.org/10.3145/epi.2016.nov.13
Cascón-Katchadourian, J., López-Herrera, A. G., Ruiz-Rodríguez, A. Á., & Herrera-Viedma, E. (2019). Proyecto Histocarto: aplicación de SIGs (georreferenciación y geolocalización) para mejorar la recuperación de la documentación histórica gráfica. Profesional de la Información, 28(4). https://doi.org/10.3145/epi.2019.jul.16
Catini, R., Karamshuk, D., Penner, O., & Riccaboni, M. (2015). Identifying geographic clusters: A network analytic approach. Research policy, 44(9), 1749-1762. https://doi.org/10.1016/j.respol.2015.01.011
Clarivate. (2022). Incites. Available at: https://incites.clarivate.com/#/landing.
Cobo, M. J., López-Herrera, A. G., Herrera-Viedma, E., & Herrera, F. (2012). SciMAT: A new science mapping analysis software tool. Journal of the American Society for Information Science and Technology, 63(8), 1609-1630. https://doi.org/10.1002/asi.22688
Cortés-José, J. (2001). El documento cartográfico. In J. Jiménez-Pelayo, J. Monteagudo-López-Menchero, & F. J. Bonachera-Cano, La documentación cartográfica : Tratamiento, gestión y uso, 37-113. Huelva: Universidad de Huelva.
CWTS. (2022). CWTS Leiden Ranking 2022. Available at: https://www.leidenranking.com/.
D'Ignazio, C., Bhargava, R., Zuckerman, E., & Beck, L. (2014). Cliff-clavin: Determining geographic focus for news articles. DSpace@MIT. Available at: https://hdl.handle.net/1721.1/123451.
Dredze, M., Paul, M. J., Bergsma, S., & Tran, H. (2013). Carmen: A twitter geolocation system with applications to public health. Workshops at the twenty-seventh AAAI conference on artificial intelligence.
Instituto de Estadística y Cartografía de Andalucía. (2022). Toponimía-Nomenclátor. Available at: https://www.juntadeandalucia.es/institutodeestadisticaycartografia/prodCartografia/toponimia/index.htm#:~:text=El%20Nomencl%C3%A1tor%20Geogr%C3%A1fico%20de%20Andaluc%C3%ADa,%2C%20extractivas%2C%20servicios%20y%20equipamientos.
Fisher, R., Radford, B. T., Knowlton, N., Brainard, R. E., Michaelis, F. B., & Caley, M. J. (2011). Global mismatch between research effort and conservation needs of tropical coral reefs. Conservation Letters, 4(1), 64-72. https://doi.org/10.1111/j.1755-263X.2010.00146.x
Geoacademy. (2022). Geoacademy. Available at: https://geoacademy.everyware.es/.
GEOUP4 (2022). GEOUP4. Las universidades en el territorio. Geolocalización de la producción científica. Available at: http://geo.up4.es/.
Gerstner, K., Moreno-Mateos, D., Gurevitch, J., Beckmann, M., Kambach, S., Jones, H. P., & Seppelt, R. (2017). Will your paper be used in a meta-analysis? Make the reach of your research broader and longer lasting. Methods in Ecology and Evolution, 8(6), 777-784. https://doi.org/10.1111/2041-210X.12758
Gritta, M., Pilehvar, M. T., Limsopatham, N., & Collier, N. (2018). What's missing in geographical parsing? Language Resources and Evaluation, 52(2), 603-623. https://doi.org/10.1007/s10579-017-9385-8 PMid:31258456 PMCid:PMC6560650
Imani, M. B., Chandra, S., Ma, S., Khan, L., & Thuraisingham, B. (2017). Focus location extraction from political news reports with bias correction. 2017 IEEE International Conference on Big Data (Big Data) 1956-1964. https://doi.org/10.1109/BigData.2017.8258141
Inoue, H., Nakajima, K., & Saito, Y. U. (2019). Localization of collaborations in knowledge creation. The Annals of Regional Science, 62(1), 119-140. https://doi.org/10.1007/s00168-018-0889-y
JournalMap (2022). JournalMap. Available at: https://www.journalmap.org/.
Karl, J. W. (2019). Mining location information from life-and earth-sciences studies to facilitate knowledge discovery. Journal of Librarianship and Information Science, 51(4), 1007-1021. https://doi.org/10.1177/0961000618759413
Karl, J. W., Unnasch, R. S., Herrick, J. E., & Gillan, J. (2012). JournalMap: geo-semantic searching for relevant knowledge. In Ecological Society of America Proceedings.
Kmoch, A., Uuemaa, E., Klug, H., & Cameron, S. G. (2018). Enhancing location-related hydrogeological knowledge. ISPRS International Journal of Geo-Information, 7(4), 132. https://doi.org/10.3390/ijgi7040132
Leveling, J. (2015). Tagging of temporal expressions and geological features in scientific articles. Proceedings of the 9th Workshop on Geographic Information Retrieval, 1-10. https://doi.org/10.1145/2837689.2837701
Mapping Research Excellence. (2022). Excellence Maps v2. Available at: https://www.excellencemapping.net/
Martin, L. J., Blossey, B., & Ellis, E. (2012). Mapping where ecologists work: Biases in the global distribution of terrestrial ecological observations. Frontiers in Ecology and the Environment, 10(4), 195-201. https://doi.org/10.1890/110154
Middleton, S. E., Kordopatis-Zilos, G., Papadopoulos, S., & Kompatsiaris, Y. (2018). Location extraction from social media: Geoparsing, location disambiguation, and geotagging. ACM Transactions on Information. Systems (TOIS), 36(4), 1-27. https://doi.org/10.1145/3202662
Ministerio para la transición ecológica y el reto demográfico. (2022). Programa de investigación. Convocatoria 2022. Available at: https://www.miteco.gob.es/es/red-parques-nacionales/programa-investigacion/convocatoria2022.aspx
Page, R. D. (2010). Enhanced display of scientific articles using extended metadata. Web Semantics: Science, Services and Agents on the World Wide Web, 8(2-3), 190-195. https://doi.org/10.1016/j.websem.2010.03.004
Ramos-Vacca, I. D., & Bucheli-Guerrero, V. A.. (2015). Automatic geolocation of the scientific knowledge: Geolocarti. 10th Computing Colombian Conference (10CCC), 416-424. https://doi.org/10.1109/ColumbianCC.2015.7333454
Scimago. (2022). Ranking Methodology. Available at: https://www.scimagoir.com/methodology.php.
ShanghaiRanking. (2022). ShanghaiRanking. Available at: https://www.shanghairanking.com/rankings/arwu/2021.
Tamames, J., & de Lorenzo, V. (2010). EnvMine: A text-mining system for the automatic extraction of contextual information. BMC bioinformatics, 11(1), 1-10. https://doi.org/10.1186/1471-2105-11-294 PMid:20515448 PMCid:PMC2901371
Teitler, B. E., Lieberman, M. D., Panozzo, D., Sankaranarayanan, J., Samet, H., & Sperling, J. (2008). NewsStand: A new view on news. Proceedings of the 16th ACM SIGSPATIAL international conference on Advances in geographic information systems, 1-10. https://doi.org/10.1145/1463434.1463458
Umultirank. (2022). Umultirank. Universities compared. Your way. Available at:https://www.umultirank.org/.
Van Eck, N. J., & Waltman, L. (2010). Software survey: VOSviewer, a computer program for bibliometric mapping, Scientometrics, 84(2), 523-538. https://doi.org/10.1007/s11192-009-0146-3 PMid:20585380 PMCid:PMC2883932
Zhang, W., & Gelernter, J. (2014). Geocoding location expressions in Twitter messages: A preference learning method. Journal of Spatial Information Science, 9, 37-70. https://doi.org/10.5311/JOSIS.2014.9.170
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Consejo Superior de Investigaciones Científicas (CSIC)

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
© CSIC. Los originales publicados en las ediciones impresa y electrónica de esta Revista son propiedad del Consejo Superior de Investigaciones Científicas, siendo necesario citar la procedencia en cualquier reproducción parcial o total.Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento 4.0 Internacional ” (CC BY 4.0). Puede consultar desde aquí la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
No se autoriza el depósito en repositorios, páginas web personales o similares de cualquier otra versión distinta a la publicada por el editor.
Datos de los fondos
Universidad de Granada
Números de la subvención MLAB2019-02