Sistemas de recuperación de información implementados a partir de CORD-19: herramientas clave en la gestión de la información sobre COVID-19
DOI:
https://doi.org/10.3989/redc.2020.4.1794Palabras clave:
conjuntos de datos, COVID-19, Sistemas de Recuperación de Información, gestión de información, CORD-19Resumen
La investigación sobre el coronavirus ha generado una producción de documentos científicos extraordinaria. Su tratamiento y asimilación por parte de la comunidad científica ha necesitado de la ayuda de sistemas de recuperación de información diseñados específicamente. Algunas de las principales instituciones mundiales dedicadas a la lucha contra la pandemia han desarrollado el conjunto de datos CORD-19 que destaca sobre otros proyectos de similar naturaleza. Los documentos recopilados en esta fuente han sido procesados por distintas herramientas de recuperación de información, a veces prototipos o sistemas que ya estaban implementados. Se ha analizado la tipología y características principales de estos sistemas concluyendo que hay tres grandes categorías no excluyentes entre ellas: búsqueda terminológica, visualización de información y procesamiento de lenguaje natural. Destaca enormemente que la gran mayoría de ellos emplean preferentemente tecnologías de búsqueda semántica con el objeto de facilitar la adquisición de conocimiento s los investigadores y ayudarlas en su ingente tarea. La crisis provocada por la pandemia ha sido aprovechada por los buscadores semánticos para encontrar su sitio.
Descargas
Citas
Adams, J., Light, R. (2020). What Role Does Collaboration have in Responding to COVID-19? https://osf.io/preprints/socarxiv/jqwyr/ https://doi.org/10.31235/osf.io/jqwyr
Bao, Y., Bossion, A., Brambilla, D., Buriak, J. M., Cai, K., Chen, L., Horton, M. K. (2020). Snapshots of Life-Early Career Materials Scientists Managing in the Midst of a Pandemic. Chemistry of Materials, 32 (9), 3673-3677. https://doi.org/10.1021/acs.chemmater.0c01624 PMCid:PMC7182139
Baumann N. (2016). How to use the medical subject headings (MeSH). International. Journal of Clinical Practice, 70(2). pp.171-174. https://doi.org/10.1111/ijcp.12767 PMid:26763799
Callaghan S. (2020). COVID-19 Is a Data Science Issue. Patterns, 1 (2), 100022. preprint. https://doi.org/10.1016/j.patter.2020.100022 PMid:32562484 PMCid:PMC7144860
Colavizza, G., Costas, R., Traag, V. A., Van Eck, N. J., Van Leeuwen, T., Waltman, L. (2020). A scientometric overview of CORD-19. BioRxiv. https://doi.org/10.1101/2020.04.20.046144
Donnelly, K. (2006). SNOMED-CT: The advanced terminology and coding system for eHealth. Studies in health technology and informatics, 121, 279-290.
Dousset, B., Mothe, J. (2020). Getting Insights from a Large Corpus of Scientific Papers on Specialisted Comprehensive Topics--the Case of COVID-19. arXiv preprint. https://arxiv.org/abs/2005.00485 https://doi.org/10.1016/j.procs.2020.09.287 PMid:33042309 PMCid:PMC7531911
Fernández-Sellers, M.; Acedo J.; Lozano-Tello, A. (2019). Identification of representative terms of datasets. 2019 14th Iberian Conference on Information Systems and Technologies (CISTI), Coimbra, Portugal, pp. 1-6. https://doi.org/10.23919/CISTI.2019.8760664
Huang, T. H. K., Huang, C. Y., Ding, C. K. C., Hsu, Y. C., Giles, C. L. (2020). CODA-19: Using a Non-Expert Crowd to Annotate Research Aspects on 10,000+ Abstracts in the COVID-19 Open Research Dataset. arXiv preprint. https://arxiv.org/abs/2005.02367
Kousha, K., Thelwall, M. (2020). COVID-19 publications: Database coverage, citations, readers, tweets, news, Facebook walls, Reddit posts. Quantitative Science Studies, 1 (3), 1068-1091. https://doi.org/10.1162/qss_a_00066
Nasution, D. K. (2018). Corpus Based-Approach in Enhancing Students' Academic Writing Skill: Its Efficacy and Students Perspectives. International Journal, 6 (2), 210-217. https://doi.org/10.15640/ijll.v6n2a25
Otegi, A.; Soroa, A.; Agirre, E. y Campos, J.A. (2020). Cómo gestionar la sobrecarga de información científica sobre COVID-19. https://theconversation.com/como-gestionar-la-sobrecarga-de-informacion-cientifica-sobre-covid-19-138651
Pahins, C. A., Omidvar-Tehrani, B., Amer-Yahia, S., Siroux, V., Pepin, J. L., Borel, J. C., Comba, J. L. (2019). COVIZ: a system for visual formation and exploration of patient cohorts. Proceedings of the VLDB Endowment, 12 (12), 1822-1825. https://doi.org/10.14778/3352063.3352075
Roberts, K., Alam, T., Bedrick, S., Demner-Fushman, D., Lo, K., Soboroff, I., Hersh, W. R. (2020). TREC-COVID: Rationale and Structure of an Information Retrieval Shared Task for COVID-19. Journal of the American Medical Informatics Association, 27 (9), 1431-1436. https://doi.org/10.1093/jamia/ocaa091 PMid:32365190 PMCid:PMC7239098
Salas, J. (2020, 5 de mayo). Sepultados bajo la mayor avalancha de estudios científicos. El País. https://elpais.com/ciencia/2020-05-04/sepultados-bajo-la-mayor-avalancha-de-estudios-cientificos.html
Su, D., Xu, Y., Yu, T., Siddique, F. B., Barezi, E. J., Fung, P. (2020). CAiRE-COVID: A Question Answering and Multi-Document Summarization System for COVID-19 Research. arXiv preprint. https://arxiv.org/ abs/2005.03975 https://doi.org/10.18653/v1/2020.nlpcovid19-2.14
Torres-Salinas, D. (2020). Ritmo de crecimiento diario de la producción científica sobre Covid-19. Análisis en bases de datos y repositorios en acceso abierto. El profesional de la información, 29 (2). https://doi.org/10.3145/epi.2020.mar.15
Wang, L. L., Lo, K., Chandrasekhar, Y., Reas, R., Yang, J., Eide, D. (2020a). CORD-19: The Covid-19 Open Research Dataset. arXiv preprint. https://arxiv.org/abs/2004.10706
Wang, X., Liu, W., Chauhan, A., Guan, Y., Han, J. (2020b). Automatic Textual Evidence Mining in COVID-19 Literature. arXiv preprint. https://arxiv.org/abs/2004.12563
Zhang, E., Gupta, N., Nogueira, R., Cho, K., Lin, J. (2020). Rapidly Deploying a Neural Search Engine for the COVID-19 Open Research Dataset: Preliminary Thoughts and Lessons Learned. arXiv preprint. https://arxiv.org/abs/2004.05125
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2020 Consejo Superior de Investigaciones Científicas (CSIC)
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
© CSIC. Los originales publicados en las ediciones impresa y electrónica de esta Revista son propiedad del Consejo Superior de Investigaciones Científicas, siendo necesario citar la procedencia en cualquier reproducción parcial o total.Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento 4.0 Internacional ” (CC BY 4.0). Puede consultar desde aquí la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
No se autoriza el depósito en repositorios, páginas web personales o similares de cualquier otra versión distinta a la publicada por el editor.