Introdução à recuperação da informação. Indexação e pré-processamento. Modelagem em recuperação da informação: modelos booleano, vetorial e probabilístico. Avaliação da recuperação.
Ofertado em: [2021-1] [2021-2] [2022-1]
- Introdução à recuperação da informação: Tipos de sistemas de RI. Modelos de interação em RI. Visão geral de recuperação da informação. Recuperação da informação na Web.
- Indexação e pré-processamento: Termos de indexação e vocabulário. Representação de documentos: matriz de termos e índice invertido. Visão lógica dos documentos. Pré-processamento de texto.
- Modelagem em recuperação da informação: Modelagem e ranqueamento. Modelo booleano. Ponderação de termos. Ponderação TF-IDF. Normalização pelo tamanho dos documentos. Modelo vetorial. Modelo probabilístico. Modelo BM25.
- Avaliação da recuperação: Métricas de recuperação: precisão e revocação. Métrricas de avaliação: média das precisões médias, curva de precisão vs. revocação, precisão interpolada, F-score.
- Baeza-Yates, R.; Ribeiro-Neto, B. Modern Information Retrieval: The Concepts and Technology behind Search. 2a ed. Pearson, 2011.
- Elmasri, R.; Navathe, S. B. Fundamentals of Database Systemas. 7a ed. São Paulo: Pearson, 2016.