A IR simple library
Project description
MatchUp
Atualmente, por meio de máquinas de busca, é comum realizar consultas que apresentam, como resultado, um número elevado de referências que não atendem aos contextos das mesmas. Com o propósito de proporcionar resultados relevantes, mediante consultas, alguns modelos da área de Recuperação de Informação, chamados clássicos, foram propostos: o Booleano, o Vetorial e o ProbabilÃstico. Por sua vez, visando a melhoria da qualidade dos resultados gerados pela aplicação dos modelos clássicos de Recuperação de Informação, foram definidos, a partir dos mesmos, modelos estendidos de Recuperação de Informação; dentre eles, tem-se o Extended Boolean, o Generalized Vector e o Belief Network.
Em 2018/1, foi desenvolvida a primeira versão da ferramenta MatchUp: uma ferramenta Web para cálculo de similaridade entre uma consulta, podendo ser um determinado documento ou um conjunto de termos de interesse do usuário, e uma coleção de documentos, possibilitando a geração de uma lista de documentos desta coleção que são relevantes à consulta desejada. Para cálculo de similaridade, tal versão contemplou os modelos clássicos de RI e o modelo estendido Extended Boolean. Por meio da análise dos resultados dos experimentos realizados, foi possÃvel perceber que o modelo Vetorial, de uma forma geral, apresentou os melhores resultados quando comparado aos demais modelos implementados. Porém, a MatchUp não contemplou os modelos estendidos Generalized Vector e Belief Network, que podem apresentar melhores resultados que o Modelo Vetorial. Logo, este projeto de iniciação cientÃfica possui, como objetivo principal, o desenvolvimento da versão 2.0 da ferramenta MatchUp, no intuito de contemplar também os modelos estendidos Generalized Vector e Belief Network. Para validar a versão 2.0 da ferramenta MatchUp, experimentos serão realizados, envolvendo distintas coleções de documentos.
Objetivos
Este projeto de iniciação cientÃfica possui, como objetivo principal, o desenvolvimento da versão 2.0 da ferramenta MatchUp, no intuito de contemplar os modelos estendidos Generalized Vector e Belief Network de RI. A MatchUp consiste em uma ferramenta Web para cálculo de similaridade entre uma consulta, podendo ser um determinado documento ou um conjunto de termos de interesse do usuário, e uma coleção de documentos, possibilitando a geração de uma lista de documentos desta coleção que são relevantes à consulta desejada. Para cálculo de similaridade, a versão 1.0 da MatchUp contemplou os modelos clássicos de RI e o modelo estendido Extended Boolean.
Os objetivos especÃficos a serem atingidos são:
- implementação de distintos modelos estendidos de RI;
- definição de uma interface amigável para a ferramenta Web, de forma a facilitar a entrada dos dados necessários para a execução da mesma e permitir a intervenção do usuário, se for de interesse, na definição de caracterÃsticas de funcionalidade quanto aos modelos de RI implementados;
- realização de experimentos de validação da ferramenta Web desenvolvida, por meio da execução da mesma para distintas coleções de documentos;
- estudo comparativo da eficácia dos modelos de RI implementados, com base nos resultados experimentais obtidos;
- levantamento de dados estatÃsticos quanto aos termos presentes em uma determinada coleção de documentos;
- capacitação do bolsista do projeto, preparando-o para cursar um programa de pósgraduação e, consequentemente, minimizando o seu tempo de permanência em tal programa;
- consolidação da linha de pesquisa Tratamento e Recuperação da Informação do Departamento de Computação da Universidade Federal de Ouro Preto.
Tecnologias
- Python 3.7 - Linguagem de Programação
STATUS : Em construção
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file matchup-ir-0.0.1.tar.gz
.
File metadata
- Download URL: matchup-ir-0.0.1.tar.gz
- Upload date:
- Size: 14.8 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.22.0 setuptools/45.2.0 requests-toolbelt/0.9.1 tqdm/4.42.1 CPython/3.7.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 |
76a2111c77c0a1dcb90e48f341fa8b662df35cc131210d9bd52320e159e7da8c
|
|
MD5 |
6336ef34132d7df6a2586c1ab033a4be
|
|
BLAKE2b-256 |
0c88ef3f874ab1a7ccb91a0c2c8da92c6827154c866e7220706661c9baaa7f2b
|
File details
Details for the file matchup_ir-0.0.1-py3-none-any.whl
.
File metadata
- Download URL: matchup_ir-0.0.1-py3-none-any.whl
- Upload date:
- Size: 21.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.22.0 setuptools/45.2.0 requests-toolbelt/0.9.1 tqdm/4.42.1 CPython/3.7.0
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 |
2e3a9a59c592aaa4187263722a97f35b7a381b0ebdc8ebab2fa5dea80ea4f674
|
|
MD5 |
d2152f0e939d07e2c959c25639cfa5dc
|
|
BLAKE2b-256 |
e1ccb12061964a784c99415303934758269f77904f6313adac1258f2a0516334
|