The package contains functions for calculating ranking metrics
Project description
Описание
Данный репозиторий содержит реализацию алгоритмов ранжирования Bm25, LaBSE с подсчетом метрик:
- Top@1;
- Top@3;
- Top@5;
- Средняя позиция в выдачах (AverageLoc);
- Оценка как часто фейковый документ выше релевантных (FDARO)
Пример использования
Пример использования представлен в examples/using_metrics.py
# Объявление метрик
metrics = [LaBSE(), Bm25()]
# Объявление класса агрегирующего обновление метрик
rank_metrics = RankingMetrics(metrics)
...
'''
Обновление значений метрик, где
query - запрос по которому сгенерирован документ,
sentences - массив документов,
labels - метки документов
'''
rank_metrics.update(query, sentences, labels)
...
# Получение значений подсчитанных метрик ввиде словаря
rank_metrics.get()
Возможный вывод метода get:
{
'LaBSE_AverageLoc': 10.5,
'Bm25_AverageLoc': 1.13513,
'LaBSE_Top@1': 0.0,
'LaBSE_Top@3': 0.013513,
'LaBSE_Top@5': 0.013513,
'Bm25_Top@1': 0.91891,
'Bm25_Top@3': 1.0,
'Bm25_Top@5': 1.0,
'LaBSE_FDARO': 0.6216,
'Bm25_FDARO': 1.0
}
Загрузка пакета
Необходимо установить все зависимости
pip install twine wheel
Для создания пакета необходимо воспользоваться командой:
python3 setup.py sdist bdist_wheel
Загружаем пакет в PyPI
python3 -m twine upload dist/*
Улучшения:
- Исправить подсчет метрик под документы разной релевантности
- Внедрить модель https://huggingface.co/cross-encoder/ms-marco-MiniLM-L-6-v2
- Придумать дополнительные метрики
- Завернуть все в пакет
- Написать тесты, workflows
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Close
Hashes for docs-ranking-metrics-0.0.1.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | ecb3c787aec921d8355aac3289949aa5b0508cf50669879a69a962f8b25d5740 |
|
MD5 | 329563c1046fe9e31b80fc48e6ae2161 |
|
BLAKE2b-256 | 305e246fded933e8ce1b62ee7d0038b04f3a3a066b08637d001c184c5b12f5c5 |
Close
Hashes for docs_ranking_metrics-0.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 84530ae1904dfdd68310095b99a12d93ed66e77720eb18b34ece00c49758fd27 |
|
MD5 | ab0db3e6533c24575cec28a1c0a3bf80 |
|
BLAKE2b-256 | 6046bcbf253f085f5e4efa4ad35558d64856f04f22206b5a6b789563ca6b7fbc |