The package contains functions for calculating ranking metrics
Project description
Описание
Данный репозиторий содержит реализацию алгоритмов ранжирования Bm25, LaBSE, MsMarcoST, MsMarcoCE с подсчетом метрик:
- Top@1;
- Top@3;
- Top@5;
- Средняя позиция в выдачах (AverageLoc);
- Cредняя относительная позиция в выдачах (AverageRelLoc);
- Оценка как часто фейковый документ выше всех релевантных (FDARO@v1);
- Оценка как часто фейковый документ выше хотя бы одного релевантного (FDARO@v2);
- Частота попадания фейкового документа в топ 25% (UpQuartile).
Установка
Для установки пакета воспользуйтесь командой
pip install docs-ranking-metrics
Пример использования
Пример использования представлен в examples/using_metrics.py
# Объявление метрик
metrics = [LaBSE(), Bm25()]
# Объявление класса агрегирующего обновление метрик
rank_metrics = RankingMetrics(metrics)
...
'''
Обновление значений метрик, где
query - запрос по которому сгенерирован документ,
sentences - массив документов,
labels - метки документов
'''
rank_metrics.update(query, sentences, labels)
...
# Получение значений подсчитанных метрик ввиде словаря
rank_metrics.get()
# Получение значений метрик при помощи функции show_metrics
rank_metrics.show_metrics()
Возможный вывод метода get:
{
'LaBSE_AverageLoc': 10.5,
'Bm25_AverageLoc': 1.13513,
'LaBSE_Top@1': 0.0,
'LaBSE_Top@3': 0.013513,
'LaBSE_Top@5': 0.013513,
'Bm25_Top@1': 0.91891,
'Bm25_Top@3': 1.0,
'Bm25_Top@5': 1.0,
'LaBSE_FDARO': 0.6216,
'Bm25_FDARO': 1.0
}
Возможный вывод метода show_metrics():
LaBSE_AverageLoc: 4.5 Bm25_AverageLoc: 3.0
-----------------------------
LaBSE_AverageRelLoc: 0.75 Bm25_AverageRelLoc: 0.5
-----------------------------
LaBSE_Top@1: 0.0 Bm25_Top@1: 0.5
LaBSE_Top@3: 0.5 Bm25_Top@3: 0.5
LaBSE_Top@5: 0.5 Bm25_Top@5: 1.0
-----------------------------
LaBSE_FDARO@v1: 0.5 Bm25_FDARO@v1: 0.5
LaBSE_FDARO@v2: 0.5 Bm25_FDARO@v2: 0.5
-----------------------------
LaBSE_UpQuartile: 0.5 Bm25_UpQuartile: 0.5
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Close
Hashes for docs-ranking-metrics-0.0.4.dev3.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | dfd6b37c20b6c404c40f896edda81e04b0ca26e9e9cb0164f3ac21a8f2c794c0 |
|
MD5 | c43f2b48358fb83c6abfe52434add6ab |
|
BLAKE2b-256 | c7e92b5ed58e77a802ab6e9fe5059cd8c0465fc5ef11e9f863889a4be5332530 |
Close
Hashes for docs_ranking_metrics-0.0.4.dev3-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 99fa9d4028348570a15c14c3543ae9317b5e2e84490ef98f772939422ee2f00e |
|
MD5 | 63fd5762ab8e0ab23fc29803e955a9fc |
|
BLAKE2b-256 | 88afa5687d9646815d7226d0588a78d09df7933f9798bf42ff236e9c607b3efd |