Python library for scraping football data and visualize it / Libreria de Python para scrapear data de fútbol y visualizarla
Project description
Esto es la líbreria de LanusStats, un lugar en donde se intentará hacerle la vida más facíla toda persona que este interesada en el ámbito del fútbol y los datos. Se van a tener recursos de todo tipo, desde scrapeo de información de distintas páginas/lugares hasta la posibilidad de hacer visualizaciones con solo una función.
Para instalarla, solamente tenes que correr esto en algun consola de comando:
pip install LanusStats
En caso de querer actualizarla a la versión más reciente:
pip install --upgrade LanusStats
La libreria consta de distintos módulos para sacar información de estas páginas:
Cómo se usa?
General
Para saber que páginas contienen un módulo para scrapear, podes hacer:
get_available_pages()
Para saber que ligas tienen las páginas de la función anterior, podes hacer:
get_available_leagues(page)
Para saber que temporadas tienen las ligas de las páginas de la función anterior, podes hacer:
get_available_season_for_leagues(page, league)
Fbref
- Para scrapear información de los equipos se puede usar
get_teams_season_stats
. Ejemplo:
get_teams_season_stats('gca', 'Copa de la Liga', season='2024', save_csv=False, stats_vs=False, change_columns_names=False, add_page_name=False)
change_columns_names te permite ponerle el nombre a columnas de tipo Unnamed: 0 add_page_name le agrega el nombre de la página a las columnas, hay veces que se repiten los nombres entre páginas save_csv exporta la tabla a un csv stats_vs te permite scrapear las tablas de estadísticas vs que en Fbref está la posibilidad
Si esto lo queres hacer todo junto, podes usar get_vs_and_teams_season_stats
. Ejemplo:
get_vs_and_teams_season_stats('gca', 'Copa de la Liga', season='2024', save_excel=False, stats_vs=False, change_columns_names=False, add_page_name=False)
Esto te devuelve dos DataFrames, uno para las estadísticas a favor y otro en contra. save_excel te permite exportarlo a un .xlsx que contiene dos páginas.
Para terminar, con get_all_teams_season_stats
podes scrapear TODAS las estadísticas que esten en la pagina. Ejemplo:
get_all_teams_season_stats('gca', 'Copa de la Liga', save_csv=False, stats_vs=False, change_columns_names=False, add_page_name=False)
- Para scrapear data de los jugadores se pueden usar:
get_player_season_stats('gca', 'Copa de la Liga', save_csv=False, add_page_name=False)
Y si quiero scrapear todas las estadísticas en una
get_all_player_season_stats("Copa de la Liga", save_csv=False, add_page_name=False)
- Del perfil de un jugar se puede sacar los percentiles y las similutdes (si las tiene)
get_player_percentiles("https://fbref.com/en/players/bc7dc64d/Bukayo-Saka")
get_player_similarities("https://fbref.com/en/players/bc7dc64d/Bukayo-Saka")
- De un partido en particular se puede sacar los tiros y las estadísticas generales (si las tiene)
get_match_shots("https://fbref.com/en/matches/77d7e2d6/Arsenal-Luton-Town-April-3-2024-Premier-League")
get_general_match_team_stats("https://fbref.com/en/matches/77d7e2d6/Arsenal-Luton-Town-April-3-2024-Premier-League")
- Si queres scrapear la tabla de posiciones de una liga, podes:
get_tournament_table("https://fbref.com/en/comps/9/Premier-League-Stats")
FotMob
SofaScore
365 Scores
Visualizaciones
Créditos
Quiero agradecer a las influencias y ayudas que tuve para armar todo esto:
Más contenido
Unite al Discord hecho para la comunidad hispano hablante de fútbol y datos (cualquiera está invitado igual)
Para ver todo el contenido de LanusStats, te dejo este link
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for LanusStats-1.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 5d0445c8466380383d5dd877a6db8c0b870cea2f9a8243909053799cdee63d9a |
|
MD5 | fc4c1bf18801526f0d37e29794eea2d7 |
|
BLAKE2b-256 | f22e2e7844c5c40f75dfade00e7fd1ff5e75101c33d0a828853841f6a2a91ec1 |