Skip to main content

Python library for scraping football data and visualize it / Libreria de Python para scrapear data de fútbol y visualizarla

Project description

Esto es la líbreria de LanusStats, un lugar en donde se intentará hacerle la vida más facíla toda persona que este interesada en el ámbito del fútbol y los datos. Se van a tener recursos de todo tipo, desde scrapeo de información de distintas páginas/lugares hasta la posibilidad de hacer visualizaciones con solo una función.

Para instalarla, solamente tenes que correr esto en algun consola de comando:

pip install LanusStats

En caso de querer actualizarla a la versión más reciente:

pip install --upgrade LanusStats

La libreria consta de distintos módulos para sacar información de estas páginas:


Cómo se usa?

General

Para saber que páginas contienen un módulo para scrapear, podes hacer:

get_available_pages()

Para saber que ligas tienen las páginas de la función anterior, podes hacer:

get_available_leagues(page)

Para saber que temporadas tienen las ligas de las páginas de la función anterior, podes hacer:

get_available_season_for_leagues(page, league)

Fbref

  • Para scrapear información de los equipos se puede usar get_teams_season_stats. Ejemplo:
get_teams_season_stats('gca', 'Copa de la Liga', season='2024', save_csv=False, stats_vs=False, change_columns_names=False, add_page_name=False)

change_columns_names te permite ponerle el nombre a columnas de tipo Unnamed: 0 add_page_name le agrega el nombre de la página a las columnas, hay veces que se repiten los nombres entre páginas save_csv exporta la tabla a un csv stats_vs te permite scrapear las tablas de estadísticas vs que en Fbref está la posibilidad

Si esto lo queres hacer todo junto, podes usar get_vs_and_teams_season_stats. Ejemplo:

get_vs_and_teams_season_stats('gca', 'Copa de la Liga', season='2024', save_excel=False, stats_vs=False, change_columns_names=False, add_page_name=False)

Esto te devuelve dos DataFrames, uno para las estadísticas a favor y otro en contra. save_excel te permite exportarlo a un .xlsx que contiene dos páginas.

Para terminar, con get_all_teams_season_stats podes scrapear TODAS las estadísticas que esten en la pagina. Ejemplo:

get_all_teams_season_stats('gca', 'Copa de la Liga', save_csv=False, stats_vs=False, change_columns_names=False, add_page_name=False)
  • Para scrapear data de los jugadores se pueden usar:
get_player_season_stats('gca', 'Copa de la Liga', save_csv=False, add_page_name=False)

Y si quiero scrapear todas las estadísticas en una

get_all_player_season_stats("Copa de la Liga", save_csv=False, add_page_name=False)
  • Del perfil de un jugar se puede sacar los percentiles y las similutdes (si las tiene)
get_player_percentiles("https://fbref.com/en/players/bc7dc64d/Bukayo-Saka")
get_player_similarities("https://fbref.com/en/players/bc7dc64d/Bukayo-Saka")
  • De un partido en particular se puede sacar los tiros y las estadísticas generales (si las tiene)
get_match_shots("https://fbref.com/en/matches/77d7e2d6/Arsenal-Luton-Town-April-3-2024-Premier-League")
get_general_match_team_stats("https://fbref.com/en/matches/77d7e2d6/Arsenal-Luton-Town-April-3-2024-Premier-League")
  • Si queres scrapear la tabla de posiciones de una liga, podes:
get_tournament_table("https://fbref.com/en/comps/9/Premier-League-Stats")

FotMob

SofaScore

365 Scores

Visualizaciones


Créditos

Quiero agradecer a las influencias y ayudas que tuve para armar todo esto:


Más contenido

Unite al Discord hecho para la comunidad hispano hablante de fútbol y datos (cualquiera está invitado igual)

Para ver todo el contenido de LanusStats, te dejo este link

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

LanusStats-1.1.0.tar.gz (16.5 kB view details)

Uploaded Source

Built Distribution

LanusStats-1.1.0-py3-none-any.whl (19.0 kB view details)

Uploaded Python 3

File details

Details for the file LanusStats-1.1.0.tar.gz.

File metadata

  • Download URL: LanusStats-1.1.0.tar.gz
  • Upload date:
  • Size: 16.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.10.0

File hashes

Hashes for LanusStats-1.1.0.tar.gz
Algorithm Hash digest
SHA256 35a85b30db224f041fa6db0f3d7d351c6789cce145d315d5e5a879208da3c7a0
MD5 a85d4f2a1273c615d7b82ed86e244b2a
BLAKE2b-256 7614e8a010dc3f8d553ed33afaf1817171537088bf82da6ce4f16dd6eb8ddbde

See more details on using hashes here.

File details

Details for the file LanusStats-1.1.0-py3-none-any.whl.

File metadata

  • Download URL: LanusStats-1.1.0-py3-none-any.whl
  • Upload date:
  • Size: 19.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.10.0

File hashes

Hashes for LanusStats-1.1.0-py3-none-any.whl
Algorithm Hash digest
SHA256 c7bc986b80f8c4049967414588845a2fce95637ba0b0dfa503f59a80fe7087d0
MD5 f1e3bdbe9315832b6032db93e83b965a
BLAKE2b-256 0841dfa2aae72fa17edb95472d1098b923d52a0780a901bad1d4e88847eb9368

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page