Skip to main content

Scraping Korea Baseball Game information

Project description

What is kbo-data

kbo-data는 한국프로야구 경기정보를 스크래핑하는 파이썬 패키지입니다.
kbo-data is a Python package that provides Korean professional baseball game information by scraping.

PyPI - Python Version PyPI GitHub license

Required

이 패키지를 사용하기 위해서는 chrome driver가 필요합니다. chrome driver는 해당 페이지에서 다운로드할 수 있습니다.
This package is required chrome driver. You can download it from this page

How to Use

패키지 설치하기

먼저 패키지를 설치합니다.
you have to install kbodata package first.

pip install kbodata

데이터 가져오기 (kbodata.get module)

원하는 날짜의 경기 스케쥴을 다운로드 받습니다.
you can download KBO match schedule that you want to get.

    import kbodata

    # 2021년 4월 20일의 KBO 경기 스케쥴을 가져옵니다.
    # Get the KBO match schedule for April 20, 2021.
    >>> day = kbodata.get_daily_schedule(2021,4,20,'chromedriver_path')

    # 2021년 4월 KBO 경기 스케쥴을 가져옵니다.
    # Get the KBO match schedule for April 2021.
    >>> month = kbodata.get_monthly_schedule(2021,4,'chromedriver_path')

    # 2021년 KBO 경기 스케쥴을 가져옵니다. 
    # Get the KBO match schedule for 2021.
    >>> year = kbodata.get_yearly_schedule(2021,'chromedriver_path')

해당 스케쥴을 바탕으로 경기 정보를 JSON 형식으로 가져옵니다.
It will be broght match information in JSON format based on the schedule.

    # 2021년 4월 20일의 KBO 경기 정보를 가져옵니다.
    # Get the KBO match information for April 20, 2021.
    >>> day_data = kbodata.get_game_data(day,'chromedriver_path')

    # 2021년 4월 KBO 경기 정보를 가져옵니다.
    # Get the KBO match information for April 2021.
    >>> month_data = kbodata.get_game_data(month,'chromedriver_path')

    # 2021년 KBO 경기 정보를 가져옵니다. 
    # Get the KBO match information for 2021.
    >>> year_data = kbodata.get_game_data(year,'chromedriver_path')

JSON 형식은 아래와 같습니다.
The JSON format is as below.

    { id: date_gameid,
    contents: {
      'scoreboard': []
      'ETC_info': {}
      'away_batter': []
      'home_batter': []
      'away_pitcher': []
      'home_pitcher': []
        }
    }

데이터 변형하기 (kbodata.load module)

가져온 데이터들을 특정 파일 타입으로 변환합니다. 지원하는 파일 타입은 아래와 같습니다.
This module converts data into specific file types. The supported file types are as follows.

  • DataFrame(pandas)
  • Dict
    # 팀 경기 정보만을 정리하여 DataFrame으로 변환합니다.
    scoreboard = kbodata.scoreboard_to_DataFrame(day_data)
    # 타자 정보만을 정리하여 DataFrame으로 변환합니다.
    batter = kbodata.batter_to_DataFrame(day_data)
    # 투수 정보만을 정리하여 DataFrame으로 변환합니다.
    pitcher = kbodata.pitcher_to_DataFrame(day_data)

    # 팀 경기 정보만을 정리하여 Dict으로 변환합니다.
    scoreboard = kbodata.scoreboard_to_Dict(day_data)
    # 타자 정보만을 정리하여 Dict으로 변환합니다.
    batter = kbodata.batter_to_Dict(day_data)
    # 투수 정보만을 정리하여 Dict으로 변환합니다.
    pitcher = kbodata.pitcher_to_Dict(day_data)

변환된 데이터에 대한 정보는 아래의 링크에서 확인할 수 있습니다.
You can find information about the converted data at the link below.

Issues

KBO 공식 홈페이지에 없는 데이터는 제공되지 않습니다. 데이터가 제공되지 않는 경기 정보는 아래와 같습니다.
Data that is not on the KBO official website is not provided. Match information for which data is not provided are listed below.

경기 기준 (from game)

  • 2008-03-30 LTHH0
  • 2009-04-04 WOLT0
  • 2010-03-20 OBLT0
  • 2010-03-20 WOSS0
  • 2015-07-08 HTWO0
  • 2018-08-01 WOSK0

날짜 기준 (from date)

  • 2013-03-09
  • 2013-03-10
  • 2013-03-11
  • 2013-03-12
  • 2013-03-13
  • 2013-03-14
  • 2013-03-15
  • 2013-03-16
  • 2013-03-17
  • 2013-03-18
  • 2013-03-19
  • 2013-03-20

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

kbodata-0.1.7.tar.gz (17.2 kB view details)

Uploaded Source

Built Distribution

kbodata-0.1.7-py3-none-any.whl (21.2 kB view details)

Uploaded Python 3

File details

Details for the file kbodata-0.1.7.tar.gz.

File metadata

  • Download URL: kbodata-0.1.7.tar.gz
  • Upload date:
  • Size: 17.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.1.14 CPython/3.10.5 Darwin/20.6.0

File hashes

Hashes for kbodata-0.1.7.tar.gz
Algorithm Hash digest
SHA256 46a45bfd045e39f1ee1dc423aa9d3a8b326679f1155759901a219c62129aa3a3
MD5 7d20001acca55f970cbe8d97c185b0e8
BLAKE2b-256 1e41f8a8e67751b45d436a123d25a23036e8798b782004bd63a478c5be42b187

See more details on using hashes here.

File details

Details for the file kbodata-0.1.7-py3-none-any.whl.

File metadata

  • Download URL: kbodata-0.1.7-py3-none-any.whl
  • Upload date:
  • Size: 21.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.1.14 CPython/3.10.5 Darwin/20.6.0

File hashes

Hashes for kbodata-0.1.7-py3-none-any.whl
Algorithm Hash digest
SHA256 9f21fd62af15093f9d24323d52f14f78211ce460d47f1c1a6933bc39b6fb6814
MD5 c5cb95ab9d9b8a3ef3a6e6cd9caa2b39
BLAKE2b-256 c9410db6caa687b346e17b2065d4d3d435119bb19c38ca52f7909f6bd1252d17

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page