Skip to main content

Lang2SQL - Query Generator for Data Warehouse

Project description

Lang2SQL

Lang2SQL은 자연어 입력을 기반으로 SQL을 생성하는 프로젝트입니다. LangGraph, DataHub를 활용하여 데이터를 분석하고 최적의 SQL 쿼리를 생성 및 최적화합니다.

📌 프로젝트 목표

  1. 자연어 입력을 기반으로 SQL 쿼리를 자동으로 생성
  2. DataHub를 활용하여 관련 테이블 및 컬럼 메타데이터 조회
  3. Best Practice Query를 참고하여 최적의 SQL 생성
  4. SQL 최적화 과정을 거쳐 성능 향상

🚀 기술 스택

  • LangGraph: LLM 기반의 쿼리 생성
  • DataHub: 테이블 및 컬럼 메타데이터 조회

📦 설치 방법

1️⃣ 필수 패키지 설치

pip install -r requirements.txt

2️⃣ 패키지 설치

setup.py를 통해 패키지를 설치할 수 있습니다:

python setup.py install

3️⃣ CLI 명령어 사용

설치 후, lang2sql 명령어를 사용할 수 있습니다. 예를 들어, Streamlit 앱을 실행하려면 다음과 같이 입력합니다:

lang2sql --run-streamlit

기본 포트는 8501이며, 다른 포트를 사용하려면 -p 옵션을 사용하세요:

lang2sql --run-streamlit -p 8502

DataHub GMS 서버 URL을 설정하려면 --datahub_server 옵션을 사용하세요. 기본값은 http://localhost:8080입니다:

lang2sql --datahub_server http://your-datahub-server:8080 --run-streamlit

4️⃣ 환경 변수 설정

다음 환경 변수들은 설정되어야 합니다. .env 파일을 생성하여 다음과 같이 관리할 수 있습니다:

OPENAI_API_KEY=your-api-key-here
LANGCHAIN_TRACING_V2=true
LANGCHAIN_PROJECT=autosql
LANGCHAIN_ENDPOINT=https://api.smith.langchain.com
LANGCHAIN_API_KEY=your-langchain-api-key
DATAHUB_SERVER=http://localhost:8080

🎯 동작

  1. 자연어 입력을 기반으로 테이블 조회
  2. 테이블의 스키마 및 컬럼 정보 확인
  3. 최적의 SQL 쿼리 생성
  4. 쿼리 최적화 실행

빌드 및 배포 방법

수동 빌드

python setup.py sdist bdist_wheel
twine upload dist/*

GitHub Actions를 통한 자동 배포

GitHub 저장소에 태그를 v* 형식으로 푸시하면, GitHub Actions가 자동으로 PyPI에 패키지를 배포합니다. 이 과정은 .github/workflows/pypi-release.yml 파일에 정의되어 있습니다.

  • 태그 형식: v1.0.0
  • 필요한 설정: GitHub Secrets에 PYPI_API_TOKEN을 설정해야 합니다.

라이선스

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

lang2sql-0.1.8.tar.gz (11.9 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

lang2sql-0.1.8-py3-none-any.whl (9.8 kB view details)

Uploaded Python 3

File details

Details for the file lang2sql-0.1.8.tar.gz.

File metadata

  • Download URL: lang2sql-0.1.8.tar.gz
  • Upload date:
  • Size: 11.9 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.13.2

File hashes

Hashes for lang2sql-0.1.8.tar.gz
Algorithm Hash digest
SHA256 ebf0f9763ba31095dc3125700ece62e85f4c3854a4b6b633fe149376ecea5a93
MD5 3c67103cd8cbc30c0f287307909fe679
BLAKE2b-256 a80482e82881061621a6e1b1ebf6d9c040f0c3993790b155647147baa7fbe463

See more details on using hashes here.

File details

Details for the file lang2sql-0.1.8-py3-none-any.whl.

File metadata

  • Download URL: lang2sql-0.1.8-py3-none-any.whl
  • Upload date:
  • Size: 9.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.13.2

File hashes

Hashes for lang2sql-0.1.8-py3-none-any.whl
Algorithm Hash digest
SHA256 35dff29930d628c818d04c46600fd716791a52027bb70a00619f52a22e1726c6
MD5 bf1a370f9f232e5b0c921890b825da64
BLAKE2b-256 f7fae171c187adfa79fe784bd3802d346475f7b56fe242e73f8cbff825eb3504

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page