KOSPI·KOSDAQ 종목 자동 스크리닝 + AI/ML 분석 + 텔레그램 리포트 플랫폼
Project description
📈 Korean Stocks AI/ML Analysis System
KOSPI · KOSDAQ 종목을 AI와 머신러닝으로 분석하는 자동화 투자 보조 플랫폼
목차
- 프로젝트 소개
- 주요 기능
- 기술 스택
- 시스템 아키텍처
- 분석 파이프라인
- 점수 체계
- 대시보드 메뉴
- 실전 투자 활용 가이드
- 설치 및 실행
- API 엔드포인트
- 자동화 설정
- 변경 이력
- 면책 조항
🚀 프로젝트 소개
Korean Stocks AI/ML Analysis System은 기술적 지표 분석, 머신러닝 예측, 뉴스 감성 분석을 통합하여 한국 주식 시장의 유망 종목을 자동으로 발굴하고 리포트를 생성하는 플랫폼입니다.
매일 장 마감 후 자동으로 실행되어 KOSPI·KOSDAQ 전 종목 중 거래량 상위 · 상승 모멘텀 · 반등 후보 버킷으로 분류된 종목을 스크리닝하고, 심층 분석 후 텔레그램으로 결과를 전송합니다.
단기 AI 추천 외에, DART 공시 기반 펀더멘털과 Piotroski F-Score를 활용한 가치주 스크리닝(중기 3~6개월), ROE·영업이익률·재무건전성 기반의 우량주 스크리닝(장기 6개월+)도 지원합니다.
✨ 주요 기능
| 기능 | 설명 |
|---|---|
| AI 종목 추천 | 기술적 지표·ML·뉴스를 종합한 복합 점수로 유망 종목 선정 |
| 버킷 기반 선정 | 거래량 상위·상승 모멘텀·반등 후보 3개 버킷 쿼터 보장 (배지 UI 표시) |
| 날짜별 히스토리 | 과거 30일 분석 결과를 날짜 선택으로 조회 |
| 추천 지속성 히트맵 | 연속 추천(🔥)·비연속 반복 추천(🔄/📌) 배지로 신호 신뢰도 시각화 |
| DB 우선 조회 & 캐시 | 당일 저장된 DB 결과 우선 표시, 메뉴 이탈 후 재진입 시 세션 캐시 유지 |
| DB 자동 동기화 | GitHub Actions 완료 후 DB를 저장소에 자동 커밋·푸시 → koreanstocks sync 한 번으로 최신 결과 반영 |
| 텔레그램 알림 | 종합점수 바·당일 등락률·RSI·뉴스 헤드라인·AI 강점 포함 구조화 리포트 발송 |
| 전략 백테스팅 | RSI · MACD · COMPOSITE 전략 시뮬레이션 (단순보유 비교, 초보자 해석 가이드 포함) |
| 관심 종목 관리 | Watchlist 등록 및 분석 이력 타임라인 제공 |
| 추천 성과 추적 | 5·10·20거래일 후 실제 수익률 자동 검증, 승률·목표가 달성률 통계 제공 |
| 가치주 스크리닝 | PER·PBR·ROE·부채비율·Piotroski F-Score 필터 + value_score 정렬, 당일 인메모리 캐시 |
| 우량주 스크리닝 | ROE·영업이익률·YoY성장·부채비율·PBR 필터 + quality_score 정렬, ROE 2개년 평균으로 지속성 확인 |
| 모델 신뢰도 대시보드 | ML 모델 AUC·과적합 갭·드리프트 등급·피처 중요도·재학습 권장 여부 확인 |
🛠 기술 스택
UI FastAPI + Reveal.js (일일 브리핑) + Vanilla JS (인터랙티브 대시보드 8탭)
CLI Typer (10개 명령어: serve / recommend / analyze / train / outcomes / value / quality / init / sync / home)
AI/LLM OpenAI GPT-4o-mini (뉴스 감성 분석, AI 종합 의견)
ML Scikit-learn (Random Forest, Gradient Boosting) + XGBoost Ranker + LightGBM + CatBoost
→ 5-모델 앙상블 (분류기 75% + 랜커 25%, AUC 기반 Softmax 가중치)
기술 지표 ta (RSI, MACD, BB, SMA, OBV, ADX, VWAP, CMF, MFI, Stochastic, CCI, ATR, Donchian)
+ finta (SQZMI, VZO, Fisher Transform, Williams Fractal)
ML 피처 20개 (변동성·추세강도·시장 상대강도·모멘텀·finta·거래량·거시경제·극값감지)
데이터 FinanceDataReader, KIND API (KRX 전종목), Naver News API, DART Open API (선택)
Yahoo Finance (VIX · S&P500 거시지표)
DB SQLite (data/storage/stock_analysis.db)
자동화 GitHub Actions (평일 16:30 KST), Telegram Bot API
시각화 Plotly, Matplotlib, Chart.js (백테스트 차트)
언어 Python 3.11 ~ 3.13
🏗 시스템 아키텍처
세 가지 독립적인 분석 파이프라인: 단기 AI 추천 · 중기 가치주 스크리닝 · 장기 우량주 스크리닝
graph TD
CLI["🖥 CLI<br/>serve · recommend · analyze · train<br/>outcomes · value · quality · init · sync · home"]
USER["👤 사용자<br/>브라우저"]
subgraph API["⚡ FastAPI (koreanstocks.api)"]
RA["AI 추천 · 분석 · Watchlist<br/>백테스트 · 시장 · 모델"]
RV["가치주 · 우량주<br/>GET /api/value_stocks<br/>GET /api/quality_stocks"]
end
subgraph FRONTEND["🌐 대시보드 (dashboard.html — 8탭)"]
F1["① Dashboard<br/>시장지수 · AI추천 · 히트맵"]
F2["② Watchlist<br/>관심종목 관리"]
F3["③ AI 추천<br/>ML 추천 · 성과 추적"]
F4["④ 가치주 추천<br/>F-Score · value_score"]
F5["⑤ 우량주 추천<br/>quality_score · ROE 지속성"]
F6["⑥ 백테스트<br/>전략 시뮬레이션"]
F7["⑦ 모델 신뢰도<br/>AUC · 피처 중요도"]
F8["⑧ 설정<br/>수동 실행 · 데이터 소스"]
end
subgraph PIPELINE_AI["🤖 단기 AI 추천 (1~2주)"]
E1["indicators.py<br/>기술적 지표 → tech_score"]
E2["prediction_model.py<br/>5-모델 앙상블 → ml_score<br/>RF · GB · LGB · CB · XGBRanker"]
E3["news_agent.py<br/>뉴스 감성 → sentiment_score<br/>GPT-4o-mini"]
E4["analysis_agent.py<br/>4단계 심층 분석"]
E5["recommendation_agent.py<br/>버킷 기반 종목 선정<br/>composite score 산출"]
end
subgraph PIPELINE_FUND["💰 펀더멘털 스크리닝"]
V1["value_screener.py<br/>중기 가치주 (3~6개월)<br/>Piotroski F-Score + value_score"]
Q1["quality_screener.py<br/>장기 우량주 (6개월+)<br/>quality_score · ROE 2개년 평균"]
end
subgraph DATA["📊 Data Layer"]
D1["provider.py<br/>FinanceDataReader · KIND API<br/>OHLCV · 시장지수 · 종목목록"]
D2["fundamental_provider.py<br/>DART Open API<br/>PER · PBR · ROE · 부채비율"]
D3["database.py<br/>SQLite CRUD<br/>추천결과 · 분석이력 · 뉴스캐시"]
end
subgraph EXT["🌐 외부 데이터"]
X1["FinanceDataReader / KIND API<br/>OHLCV · 종목목록"]
X2["Naver News API<br/>종목 뉴스"]
X3["DART Open API<br/>재무제표 공시"]
X4["OpenAI GPT-4o-mini<br/>감성 분석 · AI 의견"]
X5["Yahoo Finance<br/>VIX · S&P500"]
end
subgraph STORAGE["💾 저장소"]
S1[("stock_analysis.db")]
S2["models/saved/*.pkl<br/>학습된 ML 모델"]
end
CLI -->|서버 기동| API
CLI -->|직접 실행| PIPELINE_AI
CLI -->|value / quality| PIPELINE_FUND
USER --> FRONTEND
FRONTEND -->|REST| API
API --> RA --> PIPELINE_AI
API --> RV --> PIPELINE_FUND
PIPELINE_AI --> E1 & E2 & E3
E1 & E2 & E3 --> E4 --> E5 --> D3
PIPELINE_FUND --> V1 & Q1
V1 & Q1 --> D1 & D2
D1 --> X1
D2 --> X3
E3 --> X2 & X4
E4 --> X4
E1 & E2 --> X5
D3 --> S1
E2 --> S2
🔬 분석 파이프라인
단기 AI 추천 파이프라인 (1~2주)
버킷 기반 후보군 선정
flowchart TD
A["FinanceDataReader + KIND API<br/>KOSPI · KOSDAQ 전체 종목"] --> B["시장 필터<br/>KOSPI / KOSDAQ / ALL"]
B --> V["🟦 거래량 상위<br/>40% 쿼터"]
B --> M["🟩 상승 모멘텀<br/>+2%~+15%<br/>35% 쿼터"]
B --> R["🟥 반등 후보<br/>거래량 상위 중 하락<br/>25% 쿼터"]
V & M & R --> POOL["분석 풀 구성<br/>min(limit × 8, 80)개<br/>limit=9 → 최대 72종목"]
종목별 심층 분석 (4단계 병렬)
flowchart TD
POOL["분석 풀 (최대 80종목)"] --> PAR["병렬 분석<br/>max_workers=5 · timeout=60s"]
PAR --> T["1단계 기술적 지표<br/>tech_score 0~100<br/>추세(40) + 모멘텀(30) + BB/CMF/거래량(30)"]
PAR --> ML["2단계 ML 앙상블<br/>ml_score 0~100<br/>RF · GB · LGB · CB + XGBRanker<br/>20개 피처 · 101분위 캘리브레이션"]
PAR --> N["3단계 뉴스 감성<br/>sentiment_score -100~100<br/>GPT-4o-mini · 지수감쇠 시간가중"]
T & ML & N --> GPT["4단계 GPT-4o-mini<br/>AI 종합 의견<br/>BUY/HOLD/SELL · 목표가 · 강점/약점"]
GPT --> C["종합 점수 산출<br/>tech×0.40 + ml×0.35 + sentiment_norm×0.25"]
C --> Q["버킷 쿼터 기반 최종 N종목<br/>섹터 다양성 고려"]
Q --> DB[("SQLite DB<br/>날짜별 저장")]
Q --> TG["📱 텔레그램<br/>구조화 리포트"]
종합 점수 공식
flowchart LR
T["Tech Score<br/>0~100"] -->|"× 0.40"| SUM["종합 점수<br/>0~100"]
ML["ML Score<br/>0~100"] -->|"× 0.35"| SUM
N["News Score<br/>-100~100 → 정규화 0~100"] -->|"× 0.25"| SUM
SUM --> FB["※ ML 모델 없을 때<br/>tech×0.65 + sentiment_norm×0.35"]
style FB fill:#f9f,stroke:#999,stroke-dasharray:5 5
sentiment_norm = (sentiment_score + 100) / 2→ 0~100 정규화
2단계 — ML 앙상블 (ml_score, 0~100)
5-모델 앙상블 구조
flowchart LR
subgraph FEAT["입력 피처 (20개)"]
F1["변동성·추세강도<br/>atr_ratio · adx<br/>bb_width · bb_position"]
F2["시장 상대강도<br/>rs_vs_mkt_3m"]
F3["모멘텀·추세<br/>high_52w_ratio · mom_accel<br/>macd_diff · macd_slope_5d<br/>price_sma_5_ratio"]
F4["finta 지표<br/>fisher · bullish_fractal_5d"]
F5["거래량·강도<br/>mfi · vzo · obv_trend<br/>low_52w_ratio"]
F6["극값감지·반전<br/>rsi · cci_pct"]
F7["거시경제<br/>vix_level · sp500_1m"]
end
subgraph MODELS["5-모델 앙상블"]
RF["Random Forest<br/>(분류기)"]
GB["Gradient Boosting<br/>(분류기)"]
LGB["LightGBM<br/>(분류기)"]
CB["CatBoost<br/>(분류기)"]
XGB["XGBoost Ranker<br/>(rank:ndcg)"]
end
subgraph AGG["집계"]
CLS["분류기 평균<br/>AUC 기반 Softmax 가중치<br/>75%"]
RNK["랜커 점수<br/>25%"]
CAL["101분위수 캘리브레이션<br/>→ 0~100 균등 스케일"]
end
FEAT --> MODELS
RF & GB & LGB & CB --> CLS
XGB --> RNK
CLS & RNK --> CAL
ML 학습 설정:
- 타깃: 10거래일 후 수익률 상위 25% = 1 / 하위 25% = 0 (중간 50% neutral zone 제외)
- Walk-Forward CV: VAL_STEP=10 거래일, 약 48 fold, Purging 20 거래일
- 품질 게이트: test_AUC ≥ 0.52 통과 시에만 저장 (미통과 시 tech_score 폴백)
가치주 스크리닝 파이프라인 (중기 3~6개월)
flowchart TD
A["Naver 시가총액 순위 페이지<br/>병렬 스크래핑<br/>탐색 범위: 100 / 200 / 300종목"] --> B["사전 필터<br/>PER > 0 · ROE > 0<br/>시가총액 500억 이상"]
B --> C["DART Open API<br/>펀더멘털 수집<br/>PER · PBR · ROE · 부채비율 · 영업이익YoY<br/>※ 연도 폴백: 전년사업보고서 → 반기 → 전전년"]
C --> D["6단계 필터<br/>PER ≤ 25 · PBR ≤ 3<br/>ROE ≥ 8% · 부채비율 ≤ 150%<br/>영업이익YoY ≥ -15% · F-Score ≥ 4"]
D --> E["Piotroski F-Score<br/>9점 만점<br/>수익성(P1~P3) + 안전성(L1~L3) + 성장성(E1~E3)"]
D --> F["value_score<br/>0~100점<br/>PER(25) + PBR(15) + ROE(20)<br/>부채비율(15) + 영업이익YoY(30) + 배당(10)"]
E & F --> G["복합 정렬<br/>value_score × 0.7 + F-Score_normalized × 0.3"]
G --> H["결과 반환<br/>당일 인메모리 캐시<br/>동일 조건 재실행 → 즉시 반환"]
Piotroski F-Score 구성 (9점)
| 구분 | 항목 | 기준 |
|---|---|---|
| 수익성 (P1~P3) | P1 ROA | 당기순이익 / 총자산 > 0 |
| P2 영업현금흐름 | 영업이익 > 0 | |
| P3 ROA 개선 | 전년 대비 ROA 증가 | |
| 안전성 (L1~L3) | L1 부채비율 감소 | 전년 대비 부채비율 하락 |
| L2 유동비율 개선 | 부채비율 하락 (대리지표) | |
| L3 무상증자 없음 | PBR 정상 범위 | |
| 성장성 (E1~E3) | E1 영업이익률 개선 | 전년 대비 영업이익률 상승 |
| E2 자산회전율 개선 | 전년 대비 매출/총자산 증가 | |
| E3 OCF > 순이익 | 영업이익YoY > 5% (대리지표) |
우량주 스크리닝 파이프라인 (장기 6개월+)
flowchart TD
A["Naver 시가총액 순위 페이지<br/>탐색 범위: 100 / 200 / 300종목"] --> B["사전 필터<br/>ROE > 0 · 시가총액 500억 이상"]
B --> C["DART Open API<br/>ROE 2개년 평균 · 영업이익률<br/>영업이익YoY · 부채비율 · 배당수익률<br/>※ 연도 폴백: 전년사업보고서 → 반기"]
C --> D["5단계 필터<br/>ROE ≥ roe_min · 영업이익률 ≥ op_margin_min<br/>영업이익YoY ≥ yoy_min · 부채비율 ≤ debt_max<br/>PBR ≤ pbr_max"]
D --> E["quality_score<br/>0~100점<br/>ROE(30) + 영업이익률(25)<br/>영업이익YoY(20) + 부채비율(15) + 배당(10)"]
E --> F["ROE 2개년 평균<br/>일시적 고ROE 필터링<br/>지속 성장 기업 확인"]
F --> G["quality_score 내림차순 정렬<br/>당일 인메모리 캐시"]
📊 점수 체계 해석
Tech Score (기술적 지표 종합, 0~100)
| 점수 | 해석 |
|---|---|
| 80–100 | 매우 강세 |
| 60–79 | 강세 |
| 40–59 | 중립 |
| 0–39 | 약세 |
세부 구성 (합계 100점)
| 구성 | 최대 | 주요 지표 |
|---|---|---|
| ① 추세 | 40점 | SMA5/20/60, MACD 골든크로스, ADX DI+/DI− |
| ② 모멘텀 | 30점 | RSI × MACD 방향 맥락 보정, BB 폭 보정 |
| ③ 위치·자금흐름 | 30점 | BB 위치(20), CMF(5), 거래량 확인(5) |
MACD 방향에 따라 RSI 최적 구간이 반전됩니다 (상승추세: 55
75 최적 / 하락추세: 3550 최적).
ML Score (머신러닝 예측, 0~100)
10거래일 후 수익률 상위 25% 진입 확률의 캘리브레이션 점수.
| 점수 | 해석 |
|---|---|
| 70–100 | 강한 상승 기대 (상위 25% 고확률) |
| 50–69 | 중간 이상 — 양호 |
| 30–49 | 중립~약세 |
| 0–29 | 하위권 예상 |
News Sentiment Score (뉴스 감성, -100~100)
| 점수 | 해석 |
|---|---|
| 51–100 | Very Bullish (매우 긍정) |
| 1–50 | Bullish (긍정) |
| 0 | Neutral |
| -49~-1 | Bearish (부정) |
| -100~-50 | Very Bearish (매우 부정) |
Value Score (가치주, 0~100)
| 항목 | 배점 | 최고점 기준 |
|---|---|---|
| PER | 25pt | 업종 중앙값 기준 상대 평가 |
| PBR | 15pt | 낮을수록 최고 / 3.0 이상 0pt |
| ROE | 20pt | ≥ 30% 최고 (2개년 평균) |
| 부채비율 | 15pt | 낮을수록 최고 / 150% 이상 0pt |
| 영업이익YoY | 30pt | ≥ +30% 최고 / -30% 이하 0pt |
| 배당수익률 | 10pt | ≥ 3% 최고 (데이터 없으면 제외) |
복합 정렬: value_score × 0.7 + (F-Score / 9 × 100) × 0.3
| value_score | 해석 |
|---|---|
| 70–100 | 우수한 저평가 종목 — 중기 매수 검토 대상 |
| 50–69 | 양호 — 추가 검증 후 판단 |
| 30–49 | 보통 — 일부 지표 취약 |
| 0–29 | 미달 |
Quality Score (우량주, 0~100)
| 항목 | 배점 | 최고점 기준 |
|---|---|---|
| ROE | 30pt | ≥ 20% 최고 (2개년 평균) |
| 영업이익률 | 25pt | ≥ 20% 최고 |
| 영업이익YoY | 20pt | ≥ 30% 최고 |
| 부채비율 | 15pt | 낮을수록 최고 / 100% 이상 0pt |
| 배당수익률 | 10pt | ≥ 3% 최고 |
| quality_score | 해석 |
|---|---|
| 70–100 | 최우량 — 장기 핵심 보유 후보 |
| 50–69 | 양호 — 장기 투자 검토 대상 |
| 30–49 | 보통 — 추가 검증 필요 |
| 0–29 | 미달 |
🖥 대시보드 메뉴 구성 (8탭)
권장 브라우저: Chrome / Firefox (최신 버전)
flowchart LR
DASH["http://localhost:8000/dashboard"]
DASH --> T1["① Dashboard<br/>시장지수 · 포트폴리오 요약<br/>날짜별 AI 추천 리포트<br/>추천 지속성 히트맵 🔥🔄📌"]
DASH --> T2["② Watchlist<br/>관심 종목 등록·삭제<br/>실시간 심층 분석<br/>분석 이력 타임라인"]
DASH --> T3["③ AI 추천<br/>테마·시장별 추천 생성<br/>날짜 선택 히스토리<br/>📊 5·10·20거래일 성과 추적"]
DASH --> T4["④ 가치주 추천<br/>PER·PBR·ROE·부채비율·F-Score 필터<br/>value_score 복합 정렬<br/>탐색 범위 100/200/300종목"]
DASH --> T5["⑤ 우량주 추천<br/>ROE·영업이익률·YoY·부채비율 필터<br/>quality_score 정렬<br/>ROE 2개년 지속성 확인"]
DASH --> T6["⑥ 백테스트<br/>RSI / MACD / COMPOSITE<br/>단순보유 비교 차트<br/>초보자 해석 가이드"]
DASH --> T7["⑦ 모델 신뢰도<br/>5모델 AUC · 과적합 갭<br/>드리프트 등급 · 피처 중요도<br/>재학습 권장 여부"]
DASH --> T8["⑧ 설정<br/>수동 일일 업데이트 실행<br/>텔레그램·데이터소스 상태 확인"]
| 탭 | 주요 기능 | 투자 관점 |
|---|---|---|
| Dashboard | 시장지수, AI 추천, 히트맵 | 당일 현황 파악 |
| Watchlist | 관심종목 관리, 분석 이력 | 지속 모니터링 |
| AI 추천 | ML 추천 생성, 성과 추적 | 단기 1~2주 |
| 가치주 추천 | F-Score + value_score 스크리닝 | 중기 3~6개월 |
| 우량주 추천 | quality_score 스크리닝 | 장기 6개월+ |
| 백테스트 | 전략별 과거 성과 시뮬레이션 | 전략 검증 |
| 모델 신뢰도 | ML 모델 헬스체크 | 신호 신뢰성 판단 |
| 설정 | 수동 실행, 환경 설정 확인 | 운영 관리 |
💡 실전 투자 활용 가이드
⚠️ 본 시스템은 투자 보조 도구입니다. 최종 투자 결정은 반드시 본인이 직접 판단하세요.
투자 시계 (Investment Horizon) 선택
flowchart TD
START["투자 목적 선택"] --> S1["단기 트레이딩<br/>1~2주"]
START --> S2["중기 투자<br/>3~6개월"]
START --> S3["장기 투자<br/>6개월+"]
S1 --> A1["AI 추천 탭 사용<br/>tech_score + ml_score + sentiment<br/>종합 점수 65+ · BUY 신호 우선"]
S2 --> A2["가치주 추천 탭 사용<br/>value_score 60+ · F-Score 6+<br/>PER ≤ 15 · ROE ≥ 10%"]
S3 --> A3["우량주 추천 탭 사용<br/>quality_score 70+<br/>ROE 2개년 ≥ 15% · 영업이익률 ≥ 15%"]
A1 & A2 & A3 --> CHECK["두 신호 이상 일치 시<br/>최우선 검토 대상"]
단기 AI 추천 활용 단계별 가이드
Step 1 — 스크리닝 (매일 자동)
→ 텔레그램 알림으로 오늘의 추천 9종목 확인
→ 종합 점수 상위 2~3종목을 후보로 선정
Step 2 — 지속성 확인 (신뢰도 검증)
→ 추천 지속성 히트맵에서 연속 추천 일수 확인
→ 🔥 (연속 2일+) 배지 종목은 신호 신뢰도 높음
Step 3 — 성과 데이터 확인
→ AI 추천 탭 → "추천 성과 추적" 섹션
→ 과거 추천의 5·10·20거래일 승률 · 목표가 달성률 확인
Step 4 — 심층 검증 (수동)
→ Dashboard 또는 AI 추천 탭 상세 리포트 확인
→ 강점/약점, 뉴스 원문 링크, 목표가 근거 직접 검토
→ 백테스트 탭에서 해당 전략의 과거 성과 확인
Step 5 — 최종 판단 기준
아래 조건 중 2개 이상 충족 시 매수 검토 ✅
✓ 최근 5일 거래량 ≥ 20일 평균의 150%
✓ 52주 저점 대비 -20% 이내
✓ 뉴스 감성 Bullish 이상 (score > 20)
✓ 추천 지속성 히트맵 🔥 배지 (연속 2일+)
✓ ML Score ≥ 60 + Tech Score ≥ 65
강력 매수 후보 판단 기준
강력 매수 후보 (모든 조건 충족 시)
✅ Tech Score ≥ 65
✅ ML Score ≥ 60
✅ News Score > 20
✅ AI action = BUY
✅ RSI: 35~50 구간 (과매도 탈출 또는 중립 하단)
✅ MACD: 골든크로스 발생 또는 유지
관망 권고
✗ Tech < 50 이고 MACD 데드크로스 상태
✗ News Score < -30 (강한 악재 뉴스)
✗ RSI > 75 (과열 구간)
매도 검토
✗ AI action = SELL + Tech Score < 40
✗ RSI > 75 + MACD 데드크로스 동시 발생
리스크 관리 원칙
| 원칙 | 설명 |
|---|---|
| 분산 투자 | 동일 섹터에 몰리지 않도록 1~2종목만 선택 |
| 손절 기준 | 매수가 대비 7~8% 하락 시 손절 고려 |
| 비중 관리 | 단일 종목에 총 자산의 10% 이상 집중 지양 |
| 재검증 | 매수 후 3~5일 내 재분석으로 의견 변화 모니터링 |
⚙️ 설치 및 실행
방법 A — PyPI 설치 (권장: 분석 결과 조회 전용)
분석 실행 없이 GitHub Actions가 생성한 추천 결과를 대시보드로 조회할 때 사용합니다.
# 시스템 라이브러리 (XGBoost / LightGBM 구동에 필요)
sudo apt-get install -y libomp-dev # Ubuntu / Debian
# brew install libomp # macOS
pip install koreanstocks
koreanstocks init # API 키 대화형 설정
koreanstocks sync # GitHub Actions 생성 DB 다운로드
koreanstocks serve # http://localhost:8000/dashboard 자동 열림
.env·DB·ML 모델은~/.koreanstocks/에 저장됩니다.
pipx로 설치 (CLI 격리 권장)
pip install pipx && pipx ensurepath
pipx install koreanstocks
방법 B — 저장소 클론 (개발 / 자체 분석 실행)
git clone https://github.com/bullpeng72/KoreanStock.git
cd KoreanStock
conda create -n stocks_env python=3.11
conda activate stocks_env
sudo apt-get install -y libomp-dev # Ubuntu/Debian
pip install -e . # editable 설치
API 키 설정 — koreanstocks init
koreanstocks init # 대화형 입력 (권장)
koreanstocks init --non-interactive # 빈 템플릿 생성 (CI용)
환경 변수 목록
# ── 필수 ──────────────────────────────────────────────────────
OPENAI_API_KEY=sk-proj-... # GPT-4o-mini 뉴스 감성·AI 의견
NAVER_CLIENT_ID=abc123 # Naver News API
NAVER_CLIENT_SECRET=xyz789
TELEGRAM_BOT_TOKEN=123456:ABC-... # 추천 리포트 발송
TELEGRAM_CHAT_ID=-1001234567890
# ── 선택 ──────────────────────────────────────────────────────
DART_API_KEY= # 미설정 시 뉴스만으로 감성 분석
# ── 시스템 (기본값 사용 권장) ──────────────────────────────────
DB_PATH=data/storage/stock_analysis.db
# KOREANSTOCKS_BASE_DIR= # 데이터 루트 경로 강제 지정
# KOREANSTOCKS_GITHUB_DB_URL= # fork 시 sync URL 재정의
| 변수 | 발급처 | 필수 |
|---|---|---|
OPENAI_API_KEY |
platform.openai.com/api-keys | ✅ |
NAVER_CLIENT_ID/SECRET |
developers.naver.com — 검색 API | ✅ |
TELEGRAM_BOT_TOKEN |
텔레그램 @BotFather → /newbot |
✅ |
TELEGRAM_CHAT_ID |
api.telegram.org/bot<TOKEN>/getUpdates |
✅ |
DART_API_KEY |
opendart.fss.or.kr (무료) | ☑️ |
주요 CLI 명령어
# 웹 대시보드
koreanstocks serve # http://localhost:8000/dashboard
koreanstocks serve --port 8080 # 포트 변경
koreanstocks serve --no-browser # 브라우저 자동 실행 비활성화
# 일일 추천 분석 (GitHub Actions용)
koreanstocks recommend
koreanstocks recommend --market KOSPI --limit 10
# 단일 종목 심층 분석
koreanstocks analyze 005930
# ML 모델 재학습
koreanstocks train
koreanstocks train --period 3 --future-days 10
# DB 동기화 (PyPI 설치 환경)
koreanstocks sync # 최초 수신 또는 날짜 갱신
koreanstocks sync --force # 강제 덮어쓰기
# 추천 성과 추적
koreanstocks outcomes # 미검증 결과 업데이트 + 통계 출력
koreanstocks outcomes --days 180 # 최근 180일 조회
koreanstocks outcomes --no-record # DB 업데이트 없이 통계만
# 가치주 스크리닝 (중기 3~6개월)
koreanstocks value # 기본 필터 (상위 20종목)
koreanstocks value --per-max 15 --roe-min 10
koreanstocks value --f-score-min 6 --candidate-limit 300
# 우량주 스크리닝 (장기 6개월+)
koreanstocks quality # 기본 필터 (상위 20종목)
koreanstocks quality --roe-min 15 --margin-min 15
koreanstocks quality --market KOSPI --candidate-limit 200
# 데이터 홈 디렉토리
koreanstocks home # 경로 출력
koreanstocks home --open # 파일 탐색기로 열기
koreanstocks home --setup # 셸 alias 스니펫 출력
# 테스트
pytest tests/
python tests/compat_check.py # Python 3.11~3.13 호환성 검증
📡 API 엔드포인트
서버 실행 후 /docs에서 Swagger UI로 전체 API 문서를 확인할 수 있습니다.
| 라우터 | 엔드포인트 | 메서드 | 설명 |
|---|---|---|---|
| market | /api/market |
GET | 시장 지수 (KS11/KQ11) |
/api/market/trading-day |
GET | 거래일 여부 확인 | |
/api/market/ranking |
GET | 시장 등락 순위 | |
| recommendations | /api/recommendations |
GET | 날짜별 추천 목록 |
/api/recommendations/run |
POST | 추천 분석 실행 | |
/api/recommendations/history |
GET | 30일 히스토리 | |
/api/recommendations/outcomes |
GET | 성과 추적 통계 | |
| analysis | /api/analysis/{code} |
GET/POST | 종목 심층 분석 |
/api/analysis/{code}/history |
GET | 분석 이력 타임라인 | |
| watchlist | /api/watchlist |
GET/POST | 관심 종목 조회/등록 |
/api/watchlist/{code} |
DELETE | 관심 종목 삭제 | |
| backtest | /api/backtest |
GET | 전략 백테스팅 |
| value | /api/value_stocks |
GET | 가치주 스크리닝 결과 |
/api/value_stocks/filters |
GET | 필터 기본값 | |
| quality | /api/quality_stocks |
GET | 우량주 스크리닝 결과 |
/api/quality_stocks/filters |
GET | 필터 기본값 | |
| models | /api/model_health |
GET | ML 모델 헬스체크 |
| version | /api/version |
GET | API 버전 정보 |
🤖 자동화 설정 (GitHub Actions)
실행 시점: 평일 오후 16:30 KST (UTC 07:30) — 장 마감 후 자동 실행
flowchart TD
TRIGGER["⏰ 16:30 KST 평일 자동 실행<br/>(또는 수동 workflow_dispatch)"]
TRIGGER --> TRADING{"한국 증시 거래일?"}
TRADING -- 휴장 --> SKIP["📅 텔레그램 휴장일 알림"]
TRADING -- 거래일 --> OUTCOME["지난 추천 성과 기록<br/>5·10·20거래일 후 수익률 집계<br/>→ 텔레그램 성과 리포트"]
OUTCOME --> STOCKLIST["KOSPI + KOSDAQ 전체 종목 갱신"]
STOCKLIST --> BUCKETS["버킷 기반 후보군 선정<br/>거래량 상위 / 상승 모멘텀 / 반등 후보"]
BUCKETS --> ANALYSIS["심층 분석 (병렬)<br/>기술 + ML + 뉴스 + GPT"]
ANALYSIS --> SELECT["종합 점수 상위 9종목 선정<br/>버킷 쿼터 + 섹터 다양성"]
SELECT --> SAVE[("SQLite DB 저장")]
SAVE --> ARTIFACT["GitHub Artifact 백업 (90일)"]
SAVE --> COMMIT["저장소에 DB 커밋·푸시"]
COMMIT --> NOTIFY["📱 텔레그램 추천 리포트"]
COMMIT --> SYNC1["git clone 환경 → git pull"]
COMMIT --> SYNC2["PyPI 설치 → koreanstocks sync"]
GitHub Secrets 등록 (Settings > Secrets and variables > Actions):
OPENAI_API_KEY
TELEGRAM_BOT_TOKEN
TELEGRAM_CHAT_ID
NAVER_CLIENT_ID
NAVER_CLIENT_SECRET
DART_API_KEY (선택)
📁 프로젝트 구조
KoreanStocks/
├── pyproject.toml # pip 빌드 설정 (koreanstocks CLI 진입점)
├── requirements.txt # 개발/테스트 전용 (pytest 등)
├── train_models.py # ML 모델 재학습 스크립트
├── src/
│ └── koreanstocks/
│ ├── __init__.py # VERSION = "0.4.2"
│ ├── cli.py # Typer CLI (10개 명령어)
│ ├── api/
│ │ ├── app.py # FastAPI 앱 팩토리
│ │ ├── dependencies.py # 공통 의존성
│ │ └── routers/
│ │ ├── recommendations.py # AI 추천 · 성과 추적
│ │ ├── analysis.py # 종목 심층 분석
│ │ ├── watchlist.py # 관심 종목 CRUD
│ │ ├── backtest.py # 전략 백테스팅
│ │ ├── market.py # 시장 지수 · 거래일
│ │ ├── models.py # ML 모델 헬스체크
│ │ ├── value.py # 가치주 스크리닝
│ │ └── quality.py # 우량주 스크리닝
│ ├── static/
│ │ ├── index.html # Reveal.js 일일 브리핑 슬라이드
│ │ ├── dashboard.html # 인터랙티브 대시보드 (8탭)
│ │ ├── js/
│ │ │ ├── slides.js
│ │ │ └── dashboard.js
│ │ └── css/theme.css
│ └── core/
│ ├── config.py # 환경변수 및 설정 (dotenv)
│ ├── constants.py # 버킷 상수 등 공유 상수
│ ├── data/
│ │ ├── provider.py # 주가 · 종목목록 수집
│ │ ├── fundamental_provider.py # DART 펀더멘털 수집
│ │ └── database.py # SQLite CRUD
│ ├── engine/
│ │ ├── indicators.py # 기술적 지표 계산
│ │ ├── features.py # ML 피처 추출 (20개, 공유)
│ │ ├── strategy.py # 전략별 시그널 생성
│ │ ├── prediction_model.py # 5-모델 앙상블 추론
│ │ ├── news_agent.py # 뉴스 수집 + GPT 감성
│ │ ├── analysis_agent.py # 종목 심층 분석 오케스트레이터
│ │ ├── recommendation_agent.py # 버킷 기반 추천 생성
│ │ ├── value_screener.py # 가치주 스크리닝 (F-Score + value_score)
│ │ ├── quality_screener.py # 우량주 스크리닝 (quality_score)
│ │ ├── trainer.py # ML 모델 재학습 워크플로우
│ │ └── scheduler.py # 자동화 워크플로우
│ └── utils/
│ ├── backtester.py # 전략 성과 검증
│ ├── notifier.py # 텔레그램 리포트
│ └── outcome_tracker.py # 추천 결과 성과 추적
├── models/saved/ # 학습된 ML 모델 (.pkl) · 파라미터 (.json)
├── data/storage/ # SQLite DB 파일
├── docs/
│ ├── ML_ANALYSIS.md # ML 앙상블 시스템 기술 문서
│ ├── TECHNICAL_ANALYSIS.md # 기술적 분석 시스템 기술 문서
│ ├── NEWS_ANALYSIS.md # 뉴스 감성 분석 시스템 기술 문서
│ ├── VALUE_SCREENING.md # 가치주 스크리닝 기술 문서
│ └── QUALITY_SCREENING.md # 우량주 스크리닝 기술 문서
├── tests/
│ ├── test_backtester.py # 백테스터 단위 테스트
│ └── compat_check.py # Python 3.11~3.13 호환성 검증
└── .github/workflows/
└── daily_analysis.yml # GitHub Actions 스케줄러
📝 변경 이력
v0.4.2 (2026-03-10) — 경고 전면 제거 · 추천 성과 추적 안정성 강화 · 코드 품질 개선
- 🐛
StandardScalerfeature names 불일치 경고 수정 (prediction_model.py) - 🐛
pct_change(fill_method=None)/yf.download(auto_adjust=True)FutureWarning 제거 - 🐛
SettingWithCopyWarning수정 — boolean 슬라이스 후.copy()추가 (provider.py) - 🔧
outcome_tracker.py안정성 대폭 강화:entry_price <= 0방어,_get_date_range()헬퍼, DBexc_info=True, HORIZONS 주석 명시 - 🔧
database.py:session_date인덱스 추가 (recommendations,recommendation_outcomes) - 🔧
dashboard.js:statCard()ev=0오판 버그 수정 (!ev→ev == null) - 🔧 API 에러 응답에서 내부 정보 마스킹 (
recommendations.py) - 🔧
cli.pysync: 관심종목(watchlist) 자동 백업·복원
v0.4.1 (2026-03-10) — 우량주 스크리너 추가 · ML 피처 개선 · 대시보드 히트맵 개선 · UI 품질 강화
- ✨
우량주 추천탭 신설 (대시보드 5번째 탭) — ROE·영업이익률·YoY성장·부채비율·PBR 필터 + 우량점수 정렬, 배당수익률 표시 - ✨
koreanstocks qualityCLI 명령어 신설 - ✨
GET /api/quality_stocks엔드포인트 신설 - ✨ 추천 지속성 히트맵 개선 — 연속 추천(🔥)과 비연속 반복 추천(🔄/📌) 구분 배지 + 점수 범례 추가
- 🔧 ML 피처 3개 추가:
obv_trend,rsi,cci_pct— 17→20개 - 🔧 ML Walk-Forward CV: VAL_STEP 20→10 거래일 (fold
24→48), Purging 10→20거래일 강화 - 🔧 ML 모델 depth 조정: RF max_depth 4→5, CatBoost depth 2→3
- 🔧 앙상블 Softmax 가중치 정규화, Classifier·Ranker 분리 집계 (75%:25%)
- 🐛
bool(numpy.bool_)JSON 직렬화 오류 수정 (Python 3.13 + NumPy 2.x 호환) - 📝
docs/QUALITY_SCREENING.md신설
v0.4.0 (2026-03-06) — 가치주 스크리닝 기능 추가
- ✨
가치주 추천탭 신설 — PER·PBR·ROE·부채비율·F-Score 필터 + value_score 정렬 - ✨
koreanstocks valueCLI 명령어 신설 - ✨
GET /api/value_stocks엔드포인트 신설 — Piotroski F-Score + value_score 복합 정렬 - 🐛
fundamental_provider.pyDART 재작성 — ROE·부채비율 대차대조표에서 직접 계산 - 🔧
value_screener.py당일 인메모리 캐시 추가 - 📝
docs/VALUE_SCREENING.md신설
v0.3.x (2026-02-28 ~ 2026-03-05) — 추천 성과 추적 · 5-모델 앙상블 · pykrx 제거
- ✨ 추천 성과 추적 (5·10·20거래일 후 실적 검증,
outcomesCLI 및 Web UI) - ✨ 버킷 배지 UI (거래량 상위/상승 모멘텀/반등 후보) — 대시보드·슬라이드 동시 반영
- ✨ LightGBM · CatBoost 추가 → 5-모델 앙상블
- ✨ XGBoost 이진 분류 → XGBRanker (rank:ndcg) 교체
- ✨
/api/version엔드포인트 신설 - 🔧 pykrx 완전 제거 → FinanceDataReader + KIND API
⚠️ 면책 조항
본 소프트웨어는 교육 및 정보 제공 목적으로만 제작되었습니다.
- 본 시스템의 분석 결과는 투자 권유 또는 금융 조언이 아닙니다.
- AI 및 ML 모델의 예측은 미래 수익을 보장하지 않습니다.
- 주식 투자에는 원금 손실의 위험이 있습니다.
- 최종 투자 결정과 그에 따른 손익은 전적으로 투자자 본인에게 있습니다.
📄 라이선스
이 프로젝트는 MIT License를 따릅니다.
(C) 2026. All rights reserved.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file koreanstocks-0.4.2.tar.gz.
File metadata
- Download URL: koreanstocks-0.4.2.tar.gz
- Upload date:
- Size: 194.2 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.14
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
6754a707554ca1833355bb40bcd77cb82e63dcefaa40be3512b1d8e644afec5f
|
|
| MD5 |
656bf3331f08db104934b653ca7ef55a
|
|
| BLAKE2b-256 |
e8dfe878846581b5b312411c4e7a7deecb3534edcef05880e98a6a8c4a588557
|
File details
Details for the file koreanstocks-0.4.2-py3-none-any.whl.
File metadata
- Download URL: koreanstocks-0.4.2-py3-none-any.whl
- Upload date:
- Size: 181.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.14
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
d1af101d69a531edf307de1ddee79686ff75975ec865c652800418b0a951083a
|
|
| MD5 |
bc15a902c47e5c02f57859a38376c244
|
|
| BLAKE2b-256 |
22a9c7e174f744fa68f6c087864aa8f34a11370632c41a3a038f4167d01ff1ea
|