HCC Algorithm for FHIR Resources

These details have not been verified by PyPI

Project links

License
- OSI Approved :: Apache Software License
Operating System
- OS Independent
Programming Language
- Python :: 3

Project description

`hccinfhir` (HCC in FHIR)

A Python library for extracting standardized service-level data from FHIR ExplanationOfBenefit resources, with a focus on supporting HCC (Hierarchical Condition Category) risk adjustment calculations.

Features

Extract diagnosis codes, procedures, providers, and other key data elements from FHIR EOBs
Support for both BCDA (Blue Button 2.0) and standard FHIR R4 formats
Pydantic models for type safety and data validation
Standardized Service Level Data (SLD) output format
Multiple HCC model support (V22, V24, V28, ESRD V21, ESRD V24, RxHCC V08)
Flexible input options: FHIR EOBs, service data, or direct diagnosis codes

Installation

pip install hccinfhir

Why FHIR-Based HCC Processing?

Risk Adjustment calculations traditionally rely on processed claims data, leading to information loss and reconciliation challenges. hccinfhir processes FHIR resources directly because:

FHIR represents the source of truth with complete clinical and administrative data
Risk Adjustment requires multiple data elements beyond diagnosis codes
Direct processing eliminates data transformation errors and simplifies reconciliation

Data Model & Flexibility

While built for native FHIR processing, hccinfhir works with any data source that can be transformed into the SLD (Service Level Data) format:

sld = [{
    "procedure_code": "99214",
    "diagnosis_codes": ["E11.9", "I10"],
    "claim_type": "71",
    "provider_specialty": "01", 
    "service_date": "2024-01-15"
}, ...]

Or, for direct risk score calculation from a list of diagnosis codes, you only need the model name, diagnosis codes, and basic demographic factors:

from hccinfhir.model_calculate import calculate_raf

diagnosis_codes = ['E119', 'I509']  # Diabetes without complications, Heart failure
age = 67
sex = 'F'
model_name = "CMS-HCC Model V24"

result = calculate_raf(
   diagnosis_codes=diagnosis_codes,
   model_name=model_name,
   age=age,
   sex=sex
)

For more details on the SLD format, see the datamodels.py file.

Sample Data

The package includes comprehensive sample data for testing and demonstration purposes:

from hccinfhir import (
    get_eob_sample,
    get_eob_sample_list,
    get_837_sample,
    get_837_sample_list,
    list_available_samples
)

# Get individual EOB samples (cases 1, 2, or 3)
eob_data = get_eob_sample(1)

# Get multiple EOB samples (up to 200 available)
eob_list = get_eob_sample_list(limit=10)

# Get 837 claim samples (cases 0 through 11)
claim_data = get_837_sample(0)

# Get information about available samples
info = list_available_samples()

For detailed usage examples, see the examples/sample_data_usage.py file.

Core Components

1. Extractor Module

Processes FHIR ExplanationOfBenefit resources to extract Minimum Data Elements (MDE):

from hccinfhir.extractor import extract_sld, extract_sld_list

sld = extract_sld(eob_data)  # Process single EOB

sld_list = extract_sld_list([eob1, eob2])  # Process multiple EOBs

2. Filter Module

Implements claim filtering rules:

Inpatient/outpatient criteria - Type of Bill + Eligible CPT/HCPCS
Professional service requirements - Eligible CPT/HCPCS
Provider validation (Not in scope for this release, applicable to RAPS)

from hccinfhir.filter import apply_filter

filtered_sld = apply_filter(sld_list)

3. Logic Module

Implements core HCC calculation logic:

Maps diagnosis codes to HCC categories
Applies hierarchical rules and interactions
Calculates final RAF scores
Integrates with standard CMS data files

from hccinfhir.model_calculate import calculate_raf

diagnosis_codes = ['E119', 'I509']  # Diabetes without complications, Heart failure
result = calculate_raf(
   diagnosis_codes=diagnosis_codes,
   model_name="CMS-HCC Model V24",
   age=67,
   sex='F'
)

4. HCCInFHIR Class

The main processor class that integrates extraction, filtering, and calculation components:

from hccinfhir.hccinfhir import HCCInFHIR
from hccinfhir.datamodels import Demographics

# Initialize with custom configuration
hcc_processor = HCCInFHIR(
    filter_claims=True,                                    # Enable claim filtering
    model_name="CMS-HCC Model V28",                       # Choose HCC model version
    proc_filtering_filename="ra_eligible_cpt_hcpcs_2025.csv",  # CPT/HCPCS filtering rules
    dx_cc_mapping_filename="ra_dx_to_cc_2025.csv"         # Diagnosis to CC mapping
)

# Define beneficiary demographics
demographics = {
    age=67,
    sex='F'
}

# Method 1: Process FHIR EOB resources
raf_result = hcc_processor.run(eob_list, demographics)

# Method 2: Process service level data
service_data = [{
    "procedure_code": "99214",
    "claim_diagnosis_codes": ["E11.9", "I10"],
    "claim_type": "71",
    "service_date": "2024-01-15"
}]
raf_result = hcc_processor.run_from_service_data(service_data, demographics)

# Method 3: Direct diagnosis processing
diagnosis_codes = ['E119', 'I509']
raf_result = hcc_processor.calculate_from_diagnosis(diagnosis_codes, demographics)

# RAF Result contains:
print(f"Risk Score: {raf_result['risk_score']}")
print(f"HCC List: {raf_result['hcc_list']}")
print(f"CC to Diagnosis Mapping: {raf_result['cc_to_dx']}")
print(f"Applied Coefficients: {raf_result['coefficients']}")
print(f"Applied Interactions: {raf_result['interactions']}")

The HCCInFHIR class provides three main processing methods:

run(eob_list, demographics): Process FHIR ExplanationOfBenefit resources
- Extracts service data from FHIR resources
- Applies filtering rules if enabled
- Calculates RAF scores using the specified model
run_from_service_data(service_data, demographics): Process standardized service data
- Accepts pre-formatted service level data
- Validates data structure using Pydantic models
- Applies filtering and calculates RAF scores
calculate_from_diagnosis(diagnosis_codes, demographics): Direct diagnosis processing
- Processes raw diagnosis codes without service context
- Useful for quick RAF calculations or validation
- Bypasses service-level filtering

Each method returns a RAFResult containing:

Final risk score
List of HCCs
Mapping of condition categories to diagnosis codes
Applied coefficients and interactions
Processed service level data (when applicable)

Testing

After installing hatch

$ hatch shell
$ pip install -e .
$ pytest tests/*

Dependencies

Pydantic >= 2.10.3
Standard Python libraries

Research: FHIR BCDA and 837 Field Mapping Analysis

Core Identifiers

Field	837 Source	FHIR BCDA Source	Alignment Analysis
claim_id	CLM01 segment	eob.id	✓ Direct mapping
patient_id	NM109 when NM101='IL'	eob.patient.reference (last part after '/')	✓ Aligned but different formats

Provider Information

Field	837 Source	FHIR BCDA Source	Alignment Analysis
performing_provider_npi	NM109 when NM101='82' and NM108='XX'	careTeam member with role 'performing'/'rendering'	✓ Aligned
billing_provider_npi	NM109 when NM101='85' and NM108='XX'	contained resources with NPI system identifier	✓ Conceptually aligned
provider_specialty	PRV03 when PRV01='PE'	careTeam member qualification with specialty system	✓ Aligned but different code systems

Claim Type Information

Field	837 Source	FHIR BCDA Source	Alignment Analysis
claim_type	GS08 (mapped via CLAIM_TYPES)	eob.type with claim_type system	✓ Aligned but different coding
facility_type	CLM05-1 (837I only)	facility.extension with facility_type system	✓ Aligned for institutional claims
service_type	CLM05-2 (837I only)	extension or eob.type with service_type system	✓ Aligned for institutional claims

Service Line Information

Field	837 Source	FHIR BCDA Source	Alignment Analysis
procedure_code	SV1/SV2 segment, element 2	item.productOrService with pr system	✓ Aligned
ndc	LIN segment after service line	item.productOrService with ndc system or extension	✓ Aligned but different locations
quantity	SV1/SV2 element 4	item.quantity.value	✓ Direct mapping
quantity_unit	SV1/SV2 element 5	item.quantity.unit	✓ Direct mapping
service_date	DTP segment with qualifier 472	item.servicedPeriod or eob.billablePeriod	✓ Aligned
place_of_service	SV1 element 6	item.locationCodeableConcept with place_of_service system	✓ Aligned
modifiers	SV1/SV2 segment, additional qualifiers	item.modifier with pr system	✓ Aligned

Diagnosis Information

Field	837 Source	FHIR BCDA Source	Alignment Analysis
linked_diagnosis_codes	SV1/SV2 diagnosis pointers + HI segment codes	item.diagnosisSequence + diagnosis lookup	✓ Aligned but different structure
claim_diagnosis_codes	HI segment codes	diagnosis array with icd10cm/icd10 systems	✓ Aligned

Additional Fields

Field	837 Source	FHIR BCDA Source	Alignment Analysis
allowed_amount	Not available in 837	item.adjudication with 'eligible' category	⚠️ Only in FHIR

Key Differences and Notes

Structural Differences:
- 837 uses a segment-based approach with positional elements
- FHIR uses a nested object structure with explicit systems and codes
Code Systems:
- FHIR explicitly defines systems for each code (via SYSTEMS constant)
- 837 uses implicit coding based on segment position and qualifiers
Data Validation:
- FHIR implementation uses Pydantic models for validation
- 837 implements manual validation and parsing
Diagnosis Handling:
- 837: Direct parsing from HI segment with position-based lookup
- FHIR: Uses sequence numbers and separate diagnosis array
Provider Information:
- 837: Direct from NM1 segments with role qualifiers
- FHIR: Through careTeam structure with role coding

TODO: Enhancement Suggestions

Consider adding validation for code systems in 837 parser to match FHIR's explicitness
Standardize date handling between both implementations
Add support for allowed_amount in 837 if available in different segments
Consider adding more robust error handling in both implementations

Data Files

ra_dx_to_cc_mapping_2026.csv

WITH latest_years AS (
  SELECT 
    model_name,
    MAX(year) as latest_year
  FROM mimi_ws_1.cmspayment.ra_dx_to_cc_mapping 
  WHERE model_type = 'Initial'
    AND year <= 2026  -- Don't go beyond 2026
  GROUP BY model_name
)
SELECT 
  r.diagnosis_code, 
  r.cc, 
  r.model_name
FROM mimi_ws_1.cmspayment.ra_dx_to_cc_mapping r
INNER JOIN latest_years l 
  ON r.model_name = l.model_name 
  AND r.year = l.latest_year
WHERE r.model_type = 'Initial'
ORDER BY r.model_name, r.diagnosis_code;

ra_hierarchies_2026.csv

WITH latest_dates AS (
  SELECT 
    model_domain,
    model_version,
    model_fullname,
    MAX(eff_last_date) as latest_eff_last_date
  FROM mimi_ws_1.cmspayment.ra_hierarchies 
  GROUP BY model_domain, model_version, model_fullname
)
SELECT 
  r.cc_parent, 
  r.cc_child, 
  r.model_domain, 
  r.model_version, 
  r.model_fullname
FROM mimi_ws_1.cmspayment.ra_hierarchies r
INNER JOIN latest_dates l 
  ON r.model_domain = l.model_domain 
  AND r.model_version = l.model_version
  AND r.model_fullname = l.model_fullname
  AND r.eff_last_date = l.latest_eff_last_date
ORDER BY r.model_domain, r.model_version, r.model_fullname, r.cc_parent, r.cc_child;

ra_coefficients_2026.csv

WITH preferred_records AS (
  SELECT 
    model_domain,
    model_version,
    MAX(eff_last_date) as latest_eff_last_date
  FROM mimi_ws_1.cmspayment.ra_coefficients
  GROUP BY model_domain, model_version
)
SELECT 
  r.coefficient,
  r.value, 
  r.model_domain, 
  r.model_version
FROM mimi_ws_1.cmspayment.ra_coefficients r
INNER JOIN preferred_records p
  ON r.model_domain = p.model_domain 
  AND r.model_version = p.model_version
  AND r.eff_last_date = p.latest_eff_last_date
ORDER BY r.model_domain, r.model_version, r.coefficient;

ra_eligible_cpt_hcpcs_2026.csv

SELECT DISTINCT cpt_hcpcs_code
FROM mimi_ws_1.cmspayment.ra_eligible_cpt_hcpcs
WHERE is_included = 'yes' AND YEAR(mimi_src_file_date) = 2025;

Contributing

Join us at mimilabs. Reference data available in MIMILabs data lakehouse.

Publishing (only for those maintainers...)

Inside the hatch

$ hatch build
$ hatch publish

License

Apache License 2.0

Project details

These details have not been verified by PyPI

Project links

License
- OSI Approved :: Apache Software License
Operating System
- OS Independent
Programming Language
- Python :: 3

Release history Release notifications | RSS feed

0.3.3

Apr 6, 2026

0.3.2

Apr 4, 2026

0.3.1

Mar 26, 2026

0.3.0

Feb 24, 2026

0.2.9

Feb 3, 2026

0.2.8

Jan 20, 2026

0.2.7

Jan 16, 2026

0.2.6

Jan 16, 2026

0.2.5

Dec 13, 2025

0.2.4

Dec 13, 2025

0.2.3

Dec 13, 2025

0.2.2

Dec 7, 2025

0.2.1

Nov 30, 2025

0.2.0

Nov 29, 2025

0.1.9

Nov 13, 2025

0.1.8

Nov 7, 2025

0.1.7

Nov 1, 2025

0.1.6

Oct 2, 2025

0.1.5

Sep 17, 2025

0.1.4

Sep 1, 2025

0.1.3

Aug 27, 2025

This version

0.1.2

Aug 26, 2025

0.1.1

Aug 7, 2025

0.1.0

Mar 31, 2025

0.0.9

Mar 31, 2025

0.0.8

Mar 18, 2025

0.0.7

Mar 18, 2025

0.0.6

Mar 18, 2025

0.0.5

Mar 18, 2025

0.0.4

Mar 18, 2025

0.0.3

Dec 10, 2024

0.0.2

Dec 10, 2024

0.0.1

Dec 5, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

hccinfhir-0.1.2.tar.gz (509.3 kB view details)

Uploaded Aug 26, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

hccinfhir-0.1.2-py3-none-any.whl (554.9 kB view details)

Uploaded Aug 26, 2025 Python 3

File details

Details for the file hccinfhir-0.1.2.tar.gz.

File metadata

Download URL: hccinfhir-0.1.2.tar.gz
Upload date: Aug 26, 2025
Size: 509.3 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: python-httpx/0.28.1

File hashes

Hashes for hccinfhir-0.1.2.tar.gz
Algorithm	Hash digest
SHA256	`047f2ea9353b8444b53c975cf78efa6ce7fcc52ceed7c65f851449f955ff2ca4`
MD5	`99bd30878b7246dc4c955ca860bfda42`
BLAKE2b-256	`f940f1f47f9014c27cf693dbc05c9623dda06845440fd4a06573e17b965ee78a`

See more details on using hashes here.

File details

Details for the file hccinfhir-0.1.2-py3-none-any.whl.

File metadata

Download URL: hccinfhir-0.1.2-py3-none-any.whl
Upload date: Aug 26, 2025
Size: 554.9 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: python-httpx/0.28.1

File hashes

Hashes for hccinfhir-0.1.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`599669cba31b12e04772fb09deff84f6ed0f04184ca799ba461410fc2bd4793e`
MD5	`59b499b26877cd48b5c523330496fedf`
BLAKE2b-256	`b4279e7e6a665837fb52804b635efa4b3bc5d7d887713c9212a27eab771e1134`

See more details on using hashes here.

hccinfhir 0.1.2

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

hccinfhir (HCC in FHIR)

Features

Installation

Why FHIR-Based HCC Processing?

Data Model & Flexibility

Sample Data

Core Components

1. Extractor Module

2. Filter Module

3. Logic Module

4. HCCInFHIR Class

Testing

Dependencies

Research: FHIR BCDA and 837 Field Mapping Analysis

Core Identifiers

Provider Information

Claim Type Information

Service Line Information

Diagnosis Information

Additional Fields

Key Differences and Notes

TODO: Enhancement Suggestions

Data Files

Contributing

Publishing (only for those maintainers...)

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

`hccinfhir` (HCC in FHIR)