Advanced Recommendation Systems Library with State-of-the-Art Algorithms

These details have not been verified by PyPI

Project links

Project description

CoreRec

Production-grade recommendation systems framework.
57+ models · Unified API · Multi-stage pipelines · Research to deployment.

pip install corerec pip install cr_learn

Docs · PyPI · Issues · Modern Guide

What is CoreRec?

CoreRec is a modern recommendation engine built for the deep learning era. It implements industry-standard architectures — Two-Tower retrieval, Transformers, Graph Neural Networks — following the multi-stage pipeline approach used at Netflix, YouTube, and major e-commerce platforms.

Unified API: every model shares fit, predict, recommend, save, load
57+ algorithms: deep learning, collaborative filtering, graph-based, sequential, Bayesian
Multi-stage pipeline: Retrieval → Ranking → Reranking in a single orchestrated system
cr_learn: companion dataset library for fast prototyping on real-world data

Downloads per month

Last updated: 2024-11-20

Installation

pip install --upgrade corerec
pip install cr_learn          # dataset companion (optional but recommended)

Requirements

Python ≥ 3.8
PyTorch ≥ 1.9
NumPy, Pandas, SciPy

Some models (TwoTower, multimodal fusion, and other encoder-based engines) depend on Hugging Face transformers. Install the extra to use them:

pip install "corerec[transformers]"

Quickstart in 60 seconds

from corerec.engines import DCN
from cr_learn import ml_1m

# 1. Load a real dataset (auto-downloads MovieLens 1M)
data = ml_1m.load()
ratings = data['ratings']

user_ids = ratings['user_id'].values
item_ids = ratings['movie_id'].values
r        = ratings['rating'].values

# 2. Train
model = DCN(embedding_dim=64, epochs=10, verbose=True)
model.fit(user_ids=user_ids, item_ids=item_ids, ratings=r)

# 3. Recommend
recs = model.recommend(user_id=1, top_k=10)
print(recs)

That's it. The same three calls — fit, recommend, predict — are shared by every model in CoreRec. A few models expect their input in a model-specific shape (e.g. SASRec takes a user×item interaction matrix, GNNRec needs ratings binarized to [0, 1]); see each model's section below and the QuickStart for those cases.

Core API

Every model in CoreRec inherits from BaseRecommender and exposes the same interface:

model.fit(user_ids, item_ids, ratings)          # train
model.predict(user_id, item_id)                 # → float score
model.recommend(user_id, top_k=10)              # → list of item IDs
model.batch_predict([(uid, iid), ...])          # → list of floats
model.save('artifacts/my_model')                # persist (safe bundle: base path, no extension)
model = ModelClass.load('artifacts/my_model')   # restore

Persistence note: save writes a safe bundle — pass a base path (not a .pkl file). It produces <base>.meta.json + <base>.weights.pt; load takes the same base path. See Safe Bundle Persistence.

Model Families

Deep Learning (29 models)

Best for feature-rich data with complex interaction patterns.

Model	Description	Import
DCN	Deep & Cross Network — explicit + implicit feature crossing	`from corerec.engines import DCN`
DeepFM	Factorization Machines + Deep Network	`from corerec.engines import DeepFM`
GNNRec	Graph Neural Network recommender	`from corerec.engines import GNNRec`
MIND	Multi-Interest sequential network	`from corerec.engines import MIND`
SASRec	Self-Attentive Sequential Recommendation	`from corerec.engines import SASRec`
NASRec	Neural Architecture Search for RecSys	`from corerec.engines import NASRec`
BERT4Rec	Bidirectional Transformer for sequences	`from corerec.engines.content_based import BERT4Rec`
TwoTower	Dual-encoder retrieval (YouTube-style)	`from corerec.engines import TwoTower`
AFM, AutoInt, DIN, DIEN, DLRM, PNN, NCF, NFM, FIBINet, xDeepFM, Wide&Deep, YouTubeDNN, ESMM, MMoE, PLE, FGCNN, Monolith …		see `corerec.engines`

DCN example

from corerec.engines import DCN
from cr_learn import ml_1m

data = ml_1m.load()
ratings = data['ratings']

model = DCN(
    embedding_dim=64,
    num_cross_layers=3,
    deep_layers=[128, 64],
    epochs=20,
    learning_rate=0.001,
    verbose=True,
)
model.fit(
    user_ids=ratings['user_id'].values,
    item_ids=ratings['movie_id'].values,
    ratings=ratings['rating'].values,
)

score = model.predict(user_id=1, item_id=100)
recs  = model.recommend(user_id=1, top_k=10)
print(f"Score: {score:.3f}  |  Top-10: {recs}")

TwoTower (retrieval at scale)

Requires the transformers extra: pip install "corerec[transformers]".

from corerec.engines import TwoTower

model = TwoTower(user_input_dim=64, item_input_dim=128, embedding_dim=256)
model.fit(user_ids, item_ids, interactions)

candidates = model.recommend(user_id=42, top_k=100)

Sequential / transformer

from corerec.engines.content_based import BERT4Rec

model = BERT4Rec(hidden_dim=256, num_layers=4)
model.fit(user_ids, item_ids, interactions)
next_items = model.recommend(user_id=1, top_k=10)

Collaborative Filtering

Simple Algorithm for Recommendation (SAR) — fast, no GPU required.

from corerec.engines.collaborative import SAR
import pandas as pd

df = pd.DataFrame({
    'userID': [0, 0, 1, 1, 2],
    'itemID': [10, 20, 10, 30, 20],
    'rating': [5.0, 4.0, 5.0, 3.0, 4.0],
})

model = SAR(similarity_type='jaccard')   # also: 'cosine', 'lift', 'cooccurrence'
model.fit(df)

recs = model.recommend(user_id=0, top_k=5)
batch_recs = model.recommend_k_items(df[['userID']], top_k=10)  # all users at once

Content-Based Filtering

from corerec.engines.content_based import TFIDFRecommender

items = [101, 102, 103]
docs  = {101: "action adventure film", 102: "romantic comedy", 103: "thriller suspense"}

model = TFIDFRecommender()
model.fit(items=items, docs=docs)

recs  = model.recommend_by_text(query_text="action thriller", top_n=5)

Graph-Based

GNNRec trains with BCE loss, so ratings must be in [0, 1] (implicit feedback or normalized explicit ratings). Binarize raw ratings before calling fit:

import numpy as np
from corerec.engines import GNNRec

# Raw explicit ratings (e.g. 1-5) -> implicit signal in [0, 1]
binary_ratings = (ratings >= 1.0).astype(np.float32)

model = GNNRec(embedding_dim=64, epochs=20)
model.fit(user_ids, item_ids, binary_ratings)
recs = model.recommend(user_id=1, top_k=10)

Multi-Modal Fusion

from corerec.multimodal.fusion_strategies import MultiModalFusion

fusion = MultiModalFusion(
    modality_dims={'text': 768, 'image': 2048, 'meta': 32},
    output_dim=256,
    strategy='attention',
)
item_embedding = fusion({'text': text_emb, 'image': img_emb, 'meta': meta})

Multi-Stage Pipeline

Production systems use Retrieval → Ranking → Reranking. CoreRec ships this pattern out of the box:

from corerec.pipelines import RecommendationPipeline, PipelineConfig

pipeline = RecommendationPipeline(
    config=PipelineConfig(retrieval_k=200, ranking_k=50, final_k=10)
)
pipeline.add_retriever(my_retriever, weight=1.0)
pipeline.set_ranker(my_ranker)
pipeline.add_reranker(diversity_reranker)

result = pipeline.recommend(user_id=123, top_k=10)

cr_learn — Dataset Library

cr_learn is CoreRec's companion package. It provides one-line access to real recommendation datasets, auto-downloading and caching them locally.

pip install cr_learn

Available datasets

Dataset	Module	Load
MovieLens 1M	`cr_learn.ml_1m`	`ml_1m.load()`
IJCAI-16 (Tmall/O2O)	`cr_learn.ijcai`	`ijcai.load()`
Tmall	`cr_learn.tmall`	`tmall.load()`
Steam Games	`cr_learn.steam_games`	`steam_games.load()`
BeiDou/BeiBei	`cr_learn.beibei`	`beibei.load()`
LibraryThing	`cr_learn.library_thing`	`library_thing.load()`
Rees46	`cr_learn.rees46`	`rees46.load()`

Example: MovieLens 1M

from cr_learn import ml_1m

data = ml_1m.load()
# Returns dict with keys: 'users', 'ratings', 'movies',
#                         'user_interactions', 'item_features', 'trn_buy'

print(data['ratings'].head())
#    user_id  movie_id  rating  timestamp
# 0        1      1193       5  978300760
# ...

# Ready-to-use training data
ratings = data['ratings']
user_ids = ratings['user_id'].values
item_ids = ratings['movie_id'].values
r        = ratings['rating'].values

Example: IJCAI-16 (O2O commerce)

from cr_learn import ijcai

data = ijcai.load(limit_rows=50000)
# Returns dict with train/test DataFrames + user/item features

Datasets auto-detect in examples

All example scripts try cr_learn first and fall back to the bundled sample_data/ CSVs — no manual setup needed.

Optimizers / Boosters

CoreRec ships its own optimizer suite (compatible with torch.optim API):

from corerec.cr_boosters.adam   import Adam
from corerec.cr_boosters.nadam  import NAdam

optimizer = Adam(model.parameters(), lr=0.001)

Available: Adam · NAdam · Adamax · Adadelta · Adagrad · ASGD · LBFGS · RMSprop · SGD · SparseAdam

Runnable Examples

Deep Learning Engines

python examples/engines_dcn_example.py        # Deep & Cross Network
python examples/engines_deepfm_example.py     # DeepFM
python examples/engines_gnnrec_example.py     # GNN-based recommender
python examples/engines_mind_example.py       # MIND (multi-interest)
python examples/engines_nasrec_example.py     # NASRec
python examples/engines_sasrec_example.py     # SASRec (self-attentive)

Collaborative / Hybrid

python examples/unionized_sar_example.py      # SAR (item-to-item similarity)
python examples/unionized_fast_example.py     # FastAI-style embedding
python examples/unionized_rbm_example.py      # Restricted Boltzmann Machine
python examples/unionized_rlrmc_example.py    # Riemannian low-rank matrix completion
python examples/unionized_geomlc_example.py   # Geometric matrix completion

Content Filter

python examples/content_filter_tfidf_example.py   # TF-IDF content filter

Frontends (imshow)

python examples/imshow_connector_example.py   # plug-and-play demo UI
# Then open http://127.0.0.1:8000

Full Test Suite

python examples/run_all_algo_tests_example.py  # discover + run all algorithm tests

Tip: All scripts add the project root to sys.path automatically. If cr_learn is installed, they prefer it; otherwise they use sample_data/ CSVs bundled in this repo.

Project Structure

Area	Path
Core models	corerec/ ├── engines/ │ ├── dcn.py, deepfm.py, gnnrec.py, mind.py, │ │ sasrec.py, nasrec.py, bert4rec.py, two_tower.py │ ├── collaborative/ SAR, LightGCN, NCF, TwoTower │ └── content_based/ TFIDFRecommender, YoutubeDNN, DSSM ├── pipelines/ RecommendationPipeline, DataPipeline ├── retrieval/ Candidate retrieval, ensemble fusion ├── ranking/ Pointwise, pairwise, feature-cross rankers ├── reranking/ Diversity, fairness rerankers ├── multimodal/ MultiModalFusion, encoders ├── embeddings/ Pretrained embeddings, tables ├── evaluation/ Evaluator, metrics (RMSE, NDCG, MAP …) ├── explanation/ Feature-based & generative explainers ├── serving/ ModelServer, batch inference ├── api/ BaseRecommender, exceptions, mixins └── cr_boosters/ Adam, NAdam, SGD, … optimizers
Datasets	cr_learn_setup/cr_learn/ ├── ml_1m.py MovieLens 1M ├── ijcai.py IJCAI-16 O2O ├── tmall.py Tmall ├── beibei.py BeiBei ├── steam_games.py Steam Games ├── rees46.py Rees46 └── library_thing.py
Docs & Examples	docs/source/ ├── tutorials/ 57 model tutorials (DCN, DeepFM, SASRec …) ├── api/ Full API reference ├── user_guide/ Data prep, training, persistence, best practices └── examples/ Basic, advanced, production deployment examples/ Runnable .py scripts for every engine

Area

Path

Core models

corerec/
├── engines/
│   ├── dcn.py, deepfm.py, gnnrec.py, mind.py,
│   │   sasrec.py, nasrec.py, bert4rec.py, two_tower.py
│   ├── collaborative/       SAR, LightGCN, NCF, TwoTower
│   └── content_based/       TFIDFRecommender, YoutubeDNN, DSSM
├── pipelines/               RecommendationPipeline, DataPipeline
├── retrieval/               Candidate retrieval, ensemble fusion
├── ranking/                 Pointwise, pairwise, feature-cross rankers
├── reranking/               Diversity, fairness rerankers
├── multimodal/              MultiModalFusion, encoders
├── embeddings/              Pretrained embeddings, tables
├── evaluation/              Evaluator, metrics (RMSE, NDCG, MAP …)
├── explanation/             Feature-based & generative explainers
├── serving/                 ModelServer, batch inference
├── api/                     BaseRecommender, exceptions, mixins
└── cr_boosters/             Adam, NAdam, SGD, … optimizers

Datasets

cr_learn_setup/cr_learn/
├── ml_1m.py       MovieLens 1M
├── ijcai.py       IJCAI-16 O2O
├── tmall.py       Tmall
├── beibei.py      BeiBei
├── steam_games.py Steam Games
├── rees46.py      Rees46
└── library_thing.py

Docs & Examples

docs/source/ ├── tutorials/ 57 model tutorials (DCN, DeepFM, SASRec …) ├── api/ Full API reference ├── user_guide/ Data prep, training, persistence, best practices └── examples/ Basic, advanced, production deployment

examples/ Runnable .py scripts for every engine

VishGraphs

VishGraphs is CoreRec's built-in module for graph visualization and analysis. It ships inside CoreRec — no extra install, import it from corerec:

from corerec import vish_graphs as vg

# Generate a random graph and save to CSV
graph_file = vg.generate_random_graph(num_people=100, file_path="graph.csv")

# Load as adjacency matrix
adj_matrix = vg.bipartite_matrix_maker(graph_file)

# Highlight the most-connected nodes
top_nodes = vg.find_top_nodes(adj_matrix, num_nodes=3)

vg.draw_graph(adj_matrix, top_nodes=top_nodes)          # 2D
vg.draw_graph_3d(adj_matrix, top_nodes=top_nodes)       # 3D
vg.show_bipartite_relationship(adj_matrix)              # bipartite view

API summary:

Function	Description
`generate_random_graph(n, file_path, seed)`	Generate & save random adjacency matrix
`draw_graph(adj, top_nodes, recommended_nodes, ...)`	2D graph visualization
`draw_graph_3d(adj, top_nodes, ...)`	3D graph visualization
`show_bipartite_relationship(adj)`	Bipartite relationship view
`find_top_nodes(matrix, num_nodes)`	Most-connected nodes
`bipartite_matrix_maker(csv_path)`	Load adjacency matrix from CSV

Documentation

Full documentation is available at vishesh9131.github.io/CoreRec.

Build locally:

pip install sphinx sphinx-design myst-parser sphinx-book-theme
sphinx-build -b html docs/source docs/build/html
open docs/build/html/index.html

Key sections:

Troubleshooting

ImportError / module not found

pip install --upgrade corerec

NumPy 2.x conflict with PyTorch

pip install "numpy<2"

CUDA / GPU issues

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118

cr_learn dataset download fails

Examples fall back to sample_data/ CSVs bundled in this repo automatically. No action needed.

For anything else: open an issue or check the FAQ.

Contributing

We welcome bug fixes, new features, docs improvements, and new models.

Fork the repo
Create a feature branch (git checkout -b feature/my-thing)
Make your changes following the existing code style
Open a pull request with a clear description

See CONTRIBUTING.md for the full guide.

Core Team

@vishesh9131

Founder / Creator

License

This library and its utilities are for research purposes only. Commercial use requires explicit consent from the author (@vishesh9131).

See LICENSE for details.

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.5.4

Jun 5, 2026

0.5.3

May 31, 2026

0.5.2

Feb 23, 2026

0.5.0

Aug 26, 2025

0.4.1.9

Mar 22, 2025

0.4.1.8

Mar 22, 2025

0.4.1.8a2 pre-release

Mar 22, 2025

0.4.1.8a1 pre-release

Mar 22, 2025

0.4.1.7

Mar 22, 2025

0.4.1.5

Mar 22, 2025

0.4.1.3

Mar 22, 2025

0.4.1.2

Mar 22, 2025

0.4.1.1

Mar 22, 2025

0.4.1

Mar 21, 2025

0.4.0

Mar 21, 2025

0.3.0

Nov 5, 2024

0.2.8

Nov 5, 2024

0.2.7

Nov 5, 2024

0.2.6

Nov 5, 2024

0.2.5

Nov 5, 2024

0.2.4

Nov 5, 2024

0.2.3

Oct 30, 2024

0.2.2

Oct 7, 2024

0.2.1

Oct 7, 2024

0.2.0

Oct 7, 2024

0.1.9

Sep 6, 2024

0.1.8

Aug 31, 2024

0.1.7

Aug 31, 2024

0.1.6

Aug 31, 2024

0.1.5

Aug 29, 2024

0.1.4

Aug 21, 2024

0.1.2

Aug 17, 2024

0.1.1

Aug 17, 2024

0.1.0

Aug 17, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

corerec-0.5.4.tar.gz (1.6 MB view details)

Uploaded Jun 5, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

corerec-0.5.4-py3-none-any.whl (2.0 MB view details)

Uploaded Jun 5, 2026 Python 3

File details

Details for the file corerec-0.5.4.tar.gz.

File metadata

Download URL: corerec-0.5.4.tar.gz
Upload date: Jun 5, 2026
Size: 1.6 MB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for corerec-0.5.4.tar.gz
Algorithm	Hash digest
SHA256	`efa770354c68cf8fd58c9167f39ea67ab6601fbb34a2ab13fc8b0bcd40440784`
MD5	`42ae92f1766e704e9d6a10bd5e22d156`
BLAKE2b-256	`714f2d32dfd997f269e283e713981e5314862861d37f5d410b0db216d350db5a`

See more details on using hashes here.

File details

Details for the file corerec-0.5.4-py3-none-any.whl.

File metadata

Download URL: corerec-0.5.4-py3-none-any.whl
Upload date: Jun 5, 2026
Size: 2.0 MB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for corerec-0.5.4-py3-none-any.whl
Algorithm	Hash digest
SHA256	`de72053e5324d83f36907bcc5ea83c3dcf0905a2f2b2fd58dfff3f4a3afee64c`
MD5	`af9f80859aba09088c319f13932c2552`
BLAKE2b-256	`4048c8610f44c5f9c2486b4030a5966da6731b610ed5093d558a5e1ecbdfbe0d`

See more details on using hashes here.

corerec 0.5.4

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

CoreRec

What is CoreRec?

Downloads per month

Installation

Requirements

Quickstart in 60 seconds

Core API

Model Families

Deep Learning (29 models)

DCN example

TwoTower (retrieval at scale)

Sequential / transformer

Collaborative Filtering

Content-Based Filtering

Graph-Based

Multi-Modal Fusion

Multi-Stage Pipeline

cr_learn — Dataset Library

Available datasets

Example: MovieLens 1M

Example: IJCAI-16 (O2O commerce)

Datasets auto-detect in examples

Optimizers / Boosters

Runnable Examples

Deep Learning Engines

Collaborative / Hybrid

Content Filter

Frontends (imshow)

Full Test Suite

Project Structure

VishGraphs

Documentation

Troubleshooting

Contributing

Core Team

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes