A Python library for Network Influence Maximization
Project description
PyNetIM
PyNetIM 是一个用于**社交网络影响力最大化(Influence Maximization, IM)**问题的 Python 库,集成了多种经典算法与扩散模型,并提供 Python 实现 + C++ 加速后端,适用于算法复现、性能对比与科研实验。
📦 最新版本
当前版本: v0.4.3
发布日期: 2026-03-30
🎯 v0.4.3 主要更新
✨ 新功能
- IC 和 LT 模型新增激活节点记录功能:
- 添加
record_activated参数(默认为false),用于控制是否记录种子集激活的节点 - 添加
set_record_activated(record)方法,可在运行时动态开启/关闭记录功能 - 添加
run_single_simulation(seed=0)方法,用于单次独立传播模拟 - 每次调用
run_single_simulation都会进行一次独立的传播模拟,从种子集出发,返回该次模拟中被激活的所有节点 - 支持通过不同的
seed参数进行多次独立的模拟实验
- 添加
📚 API 更新
-
IndependentCascadeModel:
- 构造函数新增
record_activated参数 - 新增
set_record_activated(record: bool)方法 - 新增
run_single_simulation(seed: int = 0) -> Set[int]方法
- 构造函数新增
-
LinearThresholdModel:
- 构造函数新增
record_activated参数 - 新增
set_record_activated(record: bool)方法 - 新增
run_single_simulation(seed: int = 0) -> Set[int]方法
- 构造函数新增
🧪 测试
- 新增功能验证测试:
- IC 模型单次模拟测试
- LT 模型单次模拟测试
- 多次独立模拟测试
set_record_activated动态切换测试- 编译和运行测试全部通过
📝 使用示例
# IC 模型
from pynetim.cpp.diffusion_model import IndependentCascadeModel
ic_model = IndependentCascadeModel(graph, seeds, record_activated=True)
activated_nodes = ic_model.run_single_simulation(seed=42)
print(f"激活的节点: {activated_nodes}")
# LT 模型
from pynetim.cpp.diffusion_model import LinearThresholdModel
lt_model = LinearThresholdModel(graph, seeds, theta_l=0.0, theta_h=1.0, record_activated=True)
activated_nodes = lt_model.run_single_simulation(seed=42)
print(f"激活的节点: {activated_nodes}")
# 动态开启/关闭记录
ic_model.set_record_activated(True)
🔧 技术细节
-
修改文件:
src/pynetim/cpp/include/diffusion_model.h- 添加核心功能实现src/pynetim/cpp/bindings/ic_bind.cpp- IC 模型 Python 绑定src/pynetim/cpp/bindings/lt_bind.cpp- LT 模型 Python 绑定src/pynetim/cpp/diffusion_model/independent_cascade_model.pyi- 类型提示src/pynetim/cpp/diffusion_model/linear_threshold_model.pyi- 类型提示
-
实现细节:
run_single_trial方法新增activated_nodes参数,用于记录激活节点- 当
record_activated为true时,遍历所有节点收集激活的节点 - 使用独立的随机数生成器确保每次模拟的独立性
📖 查看完整更新: CHANGELOG.md
🎯 v0.4.2 主要更新
🐛 Bug 修复
- 修复 Graph 对象生命周期管理问题:
- 修复了 Python 层 Graph 对象被垃圾回收后,C++ 层模型仍持有悬空指针导致的段错误
- 根本原因:Graph 没有以正确的
std::shared_ptr形式被 Python 管理 - 解决方案:在 graph_bind.cpp 中使用
std::make_shared创建 Graph 对象 - 现在 Python 和 C++ 共享同一个
shared_ptr,引用计数统一管理 py::keep_alive真正生效,确保 Graph 对象在模型使用期间不会被回收
🧪 测试
- 新增生命周期验证测试:
test_weakref.py- 使用 weakref 验证 Graph 对象生命周期test_weakref2.py- 带 seeds 的生命周期测试- 测试结果:Graph 对象在模型使用期间保持存活,不会发生段错误
📚 技术细节
- 关键知识点:
py::class_<T, std::shared_ptr<T>>只保证 Python 用 shared_ptr 管理对象,但前提是这个对象本来就是 shared_ptr 创建的 - 修改文件: graph_bind.cpp
📖 查看完整更新: CHANGELOG.md
🎯 v0.4.1 主要更新
🐛 Bug 修复
- 修复 C++ 扩展的线程安全问题:
- 修复
IndependentCascadeModel和LinearThresholdModel在多线程模式下的线程安全问题 - 通过参数传递替代直接访问成员变量
seeds,消除跨线程共享std::set的状态 - 解决了与 PyTorch 等多线程库结合使用时的 segmentation fault 问题
- 经过严格测试:5000 次迭代、8 线程并发、10 图并发均稳定运行
- 单线程和多线程结果完全一致,确保正确性
- 修复
🧪 测试
- 新增严格验证测试:
- 单线程/多线程一致性测试
- 长时间多线程压力测试 (2000 次迭代)
- 多线程并发访问测试 (8 线程)
- 多图并发处理测试 (10 个图)
- 极限压力测试 (5000 次迭代)
📖 查看完整更新: CHANGELOG.md
🎯 v0.4.0 主要更新
✨ 新功能
- C++ 图完整支持: 所有工具函数现在支持
IMGraphCpp(C++ 图)set_edge_weight()- 支持三种权重模型(CONSTANT、TV、WC)infection_threshold()- 支持基于度分布的感染阈值计算graph_statistics()- 支持完整的图统计信息graph_density()- 支持图密度计算connectivity_analysis()- 支持连通性分析
⚡ 性能优化
- 避免重复计算度字典
- 使用
Counter优化度分布统计 - 合并重复代码逻辑,提升可维护性
🐛 Bug 修复
- 修复缺失的
networkx模块导入 - 修复整数除法导致的精度丢失问题
- 修复连通性分析中的重复代码
📚 文档改进
- 为所有主要模型和算法添加学术参考文献
- 4个传播模型(LT、IC、SIR、SI)
- 3个影响力最大化算法(Degree Discount、RIS、IMM)
- 1个关键工具函数(infection_threshold)
- 新增文档:
CHANGELOG.md- 完整的更新日志REFERENCES_DOCUMENTATION.md- 参考文献文档
📖 查看完整更新: CHANGELOG.md
✨ 功能概览
- 多种经典影响力最大化算法(Heuristic / Simulation / RIS)
- 多种传播模型(IC / LT / SI / SIR)
- 统一的图结构封装(基于 NetworkX)
- Python 可读实现 + C++ 高性能实现
- 支持蒙特卡洛扩散模拟
- 内置算法计时装饰器
📁 项目结构总览
src/
├─ pynetim/
│ ├─ __init__.py
│ │
│ ├─ cpp/ # C++ 后端(pybind11 绑定)
│ │ ├─ diffusion_model/
│ │ ├─ graph/
│ │ └─ __init__.py
│ │
│ ├─ py/ # Python 实现(核心逻辑)
│ │ ├─ algorithms/
│ │ ├─ diffusion_model/
│ │ ├─ graph/
│ │ └─ decorator/
│ │
│ ├─ utils/ # 通用工具函数
│ └─ __init__.py
│
└─ tests/ # 测试代码
🧠 架构说明
PyNetIM 采用 “Python 逻辑层 + C++ 计算层” 的设计:
- 算法逻辑、实验流程 → Python
- 高频计算(扩散 / 图操作) → C++
- 上层算法 对后端透明
Algorithm (Python)
↓
Diffusion Model Interface
↓
Graph Interface
↓
Python 实现 / C++ 扩展
⚙️ C++ 后端(pynetim/cpp)
该目录包含 C++ 实现的高性能模块,通过 pybind11 暴露给 Python。
📁 cpp/diffusion_model
cpp/diffusion_model/
├─ diffusion_model.h # 扩散模型公共接口
├─ ic_bind.cpp # IC 模型 pybind11 绑定
├─ lt_bind.cpp # LT 模型 pybind11 绑定
├─ independent_cascade_model.pyi # IC Python 类型存根
├─ linear_threshold_model.pyi # LT Python 类型存根
└─ __init__.py
说明:
-
.cpp文件仅包含 Python 绑定逻辑 -
.pyi用于:- IDE 自动补全
- 类型检查(MyPy / PyCharm)
支持的模型:
- Independent Cascade (IC)
- Linear Threshold (LT)
📁 cpp/graph
cpp/graph/
├─ Graph.h # C++ 图结构定义
├─ graph_bind.cpp # 图结构 pybind11 绑定
├─ graph.pyi # Python 类型存根
└─ __init__.py
功能:
- 提供 C++ 层图结构
- 为 IC / LT 等模型提供高效邻接访问
🐍 Python 实现(pynetim/py)
该部分包含 完整、可读、可修改的实现,是算法理解与二次开发的主要入口。
📁 py/algorithms —— 影响力最大化算法
py/algorithms/
├─ base_algorithm.py
├─ heuristic_algorithm.py
├─ simulation_algorithm.py
├─ RIS_algorithm.py
└─ __init__.py
已实现算法
启发式算法(速度快):
SingleDiscountAlgorithmDegreeDiscountAlgorithm
基于模拟的算法(精度高):
GreedyAlgorithmCELFAlgorithm
RIS 系列算法(适合大规模图):
BaseRISAlgorithmIMMAlgorithm
📁 py/diffusion_model —— 扩散模型(Python 版本)
py/diffusion_model/
├─ base_diffusion_model.py
├─ independent_cascade_model.py
├─ linear_threshold_model.py
├─ susceptible_infected_model.py
├─ susceptible_infected_recovered_model.py
├─ run_monte_carlo_diffusion.py
└─ __init__.py
说明:
-
Python 版本 逻辑完整
-
用于:
- 算法理解
- 实验修改
-
run_monte_carlo_diffusion.py提供统一的蒙特卡洛扩散接口
📁 py/graph —— Python 图封装
py/graph/
├─ graph.py
└─ __init__.py
核心类:
-
IMGraph
- 封装 NetworkX 图
- 管理节点、边、权重
- 为算法与扩散模型提供统一接口
📁 py/decorator —— 装饰器
py/decorator/
├─ decorator.py
└─ __init__.py
Timer:用于统计算法运行时间
🧰 工具函数(pynetim/utils)
utils/
├─ utils.py
└─ __init__.py
主要功能:
-
set_edge_weight- WC(入度倒数)
- 随机权重
- 自定义权重
🧪 测试
运行测试
PyNetIM 提供了完整的测试套件,用于验证库的功能和性能。
NetworkX 图测试
运行 NetworkX 图的测试:
conda run -n pynetim python tests/test.py
C++ 图测试
运行 C++ 图的测试:
conda run -n pynetim python tests/test_cpp.py
测试覆盖
测试套件涵盖了以下功能:
NetworkX 图测试 (tests/test.py):
- 基本图操作(创建、节点、边)
- 图统计信息计算
- 图密度计算
- 连通性分析
- 边权重设置(CONSTANT、TV、WC)
- 感染阈值计算
C++ 图测试 (tests/test_cpp.py):
- 基本图操作(创建、节点、边)
- 邻接查询
- 度数查询(批量)
- 边权重设置
- IC 扩散模型测试
- LT 扩散模型测试
- SI 扩散模型测试
- SIR 扩散模型测试
🚀 快速开始
import networkx as nx
from pynetim.py.graph import IMGraph
from pynetim.py.algorithms import DegreeDiscountAlgorithm
# 创建图
g = nx.erdos_renyi_graph(100, 0.1)
# 构建 IMGraph(WC 权重)
graph = IMGraph(g, edge_weight_type='WC')
# 运行算法
algo = DegreeDiscountAlgorithm(graph)
seeds = algo.run(k=10)
print(seeds)
🔧 扩展说明
- ✔ 可新增 Python 扩散模型
- ✔ 可新增 自定义 IM 算法
- ✔ C++ 层主要用于性能优化
📦 安装
pip install pynetim
🙏 致谢
感谢以下对本项目提供帮助的个人和工具:
- TraeAI - 提供了强大的 AI 辅助开发环境,显著提升了代码开发效率和问题解决能力
- GLM-4.7 (Trae AI Assistant) - 在项目开发过程中提供了关键的技术支持,特别是在 C++/Python 互操作、对象生命周期管理等复杂问题上提供了精准的分析和解决方案
📄 License
MIT License 详见 LICENSE
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
File details
Details for the file pynetim-0.4.3.tar.gz.
File metadata
- Download URL: pynetim-0.4.3.tar.gz
- Upload date:
- Size: 46.5 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.10.20
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
bd0a1c79a920b1477e0a8f9e9ed8e1968e6c843a3e909499833d47362d359738
|
|
| MD5 |
b669e4cb2a981b7ba0af5924721d6534
|
|
| BLAKE2b-256 |
c9de4aec9b0cbb5898e78b7245fd276071eabe8c24c12583ba9e37a493dce97b
|