轻量级 Python 任务队列管理器,无需额外服务
Project description
video-gen-agent 是专为高保真、多模态内容创作设计的智能生成执行引擎。作为 video-shot-agent 生态中的核心“创作者”,它负责将结构化的分镜脚本、文本描述及风格参考,转化为电影级画质的静态图像与动态视频。 不同于传统的简单 API 调用器,video-gen-agent 是一个具备模型路由、参数自适应与多步推理能力的智能体,能够根据剧本需求自动选择最优生成策略,确保每一帧画面都精准还原创意构想。 🚀 核心使命 在 AI 视频生成的复杂工作流中,video-gen-agent 充当了“全能画师 + 技术导演”的角色: 多模态转化 (Multimodal Translation):无缝衔接文本(Prompt)、图像(Reference)与控制信号(ControlNet/Depth),实现从抽象概念到具象视觉的精准映射。 动态模型路由 (Dynamic Model Routing):根据场景需求(如“写实真人”、“二次元动漫”、“3D 渲染”),自动调度最合适的底层模型(如 Sora, Kling, Runway Gen-3, Flux, Stable Video Diffusion 等)。 可控性增强 (Controllable Generation):通过集成姿态控制、深度图引导及面部一致性算法,解决传统生成中的“随机性”痛点,实现角色、动作与构图的精确可控。 🔍 主要功能模块
- 智能提示词工程 (Smart Prompt Engineering) 语义增强:接收 video-shot-agent 输出的简略分镜描述,自动扩展为包含光影、镜头语言、材质细节的高质量 Prompt。 负面约束优化:根据目标风格,自动注入针对性的 Negative Prompts(如“低质量、变形、模糊”),从源头提升出图率。 多语言适配:支持全球主流语言的输入,自动翻译并优化为英文提示词以适配主流模型。
- 自适应模型调度 (Adaptive Model Orchestration) 场景感知路由: 高动态场景(如爆炸、奔跑):自动调用高帧率、强运动一致性的视频模型。 高细节场景(如文字特写、复杂纹理):自动切换至高分辨率图像模型 + 视频插值工作流。 角色驱动场景:优先启用支持 Character Reference (角色参考) 的专用模型。 成本/速度平衡:根据用户配置的优先级(“极速模式”或“极致画质模式”),动态调整采样步数、分辨率及模型版本。
- 高级一致性控制 (Advanced Consistency Control) 角色锁定 (Character Locking):利用 IP-Adapter 或 InsightFace 技术,确保同一角色在不同镜头、不同时间段内保持面部特征、发型及服装的高度一致。 时空连贯性 (Spatio-Temporal Coherence):在长视频生成中,应用光流引导与潜空间插值技术,消除画面闪烁与物体突变,确保动作流畅自然。 结构化引导:支持上传草图、深度图或姿态骨架,严格约束生成内容的构图与动作轨迹,实现“指哪打哪”。
- 生成后处理流水线 (Post-Generation Pipeline) 超分与修复:内置自动超分辨率(Upscale)与面部修复(Face Restore)模块,确保输出达到 4K 广播级标准。 帧率插值:将原生低帧率视频平滑插值至 60fps,提升观影流畅度。 元数据嵌入:自动将生成参数、模型版本、Prompt 信息写入视频元数据,便于后续追溯与 video-audit-agent 审查。 🛠️ 技术架构亮点 插件化模型后端:支持热插拔接入最新的开源与闭源模型,无需重构核心代码即可享受技术红利。 并行生成集群:支持分布式任务队列,可并发处理多个分镜片段,大幅缩短长视频制作周期。 反馈学习机制:记录 video-audit-agent 的驳回原因,自动微调后续生成的参数策略,形成“生成 - 审查 - 优化”的闭环进化。 📦 适用场景 AI 电影/短剧制作:批量生成保持角色一致的连续镜头。 广告创意可视化:快速将文案转化为多种风格的故事板或成品视频。 游戏资产生成:制作角色立绘、过场动画及动态背景。 教育/科普内容:将抽象的科学概念转化为直观的动态演示视频。 video-gen-agent —— 让创意不再受限于技术壁垒,是您构建可控、高效、高质量AIGC 视频生产线的核心动力引擎。 生态定位: video-shot-agent (大脑:规划) ➡️ video-gen-agent (双手:创造) ➡️ video-audit-agent (眼睛:把关)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file neogen-0.1.0.tar.gz.
File metadata
- Download URL: neogen-0.1.0.tar.gz
- Upload date:
- Size: 8.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
fe7d97998ae5e68ee9554fcbb5315306e2c3d7751148ef764c262f6dce2ddc7a
|
|
| MD5 |
a438773791d0ea9bc3ccf96c67107788
|
|
| BLAKE2b-256 |
e3b2fb748393fcf8f6d70bac8a275aea1f9b97c8025a999071c711b555079784
|
Provenance
The following attestation bundles were made for neogen-0.1.0.tar.gz:
Publisher:
publish-pypi.yml on neopen/video-gen-agent
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
neogen-0.1.0.tar.gz -
Subject digest:
fe7d97998ae5e68ee9554fcbb5315306e2c3d7751148ef764c262f6dce2ddc7a - Sigstore transparency entry: 1181043196
- Sigstore integration time:
-
Permalink:
neopen/video-gen-agent@dc8e205d8e1b7579b803c9da2575f0a32aeed74a -
Branch / Tag:
refs/tags/v0.1.0-alpha.1 - Owner: https://github.com/neopen
-
Access:
private
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish-pypi.yml@dc8e205d8e1b7579b803c9da2575f0a32aeed74a -
Trigger Event:
release
-
Statement type:
File details
Details for the file neogen-0.1.0-py3-none-any.whl.
File metadata
- Download URL: neogen-0.1.0-py3-none-any.whl
- Upload date:
- Size: 8.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
8260d7f20c0fb02c20ebdb8964645d82934c3c374386ea43264f6964e4f9029c
|
|
| MD5 |
cfde90b543aeaa085595372fceb6a264
|
|
| BLAKE2b-256 |
a08fffb9ffd94201caa052ef87414b9ab570c4a55a5d52e30b87158cecd16ed7
|
Provenance
The following attestation bundles were made for neogen-0.1.0-py3-none-any.whl:
Publisher:
publish-pypi.yml on neopen/video-gen-agent
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
neogen-0.1.0-py3-none-any.whl -
Subject digest:
8260d7f20c0fb02c20ebdb8964645d82934c3c374386ea43264f6964e4f9029c - Sigstore transparency entry: 1181043225
- Sigstore integration time:
-
Permalink:
neopen/video-gen-agent@dc8e205d8e1b7579b803c9da2575f0a32aeed74a -
Branch / Tag:
refs/tags/v0.1.0-alpha.1 - Owner: https://github.com/neopen
-
Access:
private
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish-pypi.yml@dc8e205d8e1b7579b803c9da2575f0a32aeed74a -
Trigger Event:
release
-
Statement type: