No project description provided

These details have not been verified by PyPI

Project links

Project description

sparrow-python

快速命令索引

🎯 常用命令速查

# 查看表格数据
spr table_viewer data.csv

# 图像批量处理  
spr mllm_call_images ./photos
spr download_images "关键词" --num_images=100

# 视频处理
spr video_dedup video.mp4
spr frames_to_video frames_dir

# 文件操作
spr pack folder_name        # 压缩
spr split large_file.dat    # 分割大文件
spr kill 8080              # 杀死端口进程

# 项目工具
spr create my_project      # 创建项目
spr clone repo_url         # 克隆仓库
spr gen_key project_name   # 生成SSH密钥

# 服务启动
spr start_server           # 多进程服务器
spr reminder              # 提醒服务

📖 详细命令说明

所有命令都支持 sp、spr、sparrow 三种调用方式。使用 spr <command> --help 查看具体参数说明。

TODO

多模态图像预处理考虑使用多进程
找一个可以优雅绘制流程图、示意图的工具，如ppt？
实现一个优雅的TextSplitter
prompt调试页面
相关配置指定支持：prompt后端地址；模型参数配置；
添加测试按钮，模型选项，模型配置
原生git下载支持
[ ]
streamlit 多模态chat input: https://github.com/streamlit/streamlit/issues/7409
https://github.com/hiyouga/LLaMA-Factory/blob/main/src/llamafactory/chat/vllm_engine.py#L99

识别下面链接的滚动截图： https://sjh.baidu.com/site/dzfmws.cn/da721a31-476d-42ed-aad1-81c2dc3a66a3

vllm 异步推理示例：

new 实例(from deepwiki)

import asyncio  
from fastapi import FastAPI, Request  
from fastapi.responses import JSONResponse, StreamingResponse  
from vllm.engine.arg_utils import AsyncEngineArgs  
from vllm.engine.async_llm_engine import AsyncLLMEngine  
from vllm.sampling_params import SamplingParams  
from vllm.utils import random_uuid  
import json  
  
app = FastAPI()  
engine = None  
  
async def init_engine():  
    """初始化 vLLM 引擎"""  
    global engine  
    # 配置引擎参数  
    engine_args = AsyncEngineArgs(  
        model="your-model-name",  # 替换为您的模型  
        tensor_parallel_size=1,   # 根据您的GPU数量调整  
        dtype="auto",  
        max_model_len=2048,  
    )  
    engine = AsyncLLMEngine.from_engine_args(engine_args)  
  
@app.on_event("startup")  
async def startup_event():  
    await init_engine()  
  
@app.post("/generate")  
async def generate(request: Request):  
    """生成文本的端点"""  
    request_dict = await request.json()  
    prompt = request_dict.get("prompt")  
    stream = request_dict.get("stream", False)  
      
    # 创建采样参数  
    sampling_params = SamplingParams(  
        temperature=request_dict.get("temperature", 0.7),  
        max_tokens=request_dict.get("max_tokens", 100),  
        top_p=request_dict.get("top_p", 1.0),  
    )  
      
    request_id = random_uuid()  
    results_generator = engine.generate(prompt, sampling_params, request_id)  
      
    if stream:  
        # 流式响应  
        async def stream_results():  
            async for request_output in results_generator:  
                text_outputs = [output.text for output in request_output.outputs]  
                ret = {"text": text_outputs}
                yield f"data: {json.dumps(ret)}\n\n"  
          
        return StreamingResponse(stream_results(), media_type="text/plain")  
    else:  
        # 非流式响应  
        final_output = None  
        async for request_output in results_generator:  
            final_output = request_output  
          
        text_outputs = [output.text for output in final_output.outputs]  
        return JSONResponse({"text": text_outputs})  
  
if __name__ == "__main__":  
    import uvicorn  
    uvicorn.run(app, host="0.0.0.0", port=8000)

from fastapi import FastAPI
from pydantic import BaseModel
from typing import List
import uvicorn
from vllm.engine.arg_utils import AsyncEngineArgs
from vllm.engine.async_llm_engine import AsyncLLMEngine
from vllm.sampling_params import SamplingParams
import torch

# Define request data model
class RequestData(BaseModel):
    prompts: List[str]
    max_tokens: int = 2048
    temperature: float = 0.7

# Initialize FastAPI app
app = FastAPI()

# Determine device
device = "cuda" if torch.cuda.is_available() else "cpu"

# Initialize AsyncLLMEngine
engine_args = AsyncEngineArgs(
    model="your-model-name",  # Replace with your model name
    dtype="bfloat16",
    gpu_memory_utilization=0.8,
    max_model_len=4096,
    trust_remote_code=True
)
llm_engine = AsyncLLMEngine.from_engine_args(engine_args)

# Define the inference endpoint
@app.post("/predict")
async def generate_text(data: RequestData):
    sampling_params = SamplingParams(
        max_tokens=data.max_tokens,
        temperature=data.temperature
    )
    request_id = "unique_request_id"  # Generate a unique request ID
    results_generator = llm_engine.generate(data.prompts, sampling_params, request_id)
  
    final_output = None
    async for request_output in results_generator:
        final_output = request_output
  
    assert final_output is not None
    text_outputs = [output.text for output in final_output.outputs]
    return {"responses": text_outputs}

# Run the server
if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8000)

待添加脚本

Install

pip install sparrow-python
# Or dev version
pip install sparrow-python[dev]
# Or
pip install -e .
# Or
pip install -e .[dev]

Usage

Multiprocessing SyncManager

Open server first:

$ spr start-server

The defualt port 50001.

(Process1) productor:

from sparrow.multiprocess.client import Client

client = Client(port=50001)
client.update_dict({'a': 1, 'b': 2})

(Process2) consumer:

from sparrow.multiprocess.client import Client

client = Client(port=50001)
print(client.get_dict_data())

>> > {'a': 1, 'b': 2}

常用工具

数据处理与查看

表格查看器

# 基本用法
spr table_viewer sample_products.csv --port 8081

# 指定图像列并设置端口
spr table_viewer "products.xlsx" --image_columns="product_image,thumbnail" --port=9090

# 指定工作表
spr table_viewer "report.xlsx" --sheet_name="Sheet2"

文本去重

# 使用编辑距离去重
spr deduplicate input.txt output.txt --method=edit --threshold=0.8

# 使用ROUGE相似度去重
spr deduplicate data.csv clean.csv --method=rouge --target_col=content

文件压缩与解压 支持格式："zip", "tar", "gztar", "bztar", "xztar"

# 压缩文件/文件夹
spr pack pack_dir

# 解压文件
spr unpack filename extract_dir

大文件分割与合并

# 分割大文件 (默认1GB块)
spr split large_file.dat

# 合并分割文件
spr merge large_file.dat

项目管理

项目脚手架

spr create awesome-project

Git仓库克隆

# 基本克隆
spr clone https://github.com/user/repo.git

# 指定分支和保存路径
spr clone https://github.com/user/repo.git --branch=dev --save_path=./my_project

自动Git提交监控

spr auto_commit --interval=60

SSH密钥生成

spr gen_key project_name --email=your@email.com

配置管理

# 初始化配置文件
spr init_config

# 查看当前配置
spr get_config

# 查看特定配置项
spr get_config mllm.model

系统工具

端口进程管理

# 杀死指定端口进程
spr kill 8080

# 获取本机IP
spr get_ip
spr get_ip --env=outer  # 获取外网IP

Docker管理

# 保存所有Docker镜像
spr save_docker_images

# 加载Docker镜像
spr load_docker_images

# Docker GPU状态监控
spr docker_gpu_stat

多媒体处理

视频帧去重

# 基本去重 (默认phash算法)
spr video_dedup video.mp4

# 自定义参数
spr video_dedup video.mp4 --method=dhash --threshold=5 --step=2 --workers=4

图像帧转视频

# 将帧目录转换为视频
spr frames_to_video frames_dir --fps=24

# 一站式：去重+生成视频
spr dedup_and_create_video video.mp4 --video_fps=15

视频字幕处理

# 自动生成字幕（转录+翻译）
spr subtitles video.mp4

# 翻译现有字幕
spr translate_subt subtitles.srt

# 合并双语字幕
spr merge_subtitles en.srt zh.srt

图像下载与处理

批量图像下载

# 单关键词下载
spr download_images "猫咪" --num_images=100

# 多关键词，多搜索引擎
spr download_images "猫咪,狗狗" --engines="bing,google,baidu" --save_dir="animals"

大模型与AI

批量图像识别（表格）

# 基本用法
spr mllm_call_table images.xlsx --image_col=图片路径

# 自定义模型和提示词
spr mllm_call_table data.csv \
    --model="gpt-4o-mini" \
    --text_prompt="详细描述这张图片" \
    --output_file="results.csv"

批量图像识别（文件夹）

# 处理文件夹中所有图片
spr mllm_call_images ./photos --recursive=True

# 指定文件类型和数量限制
spr mllm_call_images ./images \
    --extensions=".jpg,.png" \
    --max_num=50 \
    --output_file="analysis.csv"

网络与API

异步HTTP请求

# POST请求
spr post "https://api.example.com" '{"key": "value"}' --concurrent=10

# GET请求
spr get_url "https://api.example.com" --concurrent=5

文件传输

# P2P文件传输 (基于croc)
spr send file.txt
spr recv  # 在另一台机器上接收

# 云存储传输
spr send2 file.txt workspace_name
spr recv2 file.txt workspace_name

数据库与服务

启动多进程同步服务器

spr start_server --port=50001

Milvus向量数据库

# 启动Milvus服务
spr milvus start

# 停止Milvus服务
spr milvus stop

数据存储 (FlaxKV)

# 存储文件到指定空间
spr set mykey /path/to/file.txt

# 获取存储的数据
spr get mykey

# 查看所有存储的键
spr keys

# 清理过期数据
spr clean

开发工具

软件安装

# 安装Node.js (通过NVM)
spr install_node --version=18

# 安装/卸载Neovim
spr install_nvim --version=0.9.2
spr uninstall_nvim

定时器工具

spr timer --dt=0.5  # 0.5秒间隔定时器

性能测试

# 测试PyTorch环境
spr test_torch

高级功能

提醒服务

# 启动Web提醒服务
spr reminder --port=8000

Some useful functions

sparrow.relp Relative path, which is used to read or save files more easily.

sparrow.performance.MeasureTime For measuring time (including gpu time)

sparrow.performance.get_process_memory Get the memory size occupied by the process

sparrow.performance.get_virtual_memory Get virtual machine memory information

sparrow.add_env_path Add python environment variable (use relative file path)

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.6.2

Aug 21, 2025

0.6.1

Aug 19, 2025

0.6.0

Aug 18, 2025

0.5.13

Jun 17, 2025

0.5.12

Jun 16, 2025

0.5.11

Jun 15, 2025

0.5.10

Jun 15, 2025

0.5.9

Jun 15, 2025

0.5.8

Jun 11, 2025

0.5.7

Jun 10, 2025

0.5.5

Jun 2, 2025

0.5.4

Jun 1, 2025

0.5.3

Jun 1, 2025

0.5.1

Apr 20, 2025

0.5.0

Mar 19, 2025

0.4.9

Mar 19, 2025

0.4.8

Mar 13, 2025

0.4.7

Mar 12, 2025

0.4.5

Mar 9, 2025

0.4.4

Mar 7, 2025

0.4.3

Mar 3, 2025

0.4.2

Mar 3, 2025

0.4.1

Jan 7, 2025

0.4.0

Dec 22, 2024

0.3.22

Dec 21, 2024

0.3.21

Dec 17, 2024

0.3.20

Dec 15, 2024

0.3.19

Dec 10, 2024

0.3.17

Nov 26, 2024

0.3.16

Nov 24, 2024

0.3.15

Nov 24, 2024

0.3.14

Nov 24, 2024

0.3.13

Nov 15, 2024

0.3.12

Nov 12, 2024

0.3.11

Nov 11, 2024

0.3.10

Nov 11, 2024

0.3.9

Nov 10, 2024

0.3.8

Nov 10, 2024

0.3.7

Nov 9, 2024

0.3.6

Nov 5, 2024

0.3.5

Nov 5, 2024

0.3.4

Nov 4, 2024

0.3.3

Nov 3, 2024

0.3.2

Oct 31, 2024

0.3.1

Oct 28, 2024

0.3.0

Oct 27, 2024

0.2.9

Oct 27, 2024

0.2.8

Oct 27, 2024

0.2.7.2

Oct 21, 2024

0.2.7.1

Sep 24, 2024

0.2.7

Sep 23, 2024

0.2.6

Sep 8, 2024

0.2.5

Aug 17, 2024

0.2.4

Aug 14, 2024

0.2.3.2

Jun 26, 2024

0.2.3.1

May 12, 2024

0.2.3

Apr 29, 2024

0.2.2

Apr 24, 2024

0.2.1

Apr 6, 2024

0.2.0

Apr 6, 2024

0.1.12

Mar 2, 2024

0.1.11

Mar 2, 2024

0.1.10

Mar 2, 2024

0.1.9

Mar 1, 2024

0.1.8

Jan 18, 2024

0.1.7

Sep 7, 2023

0.1.6

Jul 8, 2023

0.1.5

Jun 26, 2023

0.1.4

Jun 13, 2023

0.1.3

May 2, 2023

0.1.2

Apr 22, 2023

0.1.1

Apr 14, 2023

0.1.0

Apr 14, 2023

0.0.8

Mar 27, 2023

0.0.7

Mar 12, 2023

0.0.6

Mar 12, 2023

0.0.4

Feb 19, 2023

0.0.3

Feb 19, 2023

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

sparrow_python-0.6.2.tar.gz (1.7 MB view details)

Uploaded Aug 21, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

sparrow_python-0.6.2-py3-none-any.whl (1.8 MB view details)

Uploaded Aug 21, 2025 Python 3

File details

Details for the file sparrow_python-0.6.2.tar.gz.

File metadata

Download URL: sparrow_python-0.6.2.tar.gz
Upload date: Aug 21, 2025
Size: 1.7 MB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for sparrow_python-0.6.2.tar.gz
Algorithm	Hash digest
SHA256	`ac1f3946585348cdf5cce22b61a35f38c20fdf115cf0593b6912e734fb31ad90`
MD5	`6b2160af6866076643e8e23a4099d116`
BLAKE2b-256	`ef79f5c67d5102bf9474ba809aa1e6eaa747bdd2f8ea151125924742e4ab9e61`

See more details on using hashes here.

Provenance

The following attestation bundles were made for sparrow_python-0.6.2.tar.gz:

Publisher: python-publish.yml on KenyonY/sparrow

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: sparrow_python-0.6.2.tar.gz
- Subject digest: ac1f3946585348cdf5cce22b61a35f38c20fdf115cf0593b6912e734fb31ad90
- Sigstore transparency entry: 414941051
- Sigstore integration time: Aug 21, 2025
Source repository:
- Permalink: KenyonY/sparrow@e18193003aa3117cda8cd945def14759fceb7315
- Branch / Tag: refs/tags/v0.6.2
- Owner: https://github.com/KenyonY
- Access: private
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: python-publish.yml@e18193003aa3117cda8cd945def14759fceb7315
- Trigger Event: push

File details

Details for the file sparrow_python-0.6.2-py3-none-any.whl.

File metadata

Download URL: sparrow_python-0.6.2-py3-none-any.whl
Upload date: Aug 21, 2025
Size: 1.8 MB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.12.9

File hashes

Hashes for sparrow_python-0.6.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`2824ae2af54ab95dd84d9df6266b7a4b5e7ff0e42f873e8c3841d2853a5b4709`
MD5	`f053d57972f035c27a43bda8ffd38ff5`
BLAKE2b-256	`a45c30372d7ab837d70ff243075555bfadae5a6d83c2ec7d24b4b87b99cf1ca6`

See more details on using hashes here.

Provenance

The following attestation bundles were made for sparrow_python-0.6.2-py3-none-any.whl:

Publisher: python-publish.yml on KenyonY/sparrow

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: sparrow_python-0.6.2-py3-none-any.whl
- Subject digest: 2824ae2af54ab95dd84d9df6266b7a4b5e7ff0e42f873e8c3841d2853a5b4709
- Sigstore transparency entry: 414941053
- Sigstore integration time: Aug 21, 2025
Source repository:
- Permalink: KenyonY/sparrow@e18193003aa3117cda8cd945def14759fceb7315
- Branch / Tag: refs/tags/v0.6.2
- Owner: https://github.com/KenyonY
- Access: private
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: python-publish.yml@e18193003aa3117cda8cd945def14759fceb7315
- Trigger Event: push

sparrow-python 0.6.2

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

sparrow-python

快速命令索引

🎯 常用命令速查

📖 详细命令说明

TODO

待添加脚本

Install

Usage

Multiprocessing SyncManager

常用工具

数据处理与查看

项目管理

系统工具

多媒体处理

图像下载与处理

大模型与AI

网络与API

数据库与服务

开发工具

高级功能

Some useful functions

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance