Skip to main content

A Python-based AI assistant project

Project description

AI 助手项目

项目简介

multi_ai_assistant 是一个基于 Python 的 AI 助手,支持多模型对话、TTS 语音等多种功能,适合个人效率提升及 AI 应用开发。

安装方法

推荐使用 pip 安装(PyPI 发布后):

pip install multi_ai_assistant

或从源码安装:

git clone https://github.com/mofanx/multi_ai_assistant.git
cd multi_ai_assistant
pip install .

使用方法

安装后可通过命令行启动:

multi_ai_assistant

或在代码中调用:

from multi_ai_assistant import AI_Assistant
assistant = AI_Assistant()
assistant.run()

依赖说明

  • keyboard
  • pygame
  • asyncio
  • requests
  • openai
  • pyclip
  • aiohttp

开源协议

本项目基于 MIT 协议开源,详见 LICENSE 文件。

项目说明

本项目是一个通过快捷键调用不同AI模型进行对话的Python脚本,支持多种AI模型和TTS(文本转语音)功能。

功能特性

  • 支持多种 AI 模型一键切换:Gemini、Qwen、QWQ、Grok、Baidu、Zhipu、Aliyun(含 Web 模式)
  • 提供 TTS 语音合成功能,支持普通、流式、非流式三种模式
  • 支持截图 OCR 识别、白描 OCR 识别
  • 支持多角色快捷键:中英文互译、内容转 JSON、JSON 转 Markdown
  • 支持 Piclab 图床上传:一键上传剪贴板图片或图片链接,自动复制 Markdown 链接到剪贴板(快捷键 F8+P)
  • 支持 AI 绘画:调用阿里云、Gemini、XAI 生成图片
  • 通过丰富快捷键快速调用不同模型和功能
  • 支持随时取消当前对话、停止 TTS、退出程序

安装依赖

pip install -r requirements.txt

配置环境变量

# 需手动配置
NEW_API_URL:New API地址
NEW_API_KEY:New API密钥

ALIYUN_API_KEY:阿里云API密钥
ALIYUN_API_URL:阿里云API地址

OTHER_TTS_BASE_URL:其他TTS API地址
OTHER_TTS_API_KEY:其他TTS API密钥
TTS_SERVER_BASE_URL:TTS服务器地址


# 根据需要自行更改代码并配置
AI_STUDIO_API_KEY:百度 AI Studio API密钥
AI_STUDIO_API_URL:百度 AI Studio API地址

XAI_API_URL:XAI API地址
XAI_API_KEY:XAI API密钥

快捷键说明

快捷键 功能描述
f9+o 调用 OpenAI 模型
f9+g 调用 Gemini 模型
f9+x 调用 Grok 模型
f9+q 调用 Qwen 模型
f9+w 调用 QWQ 模型
f9+b 调用 Baidu 模型
f9+z 调用 Zhipu 模型
f9+a 调用 Aliyun 模型
f9+l 调用 Aliyun Web 模型
f9+1 调用 TTS 语音合成
esc+1 停止 TTS
f9+2 流式 TTS 语音合成
f9+3 非流式 TTS 语音合成
f8+0 截图 OCR 识别
f8+9 白描 OCR 识别
f8+p 上传剪贴板图片到Piclab
f8+o 调用截图并上传到Piclab
f8+a 调用阿里云生成图片
f8+g 调用 Gemini 生成图片
f8+x 调用 XAI 生成图片
esc+2 停止流式 TTS
esc+3 停止非流式 TTS
esc 取消当前对话
esc+f9 退出程序
f8+e 翻译为英文
f8+c 翻译为中文
f8+j 内容转 JSON
f8+m JSON 转 Markdown

使用方法

  1. 运行主脚本:

    python multi_ai_assistant/ai_assistant.py
    
  2. 按上述快捷键即可调用相应模型或功能。

  3. 命令行参数:

    • --web 启用 Qwen Web 模式
    • --model 指定 OpenAI 调用的模型名称
  4. 也可通过 multi_ai_assistant 命令或在代码中调用 AI_Assistant() 启动。 | f9+1 | 调用TTS | | esc+1 | 停止TTS | | f9+2 | 调用流式TTS | | f9+3 | 调用非流式TTS | | esc | 取消当前对话 | | esc+f9 | 退出程序 |

项目结构

multi_ai_assistant/
├── ai_assistant/
│   ├── assistant/                # 各类模型与功能模块
│   │   ├── __init__.py           # 子包初始化
│   │   ├── baimiao_ocr.py        # 白描 OCR 识别
│   │   ├── base.py               # 基础类定义
│   │   ├── chat_with_tts_no_stream.py  # 非流式 TTS 聊天
│   │   ├── chat_with_tts_stream.py     # 流式 TTS 聊天
│   │   ├── openai_model.py       # OpenAI 模型实现
│   │   ├── openai_tts.py         # OpenAI TTS 支持
│   │   ├── qwen_model.py         # 通义千问模型实现
│   │   ├── qwq_model.py          # QWQ 模型实现
│   │   ├── screenshot_ocr_llm.py # 截图 OCR 识别
│   │   ├── tts_client.py         # TTS 客户端
│   │   ├── tts_server.py         # TTS 服务器
│   │   ├── piclab_uploader.py    # Piclab 图床上传
│   │   ├── aliyun_img_gen.py     # 阿里云生成图片
│   │   ├── gemini_img_gen.py     # Gemini 生成图片
│   │   └── xai_img_gen.py        # XAI 生成图片
│   ├── __init__.py               # 包初始化文件
│   ├── ai_assistant.py           # 主程序脚本(快捷键入口等)
│   └── prompts.json              # 预设提示词配置
├── README.md                     # 项目说明文档
├── requirements.txt              # 依赖列表
├── pyproject.toml                # 构建与元数据配置
├── LICENSE                       # 开源协议文件
└── multi_ai_assistant.egg-info/  # 构建生成的元数据目录(可忽略)   
  • 代码主入口为 multi_ai_assistant/ai_assistant/ai_assistant.py
  • 所有核心模型、TTS、OCR、工具均在 multi_ai_assistant/ai_assistant/assistant/ 下实现。
  • 依赖与元数据分别在 requirements.txtpyproject.toml 中声明。
  • prompts.json 为对话和功能的提示词模板。

贡献指南

欢迎提交Pull Request或Issue来改进本项目。

许可证

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

multi_ai_assistant-1.1.3.tar.gz (44.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

multi_ai_assistant-1.1.3-py3-none-any.whl (57.2 kB view details)

Uploaded Python 3

File details

Details for the file multi_ai_assistant-1.1.3.tar.gz.

File metadata

  • Download URL: multi_ai_assistant-1.1.3.tar.gz
  • Upload date:
  • Size: 44.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.3

File hashes

Hashes for multi_ai_assistant-1.1.3.tar.gz
Algorithm Hash digest
SHA256 6f0d0402420b6cc85eef71b9b6c65361d801dd741b0b3b28ba32f80500694ed4
MD5 9377b2c3fb8528d482313aa181cf5c12
BLAKE2b-256 972329d89ca88d76e636f72d57eeeedd82291c846e1ec0b4c92161e7ed35b4c0

See more details on using hashes here.

File details

Details for the file multi_ai_assistant-1.1.3-py3-none-any.whl.

File metadata

File hashes

Hashes for multi_ai_assistant-1.1.3-py3-none-any.whl
Algorithm Hash digest
SHA256 d35efc097e60b2f780971768a0cb78e55bdc8cfe7b57a41da04d5d26d9a2e6b8
MD5 6a64aeb87e40e1892bb2efe518e242ac
BLAKE2b-256 6510fdda34a600b7c461eb9c393cbb97ebc1c0307b9f236db1a8623035cd61a8

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page