Create a Python package.
Project description
🔥ChatLLM 基于知识库🔥
Install
pip install -U chatllm
Docs
Usages
from chatllm.applications import ChatBase
qa = ChatBase()
qa.load_llm4chat(model_name_or_path="THUDM/chatglm-6b")
_ = list(qa(query='周杰伦是谁', knowledge_base='周杰伦是傻子', role=' '))
# 根据已知信息无法回答该问题,因为周杰伦是中国内地流行歌手、演员、音乐制作人、导演,
# 是具有一定的知名度和专业能力的人物,没有提供足够的信息无法判断他是傻子。
- 支持角色扮演
ChatPDF
Click to ChatPDF
一键启动UI chatllm-run webui --name chatpdf
from chatllm.applications.chatpdf import ChatPDF
qa = ChatPDF(encode_model='nghuyong/ernie-3.0-nano-zh')
qa.load_llm4chat(model_name_or_path="THUDM/chatglm-6b")
qa.create_index('财报.pdf') # 构建知识库
list(qa(query='东北证券主营业务'))
# 根据已知信息,东北证券的主营业务为证券业务。公司作为证券公司,主要从事证券经纪、证券投资咨询、与证券交易、
# 证券投资活动有关的财务顾问、证券承销与保荐、证券自营、融资融券、证券投资基金代销和代销金融产品待业务。
- 支持查看召回结果
Deploy
Click to Deploy
-
ChatGLM-6B 模型硬件需求
量化等级 最低 GPU 显存(推理) 最低 GPU 显存(高效参数微调) FP16(无量化) 13 GB 14 GB INT8 8 GB 9 GB INT4 6 GB 7 GB -
从本地加载模型
TODO
Click to TODO
-
ChatLLM 应用
- 接入非结构化文档(已支持 md、pdf、docx、txt 文件格式)
- 搜索引擎与本地网页接入
- 结构化数据接入(如 csv、Excel、SQL 等)
- 知识图谱/图数据库接入
- 增加 ANN 后端,ES/RedisSearch【确保生产高可用】
- 增加多级缓存缓存
-
多路召回
- 问
- 标量匹配
- 多种向量化,向量匹配
- 增加相似问,换几个问法
- 高置信度直接返回答案【匹配标准问】
- 答
- 高置信度篇章
- 增加上下文信息
- 增加夸篇章信息
- 增加召回信息的相似信息
- 提前生成标准问,匹配问
- 拒绝推断
- 问
-
增加更多 LLM 模型支持
-
增加更多 Embedding 模型支持
-
增加一键启动 webui
- 利用 streamlit 实现 ChatPDF,一键启动
chatllm-run webui --name chatpdf
- 利用 gradio 实现 Web UI DEMO
- 添加输出内容及错误提示
- 引用标注
- 增加知识库管理
- 选择知识库开始问答
- 上传文件/文件夹至知识库
- 删除知识库中文件
- 利用 streamlit 实现 ChatPDF,一键启动
-
增加 API 支持
- 利用 Fastapi/Flask/Grpc 实现流式接口
chatllm-run flask-api --model_name_or_path <MODEL_PATH> --host 127.0.0.1 --port 8000
- 前后端分离,实现调用 API 的 Web UI Demo
- 利用 Fastapi/Flask/Grpc 实现流式接口
交流群
======= History
0.0.0 (2023-04-11)
- First release on PyPI.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Close
Hashes for ChatLLM-2023.5.4.11.58.59.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | e6c1c4f26900c554e2ae2fde4649902edf473c2bc4be9602073116db2c4d30e1 |
|
MD5 | 0a73d5d66e8cea28d13a6ce6da87a276 |
|
BLAKE2b-256 | 26ae06b5906200f6d554d553eb7b1b47e5cd28675f7cb4fadf9f7a8671c59427 |
Close
Hashes for ChatLLM-2023.5.4.11.58.59-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | c6629d1d81a94163be1ed6ce27d30316a4ccd15c22293ac0f33b31ea996e4441 |
|
MD5 | 938a44d72adccf7fe6cf5764d8d5eaa0 |
|
BLAKE2b-256 | 15eb983b9551009f454ed77fb1072f9e73002488c32181e1d20fa4e554dd1474 |