HelperRag 是一个基于向量数据库的知识库管理系统,支持文档的批量上传、向量化处理和检索功能配置了重排模型。
-
文件管理
- 支持批量上传txt文件(最多100个)
- 文件类型验证
- 实时显示文件状态
- 一键删除功能
-
向量化处理
- 自动文本分块
- 向量化存储
- 状态实时显示
- 处理进度跟踪
-
用户界面
- 直观的文件列表显示
- 操作确认弹窗
- 实时状态更新
- 响应式布局
- 前端:Gradio
- 后端:Flask
- 向量数据库:Milvus
- 文本处理:LangChain
HelperRag/
├── backend/ # 后端服务
│ ├── agents/ # 智能代理模块
│ │ ├── agent_base.py # 基础代理类
│ │ ├── knowage_agent.py # 知识库代理
│ │ └── session_history.py # 会话历史管理
│ ├── logs/ # 日志目录
│ │ └── app.log
│ ├── prompts/ # 提示词模板
│ │ ├── knowage_answer_prompt.txt
│ │ └── knowage_query_prompt.txt
│ ├── utils/ # 工具类
│ │ ├── comon.py # 通用工具函数
│ │ ├── database.py # 数据库操作
│ │ └── logger.py # 日志工具
│ ├── config.py # 后端配置
│ ├── document_processor.py # 文档处理器
│ ├── model_handler.py # 模型处理器
│ ├── server.py # 主服务器
│ └── session_manager.py # 会话管理
├── frontend/ # 前端应用
│ ├── app.py # 主界面
│ ├── document_uploader.py # 文件上传组件
│ ├── session_manager.py # 前端会话管理
│ ├── util.py # 工具函数
│ └── vector_storage.py # 向量存储接口
├── config/ # 配置文件目录
│ └── config.yaml # 主配置文件
├── backup/ # 已处理文件备份
├── db/ # 数据库文件
│ └── milvus/ # Milvus数据目录
├── input/ # 文件处理中转目录
├── uploads/ # 文件上传目录
├── requirements.txt # 项目依赖
└── README.md # 项目说明
- 克隆项目
git clone https://github.com/MingjunHu/HelperRag.git
cd HelperRag- 安装依赖
pip install -r requirements.txt- 配置
- 复制
config/config.yaml.example到config/config.yaml - 修改配置文件中的相关设置
- 启动服务
# 启动后端服务
cd backend
python server.py
# 启动前端服务
cd frontend
python app.py-
文件上传
- 点击"上传文件"按钮选择txt文件
- 确认上传
- 查看上传状态
-
向量化处理
- 选择需要处理的文件
- 点击"向量化知识库"按钮
- 等待处理完成
- 清空量化数据
-
文件管理
- 查看文件列表
- 监控处理状态
- 删除不需要的文件
- 更新项目结构说明
- 优化文件说明
- 更新项目地址
- 完善文档注释
- 初始版本发布
- 基础文件管理功能
- 向量化处理支持
- 用户界面实现
- Fork 项目
- 创建功能分支
- 提交更改
- 发起 Pull Request
MIT License
huarmy
感谢所有贡献者的付出。