RagFlow
accttodo
# RagFlow
定位:面向复杂 RAG 场景的开源框架,侧重数据处理与自动化。
核心能力:
- 支持多模态数据解析(文本、表格、图像)与高精度向量化;
- 内置规则引擎,可自定义数据清洗与增强流程;
- 需结合自研模型或第三方 LLM 实现问答功能。
技术架构
- 基于 Python 生态,兼容多种向量数据库(如 Milvus、Elasticsearch)15。
适用场景:科研数据处理、高精度知识检索。
# 什么是RAGFlow?
RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出。
RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制等,特别强调了深度文档理解技术,能够从复杂格式的非结构化数据中提取关键信息。
# RAGFlow的技术架构
# RAGFlow的部署使用
# 环境依赖
软件/系统 | 版本 | 架构 | 包名 | 安装方式 | 备注 |
---|---|---|---|---|---|
Linux | CentOS-7.X | x86_64 | |||
jenkins | 2.346.3-1.1 | jenkins-2.346.3-1.1.noarch.rpm (opens new window) | 离线程序安装 | 官网下载 (opens new window) | |
java | 1.8.0_411 |