EmbedAI-server

随处可用的智能知识助手系统，基于图数据库和大语言模型，提供高性能的知识检索和智能问答服务。

配套项目

功能特性

轻松植入：提供多语言SDK和完整API，支持快速接入任何系统
智能问答：基于大语言模型和图数据库的知识检索，提供准确的问答服务
知识库隔离：为每个接入系统提供独立的知识库空间，确保数据安全和隔离
高效文档管理：支持多种文档类型的管理，包括创建、更新、查询和软删除
权限控制：完善的访问权限管理，支持多租户和多角色

技术优势

极简接入方案
- 完整的RESTful API支持，支持任意系统快速集成
- 支持Docker一键部署，简化运维成本
基于图数据库的知识存储
- 相比传统关系型数据库，图数据库能更自然地表达实体间的复杂关系
- 支持高效的图遍历算法，显著提升多跳关系查询性能
- 灵活的图模型设计，便于动态扩展知识结构
- 强大的关系分析能力，支持知识推理和关联发现
AI问答处理流程
- 智能实体识别：区分命名实体和通用实体，通过向量编码实现精准匹配
- 多层次评分机制：
  - 实体评分：基于向量相似度，对命名实体和通用实体采用差异化评分策略
  - 图结构评分：利用图结构信息重新评估实体重要性，考虑实体间关系强度
  - 关系评分：基于实体分数评估关系重要性，使用实体到关系的映射矩阵
  - 文本块评分：通过关系找到相关文本块，确保上下文完整性
- 确保查询理解准确性和结果相关性
企业级特性
- 多租户隔离机制
- 访问控制策略
- 文档的软删除机制
- 知识库训练队列管理

用户和知识库的关系

User (用户)
├── owned_knowledge_bases (拥有的知识库，一对多)
│   └── KnowledgeBase.owner_id 引用 User.id
│
└── knowledge_bases (参与的知识库，多对多)
    └── knowledge_base_users (关联表)
        ├── user_id 引用 User.id
        ├── knowledge_base_id 引用 KnowledgeBase.id
        ├── permission (权限)
        └── created_at (加入时间)

KnowledgeBase (知识库)
├── owner (所有者，多对一)
│   └── owner_id 引用 User.id
│
└── users (成员，多对多)
    └── knowledge_base_users (关联表)
        ├── knowledge_base_id 引用 KnowledgeBase.id
        ├── user_id 引用 User.id
        ├── permission (权限)
        └── created_at (加入时间)

数据库关系

TODO LIST

sdk

web SDK

后台管理

后台管理页面

服务器功能

查询过程

让我为您详细解释每个步骤的作用和原因：

生成查询嵌入

作用：将文本转换为向量表示
原因：
- 便于在向量空间中进行相似度计算
- 区分处理命名实体和通用实体，通过添加[NONE]前缀来区分实体类型
- 将查询文本也转换为向量，实现统一的相似度计算

向量数据库评分

作用：基于向量相似度为实体打分
原因：
- 命名实体使用严格匹配（top_k=1），因为命名实体需要精确匹配
- 通用实体使用模糊匹配（top_k=20），允许更多相关实体的召回
- 使用不同的阈值控制匹配质量

实体评分合并

作用：整合不同来源的实体评分
原因：
- 使用max操作选择最高分，确保最相关的匹配被保留
- 统一评分标准，便于后续处理

图结构评分

作用：利用图结构信息进行二次评分
原因：
- 考虑实体间的关系网络
- 利用图的结构特征提升评分的准确性
- 补充纯向量相似度无法捕捉的结构信息

实体检索

作用：根据最终评分提取相关实体
原因：
- 使用排序后的评分确保获取最相关的实体
- 异步获取实体信息提高效率
- 过滤无效实体，确保结果质量

关系检索

作用：基于已选实体提取相关关系
原因：
- 利用实体评分传导到关系层面
- 确保关系的两端实体都具有较高相关性
- 构建实体间的语义连接

文档块检索

作用：获取支持关系的原始文本证据
原因：
- 提供关系的上下文支持
- 通过文档块回溯到原始信息
- 为最终答案生成提供证据支持

上下文构建

作用：组织检索到的所有信息
原因：
- 将实体、关系、文档块统一组织
- 提供结构化的上下文信息
- 便于后续的答案生成

这种层层递进的设计体现了：

从表层到深层的信息提取过程
多维度的相关性评估机制
完整的知识图谱利用策略
高效的异步处理机制

Name		Name	Last commit message	Last commit date
Latest commit History 88 Commits
.vscode		.vscode
app		app
tests		tests
workspaces/kb_2_20250224_150644		workspaces/kb_2_20250224_150644
.gitignore		.gitignore
.python-version		.python-version
1.txt		1.txt
README.md		README.md
__init__.py		__init__.py
alembic.ini		alembic.ini
main.py		main.py
poetry.lock		poetry.lock
project_structure.txt		project_structure.txt
pyproject.toml		pyproject.toml
pytest.ini		pytest.ini

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EmbedAI-server

配套项目

功能特性

技术优势

用户和知识库的关系

数据库关系

TODO LIST

sdk

后台管理

服务器功能

查询过程

About

Releases

Packages

Languages

congwa/EmbedAI-server

Folders and files

Latest commit

History

Repository files navigation

EmbedAI-server

配套项目

功能特性

技术优势

用户和知识库的关系

数据库关系

TODO LIST

sdk

后台管理

服务器功能

查询过程

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages