我来为您创建一个可交互的HTML页面,展示这个ER模型设计。 ```html 校本知识库 RAG 系统 — ER 模型设计

📚 校本知识库 RAG 系统 — ER 模型设计(一期)

以「课」(Lesson)为核心,面向检索、关联与解释的实体关系模型

12
实体总数
21
关系总数
5
实体分类
4
向量化模板
RAG
系统目标
🧩 实体定义标准(5条判断准则)

① 有独立身份

不依附于某个特定资源而存在

💡 "张老师" 不管有没有课件,他都存在

② 被多方引用

多个其他实体会指向它

💡 同一"章节节点"被 20 个课件引用

③ 有自己的属性

不只是一个名字,自身还有需要描述的信息

💡 "学校"有名称、地区、类型等属性

④ 有内部结构

自身有层级、分类等结构

💡 章节树有父子层级关系

⑤ 独立变更

自身信息变化时不应连带修改其他实体

💡 教师改名,不应该去改每个课件
🗂️ 实体分类概览
🌟 核心聚合实体
课(Lesson)
串联所有资源的教学单元,是检索主链路的核心枢纽
📑 资源实体
课件 · 课堂实录
实际的教学内容载体,支持 Filter / Enrichment
🔬 原子级实体
课件页 · 教学环节片段
最小检索单元,直接承载 Embedding 文本
📝 标注实体
教学方法标注 · 知识内容标注 · 师生交互记录
挂接在片段上的语义增强标注
🏗️ 结构实体
章节节点 · 知识点
树形层级结构,支持路径检索
👥 对象实体
教师 · 学校/机构 · 教材 · 课堂结构标签
辅助检索的关联对象
🔍 RAG 检索主链路
课(Lesson) 课件 / 实录 原子片段 / 课件页 教学方法 / 知识内容 / 交互 结构标签 / 章节路径 关联跳转
📚 课(Lesson)
核心聚合实体
🔑 lesson_id
课名称 / 学科 / 年级
课型 / 章节树
📑 课件
资源实体
🔑 id
名称 / 学段 / 学科
年级 / 课型 / 总页数
🎥 课堂实录
资源实体
🔑 id
名称 / 学段 / 学科
年级 / 课型 / 时长
📄 课件页
原子级实体
🔑 id
页码 / 页面文本★
缩略图URL
🎬 教学环节片段
原子级实体
🔑 segment_id
开始/结束时间
片段摘要★ / 转写★
📝 教学方法标注
标注实体
🔑 method_id
教学方法标签
教学方法说明
📝 知识内容标注
标注实体
🔑 knowledge_id
知识点名称★
知识模块
📝 师生交互记录
标注实体
🔑 interaction_id
交互类型
交互说明
📖 章节节点
结构实体
🔑 id
名称 / 层级
完整路径 / 父节点ID
🧠 知识点
结构实体
🔑 id
名称 / 层级
完整路径 / 父节点ID
🏷️ 课堂结构标签
标签实体
🔑 id
标签名称 / 排序序号
📚 教材
弱实体
🔑 id
名称 / 学段
学科 / 版本
👨‍🏫 教师
对象实体
🔑 id
姓名
🏫 学校/机构
对象实体
🔑 id
名称 / 地区
实体类型
核心聚合实体
资源实体
原子级实体
标注实体
结构实体
对象实体
弱实体
💡 拖动色块可重新布局 · 悬停查看关系
🔗 实体关系定义表(R1–R21)
# 关系名称 源实体 目标实体 基数 说明 一期
🧠 向量化拼接策略

遵循「自身核心文本 + 父实体上下文 + 结构标签补充 + 关联对象增强」原则

📑 课件资源级
📄 课件页级
🎥 课堂实录级
🎬 教学环节片段级
// 自身属性 【资源名称】{课件.名称} 【学段】{课件.学段} 【学科】{课件.学科} 【年级】{课件.年级} 【课型】{课件.课型} 【简介】{课件.简介} 【课时序号】{课件.课时序号} // 关联结构信息 【章节】{→ 章节节点.完整路径} 【知识点】{→ 知识点.名称} // 教材为增强项,不作为一期前置依赖 【教材】{→ 教材.名称,可为空}
// 从父实体继承上下文 【资源名称】{← 课件.名称} 【课型】{← 课件.课型} 【章节】{← 课件 → 章节节点.完整路径} 【知识点】{← 课件 → 知识点.名称} // 自身属性 【页码】第{课件页.页码}页 【页面文本】{课件页.页面文本} ★ Embedding核心 【备注】{课件页.页面备注}
// 自身属性 【资源名称】{实录.名称} 【学段】{实录.学段} 【学科】{实录.学科} 【年级】{实录.年级} 【课型】{实录.课型} 【教学目标】{实录.教学目标} 【简介】{实录.简介} // 关联结构信息 【章节】{→ 章节节点.完整路径} 【知识点】{→ 知识点.名称} 【主讲教师】{→ 教师.姓名,可为空}
// 从父实体(课 / 实录)继承 【资源名称】{← 实录.名称} 【课型】{← 实录.课型} 【教学目标】{← 实录.教学目标} 【章节】{← 实录 → 章节节点.完整路径} 【知识点】{← 实录 → 知识点.名称} // 课堂结构标签 【课堂结构】{→ 课堂结构标签.标签名称} // 自身属性 【片段摘要】{教学环节片段.片段摘要} ★ 高质量概述,优先拼入 【片段时间】{开始时间} - {结束时间} 【片段转写文本】{教学环节片段.片段转写文本} ★ Embedding核心 // 标注增强(多条合并拼接) 【教学方法】{→ 教学方法标注.教学方法标签}{→ 教学方法标注.教学方法说明,可为空} 【知识内容】{→ 知识内容标注.知识点名称}{→ 知识内容标注.知识模块}):{→ 知识内容标注.知识点说明,可为空} 【师生交互】{→ 师生交互记录.交互类型}{→ 师生交互记录.交互说明,可为空} // 理科补偿:拼接映射课件页文本 【对应课件页文本】{↔ 课件页.页面文本,可为空}
📌 向量化字段说明
🌟 Embedding 核心字段
页面文本★、片段摘要★、片段转写文本★、知识点名称★
直接进入向量索引
🔽 Filter 过滤字段
学段、学科、年级、课型、学年
用于精确过滤检索范围
📖 Enrichment 增强字段
简介、教学目标、教学方法说明
拼接后增强语义表达
⬆️ 父实体上下文继承
← 表示从父实体继承
→ 表示关联到子实体
↔ 表示双向映射
``` 这个页面包含以下完整功能: **📊 五个交互面板:** 1. **总览** — 实体分类概览、定义标准、RAG检索主链路可视化 2. **ER结构图** — 14个可拖拽色块节点 + SVG贝塞尔曲线连线,必须关系蓝色实线,可选关系灰色虚线,悬停显示Tooltip 3. **实体属性** — 支持关键词搜索 + 类型筛选,所有字段的RAG用途和一期级别用彩色Badge显示 4. **关系定义** — R1-R21完整关系表,支持搜索筛选,必须/可选用左侧色条区分 5. **向量化模板** — 4个子Tab切换,代码高亮显示,箭头方向/核心字段★用不同颜色区分