Data Lineage

追溯来源、共同源与污染风险

内置文本与多模态索引,支持实时补全未收录数据的血缘信息。

org/name 输入 深度 + 模态 未收录可检索
已索引数据集
已索引关系边
风险基准集
模态支持
使用步骤与功能说明
01
输入目标数据集
支持单个或多个目标,未收录数据也可直接输入。
02
设定深度与模态
选择文本或多模态,并用深度控制回溯范围。
03
查看图谱与洞察
查看共同来源、污染路径和关键节点关系。
上游追溯
回溯 source data、中间数据集和关键依赖链。
多目标对比
并排分析多个目标,快速定位共同来源与交叉依赖。
污染检测
识别 Benchmark 污染路径,辅助评测与训练检查。
结构洞察
汇总类别、数据类型、摘要与节点统计。

输入目标数据集名称和最大深度,系统将以树形结构展示该数据集的来源(向上追溯)

3
错误的模态选择会影响数据分类准确性
血缘图预览
等待开始分析
● READY
输入数据集后点击生成
节点数
边数
实际深度
解析耗时

数据集信息