Docs核心概念
核心概念
了解 FindIP 语义专利检索引擎的内部工作原理。
什么是向量嵌入?
向量嵌入是将文本转换为数百维数值向量的技术。语义相近的文本在向量空间中位置相近,因此即便关键词不同,也能基于语义找到相似的文档。
FindIP 的嵌入流水线
- 将专利文档按章节(标题、摘要、权利要求、详细说明)切分
- 用嵌入模型将每个章节向量化并存入向量数据库
- 用同一模型将检索查询向量化,并找出最近的向量
- 使用重排(Reranking)模型对最终排序进行精细化
语义检索 (Semantic Search)
与传统关键词匹配不同,FindIP 使用语义嵌入捕捉查询背后的意图和含义。即便用自然语言句子、技术问题或解决方案表达,词语不同也能准确找到相关性高的专利。
检索示例
关键词检索: "锂电池发热" — 仅匹配完全相同的词
语义检索: "如何防止电动汽车电池组热失控" — 理解技术背景与意图
混合检索 (2-Track 系统)
FindIP 为获得最佳结果,将两种检索策略并行结合。
Track B — 混合(段落级)
Dense Vector(语义)+ Sparse(关键词,BM25)检索结合。在段落级找到非常精确匹配的内容。
Track C — Dense(文档级)
在整个文档级别的纯 Dense Vector 检索。适用于快速发现宽泛主题或大范围技术相似性。
两轨道的结果通过 RRF(Reciprocal Rank Fusion)算法融合产出最终排序。
支持国家 (Supported Countries)
FindIP 索引并提供全球主要专利局的专利数据。
| 国家代码 | 国家 / 专利局 | 语言 |
|---|---|---|
KR | 韩国 (KIPO) | 韩语 |
US | 美国 (USPTO) | 英语 |
JP | 日本 (JPO) | 日语 |
CN | 中国 (CNIPA) | 中文 |
EP | 欧洲专利局 (EPO) | 英语、法语、德语 |
专利文档结构
每份专利文档由以下章节组成,可分别检索和查询。
Abstract简要总结发明的内容
Claims界定专利法律权利范围的权利要求
Description包含实施例的详细技术说明
Figures帮助理解技术的附图与示意图
Metadata申请日、公开日、申请人、IPC 分类等各种元数据
API 端点概览
FindIP 提供以下核心 API 端点。
| 方法 | 端点 | 说明 |
|---|---|---|
POST | /search | 语义专利检索 |
GET | /documents/{id} | 专利详情查询(支持 Smart Resolution) |
GET | /figures/{id}/{filename} | 专利附图图像 |
POST | /trends | 基于自然语言的专利趋势与统计分析 |
POST | /stats | 基于 SQL 条件的数据库直接聚合统计 |
基础 URL: https://api.findip.ai