Docs核心概念

核心概念

了解 FindIP 语义专利检索引擎的内部工作原理。

什么是向量嵌入?

向量嵌入是将文本转换为数百维数值向量的技术。语义相近的文本在向量空间中位置相近,因此即便关键词不同,也能基于语义找到相似的文档。

FindIP 的嵌入流水线

  1. 将专利文档按章节(标题、摘要、权利要求、详细说明)切分
  2. 用嵌入模型将每个章节向量化并存入向量数据库
  3. 用同一模型将检索查询向量化,并找出最近的向量
  4. 使用重排(Reranking)模型对最终排序进行精细化

语义检索 (Semantic Search)

与传统关键词匹配不同,FindIP 使用语义嵌入捕捉查询背后的意图和含义。即便用自然语言句子、技术问题或解决方案表达,词语不同也能准确找到相关性高的专利。

检索示例

关键词检索: "锂电池发热" — 仅匹配完全相同的词

语义检索: "如何防止电动汽车电池组热失控" — 理解技术背景与意图

混合检索 (2-Track 系统)

FindIP 为获得最佳结果,将两种检索策略并行结合。

Track B — 混合(段落级)

Dense Vector(语义)+ Sparse(关键词,BM25)检索结合。在段落级找到非常精确匹配的内容。

Track C — Dense(文档级)

整个文档级别的纯 Dense Vector 检索。适用于快速发现宽泛主题或大范围技术相似性。

两轨道的结果通过 RRF(Reciprocal Rank Fusion)算法融合产出最终排序。

支持国家 (Supported Countries)

FindIP 索引并提供全球主要专利局的专利数据。

国家代码国家 / 专利局语言
KR韩国 (KIPO)韩语
US美国 (USPTO)英语
JP日本 (JPO)日语
CN中国 (CNIPA)中文
EP欧洲专利局 (EPO)英语、法语、德语

专利文档结构

每份专利文档由以下章节组成,可分别检索和查询。

Abstract

简要总结发明的内容

Claims

界定专利法律权利范围的权利要求

Description

包含实施例的详细技术说明

Figures

帮助理解技术的附图与示意图

Metadata

申请日、公开日、申请人、IPC 分类等各种元数据

API 端点概览

FindIP 提供以下核心 API 端点。

方法端点说明
POST/search语义专利检索
GET/documents/{id}专利详情查询(支持 Smart Resolution)
GET/figures/{id}/{filename}专利附图图像
POST/trends基于自然语言的专利趋势与统计分析
POST/stats基于 SQL 条件的数据库直接聚合统计

基础 URL: https://api.findip.ai

FindIP | Semantic Patent Search