핵심 개념 (Core Concepts)
FindIP의 시맨틱 특허 검색 엔진이 내부적으로 어떻게 작동하는지 이해해보세요.
벡터 임베딩이란?
벡터 임베딩은 텍스트를 수백 차원의 숫자 벡터로 변환하는 기술입니다. 의미가 비슷한 텍스트는 벡터 공간에서 가까운 위치에 놓이게 되어, 키워드가 다르더라도 의미를 기반으로 유사한 문서를 찾을 수 있습니다.
FindIP의 임베딩 파이프라인
- 특허 문서를 섹션별(제목, 초록, 청구항, 상세설명)로 분할
- 각 섹션을 임베딩 모델로 벡터화하여 벡터 DB에 저장
- 검색 쿼리도 동일 모델로 벡터화한 뒤, 가장 가까운 벡터를 검색
- 리랭킹(Reranking) 모델로 최종 순위를 정밀하게 재조정
시맨틱 검색 (Semantic Search)
전통적인 키워드 매칭과 달리, FindIP는 시맨틱 임베딩을 사용하여 검색어의 숨겨진 의도와 의미를 파악합니다. 따라서 자연어 문장, 기술적 문제점, 또는 해결 방안으로 검색해도, 사용된 단어가 다르더라도 연관성이 높은 특허를 정확히 찾아냅니다.
검색 예시
키워드 검색: "리튬 배터리 발열" — 정확히 일치하는 단어만 검색
시맨틱 검색: "전기차 배터리 팩에서 과열을 방지하는 방법" — 기술적 맥락과 의도를 이해
하이브리드 검색 (2-Track 시스템)
FindIP는 최상의 결과를 얻기 위해 두 가지 검색 전략을 병렬로 결합하여 사용합니다.
Track B — 하이브리드 (문단 단위)
Dense Vector(의미 기반) + Sparse(키워드 기반, BM25) 검색을 결합. **문단 수준(Paragraph level)**에서 매우 정밀하게 일치하는 내용을 찾습니다.
Track C — Dense (문서 단위)
**문서 전체 수준(Document level)**에서의 순수 Dense Vector 검색. 포괄적인 주제나 넓은 범위의 기술적 유사성을 빠르게 찾아내는 데 효과적입니다.
두 트랙에서 나온 결과는 RRF(Reciprocal Rank Fusion) 알고리즘을 통해 융합되어 최종 순위가 매겨집니다.
지원 국가 (Supported Countries)
FindIP는 전 세계 주요 특허청의 특허 데이터를 색인하여 제공합니다.
| 국가 코드 | 국가 / 특허청 | 언어 |
|---|---|---|
KR | 한국 (KIPO) | 한국어 |
US | 미국 (USPTO) | 영어 |
JP | 일본 (JPO) | 일본어 |
CN | 중국 (CNIPA) | 중국어 |
EP | 유럽 특허청 (EPO) | 영어, 프랑스어, 독일어 |
특허 문서 구조
각 특허 문서는 다음과 같은 섹션으로 구성되어 있으며, 각각 개별적으로 검색 및 조회가 가능합니다.
Abstract발명의 내용을 간략히 요약한 초록
Claims특허의 법적 권리 범위를 정의하는 청구항
Description발명의 실시예를 포함한 상세한 기술적 설명
Figures기술의 이해를 돕는 도면 및 다이어그램
Metadata출원일, 공개일, 출원인, IPC 분류 코드 등 각종 메타데이터
API 엔드포인트 개요
FindIP는 다음과 같은 핵심 API 엔드포인트를 제공합니다.
| 메서드 | 엔드포인트 | 설명 |
|---|---|---|
POST | /search | 시맨틱 특허 검색 수행 |
GET | /documents/{id} | 특허 상세 문헌 조회 (Smart Resolution 지원) |
GET | /figures/{id}/{filename} | 특허 도면 이미지 조회 |
POST | /trends | 자연어 기반 특허 트렌드 및 통계 분석 |
POST | /stats | SQL 조건 기반 데이터베이스 직접 집계 통계 |
기본 URL (Base URL): https://api.findip.ai