コアコンセプト
FindIP のセマンティック特許検索エンジンが内部でどう動くかを理解しましょう。
ベクトル埋め込みとは?
ベクトル埋め込みはテキストを数百次元の数値ベクトルに変換する技術です。意味の近いテキストはベクトル空間で近くに配置されるため、キーワードが違っても意味ベースで類似文書を見つけられます。
FindIP の埋め込みパイプライン
- 特許文書をセクション別(タイトル・要約・請求項・詳細説明)に分割
- 各セクションを埋め込みモデルでベクトル化しベクトル DB に保存
- 検索クエリも同一モデルでベクトル化し、最も近いベクトルを検索
- リランキング(Reranking)モデルで最終順位を精密に再調整
セマンティック検索 (Semantic Search)
従来のキーワードマッチと異なり、FindIP はセマンティック埋め込みでクエリに隠れた意図や意味を捉えます。自然言語の文章、技術的課題、解決方法で検索しても、語が違っても関連性の高い特許を正確に見つけます。
検索例
キーワード検索: 「リチウム電池発熱」 — 完全一致する語だけ検索
セマンティック検索: 「EV バッテリーパックで熱暴走を防ぐ方法」 — 技術的文脈と意図を理解
ハイブリッド検索 (2-Track システム)
FindIP は最良の結果のため 2 つの戦略を並列で結合します。
Track B — ハイブリッド(段落単位)
Dense Vector(意味)+ Sparse(キーワード、BM25)検索を結合。段落レベルで非常に精密に一致する内容を見つけます。
Track C — Dense(文書単位)
文書全体レベルの純粋 Dense Vector 検索。包括的なテーマや広範な技術的類似性を素早く見つけるのに有効。
両トラックの結果は RRF(Reciprocal Rank Fusion)アルゴリズムで融合され最終順位がつきます。
対応国 (Supported Countries)
FindIP は世界の主要特許庁のデータをインデックス化し提供します。
| 国コード | 国 / 特許庁 | 言語 |
|---|---|---|
KR | 韓国 (KIPO) | 韓国語 |
US | 米国 (USPTO) | 英語 |
JP | 日本 (JPO) | 日本語 |
CN | 中国 (CNIPA) | 中国語 |
EP | 欧州特許庁 (EPO) | 英語・フランス語・ドイツ語 |
特許文書構造
各特許文書は次のセクションで構成され、それぞれ個別に検索・照会可能です。
Abstract発明内容を簡潔にまとめた要約
Claims特許の法的権利範囲を定める請求項
Description実施例を含む詳細な技術的説明
Figures技術理解を助ける図面・ダイアグラム
Metadata出願日・公開日・出願人・IPC 分類など各種メタデータ
API エンドポイント概要
FindIP は次のコア API エンドポイントを提供します。
| メソッド | エンドポイント | 説明 |
|---|---|---|
POST | /search | セマンティック特許検索 |
GET | /documents/{id} | 特許詳細照会 (Smart Resolution 対応) |
GET | /figures/{id}/{filename} | 特許図面画像取得 |
POST | /trends | 自然言語ベースの特許トレンド・統計分析 |
POST | /stats | SQL 条件によるデータベース直接集計統計 |
ベース URL: https://api.findip.ai