Docsコアコンセプト
コアコンセプト
FindIP のセマンティック特許検索エンジンが内部でどう動くかを理解しましょう。
ベクトル埋め込みとは?
ベクトル埋め込みはテキストを数百次元の数値ベクトルに変換する技術です。意味の近いテキストはベクトル空間で近くに配置されるため、キーワードが違っても意味ベースで類似文書を見つけられます。
FindIP の埋め込みパイプライン
- 特許文書をセクション別(タイトル・要約・請求項・詳細説明)に分割
- 各セクションを埋め込みモデルでベクトル化しベクトル DB に保存
- 検索クエリも同一モデルでベクトル化し、最も近いベクトルを検索
- リランキング(Reranking)モデルで最終順位を精密に再調整
セマンティック検索 (Semantic Search)
従来のキーワードマッチと異なり、FindIP はセマンティック埋め込みでクエリに隠れた意図や意味を捉えます。自然言語の文章、技術的課題、解決方法で検索しても、語が違っても関連性の高い特許を正確に見つけます。
検索例
キーワード検索: 「リチウム電池発熱」 — 完全一致する語だけ検索
セマンティック検索: 「EV バッテリーパックで熱暴走を防ぐ方法」 — 技術的文脈と意図を理解
順位付けの仕組み: ベクトル検索 + リランキング
FindIP はキーワード(BM25)マッチングを行いません。検索パイプラインは完全にセマンティックで、次の 2 段階で動作します。
ステージ 1 — ベクトル検索(段落 / チャンク単位)
各特許は段落・請求項単位のチャンクに分割され、ベクトルに埋め込まれます。クエリも同一モデルで埋め込み、ベクトル類似度(similarity_score)が最も近いチャンクを取得します。
ステージ 2 — リランキング
リランキングモデルが取得した候補をクエリと再度照合してスコアを付け、最終順位(rerank_score)を精密に決定します。結果はこのリランクスコア順で返されます。
マッチングが段落 / チャンク単位で行われるため、短いキーワードの羅列よりも、具体的な技術的課題や解決方法を自然言語で記述する方が関連性の高い結果を得やすくなります。
対応国 (Supported Countries)
FindIP は世界の主要特許庁のデータをインデックス化し提供します。
| 国コード | 国 / 特許庁 | 言語 |
|---|---|---|
US | 米国 (USPTO) | 英語 |
CN | 中国 (CNIPA) | 中国語 |
JP | 日本 (JPO) | 日本語 |
KR | 韓国 (KIPO) | 韓国語 |
EP | 欧州特許庁 (EPO) | 英語・フランス語・ドイツ語 |
特許文書構造
各特許文書は次のセクションで構成され、それぞれ個別に検索・照会可能です。
Abstract発明内容を簡潔にまとめた要約
Claims特許の法的権利範囲を定める請求項
Description実施例を含む詳細な技術的説明
Figures技術理解を助ける図面・ダイアグラム
Metadata出願日・公開日・出願人・IPC 分類など各種メタデータ