Docsコアコンセプト

コアコンセプト

FindIP のセマンティック特許検索エンジンが内部でどう動くかを理解しましょう。

ベクトル埋め込みとは?

ベクトル埋め込みはテキストを数百次元の数値ベクトルに変換する技術です。意味の近いテキストはベクトル空間で近くに配置されるため、キーワードが違っても意味ベースで類似文書を見つけられます。

従来のキーワードマッチと異なり、FindIP はセマンティック埋め込みでクエリに隠れた意図や意味を捉えます。自然言語の文章、技術的課題、解決方法で検索しても、語が違っても関連性の高い特許を正確に見つけます。

キーワード検索: 「リチウム電池発熱」 — 完全一致する語だけ検索

セマンティック検索: 「EV バッテリーパックで熱暴走を防ぐ方法」 — 技術的文脈と意図を理解

FindIP はキーワード(BM25)マッチングを行いません。検索パイプラインは完全にセマンティックで、次の 2 段階で動作します。

各特許は段落・請求項単位のチャンクに分割され、ベクトルに埋め込まれます。クエリも同一モデルで埋め込み、ベクトル類似度(similarity_score)が最も近いチャンクを取得します。

リランキングモデルが取得した候補をクエリと再度照合してスコアを付け、最終順位(rerank_score)を精密に決定します。結果はこのリランクスコア順で返されます。

マッチングが段落 / チャンク単位で行われるため、短いキーワードの羅列よりも、具体的な技術的課題や解決方法を自然言語で記述する方が関連性の高い結果を得やすくなります。

FindIP は世界の主要特許庁のデータをインデックス化し提供します。

各特許文書は次のセクションで構成され、それぞれ個別に検索・照会可能です。

Abstract

発明内容を簡潔にまとめた要約

Claims

特許の法的権利範囲を定める請求項

Description

実施例を含む詳細な技術的説明

Figures

技術理解を助ける図面・ダイアグラム

Metadata

出願日・公開日・出願人・IPC 分類など各種メタデータ