Lazy loaded image
心情随笔
💯个人开源工具
字数 140阅读时长 1 分钟
2024-7-3
type
Page
status
Published
date
Jul 3, 2024
summary
slug
个人开源工具
tags
工具
category
心情随笔
password
URL
icon
fa-solid fa-toolbox
 

SemanticSearch

SemanticSearch 是一个用于计算语义相似度的 Java SDK,开源且免费。它默认使用 Hugging Face 的模型(Nomic-embed-text-v1,强于OPENAI的text-embedding-ada-002和text-embeddings-v3-small)来生成句子的向量表示,并计算字符串之间的语义相似度,您可以根据实际情况切换任意ONNX格式的模型。详情可见https://github.com/luxinfeng/SemanticSearch
Name
SeqLen
MTEB
LoCo
Jina Long Context
Open Weights
Open Training Code
Open Data
nomic-embed-text-v1
8192
62.39
85.53
54.16
jina-embeddings-v2-base-en
8192
60.39
85.45
51.90
text-embedding-3-small
8191
62.26
82.40
58.20
text-embedding-ada-002
8191
60.99
52.70
55.25
上一篇
数据增强——在图片中添加遮挡物
下一篇
深度调研TradingAgents金融智能体