Redis可以通过RedisSearch模块来实现向量存储和相似性查询。以下是使用Redis进行向量存储和相似查询检索的基本步骤和示例:
安装RedisSearch模块首先,确保你的Redis实例安装了RedisSearch模块。你可以在编译Redis时包含这个模块,或者使用已经包含RedisSearch的Redis发行版。
创建索引使用FT.CREATE命令创建一个包含向量字段的索引:
FT.CREATE myindex
SCHEMA vec VECTOR HNSW 6 TYPE FLOAT32 DIM 128 DISTANCE_METRIC COSINE 这里创建了一个名为"myindex"的索引,包含一个名为"vec"的向量字段。向量维度为128,使用余弦相似度作为距离度量。
添加向量数据使用HSET命令添加向量数据:
HSET item:1 vec "[0.1,0.2,...,0.5]" HSET item:2 vec "[0.2,0.3,...,0.6]"执行相似性查询
使用FT.SEARCH命令进行相似性查询:
FT.SEARCH myindex "*=>[KNN 5 @vec $query_vector AS score]"
PARAMS 2 query_vector "[0.3,0.4,...,0.7]" RETURN 1 score
SORTBY score DIALECT 2 这个查询会返回与给定查询向量最相似的5个向量。
Python示例以下是使用Python的redis-py库进行向量存储和查询的示例代码:
import redis
import numpy as np
# 连接到Redis
r = redis.Redis(host='localhost', port=6379, db=0)
# 创建索引
r.execute_command('FT.CREATE', 'myindex', 'SCHEMA', 'vec', 'VECTOR', 'HNSW', '6', 'TYPE', 'FLOAT32', 'DIM', '128', 'DISTANCE_METRIC', 'COSINE')
# 添加向量数据
for i in range(1000):
vec = np.random.rand(128).tolist()
r.hset(f'item:{i}', 'vec', str(vec))
# 执行相似性查询
query_vec = np.random.rand(128).tolist()
results = r.execute_command('FT.SEARCH', 'myindex', f'*=>[KNN 5 @vec $query_vector AS score]',
'PARAMS', '2', 'query_vector', str(query_vec),
'RETURN', '1', 'score',
'SORTBY', 'score',
'DIALECT', '2')
print(results) 这个示例创建了一个包含1000个随机向量的索引,然后执行了一个相似性查询来找到最相似的5个向量。
注意事项:
确保你的Redis版本和RedisSearch模块版本兼容。向量的维度和距离度量方法要根据你的具体需求来设置。在生产环境中,你可能需要考虑索引的性能优化,如调整HNSW参数等。Redis的向量搜索功能相对较新,在使用时请参考最新的官方文档。通过这种方式,Redis可以有效地进行向量存储和相似性查询,适用于推荐系统、图像检索等场景。
网友回复


