+
95
-

回答

Redis可以通过RedisSearch模块来实现向量存储和相似性查询。以下是使用Redis进行向量存储和相似查询检索的基本步骤和示例:

安装RedisSearch模块

首先,确保你的Redis实例安装了RedisSearch模块。你可以在编译Redis时包含这个模块,或者使用已经包含RedisSearch的Redis发行版。

创建索引

使用FT.CREATE命令创建一个包含向量字段的索引:

FT.CREATE myindex 
    SCHEMA vec VECTOR HNSW 6 TYPE FLOAT32 DIM 128 DISTANCE_METRIC COSINE

这里创建了一个名为"myindex"的索引,包含一个名为"vec"的向量字段。向量维度为128,使用余弦相似度作为距离度量。

添加向量数据

使用HSET命令添加向量数据:

HSET item:1 vec "[0.1,0.2,...,0.5]" 
HSET item:2 vec "[0.2,0.3,...,0.6]"
执行相似性查询

使用FT.SEARCH命令进行相似性查询:

FT.SEARCH myindex "*=>[KNN 5 @vec $query_vector AS score]"
    PARAMS 2 query_vector "[0.3,0.4,...,0.7]" RETURN 1 score 
    SORTBY score DIALECT 2

这个查询会返回与给定查询向量最相似的5个向量。

Python示例

以下是使用Python的redis-py库进行向量存储和查询的示例代码:

import redis
import numpy as np

# 连接到Redis
r = redis.Redis(host='localhost', port=6379, db=0)

# 创建索引
r.execute_command('FT.CREATE', 'myindex', 'SCHEMA', 'vec', 'VECTOR', 'HNSW', '6', 'TYPE', 'FLOAT32', 'DIM', '128', 'DISTANCE_METRIC', 'COSINE')

# 添加向量数据
for i in range(1000):
    vec = np.random.rand(128).tolist()
    r.hset(f'item:{i}', 'vec', str(vec))

# 执行相似性查询
query_vec = np.random.rand(128).tolist()
results = r.execute_command('FT.SEARCH', 'myindex', f'*=>[KNN 5 @vec $query_vector AS score]',
                            'PARAMS', '2', 'query_vector', str(query_vec),
                            'RETURN', '1', 'score',
                            'SORTBY', 'score',
                            'DIALECT', '2')

print(results)

这个示例创建了一个包含1000个随机向量的索引,然后执行了一个相似性查询来找到最相似的5个向量。

注意事项:

确保你的Redis版本和RedisSearch模块版本兼容。向量的维度和距离度量方法要根据你的具体需求来设置。在生产环境中,你可能需要考虑索引的性能优化,如调整HNSW参数等。Redis的向量搜索功能相对较新,在使用时请参考最新的官方文档。

通过这种方式,Redis可以有效地进行向量存储和相似性查询,适用于推荐系统、图像检索等场景。

网友回复

我知道答案,我要回答