+
50
-

nodejs有没有文件向量数据库?

nodejs有没有文件向量数据库?可以插入和查询向量。


网友回复

+
0
-

有,Vectra可以,并且是开源的。

Vectra 是一个 Node.js 的本地向量数据库,类似于 Pinecone 或 Qdrant,但使用本地文件构建。它允许用户在创建索引时指定要索引的元数据属性,并将这些字段存储在 index.json 文件中。

所有其他元数据将存储在磁盘上的单独文件中,每个项目都使用 GUID 进行索引。

Vectra 支持与 Pinecone 类似的 MongoDB 查询操作子集,并返回按相似性排序的结果。

每个项目都会首先通过元数据过滤,然后进行相似性排名。

Vectra 的整个索引都加载到内存中,因此不适合用于长记忆聊天机器人内存等情况。

它旨在用于小型静态数据集的情况,例如无限的几次示例或单个文档,用户想要对其进行询问。

Vectra 不直接支持 Pinecone 样式的命名空间,但可以通过创建单独的 Vectra 索引(和文件夹)来模拟每个命名空间。

安装 Vectra 后,用户需要创建一个 LocalIndex 实例,并指定存储项目的文件夹的路径。然后,用户可以从异步函数中创建索引,向其添加项目并查询项目。

npm install vectra

import { LocalIndex } from 'vectra';

const index = new LocalIndex(path.join(__dirname, '..', 'index'));
if (!await index.isIndexCreated()) {
    await index.createIndex();
}

从openai获取embedding插入到vectra中

import { OpenAIApi, Configuration } from 'openai';

const configuration = new Configuration({
    apiKey: `<YOUR_KEY>`,
});

const api = new OpenAIApi(configuration);

async function getVector(text: string) {
    const response = await api.createEmbedding({
        'model': 'text-embedding-ada-002',
        'input': text,
    });
    return response.data.data[0].embedding;
}

async function addItem(text: string) {
    await index.insertItem({
        vector: await getVector(text),
        metadata: { text }
    });
}

// Add items
await addItem('apple');
await addItem('oranges');
await addItem('red');
await addItem('blue');

查询

async function query(text: string) {
    const vector = await getVector(text);
    const results = await index.queryItems(vector, 3);
    if (results.length > 0) {
        for (const result of results) {
            console.log(`[${result.score}] ${result.item.metadata.text}`);
        }
    } else {
        console.log(`No results found.`);
    }
}

await query('green');
/*
[0.9036569942401076] blue
[0.8758153664568566] red
[0.8323828606103998] apple
*/

await query('banana');
/*
[0.9033128691220631] apple
[0.8493374123092652] oranges
[0.8415324469533297] blue
*/

github:https://github.com/Stevenic/vectra
我知道答案,我要回答