AI-powered academic article screening and analysis tool

These details have not been verified by PyPI

Project links

Project description

Lutz

Biblioteca e ferramenta de linha de comando para organizar, vetorizar e analisar artigos academicos em PDF com IA.

Python Version License Status CLI

Tags: revisao sistematica, triagem academica, artigos cientificos, IA generativa, LLM, RAG, embeddings, PDF, LanceDB, Python, ciencia aberta, pesquisa academica.

Lutz ajuda pesquisadores, estudantes e equipes de revisao bibliografica a lidar com muitos artigos em PDF. O pacote cria uma estrutura de projeto, copia os PDFs para o lugar correto, faz uma verificacao basica de seguranca, extrai o texto, gera embeddings, salva tudo em um banco vetorial local e usa um modelo de linguagem para responder a prompts de analise.

Versao atual do pacote: 0.1.0.

O nome do pacote e inspirado em Bertha Maria Julia Lutz, importante cientista brasileira, biologa e pesquisadora que contribuiu para a biologia e para a valorizacao da ciencia no Brasil.

Para que serve

Use o Lutz quando voce precisa:

Organizar uma pasta de artigos cientificos em PDF.
Preparar uma revisao sistematica, revisao narrativa, mapeamento de literatura ou triagem inicial de estudos.
Fazer perguntas sobre um conjunto de artigos usando um modelo de linguagem.
Gerar uma analise estruturada a partir de prompts em Markdown.
Manter os arquivos, prompts, banco vetorial e relatorios dentro de um projeto reproduzivel.

O Lutz nao substitui a leitura critica nem a decisao metodologica de pesquisadores. Ele e uma ferramenta de apoio para acelerar organizacao, busca semantica e primeira sintese dos textos.

Como o Lutz funciona

PDFs -> verificacao de seguranca -> extracao de texto -> embeddings -> banco vetorial -> analise com LLM -> relatorio JSON

Fluxo basico:

lutz init cria uma pasta de projeto com subpastas, prompts prontos e .env.example.
lutz load copia seus PDFs para a pasta articles/.
lutz vectorize verifica os PDFs, extrai texto, divide o conteudo em trechos e cria embeddings.
lutz analysis usa um prompt em Markdown para analisar os artigos vetorizados.
Os resultados ficam em analysis/execution_reports/.

Antes de comecar

Voce vai precisar de:

Um computador com Windows, macOS ou Linux.
Acesso ao terminal. No Windows, pode ser PowerShell; no macOS e Linux, Terminal.
Python 3.10 ou superior.
Uma pasta com seus artigos em PDF.
Um modelo de IA para a analise: autohospedado via Docker Model Runner, Ollama ou llama.cpp; OpenAI/OpenRouter; ou Anthropic.

A instalacao abaixo usa Python local com ambiente virtual.

Instalacao

Python local

Instale Python 3.10 ou superior.

Verifique a versao:

python --version

Em alguns sistemas, o comando pode ser python3 --version.

Baixe e entre no repositorio.

git clone https://github.com/jooguilhermesc/lutz.git
cd lutz

Crie e ative um ambiente virtual.

Linux ou macOS:

python -m venv .venv
source .venv/bin/activate

Windows PowerShell:

python -m venv .venv
.\.venv\Scripts\Activate.ps1

Instale o pacote.

python -m pip install --upgrade pip
pip install -e .

Teste a instalacao.

lutz --help
lutz --version

Primeiro uso passo a passo

Os comandos abaixo assumem que o comando lutz ja funciona no seu terminal.

1. Crie uma pasta para sua revisao

mkdir minha-revisao
cd minha-revisao
lutz init

O Lutz criara uma estrutura parecida com esta:

articles/                  PDFs da pesquisa
prompts/                   modelos de prompts
analysis/execution_reports/ relatorios gerados
.env.example               exemplo de configuracao
README.md                  anotacoes do projeto

2. Configure os modelos de IA

Copie o arquivo de exemplo:

Linux ou macOS:

cp .env.example .env

Windows PowerShell:

Copy-Item .env.example .env

Abra o arquivo .env em um editor de texto e escolha uma das configuracoes da secao Configuracao dos modelos.

3. Coloque seus PDFs no projeto

Voce pode copiar os arquivos manualmente para a pasta articles/ ou usar o comando load.

Exemplo no Linux ou macOS:

lutz load --f ~/Downloads/meus-artigos --so linux

Exemplo no macOS:

lutz load --f ~/Desktop/artigos --so mac

Exemplo no Windows:

lutz load --f "C:\Users\Ana\Downloads\artigos" --so windows

Se os PDFs ja estiverem em articles/, voce pode pular este passo.

4. Crie o indice vetorial dos artigos

lutz vectorize

Esse comando pode demorar na primeira execucao, principalmente se houver muitos PDFs ou se o modelo local ainda precisar ser baixado.

5. Rode uma analise

lutz analysis --p prompts/systematic_review.md

Para analisar cada artigo separadamente, use:

lutz analysis --p prompts/systematic_review.md --per-article

6. Abra o resultado

Os arquivos ficam em:

analysis/execution_reports/

Cada execucao gera um arquivo .json com metadados, artigos usados, tokens e resposta do modelo.

Configuracao dos modelos

As configuracoes ficam no arquivo .env, criado a partir de .env.example.

Opcao local/autohospedada: Docker Model Runner

Esta opcao usa modelos locais pelo Docker Model Runner e nao exige chave de API externa.

Baixe os modelos.

docker model pull nomic-embed-text
docker model pull ai/llama3.2

Configure o .env.

EMBEDDING_PROVIDER=docker_model_runner
EMBEDDING_MODEL=nomic-embed-text

LLM_PROVIDER=docker_model_runner
LLM_MODEL=ai/llama3.2

DOCKER_MODEL_HOST=http://localhost:12434/engines/v1

Opcao autohospedada com Ollama ou llama.cpp

O Lutz tambem pode usar servidores locais compativeis com a API da OpenAI. Isso inclui Ollama e llama.cpp server.

Para endpoints locais, OPENAI_API_KEY pode ser um valor ficticio quando o servidor nao exige autenticacao.

Exemplo com Ollama:

EMBEDDING_PROVIDER=sentence_transformers
EMBEDDING_MODEL=all-MiniLM-L6-v2

LLM_PROVIDER=openai
OPENAI_BASE_URL=http://localhost:11434/v1
OPENAI_API_KEY=ollama
LLM_MODEL=llama3.2

Exemplo com llama.cpp server:

EMBEDDING_PROVIDER=sentence_transformers
EMBEDDING_MODEL=all-MiniLM-L6-v2

LLM_PROVIDER=openai
OPENAI_BASE_URL=http://localhost:8080/v1
OPENAI_API_KEY=llama-cpp
LLM_MODEL=modelo-carregado-no-servidor

Se o servidor autohospedado tambem oferecer embeddings pela API compativel com OpenAI, voce pode configurar EMBEDDING_PROVIDER=openai e usar o modelo de embeddings correspondente.

Opcao com OpenRouter ou API compativel com OpenAI

Use esta opcao se voce tem uma chave de API ou quer usar modelos gratuitos do OpenRouter.

Crie uma conta em https://openrouter.ai.
Gere uma chave em https://openrouter.ai/keys.
Configure o .env.

EMBEDDING_PROVIDER=sentence_transformers
EMBEDDING_MODEL=all-MiniLM-L6-v2

LLM_PROVIDER=openai
OPENAI_BASE_URL=https://openrouter.ai/api/v1
OPENAI_API_KEY=sua-chave-aqui
LLM_MODEL=google/gemma-3-12b-it:free

Tambem funciona com OpenAI padrao:

EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small

LLM_PROVIDER=openai
OPENAI_API_KEY=sua-chave-aqui
LLM_MODEL=gpt-4o-mini

Opcao com Anthropic

EMBEDDING_PROVIDER=sentence_transformers
EMBEDDING_MODEL=all-MiniLM-L6-v2

LLM_PROVIDER=anthropic
ANTHROPIC_API_KEY=sua-chave-aqui
LLM_MODEL=claude-haiku-4-5-20251001

Variaveis uteis

Variavel	Para que serve
`EMBEDDING_PROVIDER`	Define quem gera embeddings: `docker_model_runner`, `openai` ou `sentence_transformers`.
`EMBEDDING_MODEL`	Nome do modelo de embeddings.
`LLM_PROVIDER`	Define o provedor do modelo de linguagem: `docker_model_runner`, `openai` ou `anthropic`.
`LLM_MODEL`	Nome do modelo usado na analise.
`OPENAI_API_KEY`	Chave para OpenAI ou servico compativel. Em endpoints locais sem autenticacao, pode ser um valor ficticio.
`OPENAI_BASE_URL`	URL alternativa para APIs compativeis com OpenAI.
`ANTHROPIC_API_KEY`	Chave da Anthropic.
`DOCKER_MODEL_HOST`	Endereco do Docker Model Runner quando usado com instalacao Python local.
`DOCKER_MODEL_API_KEY`	Chave usada pelo cliente compativel com OpenAI do Docker Model Runner. Normalmente nao precisa ser alterada.
`LLM_MAX_TOKENS`	Tamanho maximo da resposta do modelo. Padrao: `4096`.
`LLM_TEMPERATURE`	Grau de variacao da resposta. Padrao: `0.2`.
`HUGGINGFACE_TOKEN`	Token opcional para modelos protegidos usados via `sentence_transformers`.

Comandos principais

`lutz init [PROJECT_NAME]`

Cria um novo projeto Lutz.

lutz init
lutz init minha-revisao

O comando cria:

articles/
prompts/
analysis/execution_reports/
.env.example
.gitignore
README.md do projeto
repositorio Git local

`lutz load --f FOLDER [--so OS] [--overwrite]`

Copia PDFs de uma pasta de origem para articles/.

Opcao	Descricao	Padrao
`--f`	Caminho da pasta onde estao os PDFs.	obrigatoria
`--so`	Sistema do caminho informado: `linux`, `windows` ou `mac`.	informe conforme seu sistema
`--overwrite`	Sobrescreve arquivos ja existentes em `articles/`.	desativado

Exemplos:

lutz load --f ~/Downloads/artigos --so linux
lutz load --f ~/Desktop/artigos --so mac

Windows PowerShell:

lutz load --f "C:\Users\Ana\Downloads\artigos" --so windows

`lutz vectorize [--skip-security] [--chunk-size N] [--chunk-overlap N] [--quarantine]`

Processa os PDFs de articles/ e cria o banco vetorial local em .lutz/vector_store/.

Opcao	Descricao	Padrao
`--skip-security`	Pula a verificacao de seguranca. Nao recomendado.	desativado
`--chunk-size`	Tamanho dos trechos de texto.	`512`
`--chunk-overlap`	Sobreposicao entre trechos.	`64`
`--quarantine`	Processa arquivos em `articles/_quarantine/`.	desativado

Exemplos:

lutz vectorize
lutz vectorize --chunk-size 256 --chunk-overlap 32

`lutz unvectorize`

Apaga o banco vetorial, mas nao apaga seus PDFs.

lutz unvectorize

Use quando quiser reconstruir o indice do zero.

`lutz analysis --p PROMPT [opcoes]`

Analisa os artigos vetorizados usando um prompt em Markdown. Dois modos estao disponiveis.

Modo RAG (padrao)

Incorpora o prompt em um vetor, busca os trechos mais relevantes do corpus inteiro e faz uma unica chamada ao modelo. Util para sintese geral e busca semantica.

Modo por artigo (--per-article)

Faz uma chamada separada ao modelo para cada artigo no banco vetorial. Util para triagem sistematica, onde voce precisa de uma decisao de inclusao ou exclusao por artigo.

Opcao	Descricao	Padrao
`--p`	Caminho do prompt `.md`.	obrigatoria
`--top-k`	Trechos a recuperar no modo RAG. Use `'*'` para todos.	`10`
`--per-article`	Analisa cada artigo em uma chamada separada ao modelo.	desativado
`--workers`	Chamadas paralelas ao modelo no modo `--per-article`.	`1`
`--max-chunks-per-article`	Limite de trechos enviados por artigo no modo `--per-article`.	sem limite
`--output-name`	Nome base do arquivo de saida.	gerado automaticamente

Exemplos:

# Modo RAG padrao
lutz analysis --p prompts/systematic_review.md

# RAG recuperando mais trechos
lutz analysis --p prompts/methodology_analysis.md --top-k 20

# RAG com todos os trechos do corpus
lutz analysis --p prompts/systematic_review.md --top-k '*'

# Triagem por artigo, sequencial
lutz analysis --p prompts/screening.md --per-article

# Triagem por artigo com 4 chamadas paralelas
lutz analysis --p prompts/screening.md --per-article --workers 4

# Triagem por artigo limitando o contexto a 10 trechos por artigo
lutz analysis --p prompts/screening.md --per-article --workers 4 --max-chunks-per-article 10

# Saida com nome personalizado
lutz analysis --p prompts/systematic_review.md --output-name minha-analise-v1

Desempenho no modo --per-article

Com muitos artigos, o modo --per-article pode demorar porque cada chamada ao modelo espera a anterior terminar. Use --workers para paralelizar:

Artigos	`--workers 1`	`--workers 4`	`--workers 8`
52 artigos a ~50s cada	~43 min	~11 min	~6 min

O limite pratico depende do provedor: APIs remotas como OpenRouter tem limites de requisicoes por minuto; modelos autohospedados podem ter gargalos de CPU, GPU, memoria ou fila de requisicoes. Ajuste --workers conforme a capacidade do servico usado.

Use --max-chunks-per-article para reduzir o tamanho do contexto por chamada, o que diminui a latencia e o custo por artigo. Os trechos sao enviados na ordem do documento.

Nota sobre tamanho de contexto: o parametro --chunk-size do lutz vectorize e em palavras, nao em tokens do modelo. Um chunk de 512 palavras equivale a aproximadamente 680 tokens. Com 23 chunks por artigo (media de um corpus tipico), o contexto de entrada por chamada e de cerca de 15.000 a 16.000 tokens. Verifique se o modelo configurado suporta esse tamanho de janela.

`lutz citations --analysis FILE [opcoes]`

Extrai citacoes estruturadas de um relatorio produzido por lutz analysis --per-article.

Opcao	Descricao	Padrao
`--analysis`	Caminho do JSON de analise por artigo.	obrigatoria
`--workers`	Chamadas paralelas ao modelo.	`1`
`--only-relevant`	Inclui no relatorio apenas artigos relevantes.	desativado
`--output-name`	Nome base do arquivo de saida.	gerado automaticamente

Fluxo interno:

Le o JSON produzido por lutz analysis --per-article.
Classifica cada artigo como relevante, nao relevante ou desconhecido usando o texto da analise (sem custo de LLM).
Para cada artigo relevante, recupera os trechos originais do banco vetorial e chama o LLM para extrair as 3 a 5 passagens que melhor justificam a classificacao.
Salva um relatorio JSON em analysis/execution_reports/.

O nome do arquivo de saida segue o padrao <nome_da_analise>_citations_<timestamp>.json.

# Extracao basica
lutz citations --analysis analysis/execution_reports/screening_20260501.json

# Com paralelismo e apenas artigos relevantes
lutz citations --analysis analysis/execution_reports/screening_20260501.json \
  --workers 4 --only-relevant

# Com nome de saida personalizado
lutz citations --analysis analysis/execution_reports/screening_20260501.json \
  --output-name revisao_citacoes_v1

Prerequisito: o relatorio de entrada deve ter sido gerado com lutz analysis --per-article. O banco vetorial precisa estar disponivel (.lutz/vector_store/), pois as citacoes sao extraidas dos trechos originais dos artigos.

`lutz vector-store [--summarize] [--export [FILE]]`

Inspeciona o banco vetorial local.

Opcao	Descricao
`--summarize`	Exibe o resumo no terminal.
`--export`	Exporta o resumo como JSON (caminho gerado automaticamente em `.lutz/`).
`--export FILE`	Exporta para o caminho informado. Use `-` para imprimir no stdout.

As duas opcoes podem ser combinadas na mesma execucao.

# Exibir no terminal
lutz vector-store --summarize

# Exportar JSON com caminho automatico
lutz vector-store --export

# Exportar para um arquivo especifico
lutz vector-store --export summary.json

# Imprimir JSON no stdout
lutz vector-store --export -

# Exibir e exportar ao mesmo tempo
lutz vector-store --summarize --export summary.json

Como escrever prompts

Prompts sao arquivos Markdown dentro da pasta prompts/. Eles dizem ao modelo o que voce quer analisar.

Um bom prompt costuma ter:

# Titulo da analise

## Objetivo
Explique em poucas linhas o que voce quer descobrir.

## Perguntas
1. Qual e a pergunta principal?
2. Quais informacoes devem ser extraidas dos artigos?
3. Que criterios de inclusao ou exclusao devem ser considerados?

## Formato da resposta
Peça uma tabela, uma lista ou secoes com titulos claros.

## Tema da pesquisa
Descreva o tema ou a pergunta de pesquisa.

O lutz init ja cria alguns modelos prontos:

Arquivo	Uso sugerido
`prompts/systematic_review.md`	Revisao sistematica com tabela de evidencias.
`prompts/methodology_analysis.md`	Comparacao de metodos de pesquisa.
`prompts/evidence_quality.md`	Avaliacao de qualidade e vieses.
`prompts/thematic_synthesis.md`	Sintese tematica entre artigos.

Antes de rodar lutz analysis, abra o prompt escolhido e substitua os campos de exemplo pela sua pergunta de pesquisa.

Onde ficam os resultados

Depois de lutz analysis, os resultados aparecem em:

analysis/execution_reports/

O arquivo gerado e um .json. Ele inclui:

prompt usado na analise;
data e tempo de execucao;
modo de analise, como rag ou per_article;
modelo de embedding e modelo de linguagem usados;
quantidade de tokens;
artigos cobertos;
resposta produzida pelo modelo.

Exemplo de nome de arquivo:

systematic_review_20260501_153000.json

Modelo de seguranca

Antes de vetorizar, o Lutz pode verificar os PDFs para reduzir riscos comuns em arquivos maliciosos ou inadequados.

Verificacao	O que procura
Analise estrutural	JavaScript embutido, acoes automaticas e formularios XFA.
Prompt injection	Frases que tentam sobrescrever instrucoes do modelo.
Estrutura academica	Sinais basicos de artigo academico, como resumo, metodologia e referencias.
Anomalia no corpus	Quando ha 5 ou mais documentos, identifica possiveis outliers estatisticos.

Arquivos suspeitos podem ser movidos para:

articles/_quarantine/

Para processar arquivos em quarentena depois de revisa-los manualmente:

lutz vectorize --quarantine

Para pular a verificacao de seguranca:

lutz vectorize --skip-security

Use --skip-security apenas se voce confia na origem dos PDFs.

Arquitetura

lutz/
├── cli.py                    # entrada principal da CLI Click
├── commands/
│   ├── init.py               # lutz init
│   ├── load.py               # lutz load
│   ├── vectorize.py          # lutz vectorize / lutz unvectorize
│   ├── analysis.py           # lutz analysis
│   ├── citations.py          # lutz citations
│   └── vector_store.py       # lutz vector-store
├── core/
│   ├── security_checker.py   # verificacoes de seguranca em PDF
│   ├── pdf_processor.py      # extracao de texto e divisao em chunks
│   ├── vector_store.py       # wrapper do LanceDB
│   ├── embedding_client.py   # provedores de embeddings
│   └── llm_client.py         # provedores de LLM
└── utils/
    ├── pdf.py                # validacao basica de PDF
    ├── project.py            # deteccao do projeto e leitura de .env
    └── templates.py          # arquivos criados pelo lutz init

O banco vetorial usa LanceDB e fica em .lutz/vector_store/ dentro do projeto. Esse diretorio nao deve ser versionado no Git.

Fluxo completo de revisao sistematica

# 1. Criar projeto
lutz init minha-revisao && cd minha-revisao

# 2. Adicionar PDFs
lutz load --f ~/Downloads/artigos --so linux

# 3. Vetorizar (com verificacao de seguranca)
lutz vectorize

# 4. Triagem por artigo
lutz analysis --p prompts/screening.md --per-article --workers 4

# 5. Extrair citacoes dos artigos relevantes
lutz citations --analysis analysis/execution_reports/screening_<timestamp>.json \
  --workers 4 --only-relevant

# 6. Inspecionar o banco vetorial
lutz vector-store --summarize
lutz vector-store --export

Contribuindo

Contribuicoes sao bem-vindas. Para preparar o ambiente de desenvolvimento:

git clone https://github.com/jooguilhermesc/lutz.git
cd lutz
pip install -e ".[dev]"
pytest

Antes de propor mudancas grandes, abra uma issue para discutir a ideia.

Licenca

MIT

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.1.3

May 6, 2026

0.1.2

May 2, 2026

0.1.1

May 2, 2026

This version

0.1.0

May 2, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

lutz_research-0.1.0.tar.gz (226.4 kB view details)

Uploaded May 2, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

lutz_research-0.1.0-py3-none-any.whl (47.5 kB view details)

Uploaded May 2, 2026 Python 3

File details

Details for the file lutz_research-0.1.0.tar.gz.

File metadata

Download URL: lutz_research-0.1.0.tar.gz
Upload date: May 2, 2026
Size: 226.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for lutz_research-0.1.0.tar.gz
Algorithm	Hash digest
SHA256	`af8384836e10b130d259479902cb7b5c600a163c0fc40da1066242b08f9e16ad`
MD5	`56b6cef4bfc29188eea4af02bba3c63c`
BLAKE2b-256	`3a9d0471fe31868259534f475b61e6cf55fb8d965d253da695c4ab0b6c97b5d1`

See more details on using hashes here.

File details

Details for the file lutz_research-0.1.0-py3-none-any.whl.

File metadata

Download URL: lutz_research-0.1.0-py3-none-any.whl
Upload date: May 2, 2026
Size: 47.5 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for lutz_research-0.1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`d6cbbf3c487f3bebeb8314a90ed3095690d9107dfd0cb59a28560cc185b9fe91`
MD5	`2c47325f052aaf20e289f11bc59be9dc`
BLAKE2b-256	`19c7fa12680818e7bf8c28ca7f4d65c273e3e9f3f806ffc68f4c583de55bf466`

See more details on using hashes here.

lutz-research 0.1.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Lutz

Sumario

Para que serve

Como o Lutz funciona

Antes de comecar

Instalacao

Python local

Primeiro uso passo a passo

1. Crie uma pasta para sua revisao

2. Configure os modelos de IA

3. Coloque seus PDFs no projeto

4. Crie o indice vetorial dos artigos

5. Rode uma analise

6. Abra o resultado

Configuracao dos modelos

Opcao local/autohospedada: Docker Model Runner

Opcao autohospedada com Ollama ou llama.cpp

Opcao com OpenRouter ou API compativel com OpenAI

Opcao com Anthropic

Variaveis uteis

Comandos principais

lutz init [PROJECT_NAME]

lutz load --f FOLDER [--so OS] [--overwrite]

lutz vectorize [--skip-security] [--chunk-size N] [--chunk-overlap N] [--quarantine]

lutz unvectorize

lutz analysis --p PROMPT [opcoes]

lutz citations --analysis FILE [opcoes]

lutz vector-store [--summarize] [--export [FILE]]

Como escrever prompts

Onde ficam os resultados

Modelo de seguranca

Arquitetura

Fluxo completo de revisao sistematica

Contribuindo

Licenca

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

`lutz init [PROJECT_NAME]`

`lutz load --f FOLDER [--so OS] [--overwrite]`

`lutz vectorize [--skip-security] [--chunk-size N] [--chunk-overlap N] [--quarantine]`

`lutz unvectorize`

`lutz analysis --p PROMPT [opcoes]`

`lutz citations --analysis FILE [opcoes]`

`lutz vector-store [--summarize] [--export [FILE]]`