Promptfoo

Free

AI TestingDevToolsPenetration TestingOpen Source

Sobre

Promptfoo serve como uma solução para avaliar e testar a qualidade dos resultados gerados por Large Language Models (LLMs). Utilizando o Promptfoo, os usuários podem avaliar seus prompts, agentes e sistemas de geração aumentada de recuperação (RAG). Facilita a formação de equipes vermelhas, testes de penetração e avaliações de vulnerabilidade para LLMs. Os usuários também podem comparar o desempenho de vários modelos, como GPT, Claude, Gemini, Llama e outros. A ferramenta apresenta configurações declarativas simples e oferece suporte à integração com interfaces de linha de comando e pipelines de CI/CD.

Principais Funcionalidades

Amigável ao desenvolvedor: o promptfoo opera rapidamente e inclui funcionalidades fáceis de usar, como recargas ao vivo e cache.
Testado em batalha: Originalmente projetado para aplicativos LLM que atendem a mais de 10 milhões de usuários ativos em um ambiente de produção. Nossas ferramentas são versáteis e podem ser personalizadas para diversas configurações.
Casos de teste simples e declarativos: configure avaliações sem a necessidade de codificação ou de lidar com notebooks complexos.
Independente de linguagem: Utilize Python, Javascript ou qualquer outra linguagem de programação.
Compartilhe e colabore: recursos de compartilhamento integrados e um visualizador da Web para colaboração com membros da equipe.
Código aberto: as avaliações LLM são uma oferta padrão e devem ser fornecidas exclusivamente por iniciativas totalmente de código aberto, sem quaisquer condições.
Privado: Este aplicativo opera inteiramente em seu ambiente local. As avaliações acontecem no seu dispositivo e se comunicam diretamente com o LLM.

Ferramentas similares

Baixar CursorChat

Free

AI Testing

Exporta e analisa seus logs de bate-papo do Cursor AI.

IDE

Diretório de cursores

Free

AI Testing

Explore as recomendações de cursores ideais para sua linguagem de programação e estrutura específicas.

IDE

Mais curto

Free

AI Testing

Estrutura de teste abrangente com tecnologia de IA que aproveita a linguagem natural.

FrameworkJavaScriptOpen Source

talk2dom

Free

AI Testing

Identifique elementos da web por meio do processamento de linguagem natural. Alimentado por LLM. Compatível com Selênio.

SeleniumLLMMCP

Agente de automação de teste de UI com tecnologia de IA

Free

AI Testing

Integração de IA generativa, geração aumentada de recuperação (RAG) e visão computacional para automatizar testes de IU.

FrameworkSeleniumMCP

Dramaturgo MCP

Free

AI Testing

Automação de navegador com tecnologia de IA utilizando Playwright, que permite que grandes modelos de linguagem interajam com páginas da web por meio ...

FrameworkPlaywrightMCP