提示富

Free

AI TestingDevToolsPenetration TestingOpen Source

提示富

关于

Promptfoo 用作评估和测试大型语言模型 (LLM) 生成的输出质量的解决方案。利用 Promptfoo，用户可以评估他们的提示、代理和检索增强生成 (RAG) 系统。它有助于法学硕士的红队、渗透测试和漏洞评估。用户还可以比较各种模型的性能，例如 GPT、Claude、Gemini、Llama 等。该工具具有简单的声明性配置，并支持与命令行界面和 CI/CD 管道的集成。

主要功能

开发人员友好：promptfoo 运行速度快，并包含用户友好的功能，例如实时重新加载和缓存。
经过实战检验：最初是为 LLM 应用程序设计的，可满足生产环境中超过 1000 万活跃用户的需求。我们的工具用途广泛，可以针对各种配置进行定制。
简单的声明性测试用例：无需编码或处理复杂的笔记本即可设置评估。
与语言无关：使用 Python、Javascript 或任何其他编程语言。
共享和协作：集成的共享功能和 Web 查看器，用于与团队成员协作。
开源：LLM 评估是一项标准服务，应仅由完全开源计划提供，无任何条件。
私有：此应用程序完全在您的本地环境中运行。评估在您的设备上进行，并直接与法学硕士沟通。

类似工具

CursorChat 下载器

CursorChat 下载器

导出并分析您的 Cursor AI 聊天日志。

光标目录

光标目录

探索适合您的特定编程语言和框架的理想光标建议。

最短

利用自然语言的人工智能驱动的全方位测试框架。

FrameworkJavaScriptOpen Source

谈话2dom

谈话2dom

通过自然语言处理识别网络元素。由法学硕士推动。与硒兼容。

AI 支持的 UI 测试自动化代理

AI 支持的 UI 测试自动化代理

集成生成式 AI、检索增强生成 (RAG) 和计算机视觉以自动化 UI 测试。

FrameworkSeleniumMCP

剧作家MCP

剧作家MCP

利用 Playwright 的人工智能驱动的浏览器自动化，允许大型语言模型通过有组织的可访问性快照与网页交互，从而无需屏幕截图。

FrameworkPlaywrightMCP

微代理

微代理

创建单元测试并优化代码，直到测试成功。

FrameworkJavaScriptOpen Source

赫拉克勒斯

赫拉克勒斯

开源人工智能测试代理

FrameworkOpen Source