A newer version of the Gradio SDK is available:
5.46.0
metadata
title: agent.wang score
emoji: 🌍
colorFrom: green
colorTo: indigo
sdk: gradio
sdk_version: 5.44.1
app_file: app.py
pinned: false
license: gpl-3.0
王艾卷智能体评分系统 agent.wang
项目介绍
agent.wang 王艾卷智能体评分系统
是一款基于百度千帆 ERNIE-4.5-Turbo-VL 多模态大模型开发的智能体评估工具。该系统能够对智能体网页截图进行自动化分析,从多个维度进行评分并拆解智能体能力,为开发者和产品经理提供客观、全面的智能体评估报告。
功能特点
- 多维度评分:从整体评价、设计美感、易用性、功能完整性和响应式设计五个维度进行1-10分制评分
- 能力拆解:自动识别智能体的核心功能、优势、劣势、潜在用途和改进方向
- 结构化输出:提供JSON格式原始数据和可视化解析结果,方便查看和进一步处理
- 结果保存:自动将分析结果保存为JSON文件,便于归档和对比分析
- 错误处理:完善的错误提示和处理机制,帮助用户快速定位和解决问题
环境要求
- Python 3.8+
- openai 库
安装步骤
- 克隆或下载项目代码到本地
- 安装依赖库:
pip install openai
百度API密钥获取
- 访问百度智能云API密钥管理页面:https://console.bce.baidu.com/iam/#/iam/apikey/list
- 登录百度账号(未注册用户需先完成注册和实名认证)
- 点击"创建Access Key"生成API密钥
- 确保已开通千帆大模型服务(新用户可领取免费调用额度)
使用指南
- 准备一张智能体网页的截图,保存为PNG或JPG格式
- 打开
ernie_analysis_with_parsing.py
文件,修改配置参数:API_KEY = "您的百度智能云Access Key" # 替换为实际API密钥 IMAGE_PATH = "demo.png" # 替换为您的截图路径 OUTPUT_FILE = "analysis_result.json" # 结果保存文件名
- 运行脚本:
python ernie_analysis_with_parsing.py
- 查看结果:
- 控制台将显示原始JSON数据和解析后的结构化结果
- 分析结果同时会保存到指定的JSON文件中
输出结果说明
控制台输出
- 原始JSON结果:完整展示模型返回的结构化数据,包含页面评分和智能体能力拆解的全部信息
- 解析后的结果:格式化展示分析结果,包括:
- 页面评分:各维度得分及评论
- 智能体能力拆解:核心功能、优势、劣势、潜在用途、改进方向和详细分析
JSON文件输出
分析结果会保存到指定的JSON文件中,可用于:
- 结果归档和版本对比
- 导入其他工具进行进一步分析
- 集成到报告生成系统
常见问题
API密钥相关问题
- Q: 提示"API密钥验证失败"怎么办? A: 检查API_KEY是否正确填写,确保没有多余空格;确认百度智能云账号已完成实名认证并开通千帆大模型服务;检查账号是否有可用的调用额度。
图像相关问题
- Q: 提示"未找到图像文件"如何解决? A: 检查IMAGE_PATH是否正确,确保路径中包含正确的文件名和扩展名;如果使用相对路径,确认图像文件与脚本在同一目录下。
结果解析问题
- Q: 模型返回结果格式异常怎么办? A: 系统已内置格式清理功能,会自动处理常见的格式问题。如果仍解析失败,可尝试重新运行脚本。
自定义扩展
调整评分维度
如需增加或修改评分维度,可修改脚本中messages里的文本内容,例如: "text": "请分析这张智能体网页的截图,并完成以下任务:\n\
- 页面评分(每项1-10分,并给出简短评论):\n\
- 整体评价(overall)\n\
- 设计美感(design)\n\
- 易用性(usability)\n\
- 功能完整性(functionality)\n\
- 响应式设计(responsiveness)\n\
- 安全性(security)\n # 新增维度
..."
修改输出文件路径
如需将结果保存到指定路径,可修改OUTPUT_FILE参数: OUTPUT_FILE = "D:/reports/agent_analysis_202409.json" # 绝对路径
注意事项
- 使用前请确保已阅读并遵守百度智能云的服务协议
- 合理使用API调用额度,避免不必要的频繁调用
- 对于敏感页面截图,请确保已获得必要的授权