score / README.md
zhl
agent.wang first commit.
99f5a39

A newer version of the Gradio SDK is available: 5.46.0

Upgrade
metadata
title: agent.wang score
emoji: 🌍
colorFrom: green
colorTo: indigo
sdk: gradio
sdk_version: 5.44.1
app_file: app.py
pinned: false
license: gpl-3.0

王艾卷智能体评分系统 agent.wang

项目介绍

agent.wang 王艾卷智能体评分系统 是一款基于百度千帆 ERNIE-4.5-Turbo-VL 多模态大模型开发的智能体评估工具。该系统能够对智能体网页截图进行自动化分析,从多个维度进行评分并拆解智能体能力,为开发者和产品经理提供客观、全面的智能体评估报告。

功能特点

  • 多维度评分:从整体评价、设计美感、易用性、功能完整性和响应式设计五个维度进行1-10分制评分
  • 能力拆解:自动识别智能体的核心功能、优势、劣势、潜在用途和改进方向
  • 结构化输出:提供JSON格式原始数据和可视化解析结果,方便查看和进一步处理
  • 结果保存:自动将分析结果保存为JSON文件,便于归档和对比分析
  • 错误处理:完善的错误提示和处理机制,帮助用户快速定位和解决问题

环境要求

  • Python 3.8+
  • openai 库

安装步骤

  1. 克隆或下载项目代码到本地
  2. 安装依赖库:
    pip install openai
    

百度API密钥获取

  1. 访问百度智能云API密钥管理页面:https://console.bce.baidu.com/iam/#/iam/apikey/list
  2. 登录百度账号(未注册用户需先完成注册和实名认证)
  3. 点击"创建Access Key"生成API密钥
  4. 确保已开通千帆大模型服务(新用户可领取免费调用额度)

使用指南

  1. 准备一张智能体网页的截图,保存为PNG或JPG格式
  2. 打开ernie_analysis_with_parsing.py文件,修改配置参数:
    API_KEY = "您的百度智能云Access Key"  # 替换为实际API密钥
    IMAGE_PATH = "demo.png"                # 替换为您的截图路径
    OUTPUT_FILE = "analysis_result.json"   # 结果保存文件名
    
  3. 运行脚本:
    python ernie_analysis_with_parsing.py
    
  4. 查看结果:
    • 控制台将显示原始JSON数据和解析后的结构化结果
    • 分析结果同时会保存到指定的JSON文件中

输出结果说明

控制台输出

  1. 原始JSON结果:完整展示模型返回的结构化数据,包含页面评分和智能体能力拆解的全部信息
  2. 解析后的结果:格式化展示分析结果,包括:
    • 页面评分:各维度得分及评论
    • 智能体能力拆解:核心功能、优势、劣势、潜在用途、改进方向和详细分析

JSON文件输出

分析结果会保存到指定的JSON文件中,可用于:

  • 结果归档和版本对比
  • 导入其他工具进行进一步分析
  • 集成到报告生成系统

常见问题

API密钥相关问题

  • Q: 提示"API密钥验证失败"怎么办? A: 检查API_KEY是否正确填写,确保没有多余空格;确认百度智能云账号已完成实名认证并开通千帆大模型服务;检查账号是否有可用的调用额度。

图像相关问题

  • Q: 提示"未找到图像文件"如何解决? A: 检查IMAGE_PATH是否正确,确保路径中包含正确的文件名和扩展名;如果使用相对路径,确认图像文件与脚本在同一目录下。

结果解析问题

  • Q: 模型返回结果格式异常怎么办? A: 系统已内置格式清理功能,会自动处理常见的格式问题。如果仍解析失败,可尝试重新运行脚本。

自定义扩展

调整评分维度

如需增加或修改评分维度,可修改脚本中messages里的文本内容,例如: "text": "请分析这张智能体网页的截图,并完成以下任务:\n\

  1. 页面评分(每项1-10分,并给出简短评论):\n\
    • 整体评价(overall)\n\
    • 设计美感(design)\n\
    • 易用性(usability)\n\
    • 功能完整性(functionality)\n\
    • 响应式设计(responsiveness)\n\
    • 安全性(security)\n # 新增维度
      ..."

修改输出文件路径

如需将结果保存到指定路径,可修改OUTPUT_FILE参数: OUTPUT_FILE = "D:/reports/agent_analysis_202409.json" # 绝对路径

注意事项

  • 使用前请确保已阅读并遵守百度智能云的服务协议
  • 合理使用API调用额度,避免不必要的频繁调用
  • 对于敏感页面截图,请确保已获得必要的授权

联系方式

如有任何问题或建议,请联系项目维护团队。

url: https://agent.wang

exmail: zhl@agent.wang