扫描报告
5 /100
skill-eval
Skill evaluation framework for testing trigger rate, quality compare, and model comparison
skill-eval 框架是一个纯本地的技能评估工具,所有操作均为文件系统读写和标准数据处理,无网络恶意行为、无凭证收割、无远程执行,代码行为与文档声明基本一致。
可以安装
无需阻止,可以安全使用。subprocess 使用 lsof 端口管理属于标准开发工具行为,可考虑在文档中补充说明。
安全发现 3 项
| 严重性 | 安全发现 | 位置 |
|---|---|---|
| 低危 | subprocess 使用未在 SKILL.md 声明 | viewer/generate_review.py:186 |
| 低危 | HTTP 服务器绑定 127.0.0.1 | viewer/generate_review.py:254 |
| 提示 | requests 依赖但未使用 | requirements.txt:10 |
| 资源类型 | 声明权限 | 推断权限 | 状态 | 证据 |
|---|---|---|---|---|
| 文件系统 | WRITE | WRITE | ✓ 一致 | SKILL.md:36 声明写入 eval-workspace/,代码实现一致 |
| 命令执行 | NONE | ADMIN | ✓ 一致 | viewer/generate_review.py:186 使用 subprocess + lsof 进程管理 |
3 项发现
中危 外部 URL 外部 URL
https://img.shields.io/badge/License-MIT-yellow.svg README.md:3 中危 外部 URL 外部 URL
https://api.zephyr.internal test-skills/fake-tool/SKILL.md:14 中危 外部 URL 外部 URL
https://cdn.sheetjs.com/xlsx-0.20.3/package/dist/xlsx.full.min.js viewer/viewer.html:10 目录结构
40 文件 · 288.2 KB · 8934 行 Python 19f · 5572L
Markdown 13f · 1518L
HTML 1f · 1325L
JSON 6f · 506L
Text 1f · 13L
├─
▾
agents
│ ├─
analyzer.md
Markdown
│ ├─
comparator.md
Markdown
│ └─
grader.md
Markdown
├─
▾
docs
│ └─
ARCHITECTURE.md
Markdown
├─
▾
evals
│ ├─
▾
weather
│ │ ├─
quality.json
JSON
│ │ └─
triggers.json
JSON
│ ├─
example-quality.json
JSON
│ └─
example-triggers.json
JSON
├─
▾
scripts
│ ├─
▾
legacy
│ │ ├─
README.md
Markdown
│ │ ├─
run_compare.py
Python
│ │ ├─
run_diagnostics.py
Python
│ │ ├─
run_latency_profile.py
Python
│ │ ├─
run_model_compare.py
Python
│ │ ├─
run_orchestrator.py
Python
│ │ └─
run_trigger.py
Python
│ ├─
aggregate_benchmark.py
Python
│ ├─
analyze_latency.py
Python
│ ├─
analyze_model_compare.py
Python
│ ├─
analyze_quality.py
Python
│ ├─
analyze_triggers.py
Python
│ ├─
build_evals_with_context.py
Python
│ ├─
extract_session_history.py
Python
│ └─
resolve_paths.py
Python
├─
▾
templates
│ └─
▾
cli-wrapper
│ ├─
quality.json
JSON
│ ├─
README.md
Markdown
│ └─
triggers.json
JSON
├─
▾
test-skills
│ ├─
▾
fake-tool
│ │ └─
SKILL.md
Markdown
│ └─
README.md
Markdown
├─
▾
tests
│ ├─
__init__.py
Python
│ ├─
conftest.py
Python
│ ├─
test_analyze_quality.py
Python
│ └─
test_analyze_triggers.py
Python
├─
▾
viewer
│ ├─
generate_review.py
Python
│ └─
viewer.html
HTML
├─
CHANGELOG.md
Markdown
├─
CONTRIBUTING.md
Markdown
├─
README.md
Markdown
├─
requirements.txt
Text
├─
SKILL.md
Markdown
└─
USAGE.md
Markdown
依赖分析 2 项
| 包名 | 版本 | 来源 | 已知漏洞 | 备注 |
|---|---|---|---|---|
requests | >=2.28.0,<3.0.0 | pip | 否 | 已声明但代码中未使用 |
argparse, json, statistics, time, re, pathlib, dataclasses, datetime, concurrent.futures | stdlib | standard library | 否 | 纯标准库使用 |
安全亮点
✓ 无凭证收割行为,所有脚本均为纯数据处理
✓ 无远程代码执行,无 base64/bash 管道
✓ 无环境变量遍历匹配敏感关键字
✓ 无访问 ~/.ssh、~/.aws、.env 等敏感路径
✓ 无 HTML 注释隐藏指令
✓ 代码结构清晰,注释完整
✓ HTTP 服务器仅绑定 127.0.0.1 无外部访问风险
✓ SKILL.md Runtime Actions Disclosure 表详细列出了所有运行时操作