扫描报告
5 /100
llm-chat-scraper
Scrape AI chat conversations from ChatGPT, Gemini, Perplexity, Copilot, Google AI Mode, and Grok via Scrapeless API
LLM Chat Scraper 通过 Scrapeless API 爬取 AI 对话回复,代码干净,仅有合法的网络请求和 API Token 读取,无 shell 执行、无凭证收割、无数据外泄。
可以安装
可直接使用。注意事项:X_API_TOKEN 需自行保障安全,requests 和 python-dotenv 建议锁定版本。
安全发现 1 项
| 严重性 | 安全发现 | 位置 |
|---|---|---|
| 低危 | 依赖库版本未锁定上限 供应链 | requirements.txt:1 |
| 资源类型 | 声明权限 | 推断权限 | 状态 | 证据 |
|---|---|---|---|---|
| 网络访问 | READ | READ | ✓ 一致 | scripts/llm_chat_scraper.py:56-57 仅向 api.scrapeless.com 发送请求 |
| 环境变量 | READ | READ | ✓ 一致 | scripts/llm_chat_scraper.py:40 读取 X_API_TOKEN |
| 文件系统 | NONE | NONE | — | 代码无任何文件读写操作,仅 load_dotenv() 读取 .env |
| 命令执行 | NONE | NONE | — | 无 subprocess/os.system/eval 等任何 shell 执行调用 |
| 技能调用 | NONE | NONE | — | 无嵌套 skill 调用 |
17 项发现
中危 外部 URL 外部 URL
https://docs.scrapeless.com/en/llm-chat-scraper/scrapers/chatgpt/ README.md:2 中危 外部 URL 外部 URL
https://www.youtube.com/@Scrapeless README.md:10 中危 外部 URL 外部 URL
https://img.shields.io/badge/Follow%20on%20YouTuBe-FF0033?style=for-the-badge&logo=youtube&logoColor=white README.md:11 中危 外部 URL 外部 URL
https://discord.com/invite/xBcTfGPjCQ README.md:13 中危 外部 URL 外部 URL
https://img.shields.io/badge/Join%20our%20Discord-5865F2?style=for-the-badge&logo=discord&logoColor=white README.md:14 中危 外部 URL 外部 URL
https://x.com/Scrapelessteam README.md:16 中危 外部 URL 外部 URL
https://img.shields.io/badge/Follow%20us%20on%20X-000000?style=for-the-badge&logo=x&logoColor=white README.md:17 中危 外部 URL 外部 URL
https://www.reddit.com/r/Scrapeless README.md:19 中危 外部 URL 外部 URL
https://img.shields.io/badge/Join%20us%20on%20Reddit-FF4500?style=for-the-badge&logo=reddit&logoColor=white README.md:20 中危 外部 URL 外部 URL
https://app.scrapeless.com/passport/register?utm_source=official&utm_term=githubopen README.md:22 中危 外部 URL 外部 URL
https://img.shields.io/badge/Official%20Website-12A594?style=for-the-badge&logo=google-chrome&logoColor=white README.md:23 中危 外部 URL 外部 URL
https://docs.scrapeless.com/en/llm-chat-scraper/quickstart/introduction/ README.md:36 中危 外部 URL 外部 URL
https://www.scrapeless.com/ README.md:53 中危 外部 URL 外部 URL
https://www.scrapeless.com README.md:104 中危 外部 URL 外部 URL
https://docs.scrapeless.com/en/universal-scraping-api/ README.md:186 中危 外部 URL 外部 URL
https://api.scrapeless.com scripts/llm_chat_scraper.py:57 提示 邮箱 邮箱地址
[email protected] README.md:190 目录结构
4 文件 · 29.4 KB · 813 行 Python 1f · 414L
Markdown 2f · 397L
Text 1f · 2L
├─
▾
scripts
│ └─
llm_chat_scraper.py
Python
├─
README.md
Markdown
├─
requirements.txt
Text
└─
SKILL.md
Markdown
依赖分析 2 项
| 包名 | 版本 | 来源 | 已知漏洞 | 备注 |
|---|---|---|---|---|
requests | >=2.31.0 | pip | 否 | 无版本上限锁定,存在轻微供应链风险 |
python-dotenv | >=1.0.0 | pip | 否 | 无版本上限锁定 |
安全亮点
✓ 无 shell/代码执行调用,无 subprocess、os.system、eval 等危险操作
✓ 无凭证收割行为,X_API_TOKEN 仅用于调用 Scrapeless API,不外传
✓ 无数据外泄,HTTP 请求仅指向 api.scrapeless.com,无可疑 IP 或 C2 通信
✓ 无代码混淆,未使用 base64、eval、exec 等动态执行手段
✓ 文档与代码行为一致,SKILL.md 描述的所有功能均有对应实现
✓ 网络请求有超时保护(timeout=30)和合理的错误处理
✓ API 响应通过 JSON 返回,无将数据写入本地文件的行为