Novel Scraper SPA
功能
支持抓取 JavaScript 加载的小说网站(SPA 架构),使用 Playwright 浏览器渲染。
使用场景
- - 抓取笔趣阁等 SPA 架构小说网站
- 需要 JavaScript 渲染才能获取内容的网站
- 普通静态网站(自动使用 curl,更快速)
命令
CODEBLOCK0
参数
- -
--url: 目标 URL - INLINECODE1 : 书名(用于输出文件名)
- INLINECODE2 : 章节号
- INLINECODE3 : 强制使用浏览器渲染
- INLINECODE4 : 详细日志
输出
保存到 ~/.openclaw/workspace/novels/ 目录
2. Task-Based (best for tool collections)
- - Works well when the skill offers different operations/capabilities
- Example: PDF skill with "Quick Start" → "Merge PDFs" → "Split PDFs" → "Extract Text"
- Structure: ## Overview → ## Quick Start → ## Task Category 1 → ## Task Category 2...
3. Reference/Guidelines (best for standards or specifications)
- - Works well for brand guidelines, coding standards, or requirements
- Example: Brand styling with "Brand Guidelines" → "Colors" → "Typography" → "Features"
- Structure: ## Overview → ## Guidelines → ## Specifications → ## Usage...
4. Capabilities-Based (best for integrated systems)
- - Works well when the skill provides multiple interrelated features
- Example: Product Management with "Core Capabilities" → numbered capability list
- Structure: ## Overview → ## Core Capabilities → ### 1. Feature → ### 2. Feature...
Patterns can be mixed and matched as needed. Most skills combine patterns (e.g., start with task-based, add workflow for complex operations).
Delete this entire "Structuring This Skill" section when done - it's just guidance.]
[TODO: Replace with the first main section based on chosen structure]
[TODO: Add content here. See examples in existing skills:
- - Code samples for technical skills
- Decision trees for complex workflows
- Concrete examples with realistic user requests
- References to scripts/templates/references as needed]
Resources
This skill includes example resource directories that demonstrate how to organize different types of bundled resources:
scripts/
Executable code (Python/Bash/etc.) that can be run directly to perform specific operations.
Examples from other skills:
- - PDF skill:
fill_fillable_fields.py, extract_form_field_info.py - utilities for PDF manipulation - DOCX skill:
document.py, utilities.py - Python modules for document processing
Appropriate for: Python scripts, shell scripts, or any executable code that performs automation, data processing, or specific operations.
Note: Scripts may be executed without loading into context, but can still be read by Claude for patching or environment adjustments.
references/
Documentation and reference material intended to be loaded into context to inform Claude's process and thinking.
Examples from other skills:
- - Product management:
communication.md, context_building.md - detailed workflow guides - BigQuery: API reference documentation and query examples
- Finance: Schema documentation, company policies
Appropriate for: In-depth documentation, API references, database schemas, comprehensive guides, or any detailed information that Claude should reference while working.
assets/
Files not intended to be loaded into context, but rather used within the output Claude produces.
Examples from other skills:
- - Brand styling: PowerPoint template files (.pptx), logo files
- Frontend builder: HTML/React boilerplate project directories
- Typography: Font files (.ttf, .woff2)
Appropriate for: Templates, boilerplate code, document templates, images, icons, fonts, or any files meant to be copied or used in the final output.
Any unneeded directories can be deleted. Not every skill requires all three types of resources.
Novel Scraper SPA
功能
支持抓取 JavaScript 加载的小说网站(SPA 架构),使用 Playwright 浏览器渲染。
使用场景
- - 抓取笔趣阁等 SPA 架构小说网站
- 需要 JavaScript 渲染才能获取内容的网站
- 普通静态网站(自动使用 curl,更快速)
命令
bash
python3 scripts/scraper.py --url --book <书名> --chapter <章节号>
参数
- - --url: 目标 URL
- --book: 书名(用于输出文件名)
- --chapter: 章节号
- --force-spa: 强制使用浏览器渲染
- -v: 详细日志
输出
保存到 ~/.openclaw/workspace/novels/ 目录
2. 基于任务(最适合工具集合)
- - 当技能提供不同操作/能力时效果最佳
- 示例:PDF 技能包含快速入门→合并 PDF→拆分 PDF→提取文本
- 结构:## 概述 → ## 快速入门 → ## 任务类别 1 → ## 任务类别 2...
3. 参考/指南(最适合标准或规范)
- - 适用于品牌指南、编码标准或需求文档
- 示例:品牌样式包含品牌指南→颜色→排版→功能
- 结构:## 概述 → ## 指南 → ## 规范 → ## 使用...
4. 基于能力(最适合集成系统)
- - 当技能提供多个相互关联的功能时效果最佳
- 示例:产品管理包含核心能力→ 编号能力列表
- 结构:## 概述 → ## 核心能力 → ### 1. 功能 → ### 2. 功能...
模式可以根据需要混合搭配。大多数技能会组合多种模式(例如,从基于任务开始,为复杂操作添加工作流)。
完成后删除此结构化此技能部分——这仅作为指导。
[TODO:根据所选结构替换为第一个主要部分]
[TODO:在此添加内容。请参考现有技能中的示例:
- - 技术技能的代码示例
- 复杂工作流的决策树
- 包含真实用户请求的具体示例
- 根据需要引用脚本/模板/参考]
资源
本技能包含示例资源目录,演示如何组织不同类型的捆绑资源:
scripts/
可直接运行以执行特定操作的可执行代码(Python/Bash 等)。
其他技能中的示例:
- - PDF 技能:fillfillablefields.py、extractformfield_info.py——PDF 操作工具
- DOCX 技能:document.py、utilities.py——文档处理的 Python 模块
适用于: Python 脚本、Shell 脚本或任何执行自动化、数据处理或特定操作的可执行代码。
注意: 脚本可能在不加载到上下文的情况下执行,但 Claude 仍可读取以进行修补或环境调整。
references/
旨在加载到上下文中的文档和参考资料,用于指导 Claude 的流程和思考。
其他技能中的示例:
- - 产品管理:communication.md、context_building.md——详细工作流指南
- BigQuery:API 参考文档和查询示例
- 财务:模式文档、公司政策
适用于: 深入文档、API 参考、数据库模式、综合指南或任何 Claude 在工作时应参考的详细信息。
assets/
不打算加载到上下文中,而是在 Claude 生成的输出中使用的文件。
其他技能中的示例:
- - 品牌样式:PowerPoint 模板文件(.pptx)、Logo 文件
- 前端构建器:HTML/React 样板项目目录
- 排版:字体文件(.ttf、.woff2)
适用于: 模板、样板代码、文档模板、图片、图标、字体或任何旨在复制或用于最终输出的文件。
任何不需要的目录都可以删除。 并非每个技能都需要所有三种类型的资源。