Extract content from HTML pages and files using MinerU. Converts HTML to clean, structured Markdown preserving headings, lists, tables, and text hierarchy. Features: HTML content extraction to Markdown. Preserves document structure and formatting. Handles complex HTML layouts. Token-based extraction for full feature set. Use when you need to: extract content from HTML, convert HTML to Markdown, get text from a web page, parse HTML file content. Use when asked: 'how do I extract content from HTML
使用 MinerU 从本地 HTML 文件中提取文本和内容并转换为 Markdown 格式。如需处理实时网页 URL,请使用 mineru-open-api crawl。
bash
npm install -g mineru-open-api
bash
需要令牌:
bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置
在以下地址创建令牌:https://mineru.net/apiManage/token
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 html-extract-1775983261 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 html-extract-1775983261 技能
skillhub install html-extract-1775983261
文件大小: 1.87 KB | 发布时间: 2026-4-13 10:35