Convert HTML to plain readable text using MinerU. Strips HTML markup and extracts clean text content from web pages and HTML files. Features: HTML to text conversion. Removes all markup while preserving readable structure. Outputs Markdown as the closest plain-text format. JSON output mode for pure text fields. Works with local files and URLs. Use when you need to: convert HTML to plain text, strip markup from a web page, extract readable text from HTML, get text content from an HTML file. Use w
使用 MinerU 从 HTML 文件或网页中提取纯文本可读内容。MinerU 输出的 Markdown 格式是最接近纯文本的格式。
bash
npm install -g mineru-open-api
bash
需要令牌:
bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置
在以下地址创建令牌:https://mineru.net/apiManage/token
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 html-to-text-1775899862 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 html-to-text-1775899862 技能
skillhub install html-to-text-1775899862
文件大小: 1.9 KB | 发布时间: 2026-4-12 10:13