ebooktomd Skill
将 PDF、图片、MOBI、EPUB 转为 Markdown。仅使用百度 OCR。
输入格式
- - PDF:扫描版/图像型 PDF
- PNG/JPEG:单张图片
- MOBI/EPUB:需安装 Calibre,先转 PDF 再处理
图片 OCR 输出会自动添加 Markdown 分段:首行若为短标题则转为 ##,对话段落前插入空行。
输出格式
仅输出 Markdown(.md)。
参数
| Parameter | Type | Required | Default | Description |
|---|
| inputpath | string | yes | - | 文档路径(pdf/png/jpeg/mobi/epub)或 base64 图片 |
| outputpath |
string | no | - | 输出文件路径 |
| ocr_backend | string | no | "baidu" | 保留参数,仅支持百度 |
| inline_images | bool | no | true | 图片是否 base64 内联 |
快速开始
CODEBLOCK0
依赖
Python
CODEBLOCK1
系统
- - Calibre(mobi/epub): INLINECODE1
- 百度 OCR:设置
BAIDU_OCR_API_KEY、 INLINECODE3
使用示例
百度 OCR(默认)
CODEBLOCK2
MOBI/EPUB(需 Calibre)
CODEBLOCK3
返回格式
成功:返回字符串,含预览;若指定 output_path 则写入文件。
失败:返回 "错误: ..."
相关
- - pdftomarkdown:原生文本 PDF 转换(docling)
ebooktomd 技能
将 PDF、图片、MOBI、EPUB 转为 Markdown。仅使用百度 OCR。
输入格式
- - PDF:扫描版/图像型 PDF
- PNG/JPEG:单张图片
- MOBI/EPUB:需安装 Calibre,先转 PDF 再处理
图片 OCR 输出会自动添加 Markdown 分段:首行若为短标题则转为 ##,对话段落前插入空行。
输出格式
仅输出 Markdown(.md)。
参数
| 参数 | 类型 | 必填 | 默认值 | 描述 |
|---|
| inputpath | string | 是 | - | 文档路径(pdf/png/jpeg/mobi/epub)或 base64 图片 |
| outputpath |
string | 否 | - | 输出文件路径 |
| ocr_backend | string | 否 | baidu | 保留参数,仅支持百度 |
| inline_images | bool | 否 | true | 图片是否 base64 内联 |
快速开始
bash
PDF 转 Markdown(百度 OCR)
python scripts/ebook
tomd.py --input_path=./scanned.pdf
图片转 Markdown
python scripts/ebook
tomd.py --input_path=./screenshot.png
指定输出路径
python scripts/ebook
tomd.py --input
path=./report.pdf --outputpath=./report.md
依赖
Python
bash
pip install requests
系统
- - Calibre(mobi/epub):brew install calibre
- 百度 OCR:设置 BAIDUOCRAPIKEY、BAIDUOCRSECRETKEY
使用示例
百度 OCR(默认)
python
from skills.ebooktomd import main
main(inputpath=./report.pdf, outputpath=./report.md)
main(input_path=./image.png) # 图片识别
MOBI/EPUB(需 Calibre)
python
main(inputpath=./book.epub, outputpath=./book.md)
main(inputpath=./book.mobi, outputpath=./book.md)
返回格式
成功:返回字符串,含预览;若指定 output_path 则写入文件。
失败:返回 错误: ...
相关
- - pdftomarkdown:原生文本 PDF 转换(docling)