Extract text and layout from images and PDFs using LLMWhisperer API. Good for handwriting and complex forms.
使用LLMWhisperer API从图像和PDF中提取文本——非常适合手写内容和复杂表单。
需要在~/.clawdbot/.env中设置LLMWHISPERERAPIKEY:
bash
echo LLMWHISPERERAPIKEY=yourkeyhere >> ~/.clawdbot/.env
bash
llmwhisperer <文件>
可执行脚本位于scripts/llmwhisperer。
bash
#!/bin/bash
if [ -z $LLMWHISPERERAPIKEY ]; then
if [ -f ~/.clawdbot/.env ]; then
# shellcheck disable=SC2046
export $(grep -v ^# ~/.clawdbot/.env | grep LLMWHISPERERAPIKEY | xargs)
fi
fi
if [ -z $LLMWHISPERERAPIKEY ]; then
echo 错误:在环境变量或~/.clawdbot/.env中未找到LLMWHISPERERAPIKEY
exit 1
fi
FILE=$1
if [ -z $FILE ]; then
echo 用法:$0 <文件>
exit 1
fi
curl -s -X POST https://llmwhisperer-api.us-central.unstract.com/api/v2/whisper?mode=highquality&outputmode=layout_preserving \
-H Content-Type: application/octet-stream \
-H unstract-key: $LLMWHISPERERAPIKEY \
--data-binary @$FILE
将文本输出到终端:
bash
llmwhisperer flyer.jpg
将输出保存到文本文件:
bash
llmwhisperer invoice.pdf > invoice.txt
处理手写笔记:
bash
llmwhisperer notes.jpg
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 llmwhisperer-1776390913 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 llmwhisperer-1776390913 技能
skillhub install llmwhisperer-1776390913
文件大小: 1.41 KB | 发布时间: 2026-4-17 15:25