【教程】Claude API实战：手把手教你用Python构建智能文档分析助手 - 闲社

export ANTHROPIC_API_KEY="your-api-key-here"

复制代码

pip install anthropic python-dotenv

复制代码

import os
from anthropic import Anthropic
from dotenv import load_dotenv
# 加载环境变量
load_dotenv()
class DocumentAnalyzer:
def __init__(self):
self.client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))
self.model = "claude-sonnet-4-20250514"
def analyze(self, document_text, analysis_type="summary"):
"""
分析文档内容
analysis_type: summary, keywords, sentiment, action_items
"""
prompts = {
"summary": "请用中文总结以下文档的核心内容，控制在200字以内：",
"keywords": "请提取以下文档的5-10个关键词，用逗号分隔：",
"sentiment": "请分析以下文档的情感倾向（正面/负面/中性），并说明理由：",
"action_items": "请从以下文档中提取待办事项，按优先级排序："
}
prompt = prompts.get(analysis_type, prompts["summary"])
try:
response = self.client.messages.create(
model=self.model,
max_tokens=1000,
messages=[
{
"role": "user",
"content": f"{prompt}\n\n{document_text}"
}
]
)
return response.content[0].text
except Exception as e:
return f"分析出错: {str(e)}"
def batch_analyze(self, file_path):
"""批量分析文件"""
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
results = {}
for analysis_type in ["summary", "keywords", "sentiment", "action_items"]:
print(f"正在执行 {analysis_type} 分析...")
results[analysis_type] = self.analyze(content, analysis_type)
return results
# 使用示例
if __name__ == "__main__":
analyzer = DocumentAnalyzer()
# 分析单个文档
with open("sample_doc.txt", "r", encoding="utf-8") as f:
doc = f.read()
summary = analyzer.analyze(doc, "summary")
print("\n=== 文档总结 ===")
print(summary)

复制代码

2024年Q3产品会议纪要
参会人员：产品经理张三、开发负责人李四、设计师王五
讨论内容：
1. 用户反馈新功能使用率低，需要优化交互设计
2. 移动端适配问题严重，优先级提升为P0
3. 竞品分析显示我们的AI功能落后，需要加速研发
4. 预算紧张，建议砍掉低优先级项目
待办事项：
- 设计师王五：一周内完成交互优化方案
- 开发李四：两周内修复移动端适配问题
- 产品经理：重新评估项目优先级，周五前提交报告

复制代码

python document_analyzer.py

复制代码

=== 文档总结 ===
这是一份2024年Q3产品会议纪要，主要讨论了四个问题：新功能使用率低需优化交互、移动端适配问题需优先处理、AI功能相对竞品落后需加速研发、以及预算紧张需砍掉低优先级项目。会议确定了三个待办事项，分别由设计师、开发负责人和产品经理负责，有明确的时间节点。

复制代码

import glob
def batch_process_folder(folder_path):
"""批量分析文件夹内所有txt文件"""
analyzer = DocumentAnalyzer()
files = glob.glob(os.path.join(folder_path, "*.txt"))
for file in files:
print(f"\n{'='*50}")
print(f"分析文件: {os.path.basename(file)}")
print(f"{'='*50}")
results = analyzer.batch_analyze(file)
for analysis_type, result in results.items():
print(f"\n【{analysis_type}】")
print(result)
# 批量处理当前目录下的所有txt文件
batch_process_folder("./documents")

复制代码