返回顶部
m

media-search媒体搜索

当用户需要写新闻、找素材、查背景、核实信息、了解事件来龙去脉,或者提到"查一下"、"搜一下"、"找找相关报道"、"有什么最新消息"时,或开展互联网线索数据挖掘、新闻选题策划、内容采编、监测竞品或特定信源动态等业务时,需要进行全网媒体稿件检索、查找事件背景、行业数据、政策动态、人物信息、历史脉络等,都应使用此技能

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
81
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

media-search

Media Search Tool

媒体库搜索工具技能,用于通过 search.py 脚本搜索媒体内容。

使用方法

bash
python3 search.py --json-input {keywords: 搜索关键词, limit: 10} [--output-file results.json] [--output-console]

参数说明

必需参数

  • - --json-input: JSON格式的搜索参数

搜索参数(JSON输入)
参数名类型默认值可选值/格式必填说明
keywordsstring多个关键词用空格分隔用户输入的搜索主题(如“乡村振兴 最新政策”),系统会自动拆分关键词提升召回率
keyword_position
string | 标题或正文 | 仅标题、仅正文、标题或正文 | 否 | 指定关键词匹配位置 |

| publishtimestart | string (datetime) | 见规则 | yyyy-MM-dd HH:mm:ss | 否 | 发布时间开始时间,支持模糊时间词(见下) | | publishtimeend | string (datetime) | 当前时间 | yyyy-MM-dd HH:mm:ss | 否 | 发布时间结束时间 | | data_type | string | 全部 | news,app,weibo,wechat,wemedia,epaper(逗号分隔) | 否 | 数据来源类型 | | source_name | string | 全部信源 | 任意信源名称 | 否 | 指定媒体来源(支持模糊匹配) 如“人民日报”、“新华社”、“澎湃新闻” | | limit | integer | 10 | 1 ~ 50 | 否 | 返回结果数量 |

keywords 拆分规则

用于对用户输入的 keywords 进行智能拆分与规范化处理,以提升检索召回率与相关性。

一、基础拆分规则

  1. 1. 按空格拆分
- 输入:乡村振兴 最新政策 - 输出:[乡村振兴, 最新政策]
  1. 2. 去除多余空格
- 自动去除首尾空格及重复空格
  1. 3. 大小写统一(英文)
- 全部转为小写(如:AI Policy → ai policy)

二、分词增强规则

  1. 1. 中文分词(语义切分)
- 输入:人工智能发展 - 输出:[人工智能, 发展]
  1. 2. 中英文混合拆分
- 输入:AI发展趋势 - 输出:[ai, 发展, 趋势]
  1. 3. 数字与单位拆分
- 输入:5G产业 - 输出:[5g, 产业]

三、停用词过滤

系统可过滤无意义词:的、了、和、是、在、与、及、以及、相关、方面、情况

自然语言时间解析规则

用于从用户输入(关键词 / 对话文本)中识别时间表达,并转换为标准时间范围(publishtimestart / publishtimeend)。

模糊时间关键词

关键词转换规则
最新 / 实时当前时间 - 24 小时
近期 / 最近
当前时间 - 3 天 |

相对时间表达

表达转换规则
最近1天 / 过去1天当前时间 - 1 天
最近3天
当前时间 - 3 天 | | 最近7天 / 最近一周 | 当前时间 - 7 天 | | 最近1个月 | 当前时间 - 30 天 | | 最近3个月 | 当前时间 - 90 天 |

自然时间表达

表达转换规则
今天当天 00:00:00 ~ 当前时间
昨天
昨天 00:00:00 ~ 23:59:59 | | 前天 | 前天 00:00:00 ~ 23:59:59 | | 本周 | 本周一 00:00:00 ~ 当前时间 | | 上周 | 上周一 00:00:00 ~ 上周日 23:59:59 | | 本月 | 本月1号 00:00:00 ~ 当前时间 | | 上月 | 上月1号 00:00:00 ~ 上月最后一天 23:59:59 | | 今年 | 当年 01-01 00:00:00 ~ 当前时间 | | 去年 | 去年 01-01 00:00:00 ~ 12-31 23:59:59 |

默认时间规则

当用户未提供任何时间信息时:
publishtimestart = 当前时间 - 90 天
publishtimeend = 当前时间

解析规则说明

  1. 1. 所有“当前时间”均指系统当前时间(now)
  2. 时间范围统一输出格式:yyyy-MM-dd HH:mm:ss

输出参数

  • - --output-file (string, optional): 将结果保存到指定JSON文件
  • --output-console (flag, optional): 强制输出到控制台

输出存储

1. JSON输出文件

当指定 --output-file 时保存为JSON格式: json { total: 100, fallbacktoweb: false, items: [ { title: 文章标题, summary: 文章摘要, source_name: 信源名称, data_type: news, url: https://example.com } ] }

2. 控制台输出

格式化文本输出到控制台,包含:
  • - 查询元数据(查询词、后端、时间、数量)
  • 每个结果的详细信息
  • 链接、摘要、正文预览

生成文件管理

默认生成位置

默认情况下,所有生成的文件保存在当前SKILL目录下:
  • - JSON输出文件需要手动指定完整路径,例如:sources/result.json

清理策略

生成的JSON文件应根据情况删除:
  • - 需要删除时:JSON文件为临时/中间结果且不再需要时
  • 需要保留时:JSON文件包含需要保留的重要数据时
  • 判断标准:根据文件内容的重要性和项目持续需求来评估

示例清理流程:
bash

生成结果到指定目录


python3 search.py --json-input {keywords: test} --output-file sources/result.json

使用结果后,如不再需要则清理

rm sources/result.json # 删除临时JSON文件

示例

基础搜索

bash python3 search.py --json-input {keywords: 人工智能 政策, limit: 20}

带信源过滤的搜索

bash python3 search.py --json-input {keywords: 乡村振兴, limit: 10}

带时间范围的搜索

bash python3 search.py --json-input { keywords: 人民日报 一带一路, source_name: 人民日报, publishtimestart: 2026-03-25 00:00:00, publishtimeend: 2026-04-01 17:02:28 }

保存到JSON文件

bash python3 search.py --json-input {keywords: 经济 发展} --output-file results.json

仅控制台输出

bash python3 search.py --json-input {keywords: 科技创新} --output-console

环境要求

需要配置API密钥环境变量:

  • - NEWSBIGDATAAPIKEY: API密钥
  • NEWSBIGDATAAPISECRET: API密钥密钥

脚本异常处理

当运行 search.py 脚本发生异常时:

  • - 系统会在控制台显示具体的错误信息
  • 脚本会立即停止执行并返回错误代码
  • 用户可根据显示的错误信息进行相应的故障排除

常见异常情况:

  • - API密钥配置缺失或无效
  • JSON输入格式错误
  • 网络连接问题
  • 参数验证失败

集成说明

  1. 1. 自动保存: 所有搜索结果自动保存到sources文件夹
  2. 多格式支持: 支持JSON文件、控制台、Markdown三种输出
  3. 参数验证: 自动验证参数范围和必填项
  4. 日志记录: 详细的操作日志输出到控制台

依赖项

  • - scripts/media_search.py: 核心搜索引擎
  • scripts/SearchParameters: 搜索参数模型

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 media-search-1775878208 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 media-search-1775878208 技能

通过命令行安装

skillhub install media-search-1775878208

下载

⬇ 下载 media-search v1.0.0(免费)

文件大小: 19.46 KB | 发布时间: 2026-4-12 10:33

v1.0.0 最新 2026-4-12 10:33
- Initial release of media-search skill for comprehensive media content searching.
- Supports search by keywords, time range, source, and data type, with advanced rules for keyword splitting and time parsing.
- Provides results via JSON file output or formatted console output.
- Flexible filtering, parameter validation, and error handling included.
- Result storage management, environment variable requirements, and workflow integration guidance provided.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部