name: real-hot-news description: 获取当天中文和国际权威渠道的热点新闻,确保真实性和时效性,按热度排序并提供AI总结和多角度点评。当用户提到"热点新闻"、"今日新闻"、"新闻热榜"、"国际新闻"、"时事热点"、"最新新闻"、"今天发生了什么"时使用。
Real Hot News - 热点新闻获取技能
技能概述
这个技能帮助你获取当天的热点新闻,从权威渠道抓取中文和国际新闻,确保真实性和时效性,并提供AI总结和多角度点评。
核心原则
⚠️ 时效性第一原则:必须严格验证新闻是当天(当年)的,往年同日期的新闻必须排除!
- 真实性优先:仅从权威渠道获取新闻
- 时效性保证:严格验证是当天的新闻,确认年份正确
- 热度排序:综合多个来源的热度指标
- 智能分析:提供内容总结和多角度点评
使用流程
步骤1:识别用户需求
首先确认当前日期:
- 📅 确认今天的完整日期(年-月-日)
- 📅 示例:今天是2026年1月27日
- 📅 在后续所有搜索中必须使用正确的年份
从用户请求中识别:
- 新闻类型:中文、国际或混合(默认:混合)
- 新闻数量:用户指定或默认20条
- 特定主题:是否关注特定领域(科技、财经、政治等)
步骤2:获取新闻数据
使用抓取脚本直接获取实时热榜数据。
执行抓取脚本:
# 运行新闻抓取脚本
python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py
脚本功能:
- ✅ 自动抓取多个权威平台的实时热榜
- ✅ 内置时效性验证,确保是当天数据
- ✅ 智能去重和排序
- ✅ 输出JSON格式数据便于处理
支持的新闻源:
中文新闻源(14个):
- 新华网要闻(网页抓取)- 官方权威媒体
- 人民网要闻(网页抓取)- 官方权威媒体
- 财新网(网页抓取)- 专业财经媒体,深度报道
- FT中文网(网页抓取)- 国际权威财经媒体
- 华尔街日报中文网(网页抓取)- 国际权威财经媒体
- 纽约时报中文网(网页抓取)- 国际权威媒体
- BBC中文(网页抓取)- 国际权威媒体
- 联合早报(网页抓取)- 新加坡权威华文媒体,国际视角
- 界面新闻(网页抓取)- 专业财经科技媒体
- 微博热搜(实时API)- 社交媒体热度
- 知乎热榜(官方API)- 问答社区热度
- 今日头条热榜(官方API)- 资讯平台热度
- 百度热搜(网页抓取)- 搜索引擎热度
国际新闻源(可扩展):
- 使用 WebFetch 获取BBC、Reuters等媒体首页
- 解析最新头条和热点新闻
重要提示:
- ⚠️ 首次使用需安装依赖:
pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt - ⚠️ 网络要求:需要能够访问各大新闻网站
- ⚠️ 频率限制:建议间隔至少5分钟再次抓取,避免频繁请求
- ✅ 自动验证:脚本内置时效性检查,自动过滤旧新闻
- ✅ 缓存支持:可以读取最近生成的JSON文件作为缓存
步骤3:数据处理与验证
读取脚本输出的JSON数据并进行分析:
# 读取最新生成的JSON文件
import json
import glob
import os
# 找到最新的新闻数据文件
news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
if news_files:
latest_file = max(news_files, key=os.path.getctime)
with open(latest_file, 'r', encoding='utf-8') as f:
data = json.load(f)
print(f"数据获取时间: {data['fetch_time']}")
print(f"新闻总数: {data['count']}")
news_list = data['news']
脚本已自动完成的处理:
✅ 提取关键信息:
- 新闻标题
- 新闻来源
- 热度排名
- 热度综合评分
- 原文链接
✅ 时效性保障:
- 脚本直接调用各平台实时API/热榜
- 获取的都是当前最新数据
- 无需担心获取到往年同日期的旧闻
✅ 真实性保障:
- 仅从权威平台获取(微博、知乎、新华网、人民网等)
- 官方媒体权重更高
- 已按来源权威性加权排序
✅ 去重处理:
- 脚本已自动识别相似标题
- 保留热度最高的版本
- 避免重复新闻干扰
需要人工分析的部分:
新闻分类:
- 根据标题关键词判断新闻类型(政治、经济、科技、娱乐等)
- 用户有特定需求时可以筛选分类
热度解释:
- 脚本输出的heat值是综合评分(0-100分)
- 考虑了来源权威性、排名和原始热度
多源印证:
- 如果同一新闻在多个平台出现,标注"多源报道"
- 提高该新闻的可信度
步骤4:热度排序
综合排序依据:
- 各平台的热度指标(浏览量、讨论数、排名)
- 新闻的时效性(越新越优先)
- 来源的权威性(官方媒体加权)
- 多平台覆盖度(多源报道的新闻提升排名)
步骤5:生成总结和点评
对每条新闻:
内容总结(3-5句话):
- 提取核心事实
- 避免主观评价
- 简洁明了
多角度AI点评:
- 📊 社会影响:分析对社会、行业、群体的影响
- 🔍 深层解读:探讨背后的原因、趋势和关联
- 🌍 全球视角:国际相关性、跨文化对比、全球影响
- 💡 个人启示:对普通人的意义和可能的影响
点评原则:
- 客观理性,避免极端观点
- 多维度思考,提供不同视角
- 基于事实,避免臆测
- 语言简洁,重点突出
步骤6:缓存管理
基于文件的缓存策略:
import os
import time
from datetime import datetime
# 检查最新数据文件的创建时间
def get_latest_news_file():
news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
if news_files:
latest_file = max(news_files, key=os.path.getctime)
file_time = os.path.getctime(latest_file)
current_time = time.time()
age_minutes = (current_time - file_time) / 60
return latest_file, age_minutes
return None, None
# 缓存逻辑
latest_file, age = get_latest_news_file()
if latest_file and age < 30:
# 使用缓存数据
print(f"📦 使用缓存数据({age:.1f}分钟前)")
# 读取并返回缓存数据
elif latest_file and age >= 30:
# 缓存过期,重新抓取
print(f"🔄 缓存已过期({age:.1f}分钟前),重新抓取...")
# 运行抓取脚本
else:
# 没有缓存,首次抓取
print("📥 首次抓取新闻...")
# 运行抓取脚本
缓存优势:
- ✅ 减少网络请求,提高响应速度
- ✅ 避免频繁抓取被限制
- ✅ 30分钟内数据变化不大,缓存合理
- ✅ 用户可以要求"刷新"强制更新
输出格式
使用以下结构化格式输出:
# 📰 今日热点新闻(前20条)
> 数据获取时间:[YYYY-MM-DD HH:MM]
> 新闻来源:14个中文权威渠道(官方媒体、国际媒体、专业媒体、社交平台)
---
## 1. [新闻标题]
**来源**:[新闻来源]
**时间**:[发布时间]
**热度**:⭐⭐⭐⭐⭐ ([热度值/排名])
**链接**:[原文链接]
**内容总结**:
[AI生成的简明总结,3-5句话概括核心内容]
**AI点评**(多角度):
- 📊 **社会影响**:[分析对社会的影响]
- 🔍 **深层解读**:[背后的原因和趋势]
- 🌍 **全球视角**:[国际相关性和对比]
- 💡 **个人启示**:[对普通人的意义]
---
## 2. [新闻标题]
...
---
📌 **说明**:
- 数据来自权威渠道,确保真实性
- 热度综合多个平台的指标
- AI点评仅供参考,请独立思考
- 如需刷新数据,请明确提出
错误处理
遇到问题时的应对策略:
脚本依赖未安装:
错误提示:ModuleNotFoundError: No module named 'requests' 解决方案: pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt 或单独安装: pip install requests beautifulsoup4 lxml脚本执行失败:
# 测试脚本是否正常 python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py # 查看详细错误信息 # 根据输出的错误提示判断问题常见问题:
- ❌ 网络连接问题:检查网络,使用代理
- ❌ 权限问题:确保脚本有执行权限
- ❌ Python版本:确保Python 3.7+
部分新闻源抓取失败:
- ✅ 脚本会显示每个源的抓取结果
- ✅ 自动跳过失败的源,继续其他源
- ✅ 至少需要2-3个源成功才能提供有效数据
- 示例输出:
✓ 微博热搜: 获取到 20 条新闻 ✓ 知乎热榜: 获取到 20 条新闻 ❌ 今日头条: 抓取失败 (网络超时) ✓ 百度热搜: 获取到 20 条新闻
未找到缓存数据:
首次使用或缓存文件被删除时: - 自动运行脚本抓取新数据 - 可能需要等待10-30秒 - 下次请求会使用缓存,速度更快数据质量问题:
- ⚠️ 如果新闻标题明显异常,标注"[待核实]"
- ⚠️ 发现重复新闻时,脚本已自动去重
- ⚠️ 对可疑信息降低优先级
- ✅ 建议用户访问原文链接确认
网络限制问题:
如果频繁抓取导致IP被限: - 等待30分钟后再试 - 使用缓存数据(30分钟内有效) - 考虑配置代理(修改脚本)
使用示例
示例1:基本使用
用户:今天有什么热点新闻?
AI:[执行技能,抓取多个新闻源,返回前20条综合热点]
示例2:指定数量
用户:给我看看今天最热的5条新闻
AI:[返回前5条,按热度排序]
**示例3:指定类型**
用户:最近有什么重要的国际新闻? AI:[重点搜索国际新闻源,返回国际热点]
**示例4:特定领域**
用户:今天科技圈有什么大新闻? AI:[筛选科技相关新闻,提供专题热点]
**示例5:强制刷新**
用户:刷新一下最新的新闻 AI:[忽略缓存,重新获取最新数据]
## 注意事项
1. **环境依赖**:
- ⚠️ **首次使用需安装Python依赖**:
```bash
pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
```
- ✅ Python 3.7+ 版本
- ✅ 需要联网才能正常工作
- ✅ 建议在终端测试脚本:`python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py`
2. **脚本执行**:
- 使用 Shell 工具执行抓取脚本
- 脚本运行时间约10-30秒(取决于网络)
- 输出JSON文件保存在 scripts/ 目录
- 可选使用 WebFetch 工具获取国际新闻
3. **频率限制**:
- 建议至少间隔5分钟再次抓取
- 30分钟内优先使用缓存数据
- 用户明确要求"刷新"时可重新抓取
- 避免频繁请求导致IP被限制
4. **版权合规**:
- 仅提供新闻摘要和链接
- 鼓励用户访问原文
- 标注所有新闻来源
- 遵守各网站robots.txt和使用条款
- 个人学习使用,不做商业用途
5. **内容中立**:
- 保持客观,不偏向任何立场
- 平衡报道不同观点
- AI点评提供多角度分析
6. **隐私保护**:
- 不存储用户的浏览记录
- 缓存仅保留新闻数据(本地JSON文件)
- 不收集个人信息
- 不上传任何数据到外部服务器
7. **错误处理**:
- 如果某个新闻源抓取失败,继续使用其他源
- 脚本有3次重试机制
- 查看脚本输出了解具体失败原因
- 网络问题时建议稍后重试
## 进阶功能
### 自定义新闻源
如果用户有特定的新闻源偏好,可以调整搜索策略:
用户可能的请求:
- "帮我看看彭博社的今日头条"
- "关注一下财新网的最新报道"
- "CNN对这件事怎么说的"
处理方式:
- 针对性搜索特定媒体
- 保持相同的验证和分析标准
- 在输出中明确标注来源
### 新闻追踪
对持续关注的话题:
用户:"这个事件有什么新进展?"
处理方式:
- 识别用户关注的具体事件
- 搜索该事件的最新报道
- 按时间顺序整理进展
- 提供完整的事件脉络
### 对比分析
对同一新闻的不同报道角度:
用户:"不同媒体对这个新闻的报道有什么不同?"
处理方式:
- 搜索多个媒体的报道
- 对比报道角度和侧重点
- 分析不同立场和观点
- 帮助用户全面了解事件
## 额外资源
详细的新闻源配置和特点说明,请参考 [sources.md](sources.md)。