real-hot-news - SKILL.md Agent Skill

name: real-hot-news description: 获取当天中文和国际权威渠道的热点新闻，确保真实性和时效性，按热度排序并提供AI总结和多角度点评。当用户提到"热点新闻"、"今日新闻"、"新闻热榜"、"国际新闻"、"时事热点"、"最新新闻"、"今天发生了什么"时使用。

Real Hot News - 热点新闻获取技能

技能概述

这个技能帮助你获取当天的热点新闻，从权威渠道抓取中文和国际新闻，确保真实性和时效性，并提供AI总结和多角度点评。

核心原则

⚠️ 时效性第一原则：必须严格验证新闻是当天（当年）的，往年同日期的新闻必须排除！

真实性优先：仅从权威渠道获取新闻
时效性保证：严格验证是当天的新闻，确认年份正确
热度排序：综合多个来源的热度指标
智能分析：提供内容总结和多角度点评

使用流程

步骤1：识别用户需求

首先确认当前日期：

📅 确认今天的完整日期（年-月-日）
📅 示例：今天是2026年1月27日
📅 在后续所有搜索中必须使用正确的年份

从用户请求中识别：

新闻类型：中文、国际或混合（默认：混合）
新闻数量：用户指定或默认20条
特定主题：是否关注特定领域（科技、财经、政治等）

步骤2：获取新闻数据

使用抓取脚本直接获取实时热榜数据。

执行抓取脚本：

# 运行新闻抓取脚本
python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py

脚本功能：

✅ 自动抓取多个权威平台的实时热榜
✅ 内置时效性验证，确保是当天数据
✅ 智能去重和排序
✅ 输出JSON格式数据便于处理

支持的新闻源：

中文新闻源（14个）：

新华网要闻（网页抓取）- 官方权威媒体
人民网要闻（网页抓取）- 官方权威媒体
财新网（网页抓取）- 专业财经媒体，深度报道
FT中文网（网页抓取）- 国际权威财经媒体
华尔街日报中文网（网页抓取）- 国际权威财经媒体
纽约时报中文网（网页抓取）- 国际权威媒体
BBC中文（网页抓取）- 国际权威媒体
联合早报（网页抓取）- 新加坡权威华文媒体，国际视角
界面新闻（网页抓取）- 专业财经科技媒体
微博热搜（实时API）- 社交媒体热度
知乎热榜（官方API）- 问答社区热度
今日头条热榜（官方API）- 资讯平台热度
百度热搜（网页抓取）- 搜索引擎热度

国际新闻源（可扩展）：

使用 WebFetch 获取BBC、Reuters等媒体首页
解析最新头条和热点新闻

重要提示：

⚠️ 首次使用需安装依赖：pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
⚠️ 网络要求：需要能够访问各大新闻网站
⚠️ 频率限制：建议间隔至少5分钟再次抓取，避免频繁请求
✅ 自动验证：脚本内置时效性检查，自动过滤旧新闻
✅ 缓存支持：可以读取最近生成的JSON文件作为缓存

步骤3：数据处理与验证

读取脚本输出的JSON数据并进行分析：

# 读取最新生成的JSON文件
import json
import glob
import os

# 找到最新的新闻数据文件
news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
if news_files:
    latest_file = max(news_files, key=os.path.getctime)
    with open(latest_file, 'r', encoding='utf-8') as f:
        data = json.load(f)
    
    print(f"数据获取时间: {data['fetch_time']}")
    print(f"新闻总数: {data['count']}")
    news_list = data['news']

脚本已自动完成的处理：

✅ 提取关键信息：
- 新闻标题
- 新闻来源
- 热度排名
- 热度综合评分
- 原文链接
✅ 时效性保障：
- 脚本直接调用各平台实时API/热榜
- 获取的都是当前最新数据
- 无需担心获取到往年同日期的旧闻
✅ 真实性保障：
- 仅从权威平台获取（微博、知乎、新华网、人民网等）
- 官方媒体权重更高
- 已按来源权威性加权排序
✅ 去重处理：
- 脚本已自动识别相似标题
- 保留热度最高的版本
- 避免重复新闻干扰

需要人工分析的部分：

新闻分类：
- 根据标题关键词判断新闻类型（政治、经济、科技、娱乐等）
- 用户有特定需求时可以筛选分类
热度解释：
- 脚本输出的heat值是综合评分（0-100分）
- 考虑了来源权威性、排名和原始热度
多源印证：
- 如果同一新闻在多个平台出现，标注"多源报道"
- 提高该新闻的可信度

步骤4：热度排序

综合排序依据：

各平台的热度指标（浏览量、讨论数、排名）
新闻的时效性（越新越优先）
来源的权威性（官方媒体加权）
多平台覆盖度（多源报道的新闻提升排名）

步骤5：生成总结和点评

对每条新闻：

内容总结（3-5句话）：
- 提取核心事实
- 避免主观评价
- 简洁明了
多角度AI点评：
- 📊 社会影响：分析对社会、行业、群体的影响
- 🔍 深层解读：探讨背后的原因、趋势和关联
- 🌍 全球视角：国际相关性、跨文化对比、全球影响
- 💡 个人启示：对普通人的意义和可能的影响

点评原则：

客观理性，避免极端观点
多维度思考，提供不同视角
基于事实，避免臆测
语言简洁，重点突出

步骤6：缓存管理

基于文件的缓存策略：

import os
import time
from datetime import datetime

# 检查最新数据文件的创建时间
def get_latest_news_file():
    news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
    if news_files:
        latest_file = max(news_files, key=os.path.getctime)
        file_time = os.path.getctime(latest_file)
        current_time = time.time()
        age_minutes = (current_time - file_time) / 60
        
        return latest_file, age_minutes
    return None, None

# 缓存逻辑
latest_file, age = get_latest_news_file()

if latest_file and age < 30:
    # 使用缓存数据
    print(f"📦 使用缓存数据（{age:.1f}分钟前）")
    # 读取并返回缓存数据
elif latest_file and age >= 30:
    # 缓存过期，重新抓取
    print(f"🔄 缓存已过期（{age:.1f}分钟前），重新抓取...")
    # 运行抓取脚本
else:
    # 没有缓存，首次抓取
    print("📥 首次抓取新闻...")
    # 运行抓取脚本

缓存优势：

✅ 减少网络请求，提高响应速度
✅ 避免频繁抓取被限制
✅ 30分钟内数据变化不大，缓存合理
✅ 用户可以要求"刷新"强制更新

输出格式

使用以下结构化格式输出：

# 📰 今日热点新闻（前20条）

> 数据获取时间：[YYYY-MM-DD HH:MM]
> 新闻来源：14个中文权威渠道（官方媒体、国际媒体、专业媒体、社交平台）

---

## 1. [新闻标题]

**来源**：[新闻来源]  
**时间**：[发布时间]  
**热度**：⭐⭐⭐⭐⭐ ([热度值/排名])  
**链接**：[原文链接]

**内容总结**：
[AI生成的简明总结，3-5句话概括核心内容]

**AI点评**（多角度）：
- 📊 **社会影响**：[分析对社会的影响]
- 🔍 **深层解读**：[背后的原因和趋势]
- 🌍 **全球视角**：[国际相关性和对比]
- 💡 **个人启示**：[对普通人的意义]

---

## 2. [新闻标题]
...

---

📌 **说明**：
- 数据来自权威渠道，确保真实性
- 热度综合多个平台的指标
- AI点评仅供参考，请独立思考
- 如需刷新数据，请明确提出

错误处理

遇到问题时的应对策略：

脚本依赖未安装：

错误提示：ModuleNotFoundError: No module named 'requests'

解决方案：
pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt

或单独安装：
pip install requests beautifulsoup4 lxml

脚本执行失败：
```
# 测试脚本是否正常
python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py

# 查看详细错误信息
# 根据输出的错误提示判断问题
```
常见问题：
- ❌ 网络连接问题：检查网络，使用代理
- ❌ 权限问题：确保脚本有执行权限
- ❌ Python版本：确保Python 3.7+
部分新闻源抓取失败：
- ✅ 脚本会显示每个源的抓取结果
- ✅ 自动跳过失败的源，继续其他源
- ✅ 至少需要2-3个源成功才能提供有效数据
- 示例输出：
```
✓ 微博热搜: 获取到 20 条新闻
✓ 知乎热榜: 获取到 20 条新闻
❌ 今日头条: 抓取失败 (网络超时)
✓ 百度热搜: 获取到 20 条新闻
```

未找到缓存数据：

首次使用或缓存文件被删除时：
- 自动运行脚本抓取新数据
- 可能需要等待10-30秒
- 下次请求会使用缓存，速度更快

数据质量问题：
- ⚠️ 如果新闻标题明显异常，标注"[待核实]"
- ⚠️ 发现重复新闻时，脚本已自动去重
- ⚠️ 对可疑信息降低优先级
- ✅ 建议用户访问原文链接确认

网络限制问题：

如果频繁抓取导致IP被限：
- 等待30分钟后再试
- 使用缓存数据（30分钟内有效）
- 考虑配置代理（修改脚本）

使用示例

示例1：基本使用

用户：今天有什么热点新闻？
AI：[执行技能，抓取多个新闻源，返回前20条综合热点]

示例2：指定数量

用户：给我看看今天最热的5条新闻
AI：[返回前5条，按热度排序]


**示例3：指定类型**

用户：最近有什么重要的国际新闻？ AI：[重点搜索国际新闻源，返回国际热点]


**示例4：特定领域**

用户：今天科技圈有什么大新闻？ AI：[筛选科技相关新闻，提供专题热点]


**示例5：强制刷新**

用户：刷新一下最新的新闻 AI：[忽略缓存，重新获取最新数据]


## 注意事项

1. **环境依赖**：
   - ⚠️ **首次使用需安装Python依赖**：
     ```bash
     pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
     ```
   - ✅ Python 3.7+ 版本
   - ✅ 需要联网才能正常工作
   - ✅ 建议在终端测试脚本：`python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py`

2. **脚本执行**：
   - 使用 Shell 工具执行抓取脚本
   - 脚本运行时间约10-30秒（取决于网络）
   - 输出JSON文件保存在 scripts/ 目录
   - 可选使用 WebFetch 工具获取国际新闻

3. **频率限制**：
   - 建议至少间隔5分钟再次抓取
   - 30分钟内优先使用缓存数据
   - 用户明确要求"刷新"时可重新抓取
   - 避免频繁请求导致IP被限制

4. **版权合规**：
   - 仅提供新闻摘要和链接
   - 鼓励用户访问原文
   - 标注所有新闻来源
   - 遵守各网站robots.txt和使用条款
   - 个人学习使用，不做商业用途

5. **内容中立**：
   - 保持客观，不偏向任何立场
   - 平衡报道不同观点
   - AI点评提供多角度分析

6. **隐私保护**：
   - 不存储用户的浏览记录
   - 缓存仅保留新闻数据（本地JSON文件）
   - 不收集个人信息
   - 不上传任何数据到外部服务器

7. **错误处理**：
   - 如果某个新闻源抓取失败，继续使用其他源
   - 脚本有3次重试机制
   - 查看脚本输出了解具体失败原因
   - 网络问题时建议稍后重试

## 进阶功能

### 自定义新闻源

如果用户有特定的新闻源偏好，可以调整搜索策略：

用户可能的请求：

"帮我看看彭博社的今日头条"
"关注一下财新网的最新报道"
"CNN对这件事怎么说的"

处理方式：

针对性搜索特定媒体
保持相同的验证和分析标准
在输出中明确标注来源


### 新闻追踪

对持续关注的话题：

用户："这个事件有什么新进展？"

处理方式：

识别用户关注的具体事件
搜索该事件的最新报道
按时间顺序整理进展
提供完整的事件脉络


### 对比分析

对同一新闻的不同报道角度：

用户："不同媒体对这个新闻的报道有什么不同？"

处理方式：

搜索多个媒体的报道
对比报道角度和侧重点
分析不同立场和观点
帮助用户全面了解事件


## 额外资源

详细的新闻源配置和特点说明，请参考 [sources.md](sources.md)。