real-hot-news

star 0

获取当天中文和国际权威渠道的热点新闻,确保真实性和时效性,按热度排序并提供AI总结和多角度点评。当用户提到"热点新闻"、"今日新闻"、"新闻热榜"、"国际新闻"、"时事热点"、"最新新闻"、"今天发生了什么"时使用。

blueelwang By blueelwang schedule Updated 1/27/2026

name: real-hot-news description: 获取当天中文和国际权威渠道的热点新闻,确保真实性和时效性,按热度排序并提供AI总结和多角度点评。当用户提到"热点新闻"、"今日新闻"、"新闻热榜"、"国际新闻"、"时事热点"、"最新新闻"、"今天发生了什么"时使用。

Real Hot News - 热点新闻获取技能

技能概述

这个技能帮助你获取当天的热点新闻,从权威渠道抓取中文和国际新闻,确保真实性和时效性,并提供AI总结和多角度点评。

核心原则

⚠️ 时效性第一原则:必须严格验证新闻是当天(当年)的,往年同日期的新闻必须排除!

  1. 真实性优先:仅从权威渠道获取新闻
  2. 时效性保证:严格验证是当天的新闻,确认年份正确
  3. 热度排序:综合多个来源的热度指标
  4. 智能分析:提供内容总结和多角度点评

使用流程

步骤1:识别用户需求

首先确认当前日期

  • 📅 确认今天的完整日期(年-月-日)
  • 📅 示例:今天是2026年1月27日
  • 📅 在后续所有搜索中必须使用正确的年份

从用户请求中识别:

  • 新闻类型:中文、国际或混合(默认:混合)
  • 新闻数量:用户指定或默认20条
  • 特定主题:是否关注特定领域(科技、财经、政治等)

步骤2:获取新闻数据

使用抓取脚本直接获取实时热榜数据。

执行抓取脚本:

# 运行新闻抓取脚本
python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py

脚本功能:

  • ✅ 自动抓取多个权威平台的实时热榜
  • ✅ 内置时效性验证,确保是当天数据
  • ✅ 智能去重和排序
  • ✅ 输出JSON格式数据便于处理

支持的新闻源:

中文新闻源(14个):

  • 新华网要闻(网页抓取)- 官方权威媒体
  • 人民网要闻(网页抓取)- 官方权威媒体
  • 财新网(网页抓取)- 专业财经媒体,深度报道
  • FT中文网(网页抓取)- 国际权威财经媒体
  • 华尔街日报中文网(网页抓取)- 国际权威财经媒体
  • 纽约时报中文网(网页抓取)- 国际权威媒体
  • BBC中文(网页抓取)- 国际权威媒体
  • 联合早报(网页抓取)- 新加坡权威华文媒体,国际视角
  • 界面新闻(网页抓取)- 专业财经科技媒体
  • 微博热搜(实时API)- 社交媒体热度
  • 知乎热榜(官方API)- 问答社区热度
  • 今日头条热榜(官方API)- 资讯平台热度
  • 百度热搜(网页抓取)- 搜索引擎热度

国际新闻源(可扩展):

  • 使用 WebFetch 获取BBC、Reuters等媒体首页
  • 解析最新头条和热点新闻

重要提示

  • ⚠️ 首次使用需安装依赖pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
  • ⚠️ 网络要求:需要能够访问各大新闻网站
  • ⚠️ 频率限制:建议间隔至少5分钟再次抓取,避免频繁请求
  • 自动验证:脚本内置时效性检查,自动过滤旧新闻
  • 缓存支持:可以读取最近生成的JSON文件作为缓存

步骤3:数据处理与验证

读取脚本输出的JSON数据并进行分析:

# 读取最新生成的JSON文件
import json
import glob
import os

# 找到最新的新闻数据文件
news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
if news_files:
    latest_file = max(news_files, key=os.path.getctime)
    with open(latest_file, 'r', encoding='utf-8') as f:
        data = json.load(f)
    
    print(f"数据获取时间: {data['fetch_time']}")
    print(f"新闻总数: {data['count']}")
    news_list = data['news']

脚本已自动完成的处理:

  1. 提取关键信息

    • 新闻标题
    • 新闻来源
    • 热度排名
    • 热度综合评分
    • 原文链接
  2. 时效性保障

    • 脚本直接调用各平台实时API/热榜
    • 获取的都是当前最新数据
    • 无需担心获取到往年同日期的旧闻
  3. 真实性保障

    • 仅从权威平台获取(微博、知乎、新华网、人民网等)
    • 官方媒体权重更高
    • 已按来源权威性加权排序
  4. 去重处理

    • 脚本已自动识别相似标题
    • 保留热度最高的版本
    • 避免重复新闻干扰

需要人工分析的部分:

  1. 新闻分类

    • 根据标题关键词判断新闻类型(政治、经济、科技、娱乐等)
    • 用户有特定需求时可以筛选分类
  2. 热度解释

    • 脚本输出的heat值是综合评分(0-100分)
    • 考虑了来源权威性、排名和原始热度
  3. 多源印证

    • 如果同一新闻在多个平台出现,标注"多源报道"
    • 提高该新闻的可信度

步骤4:热度排序

综合排序依据:

  • 各平台的热度指标(浏览量、讨论数、排名)
  • 新闻的时效性(越新越优先)
  • 来源的权威性(官方媒体加权)
  • 多平台覆盖度(多源报道的新闻提升排名)

步骤5:生成总结和点评

对每条新闻:

  1. 内容总结(3-5句话):

    • 提取核心事实
    • 避免主观评价
    • 简洁明了
  2. 多角度AI点评

    • 📊 社会影响:分析对社会、行业、群体的影响
    • 🔍 深层解读:探讨背后的原因、趋势和关联
    • 🌍 全球视角:国际相关性、跨文化对比、全球影响
    • 💡 个人启示:对普通人的意义和可能的影响

点评原则

  • 客观理性,避免极端观点
  • 多维度思考,提供不同视角
  • 基于事实,避免臆测
  • 语言简洁,重点突出

步骤6:缓存管理

基于文件的缓存策略:

import os
import time
from datetime import datetime

# 检查最新数据文件的创建时间
def get_latest_news_file():
    news_files = glob.glob(os.path.expanduser("~/.cursor/skills/real-hot-news/scripts/hot_news_*.json"))
    if news_files:
        latest_file = max(news_files, key=os.path.getctime)
        file_time = os.path.getctime(latest_file)
        current_time = time.time()
        age_minutes = (current_time - file_time) / 60
        
        return latest_file, age_minutes
    return None, None

# 缓存逻辑
latest_file, age = get_latest_news_file()

if latest_file and age < 30:
    # 使用缓存数据
    print(f"📦 使用缓存数据({age:.1f}分钟前)")
    # 读取并返回缓存数据
elif latest_file and age >= 30:
    # 缓存过期,重新抓取
    print(f"🔄 缓存已过期({age:.1f}分钟前),重新抓取...")
    # 运行抓取脚本
else:
    # 没有缓存,首次抓取
    print("📥 首次抓取新闻...")
    # 运行抓取脚本

缓存优势:

  • ✅ 减少网络请求,提高响应速度
  • ✅ 避免频繁抓取被限制
  • ✅ 30分钟内数据变化不大,缓存合理
  • ✅ 用户可以要求"刷新"强制更新

输出格式

使用以下结构化格式输出:

# 📰 今日热点新闻(前20条)

> 数据获取时间:[YYYY-MM-DD HH:MM]
> 新闻来源:14个中文权威渠道(官方媒体、国际媒体、专业媒体、社交平台)

---

## 1. [新闻标题]

**来源**:[新闻来源]  
**时间**:[发布时间]  
**热度**:⭐⭐⭐⭐⭐ ([热度值/排名])  
**链接**:[原文链接]

**内容总结**:
[AI生成的简明总结,3-5句话概括核心内容]

**AI点评**(多角度):
- 📊 **社会影响**:[分析对社会的影响]
- 🔍 **深层解读**:[背后的原因和趋势]
- 🌍 **全球视角**:[国际相关性和对比]
- 💡 **个人启示**:[对普通人的意义]

---

## 2. [新闻标题]
...

---

📌 **说明**:
- 数据来自权威渠道,确保真实性
- 热度综合多个平台的指标
- AI点评仅供参考,请独立思考
- 如需刷新数据,请明确提出

错误处理

遇到问题时的应对策略:

  1. 脚本依赖未安装

    错误提示:ModuleNotFoundError: No module named 'requests'
    
    解决方案:
    pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
    
    或单独安装:
    pip install requests beautifulsoup4 lxml
    
  2. 脚本执行失败

    # 测试脚本是否正常
    python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py
    
    # 查看详细错误信息
    # 根据输出的错误提示判断问题
    

    常见问题:

    • ❌ 网络连接问题:检查网络,使用代理
    • ❌ 权限问题:确保脚本有执行权限
    • ❌ Python版本:确保Python 3.7+
  3. 部分新闻源抓取失败

    • ✅ 脚本会显示每个源的抓取结果
    • ✅ 自动跳过失败的源,继续其他源
    • ✅ 至少需要2-3个源成功才能提供有效数据
    • 示例输出:
      ✓ 微博热搜: 获取到 20 条新闻
      ✓ 知乎热榜: 获取到 20 条新闻
      ❌ 今日头条: 抓取失败 (网络超时)
      ✓ 百度热搜: 获取到 20 条新闻
      
  4. 未找到缓存数据

    首次使用或缓存文件被删除时:
    - 自动运行脚本抓取新数据
    - 可能需要等待10-30秒
    - 下次请求会使用缓存,速度更快
    
  5. 数据质量问题

    • ⚠️ 如果新闻标题明显异常,标注"[待核实]"
    • ⚠️ 发现重复新闻时,脚本已自动去重
    • ⚠️ 对可疑信息降低优先级
    • ✅ 建议用户访问原文链接确认
  6. 网络限制问题

    如果频繁抓取导致IP被限:
    - 等待30分钟后再试
    - 使用缓存数据(30分钟内有效)
    - 考虑配置代理(修改脚本)
    

使用示例

示例1:基本使用

用户:今天有什么热点新闻?
AI:[执行技能,抓取多个新闻源,返回前20条综合热点]

示例2:指定数量

用户:给我看看今天最热的5条新闻
AI:[返回前5条,按热度排序]

**示例3:指定类型**

用户:最近有什么重要的国际新闻? AI:[重点搜索国际新闻源,返回国际热点]


**示例4:特定领域**

用户:今天科技圈有什么大新闻? AI:[筛选科技相关新闻,提供专题热点]


**示例5:强制刷新**

用户:刷新一下最新的新闻 AI:[忽略缓存,重新获取最新数据]


## 注意事项

1. **环境依赖**:
   - ⚠️ **首次使用需安装Python依赖**:
     ```bash
     pip install -r ~/.cursor/skills/real-hot-news/scripts/requirements.txt
     ```
   - ✅ Python 3.7+ 版本
   - ✅ 需要联网才能正常工作
   - ✅ 建议在终端测试脚本:`python ~/.cursor/skills/real-hot-news/scripts/fetch_news.py`

2. **脚本执行**:
   - 使用 Shell 工具执行抓取脚本
   - 脚本运行时间约10-30秒(取决于网络)
   - 输出JSON文件保存在 scripts/ 目录
   - 可选使用 WebFetch 工具获取国际新闻

3. **频率限制**:
   - 建议至少间隔5分钟再次抓取
   - 30分钟内优先使用缓存数据
   - 用户明确要求"刷新"时可重新抓取
   - 避免频繁请求导致IP被限制

4. **版权合规**:
   - 仅提供新闻摘要和链接
   - 鼓励用户访问原文
   - 标注所有新闻来源
   - 遵守各网站robots.txt和使用条款
   - 个人学习使用,不做商业用途

5. **内容中立**:
   - 保持客观,不偏向任何立场
   - 平衡报道不同观点
   - AI点评提供多角度分析

6. **隐私保护**:
   - 不存储用户的浏览记录
   - 缓存仅保留新闻数据(本地JSON文件)
   - 不收集个人信息
   - 不上传任何数据到外部服务器

7. **错误处理**:
   - 如果某个新闻源抓取失败,继续使用其他源
   - 脚本有3次重试机制
   - 查看脚本输出了解具体失败原因
   - 网络问题时建议稍后重试

## 进阶功能

### 自定义新闻源

如果用户有特定的新闻源偏好,可以调整搜索策略:

用户可能的请求:

  • "帮我看看彭博社的今日头条"
  • "关注一下财新网的最新报道"
  • "CNN对这件事怎么说的"

处理方式:

  • 针对性搜索特定媒体
  • 保持相同的验证和分析标准
  • 在输出中明确标注来源

### 新闻追踪

对持续关注的话题:

用户:"这个事件有什么新进展?"

处理方式:

  1. 识别用户关注的具体事件
  2. 搜索该事件的最新报道
  3. 按时间顺序整理进展
  4. 提供完整的事件脉络

### 对比分析

对同一新闻的不同报道角度:

用户:"不同媒体对这个新闻的报道有什么不同?"

处理方式:

  1. 搜索多个媒体的报道
  2. 对比报道角度和侧重点
  3. 分析不同立场和观点
  4. 帮助用户全面了解事件

## 额外资源

详细的新闻源配置和特点说明,请参考 [sources.md](sources.md)。
Install via CLI
npx skills add https://github.com/blueelwang/skill-real-hot-news --skill real-hot-news
Repository Details
star Stars 0
call_split Forks 1
navigation Branch main
article Path SKILL.md
More from Creator