name: processing-network-data description: 当用户需要处理社会网络数据,包括关系数据收集、矩阵构建、数据清洗验证和多模网络处理时使用此技能 version: 1.0.0 author: socienceAI.com license: MIT tags: [social-network-analysis, network-data-processing, data-cleaning, matrix-construction, relational-data] compatibility: Claude 3.5 Sonnet and above metadata: domain: social-network-analysis methodology: data-processing complexity: intermediate integration_type: analysis_tool last_updated: "2025-12-21" allowed-tools: [python, bash, read_file, write_file]
网络数据处理技能 (Network Data Processing)
概述
专门用于社会网络研究的数据收集和预处理,将原始关系数据转换为标准化的网络分析格式。该技能帮助研究者从问卷、访谈、观察或数字记录中提取关系数据,构建标准化的网络矩阵。
使用时机
当用户请求以下处理时使用此技能:
- 处理来自各种来源的社会网络数据
- 将关系数据转换为网络格式
- 清洗和验证网络数据
- 构建邻接矩阵或边列表
- 整合多个数据源到网络格式
- 为网络分析准备数据
- 处理多重或多元网络数据
- 将调查或访谈数据转换为网络格式
快速开始
当用户请求网络数据处理时:
- 识别数据源类型(调查、访谈、观察、数字痕迹)
- 提取原始数据中的关系信息
- 清洗并验证提取的关系
- 格式化为标准网络表示
- 验证网络数据质量和完整性
核心流程
第一阶段:数据源识别
- 识别数据源类型(问卷、访谈、观察、数字痕迹)
- 评估数据结构和组织方式
- 确定适当的处理管道
- 识别潜在的数据质量问题
- 制定提取策略
第二阶段:关系数据提取
- 从问卷数据中提取关系
- 从访谈记录中解析关系
- 从观察记录中编码关系
- 从数字痕迹中挖掘关系
- 处理多种关系类型
第三阶段:数据清洗和验证
- 识别并处理缺失值
- 检测并解决数据不一致
- 验证关系数据准确性
- 标准化数据格式和表示
- 检查数据完整性
第四阶段:网络矩阵构建
- 创建带有适当标识符的节点列表
- 构建邻接矩阵(二元、加权、有向)
- 处理不同网络类型(单模、多模)
- 处理节点和边属性
- 创建标准化网络格式
第五阶段:属性整合
- 整合节点属性(人口统计、特征)
- 处理边属性(强度、类型、持续时间)
- 为动态网络处理时间属性
- 验证属性数据一致性
- 将属性映射到网络结构
第六阶段:质量保证
- 验证网络数据完整性
- 检查数据准确性和一致性
- 评估数据收集中的潜在偏差
- 验证网络构建程序
- 记录数据处理决策
第七阶段:输出生成
- 生成标准化网络数据文件
- 创建数据质量报告
- 生成网络统计和指标
- 记录处理程序
- 提供分析建议
输出格式
{
"summary": {
"nodes_count": 50,
"edges_count": 120,
"data_sources": ["survey", "interview"],
"network_type": "weighted-directed",
"completeness_score": 0.85
},
"details": {
"nodes": [...],
"edges": [...],
"attributes": {...},
"quality_report": {...}
},
"metadata": {
"timestamp": "2025-12-21T10:30:00",
"version": "1.0.0"
}
}
质量标准
- 应用系统化数据处理程序
- 在整个处理过程中维护数据完整性
- 验证关系提取的准确性
- 记录所有处理步骤和决策
- 考虑中国网络数据的文化背景
深入学习
- 社会网络数据处理文献
- 数据清洗和验证指南
- 中国语境下的网络数据处理示例
- 网络数据处理软件工具
完成标志
完成高质量的网络数据处理应包括:
- 生成标准化网络数据文件
- 创建数据质量评估报告
- 生成关系提取文档
- 提供网络统计和基本指标
- 记录处理程序文档
此技能为中文社会科学网络研究提供全面的数据处理支持,确保从原始数据到标准化网络文件的准确转换。