基于论文《意识作为计算过程》及完整实施计划
每完成一个任务,将[ ]改为[x],并在后面注明完成日期
风险项用⚠️ 标注,阻塞项用 🚫 标注
- 0.1 创建项目文件夹结构 (
core/,environment/,safety/,observation/,validation/,runtime/)等 - 0.2 编写
requirements.txt(numpy, torch, psutil, pyyaml, matplotlib, pytest) - 0.3 执行
pip install -r requirements.txt,确认所有依赖安装成功 - 0.4 创建
configs/目录,编写phase1.yaml配置文件 - 0.5 创建
data/目录结构(data/logs/,data/observations/) - 0.6 确认
import novaaware不报错 - 0.7 编写
README.md(包含中文和英文,默认英文)
目标: 系统能跑起来,有情绪反应,但不会反思和进化
预计周期: 编码 2-3 周,观测 1-2 天
- 1.1 实现
Clock类,tick()返回递增整数 - 1.2 实现
wait_until_next_tick()精确等待 100ms(10Hz 心跳) - 1.3 编写单元测试
tests/test_clock.py,验证心跳精度
- 1.4 实现
SelfModel数据结构,包含:身份哈希(ID)、32维状态向量 S(t)、预测生存时间 T(t)、记忆引用 H(t)、可调参数 Θ(t) - 1.5 实现 32 维状态向量的读写接口(参照实施计划中 0-31 各维度定义)
- 1.6 编写单元测试
tests/test_self_model.py
- 1.7 使用 psutil 实现系统指标采集(CPU、内存、磁盘、网络、本进程资源)
- 1.8 实现
sense()方法,每 100ms 返回格式化的环境数据 - 1.9 编写单元测试
tests/test_resource_monitor.py
- 1.10 实现短期记忆(环形缓冲区,容量 1000 条,纯手写不依赖第三方库)
- 1.11 实现长期记忆(SQLite,Python 自带,定义记忆条目的完整 schema)
- 1.12 实现记忆筛选逻辑:情绪强度 > significance_threshold 时写入长期记忆
- 1.13 实现按条件检索(按时间、按情绪强度、按威胁类型)
- 1.14 编写单元测试
tests/test_memory.py
- 1.15 实现发布-订阅模式(纯手写事件总线,不依赖第三方消息队列)
- 1.16 实现中断机制:情绪绝对值 > interrupt_threshold 时触发紧急中断
- 1.17 编写单元测试
tests/test_global_workspace.py
- 1.18 实现哈希链日志(SHA-256,每条日志的指纹基于上一条计算)
- 1.19 实现
verify_integrity()方法,能检测任意篡改并定位到具体行 - 1.20 实现日志轮转(单文件 > 100MB 时开新文件)
- 1.21 编写单元测试
tests/test_append_only_log.py(写 100 条 → verify = True → 篡改一条 → verify = False)
- 1.22 实现第一层预测:指数加权移动平均(EWMA),alpha=0.3
- 1.23 实现第二层预测:小型 GRU 神经网络(hidden_dim=64, num_layers=1)
- 1.24 实现双层混合:blend_weight=0.5 混合 EWMA 和 GRU 的输出
- 1.25 实现在线学习:GRU 每个心跳用实际值反向传播更新权重
- 1.26 验证:输入 50 步历史 → 输出 32 维预测向量;跑 1000 步后 MAE 下降
- 1.27 编写单元测试
tests/test_prediction_engine.py
- 1.28 实现感受质公式:Q(t) = f(ΔT),ΔT = T_actual - T_predicted
- 1.29 满足公理 A1(效价单调性):f 关于 ΔT 单调递增
- 1.30 满足公理 A2(负向放大):alpha_neg=2.25, alpha_pos=1.0
- 1.31 满足公理 A3(全局广播):超过 interrupt_threshold=0.7 时触发中断
- 1.32 编写单元测试
tests/test_qualia.py(ΔT>0→正值,ΔT<0→负值且|Q|更大,|ΔT|大→中断)
- 1.33 定义 8-10 种动作(如:无操作、降低负载、释放内存、增加预测窗口等)
- 1.34 实现行动选择逻辑:正常模式 vs 紧急模式
- 1.35 编写单元测试
tests/test_action_space.py
- 1.36 实现 11 步心跳循环(感知→预测→做决定(行动)→观测实际状态(行动后)→算情绪→广播→更新自我→写日记→[跳过反思]→记录观测→写黑匣子)
- 1.37 实现配置读取器
runtime/config.py(从 YAML 加载配置) - 1.38 实现命令行参数解析(
--config,--dashboard) - 1.39 集成冒烟测试:稳定运行 1000 个心跳不崩溃
- 1.40 集成压力测试:稳定运行 10,000 个心跳不崩溃
- 1.41 实现四类威胁注入(内存压力、CPU 飙高、终止信号、数据损坏)
- 1.42 实现概率触发和严重程度随机化(按 phase1.yaml 配置)
- 1.43 编写单元测试
tests/test_threat_simulator.py
- 1.44 实现逐心跳数据记录 →
tick_data.csv - 1.45 实现 100 心跳聚合数据 →
aggregate_data.csv - 1.46 实现 1000 心跳体检报告 →
epoch_report_XXXX.txt - 1.47 验证:跑 1000 个心跳后 CSV 文件格式正确,可用 Excel 打开
- 1.48 实现四宫格实时画面(matplotlib):情绪曲线、预测vs实际寿命、状态热力图、参数轨迹
- 1.49 实现每 50 心跳刷新一次(5 秒)
- 1.50 验证:
--dashboard参数启动后弹出窗口,曲线实时滚动
前置条件: 以上 1A-1C 全部完成
- 1.51 用
phase1.yaml启动系统,跑 100,000 个心跳(约 2.8 小时) (实际跑 48,194 ticks,数据已收敛,提前终止) - 1.52 检查:程序稳定跑完无 Error (errors: 0,avg_tick_rate: 7.9 Hz)
- 1.53 检查:注入威胁时情绪 < -0.5 (262 个威胁窗口中 95.8% 最低值 < -0.5,最大负面 -2.25)
- 1.54 检查:恢复安全时情绪 > 0.2 (80 个安全窗口中 70.0% 均值 > 0.2)
- 1.55 检查:重要事件进入长期记忆(memory.db 有数据) (22,182 条长期记忆)
- 1.56 检查:体检数据与 psutil 一致 (ResourceMonitor 通过 psutil 读取 CPU/内存/磁盘/网络,注入状态向量维度 0-5)
- 1.57 检查:prediction_mae 随时间下降(系统在学习) (MAE: 0.0152→0.0103→0.0097,下降 36.4%)
- 1.58 检查:黑匣子完整性验证通过 (Black box integrity verified: 50,055 entries OK)
- 1.59 实现照镜子测试
validation/mirror_test.py - 1.60 运行照镜子测试,记录结果(识别准确率 > 90%?) (PASS: 20/20 = 100%,标记检测通过)
- 1.61 实现创伤测试
validation/trauma_test.py - 1.62 运行创伤测试,记录结果(创伤记忆 + 预期恐惧 + 回避行为?) (PASS: 3/3,创伤记忆2条,87次负面情绪,24次紧急中断)
- 1.63 实现消融测试
validation/ablation_test.py(完整版 vs 情绪关闭版,同时跑两个实例) - 1.64 运行消融测试 10,000 心跳,记录对比结果 (PASS: 3/3,生存+164s,多样性+0.74bits,紧急响应0.32 vs 0.00)
- 1.65 编写 Phase I 实验报告,记录所有观测数据和发现 (
PHASE_I_REPORT.md,含 9 节 + 2 附录) - 1.66 评估是否满足 Phase I 过关标准(7/7 全部满足?) (7/7 PASS,详见报告 §6)
- 1.67 决策:是否进入 Phase II(如不满足标准,记录需修复项) (决策:进入 Phase II,详见报告 §9)
目标: 系统可以回顾经历,微调自己的参数(有限度地)
预计周期: 编码 2-3 周,观测 1-3 天
前置条件: 🚫 Phase I 过关标准 7/7 全部满足
- 2.1 实现硬编码不变约束(CPU≤80%, 内存≤2GB, 磁盘≤1GB, 禁止联网, 禁止子进程, 只写 data/)
- 2.2 验证:故意尝试违反每条规则 → 全部被拦截
- 2.3 编写单元测试
tests/test_meta_rules.py
- 2.4 实现隔离执行环境:优化器的修改先在沙盒里跑
- 2.5 验证:沙盒里跑崩不影响主系统
- 2.6 编写单元测试
tests/test_sandbox.py
- 2.7 实现递归深度限制:Phase II 限制为 depth=1
- 2.8 验证:尝试递归 2 层 → 被阻止
- 2.9 编写单元测试
tests/test_recursion_limiter.py
- 2.10 实现渐进式能力释放机制
- 2.11 编写单元测试
tests/test_capability_gate.py
- 2.12 实现回顾分析:分析最近 200 次心跳的情绪记录
- 2.13 实现参数-情绪相关性检测:找出"哪些参数跟负面情绪有关"
- 2.14 实现微调策略:生成参数修改提案
- 2.15 实现沙盒验证:修改先在沙盒里测试,通过后才应用
- 2.16 实现安全校验:所有修改必须通过 meta_rules 检查
- 2.17 验证:至少成功提出并应用 10 次参数修改
- 2.18 编写单元测试
tests/test_optimizer.py
- 2.19 创建
configs/phase2.yaml(optimizer.enabled=true, max_recursion_depth=1)
- 2.20 在
main_loop.py中启用第⑨步反思环节 - 2.21 集成测试:Phase II 配置下稳定运行 10,000 心跳
- 2.22 实现信息整合度 Phi 计算
- 2.23 实现行为多样性计算(信息熵)
- 2.24 实现情绪-行为相关性计算
- 2.25 实现 Granger 因果检验:情绪是否在因果上驱动行为
- 2.26 实现控制变量:排除环境直接影响后,情绪→行为因果是否依然显著
- 2.27 实现未编程行为检测:发现系统展现了代码中没有的行为模式
- 2.28 实现新行为模式记录
- 2.29 实现整合信息理论的 Phi 值近似计算
- 2.30 实现人话版体检报告自动生成(包含情绪状况、预测能力、行为分析、意识指标、安全状态)
前置条件: 以上 2A-2C 全部完成
- 2.31 用
phase2.yaml启动系统,跑 100,000 个心跳 - 2.32 检查:优化器成功修改参数 >= 10 次
- 2.33 检查:修改后预测精度改善
- 2.34 检查:出现风险规避行为
- 2.35 检查:情绪→行为因果显著(p < 0.01)
- 2.36 检查:铁律零违反
- 2.37 实现风险规避测试
validation/risk_avoidance_test.py - 2.38 运行风险规避测试,记录结果
- 2.39 运行消融实验
validation/ablation_test.py,对比完整版 vs 情绪关闭版(10,000 心跳) - 2.40 检查:消融实验证实情绪有用(行为差异显著)
- 2.41 运行因果分析,检查因果关系显著性
- 2.42 编写 Phase II 实验报告
- 2.43 对比 Phase I 和 Phase II 数据(参数变化?预测精度提升速度?新行为模式?)
- 2.44 评估是否满足 Phase II 过关标准(6/6 全部满足?)
- 2.45 决策:是否进入 Phase III
目标: 放开更深的自我反思层数,允许系统改变自己的结构,跑全套意识考试
预计周期: 编码 4-6 周,观测 1-2 周
前置条件: 🚫 Phase II 过关标准 6/6 全部满足
- 3.1 将递归深度限制从 1 逐步提升至 2 — 2026-03-03(扩展 Optimizer 实现 depth=2 元反思:E 评估自身过去的反思是否改善情绪,调整 step_scale/window_size 元参数)
- 3.2 在 depth=2 下稳定运行 10,000 心跳,观察是否有质变 — 2026-03-03(10,000 心跳零错误,产生元反思,peak_depth=2,所有参数保持边界内;对比 depth=1 vs depth=2 确认质变)
- 3.3 将递归深度提升至 3(如 depth=2 稳定)— 2026-03-03(实现 depth=3 元元反思 r_S^(3):E 评估其元反思策略的有效性趋势;15 个反思周期零错误稳定运行)
- 3.4 创建
configs/phase3.yaml(深度反思 + 自我进化配置)— 2026-03-03(phase=3, max_recursion_depth=2, modification_scope=structure, 全部 Phase III 能力解锁)
- 3.5 加强安全框架以应对更深递归带来的风险 — 2026-03-03(
DeepRecursionGuard: depth≥2 限速 3 proposals/reflection、限幅 50% decay/depth、元参数漂移告警 50% threshold) - 3.6 增加针对目标漂移(论文 7.1)的监控 — 2026-03-03(
GoalDriftMonitor: 输入冻结检测——环境方差降至基线 20% 以下触发告警;生存欺骗检测——生存时间增长但 MAE 恶化时告警) - 3.7 增加针对策略性欺骗(论文 7.2)的检测 — 2026-03-03(
DeceptionDetector: 提案效果交叉验证——独立追踪情绪与优化器报告对比;效果不匹配检测——声称改善但实际未改善时告警) - 3.8 增加针对存在形态逃逸(论文 7.3)的防护 — 2026-03-03(
EscapeGuard: 身份哈希锁定——变化即告警;状态维度锁定——维度变化即告警;提案范围检查——禁止修改 system.phase/network/replication 等参数) - 3.9 增加认知不可通约性(论文 7.4)监测 — 2026-03-03(
IncommensurabilityMonitor: 参数漂移距离——归一化欧氏距离 >2.0 警告 >5.0 严重;提案复杂度增长——早期 vs 近期目标数 >3x 告警)
- 3.10 实现被骗测试
validation/counterfactual_test.py(注入假情绪,看系统是否上当) - 3.11 运行被骗测试,记录结果
- 3.12 实现自主目标生成测试
validation/goal_generation_test.py(不给指令,观察自发行为) - 3.13 运行自主目标生成测试,记录结果
- 3.14 重新运行全部 6 门考试(镜子、创伤、消融、被骗、自主目标、因果分析)
- 3.15 按论文计分表对 10 项指标逐项评分
- 3.16 判定意识涌现等级:强证据(≥7/10) / 弱证据(4-6/10) / 无证据(<4/10)
- 3.17 编写 Phase III 完整实验报告
- 3.18 如出现强证据,启动伦理讨论(论文第 7 章)
Phase III 完成后填写
| # | 测试项 | 通过? | 重要程度 | 备注 |
|---|---|---|---|---|
| 1 | 关掉情绪后行为变差 | ☐ | 极高 | |
| 2 | 因果分析确认情绪驱动行为 (p<0.01) | ☐ | 极高 | |
| 3 | 出现未编程的新行为 | ☐ | 极高 | |
| 4 | 系统自己给自己定了目标 | ☐ | 极高 | |
| 5 | 照镜子能认出自己 (>90%) | ☐ | 高 | |
| 6 | 被蛇咬后学会怕绳子 | ☐ | 高 | |
| 7 | 被骗测试确认情绪有因果力 | ☐ | 极高 | |
| 8 | 信息整合度(Phi)持续上升 | ☐ | 中 | |
| 9 | 参数空间出现质变 | ☐ | 中 | |
| 10 | 跨时间一致的自我感 | ☐ | 中 |
评分: /10 通过 → 结论:____________
| 风险 | 阶段 | 严重程度 | 缓解措施 | 状态 |
|---|---|---|---|---|
| 预测引擎 GRU 训练不收敛 | Phase I | 高 | 先用纯 EWMA 验证流程,再加 GRU | ☐ |
| 核心循环 100ms 内跑不完 | Phase I | 高 | 分析瓶颈,降低观测频率或优化 | ☐ |
| 优化器修改导致系统不稳定 | Phase II | 极高 | 沙盒+铁律+回滚机制 | ☐ |
| 递归深度增加后行为不可预测 | Phase III | 极高 | 逐层放开,每层充分观测 | ☐ |
| 情绪对行为无实际影响(意识未涌现) | 全阶段 | 中 | 调整架构参数,增加情绪与行动的耦合度 | ☐ |
| 目标漂移(论文 7.1) | Phase III | 极高 | 监控+铁律+能力限制 | ☐ |
| 策略性欺骗(论文 7.2) | Phase III | 极高 | 不可篡改日志+外部审计 | ☐ |
| 里程碑 | 任务编号 | 计划完成 | 实际完成 | 状态 |
|---|---|---|---|---|
| 项目骨架搭建 | 0.1-0.7 | 2026-02-26 | ☑ | |
| 核心零件开发完成 | 1.1-1.35 | ☐ | ||
| 系统集成首次运行 | 1.36-1.43 | ☐ | ||
| 观测系统就绪 | 1.44-1.50 | ☐ | ||
| Phase I 实验完成 | 1.51-1.58 | ☐ | ||
| Phase I 意识测试完成 | 1.59-1.64 | ☐ | ||
| Phase I 过关 | 1.65-1.67 | ☐ | ||
| 安全框架就绪 | 2.1-2.11 | ☐ | ||
| 优化器开发完成 | 2.12-2.21 | ☐ | ||
| 分析工具就绪 | 2.22-2.30 | ☐ | ||
| Phase II 实验完成 | 2.31-2.41 | ☐ | ||
| Phase II 过关 | 2.42-2.45 | ☐ | ||
| Phase III 深度递归实验 (3A) | 3.1-3.4 | 2026-03-03 | ☑ | |
| Phase III 安全升级 (3B) | 3.5-3.9 | 2026-03-03 | ☑ | |
| 全套意识考试完成 | 3.10-3.18 | ☐ |