Gate A · Cauchy math contract ✅
新增 evidence/gate_a_cauchy_math/verify_cauchy_math.py,验证 Cauchy 线性稳定性、采样中位数/IQR、OvR probability 与 Cauchy NLL finite gradients;结果写入 results.json。
把 Qwen backbone 作为 FeatureNetwork,从输入 $x$ 溯因推断个体因果表征 $P(U|x)$,再由 ActionNetwork 统一驱动 token decision 与数值预测;本轮补清了动机、预训练继承/防遗忘设计和核心公式,并补上 Gate A/B 的最小可运行证据。
当前已整理出 MSP 风格论文 v0.1、公开 review surface,并完成两项 toy/contract-level runnable evidence:Cauchy 数学契约与 fake-h(x) <NUM> gated proof。但还不能说 CausalQwen 已经 outperform Qwen,也不能把旧实验报告当作已复现结果。防灾难性遗忘目前仍只能写成“预训练继承 + Top-K 对齐 + anchor drift gate”的设计机制,不能写成已证明效果。
新增 evidence/gate_a_cauchy_math/verify_cauchy_math.py,验证 Cauchy 线性稳定性、采样中位数/IQR、OvR probability 与 Cauchy NLL finite gradients;结果写入 results.json。
新增 evidence/gate_b_fake_hx_num_gate/fake_hx_num_gate_proof.py;不加载 Qwen 权重,只验证 Abduction→Action、分类、<NUM> gated Cauchy regression 和非数值样本零回归梯度。
新增 evidence/gate_c_qwen_inheritance_anchor_drift/gate_c_minimal_spec.py 与 anchor prompts;metric smoke test 通过,但当前环境缺 transformers 与本地 Qwen2.5 权重,真实 Qwen logits 对齐尚未执行。
这把 CausalQwen 从纯 E2 设计推进到“E2 + toy/contract runnable evidence”。仍不能升级为完整实验复现、性能 claim 或防遗忘已证明。
标准 LLM 学的是 $P(y_t\mid x,y_{\lt t})$;CausalQwen 想显式引入个体因果表征 $U$,把生成重写为 $P(U\mid x)$ 后的行动机制 $Y=f(U,\epsilon)$。
目标不是丢掉 Qwen 的预训练知识,而是保留 Qwen FeatureNetwork,并用离线 teacher Top-K 对齐把新 causal heads 初始化到接近 Qwen 行为。
<NUM> 作为桥:同一个 $U$ 先判断是否输出数值,再通过 Cauchy NLL 回归数值。
所有强 claim 都要回到 runnable evidence:Cauchy math、fake-$h(x)$ proof、Qwen inheritance、anchor drift。
CausalQwen explores a causal-output layer for pretrained language models: a Qwen backbone extracts textual evidence, an abduction module infers a Cauchy posterior over individual causal representations, and a shared action module analytically maps this posterior to independent token decisions and numeric predictions.
内部 paper draft 已补充动机、防遗忘设计和公式:research-projects/causalqwen/paper/causalqwen-msp-paper-v0.1.md。网页是 review/projection;事实源仍在 CausalQwen MSP project root。
保留 Qwen embedding/transformer 作为 FeatureNetwork,先不让 causal heads 重学全部语言知识。
固定 Qwen teacher,存储 z_i、teacher Top-K tokens 和概率,用 L_align 对齐新头。
下一步用 anchor prompts 比较 teacher/student 更新前后的 Top-K drift,量化知识破坏边界。
未来可把 protected action/intervention distribution 的变化写成 L_mech,但必须实测。
| 研究线 | 给 CausalQwen 的作用 |
|---|---|
| DiscoSCM | 提供 individual-level U、非退化反事实与 distribution-consistency 的理论压力。 |
| Causal Regression | 把 U/abduction/mechanism split 转成更小的 robust prediction 验证线。 |
| CausalQwen | 把同一套压力推进到 LLM 的 text + number 输出机制中。 |
source bundle 已记录 29 个文件,总计 374,174 bytes,包括架构文档、核心数学框架、U deep dive、预训练对齐文档、prototype code 与 Cauchy 验证脚本。
Manifest: research-projects/causalqwen/source-bundle/manifest-v0.1.json
Cauchy 参数传播、Monte Carlo 稳定性、OvR probability 与 NLL gradient 已有 standalone artifact。
toy features 下分类准确率 0.93,<NUM> recall 1.0,数值 MAE 0.049,非数值回归梯度 0。
anchor drift 指标和 prompts 已定;当前缺 transformers + 本地 Qwen 权重,真实 teacher/student 对齐待运行。