一句话:从“平均”转向“边界”
1. 核心对象:\(\mathcal M(X\mid\mathcal D)\)
设 \((\Omega,\mathcal F,P)\) 为概率空间,\(\mathcal D\subset\mathcal F\) 为子 σ 代数,\(X\in L^\infty\)。随机变量 \(X\) 关于 \(\mathcal D\) 的条件本质上确界,是一个 \(\mathcal D\)-可测随机变量 \(\mathcal M(X\mid\mathcal D)\),满足:
更直接的几何/序关系刻画是:
所以它是:用给定信息 \(\mathcal D\) 能表达的、压住 \(X\) 的最紧上界。这比“约束条件下求最大值”的写法更基础,因为约束可以被看成由信息映射生成的 σ 代数。
\(E[X\mid\mathcal D]\)
给定信息域下的中心、平均、平方损失投影。
\(\mathcal M(X\mid\mathcal D)\)
给定信息域下的最小可测上界、支撑边界、必要条件边界。
2. 核心理论结果
存在性来自 \(L^\infty\) R-N 定理
对 \(A\in\mathcal D\) 定义集函数 \(\mu(A)=\operatorname{ess sup}_{\omega\in A}X(\omega)\),用 Barron 的 \(L^\infty\) Radon–Nikodym 型定理得到 \(\mathcal D\)-可测表示。
它是上界算子,不是线性算子
有单调性、平移、正齐次、次可加等性质;但不能照搬条件期望的线性结构。
由条件期望的极限自然生成
非负有界 \(X\) 下,\(p\to\infty\) 的条件 \(L^p\) 范数收敛到条件本质上确界。
和条件期望的关键关系
这最后一个式子最重要:它说明条件上确界不是任意造出来的对象,而是条件期望族在极限意义下自然露出的“边界算子”。
3. M 独立性:保边界,而不是保分布
旧稿提出的 M 独立性定义:若 \(\mathcal C_1,\mathcal C_2\) 为子 σ 代数,且对任何非零概率集合 \(A\in\mathcal C_1, B\in\mathcal C_2\),都有 \(P(A\cap B)>0\),则称二者 M 独立。
普通独立
给定对方,不改变概率分布。
M 独立
给定对方,不切断非零概率事件,因此不改变 essential sup/inf 的可达边界。
关键刻画
直觉:普通独立关心“概率权重是否变”;M 独立关心“support 是否被条件信息切掉”。这使它更适合讨论极值、边界、可达域,而不是平均效应。
4. 应用解释:优化值函数与边界回归
4.1 约束优化的条件下确界/上确界视角
如果 \(g(x)=r\) 是约束信息,那么优化值函数可以写成条件边界函数。答辩 slide 中更明确地出现了下确界版本:
这句话的现代解释:\(h(r)\) 是给定约束状态 \(g=r\) 时,目标函数 \(f\) 的条件支撑下边界;上确界版本对应上边界。估计 \(h\) 就是估计 feasible set 的边界。
4.2 边界回归,不是平均回归
这条线最值得迁移到今天的部分,是它自然导向“机制边界 / 必要条件 / 可达域”。因果或机制不一定首先体现在平均效应,也可能体现在:某个结果要发生时,输入必须跨过怎样的边界。
4.3 NCA / FDH / necessary conditions
旧材料已指出:关联规则学习、Free Disposal Hull、Necessary Condition Analysis 都与条件本质下确界有密切关系。更干净的现代化写法是:
- NCA:necessary but not sufficient 可以写成条件边界估计。
- FDH:自由处置包络本质上是在样本支撑上估计可达边界。
- causal regression / IP-Diag:可用边界/必要条件替代单纯平均效应,形成机制诊断的一个数学接口。
5. 文献基础、可能原创点、暂缓点
Barron 线
条件本质上确界的存在性、基础性质、上确界鞅理论、与条件期望的基本关系,需标注文献基础。
Gong / Chen 线
M 独立性、M 独立性对 essential sup/inf 的刻画、优化/边界回归解释、NCA/FDH 统一 taste。
不宜硬推
Lagrange 与 LP 对偶章节目前更像未完成研究笔记,不应作为 clean note 主贡献。
注意:旧稿提到 Barron(2003) Proposition 2.3 可能有误,并给出 \(X=-1\) 的反例线索;这个可以作为原创纠错点候选,但必须回查原文命题后再公开写成正式结论。
6. 最小 clean writing 路线
最小可交付不应是把所有旧材料堆成大论文,而是写成一个短而硬的 note:
A Boundary View of Regression and Necessary Conditions
- 定义 conditional essential supremum,给出等价 characterization。
- 整理和 conditional expectation 的平行关系与极限关系。
- 定义 M-independence,并给出“M 独立但不独立”的清楚例子。
- 证明 M-independence 对 essential sup/inf 的刻画性质。
- 把应用章节改写为 boundary regression / necessary condition / feasible set estimation。
- 单独列出:哪些来自 Barron,哪些是 Gong/Chen 新增,哪些仍是 conjecture 或 research note。
附加页:客观评价与应用边界
这份整理页记录理论骨架;另有一个单独页面保存更冷静的价值判断:它不是条件期望的同等级通用替代物,而是 support boundary / necessary condition / frontier estimation 的专用语言。
收口状态:Archived MSP Seed
2026-05-29,gong 明确要求这条博士阶段探索线“该整理的整理,该归档的归档”,以 MSP 项目 seed 形式保存。当前不再主动推进 clean writing;它保留为个人研究经历与未来可重启种子。
Source notes
本页来自 WeHub 内部旧研究材料的 v0.1 整理,不是正式论文。
conditional_suprema_chineses.Rmd · M_independence_quick_violent_coarse.Rmd · M_independence_book/bookdown-demo.tex · ppt_for_optimization_with_bootstrap.tex
当前判断:DiscoSCM 仍是活跃主线;条件上确界线的价值,是为 causal regression / IP-Diag 提供“边界、support、必要条件、可达域估计”的旧数学资产。
