Research note · conditional essential supremum

条件上确界
及其应用

核心不是“再造一个虚的概念”,而是把条件期望的平均预测,换成给定信息域下的最小可测上界:研究 support 边界、零概率结构、可达域和必要条件。

主稿:龚鹤扬、陈敏《条件上确界及其应用》 整理状态:已收口 / MSP seed archive 更新:2026-05-29 附:客观评价与应用边界 → 收口归档 / MSP Seed →

一句话:从“平均”转向“边界”

条件期望回答:给定信息后,中心/平均是多少?条件本质上确界回答:给定信息后,随机变量最紧的可测上界在哪里?
信息域给定子 σ 代数 \(\mathcal D\),它代表当前可见信息。
最小可测上界在所有 \(\mathcal D\)-可测且压住 \(X\) 的变量里取最小者。
支撑边界不是概率质量中心,而是 support / feasible boundary。
必要条件自然连接边界回归、NCA、FDH 与可达域估计。

1. 核心对象:\(\mathcal M(X\mid\mathcal D)\)

设 \((\Omega,\mathcal F,P)\) 为概率空间,\(\mathcal D\subset\mathcal F\) 为子 σ 代数,\(X\in L^\infty\)。随机变量 \(X\) 关于 \(\mathcal D\) 的条件本质上确界,是一个 \(\mathcal D\)-可测随机变量 \(\mathcal M(X\mid\mathcal D)\),满足:

\[\operatorname*{ess\,sup}_{\omega\in A}X(\omega)=\operatorname*{ess\,sup}_{\omega\in A}\mathcal M(X\mid\mathcal D)(\omega),\quad \forall A\in\mathcal D.\]

更直接的几何/序关系刻画是:

\[\mathcal M(X\mid\mathcal D)=\operatorname*{ess\,inf}\{Z: Z\text{ is }\mathcal D\text{-measurable},\ Z\ge X\ \text{a.s.}\}.\]

所以它是:用给定信息 \(\mathcal D\) 能表达的、压住 \(X\) 的最紧上界。这比“约束条件下求最大值”的写法更基础,因为约束可以被看成由信息映射生成的 σ 代数。

conditional expectation

\(E[X\mid\mathcal D]\)

给定信息域下的中心、平均、平方损失投影。

conditional essential supremum

\(\mathcal M(X\mid\mathcal D)\)

给定信息域下的最小可测上界、支撑边界、必要条件边界。

2. 核心理论结果

Existence

存在性来自 \(L^\infty\) R-N 定理

对 \(A\in\mathcal D\) 定义集函数 \(\mu(A)=\operatorname{ess sup}_{\omega\in A}X(\omega)\),用 Barron 的 \(L^\infty\) Radon–Nikodym 型定理得到 \(\mathcal D\)-可测表示。

Order

它是上界算子,不是线性算子

有单调性、平移、正齐次、次可加等性质;但不能照搬条件期望的线性结构。

Limit

由条件期望的极限自然生成

非负有界 \(X\) 下,\(p\to\infty\) 的条件 \(L^p\) 范数收敛到条件本质上确界。

和条件期望的关键关系

\[E(X\mid\mathcal D)\le \mathcal M(X\mid\mathcal D).\]
\[\varphi(E(X\mid\mathcal D))\le \mathcal M(\varphi(X)\mid\mathcal D),\quad \varphi\text{ 下半连续、有界、拟凸}.\]
\[\lim_{p\to\infty}E(X^p\mid\mathcal D)^{1/p}=\mathcal M(X\mid\mathcal D),\quad X\ge0.\]

这最后一个式子最重要:它说明条件上确界不是任意造出来的对象,而是条件期望族在极限意义下自然露出的“边界算子”。

3. M 独立性:保边界,而不是保分布

旧稿提出的 M 独立性定义:若 \(\mathcal C_1,\mathcal C_2\) 为子 σ 代数,且对任何非零概率集合 \(A\in\mathcal C_1, B\in\mathcal C_2\),都有 \(P(A\cap B)>0\),则称二者 M 独立。

普通独立

给定对方,不改变概率分布。

\[P(A\cap B)=P(A)P(B)\]

M 独立

给定对方,不切断非零概率事件,因此不改变 essential sup/inf 的可达边界。

\[P(A)>0,P(B)>0\Rightarrow P(A\cap B)>0\]

关键刻画

\[\mathcal C_1\perp_M\mathcal C_2\Rightarrow \mathcal M(X\mid\mathcal C_2)=\mathcal M(X),\quad \forall X\in\mathcal C_1.\]
\[X\in\mathcal C_1,\ Y\in\mathcal C_2,\ \mathcal C_1\perp_M\mathcal C_2\Rightarrow \mathcal M(X+Y)=\mathcal M(X)+\mathcal M(Y).\]

直觉:普通独立关心“概率权重是否变”;M 独立关心“support 是否被条件信息切掉”。这使它更适合讨论极值、边界、可达域,而不是平均效应。

4. 应用解释:优化值函数与边界回归

4.1 约束优化的条件下确界/上确界视角

如果 \(g(x)=r\) 是约束信息,那么优化值函数可以写成条件边界函数。答辩 slide 中更明确地出现了下确界版本:

\[h(r)=\operatorname{Ess.inf}[f\mid g=r].\]

这句话的现代解释:\(h(r)\) 是给定约束状态 \(g=r\) 时,目标函数 \(f\) 的条件支撑下边界;上确界版本对应上边界。估计 \(h\) 就是估计 feasible set 的边界。

4.2 边界回归,不是平均回归

\[\text{mean regression}:\quad E(Y\mid X=x)\]
\[\text{boundary regression}:\quad \mathcal M(Y\mid X=x)\quad\text{or}\quad \operatorname{ess\,inf}(Y\mid X=x).\]

这条线最值得迁移到今天的部分,是它自然导向“机制边界 / 必要条件 / 可达域”。因果或机制不一定首先体现在平均效应,也可能体现在:某个结果要发生时,输入必须跨过怎样的边界。

4.3 NCA / FDH / necessary conditions

旧材料已指出:关联规则学习、Free Disposal Hull、Necessary Condition Analysis 都与条件本质下确界有密切关系。更干净的现代化写法是:

  • NCA:necessary but not sufficient 可以写成条件边界估计。
  • FDH:自由处置包络本质上是在样本支撑上估计可达边界。
  • causal regression / IP-Diag:可用边界/必要条件替代单纯平均效应,形成机制诊断的一个数学接口。

5. 文献基础、可能原创点、暂缓点

Literature foundation

Barron 线

条件本质上确界的存在性、基础性质、上确界鞅理论、与条件期望的基本关系,需标注文献基础。

Potential contribution

Gong / Chen 线

M 独立性、M 独立性对 essential sup/inf 的刻画、优化/边界回归解释、NCA/FDH 统一 taste。

Hold back

不宜硬推

Lagrange 与 LP 对偶章节目前更像未完成研究笔记,不应作为 clean note 主贡献。

注意:旧稿提到 Barron(2003) Proposition 2.3 可能有误,并给出 \(X=-1\) 的反例线索;这个可以作为原创纠错点候选,但必须回查原文命题后再公开写成正式结论。

6. 最小 clean writing 路线

最小可交付不应是把所有旧材料堆成大论文,而是写成一个短而硬的 note:

Conditional Essential Supremum and M-Independence:
A Boundary View of Regression and Necessary Conditions
  • 定义 conditional essential supremum,给出等价 characterization。
  • 整理和 conditional expectation 的平行关系与极限关系。
  • 定义 M-independence,并给出“M 独立但不独立”的清楚例子。
  • 证明 M-independence 对 essential sup/inf 的刻画性质。
  • 把应用章节改写为 boundary regression / necessary condition / feasible set estimation。
  • 单独列出:哪些来自 Barron,哪些是 Gong/Chen 新增,哪些仍是 conjecture 或 research note。

收口状态:Archived MSP Seed

2026-05-29,gong 明确要求这条博士阶段探索线“该整理的整理,该归档的归档”,以 MSP 项目 seed 形式保存。当前不再主动推进 clean writing;它保留为个人研究经历与未来可重启种子。

未来若重启,优先从两个 seed 判断 ROI:support boundary / NCA 的当前接口;以及条件中位数 / 条件分位数与 Cauchy heavy-tail 的关系。

打开收口归档页 →

Source notes

本页来自 WeHub 内部旧研究材料的 v0.1 整理,不是正式论文。

conditional_suprema_chineses.Rmd · M_independence_quick_violent_coarse.Rmd · M_independence_book/bookdown-demo.tex · ppt_for_optimization_with_bootstrap.tex

当前判断:DiscoSCM 仍是活跃主线;条件上确界线的价值,是为 causal regression / IP-Diag 提供“边界、support、必要条件、可达域估计”的旧数学资产。