二分类问题泛化误差上界的详细证明
定理描述 对二分类问题,当假设空间是有限个函数的集合 \(\mathcal{F}=\{f_1,f_2,\cdots,f_d\}\) 时,对任意一个函数 \(f\in\mathcal{F}\) ,至少以概率 \(1-\delta\) 使得以下不等式成立: \(R(f)\leq\hat{R}(f)+\epsilon(d,N,\delta)\) 其中, \(\epsilon(d,N,\delta)=\sqrt{\frac{1}{2N}(\log d+\log\frac{1}{\delta})}\) 证明该公式需要用到 \(Hoeffding\) 定理 \(Hoeffding\) 不等式 假设 \(X_1,X_2,\cdots,X_n\) 是独立随机变量,满足 \(P(X_i\in[a_i,b_i])=1,1\leq i\leq n\) ,令 \(S_n=\sum_{i=1}^{n}X_i\) ,则对任意的 \(t>0\) ,以下不等式成立: \[\begin{align} P(S_n-E[S_n]\geq t)\leq &\exp(\frac{-2t^2}{\sum_{i=1}^n(b_i-a_i)^2})\\ P(E[S_n]-S_n\geq t)\leq &\exp(\frac{-2t^2}{\sum_{i=1}^n(b_i-a_i)^2}) \end{align} \] \