摘要: 应用 投影寻踪回归技术,建立了流域年均含沙量的预测模型。用降雨量和年平均径流等4个因子建立的某流域平均含沙量的ppr预测结果的拟合合格率达100%,预留检验样本报准率为75%,表明ppr用于泥沙输移 规律 的预测 研究 是可行的。
关键词: 流域 输沙量 投影寻踪回归 预测
1 引言
我国是一个水土流失严重的国家。严重的水土流失给工农业生产和国民 经济 建设造成巨大危害。产沙量是反映水土流失的一个重要指标。而气象要素、地形、土质状况、植被系统及人类活动均对产沙量有重要的 影响 。国内外不少学者针对不同的地域特征,对流域的产沙机理,泥沙输移规律及其防治对策等进行了大量的研究 [1 , 2] ,但对诸多因子与产沙量之间的定量研究进行得较少。考虑到引起泥沙流失的诸多因子与产沙量之间的关系具有高维和非线性的特点,而传统的统计预报 方法 是采用“从某些假定出发,按照一定准则,找出最优拟合”这样一条途径,难以适应千变万化的客观世界,也就无法真正找出数据的内在规律。这种传统的预报方案往往是还原拟合较好,但预留实况检验的精度很差。近 20 年来,在统计学中提出了一条“审视数据,模拟,预报”称为探索性数据 分析 (eda) 新途径。本文正是采用基于这种新思路,应用投影寻踪回归技术 (ppr) ,建立流域产沙量的多因子预报模型。
2 ppr 原理及算法简介
投影寻踪是国际统计界 70 年代兴起的高新技术,是应用数学,统计学和 计算 机技术的交叉学科,属前沿领域。
pp 是用来分析和处理高维数据,尤其是来自非正态总体高维数据的一类新兴统计方法 [3] 。其基本思想是:利用计算机技术把高维数据通过某种组合投影到低维子空间上,寻找出能反映原高维数据 结构 或特征的投影,在低维上对数据 结构 进行分析,以达到分析研究高维数据的目的。
传统的诸多线性模型通常局限于正态分布,但多数实际 问题 却不呈线性,因此勉强用线性手段进行辩识和预报,很难取得好的效果。而 pp 与其它非参数法一样,它可用来解决某些非线性问题。它虽然是以数据线性投影为基础,但它寻找的是线性投影中的非线性 结构 。因此,它可用来解决一定程度的非线性问题。 ppr 模型如下:设 x=(x1::xp) 是一 p 维随机向量, y=f(x) 是一维随机变量,为了避免线性回归不能反映实际非线性情况的矛盾, ppr 采用一系列岭函数的和来逼近回归函数的方法,即
|
|
(1) |
式中 gm(z) 表示第 m 个岭函数, z=(
) 为岭函数的自变量,它是向量
在
方向上的投影,
也为某方向的 p 维向量, m 为岭函数的个数。
friedman 和 stuetzle 提出了实现 ppr 的 smart 多重平滑回归技术, smart 模型具有如下形式
|
|
(2) |
它实际上是采用分层分组迭代交替优化方法对式 (2) 中的参数α,β, mu 和岭函数 gm 寻优。实现步骤为
①给定一个初始模型;
②把数据投影到一个低维空间上,找出数据与现有模型相差最大的投影,这就表明在这个投影中含有现有模型中没有反映的 结构 ;
③把上述投影中所包含的 结构 并到现有模型上,得到改进了的新模型 ;
④再从这个新模型出发,重复以上步骤,直到数据与模型在任何投影空间都没有明显的差别为止。
模型的关键是最终估计出式 (1) 的参数:岭函数最优化项数 mu, 岭函数 gm ,系数α jm , β m 。其判别准则仍是:选择适当的参数组合,使式
|
|
( 3 ) |
具体作法是:把全体参数分成几组,除其中一组外,都给定一初值,然后对留下的一组参数寻优。得到结果后,把这一组参数的极值点作初值,另选一组参数在这一初值下寻优。多次重复直到参数收敛为止 , 即将α jm ,j=1,2 ………… p, β m 及岭函数 gm 划入一组, m=1,2, ……… m, 共有 m 组。固定其中的 m-1 组,而对这一组 ajm , β m,gm 优化求解。此时,又将其分成三个子组,分别固定其中的两个子组,对第 3 子组优化。然后重复这一过程,直到收敛为止,即 l2 不再减小为止。
用 smart 计算 软件 进行 ppr 计算时,实际操作十分简单,因为模型只有岭函数的光滑系数 s ,岭函数个数的上限 m 及最优个数 mu3 个参数需要调整。光滑系数 s 确定着数据平滑窗口的大小,其取值范围 s ∈[ 0.1 , 0.9 ],考虑到在满足一定精度条件下,尽可能缩短模型运行时间,要求 mu ≤ m ≤ 9 ,通常取下面这些组合:“ m , mu ”为“ 5 , 3 ”;“ 6 , 5 ”;“ 6 , 4 ”和“ 9 , 6 ”等,其最佳值最终由计算结果分析确定。此外,样本容量值 n 可在不超过 500 范围内自行指定,屏显值与指定值 n 之差由程序自动视为预留检验样本数。 ppr 的 理论 分析及算法详见 文献 [4 , 5] 。