99网
您的当前位置:首页抽样技术在数值模拟模型的替代模型建立过程中的应用

抽样技术在数值模拟模型的替代模型建立过程中的应用

来源:99网
2019.32科学技术创新-15-

抽样技术在数值模拟模型的替代模型建立过程中的应用4伊燕平1洪德法2卢文喜3高金花1,吉林长春1300122、吉林长春130033(1、长春工程学院水利与环境工程学院,长春市市政工程设计研究院,吉林长春13002、吉林长春130012)3、吉林大学环境与资源学院,吉林省水工程安全与灾害防治实验室,在数值模拟模型的可控输入变量摘要:抽样方法和替代模型种类是替代模型质量的两个关键环节。选取合适的抽样方法,的可行域内采样是有效地建立替代模型的基础条件。本文应用蒙特卡罗抽样和拉丁超立方抽样两种技术方法,针对假想的抽水量数据,在其可行域内进行采样,在抽取相同样品数的情况下对比分析采样结果发现,拉丁超立方抽样的结果对总体样本的覆盖度高,更具代表性,是获取输入数据集的有效途径,为日后模拟模型的替代模型研究提供了科学依据。关键词:替代模型;蒙特卡罗抽样;拉丁超立方抽样中图分类号院O212.2,O141.41文献标识码院A文章编号院2096-4390渊2019冤32-0015-02目前,常应用合理地选择抽样技术是建立替代模型的基础。(MonteCarlo)的抽样技术有与简单随机采样相结合的蒙特卡罗抽样和基于分层抽样技术的拉丁超立方(LatinHypercubeSampling)抽样。Kuczera[1]和Blasone[2]运用蒙特卡罗抽样方法分析了水文模型参数的不确定性;Faisal和Emmanouil应用拉丁超立方抽样技术对洪水期卫星预报降雨的不确定性进行了分析[3]。(输出)的数据集是地下水数鉴于抽水量(输入)与水位降深值模拟模型的替代模型建立基础。因此,本文采用蒙特卡罗抽样与拉丁超立方抽样,针对假想抽水量数据,在其可行域内进行采样,并对比分析抽样结果,选取出获取模拟模型输入数据集的有效方法,给地下水数值模拟模型的替代模型研究提供科学依据。1蒙特卡罗抽样简介应用蒙特卡罗方法抽样时需要产生各种概率分布的随机变最基本、最重要的量。在[0,1]上能够均匀分布的变量是最简单、随机变量。通常把这类随机变量的抽样值称为随机数,随机数是随机抽样的基本工具[4]。利用数学迭代或递推公式产生的随难以满足真正随机数机数,由于存在周期性且对初值依赖性大,要求的缺陷,因此应用数学方法产生的随机数常称作伪随机数[5],伪随机数是从0一直到1,但不包括1(即从0到0.999)的数[6]。递推公式如下[7]:目前常用乘同余法求伪随机数,xixi1(modM),i1,2,L

是乘因子,式中、M和x0是选定的常数,M是模数。上式表示将M除xi1后得到的余数记作xi。当给定初值x0后,利用上式算出序列x1,x2,x3,Lxi,L再取rixiM,这就是第i个均匀分布的伪随机数ri,如此可得到伪随机数序列r1,r2,r3,L,ri,L。MC抽样基本过程:首先,按从小到大的顺序排列离散随机然后生成随机数;变量,将频率作为概率,并对应伪随机数区间;最后抽取样品值。2拉丁超立方抽样简介ii

设随机变量的维数为N,x1与xu分别为第i维变量的上限、下限,则随机变量LHS抽样的过程如下:2.1确定抽样规模H;ii

2.2将每维变量xi的定义域区间[xl,xu]划分成H个相等的互不重叠的小区间,并在每个区间内按概率密度分布随机抽样;N1

2.3N维变量分成H层,将产生Hn个随机排列组合;n0

H1

选出适当的区间2.4对输入变量的随机配对进行有效筛选,这样就选出H个样本。配对,抽取样品值,3应用是建立地下水数值抽水量(输入)-水位降深(输出)数据集,模拟模型的的替代模型的基础。为了日后能够更好地建立替代(如表1)模型,本次针对假想的抽水量数据,基于MC抽样和LHS抽样分别在抽水量范围的可行域内进行采样,并在抽取相以便选出一同样品数的情况下,对比分析两种方法的抽样结果,种有效地获取模拟模型输入数据集的抽样方法。表1假想抽水量数据资料井号

数值(m3/d)

最小值 最大值

150 2400

150 2400

Q1

Q2

3.1蒙特卡罗抽样将各首先离散化处理抽水量数据;然后按从小到大的顺序,如表2。数与其伪随机数区间对应,表2抽水量数据相对频率与伪随机数区间抽水量(m3/d)

150 151 152 …… 2399 2400

相对频率 1/2251 1/2251 1/2251 …… 1/2251 1/2251

对应的伪随机数区间 (0,0.000444] (0.000444,0.000888] (0.000888,0.001333]

……

(0.999111,0.999555] (0.999555,0.999999]

通过运行Randomize()函数产生随机数。共计得15组随机数。将计算机产生的随机数与以上伪随机数区间对应,将得到如表4所示。蒙特卡罗抽样结果,3.2拉丁超立方抽样将抽水量的定义首先确定抽样数目,H=15;然后进行分层:Q1Q2150,151,152,L,2400区间划分成15个相等的小区间:划分:[150,300)、[300,450)、……、[2250,2400];Hn152个小超立方体被划分出来,并能够确保随机分布区域能够被采样点完全覆盖,且每个小超立方体出现的概率是相同的。现定义Qi,j表示第i个抽水井的第j个子区间内的数进行组合筛选,如表3:据,对各区间内抽水量数据进行编号,Q1:Q1,1,Q1,2,……,Q1,10,……,Q1,15;Q2:Q2,1,Q2,2,……,Q2,10,-16-科学技术创新2019.32

……,Q2,15;表3LHS抽样组合筛选结果方案 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

结果 Q1,5Q2,1 Q1,2Q2,2 Q1,13Q2,3 Q1,11Q2,4 Q1,8Q2,5 Q1,12Q2,6 Q1,10Q2,7 Q1,1Q2,8 Q1,15Q2,9 Q1,3Q2,10 Q1,14Q2,11 Q1,9Q2,12 Q1,4Q2,13 Q1,6Q2,14 Q1,7Q2,15

最后,调用VB程序中的Randomize()函数在子区间内产生随机数,抽取样品值,如表4所示。表4抽样结果 抽样 样本

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Q1 286 355 612 803 1037 931 1126 1193 1288 1324 1455 12 1901 2204 1379

MC抽样

Q2 423 587 759 866 763 1004 1287 1632 1771 1798 1855 1934 2015 2204 2392

Q1 768 422 2003 1769 1344 1941 1508 286 2263 593 2232 1401 722 991 1135

LHS抽样

Q2 267 443 588 722 867 996 1113 1349 1498 1557 1770 1932 2083 2231 2326

3.3对比分析将其抽样为了更直观地对两种方法的抽样结果进行对比,数据在数轴上表示出来,如图1,图2所示。图1MC抽样结果分布示意图图2LHS抽样结果分布示意图由以上结果可以看出,在抽取相同样品数的情况下,MC结分布也不均匀,这样的样品对果完全是随机出现,且无规律性,而LHS抽样能够按变量分布总体覆盖程度低,不具备代表性;抽样结果具备代表性。因此特征做分层处理,样品覆盖率较好,LHS抽样是获取建立替代模型所需输入数据集的有效途径。4结论选用一种合适的抽样技术来采集输入数据集,决定着所建立替代模型的质量。通过MC抽样和LHS抽样的结果发现,在抽取相同样品数的情况下,LHS的抽样结果对总体样本的覆盖率更高,具备较强的代表性,是获取输入数据集的最佳方法。本文由于时间,只应用了两种抽样方法的结果进行对比分析,通过判断抽样结果选出了适宜的抽样技术。建议在以后的替代模型研究中,应用两种抽样方法的结果各自建立替代进一步科学合模型,并对比替代模型与模拟模型的逼近程度,理地选取抽样技术。参考文献[1]Kuczera,G.,Parent,E.MonteCarloassessmentofparameteruncertaintyinconceptualcatchmentmodels:theMetropolisalgorithm[J].JournalofHydrology,1998,211:69-85.

[2]Blasone,R.,Madsen,H.,Rosbjerg,D.UncertaintyassessmentofintegrateddistributedhydrologicalmodelsusingGLUEwithMarkovchainMonteCarlosampling[J].JournalofHydrology,2008,353:18-32.

[3]FaisalHossaina.,EmmanouilN.,Anagnostou.,eatl.OnLatinHypercubesamplingforef?cientuncertaintyestimationofsatelliterainfallobservationsin?oodprediction[J].Computers&Geosciences,2006,32:776-792.

[4]帅永,夏新林,谈和平等援蒙特卡洛模拟中伪随机数的STTDMR检验[J]援计算物理,2004,21(2):185-188援

[5]陈松坤,王德禹.基于神经网络的蒙特卡罗可靠性分析方法[J].上海交通大学学报,2018,52(6):687-692.

魏公毅援综述:[6]杨自强,产生伪随机数的若干新方法[J]援数值计算与计算机应用,2001,3:201-215援

[7]卢文喜援地下水模拟预报过程中降水量的预报[J]援勘察科学技术,1995,4:8-10援

因篇幅问题不能全部显示,请点此查看更多更全内容