绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 100
  (已选择0条) 清除 结果分析
找到 12693 条结果
[硕士论文] 魏正韬
数学 西安电子科技大学 2017(学位年度)
摘要:单分类器在处理分类问题时经常遇到瓶颈,用组合或者是集成思想,将这些单分类器结合起来,往往可以得到不错的效果.随机森林算法作为一种应用广泛的分类算法,其本质上就是一种组合分类器.该算法使用Bootstrap重抽样方法抽取若干个训练样本,并用这些训练样本构建一个树形分类器的集合,然后使用该集合通过投票进行分类.
  在随机森林算法中,对于非平衡数据分类问题,由于传统的Bootstrap重抽样方法采取随机抽取数据集,使得用于构造基分类器的训练样本集的非平衡系数发生了改变,导致训练样本集成为无效样本集.这种情况对于处理非平衡数据问题不仅没有帮助,还因为在随机森林算法中决策树之间地位的相等,影响了最终投票结果,进而降低算法的分类性能.针对此问题,本文提出了一种改进的Bootstrap重抽样方法.通过对抽样的结果设定基于非平衡系数的阈值,保证训练样本集的质量,从而提升生成决策树的性能,使得投票结果更加准确,进而提高了整体算法对非平衡数据的分类性能.
  对非平衡分类问题,由于Bootstrap重抽样方法的随机性,从而得到不同决策树的分类性能差异较大.作为一种组合的分类器,随机森林算法是通过投票算法将决策树组合在一起,但是其投票规则并没有考虑到基分类器之间的差异,进而影响了分类效果.为了提高分类效果,本文提出了一种基于非平衡系数的加权随机森林算法.通过非平衡系数来判别基分类器的分类性能,并以此为依据进行加权.
  实验数据采用来自KEEL数据集仓库中12个非平衡二类分类数据,这些数据集的非平衡系数分布在1.25到42范围内,通过实验可以证明上述两种改进均可以在一定的程度上提升随机森林算法处理非平衡数据分类问题的能力.其中在改进Bootstrap重抽样方法的基础上,进行的基于非平衡系的加权随机森林算法的改进,可以进一步提升算法分类性能.
[硕士论文] 吕娜
统计学 青海师范大学 2017(学位年度)
摘要:实际应用中,通常会利用短记忆时间序列模型对客观过程进行描述和预测.然而近年来,人们通过对失业率,GDP,汇率,无线电通讯等许多数据的研究发现,很多数据具有长记忆特性,不适用于短记忆模型.分整自回归滑动平均模型(ARFIMA(p,d,q))是一种在经济、金融等领域广泛应用的长记忆模型,但由于诸多因素的影响,该模型中的长记忆参数会发生改变,即出现变点.本文研究(ARFIMA(p,d,q))模型中长记忆参数变点的检验、在线监测及估计问题.
  本文第一章绪论介绍了变点和Sieve Bootstrap的概念,同时给出了变点检验,变点监测以及变点估计的相关研究成果.第二章提出了一种MOSUM方法来在线监测ARFIMA(p,d,q)模型中的参数变点,并给出了用于近似统计量临界值的Sieve Bootstrap方法.模拟结果表明,利用Sieve Bootstrap方法确定的临界值能够将经验水平很好的控制在检验水平之下,并有较好的检验势.第三章针对文献中研究长记忆参数变点的检验方法无法检验从大到小变化变点的情况,对统计量进行改进,提出了一种新的统计量,并利用Sieve Bootstrap方法近似统计量的临界值.模拟结果表明,所提出的新方法能够很好的检验从大到小变化的长记忆参数变点.第四章中利用累积和方法研究了长记忆参数变点的估计问题,证明了估计方法的一致性和收敛速度,最后通过数值模拟分析了估计的精度.第五章总结了全文,并给出了对长记忆时间序列参数变点分析的一些展望.
[硕士论文] 马英群
统计学 曲阜师范大学 2017(学位年度)
摘要:风险无处不在,在我们的生活中,常常会发生一些不确定性事件,给我们带来各方面的损失.为了能够衡量这些风险,常用VaR,TVaR,ES等一般的风险度量方法来度量风险的大小.这些度量方法是与风险的分布息息相关,而椭圆分布和对数椭圆分布是生活中常见的分布,因此本文基于这两类分布展开研究.随机序在很多概率统计问题中是一个重要的工具,在风险决策中的意义也尤为重要.
  本文在第二章的第一部分介绍椭圆分布与对数椭圆分布的定义以及性质,第二部分介绍同单调的定义,并介绍服从多元的椭圆分布或多元对数椭圆分布的风险满足同单调的充分必要条件.在第三章介绍了风险度量的定义以及风险度量能够满足的几条性质,并给出风险的分布满足椭圆分布,对数椭圆分布时,各种风险度量的具体形式.第四章主要介绍了随机序,凸序,线性凸序等随机序的定义.探讨服从椭圆分布和对数椭圆分布的两个随机变量,当他们满足特殊的随机序时,他们的均值和方差的关系.再进一步探讨满足多元的椭圆分布和多元对数椭圆分布的两个随机向量间随机序和均值向量与协方差阵的关系.
[硕士论文] 陈吉英
统计学 曲阜师范大学 2017(学位年度)
摘要:在传统的风险理论中,一个投资组合的各个风险之间是被假定为相互独立的.但是,一般来讲,每个向量本身都有相依的成分.像在雾天里,同一地区的所有车辆被卷入事故里的概率都很大.在干燥的夏天,所有的木制房屋都更有可能发生火灾.在相同地方,地震和火灾的索赔之间是相关的,尽管严格来讲每个索赔不可预测.还有养老金,他们在同一个公司工作,乘坐相同的航班,那么这些人的死亡率在一定程度上是相依的.所以研究同单调对于更好的预测风险具有非常重要的现实意义.本文主要研究同单调和,共分五章.
  本文第一章是绪论,主要介绍了几个具有相依性的现实例子,以及同单调研究的背景和意义.
  第二章第一部分主要介绍了分布函数、逆分布函数的定义以及相关性质、定理,第二部分介绍了同单调性的概念以及相关定理.
  第三章第一部分介绍了同单调和的定义及相关定理,并举出了几个同单调和(积)的封闭性的例子,并且进一步得出椭圆分布具有同单调和的封闭性,对数椭圆分布具有同单调积的封闭性.举了一个离散的例子:几何分布并不满足同单调和的封闭性.因此得到结论,并不是所有分布都满足同单调和(积)的封闭性.
  在第四章主要介绍了相关序的定义及几个定理结果.
  第五章是总结及展望.
[硕士论文] 原超
应用数学 青岛科技大学 2017(学位年度)
摘要:线性模型被广泛的应用在物理学、经济学、生物学、遗传学、博弈论等领域,其含参估计模型及其相应的有偏估计方法是使用数学求解实际问题这一领域研究的经典课题之一。本文针对有偏估量中的岭参数估计和M—估计两类参数估量方式进行探讨,并得到少许新的论断。
  在对于有偏估计中的岭估计章节中,对可以进行估量的线性函数的最小二乘估计(LSE)进行了介绍,并概况归纳了该方法的优缺点。在这些基础上,给出在满足Gauss-Markov假设的模型下有偏估计岭估计的概念及性质;探讨了利用变换参数形式对岭估计进行改进的方法;由于复共线性的存在,使用最小二乘估计方法经常会造成估计参数在精度上的损失,引进相对效率的概念,以线性回归模型为例,基于最小特征值和均方误差,定义了两种新的相对效率,讨论了它们的上下界,并证明了在新定义的效率下,岭估计的效率高于最小二乘估计的效率。
  在关于有偏估计中的M—估计的参数估计章节中,介绍了M—估计方法的相关性质以及其国内外研究现状。在一个新的估计类中,结合岭估计思想,改进了M—估计方法,探讨了改进估计与M—估计的关系,同时,基于5个假设,探究了其是否具有相合性以及收敛性,文章最后证明结合估计具有相合性与收敛性。
[硕士论文] 连爱玲
运筹学与控制论 兰州理工大学 2017(学位年度)
摘要:温贮备可修系统,是可靠性理论模型中一个非常重要的研究内容之一.修复非新是依赖于众多现实问题的一个实际情况.在现实生产中,部件发生失效经修理后,未必能够修复如新,而是在修理次数增多的同时,部件的使用寿命渐渐缩短,其故障修理时间越来越长.因此,研究部件修复非新的温贮备可修系统更具有应用价值.本文是在前人对可靠性理论可修系统研究成果的基础上,对部件修复非新的温贮备可修系统模型进行了分析讨论.
  模型一:考虑在开关寿命连续型和修理工可多重休假的情形下,研究由两不同部件组成的修复非新的温贮备可修系统.假定部件的工作寿命、贮备寿命、转换开关的寿命以及部件1的修理时间均服从指数分布,修理工的休假时间、开关和部件2的修理时间均服从一般连续型分布,分析讨论系统可能出现的状态,利用补充变量法将其扩充为广义Markov过程,建立状态微分方程,并应用Laplace变换及其反演,得到系统的可用度、故障频度、系统等待修理的概率与修理工休假的概率、可靠度及首次故障前平均时间等重要可靠性指标.
  模型二:分析了温贮备可修系统的又一个新模型,引入了修理设备可修这一概念,同时考虑修理工多重休假,进一步研究部件修复非新的温贮备可修系统.在假定部件的工作时间、贮备时间、修理设备的工作时间服从指数分布,部件的修理时间、修理设备的修理时间以及修理工休假时间服从一般分布函数的前提下,利用补充变量法将其扩充为广义Markov过程,建立各状态概率的微分方程,并应用Laplace变换及其反演,得到系统主要可靠性指标.
[博士论文] 徐伟杰
土木工程;防灾减灾工程及防护工程 东南大学 2017(学位年度)
摘要:实时混合模拟的频域评价指标将实时混合模拟的试验误差分为幅值误差和相位误差两个部分,通过引入等效频率的概念,可以计算出实时混合模拟的时滞。与时域评价指标相比,频域评价指标可以更加全面地反映事实混合模拟的效果。尽管有关频域评价指标的初步的理论和试验已表明其具有较好的发展潜力,但作为一种新的方法,其准确性和适用范围仍需通过理论、模拟和试验等研究手段做进一步的验证。为此,本文针对实时混合模拟频域评价指标的物理意义、时滞补偿评价、局部评价和不确定性评价等若干关键问题,先后开展了理论分析、数值模拟和实验室试验,完成的主要工作及相应的结论如下:
  (1)研究了频域评价指标的物理意义,并对现有的频域评价指标进行了完善
  为研究实时混合模拟频域评价指标的物理意义,通过数值模拟和实验室试验,计算了线性结构不同频率下的幅值、相位、时滞和权重。研究表明,实时混合模拟频域评价方法实质是计算各个频率上的幅值和相位(时滞),并根据输入信号各个频率幅值平方的权重进行加权得到试验的幅值和相位(时滞)。由于权重的影响,频域评价结果受输入信号中低频成分的控制。为了解决频域评价指标在计算时滞时存在的问题,建议在数据分析时从第四个频率开始加权,或者对数据分析之前分别减去输入和输出信号的平均值。
  (2)采用评价指标对现有的时滞补偿方法进行了评价,评估了时滞补偿的效果
  选取多项式外推法、线加速度法、倒转补偿方法和自适应补偿方法四种补偿方法作为评价对象,对时滞补偿效果进行评价。首先利用bode图对四种补偿方法进行频域分析,然后采用频域评价指标对带补偿的位移追踪试验的数值模拟和实验室试验进行计算,得到各个补偿方法在不同频率下所能补偿的时滞和幅值。研究表明,与传统频域分析方法相比,频域评价指标不仅可以评价常时滞补偿方法,而且可以评价变时滞补偿方法。
  (3)研究了实时混合模拟局部评价方法,对局部试验效果进行了评价
  由于结构在地震作用下的剧烈响应持续时间并不长,所以不仅要对实时混合模拟试验的整体试验效果进行评价,还需要对局部效果进行评价。数值模拟表明,局部分析不可能同时兼顾时域分辨率和频域分辨率。为了提高分析的准确性,分析时所采用的窗函数应尽可能的长。为此,提出了不重叠窗函数和重叠窗函数两种加窗方法。不重叠窗函数计算效率高,适用于频率较高的线性结构。不重叠窗函数时域分辨率高,适用于非线性结构和频率较低的线性结构。其中,不重叠窗函数有望可用于在线评价。
  (4)研究了时滞对数值子结构参数不确定性的影响,对数值子结构的不确定性进行了评价
  为了分析数值子结构中模型不确定性对试验结果的影响,以时滞微分方程作为研究对象,将模型参数作为输入、位移最大值作为输出,建立输入与输出之间的多项式混沌模型,并采用Sobol指标研究不确定性参数对位移最大值的影响。研究表明,数值子结构参数存在不确定性的情况下,时滞越大,试验的不确定性程度增大。时滞会减小随机变量单独作用下对位移最大值的影响,但会增大随机变量之间的耦合对位移最大值的影响。时滞还可以改变影响位移最大值方差的控制变量。
  (5)对作动器位移追踪的不确定性进行了评价
  当作动器位移追踪存在随机性时,频域评价指标同样存在不确定性。因此,可以通过频域评价指标描述作动器位移追踪误差的不确定性,从而对作动器位移追踪的不确定性的影响进行定量分析。研究表明,当试验中不同时刻的幅值和时滞有相同的均值和方差时,采用频域评价指标计算得到的幅值和时滞服从高斯分布,从而可以选择Hermite多项式作为基向量,建立试验结果与幅值和时滞之间的多项式混沌。对实时混合模拟作动器位移追踪的不确定性进行定量分析时,需要确定多项式混沌的阶数、试验次数、计算每次试验的幅值和时滞、构建多项式混沌模型、根据多项式混沌进行不确定性分析。
  (6)对输入荷载的不确定性进行了初步评价
  以线性结构为例,采用误差等效的原则将幅值误差和时滞结合在一起,建立了在最不利情况下试验误差与频域评价方法参数之间的关系,从而将试验的幅值误差和时滞转换为试验误差。同时,改变外荷载输入,得到结构在不同输入情况下测量位移与真实位移均方根误差5%时的界限幅值和时滞。采用概率与统计方法,得到保证率为95%时的幅值和时滞,从而得到线性结构实时混合模拟可靠度评价指标。由于界限时滞受到频率和阻尼的影响较大,因此在研究输入的不确定性时要考虑频率和阻尼的影响。研究表明,外荷载和阻尼会等比例地影响幅值和时滞的可靠度界限,而频率仅对时滞的可靠度界限产生影响。由于结构的非线性有利于试验的稳定,因此满足该指标的非线性结构同样可以认为是可靠的。
[硕士论文] 孙艳
运筹学与控制论 兰州理工大学 2017(学位年度)
摘要:由于大数据分析的社会和经济需求,对时间序列的处理分析日渐重要。因为时间序列数据存在长、短记忆性以及异方差等特征,不能对时间序列直接进行分析,就需要选择合适的时间序列模型进行拟合,所以时间序列的建模和统计推断一直备受关注。模型的拟合不当,会直接造成结果的严重偏离。因此,在对数据拟合的过程中,就有必要对模型进行检验。混成检验因其适用性强,检验结果合理,得到了广泛的应用。近年来,各位学者和研究人员开始使用混成检验模型,在金融时间序列数据的处理中,混成检验逐渐成为诊断模型的重要工具。
  双AR(p)模型是具有异方差性质的AR(p)模型,具有非线性性和异方差的性质,而它具有的非线性的特点则构成研究难点。在以往的研究中,并没有学者对双AR(p)模型进行混成检验,以此来判断模型的可识别性,而在实际应用中,模型诊断在数据分析中是不可缺少的过程。
  本文的主要内容是针对双AR(p)模型提出了一种混成检验。首先,通过对模型参数进行拟极大指数似然估计,并在此估计的基础上,给出了其残差自相关函数和残差偏自相关函数,随后又提出了残差偏自相关函数的混成检验统计量;其次,通过求出残差自相关函数和残差偏自相关函数的渐近分布,进一步得出了相应混成检验统计量的极限分布;最后,通过实证分析给出了模型的参数估计。本文针对沪深300的部分股市收盘价数据进行了建模,得到了在严平稳条件下,双AR(p)模型拟合数据良好的结论。综上得出了偏自相关函数可用于双AR(p)模型的混成检验以及模型在实证研究方面可识别性的结论。
[硕士论文] 孙娟
数学 长安大学 2017(学位年度)
摘要:随机微分方程是应用极为广泛的一门数学分支,且它在客观现象的描述中有着非常重要的地位。由于不确定性因素的加入,随机微分方程能够更加准确地描述自然现象。在许多实际领域中,专家们为了应用强有力的现代工具,对所考察的系统建立某种随机模型常常是不可避免的,而这往往就意味着应用随机微分方程。然而,我们仅仅有模型而无法求得它的解对解决实际问题是毫无意义的。正是这样一种广泛而又实际的需求,促使我们对随机微分方程的求解非常重视。本文主要对线性随机微分方程进行求其解析解,主要工作如下:
  (1)对一些有关随机微分方程的基本概念进行了介绍。
  (2)对线性随机微分方程解的存在唯一性进行了证明。我们分别证明了齐次线性随机微分方程与非齐次线性随机微分方程解的存在唯一性。首先证明唯一性,然后再证存在性。我们运用Cauchy?Schwarz不等式、Lipschitz条件以及Gronwall引理来证明唯一性。采用作变换和分离函数的思想来证明存在性。
  (3)运用函数分离法求解齐次线性随机微分方程即 It?o型随机微分方程与Stratonovich型随机微分方程。首先,我们介绍了函数分离求解法思想,再通过转换公式将Stratonovich型随机微分方程转换成与之相对应的It?o型随机微分方程,并对它进行求解。最后,采用函数分离法对几个具体的齐次线性随机微分方程的例子进行了求解。
  (4)采用函数分离法求解非齐次线性随机微分方程。对几个具体的非齐次线性随机微分方程的例子进行了求解,以便加深对此种方法的理解。最后,通过其他解法与函数分离法进行了对比,我们对函数分离法的优势进行了总结。
[硕士论文] 李彩凤
运筹学与控制论 兰州理工大学 2017(学位年度)
摘要:在可靠性理论中,贮备系统和串联系统是其重要的研究对象,被广泛的应用到人们的生产生活中.但以往的研究大多考虑的是部件发生故障是由自身寿命引起的内部故障,这显然是不切实际的,在实际操作中,系统会经常受到来自外界的干扰.由此,Poisson冲击下的可修系统就成为了可靠性理论研究的重要内容.本文针对这一课题,考虑了Poisson冲击对部件的影响,分别讨论了n部件组成的温贮备系统和带一个冷贮备的两部件串联系统的可靠性.
  模型一:针对由n个同型部件和k个维修工构成的温贮备系统,考虑了系统不断受到外部冲击,冲击流的到达是遵从参数为?的Poisson过程,部件失效是由自身寿命及外部冲击引起的,部件的工作时间、贮备时间和修理时间都服从不同参数的指数分布,通过运用Markov理论和Laplace变换方法得到了稳态可用度、首次故障前平均时间等一系列可靠性指标,并给出一个例子验证了研究结果的可行性.
  模型二:对在Poisson冲击下由三个不同部件,两部件串联,一部件作冷贮备的可修系统进行了可靠性分析.假设部件的工作和修理时间服从指数分布,冲击只对工作部件产生影响,工作部件失效是由自身寿命及外部冲击引起的,运用Markov理论和Laplace变换方法得到了可靠性指标.
[硕士论文] 董欢
运筹学与控制论 兰州理工大学 2017(学位年度)
摘要:部分线性变系数模型是近年来提出的一个具有很强实际应用性的模型.该模型形式包含了很多子模型,例如参数、非参数以及半参数模型都可以看做为部分线性变系数模型的特例,所以其不但具有线性模型形式简单,易于观察的优点、非参数模型稳健的特征,还能够动态的表达协变量与相应变量之间的相互关系.
  通常在建立回归模型时,我们认为所得到的观测数据都是完整的,准确的,且误差项彼此相互独立并不考虑数据测量误差,或者缺失响应变量.但是在实际生产过程中,没有测量误差或者缺失响应变量的数据,通常很难得到,或者需要付出极大成本去提高精度.而在实际生产过程中,这都是不现实的.所以当研究回归模型时需要考虑到这些外部因素对模型的影响,然后再对模型的参数进行估计.
  第一章,主要介绍了本文所研究问题的背景、部分线性变系数EV模型的研究发展、现状以及本文研究所需的一些理论知识.
  第二章,考虑模型在带有测量误差及约束条件下情形下的回归情况.运用调整最小二乘估计和Lagrange乘数法估计未知参数和系数函数,在一定条件下证明参数、非参数函数估计的相合性,并模拟实验结果.
  第三章,研究了响应变量缺失下,参数具有线性约束且参数部分和非参数部分都带有测量误差的部分线性变系数模型的估计问题,利用最小二乘法和局部纠偏方法给出模型中参数和系数函数的估计,在一定的条件下证明了它们的渐近性质.
[硕士论文] 宋磊勃
运筹学与控制论 兰州理工大学 2017(学位年度)
摘要:模型选择的准确性对系数估计、数据分析、统计决策都有着至关重要的作用。近些年来,许多学者针对模型建立中解释变量的准确选取提出了不同的方法,并在应用中有着不错的效果。但是,随着数据生成机制复杂程度的增加,简单的变系数模型已经不能满足数据变化特征的要求,那么在建立模型时就需要考虑更多影响数据变化的因素。针对具有时空特点的数据,时空加权回归模型(GTWR)通过把时间和地理位置的因素纳入到解释变量的系数中给出了一个合理解释,GTWR模型可以形象的分析变量间的相依关系,而且从系数函数的变化也能清晰的反映数据分布的时空特征。然而,和其他简单模型一样,GTWR模型中解释变量的准确选取对模型的精度也是至关重要的。因此本文将对GTWR模型的系数表示、变量选择的方法以及性质、模拟实证方面进行研究。
  首先,基于最小二乘原理,通过利用样条基函数,给出了具有时空特点的变系数函数的逼近形式,样条基函数的局部支撑性、单位分解性等良好的性质在进行变量选择的过程中使得理论方法的推导更具规律性,并且样条基函数的局部支撑性使得系数估计值更具灵活性。
  其次,目标函数在最小二乘目标函数的基础上结合惩罚项,不仅对系数函数做出估计,而且对与响应变量无关的解释变量所对应的系数函数进行压缩,保留重要变量,剔除与响应变量不相关的解释变量,确定精确的模型形式。同时,为了说明方法的合理性,给出相关重要定理的证明,结论说明研究方法是合理的。
  最后,在模拟实证部分,本文首先对三种不同的变量选择方法在不同样本数量的条件下做模拟分析,结果表明,SCAD方法在样本数量增加的情况下对模型的系数函数的估计最准确,而且模型误差也最小。其次基于GTWR模型,应用气象数据对我国70个城市的空气质量分别从时间和空间的跨度上做了实例分析,研究结果表明,不管是时间因素还是空间因素,都影响着解释变量对响应变量的贡献比重,呈现一定的时空非平稳性,并且得到的系数估计值在不同时间点和不同区域都有着较好的拟合效果。
[硕士论文] 闫文楠
概率论与数理统计 山西大学 2017(学位年度)
摘要:回归模型中的方差估计是回归分析中的基本统计推断问题之一。良好的方差估计是回归系数的置信区间、假设检验以及变量选择中的调节参数的选择的基础。
  对于一般的线性模型,方差估计的传统估计方法分为两步:首先用AIC,BIC等准则进行模型的变量选择,而后用最小二乘法对所选变量的回归系数进行估计,用残差平方和除以剩余自由度得到方差的估计,一般称该种估计为最小二乘估计(以下简称LSE)。在典型的线性回归模型下,方差的最小二乘估计是一致最小方差无偏估计。
  但是,在超高维线性回归中,即协变量的个数远大于样本量的情况下,Fan et al.(2012)发现LSE将会产生很大的偏差,回归变量的维数越高偏差越大。为此,Fan et al.提出了一种基于2折交叉验证的方差的RCV(refitted cross validation)估计方法,即将数据的一半用于模型的变量选择,另一半用于回归系数和方差的估计,大量的模拟实验验证了RCV能有效纠正LSE方法的偏差。
  然而,我们发现RCV的方差估计主要依赖于变量选择的好坏,若开始用一半的数据选到的变量集不包含全部真实变量,则用另一半估计方差时效果就会差。虽然Fan et al.也提出可以采用多组2折交叉验证,以多组RCV的平均来提高方差估计的精度,但只要有一组变量选择的结果不好,多组RCV估计也不会好。因此,变量选择的好坏是方差估计的关键。
  事实上,在超高维线性回归中,变量是稀疏的,通常先用SIS方法选择变量个数到适当维度,再去参数估计。但RCV方法在使用SIS选变量时,往往丢掉一些真实变量,即使用多组RCV也没能改善变量选择的结果,导致多组RCV估计的结果也不能得到较大的改进。
  本文提出了用组块3×2交叉验证方法估计超高维线性回归模型的方差。组块3×2交叉验证是将数据等分为4分,任选两份作为训练集,其余两份为测试集,这样构成3组2折交叉验证。Wang et al.(2014)证明组块3×2交叉验证有良好的性质.具体的估计方法是,以组块3×2交叉验证的6次单独选变量的结果,按变量被选中的次数从大到小来选择最终的变量,确定变量集后再去估计方差。我们将该方法称为方差的投票-组块3×2交叉验证估计(简记为V-B3×2 CV估计)。
  本论文通过大量的模拟实验对比了V-B3×2CV方法和RCV方法,实验结果表明,V-B3×2CV估计的偏度小于RCV估计,且V-B3×2 CV具有更小的方差,同时V-B3×2 CV方法对真实模型的大小不敏感。另外,对真实数据(取自于UCI数据库的白酒数据)也使用V-B3×2 CV方法进行了分析,进一步证明了V-B3×2CV方法的优良性。最后,本文从理论上证明了V-B3×2CV估计的渐近正态性。
[硕士论文] 冯青梅
概率论与数理统计 山西大学 2017(学位年度)
摘要:已有大量数据表明,金融、保险、网络、生物学以及风险理论等领域的时间序列数据并不满足正态分布,而是展现出尖峰厚尾的特征。为此,对重尾分布及尾指数估计的研究显得十分重要,如何对尾指数做出无偏且稳健的估计成为学者们关注的热点。
  本文首先介绍了极值理论和正则变化条件。其次,介绍了MOP估计在一阶条件下的一致性与二阶条件下的渐近正态性,并且假设在较强的三阶条件下证明了MOP估计的渐近展开式,相比于较弱二阶条件下的结论得到关于渐近偏差的更多信息。然后,介绍了OMOP估计和ORBMOP估计,并在三阶条件下证明了ORBMOP估计的渐近展开式和渐近正态性且在一定条件下获得了一个非零渐近偏差。在保证方差为γ2(1?ψρ)2/(1?2ψρ)的前提下,提出ORBMOP的一种修正估计CH*(k)并在三阶条件下证明了它的渐近正态性,当γ>0或γ<0时比较了二者的渐近偏差。最后,在有限样本情形下,利用三种常见重尾模型对本文提出的CH*(k)估计与ORBMOP估计和经典降偏差CH估计进行Monte-Carlo模拟比较,模拟均值表明CH*(k)估计比ORBMOP和CH更接近γ真值,模拟均方误差表明CH*(k)估计的均方误差更小。因此,本文提出的修正的降偏差估计CH*(k)表现更好。
[硕士论文] 李宇罡
计算数学 山西大学 2017(学位年度)
摘要:本文研究了两时间尺度生产库存系统的H∞控制问题与事件触发控制问题,其中两时间尺度是指生产库存系统中不同生产过程中产品的查货周期不同。由于实际系统中的要求,多时间尺度的机制受到广泛关注。针对由多时间尺度引入的多率采样问题,我们引入方法简单、易于操作的提升技术来解决此问题。针对生产库存系统中有限网络带宽的问题,我们使用事件触发机制对查货数据进行筛选,以达到降低网络负担和减少决策次数的目的,同时也为企业节约了大量成本。本文主要包含以下两部分研究内容:第一部分研究网络环境下两时间尺度生产库存系统的H∞控制问题,第二部分研究两时间尺度生产库存系统的事件触发控制问题。
  本文研究工作如下:
  (1)第一章给出了生产库存系统的简介、研究背景及国内外研究现状,并介绍了本文的主要研究内容。
  (2)第二章研究了具有Markov跳变参数的两时间尺度生产库存系统的H∞控制问题。由于消费者需求的不确定和库存不同水平,用切换系统来建模生产库存系统并用Markov过程来描述子系统间的切换。根据Lyapunov-Krasovskii理论和切换控制理论,推导出了使得系统指数稳定并有规定H∞性能水平的条件。考虑到不同子系统中生产率不同,设计了切换控制器使得系统指数稳定并有规定H∞性能水平。最后,本章所提方案的有效性通过实际仿真例子得到验证。
  (3)第三章研究了具有平均驻留时间的两时间尺度生产库存系统的事件触发控制问题。与第二章中所使用方法类似,把生产库存系统建模为切换系统,且子系统间的切换为满足平均驻留时间条件的任意切换。为了提高网络利用率,减少决策次数,引入事件触发机制对查货数据进行筛选。根据Lyapunov-Krasovskii理论和切换控制理论,给出了使得系统指数稳定并有规定H∞性能水平的判据,并联合设计了事件触发机制和切换控制器。最后,通过仿真例子验证了本章所提方法的有效性,且证明了在一定条件下所使用的事件触发机制可以转化为时间触发机制。
  (4)第四章总结了本文研究工作,并对未来工作进行展望。
[硕士论文] 张馨方
数学 桂林电子科技大学 2017(学位年度)
摘要:伯努利滤波(Bernoulli filter)是基于随机有限集理论的一类特殊随机滤波估计。状态空间中允许状态的自由出现和消失并借助有限集统计(finite set statistic, FISST)的概念来描述随机出现状态的统计信息。由于它无法得到精确解,因此需借助粒子滤波(particle filter, PF)技术取得近似解。本文首先以提高滤波估计精度为目的,以PF作为实现手段对区间量测下的伯努利滤波跟踪算法展开研究;其次以GPS多径信号中码跟踪作为实际应用背景,改进的粒子滤波算法与实际应用相结合进行研究。
  本研究主要内容包括:⑴针对区间量测下伯努利粒子滤波(Bernoulli particle filter, Bernoulli-PF)算法产生持续存活粒子时未考虑当前时刻的量测信息对粒子的影响,从而导致跟踪精度低的问题。因此应用无迹卡尔曼滤波(UKF)思想代替原算法中仅用转移方程传递持续存活粒子的方式,提出基于无迹变换下的伯努利粒子滤波算法(Bernoulli-Upf)。改进后的算法在预测步骤产生持续存活粒子时,最大程度地利用当前时刻的量测,从而指导粒子向高似然区域移动,使得粒子分布与真实状态的后验分布更接近。仿真对比实验说明该算法是有效的。⑵针对区间量测下Bernoulli-PF跟踪算法存在粒子退化的缺陷,过程噪声越小粒子退化越明显,为了增加粒子的多样性,提高滤波估计精度,提出一种辅助粒子滤波(APF)与伯努利粒子滤波相结合的滤波(Bernoulli-APF)算法。该算法在更新阶段借鉴APF的思想选取权重较大的粒子,并结合当前时刻量测信息实现第二次权重的计算。计算权重的过程中不但采用的是较优的粒子,而且粒子的观测信息得到充分有效地利用,使得粒子权值比仅用粒子滤波得到的权值稳定,很大程度上克服了重采样后粒子概率密度变化大,粒子退化等问题。仿真实验证了算法的有效性。⑶应用改进的PF算法解决实际问题。针对GPS弱信号环境下,传统接收机存在跟踪精度低,跟踪门限高的问题,提出一种基于最小二乘估计的粒子滤波GPS信号跟踪算法。该算法通过最小二乘方法对I/Q支路相干积分值进行修正并作为观测量输出,应用粒子滤波算法估计多径环境下码相位时延值。该方法能够有效减小有偏相干积分值所造成的码相位跟踪误差,提高弱信号环境下环路的跟踪性能。仿真结果表明,该算法提高了码跟踪精度和稳定性。
[硕士论文] 黄开娇
应用数学 广西师范大学 2017(学位年度)
摘要:在现实生态中任何系统都不可避免地要受到环境噪声的干扰.为了适应实际需要,在生物系统建模时考虑随机噪声干扰是完全有必要的.另外,时滞是生态系统中普遍存在的现象,在随机捕食-被捕食系统中加上时滞因素会更加贴近实际情况.因此,本文研究具有Beddington-DeAngelis型功能性反应和带有随机时滞因素的捕食-被捕食系统,讨论该系统所反映出来的一些重要性质是很有意义的.也正是因为环境噪音和时滞因素的存在,才产生了多种多样的随机时滞模型.受此启发,本文在具有Beddington-DeAngelis型的捕食-被捕食随机模型上加上时滞因素,使得随机项也包含时滞因素,这就是本文的创新点之一.
  此外,生物系统可能受到的环境的影响是突发剧烈的,如地震、海啸、泥石流、瘟疫感染等.在数学上用简单的白噪声是不能刻画其突发性的,一般用带Lévy噪声的随机微分方程来描述这种情形.到目前为止,关于带Lévy噪声的随机生物模型的研究还比较少,特别是关于带Lévy噪声且具有Beddington-DeAngelis型功能性反应的随机捕食-被捕食模型.因此,本文将讨论一类带有Lévy噪声和具有Beddington-DeAngelis型功能性反应的随机捕食-被捕食模型.
  本文在随机泛函微分方程理论、Lyapunov稳定性理论的基础上,使用Lyapunov函数、停时以及不等式变换等技巧,系统地研究了具有Beddington-DeAngelis型功能性反应和随机时滞的捕食-被捕食模型以及一类带Lévy噪声的随机捕食-被捕食模型.本文的主要内容有:
  第一部分介绍具有Beddington-DeAngelis型功能性反应的捕食-被捕食系统和一类带Lévy噪声的捕食-被捕食模型的相关背景、研究意义和研究现状,简要介绍本论文相关的基础知识.
  第二部分建立具有Beddington-DeAngelis型功能性反应的随机时滞捕食-被捕食模型.讨论在给定假设条件下,该模型具有唯一的全局正解.证明了虽然该系统的系数既不满足局部Lipschitz条件也不满足线性增长条件,该系统仍然具有全局正解的唯一性.使用Lyapunov函数、It(o)公式等方法证明了该模型存在唯一的全局正解,并得出了该模型正解的充分条件.在此基础上,进一步证明这个解是随机最终有界的,并得出全局渐近稳定性性质.
  第三部分概要介绍一类带Lévy噪声和Bedding-DeAngelis功能反应的随机捕食-被捕食系统的建立,利用构建Lyapunov函数和停时技巧证明了该系统存在唯一的全局正解.在此基础上,通过构建函数证明这个解是随机最终有界的.最后,给出了物种趋于灭绝的充分条件.
  第四部分通过Matlab软件利用Milstein方法来验证论文的相关结论.
[博士论文] 潘伟
计算机应用技术 电子科技大学 2017(学位年度)
摘要:随着网络信息技术的发展和普及,互联网已经发展成为当今世界上资料最多、门类最全、规模最大的异构、动态和开放的分布式资源库。有序性数据是互联网中广泛存在的一类数据,如仓储与物流、生态农业、投资风险分析等。多规则有序决策已成为Web信息知识发现中非常重要的研究方向。粗糙集理论采用粒化和近似的基本思想来刻画分类问题中的不一致性,是解决不确定分类问题的有效工具。信息熵是信息不确定性的重要度量工具。本文基于粗糙计算方法论中粒化和近似的思想,结合信息熵对不确定性的度量能力,对多规则有序列决策问题进行了深入研究,建立了多规则有序决策的粗糙集模型和信息熵方法
  本研究主要内容包括:⑴建立了多规则有序决策的多粒度偏好关系粗糙计算模型,设计了粒结构选择算法。传统的偏好(优势)关系是一种不严格的偏好表示方法,论文将传统的偏好关系拓展到严格的偏好关系,改进了偏好关系粗糙集模型,并将其扩展到了多规则有序决策领域,建立了多粒度偏好关系粗糙集模型。在现在偏好关系粗糙集中,如果一个样本要属于某偏好集的下近似,则要求所有比此样本差的样本都包含在该偏好集中,这样的下近似是没有任何意义的。改进后的偏好关系粗糙集模型克服了这一问题。如果一个样本要属于某偏好集的下近似,只要存在比该样本差的样本属于此偏好集就可以了,这更加符合实际情况。考虑到不同规则的费用和成本问题,还建立了费用敏感的多粒度偏好关系粗糙集模型。此外,还将建立的模型应用于粒结构选择,并设计了粒结构选择算法。⑵建立了多规则有序决策的多粒度模糊偏好关系粗糙计算模型,设计了偏好决策和样本压缩方法。经典的偏好关系粗糙集基于传统的偏好关系,只能表示数据之间的序关系,不能体现数据之间偏好的程度。针对现有模糊偏好关系粗糙集模型在上下近似方面与传统粗糙集思想相悖的情况,引入加性一致的模糊偏好关系,提出了改进的模糊偏好关系粗糙集模型,并将其扩展到了多规则有序决策领域,建立了多粒度模糊偏好关系粗糙集模型和费用敏感的多粒度模糊偏好关系粗糙集模型。基于提出的模型,设计了偏好决策和样本压缩算法。⑶提出了偏好不一致熵的概念,建立了多规则有序决策的信息熵模型,设计了属性约简算法和样本压缩算法。将香农信息熵扩展到有序决策领域,用偏好不一致熵来度量有序决策系统中偏好的不一致性和不确定性。偏好不一致熵是基于属性的,能够有效度量有序决策系统中由于条件属性与决策的偏好不一致导致的决策不确定性,能够很好地反应条件属性在有序决策中的重要程度,在特征选择和属性约简方面有比较好的效果。⑷定义了样本的偏好不一致熵,并扩展到加权的偏好不一致熵,提出了样本的偏好决策算法。基于属性的偏好不一致熵在样本的有序决策方面能力不足。针对偏好不一致有序系统中的样本决策问题,基于偏好信息粒子和样本的偏好不一致度,定义了样本的偏好不一致熵。样本的偏好不一致熵关注的对象是样本,能够度量特定样本引起的偏好不一致,在有序决策系统中的样本分类方面具有较好的效果。当基于全局偏好不一致熵进行分类时,能够得到与原始决策比较接近的结果。⑸提出了一种基于粗糙集的最近邻样本压缩方法(FRSC算法)。最近邻分类规则的时间复杂度和空间复杂度均与训练样本集的样本数量密切相关。随着样本数量的增加,所需要的时间和空间迅速增大。而在最近邻分类规则中,决定分类结果的往往是处于决策边界的样本。因此计算训练集的一致子集是提高最近邻分类规则效率的重要途经。粗糙集理论是通过上近似和下近似来对决策空间进行逼近,处于决策边界区域的样本往往都是下近似比较小的样本。将粗糙集方法应用于最近邻规则的训练集压缩,是一种快速计算训练集一致子集有效方法。
[硕士论文] 岳利梅
统计学 山西大学 2017(学位年度)
摘要:在社会科学各研究领域的多变量问题中,研究人员经常会碰到不能准确或直接测量的潜变量.而传统的统计方法在处理这方面问题时会有很大的局限性,因此一般通过建立结构方程模型(SEM)来解决此类问题.目前研究的SEM包括测量模型及结构模型两个部分,因此可以有效地处理及检验显变量和潜变量(或潜变量和潜变量)之间关系,故而是一种实用的多元统计方法.
  成分数据是经常存在于社会科学等领域的一类特殊数据,即成分数据中各向量满足定和限制及非负性.本文主要将结构方程模型的偏最小二乘回归应用于成分数据中,且通过实例分析得到该模型具有较高的拟合度.在实例研究中先对旅游服务及旅游业发展之间的关系进行分析,而后加入旅游投资来研究三者之间的关系.通过实例分析可知模型中的符号权重和各有利弊,因此对这一方法进行了些许修正,以让该方法更为合理有效.
  本文分为五章:
  第一章:绪论.介绍了全文的研究目的及其意义.此外,阐述了结构方程模型的相关知识与国内外主要研究现状,并指出了本文研究的内容.
  第二章:成分数据及其线性回归简介.主要介绍了成分数据的相关知识、成分数据的线性回归模型及其性质.
  第三章:单形空间中有两个潜变量的SEM的PLS回归.先简单介绍了SEM的基本模型,之后主要描述了含两个潜变量且所有变量均为成分数据时的回归模型,并进行了实例分析.
  第四章:单形空间中含多潜变量结构方程模型的PLS回归.主要介绍了多元潜变量且所有变量均为成分数据时的回归模型,并进行了实例分析.
  第五章:总结与展望.归纳了全文的主要内容,并给出了未来有可能研究的一些方向.
[硕士论文] 崔红珍
应用数学 浙江师范大学 2017(学位年度)
摘要:本论文研究的主要内容是带可乘白噪声的自治薛定谔格点系统、带随机耦合系数和带可乘白噪声的非自治薛定谔格点系统随机吸引子的存在性.本论文主要分为三章:
  第一章,首先介绍问题背景和研究现状.然后介绍与本文相关的知识点,包括基本概念、定理以及本文所需的不等式等.接着介绍本文的主要结果.
  第二章和第三章是本论文主要部分,我们分别证明了带可乘白噪声的自治随机薛定谔格点系统、带随机耦合系数和带可乘白噪声的非自治薛定谔格点系统存在随机吸收集和随机吸引子.证明过程中,我们首先利用Ornstein-Uhlenbeck过程将随机薛定谔格点系统转化成以随机变量为系数而无噪声的随机格点系统;其次,研究该随机系统的初值问题的整体解的存在唯一性以及关于初值的连续依赖性,其解映射可以生成连续随机动力系统;最后,证明两类随机动力系统存在随机吸引子.
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部