绑定机构
扫描成功 请在APP上操作
打开万方数据APP,点击右上角"扫一扫",扫描二维码即可将您登录的个人账号与机构账号绑定,绑定后您可在APP上享有机构权限,如需更换机构账号,可到个人中心解绑。
欢迎的朋友
万方知识发现服务平台
获取范围
  • 1 / 60
  (已选择0条) 清除 结果分析
找到 1197 条结果
[博士论文] 侯文冰
应用数学 大连理工大学 2018(学位年度)
摘要:一直以来,人类探索生命现象的脚步从未停歇。20世纪以来,人类对生命现象的研究逐渐深入,从生物表象型的研究进入到生物小分子领域。20世纪90年代,随着科学技术,尤其是计算机技术的飞速发展,生命科学的研究进入了新的阶段。人类基因组计划的启动和实施,开辟出大量的生物数据资源,同时也对数据的存储和处理提出了更高的要求。在这样的背景下,生物信息学这一交叉学科应运而生,它的主要特点正是运用新兴的计算机科学技术和网络技术来有效的管理分析大量的生物学数据,找出其背后隐藏的生物学规律。在生物信息学中,对生物序列进行相似性分析是一项重要任务。本文主要研究工作是围绕着生物序列的相似性分析展开,分别以DNA序列和蛋白质序列作为研究对象,提出了不同的生物序列相似性分析方法。
  在第二章中,区别于常见的图形化表达方式,从信号的角度,基于不同的编码方式,本章提出了两种不同的DNA序列的编码模型。在第一种编码方式下,DNA序列被映射为信号幅度为2的方波,用四种不同的信号持续时长来分别代表AGTC四种不同的碱基,以方波幅度的交替来表示碱基的更迭。第二种编码方式则借鉴CMI编码,将实际的DNA序列转化为CMI码序列。利用转化得到的信号序列可以对DNA序列进行相似性分析。通过与已有的模型进行对比发现,以信号的思想来理解DNA序列是切实可行的,本章提出的方法是有效的DNA序列相似性比较手段。
  第三章中以蛋白质为研究对象,提出了一种基于惯性张量的蛋白质序列分析模型。首先按照氨基酸的不同性质,将20种氨基酸映射为三维空间上不同的点。通过赋予每个点“质量”,借助惯性张量的计算,可以得到蛋白质序列之间的相似程度。本章分别采用来自哺乳动物的蛋白质序列以及来自杆状病毒的蛋白质序列说明了本章提出方法的有效性。
  第四章中提出了一种基于离散傅里叶变换和动态时间规整算法的蛋白质序列分析模型。首先将蛋白质字符序列映射为数值序列,将其视为由三组信号构成的信号序列。通过对序列进行离散傅里叶变换,能够得到氨基酸序列的功率谱,随后利用动态时间规整算法判断两个氨基酸序列的相似性。从本文的计算结果中可以发现,取自相近时间段的甲流病毒的蛋白质序列的相似性更高。通过与其它软件和论文得出的计算结果进行比较,发现使用本文中同样数据的情况下,本文提出的方法能够纠正部分目前已有的软件与其他算法中的一些错误分类。
[硕士论文] 涂佳娟
概率论与数理统计 华中师范大学 2018(学位年度)
摘要:在不同的疾病状态下,基因相关性网络经常发生变化。了解这些网络如何在两种不同疾病状态间的重新布局是基因组研究中的一项重要任务。为了实现这一目标,很多差异网络分析模型被提出,但其中大部分方法都是为某种预先定义的数据类型而设计的。随着高通量技术的发展,可以从不同视角收集基因活性测量数据(例如,mRNA表达和DNA突变)。这些不同类型的数据可能享有一些共同的特征,同时也包含这些数据类型所特有的属性。因此,需要新的估计方法来探索不同数据类型所对应的差异网络之间的相似性和特异性。在这项研究中,我们提出了一种新的差异网络推断模型。这个模型通过整合基因表达数据和基因突变数据来识别基因调控网络的重新布局,同时采用Group Bridge惩罚函数来学习不同数据类型间的相似性和特异性。模拟研究表明,我们的方法始终优于对比方法。我们还将这种差异网络推断的方法应用于铂抗性卵巢癌的基因组学图谱数据,并推断与卵巢癌铂抗性相关的基因网络重新布局。这两种数据类型对应的差异网络含有一些共同的差异边,同时也含有数据类型所特有的差异边。此外,在卵巢癌铂抗性的差异网络中共有的枢纽基因在卵巢癌铂抗性中起重要作用。
[硕士论文] 郑佳
计算机应用技术 华中师范大学 2018(学位年度)
摘要:机器学习中很多重要方法都离不开模型选择。模型选择在数据聚类、复杂网络社团发现及数据降维等方面应用广泛。如何准确地进行模型选择,从而选择出合理的目标维度,进而引导出具有可解释性的分析方案,挖掘出隐含在数据中的潜在信息是机器学习中模型选择所面临的一个挑战。
  矩阵低秩分解是目前应用广泛的数据降维和数据表示方法,其中非负矩阵分解是最具有代表性的矩阵低秩分解方法。非负矩阵分解(Nonnegative MatrixFactorization,NMF)作为一种矩阵的低秩逼近方法,它分解的矩阵和最终得到的结果矩阵的数值都是非负的。非负矩阵分解能将高维数据降至低维,一个合理的维度能引导更为理想的分解,使得分解之后的低维矩阵能最大限度的保留原始数据的特性。围绕非负矩阵分解的维度选择即模型选择问题,本文做了以下研究工作:
  第一、提出基于同趋性的模型选择方法(Tendency Drive Nonnegative MatrixFactorization,TDNMF)。不同于其他在分解过程中进行模型选择的方法,该方法从数据分解前后的结构保持情况出发,基于数据点之间的相关性关系,提出样本同趋性概念,并采用重采样的方法解决了在样本容量不一致的情况下比较样本相关性的问题。得益于这两种数据处理技巧,基于同趋性的模型选择方法(TDNMF)具有较小的时间复杂度。
  第二、提出基于信息均衡的模型选择方法(Entropy Balanced Nonnegative MatrixFactorization,EBNMF),该方法结合了非负矩阵的可伸缩分解特性以及高效稳定的维数选择标准,在多个模拟数据上体现了良好的性能。在此基础上,本文进一步地在真实生物数据集包括果蝇基因表达数据和人类微生物组数据集上对提出的方法进行了验证,表明了EBNMF方法的稳定性和可解释性。EBNMF能在信息分解过程中进行很好的模型选择,并能有效提取具有噪声的生物数据的有效特征。
  非负矩阵分解模型符合整体是由局部组成这一客观规律而被广泛应用于多个领域,但其模型选择仍然是一个难题。本文提出了两种非负矩阵分解的模型选择方法,分别在计算复杂度和准确性上具有一定的优势,可适用于不同级别的数据集。
[硕士论文] 苏矿喜
概率论与数理统计 华中师范大学 2018(学位年度)
摘要:人类的疾病多为由遗传和环境因素共同作用引起的复杂性疾病。目前全基因组关联分析(Genome Wide Association Study)已经成功鉴定了上千种与人类复杂性疾病相关联的SNP位点。这些新发现极大地推动了医学和生物学的发展。随着各个国家科研人员持续深入的研究探索,GWAS也逐渐成为近几年研究的热点问题。
  近年来,在GWAS研究中,全世界各个国家的科研人员已经识别了上千种SNPs和不同的性状或者疾病之间的关联性,并提供了实质性的内容了解疾病机制的信息。尽管关于基因与疾病的关联检验取得了长足的进步,但是GWAS中可识别与疾病关联的SNPs仅仅解释了基因变异的百分之几的比例,这就引出了一个问题即这些删失的遗传可以在哪儿以及怎样被识别,可能的解释包括以下几点:一方面,目前主效应不足以解释所有的遗传效应,许多研究已经证实了关联分析中存在交互效应,基于此,最近几年大量的检验统计量被提出来检验基因与基因之间的交互效应。另一方面,被广泛使用的检验基因之间交互作用或基因与环境之间交互作用的统计量功效一般比较低。例如常规的logistic回归方法,交互效应参数估计很不精确,且其检验识别力很低,因此提出一种高效的统计量来提高检验基因与基因之间交互效应的功效很有必要。
  在病例对照实验中,对照组中基因满足连锁平衡(LE)与哈代温伯格平衡定律(HWE)条件下,本文推导出一个新的得分检验统计量来提高检验基因与基因交互效应的功效并利用δ方法计算出得分检验统计量方差的渐近估计。本文主要在二种不同的遗传编码方式下讨论基因与基因之间的交互效应是否存在,分别为1:G1,G2的主效应和交互效应均采用可加遗传编码。2:G1,G2的主效应采用共显性遗传编码而交互效应采用可加遗传编码。我们证明了在两种不同的遗传编码下,推导出来的得分检验统计量及其方差的渐近估计完全一样。最后的模拟部分显示,在两种不同的遗传编码下,我们提出的得分检验统计量相比常规的logistic方法具有明显的数值优越性。
[硕士论文] 王田莉
应用统计 华中师范大学 2018(学位年度)
摘要:随着高通量技术的发展,获取大量的基因表达数据已经成为现实,因此生物学的研究方向转向了基因层面。从基因表达数据重构基因调控网络,能够了解基因表达和生物体基本功能之间的联系,这对分析生物体复杂生命现象有着重要的意义。现有的大多数方法利用相关系数及控制阈值大小构建网络,但构建的网络包含了基因间的直接与间接相互作用关系,使得网络准确度低。基于高斯图模型构建网络的方法考虑了相关系数构建网络准确度低的问题,然而,高斯图模型依赖于假设数据是高斯的。当不满足该假设时,估计的网络会产生假阳性边。此外,当样本数据出现噪音时,构建的网络准确度也较低。
  为了解决数据噪音影响结果准确度的问题,本文借助集成学习思想,提出了基于两层集成学习来构建基因调控网络的方法。第一层是对数据集进行随机抽样,产生多个数据集;第二层是对于每个数据集利用不同的鲁棒估计方法,对估计结果进行集成学习。此方法的主要特点是通过多次集成实验减少噪音的影响,提高结果的稳定性。基于高斯图模型求解算法,模拟实验验证了基于两层集成学习构建的基因调控网络准确度高,同时针对噪音数据该方法稳定性较强。
[博士论文] 朱家砚
统计学 华中师范大学 2018(学位年度)
摘要:随着现代生物学技术的发展,已经有千余位点单核苷酸多态性与复杂疾病关联被成功识别.本文首先按照从考虑单个位点到考虑多个位点的顺序回顾了全基因关联分析中的统计方法,介绍完成论文所需要的统计遗传、概率论与数理统计、统计计算等领域的一些预备知识.
  接下来,本文提出了适合三个具体问题的基因关联分析的统计检验方法,研究了统计方法的理论分布与性质,并通过R软件实施统计模拟和进行实际数据分析,数值结果均验证了我们所提出的检验方法具有某种稳健性.具体如下:在第三章中,本文推广了包含一个冗余参数的MERT检验到包含多个冗余参数的情形,并研究了包含多个冗余参数的MERT检验存在的一些正则条件及包含多个冗余参数MERT检验的一些统计理论性质.当多个基因位点连锁平衡且在基因遗传模型未知的情形下,本文推导了MERT检验的具体形式,并研究其大样本性质.通过大量模拟研究,论证了这种检验对基因遗传模型未知具有稳健性.在第四章中,本文利用现代统计方法与数据分析技术提出了一种针对数据高维(大量基因位点)、哈代-温伯格平衡律成立与否未知、真实基因位点遗传模型未知都具有稳健性的统计检验方法,并将该方法应用在多个连锁不平衡位点的基因关联分析中,模拟研究与实际数据分析都证实了本文所提检验方法的稳健性.
  然后,在第五章中,本文初步探讨了基因关联分析中一种检测基因多效性的统计检验方法,提出了一种统计检验方法来检验二元有序离散取值的响应变量与连续取值的响应变量同时与一个协变量(向量)之间的关联性.当有序离散取值响应变量与连续取值响应变量的相关性不是很弱时,本文所提出的统计检验方法总是比传统的组合P-值检验方法功效更高.通过大量模拟研究与一个实际的医学数据分析证实了本文所提统计检验方法的优越性.
  最后,本文全面分析总结所开展研究工作的创新之处及主要优缺点,以及今后还要继续开展的一些研究工作.
[博士论文] 秦臻
生物医学工程 浙江大学 2018(学位年度)
摘要:味觉作为哺乳动物感受外界环境中化学物质的基础,为生存、觅食、繁殖等活动提供了重要的保障。经过长期的进化,味觉感受系统能够快速、灵敏、特异地识别和检测复杂的液体环境中大量不同的物质,是迄今为止性能最佳的化学检测系统之一。受哺乳味觉感受系统的结构和信息编码方式的启发,研究者们提出了电子舌的概念。目前国际上的电子舌系统通常采用离子选择电极等电化学传感器或味觉仿生材料作为敏感元件,在检测的灵敏度和特异性上存在问题。与电子舌相比,生物味觉感受系统具有与生俱来的优势,其核心功能部件如感受细胞、受体等,适合作为电子舌中的敏感元件,以实现高特异性和灵敏度的检测与识别。
  本文提出了一种新型在体生物电子舌系统:以哺乳动物味蕾中的味觉细胞作为初级感受器,味觉信息经传入神经及孤束核等脑区的整合处理后,在味觉皮层中汇集,该区域的神经元因此具有交叉敏感的味觉响应特性。微电极阵列实时记录味觉刺激前后相关神经元的胞外电位信号,通过降维、模式识别等技术建立味觉种类的分类模型和味觉强度的定量检测模型。同时,本文验证了在体生物电子舌系统对苦味和甜味物质的检测性能,包括特异性、灵敏度、长时稳定性等。另外,本文还提出了一种基于永生细胞系的生物电子舌,并将应用于受体特异性的苦味物质筛选中。
  本文主要的创新性研究工作为:
  1.首次提出了在体生物电子舌概念,并实现了苦味物质的高灵敏度检测
  受在体生物电子鼻概念的启发,本研究在国际上首次提出了在体生物电子舌的概念,其核心为建立味觉皮层神经元胞外电位的活动模式与味觉刺激的映射关系,完成味觉种类和强度的检测。实验结果表明,基于清醒大鼠的在体生物电子舌局部场电位输出具有苦味特异性,且β振荡和γ振荡的功率谱密度(power spectral density,PSD)特征均与苦味刺激的浓度相关。γ振荡PSD对苦味刺激浓度变化更为敏感,苦味物质苯甲地那铵的检出限可达0.076μM。由于保证了味觉细胞和相关神经元的在体环境,在体生物电子舌与基于离体生物电子舌相比具有更长的使用寿命,稳定的输出信号平均可维持22天;与行为学实验结果的对比也表明,基于清醒大鼠的在体生物电子舌的定量检测模型具有较高的可信度,验证了其用于苦味物质识别与检测的可行性。
  2.提出了基于麻醉大鼠的在体生物电子舌,完成了苦味物质快速准确识别
  为了减少动作噪声等对检测的不利影响,我们提出了基于麻醉大鼠的在体生物电子舌以提高实验记录的成功率;同时,研究了在体生物电子舌的锋电位信号携带的味觉信息。实验结果表明,该在体生物电子舌的锋电位和局部场电位都可以对苦味刺激产生快速的响应,平均响应延迟约为0.2s,平均响应时长小于4s。在使用支持向量机算法建立的模型中,锋电位和局部场电位信号的特征融合显著提高了苦味响应识别的准确度,苦味与非苦味物质的二元分类准确度达到88.15%。同时,本研究分别建立了基于锋电位发放频率和局部场电位PSD的苦味定量检测模型,虽与清醒大鼠的在体生物电子舌相比损失了部分灵敏度,但使用寿命得以延长,稳定的信号输出平均可维持30天。
  3.首次将在体生物电子舌用于甜味物质的识别和检测,并针对实际样品的检测与人类味觉感官进行了对比
  基于清醒大鼠的在体生物电子舌利用局部场电位的味觉特异性响应包络和随机梯度下降算法,完成了四种不同类型味觉物质分类;更进一步,本研究利用哺乳动物味觉编码的动态性,构建了区分天然糖和人工糖的分类模型。同时,建立了基于局部场电位PSD的甜味物质定量检测模型,并得到了行为学结果的验证。另外,本研究首次针对实际样品,对比了在体生物电子舌的响应强度与人类味觉感官测试的结果,分析了在体生物电子舌用于提高品味员工作效率的可行性。
  4.研制了一种基于受体细胞的新型离体生物电子舌,实现了苦味物质的受体特异性识别,并探索了其用于药物苦味检测的可行性
  Caco-2细胞内源性表达有人类苦味受体T2R38,与异源表达系统相比,具有天然完整的信号通路和更理想的贴壁能力,适合作为细胞阻抗传感器的敏感元件。实验结果表明,该离体生物电子舌可以对苦味物质苯硫脲和丙基硫氧嘧啶的定量检测,检测结果可以模拟人类的苦味感受,且该系统具有受体特异性,可以用于异硫氰酸酯类药物的苦味识别。另外,对比了该系统与基于精细胞的离体生物电子舌、在体生物电子舌检测中药苦味的结果。
[硕士论文] 张留军
控制工程 山东大学 2018(学位年度)
摘要:马蹄蝙蝠(Rhinolophidae)和Hipposideridae是两个相关的蝙蝠家族,它们在鼻腔内发射超声波脉冲进行环境探测,并用精细的挡板形状(“鼻叶”)衍射出射波包。由美国弗吉尼亚理工大学的模拟蝙蝠声呐头的实验证明,蝙蝠鼻叶的运动会对产生的超声波的方向性有实时的影响。在观察与实验过程中经过对蝙蝠的观察发现其在发出超声波的过程中鼻叶形状会发出大小不同的形变,于是猜想鼻叶的运动会产生一定的影响。证明这一结论对未来的仿生机器人具有指导性作用,可以进一步提高仿生机器人的实用范围和使用价值。
  由于在脉冲发射期间鼻叶表面产生运动,建立了实验装置来表征它们几何形状中的运动分析,并结合这种运动可能对超声脉冲产生的影响。为了达到这个目标,训练Rhinolophus ferrumequinum,Hipposideros armiger和Hipposideros pratti三种蝙蝠,在实验平台发出超声脉冲。至少有10个标记被放置在动物的鼻子上,用四个高速摄像机(帧频400Hz)来跟踪这些结构的动态几何形状的变化。相应的运动帧频被用来重建鼻翼地标的三维轨迹,从这些轨迹中,形状变化大小是基于脉冲期间个点之间的相对距离决定的。用十字形阵列的超声波麦克风测量发射的超声波脉冲的空间分布。通过脉冲期间的相关性和变异性测量来评估与鼻叶动作与发射的超声波的同步,来检测鼻叶运动与声音分布的动态特性。
  经过大量的实验数据,发现了一些蝙蝠鼻叶运动大小的分布以及蝙蝠超声波的时间特性。蝙蝠鼻叶的结构比较复杂,这也增加了我们数据收集与分析的难度,于是为了对其进行有效的认识与了解,我们初步对蝙蝠的鼻叶划分为四个部分。然后根据此四个关键部分,结合每一部分的运动尺寸和方向进行下一步分析。蝙蝠一般只有在发送超声波的过程中会有相应鼻叶运动,持续时间相对较短,由于鼻叶比较小,所以在发送脉冲中产生的形变也会比较小。在一个脉冲期间的形变是在1mm以内,通常在我们获取大量的运动实验数据后,再对其超声波进行分析,在起初的数据分析过程中,由于超声波脉冲信号包含了大量的信息,对其各个参数进行了逐步尝试,其中包括脉冲在各通道的幅值,达到最高值所对应的时间点,脉冲的形状,在不同通道之间的相互关系等等。最后发现鼻叶的运动的确对声音在空间麦克风阵列的相对强度具有影响,在蝙蝠具有鼻叶大运动和相对很小的运动产生鲜明的对比。在发出脉冲期间,超声波的主方向会发生移动,各个麦克风通道之间的相对强度也会发生相应的改变。这也是此文中的重要发现,本文会对实验的意义,实验的操作,数据的采集及分析和相应的结论进行进一步的介绍。
[硕士论文] 郭睿东
计算机软件与理论 中国科学技术大学 2018(学位年度)
摘要:序列比对是生物信息学中的一个核心问题,它是一些生物学下游应用的基础。随着测序技术的发展以及千人基因组计划的执行,测序基因组的规模越来越大,序列比对耗时也越来越多。序列比对分为找最好和找全两类问题,其中后者是计算成本更耗时的问题。因此,找全序列比对算法也成为了一个重点研究方向,其主要评价标准为时间消耗和空间占用。过滤方法的好坏,直接决定了比对的总时间,现有的过滤方法过滤后候选位置较多,会消耗大量的验证时间,因而影响了序列比对算法的速度。选取的索引直接影响了内存占用和种子查找速度,但目前的哈希索引相对较大,且对变长种子的查找支持较差。为了加快比对的速度和减少内存占用,本文主要研究找全序列比对算法的过滤方法和索引的改造及优化,具体工作和贡献如下:
  (1)过滤方法设计及优化
  我们对目前已有过滤方法进行了分析和研究,发现经过过滤方法筛选后,仍有大量的候选位置不属于真正所要的匹配位置,但这些未匹配的位置仍会消耗大量的时间进行验证。本文提出了一种基于变长种子的动态规划过滤方法,变长种子可以明显减少定长种子的候选位置数量。为了解决变长种子带来的计算成本增加问题,我们采用了两种启发式的优化策略:限制种子长度变化范围和高频种子长度扩展,前者为降低计算成本而后者为降频处理。最后将该方法应用于目前速度最快的找全序列比对算法Bitmapper中,实验结果表明,在编辑距离为5时,相较于原Bitmapper,本文方法有约30%的加速。
  (2)索引改造及并行化
  现有的哈希索引空间较大,我们先利用稀疏化方法减少了哈希索引的空间。其次,原有适合定长种子的哈希索引技术需要为变长种子进行改造和优化。因此,本文设计了一种变长种子的方案,已应用在前面的Bitmapper算法实现中,该方案是以较长且固定长度为q的种子(即q-gram)为基索引,通过合并前缀来获取长度小于q的变长种子位置。随后,提出了一种索引改造和优化方法,减少了前缀合并的耗时操作,主要是在基索引的倒排表中加入后缀字符信息,并改进了求变长种子位置的计算方法,亦能很好适应稀疏哈希索引。最后,我们采用多线程对算法进行并行化加速。实验结果表明,将改造的索引和变长种子过滤方法相结合后,在编辑距离为5时,相比于原Bitmapper,计算时间和内存消耗均得到了有效减少;对于8线程,取得了约7倍的加速比。
[博士论文] 刘炜
计算机应用技术 湖南大学 2017(学位年度)
摘要:人类基因组计划的完成标志着现代生命科学研究进入了系统生物学时代。系统生物学不仅仅是一个新兴的领域,更重要的是它代表一种对生物学研究的新方法。人们逐渐认识到在研究过程中不能仅局限于研究单个基因,而应该全面地从系统的角度去探寻这些基因之间的表达调控规律,研究整个生命系统的运行机制,最终破译生命遗传的秘密。
  随着高通量技术的飞速发展,大量的研究结果产生了海量的基因表达数据。如何从这些数据中发掘出具有生物意义的调控关系以及调控规律是后基因组时代人类所面临的最具挑战性的生物学问题之一。基因调控网络结构推测的目的正是从基因表达数据中构建基因与基因间相互调控关系所组成的网络结构。因此基因调控网络结构推测的研究具有重大意义。本文以基因表达数据为研究对象,以信息论为背景,针对当前基因调控网络推测方法中存在的一些问题开展基因调控网络结构推测算法的相关研究。本文主要工作概括如下:
  (1)针对当前大多数基于信息论的基因调控网络模型中主要采用单一网络特性推测网络结构的现状,本文将拓扑理论中的节点中心性与信息论中的互信息相结合提出了一种基于网络拓扑中心性的基因调控网络结构推测算法LDCNET。该算法首先采用互信息对基因间调控关系进行初始化和预处理。其次分别计算每一个基因的节点中心性并基于中心性对所有基因降序排列。当排序过程中出现不同基因具有相同节点中心性的情况时,依据一种基于目标基因的相邻基因节点中心性的策略对序列进行再次排序。最后依次为序列中的每一基因挑选出调控基因,并最终将所有基因的调控关系整合成完整的调控网络结构。算法在四个数据集上对其有效性进行验证,实验结果表明该算法具有良好的网络结构推测性能。
  (2)针对基因表达数据的“高维度、小样本”的数据特点,本文提出了一种基于最大相关最大显著的调控网络结构推测算法 MRMSn。该算法将基因调控网络结构推测问题转化为为每个目标基因挑选调控基因的二分类问题。为了有效挑选目标基因的调控基因,算法给出了一种基于互信息和熵减少的特征基因挑选模型,模型提供的一阶增量搜索的算法保证了所挑选的调控基因能近似地获得模型的极优值。模型中涉及不同特征的权重问题,因此本文给出了一种基于局部密度的权重自动设定方法。最后所有基因的调控关系基于一种给定约束被调整,并整合成完整的调控网络结构。算法在五个数据集上进行有效性验证,实验结果表明该算法具有良好的推测性能。
  (3)基因表达数据具有高噪声及非线性相关的特性,这使得基因调控网络结构的推测具有较高的假阳性率,有必要通过冗余控制技术分别除去这些冗余的调控关系。为此本文提出了一种基于冗余控制策略的调控网络结构推测算法RRMRNET,该算法是 MRNET算法的一种扩展。该算法首先利用一种新的基于信息论和聚类技术的冗余控制策略以减少非线性相关所引起的冗余调控关系;然后基于互信息及条件互信息为每一个目标基因分配有效的“best-first”调控基因以减少因数据噪声所引起的冗余关系。最后将所获得的每一个基因的候选基因集及“best-first”调控基因作为 MRNET算法的输入并获取最终的网络结构。RRMRNET算法在六种数据集上进行有效性验证,实验结果表明冗余控制策略能有效提升网络结构准确性。
[硕士论文] 冯清
公共卫生 山西医科大学 2017(学位年度)
摘要:目的:
  以NCBI创建的开放式基因表达综合数据库(Gene Expression Omnibu,GEO)为例,开发爬虫程序可以有效的解决日益增长的高通量基因表达的实验数据带来的问题。对信息进行挖掘和处理,而不被海量信息所淹没,提高数据库的利用率;减少生物医学信息资源的浪费,为医学工作者供给全面的基因表达数据信息,推动临床生物信息学的发展。
  方法:
  1.文献分析法:
  查阅网络爬虫系统、网页抓取技术、GEO数据库方面的相关文献等,深入学习了解网络爬虫系统发展现状,网页抓取技术的策略和GEO数据库发展现状。为开发设计专门适用于GEO数据库中RNA相关数据抓取的网络爬虫系统提供理论参考和实践经验。
  2.编程语言:
  利用Python语言编写爬虫程序。
  3.数据库技术;
  使用MySQL数据库技术储存爬虫程序爬取到的基因表达数据。
  结果:
  1.本研究成功开发一款爬虫程序,爬虫程序投入运行;
  2.爬虫程序抓取GEO数据库中全部基因表达数据共71032个,并保存在Mysql数据库中。
  结论:
  爬虫程序实现GEO数据库中基因表达信息相关数据的自动抓取,免去人工下载的繁琐,有效的实现数据的大规模下载。高效地从数据库的海量信息中挖掘出有效的信息或者生物知识,帮助临床研究者浏览生物医学文献,允许数据资源的批量下载,很大程度上方便生物研究与信息的查询与借鉴。其抓取到的成果不仅对基础医学研究有极大推动作用,而且对人类疾病防治,基因定位等都具有重要意义。
[硕士论文] 黄群
机械电子工程 哈尔滨工业大学 2017(学位年度)
摘要:经过亿万年的进化过程,鱼类获得了无比优越的游动性能。相比起人造的水下自主航行器,鱼类的游动具有速度快、效率高、机动性强、噪声小等特点。近年来,主要靠身体和尾鳍的周期性摆动来实现向前推进的身体/尾鳍型(Body and/or Caudal Fin,BCF)鱼类已成为仿生学领域中重要的仿生对象。但是人们对于鱼类的游动机理的认识还有很多不足。
  本文根据鱼类的生理结构,将由肌肉、骨骼、皮肤等复杂粘弹性结构组成的BCF柔性鱼体简化为多刚体串联结构,其中鱼体的粘弹性被简化为各关节的刚度和阻尼,鱼体的肌肉驱动则被简化为特定关节的主动力矩。基于大摆幅细长体理论计算鱼体各处受到的水作用力,并考虑鱼体运动过程中受到的阻力和升力,利用基于解耦的自然正交补矩阵的多体动力学方法建立BCF柔性鱼体的游动模型。在零位将游动模型线性化,建立鱼体的横向振动方程,根据大摆幅细长体理论,计算鱼体受到的平均推力,并依此计算鱼体的游动速度。
  应用Saha等人提出的动力学迭代方法可以对此游动模型进行数值求解。数值计算结果表明,在正弦力矩激励下,鱼体实现从静止加速,最终达到稳定直线游动状态。分析了不同激励力矩和激励频率下鲹科和鳗鲡科鱼体的游动特性。结果表明,在激励力矩较小时,随着激励频率增加,鱼体的尾尖摆幅和游动速度在鱼体固有频率附近有峰值;随着激励力矩增大,尾尖摆幅和游动速度增大,峰值变得不明显甚至消失。数值求解结果表明,鱼体所受升力和尾部集中力对鱼体摆动有阻尼作用;升力对鳗鲡科鱼体的阻尼作用更明显。
  最后用硅胶材料制作了柔性仿生鱼,开展了运动学测量实验和静止推进力测量实验。实验结果表明,在小摆幅下,随着驱动频率升高,在某频率附近,鱼体的游动速度出现峰值。当摆幅过大,此峰值现象消失。鱼体的静止推进力的测量结果有同样的规律。
[硕士论文] 付强
计算机技术 哈尔滨工业大学 2017(学位年度)
摘要:冷胁迫对生物的生长和生活有着极度严重的影响,尤其是对植物来说。对植物的冷胁迫调节机制的研究,对相关的生物技术研究以及提高农作物产量等都有重要意义。当前,对植物冷胁迫蛋白的识别主要依靠人工进行,这种方式费时费力。截止目前,通过前期的资料整理,对整个拟南芥的蛋白数据库进行统计,已发现的与冷胁迫相关的蛋白仅有594条。所以,利用机器学习的方法,通过对已有的数据进行训练和预测,以为生物实验提供数据支持,具有一定的意义和研究价值。
  本研究探讨了PULearning方法,从理论上来讲PU Learning是最合适的方法之一。将除正例数据之外的蛋白序列作为未标记的数据。尝试了 PUCPI和 LibD3C两种当前比较常用的 PU Learning算法,但结果仅在50%上下。之后开始采用常用的分类算法进行尝试,将之前的未标记数据作为负例数据处理,并在LibSVM中得到了较好的结果。除了对分类算法的尝试,实验中还尝试了多种特征提取方法,如Pse-One、K-Skip-N-Gram、Information Theory等,以及对多种特征提取方法的组合。此时,分类的准确率提高到了80%以上。在最后,一个新的负例集合被构造出来(这样可以有效的降低负例集中包含的未发现的冷胁迫蛋白的数量),并把分类准确率提高到了85%左右,取得了较好的结果。在寻找到了一个较好的冷胁迫蛋白的预测方法后,对现有的数据进行了整理并搭建了冷胁迫蛋白数据库网站。网站采用了Maven、Spring Boot,Mybatis, Mysql、VUE等主流Java Web开发技术,主要使用Java语言进行开发。为使用者提供了对拟南芥冷胁迫蛋白进行序列浏览、全文检索(Lucence)、序列比对(Blast)与分类预测等功能。
[硕士论文] 杜博雅
计算机科学与技术;计算机应用技术 东北农业大学 2017(学位年度)
摘要:在生物信息学领域,生物基因的序列比对一直是科学研究的热门问题之一。随着生物学的发展与对物种研究的深入,基因数据日益增多。同时新一代测序技术的出现,测序时间和成本下降、测序通量高使序列数据显著增加,呈指数形式增长趋势,并且每天仍有新的生物基因序列数据被发现和记录,而数据产生的速度远大于数据处理的速度,因此对大规模DNA测序数据的处理亟待更高效的方法。对海量数据进行及时有效的处理、分析,对于揭示其内涵、阐明和理解其所蕴含的生物学意义、得到对人类有用的信息具有重要意义。序列比对作为基因数据研究的基础问题,能够为后续基因组计划等研究提供重要信息,因此提高测序数据的序列比对速度至关重要。
  本文通过对已有序列比对算法的研究,针对目前基于BWT(Burrows-Wheeler Transform)索引技术的比对软件比对准确率高且内存消耗小,较其他基于哈希表的方法性能优越,但存在访存次数多,时间消耗较大的问题,就如何提高BWT索引技术的序列比对速度进行研究,提出一种应用基于Intel微架构的AVX(Advanced vector Extensions)指令技术,从改进原有算法内部函数运算方式的角度进行单线程并行优化的方法,对BWT算法中计算量大、多次递归调用的函数进行改写,减少函数运算次数及CPU访存次数,提高算法执行效率,实现提高BWT算法序列比对速度、降低算法时间消耗的目的。
  本文设计并实现了基于AVX指令集优化的BWT序列比对算法,在对BWT算法的代码及实现过程进行深入研究之后,找到适于AVX指令对代码改写的部分。将occ函数结果全部计算出来并存在内存中,在计算时使用AVX指令集的计算方式进行计算,使计算机能够一条指令并行执行多次计算,极大缩短算法运行时间。为验证比对结果的准确性和速度比,本文采用大豆测序数据对算法进行实验。实验结果表明,本文提出的指令改进有效提高了算法的查找效率,加快了序列比对速度。在接近源码比对准确率的同时提高比对速度近50%,使算法时间性能得到显著提升,实现序列比对在算法改写方向的并行优化。
  本文提出的基于AVX指令集的BWT序列比对算法相比于传统的算法计算过程,能够进行并行计算查找,有效减少函数计算时的循环遍历,减少计算次数与CPU访存次数,降低算法时间复杂度,提高序列比对速度,使得算法的时间性能有所提高。并且算法性能十分稳定,在低误配率下表现良好,对更精确的序列比对算法改进具有实际意义,为基因数据分析提供更高效快速的序列比对方法,为进一步加快对全基因组序列的处理打下基础。
[硕士论文] 蔡汝飞
机械电子工程 哈尔滨工业大学 2017(学位年度)
摘要:目前,随着科技的进步及人类需求的不断增加,智能化已成为机器人发展的重要方向之一,作为重要的感知系统,机器视觉已经成机器人领域的一个研究热点。仿生头眼机构作为机器视觉研究硬件平台,其性能直接影响到机器视觉系统的能力和水平,因此相关研究越来越受到重视,其应用也越来越广泛。作为国家863计划课题“面向非结构化环境理解的仿生眼感知与识别”的子课题,本文基于人体眼颈部运动机理,研制了一款新型宽视野仿生头眼机构,并就其结构、运动学、动力学、控制以及实验等方面展开研究。
  首先,基于人体眼颈部运动机理,提出一种新型宽视野七自由度串并联仿生头眼机构,实现视野范围和运动速度均优于人眼颈部性能。为达到宽视野目的,采用可变焦镜头扩大图像获取距离,七自由度机构扩大图像获取方位。具体为,二自由度眼部并联机构,通过采取负载偏置,转轴正交的方式,保证刚度、强度及负载能力,实现±60°俯仰、偏航高速运动;三自由度串联颈部机构,实现俯仰、侧摆和回转姿态调整,扩大图像获取方位。
  然后,基于DH参数法和向量法,建立了串并联仿生头眼机构运动学模型,用于机器人的运动学以及轨迹规划与运动控制实现;在此基础上,分析颈部机构末端工作空间,单目机构关节转角范围在整个工作空间分布规律。基于ADAMS建立仿生头眼机构运动仿真分析模型,用于模型眼部、颈部单关节、多关节复合极限运动仿真,分析各关节运动范围、最大角速度、最大角加速度以及关节转矩等特性,验证了仿生头眼机构设计的合理性。
  其次,建立仿生头眼机构运动控制系统,基于工业以太网建立开放式分布控制系统,搭建控制系统硬件平台。对控制系统软件进行设计,编写控制程序,通过轨迹规划和运动学解算实现机器人运动控制和图形采集控制。
  最后,基于搭建的仿生头眼机构样机,利用激光跟踪仪对运动学参数和光电传感器零点位置进行标定,对机器人定位精度进行测试,表明样机满足设计要求。基于研制的仿生头眼机构实验样机,开展面向移动机器人进行图像采集实验,检测仿生头眼机构具有宽视野、快速响应的可变焦拍摄能力。
[硕士论文] 刘光辉
电子与通信工程 大连海事大学 2017(学位年度)
摘要:作为人类基因组重要的表观遗传现象,DNA甲基化是基因表达调控中常见而又重要的机制,参与细胞分化与增殖、生物体老化、肿瘤发生等多种重要的生命活动。DNA甲基化状态的检测是肿瘤类型鉴别诊断的辅助手段,可用于癌症发生的抑癌基因特异性失活的检测。新一代测序技术可以实现全基因组单碱基分辨率的甲基化检测,但是测序方法相对昂贵,采用计算的方法对DNA甲基化进行预测成为当前DNA甲基化生物信息学研究的热点。
  本文构建了预测DNA甲基化状态的三种神经网络模型,结果表明,与已有的模型相比,提高了DNA甲基化的预测准确率。本文主要工作如下:
  (1)利用人工神经网络模型预测DNA甲基化状态。使用人工手段组合不同的DNA甲基化特征,训练人工神经网络模型,预测DNA甲基化状态
  (2)利用深度神经网络和卷积神经网络预测DNA甲基化状态。使用DNA甲基化的全部特征信息,分别构建5层的深度神经网络模型和4层的卷积神经网络模型预测DNA甲基化状态。
  (3)利用深度神经网络和卷积神经网络提取的DNA甲基化特征,使用随机森林分类器进行DNA甲基化的预测。提取深度神经网络模型得到的特征,输入到随机森林模型进行状态预测,将深度神经网络提取到的特征结合原始特征一起作用于随机森林模型进行状态预测;提取卷积神经网络得到的特征输入到随机森林模型进行状态预测,将卷积神经网络得到的特征结合原始特征一起作用于随机森林模型进行状态预测。
[硕士论文] 李小永
计算机科学与技术 西安电子科技大学 2017(学位年度)
摘要:随着人类基因组测序和多种生物模式的顺利完成以及DNA微阵列技术的应用,由此产生了大量的基因表达数据,这些数据具有维数高,样本小的特点。如何有效地从大量基因表达数据中挖掘有价值信息,以求认识数据本质,了解生命过程,分析疾病形成原因,揭示基因功能和相互作用成为目前生物信息学研究所面临的巨大挑战。
  基于基因聚类和样本分类是针对基因表达数据挖掘其有用信息的关键手段。基因聚类就是对基因功能划分的一种重要手段,其中选择一种高效聚类方法是至关重要的。对样本分类是实现对基因识别和疾病诊断的一种有效辅助方式,其中对具有高维小样本数据分类的关键步骤是对数据进行降维和特征提取。本文针对基因聚类和样本分类,分别从非负矩阵分解和稀疏表示两个方向做了相关研究。
  方向一:非负矩阵分解作为一种新的矩阵分解方式,也是一种新的聚类方式。由于具有非负约束,不仅使得分解后结果具有现实物理意义,还能够较容易提取训练样本的局部特征,本文采用非负矩阵分解对基因聚类做了如下研究:
  基因聚类是挖掘基因有价值信息的一种有效方式,通过基因表达水平研究具有相似功能的基因。本文主要通过非负矩阵分解方法对基因的相似功能进行研究:
  (1)传统聚类方式过分依赖相似性度量,而非负矩阵作为一种有效的数据聚类方法,并不依赖相似度量函数,因此,本文使用基于非负矩阵分解对基因表达数据进行聚类分析;
  (2)非负矩阵分解对基因表达数据聚类并不能总是展现出良好的聚类效果,因此结合K均值聚类,提出一种基于非负矩阵快速聚类方法;
  (3)对yeast数据进行基因聚类分析,将文中所提方法与基本的非负矩阵分解和传统聚类方法进行实验,结果表明,所提出的基于非负矩阵快速聚类方法获得更稳定聚类效果。
  方向二:稀疏表示作为一种识别率高,鲁棒性强的分类技术,受到众多科研工作者的关注。稀疏表示技术并不关心特征的提取,而在于过多强调分类器的设计,因此,基于稀疏表示对基因表达数据分类的重心在于分类器设计。围绕非负矩阵分解和稀疏表示做了如下工作:
  基于基因表达数据样本分类,包括:
  (1)基于微阵列技术产生的基因表达数据不仅具有典型的高维小样本特性,而且有时每类样本数相差很大,造成严重数据倾斜,因此,提出一种基于数据平衡策略的稀疏表示方法;
  (2)传统的稀疏表示分类只是利用基因表达数据之间的线性关系,缺乏内在非线性关系,因此,利用基因的相似距离,提出一种相似性稀疏表示方法;
  (3)针对稀疏表示对高维小样本数据分类的运行速度慢而提出一种稀疏表示的快速计算方法,该方法在不损失精度情况下,大大提高了运行速度;
  (4)众所周知,基因表达数据也是一种典型高冗余数据,因此,为了降低基因表达数据冗余度,提出一种基于非负矩阵分解子空间的稀疏表示对基因表达数据分类;
  (5)基于6类真实基因表达数据进行了相关实验,结果表明:基于数据平衡策略的稀疏表示方法对于倾斜数据获得了更好的分类效果;相似性稀疏表示方法主要依赖于相似度量方式。
  本文采用了欧式距离、余弦距离、皮尔森系数三种度量方式,只有基于余弦距离和皮尔森系数的分类效果优于基本稀疏表示分类;稀疏表示的快速计算方法效率明显提高,仅对mit数据而言,高达32倍,其他数据也提高2-10倍;基于非负矩阵分解子空间的稀疏表示不仅降低了对具有高维小样本的基因表达数据对算法分类精度的影响,且在6组真实基因表达数据上实验的结果优于SRC,KSRC,CRC,MSRC,CRCpSOC和SVM等方法,而且在算法的稳定性方面也展现出良好的效果。
[硕士论文] 李坤锋
机械电子工程 汕头大学 2017(学位年度)
摘要:本文在国家自然科学基金的资助下,系统研究了一种超冗余仿生象鼻机器人的单元体运动学逆解、工作空间、象鼻整体的实体样机设计选型和虚拟样机仿真等技术问题。论文取得了如下成果:
  1.以超冗余仿生象鼻机器人构成单元体——3UPS-PRU并联机构为研究对象,研究其位置逆解、速度逆解、加速度逆解和跃度逆解;并根据给定末端参考点的运动轨迹求出位置、速度、加速度和跃度随时间的变化曲线。
  2.研究象鼻机器人工作空间。基于象鼻机器人是由多个理论模型相同的单元体构成的特点,首先运用通过位置逆解验证的边界搜索法,分析单元体在固定位置下的姿态空间和固定姿态下的位置空间。根据给定的尺度参数和约束参数,求得单元体的工作空间。根据参考平面内象鼻机器人脊线的极限边界和象鼻机器人工作空间的求解流程,求出了象鼻机器人在空间内的工作空间。
  3.在前期理论分析的基础上,根据生物象鼻的运动特点和生理结构,提出仿生象鼻机器人的机械结构设计要求和设计方案。结合课题研究的实际需求对象鼻机器人进行结构设计,并在此基础上选取符合设计要求的各部分零件。得到最终的象鼻机器人机械结构设计方案和所有最终的零件选型。
  4.运用虚拟样机技术建立3UPS-PRU并联机构的三维模型,对其进行逆运动学仿真;运用得到的变化曲线与通过理论分析得到的变化曲线之间的对比,验证了单元体理论模型的正确性。根据象鼻机器人整体的三维模型,和实际的质量与尺寸,在 ANSYS中对象鼻机器人整体强度进行校核,并对每个单元体运用ADAMS进行受力校核。由所得数据可知,象鼻机器人整体强度和每个单元体的受力情况都满足要求。
[硕士论文] 邱留洋
生物物理学 电子科技大学 2017(学位年度)
摘要:多肽在人体代谢的各个过程都承担了重要作用,其中包括细胞增殖、细胞分化、消化代谢、免疫防御、肿瘤病变等。在1953年,美国生化学家第一次人工合成了催产素这一多肽,标志着多肽可以为人们所利用。在经历了长期发展之后,现在在全球范围内上市的多肽药物已经超过了80种,并且还有很多多肽药物处于正在研究的阶段。与其它药物相比,多肽类药物具有一些独特的优势:药效好,特异性高,通常在人体内不会产生累积,很少和其他药物发生交叉作用。
  多肽药物虽然具有上述的这些优势,不过同其它的药物对比,多肽药物同样存在着缺点:多肽的稳定性较低,常常被肽酶分解为氨基酸,这导致多肽的半衰期很短,为了保证药效需要重复为患者给药,很不方便。为解决这一问题,学者们探索了很多新方法,蛋白融合技术是目前延长蛋白和多肽类药物半衰期的有效手段之一。Fc融合则是目前研究最多、进展最快的蛋白融合技术,它通常是将IgG蛋白的Fc段同筛选出的多肽融合在一起。这样的多肽(Peptide)-抗体(Antibody)融合蛋白被称为“肽体”(Peptibody)。
  研究者发现:在罗米司亭(romiplostim)这一药物中,Fc段和多肽通过不同的方式连接所得到的活性差别极大。通过Fc的C端和多肽连接的活性相比于通过Fc的N端同多肽连接要高出10倍以上。但对多肽与抗体连接方式与药效间的关系和相应的机制还尚不清楚,对其的研究也更多集中在实验方面,理论上的探索寥寥无几。
  本学位论文拟从结构生物信息学角度出发,利用ITASSER在线服务预测蛋白结构以及 ZDOCK对接蛋白从而构建相关的模型,预测分析出不同连接方式的肽体同受体的结合情况。然后通过 AMBER等分子动力学模拟软件计算结合自由能以及能量分解的方法研究不同结合方式的肽体同受体的相互作用,从理论上尝试解释不同肽体药物连接方式不同所致的活性不同提供理论支持。也为以后设计肽体药物给出理论上的预测。
[硕士论文] 聂东豪
机械电子工程 哈尔滨工业大学 2017(学位年度)
摘要:自然界中的鱼类以其游速高、机动性好等优点吸引了科研工作者广泛的关注。很多学者希望通过研究鱼类的游动机理,来研制出可以与鱼类媲美的具有高游动特性的水下推进装置。水下推进器在海洋勘测,水中营救,海洋考古,水下娱乐,军事竞备等各方面都具有不可替代的应用价值。金枪鱼以其游动速度快,游动效率高等特点成为仿生工作者的研究对象,本文以模仿金枪鱼为研究目标,提出了通过改变柔性鱼尾截面惯性矩的方式,设计和研制出了具有快速游动性能和良好转弯性能的柔性机器鱼。
  本文首先对鲔科鱼类的生理结构、外形参数等特征进行了分析,设计了柔性机器鱼的驱动方式、建立了机器鱼的三维模型。为解决当前机器鱼存在鱼尾摆幅小的问题,提出了通过改变鱼尾截面惯性矩的方式(即开槽处理)来改变鱼尾的抗弯刚度。建立了柔性鱼尾的物理模型,采用理论求解和有限元思想对鱼尾进行了模态分析。并使用ANSYS和Matlab软件进行了静力学分析,求解了鱼尾挠度,对鱼尾开槽位置进行了优化,给出了槽口的形位尺寸。
  针对仿生机器鱼尾鳍摆动的特点,设计了机器鱼的驱动方式,建立了机器鱼结构组件的三维模型,并采用3D打印技术进行了加工。搭建了基于STC89C52RC单片机的机器鱼硬件控制系统,对控制系统硬件电路进行了调试,使用无线收发模块来控制舵机的转动角度和转动频率,为后续机器鱼的鱼尾实现摆动频率、摆动幅度的改变提供了保障。
  最后,制作了仿生机器鱼原型,进行了大量游动性能的测试实验,实验结果表明,变截面柔性机器鱼的游动速度是原机器鱼游动速度的2倍,而对截面位置进行优化后的柔性机器鱼的游动速度是原机器鱼游动速度的3倍。实验充分验证了改变截面惯性矩可以获得鱼尾大摆幅方法的可行性和有效性,从而提高了机器鱼的游动性能。该方法的提出为将来仿生机器鱼及仿鱼推进器的研究提供了新的思路。
  (已选择0条) 清除
公   告

北京万方数据股份有限公司在天猫、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!查看详情

手机版

万方数据知识服务平台 扫码关注微信公众号

万方选题

学术圈
实名学术社交
订阅
收藏
快速查看收藏过的文献
客服
服务
回到
顶部