报告时间:2023年12月25日上午10:00-11:00
报告地点:本部博远楼108
报告人:戈心舟,美国俄勒冈州立大学统计学助理教授



摘要:

高通量生物测序技术的发展使得生物学家可以同时观测到大量的生物学特征(例如基因、mRNA转录本和蛋白质),而在高通量生物数据分析中最重要的问题就是大规模的特征筛查(feature screening):从众多同时测量的特征中找出在不同生物学条件下有差异的特征。为了保证筛选出的特征的可靠性,统计学家提出了假发现率(FDR)这一标准。已有的用于FDR控制的统计学方法,包括著名的Benjamini-Hochberg算法,都是基于p(p-value)的。然而,真实数据中计算p值所要求的分布假设或大样本量往往无法得到满足,进而引发FDR无法得到有效控制的问题,这一问题会进一步导致错误的生物医学结论,浪费大量人力物力。为了提升生物医学数据分析中的统计严谨性,我们提出了一个适用性非常广的统计框架,Clipper。用于大规模特征筛查时,Clipper具有理论上的FDR控制且不依赖于p值。我们用大量的数据分析表明,Clipper是一种非常有效并且具有广泛应用的工具,可用于纠正多种生物医学数据分析中的FDR得不到控制的问题。

报告人介绍

戈心舟,美国俄勒冈州立大学统计学助理教授。于2022-2023年在哈佛大学统计系担任访问学者,于2021年在加州大学洛杉矶分校统计学系获得了博士学位。于2016年在北京大学best365网页版登录完成了统计学学士学位。报告人的研究主要专注于统计方法在生物医学数据中的应用。包括提高生物数据分析的统计严谨性,并提出应用于生物医学数据的多个统计和计算模型。他的多项工作发表在cellgenome biology等具有高影响力的学术期刊上。

邀请人:唐煜