在广大粉丝的期待下,《生信宝典》联合《宏基因组》在年1月11-13日北京鼓楼推出《扩增子有参无参分析和功能预测》专题培训第二期,为大家提供一条走进生信大门的捷径、为同行提供一个扩增子实战分析学习和交流的机会、助力学员真正理解分析原理和完成实战分析,独创四段式教学(3天集中授课+自行练习2周+集中讲解答疑+上课视频回看反复练习),“教—练—答—用”四个环节统一协调,真正实现独立分析大数据。
关于学习生物信息学分析的重要性,请阅读《生物信息9天速成班—成为团队中不可或缺的人》。
课程简介请详细阅读课程简介,如果以下内容您全精通,不必参加此培训。
本课程一共3天,每天6节课,共18节课,全部课程均理论与实战结合(只要课上讲的分析,都是可以带你自己实现的)。从分析平台搭建、Linux和R基础、图表解读和实战、扩增子分析标准流程、功能预测、统计分析以及各类高级分析(进化树、网络、环境因子、机器学习等),和CNS级图片修改排版。3天时间,老司机带您完成自学需要3个月甚至是3年的崎岖之路,助力您真正玩转扩增子分析。
课程大纲每节课1小时一个主题,理论结合实战,学懂原理,实战实操,全是老司机多年经验和代码的无私分享。下面是课程安排,如11代表 天 节课,26代表第二天第六节课,41为两周后的线上集中视频答疑。
编号主题简介11分析平台搭建Win10:git、R、Rstudio、R包、STAMP、AI等12Linux基础简介、优势、常用操作、序列处理等13R基础发展史、生物学中应用、ggplot2绘图14图表解读常用16种图表意义、使用场景15结果可视化16种图表的数据整理和在线绘制16发表级图版制作AdobeIllustrator制作CNS标准图版21扩增子介绍背景知识、分析原理、流程参数详解22扩增子分析流程Vsearch+Usearch跨平台 分析流程23STAMP统计分析玩转样本筛选、差异比较和统计图表保存24多样性分析R语言实现多样性、物种组成和差异比较图表25QIIME2Linux平台QIIME2 私人定制分析流程26网络分析文章解读,实战网络分析和网络属性比较31PICRUSt功能预测KEEG功能组成预测和统计绘图32Faprotax,Bugbase细菌元素循环和表型层面功能挖掘33机器学习随机森林分类回归,重现两篇Nature分析34进化分析序列筛选、比对、进化树构建和美化35环境因子文章解读,高分文章重现36研究热点展望总结、把握研究热点、展望技术发展趋势37考试50题自评学习效果、知识点回顾41答疑-线上答疑、考试内容串讲教程内容简介如下:
一、生信基础还在为没有Linux服务器而无法分析扩增子数据而苦恼吗?其实你的个人电脑就是扩增子分析的利器。易生信团队独创实现了跨平台的分析流程,在大家的Windows笔记本上可以轻松实现扩增子领域的绝大多数分析, 节课带你轻松在自己的本本上搭建数据分析平台。
图1.易生信首创基于Win10优化的扩增子分析流程,笔记本秒变大数据分析平台
推荐使用Windows10系统,8G内存分析更快更流畅。我们也会带大家在Linux上配置整个分析流程(Mac跟Linux类似,无做区别对待,但部分软件可能安装方式不同,未做深入测试,不建议参加培训时使用)。
同时讲解生物学家必要掌握的Shell和R语言基础知识,保证你高效、稳定的使用扩增子分析平台。
图2.Shell和R学习大纲,首创Rstuio中鼠标点击可完成Shell脚本和R语言分析,既打开生信的大门,又不会增加生物学家时间成本
二、图表解读和绘制专题针对很多老师缺少系统的生信背景,存在看不懂分析文章图表,更对绘制各式图表手足无措的情况。
我们推出过如下两个系列,共16篇原创文章,对8种图型进行讲解和R语言绘图。
扩增子图表解读-理解文章思路
扩增子统计绘图-冲击高分文章
但这些只是入门,在培训上,我们将结合发表高水平文章,进一步讲解16种常用分析图的原理和使用范围,让你不仅读懂图,更知道如何应用于自己的研究,并亲自轻松完成绘图。
针对大家使用R语言绘图学习时间成本较高的问题,易生团队针对常用16种图开发了免费绘图网站,一键出图,更可鼠标点选参数修改图形的个性样式。
图3.16种常用图形的表达的意义、使用场景和绘制。可使用我们的在线绘图工具实现。
为了让各种统计图片实现出版级的组图,特开设了一节AdobeIllustrator修图排版课,讲述基本使用技巧,轻松掌握精髓,让你文章图版档次向CNS看齐,轻松成为实验室的修图和拼图达人。
图4.AI排版本子图为CNS出版级组图示例(Science,封面文章)
三、扩增子理论和统计分析流程图5.典型的扩增子结构模型图
扩增子背景知识
背景:国际微生物组(人类HMP、环境EMP)计划、中国微生物组计划
研究对象:人、动物、植物、环境
研究方法:培养组学、扩增子测序(最常用)、宏基因组、宏转录组、宏蛋白组、宏代谢组、宏表观组等
宏基因组学的研究热点:微生物多样性、宏基因组、培养组、肠菌与疾病、MWAS
扩增子基本原理:细菌/古菌16S、真菌18S/ITS结构、引物选择等
实验设计:样品制备和建库中的误区
文章套路:扩增子分析SCI文章的物种组成、功能预测常用套路
主流方法优缺点比较:QIIME、QIIME2、mothur、Usearch-unois3、dada2等方法
扩增子分析流程
之前我们发布了基于QIIME(引用+)+Usearch(引用+)组合的史上最详细中文扩增子分析流程,累计阅读+
扩增子分析流程-把握分析细节
同时在去年也推出了年正式接档QIIME的 流程QIIME2的官方中文帮助文档,累计阅读5万+
QIIME2中文教程-把握分析趋势
想使用QIIME和QIIME2的小伙伴可直接点击上方链接学习。课上也会带大家用服务器操作,分享 私人定制流程。
但上面两种分析流程仍有很多缺点,如需要Linux服务器,安装和操作复杂,学习时间成本过高等不足。
易生信团队组织宏基因组、生信宝典的一线生信专家,为广大生物学家,定制了一套安装部署简单、鼠标点击编程、支持主流操作系统、学习成本低、又灵活的扩增子分析流程,助力生物学家轻松分析数据,更专注生物学现象的挖掘。
图6.扩增子分析流程金字塔,数据量从下向上逐渐减少
扩增子流程如下:
实验设计的编写
HiSeq/MiSeq数据的质控:fastqc,mulitqc
质控流程:双端序列合并、切除barcode和引物、质控
生成OTU/ESV:序列去冗余、聚类clust_otu(OTU)或去噪unoise3、dada2(ESV,ExactSequenceVariants)
OTU筛选:嵌合体生成原理及去除方法、去除线粒体、叶绿体和宿主非特异扩增污染、生成代表性序列和OTU表
物种注释及进化树构建
常用Alpha多样性指数计算
常用Beta多样性距离矩阵计算
现在你可以在自己笔记本或台式机上轻松分析扩增子啦!并且支持 的非聚类OTU的ESV方法,想自己亲自分析的朋友,快来北京参加9月扩增子专题培训班吧!这是今年 一期,错过就要等明年了。
图7.常用宏基因组统计作图软件STAMPLEfSe
引用过千次的STAMP绘制Extendedbarplot大家应该很常见,带你半小时速成。LEfSE引用超次,它的柱状图和圈图随处可见,但服务器超级难用,即上传痛苦,又要久等。我们为学员定制了专用国内服务器,随时为你服务。有服务器的伙伴还可以获得安装和使用的教程,在自己的服务器上用,不受网络和地域限制自己随时随便用。
四、可重复计算统计绘图对于可重复计算要求比较高、对细节有进一步分析要求的学员,我们还会教大家当前最 的R语言统计分析框架,让你零基础轻松实现可重复计算,满足 文章的代码公开和网页可重复要求(这些资源在生信公司是价格几十万的绝密流程代码,一般人是没有机会见到的)。
图8.数10种高质量图的R源代码实现可重复计算
在自己电脑上轻松修改输入文件、参数。可全程记录分析过程,保证从数据到发表级图形的可重复计算,让团队分析水平上升到大牛级别。
Alpha多样性各种指数:Shannon、Chao1、ObservedOTU、PDwholetree等,并配合Anova,LSD统计;
Beta多样性各种距离矩阵:BrayCurtis、Jaccard、WeightedUnifrac、UnweightedUnifrac等结果的树状图、箱线图、散点图展示样品间差异;并配合Adonis,Anosim,MRPP统计
有监督的主坐标轴分析(CCA/RDA),展示组间差异,anova.cca统计
DESeq/edgeR/t.test/wilcoxon统计组间差异,计算Pvalue和FDR
热图、曼哈顿图、火山图展示两组间比较差异分类单元或OTU/ESV
韦恩图、三元图、网络图展示两组及多组间相同与不同
五、功能预测和机器学习学习PICRUSt分析原理、常用结果展示样式及文章解读。实战进行北京看白癜风医院哪个好北京看白癜风医院哪家比较好