服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

仙桃学术 | 医院没有实验室?组织芯片带你发生信SCI

日期: 来源:解螺旋收集编辑:浮浮

大家好,我是浮浮~


最近有小伙伴说纯生信不好发了,审稿人要求补实验,但是所在医院没有实验室,qPCR和WB都做不了,马上就要进职称了,没有文章硬伤啊,怎么办?


今天带来的这篇文章“APOE Is a Prognostic Biomarker and Correlates with Immune Infiltrates in Papillary Thyroid Carcinoma”是2022年3月发表的生信文章,没有做基础实验,也没有自己收集临床组织样本,而是购买了组织芯片,加了一点点临床信息和免疫组化的结果就成功发表,我们一起来看一下吧。




期刊介绍



复现过程


接下来我们打开生信分析神器:仙桃工具,开始对本文进行复现。进入仙桃学术主页:https://www.xiantao.love/

点击“生信工具”



【高级版】 → 【立即使用】(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)。▼



首先我们来复现表达差异的结果,原文作者分析了主变量分子在泛癌中的表达情况,采用了非配对的形式,这样显示的癌种更多一些。在工具左侧菜单栏“表达差异(挑)”模块进入,选择“表达差异”菜单,工具提供了“非配对样本”和“配对样本”两种选择,我们来分别看一下。



原文使用了非配对,我们这里展示一下配对样本,点击进入页面后,首先选择“泛癌”疾病数据集,向右拖拽可以看到正常vs肿瘤,或者癌旁vs肿瘤,前者是纳入了GTEx中的正常样本数据。进行分析时可以两个都试一下,如果结果都比较好,可以像本文一样都展示出来。


这里纳入的都是TCGA中的样本,格式有TPM和FPKM两种(两个TPM格式的数据是相同的)。这两种格式都有很多参考文献支持,建议优先选择TPM格式,但是如果FPKM格式的结果较好,展示这种也是可以的。如果想分析miRNA,就选择miRNAseq数据。


右侧参数部分输入分子,这里输入“APOE”,点击“确认”进行绘图。



我们可以看到结果部分有甲状腺癌的结果,并且在肿瘤中表达高于正常对照组,具有统计学意义。如果这里没有大家研究的疾病,也可以不展示配对结果。



接下来我们看一下非配对样本形式,操作也是相同的,并且仙桃工具具有记忆疾病和分子的功能,进入“非配对样本”模块后,疾病和分子都是选好的,直接点击“确认”即可。这里建议选择GTEx的正常样本配对,样本数目多,而且得到的结果会比较好看一些。



这里说明一下非配对的样本,TCGA-GTEx的数据,纳入了正常组织的配对样本,由于TCGA中都是癌旁的样本,这一点在“临床资料”这列也可以看出来。第二行和第三行都是TPM格式的TCGA数据,但是来源不同,XENA-TCGA是XENA数据库中的泛癌样本,TCGA-ALL是直接从TCGA获取的数据,自己分析的时候两个都是可以的,只要在写文章的时候注明数据来源。最后两行就不多啰嗦了,一个是FPKM格式,最后一行是miRNA的数据。



结果这里提供多种格式进行下载,“保存结果”可以上传到历史记录中,可直接用于后续拼图,重复上述操作可以得到正常vs肿瘤和癌旁vs肿瘤的结果。好用的拼图功能已经多次详细展示了,这里就不再重复了,还不会的小伙伴可以关注“挑圈联靠”公众号,查看之前的推文,有详细操作过程~


说明一下源代码问题,有小伙伴说有些杂志要求提供代码,这一点我们也是考虑到了的。在高级版权限下,结果部分最后的demo.R就是核心代码,投稿上传是足够了的,不过只有高级版提供哦。


接下来作者分析了主变量在THCA中的表达差异情况,这里以非配对为例,疾病选择THCA,右侧参数中分子输入“APOE”,点击“确认”即可。



比原文中的显著性还高,并且是习惯性的正常对照放在左边,个人感觉看起来比原文的还舒服一些。右侧参数还可以选择其它类型的图形进行展示,并且可以调整结果图片的参数,鼠标点一点就能够轻松实现,方便不撞车。



如果自己研究的疾病具有配对样本,想要同时展示配对结果也是可以的。作者使用了HPA数据库(https://www.proteinatlas.org/)展示了免疫组化的结果。这部分虽然是实验结果,但是也算是生信挖掘,建议大家能够自己收集样本做一下免疫组化。


进入数据库官网,在首页面输入分子名称,点击“Search”



一般第一条就是目标基因,点击“Tissue”



在左侧栏的“TISSUES”中找到目标组织



点击图片可以看到该组织染色的详细信息



在上方点击“Pathology”获取APOE在肿瘤中的免疫组化图像



还是左侧栏点击“CANCER”,选择“THYROID CANCER”



点击图片进入就可以看到放大结果和该片子的详细信息。鼠标放在图片上右键即可另存为本地文件。



接下来分析了主变量分子的临床相关性。原文作者使用了UALCAN数据库进行分析可视化,这里我们来看一下仙桃如何获得更好看、更个性化的结果吧。


在“临床意义”分组下,第一个就是“临床相关性”



页面看起来复杂,但也都是通过鼠标点一点完成的。主要在下方选择相应的临床指标和分类,点击“确认”即可出图。



原文图片中代表统计意义的星号是后期AI/PS处理的,使用仙桃可以直接得到带有统计指标的结果图片,在右侧参数“统计分析”中,可以选择显示的组别以及显示类型。



仙桃的自动配色已经非常好看了,如果大家想要更加个性化的结果,也可以选择其它配色方案。



相关的临床指标每一种癌症都是不完全相同的,也有一些与癌症特点相关的个性化指标,操作都一样,大家根据疾病特点选择即可。



接下来是经典的KM生存分析曲线,仍然在“临床意义”中,下拉“预后分析”选项,点击“KM曲线图”进入模块。



由于工具可以记忆上一次分析的疾病和分子,所以该页面点进去时不需要更改任何内容,直接点击“确认”出图,非常方便快捷~




在右侧“预后参数”中可以选择“预后类型”,绘制不同类型的KM曲线图。



这里有个细节,之前分析中APOE在肿瘤组表达升高,而在这里APOE作为一种保护因素,高表达APOE反而获得了较高的预后生存率,之前也有学员分析自己课题的时候出现这样的情况,感兴趣的小伙伴可以阅读一下原文,看下作者是如何解释的,以后如果自己遇到这种情况,就可以模仿作者的解释,或者将这篇文献引用,回应审稿人的质疑。


我们继续复现文章。接下来作者绘制了ROC曲线,这时使用了组织芯片的临床数据和免疫组化结果,这里只展示了典型图片。组织芯片的数据我们无法复现,ROC曲线还是能够轻松实现的。


在“临床意义”模块中点击“ROC曲线”进入。这里有两个,另一个是“ROC曲线-自选变量”,我们一会也来看一下。



仍然是进入后点击“确认”即可,如果想要更加个性化的图片,可以在右侧参数中进行调整,之前也介绍过,而且参数的调整也是完全通过点鼠标完成的,非常简便,这里就不赘述了。



接下来我们看一下“ROC曲线-自选变量”



比刚才的ROC曲线多了一个临床变量,其实也很好理解,比如选择临床的状态,以正常和肿瘤组织分组,点击“确认”。



可以看到其实和刚才的结果是一样的,因为默认的ROC曲线就是以Normal和Tumor分组的。不过这里可以选择其它临床特征的变量,大家在分析自己研究的疾病时候可以多试一些变量,挑选结果比较好的进行展示。



接下来是免疫浸润分析,作者使用了TIMER和TISIDB数据库来分析免疫浸润,而我们使用仙桃工具就可以了,还能得到风格统一的结果。在“交互网络”中,展开“免疫浸润”分析,可以看到有三种可视化形式,我们一起来看一下。



仍然是自动选择疾病和分子,直接点击“确认”出图,我们来看一下。



这样棒棒糖图就做好了,可以看到该目的基因的确与各种免疫细胞都有比较高的相关性,而且都是正相关,接下来我们重点看一下右侧参数可以调整的风格。



个人比较喜欢的是横向的棒棒糖图,这个主要看拼图时候的布局。在“风格”中取消“XY轴颠倒”,并将“X轴文本翻转角度”设置为“45”,最后调整到比较合适的图片大小即可。



最后得到的结果如下。横向和纵向都出现过文章中,所以这个完全是个人习惯和图片布局,对于结果并没有很大的影响,大家可以自由选择。



接下来是分组比较图,就在棒棒糖图的下方,点击进入,在右侧“参数”中的“类型”可以选择箱式图、小提琴图等类型。“算法参数”下方可以选择细胞种类,如果这里同时选了几种细胞,就可以在同一张图片中展示分组结果。



在风格和图片中调节风格和图片大小,小伙伴们赶快动手实操试一下吧。



接下来我们看一下“散点图”。进入后疾病和分子不变,在“算法参数”中的“细胞”可以选择多种免疫细胞进行分析,这里以T细胞为例。



这里可以分析多个细胞类型,保存结果,然后使用仙桃工具的拼图工具进行拼图,非常方便。



原文作者使用了TISIDB数据库进一步分析了主变量在泛癌中与免疫检查点的相关性。这里不推荐大家这样分析,因为开始的泛癌表达差异到后面的甲状腺癌可以看作是由大到小的聚焦,这里突然又进行泛癌的分析,反而让逻辑混乱了。这里作者之所以使用泛癌,可能是因为该数据库无法调整某个单一的癌种,所以作者只能这样做,而且可以看到,得到的图片非常模糊,所以我们还是使用仙桃工具轻松搞定。


在“交互网络”中,下拉“分子相关性分析”,点击“单基因共表达热图”进入。


备注:这里的(临时)是指为了学员更好地体验仙桃工具,我们对基础版临时开放的部分高级版权限模块,已经购买高级版的学员不用担心,模块不会取消的,并且以后更新的模块也都是免费使用的,不再另外收费~



这步相对来说会比较麻烦一点点,因为要在分子列表中输入分析的分子名称,大家可以参考原文,输入原文的基因名称进行分析。



这样得到的结果美观清晰,而且逻辑还不突兀,仍然是单个癌种的分析。大家可以分别尝试原文中另外三组标志物,四张图片拼一张figure,也很好看。



本文到此就复现结束了,逻辑比较清晰,以生信为主,购买了组织芯片,这样既不需要补实验,也不用自己收集临床标本,为大家又提供了一种性价比很高的方式。而且我在网上查了一下,还有泛癌的组织芯片,十几种癌症类型,每种3-7例样本,大家可以咨询一下当地的公司,趁现在补充表达差异的结果还能够发文章,组织芯片算是很好的选择了。


最近小伙伴们总说生信文章发不出去了,做生信没有用啦。这个观点个人是不赞同的,生信文章越来越难发我承认,毕竟有了仙桃这样的工具,入门的门槛降低后,发表的门槛必然升高。但是内卷是必然的,未来的要求只会越来越高,如果现在不抓住机会赶紧分析赶紧发表,那么一段时间之后,仅仅补充表达差异实验的文章也发不出去了,可能多数杂志就要求补功能表型的实验了。


所以希望大家不要焦虑,而是能够抓紧开始,赶上这趟末班车,也祝愿大家都能够早日发表自己的生信文章,更多的教学内容大家可以参照往期的复现推文,也可以加入我们的生信训练营,包括但不限于基础班训练营、高级版训练营、文章复现训练营、分模块教学的快闪营、写作工具训练营等等,还有现在雪球老师正在进行的生信培训,从生信小白到生信高手的成长之路,感兴趣的小伙伴千万不要错过啦~

—END—

扫描下方二维码

回复“生信”免费邀您进入【复现营】(名额有限)

开启高质量零代码复现教学!




相关阅读

  • 因子投资的高维数时代

  • 作者:石川,北京量信投资管理有限公司创始合伙人,清华大学学士、硕士,麻省理工学院博士。《因子投资:方法与实践》领衔作者,《机器学习与资产定价》译者。封面来源:https://www.pexe
  • 向下分享,向上社交

  • 成长重要吗?非常重要,如何更好的成长,如何提高认知?说的再通透一些,如何成为一个自己想成为的有钱人?赚钱就是一种修行。可能我比较俗,但现实就是如此;你有钱,别人会高看你一眼,你有钱
  • 搜索就该有结果

  • 前阵子在给一个平台设计「搜索结果」的系列功能,打算整理一份规则,产品同学突然问:“如果我们这一版做得简单一点,在结果页告诉用户没有找到他们想要搜的东西,是不是也行呢?这样也
  • 反思与检讨

  • 《三体》里面说过,当智子封锁了粒子加速器后,其可以制造出错误的结果,使地球上很多物理学规则完全失效。比如过去输入四个不同的参数,会得到四个不同的结果。但现在哪怕是输入同
  • 新手使用ChatGPT需要避免的8个错误

  • ——Midjourney绘图如果ChatGPT是未来世界为每个登上新大陆人发放的一把AK47,那么现在大多数人做的事,就是突突突一阵扫射,不管也不知道有没有扫射到自己想要的目标。每个人都
  • 年终绩效考核,怎样做到合理有效?

  • 一到年末,人力资源部门就成了全公司最忙碌的一个部门,绩效考核要做起来了!年关将至,HR最关注的话题非“绩效考核”莫属!因为这不仅关系到员工的绩效工资和年终奖,还与来年员工薪资
  • 天翼云:第一

  • 近日,天翼云智能边缘事业部AI团队在中文语言理解零样本学习权威榜单ZeroCLUE中拔得头筹,这标志着天翼云AI在认知智能领域处于行业领先地位。ZeroCLUE是中文语言理解零样本学习

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章