MEGAN使用

软件介绍:

MEGAN主要是利用LCA算法分析宏基因组BLAST结果。不仅能够分析宏基因组的物种丰度和多样性,还能够对功能基因的多样性和丰度进行分析。我之所以接触到这个软件,是因为实验室一位同学让我帮他利用blastp to NRd的结果提取物种信息。也就是利用Gi号来提取物种分类信息。

此软件是使用Java写的,这里要注意运行这个软件需要最新版的jre,而不是JDK。

官网:http://ab.inf.uni-tuebingen.de/software/megan6/

软件使用:

1. 软件安装

此软件分为两个版本,一个是Community Edition,一个是Ultimate Edition. CE版本是一个免费的版本,不能使用命令行界面。UE版本是付费版本,但是可以使用命令行界面。我们当然使用免费的版本啦(毕竟没钱)。但是我强烈建议CE版本也要下载Linux版本的,不要使用windows版本的,因为这个软件还是很耗内存的。自己的小电脑用起来会比较卡。

1.1 软件下载

网址:http://ab.inf.uni-tuebingen.de/data/software/megan6/download/welcome.html

下载
MEGAN_Community_unix_6_10_5.sh 版本的。

同时还需要下载需要的配置文件

Mapping files for current NCBI-nr protein database (not containing GI numbers):

prot_acc2tax-Oct2017X1.abin.zip Protein accession to NCBI-taxonomy mapping file. Must be unzipped before use.

nucl_acc2tax-Oct2017.abin.zip Nucleotide accession to NCBI-taxonomy mapping file. Must be unzipped before use.

acc2interpro-Nov2016XX.abin.zip Protein accession to InterPro mapping file. Must be unzipped before use.

acc2eggnog-Oct2016X.abin.zip Protein accession to eggNOG mapping file. Must be unzipped before use.

acc2seed-May2015XX.abin.zip Protein accession to SEED mapping file. Must be unzipped before use.

acc2kegg-Nov2016X-ue.abin.zip Protein accession to KEGG mapping file. Only for use with the Ultimate Edition of MEGAN. Must be unzipped before use.

Mapping file for working with the SILVA SSU database:

SSURef_NR99_128_tax_silva_to_NCBI_synonyms.map.gzProvide this file to MEGAN as a synonyms mapping file when importing alignments against the Silva database. No need to decompress before use.

Deprecated mapping files for NCBI-nr protein database (releases until August 2016, containing GI numbers):

prot_gi2tax-Aug2016X.bin.zip GI to NCBI-taxonomy mapping file. Must be unzipped before use. 

nucl_gi2tax-Aug2016.bin.zip GI to NCBI-taxonomy mapping file. Must be unzipped before use.

gi2eggnog-June2016X.bin.zip GI to eggNOG mapping file. Must be unzipped before use.

gi2interpro-June2016X.bin.zip GI to InterPro mapping file. Must be unzipped before use.

gi2seed-May2015X.bin.zip GI to SEED mapping file. Must be unzipped before use.

gi2kegg-Aug2016X-ue.bin.zip GI to KEGG mapping file. Only for use with the Ultimate Edition of MEGAN. Must be unzipped before use.

来自 <http://ab.inf.uni-tuebingen.de/data/software/megan6/download/welcome.html>

按照我的需要,我是想要按照GI号提取物种分类信息的,所以我下载prot_gi2tax-Aug2016X.bin.zip, 由于NCBI在2016年后已经废除了GI号,所以目前只能下载到2016年的版本,我建议以后大家还是使用蛋白号(protein accession来提取物种信息吧)。如果你使用的核苷酸序列的比对结果,那就下载nucl_gi2tax-Aug2016.bin.zip

1.2 软件安装

上传至工作站中,直接输入命令:

$ ./MEGAN_Community_unix_6_10_5.sh

注意:很重要,这里需要通过SSH与Xming执行远程Linux主机上的GUI应用程序,很显然是因为免费的版本没有命令界面啊。哈哈。(详细说明使用方法:)

xming操作方法参考:https://yapingxin.github.io/2016/12/28/linux-gui-remote-through-xming/

运行安装命令行会出现和windows安装一样的图形界面,直接点击下一步下一步就可以了。注意可以把运行内存设置的高一点,反正工作站还是比较强大的,我设置的是8G。

2.软件使用

安装完成后的界面是:


运行软件:

$ ./MEGAN

注意:运行软件需要the latest Oracle JRE (not OpenJDK),我一开始运行的时候不能运行,网上查找资料的时候发现我的工作站上的java不是Oracle JRE。又浪费了我半天的时间。不开心。

参考问题解答网站:http://megan.informatik.uni-tuebingen.de/t/megan6-linux-not-starting/127

好吧,那现在需要安装JRE啦

安装JRE

网址:http://www.oracle.com/technetwork/java/javase/downloads/jre8-downloads-2133155.html


我们的linux是64位的,当然下载Linux_x64的啦(上图红框),有没有发现红框上面还有一个.rpm版本的。这个rpm是指

:有一种rpm软件管理程序,用它来安装的软件后缀自然就是rpm的了,相关概念可以查看鸟哥的Linux,我们这个ubuntu不是使用这个软件管理程序的,所以我们下载.tar.gz版本的。

下载完成后直接解压就可以了:

$ tar -xzvf jre-8u151-linux-x64.tar.gz

解压后进入jre1.8.0_151.jre/Contents/Home/bin查看


为了方便,当然把此路径写入环境变量中喽:

$ export PATH=”/home-user/tmpuser/software/jre/jre1.8.0_151.jre/Contents/Home/bin”:$PATH

因为没有权限也没用sodu, 所以好像只能这样了。

注意:该命令修改只对当前终端有效,下次登陆不行了。哎,今天上午又浪费了一上午,果然基础很重要啊,要好好学习鸟哥的Linux.

故:可把jre的环境变量添加到$PATH开始和结尾, 分别对应的命令添加到.bashrc文件的结尾

export PATH=”/home-user/tmpuser/software/jre/jre1.8.0_151.jre/Contents/Home/bin“:$PATH

export PATH=”$PATH:/home-user/tmpuser/software/jre/jre1.8.0_151.jre/Contents/Home/bin

另:由于执行的时候总是从$PATH的开始搜索可执行文件的位置,所以如果环境变量中已经设置了一个jdk,那么把新的jdk设置在PATH的开始才会有用。

 

(回头系统学习一下,再来说说linux权限设置的问题,下一课)

写入后检查java版本

$ java -version


$ ./MEGAN

成功运行MEGAN,会跳出和windows相同的GUI界面,这要得益于xming软件啦。

2.1 正式进入软件操作

a. File -> Import From BLAST


b. 输入blastp to NR的结果


c. 输入map文件,就是之前下载的prot_gi2tax-Aug2016X.bin.zip(解压后的)


d. 运行结果及结果导出



导出如下结果:


这是一个以tab分割的文件,显示每条序列的名字和其比对到的序列taxonomy path.

写在最后:这个文件功能确实很强大,还可以做功能分析(KEGG等分类),这里就抛砖引玉。想要深入地使用还是需要认真阅读他的manual。

Leave a Reply

Your email address will not be published.