新闻资讯

硬核干货 | 蛋白组学原始数据上传宝典

2021-08-10
中科新生命
3990

近期,很多客户在蛋白质组学文章投稿时遇到下面的问题,编辑要求将原始数据上传到公共数据库

那么问题来了:

公共数据库是哪个数据库?

该怎么上传数据?

上传哪些数据呢?

下面,就由小编来给大家一一解答。

◆ 公共数据库有哪些?

目前主流的上传蛋白质组学数据的公共数据库有两种:ProteomeXchangeiProX

ProteomeXchange(简称PX) 网站是目前比较主流的上传蛋白组学质谱数据的存储平台(http://www.proteomexchange.org),旗下包括有PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等子平台。

iProX 是国内的上传蛋白质组学质谱数据的存储平台,是在ProteomeXchange协会制定的数据共享指导方针的指导下建立的,包括数据上传系统和蛋白质组数据库。用户可以将自己的蛋白质组数据以公开或私密方式上传。另外,由于iProX的服务器在国内,所以数据上传的速度相对较快,且不需要下载和安装软件。国内研究者亦可以选择该平台进行数据提交。

此次,就由小编给大家介绍一下iProX上传蛋白组学数据的方法步骤吧。

◆ 蛋白质组数据如何上传?

步骤一:注册账号和登录

进入iProX官网:

https://www.iprox.cn/page/HMV006.html,点击右上角Register。按照四步注册要求,填写用户名、密码、邮箱、姓名、单位等信息。

注册完成后,系统会给您注册时登记的邮箱发送确认邮件,进入您的邮件点击链接激活账号即可。激活后,便可使用注册的用户名和密码登录iProX

此时网页会提醒你安装或升级IBM Aspera插件,按照网页的提示依次下载安装即可。后面数据上传时会用到此插件。

image.png

步骤二:新建项目

登录后,即可进入如下页面。在“Project”下拉菜单“New Project”或“My Space”页面的“New Project+”新建项目。

image.png

Tips:上图左侧的Project Tree包含三种类型数据文件①Project是用户自己提交的projectsubprojectGroups是用户参加的group中对group成员开放的projectsubprojectPublic Project是所有对公众开放的projectsubproject。您如果将来参与了某个group或者对某个开放的项目感兴趣,可在此处打开查看。

步骤三:填写项目信息

在弹出的新页面中,根据上方导航栏顺序填写项目信息,包含项目标题、关键词、项目描述、作者、通讯作者等。注意:“*”为必填项,其他为选填。SubmitterLab HeadPublication填写完成后点击“save”,以免后续报错。

该页面中的“Access Level”有三种选择,如下图所示,客户可根据自己的要求选择对应的项目访问权限。信息填写完后点“Continue”保存当前填写信息进入下一步。

image.png

Tips:上图中的“Add to Groups”的含义是将项目(包括下面的子项目)共享到选择的群组,选择群组后,即使是“private”的项目和子项目,也对该群组成员公开。

Add to subprojects”即将项目(包括下面的子项目)添加到选择的超级项目,选择后,项目和子项目的实验元信息可通过超项目进行浏览,但项目和子项目数据的访问权限同“Access Level”中的选择。

步骤四:填写子项目信息

iProX提交系统以项目为数据管理单位的(相当于一次完整的实验研究),一个项目下可以有多个子项目(多次实验结果)。可以认为一个子项目为一个项目下面的一次实验;如果没有重复/对照等不同类型的实验,一个项目下面可以只有一个子项目。

该部分需要填写子项目名称、物种、质谱仪等相关信息。“*”为必填项,其他为选填。子项目中大量实验元信息需要通过标准的控制词汇表进行填写即可,即点击“Choose”,选填控制词汇表(CV)。若项目中的样本涉及多个物种,也可点击“+New”添加。

image.png

如果选项里没有您需要的词汇,可在“CV terms Search”里搜索并选择、添加。信息填写完后点“Continue”保存当前填写信息进入下一步。

image.png

步骤五:上传数据

iProX提供两种上传原始数据的方法:①通过网页直接上传(Upload by Browse),适合少量并且较小的文件(网页上传文件大小不能超过4Gb);②通过Aspera插件上传(upload by Aspera),适合大量较大的文件(不受文件大小和数量的限制)。一般推荐使用upload by Aspera

iProX提供两种数据提交方式:Complete submission(完整提交)和Partial submission(部分提交)。它们分别包含的要提交的数据及对应的格式如下表所示。目前由于利用 PRIDE Converter 2 生成 PRIDE XML 格式文件存在多种困难,所以现在多采用 Partial submission的形式来上传数据。上传数据时系统会根据文件的后缀进行判断,如系统判断错误,您可以手动更改:原始数据的File Type选择Raw,搜库结果选择Search

image.png

image.png

设置完成后,点击Strat upload,浏览器会自动启动Aspera,在弹出的对话框中输入您的iProX账号密码即可。上传成功后在Data File会出现你已经上传成功的文件名称,如下图(如果没有可以刷新页面)。信息填写完后点“Continue”保存当前填写信息进入下一步。

image.png

步骤六:确认信息

数据提交完成后,勾选刚刚上传数据的项目和子项目,然后点击Submit。接下来就是要等待iProX管理员的审核啦。审核完成后,您注册时登记的那个邮箱会收到一封邮件,如管理员有反馈意见,按照其意见更改或补充再提交即可。审核通过后,就可以获得iProX编号了。

image.png

数据上传的工作已经完成啦。是不是很简单呢?

最后的最后,在文章致谢后的"Data Availability"或者其他位置写明数据集的访问信息(URL, project ID),保密的数据集则需在邮件里告知编审数据访问的账号和密码。

中科新生命拥有17年蛋白组学科研服务经验,与国内1500多家科研院校、1000多家临床医院以及生物医药企业等有着良好的合作。此外,中科新生命有着专业的售后服务团队,为老师提供全面的技术支撑和耐心的问题解答。欢迎有组学意向的老师前来咨询。