Uniprot Accession的格式以及正则表达式

Posted songbiao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Uniprot Accession的格式以及正则表达式相关的知识,希望对你有一定的参考价值。

Uniprot Accession

Uniprot accession是稳定的标识符,用于引用UniProtKB条目。在每个条目的数据信息整合到UniProtKB之后,每个条目都被分配了一个唯一的登录号,这个编号叫做“主Accession号”。
UniProtKB的登录号由6个或10个字母数字字符组成,其格式有以下三种pattern,请点击这里查看
这三种模式可以组合成以下的正则表达式:
[OPQ][0-9][A-Z0-9]{3}[0-9]|[A-NR-Z][0-9]([A-Z][A-Z0-9]{2}[0-9]){1,2}
Examples: A2BC19, P12345, A0A022YWF9

条目可以有多个登录号。这可能是由于两个不同的原因造成的:
a)当两个或两个以上的条目合并时,保留所有条目的登录号。第一个登录号称为“主(可供引用的)登录号”,其他的称为“第二登录号”。这些是按字母数字顺序列出的。
b)如果一个现有的条目被分割成两个或多个条目(‘demerged’),新的‘primary’登录号归属于所有分割的条目,而所有原始登录号保留为‘secondary’登录号。
Example: P29358 which has been ‘demerged’ into P68250 and P68251.

建议,在任何引用和链接中都应该使用条目的主登录号,因为它是条目唯一稳定的标识符。

致谢:
参考翻译来源

以上是关于Uniprot Accession的格式以及正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

Nr,GenBank, RefSeq, UniProt 数据库的异同

UniProt数据库怎么看

BioCodeElm格式中提取位点信息

sparql 连接查询解释它是如何工作的?

C#操作字符串以及正则表达式的用法总结

DisGeNET 数据库 数据的下载以及数据的应用