查看BioInfo的源代码
←
BioInfo
跳转到:
导航
,
搜索
因为以下原因,你没有权限编辑本页:
您刚才请求的操作只有这个用户组中的用户才能使用:
用户
您可以查看并复制此页面的源代码:
== 格式 == === FASTA === FASTA 格式(又称为Pearson格式)是一种基于文本的、用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来表示,且允许在序列前添加序列名及注释。 FASTA 文件以序列表示和序列作为一个基本单元,各行记录信息如下: * 第一行:以 ">" 开头的任意文字说明。用于序列标记,为了保证后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性 * 第二行:碱基序列。只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基酸常用大写字母。使用时应注意有些程序对大小写有明确要求。文件每行的字母一般不应超过 80 个字符 参考:https://en.wikipedia.org/wiki/FASTA_format <br> === FASTQ === FASTQ 最初由 Sanger 开发,目的是将 FASTA 格式数据与质量数据放到一起,目前已经成为高通量测序结果的事实标准。 FASTQ 文件以四行为一个基本单元,并对应一条序列的测序信息,各行记录信息如下: * 第一行:序列标识以及相关的描述信息。以‘@’开头,为了保证后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性 * 第二行:碱基序列 * 第三行:以‘+’开头,后面是序列标示符、描述信息,或者什么也不加 * 第四行:质量信息,长度和第二行的序列相对应,每一个序列都有一个质量评分,根据评分体系的不同,每个字符的含义表示的数字也不相同。 参考:https://en.wikipedia.org/wiki/FASTQ_format https://www.cnblogs.com/yahengwang/p/8973948.html <br> === EMBL === 以文献:《利用大肠杆菌中的功能互补克隆伊维斯特氏菌超氧化物歧化酶基因及基因产物的表征》提到的超氧化物歧化酶基因 (superoxide dismutase gene)为例: <source lang=bash> ID X64011; SV 1; linear; genomic DNA; STD; PRO; 756 BP. XX AC X64011; S78972; XX DT 28-APR-1992 (Rel. 31, Created) DT 26-SEP-2006 (Rel. 89, Last updated, Version 8) XX DE Listeria ivanovii sod gene for superoxide dismutase XX KW sod gene; superoxide dismutase. XX OS Listeria ivanovii OC Bacteria; Firmicutes; Bacilli; Bacillales; Listeriaceae; Listeria. XX RN [1] RX PUBMED; 1736100. RA Haas A., Goebel W.; RT "Cloning of a superoxide dismutase gene from Listeria ivanovii by RT functional complementation in Escherichia coli and characterization of the RT gene product"; RL Mol. Gen. Genet. 231(2):313-322(1992). XX RN [2] RP 1-756 RA Kreft J.; RT ; RL Submitted (21-APR-1992) to the INSDC. RL J. Kreft, Institut f. Mikrobiologie, Universitaet Wuerzburg, Biozentrum Am RL Hubland, 8700 Wuerzburg, FRG XX DR MD5; 3aef81a22cd6d78af1c13413d452aa45. DR EuropePMC; PMC2739203; 19682364. DR StrainInfo; 14848; 1. XX FH Key Location/Qualifiers FH FT source 1..756 FT /organism="Listeria ivanovii" FT /strain="ATCC 19119" FT /mol_type="genomic DNA" FT /db_xref="taxon:1638" FT regulatory 95..100 FT /gene="sod" FT /regulatory_class="ribosome_binding_site" FT CDS 109..717 FT /transl_table=11 FT /gene="sod" FT /product="superoxide dismutase" FT /EC_number="1.15.1.1" FT /db_xref="GOA:P28763" FT /db_xref="InterPro:IPR001189" FT /db_xref="InterPro:IPR019831" FT /db_xref="InterPro:IPR019832" FT /db_xref="InterPro:IPR019833" FT /db_xref="InterPro:IPR036314" FT /db_xref="InterPro:IPR036324" FT /db_xref="UniProtKB/Swiss-Prot:P28763" FT /protein_id="CAA45406.1" FT /translation="MTYELPKLPYTYDALEPNFDKETMEIHYTKHHNIYVTKLNEAVSG FT HAELASKPGEELVANLDSVPEEIRGAVRNHGGGHANHTLFWSSLSPNGGGAPTGNLKAA FT IESEFGTFDEFKEKFNAAAAARFGSGWAWLVVNNGKLEIVSTANQDSPLSEGKTPVLGL FT DVWEHAYYLKFQNRRPEYIDTFWNVINWDERNKRFDAAK" FT regulatory 723..746 FT /gene="sod" FT /regulatory_class="terminator" XX SQ Sequence 756 BP; 247 A; 136 C; 151 G; 222 T; 0 other; cgttatttaa ggtgttacat agttctatgg aaatagggtc tatacctttc gccttacaat 60 gtaatttctt ttcacataaa taataaacaa tccgaggagg aatttttaat gacttacgaa 120 ttaccaaaat taccttatac ttatgatgct ttggagccga attttgataa agaaacaatg 180 gaaattcact atacaaagca ccacaatatt tatgtaacaa aactaaatga agcagtctca 240 ggacacgcag aacttgcaag taaacctggg gaagaattag ttgctaatct agatagcgtt 300 cctgaagaaa ttcgtggcgc agtacgtaac cacggtggtg gacatgctaa ccatacttta 360 ttctggtcta gtcttagccc aaatggtggt ggtgctccaa ctggtaactt aaaagcagca 420 atcgaaagcg aattcggcac atttgatgaa ttcaaagaaa aattcaatgc ggcagctgcg 480 gctcgttttg gttcaggatg ggcatggcta gtagtgaaca atggtaaact agaaattgtt 540 tccactgcta accaagattc tccacttagc gaaggtaaaa ctccagttct tggcttagat 600 gtttgggaac atgcttatta tcttaaattc caaaaccgtc gtcctgaata cattgacaca 660 ttttggaatg taattaactg ggatgaacga aataaacgct ttgacgcagc aaaataatta 720 tcgaaaggct cacttaggtg ggtcttttta tttcta 756 // </source> <br>
返回到
BioInfo
。
个人工具
登录
名字空间
页面
讨论
变换
查看
阅读
查看源代码
查看历史
操作
搜索
导航
首页
社区专页
新闻动态
最近更改
随机页面
帮助
工具箱
链入页面
相关更改
特殊页面