Seqanswers Leaderboard Ad

**GenoMax** · 11-23-2013, 05:57 AM

Based on the example data provided it appears that Augustus may be expecting the training sequences to be in this format:

Code:

LOCUS       HS04636   9453 bp  DNA
FEATURES             Location/Qualifiers
     source          1..9453
     CDS             join(966..1017,1818..1934,2055..2198,2852..2995,3426..3607,
                     4340..4423,4543..4789,5072..5358,5860..6007,6494..6903)
BASE COUNT     2937 a   1716 c  1710 g   3090 t
ORIGIN
        1 gagctcacat taactattta cagggtaact gcttaggacc agtattatga ggagaattta
       61 cctttcccgc ctctctttcc aagaaacaag gagggggtga aggtacggag aacagtattt
      121 cttctgttga aagcaactta gctacaaaga taaattacag ctatgtacac tgaaggtagc
      181 tatttcattc cacaaaataa gagtttttta aaaagctatg tatgtatgtg ctgcatatag
      241 agcagatata cagcctatta agcgtcgtca ctaaaacata aaacatgtca gcctttctta
      301 accttactcg ccccagtctg tcccgacgtg acttcctcga ccctctaaag acgtacagac
      361 cagacacggc ggcggcggcg ggagagggga ttccctgcgc ccccggacct cagggccgct
      421 cagattcctg gagaggaagc caagtgtcct tctgccctcc cccggtatcc catccaaggc
      481 gatcagtcca gaactggctc tcggaagcgc tcgggcaaag actgcgaaga agaaaagaca
      541 tctggcggaa acctgtgcgc ctggggcggt ggaactcggg gaggagaggg agggatcaga

so on to the next record

     9241 acactgttca ctgttttttt taaaaaaaaa acttgatttg ttattaacat tgatctgctg
     9301 acaaaacctg ggaatttggg ttgtgtatgc gaatgtttca gtgcctcaga caaatgtgta
     9361 tttaacttat gtaaaagata agtctggaaa taaatgtctg tttatttttg tactatttaa
     9421 aaaaaaaaaa aaaaatcgat gtcgactcga gtc
//
LOCUS       HS08198   2344 bp  DNA
FEATURES             Location/Qualifiers
     source          1..2344
     CDS             join(445..582,758..894,1053..1123,1208..1315,1587..1688,177
                     2..1810,1890..1903)
BASE COUNT     400 a   730 c  778 g   436 t
ORIGIN
        1 agcgggcggc ggtcgtgggc ggggttgcag gcgaggctca acgaacgctg gtctgaccgt
       61 cggcgctccc tgttgccggg ccctgagcaa gtggcttcat gaaccccgtg acgttggcca
      121 tggagataag accactgggt gatggtttaa ggaagataac gtgtaaaggg ctaaggactg
      181 tcggtggaaa tcaggggtgc aggagaaatg gataaacagc cagaggtcaa ctcggacttt

**condomitti** · 11-23-2013, 06:24 AM

GenoMax, do you know any tool I could use to convert from one format to the one in the example?

Thanks.

Topics	Statistics	Last Post
Genetic Variants and Diabetes Risk in Childhood Cancer Survivors by seqadmin Started by seqadmin, Today, 08:47 AM	0 responses 12 views 0 likes	Last Post by seqadmin Today, 08:47 AM
Cancer Metastasis: A Deep Dive into Cellular Plasticity by seqadmin Started by seqadmin, 04-11-2024, 12:08 PM	0 responses 60 views 0 likes	Last Post by seqadmin 04-11-2024, 12:08 PM
Proteogenomic Profiles Offer New Clues in Prostate Cancer by seqadmin Started by seqadmin, 04-10-2024, 10:19 PM	0 responses 59 views 0 likes	Last Post by seqadmin 04-10-2024, 10:19 PM
Novel Diagnostic Assay Enhances Ovarian Cancer Detection by seqadmin Started by seqadmin, 04-10-2024, 09:21 AM	0 responses 54 views 0 likes	Last Post by seqadmin 04-10-2024, 09:21 AM

Seqanswers Leaderboard Ad

Announcement

augustus gene finder

Comment

Comment

Latest Articles

ad_right_rmr

News