Skip to content

Commit

Permalink
Added stop-codon introducing nucleotides, added longer reference.
Browse files Browse the repository at this point in the history
  • Loading branch information
jfjlaros committed Sep 4, 2015
1 parent be9dd66 commit e346cdf
Show file tree
Hide file tree
Showing 3 changed files with 234 additions and 5 deletions.
228 changes: 228 additions & 0 deletions data/mhv.fa
Original file line number Diff line number Diff line change
@@ -0,0 +1,228 @@
>MHV nsp1-11
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNATGGCAAAGATGGGCAAATACGGTCTCGGCT
TCAAATGGGCCCCAGAATTTCCATGGATGCTTCCGAACGCATCGGAGAAGTTGGGTAACC
CTGAGAGGTCAGAGGAGGATGGGTTTTGCCCCTCTGCTGCGCAAGAACCGAAAGTTAAAG
GAAAAACTTTGGTTAATCACGTGAGGGTGAATTGTAGCCGGCTTCCAGCTTTGGAATGCT
GTGTTCAGTCTGCCATAATCCGTGATATTTTTGTAGATGAGGATCCCCAGAAGGTGGAGG
CCTCAACTATGATGGCATTGCAGTTCGGTAGTGCCGTCTTGGTTAAGCCATCCAAGCGCT
TGTCTATTCAGGCATGGACTAATTTGGGTGTGCTTCCCAAAACAGCTGCCATGGGGTTGT
TCAAGCGCGTCTGCCTGTGTAACACCAGGGAGTGCTCTTGTGACGCCCACGTGGCCTTTC
ACCTTTTTACGGTCCAACCCGATGGTGTATGCCTGGGTAATGGCCGTTTTATAGGCTGGT
TCGTTCCAGTCACAGCCATACCGGAGTATGCGAAGCAGTGGTTGCAACCCTGGTCCATCC
TTCTTCGTAAGGGTGGTAACAAAGGGTCTGTGACATCCGGCCACTTCCGCCGCGCTGTTA
CCATGCCTGTGTATGACTTTAATGTAGAGGATGCTTGTGAGGAGGTTCATCTTAACCCGA
AGGGTAAGTACTCCTGCAAGGCGTATGCTCTTCTTAAGGGCTATCGCGGTGTTAAGCCCA
TCCTGTTTGTGGACCAGTATGGTTGCGACTATACTGGATGTCTCGCCAAGGGTCTTGAGG
ACTATGGCGATCTCACCTTGAGTGAGATGAAGGAGTTGTTCCCTGTGTGGCGTGACTCCT
TGGATAGTGAAGTCCTTGTGGCTTGGCACGTTGATCGAGATCCTCGGGCTGCTATGCGTC
TGCAGACTCTTGCTACTGTACGTTGCATTGATTATGTGGGCCAACCGACCGAGGATGTGG
TGGATGGAGATGTGGTAGTGCGTGAGCCTGCTCATCTTCTCGCAGCCAATGCCATTGTTA
AAAGACTCCCCCGTTTGGTGGAGACTATGCTGTATACGGATTCGTCCGTTACAGAATTCT
GTTATAAAACCAAGCTGTGTGAATGCGGTTTTATCACGCAGTTTGGCTATGTGGATTGTT
GTGGTGACACCTGCGATTTTCGTGGGTGGGTTGCCGGCAATATGATGGATGGCTTTCCAT
GTCCAGGGTGTACCAAAAATTATATGCCCTGGGAATTGGAGGCCCAGTCATCAGGTGTTA
TACCAGAAGGAGGTGTTCTATTCACTCAGAGCACTGATACAGTGAATCGTGAGTCCTTTA
AGCTCTACGGTCATGCTGTTGTGCCTTTTGGTTCTGCTGTGTATTGGAGCCCTTGCCCAG
GTATGTGGCTTCCAGTAATTTGGTCTTCTGTTAAGTCATACTCTGGTTTGACTTATACAG
GAGTAGTTGGTTGTAAGGCAATTGTTCAAGAGACAGACGCTATATGTCGTTCTCTGTATA
TGGATTATGTCCAGCACAAGTGTGGCAATCTCGAGCAGAGAGCTATCCTTGGATTGGACG
ATGTCTATCATAGACAGTTGCTTGTGAATAGGGGTGACTATAGTCTCCTCCTTGAGAATG
TGGATTTGTTTGTTAAGCGGCGCGCTGAATTTGCTTGCAAATTCGCCACCTGTGGAGATG
GTCTTGTACCCCTCCTACTAGATGGTTTAGTGCCCCGCAGTTATTATTTGATTAAGAGTG
GTCAAGCTTTCACCTCTATGATGGTTAATTTTAGCCATGAGGTGACTGACATGTGTATGG
ACATGGCTTTATTGTTCATGCATGATGTTAAAGTGGCCACTAAGTATGTTAAGAAGGTTA
CTGGCAAACTGGCCGTGCGCTTTAAAGCGTTGGGTGTAGCCGTTGTCAGAAAAATTACTG
AATGGTTTGATTTAGCCGTGGACATTGCTGCTAGTGCCGCTGGATGGCTTTGCTACCAGC
TGGTAAATGGCTTATTTGCAGTGGCCAATGGTGTTATAACCTTTGTACAGGAGGTGCCTG
AGCTTGTCAAGAATTTTGTTGACAAGTTCAAGGCATTTTTCAAGGTTTTGATCGACTCTA
TGTCGGTTTCTATCTTGTCTGGACTTACTGTTGTCAAGACTGCCTCAAATAGGGTGTGTC
TTGCTGGCAGTAAGGTTTATGAAGTTGTGCAGAAATCTTTGTCTGCATATGTTATGCCTG
TGGGTTGCAGTGAAGCCACTTGTTTGGTGGGTGAGATTGAACCTGCAGTTTTTGAAGATG
ATGTTGTTGATGTGGTTAAAGCCCCATTAACATATCAAGGCTGTTGTAAGCCACCCACTT
CTTTCGAGAAGATTTGTATTGTGGATAAATTGTATATGGCCAAGTGTGGTGATCAATTTT
ACCCTGTGGTTGTTGATAACGACACTGTTGGCGTGTTAGATCAGTGCTGGAGGTTTCCCT
GTGCGGGCAAGAAAGTCGAGTTTAACGACAAGCCCAAAGTCAGGAAGATACCCTCCACCC
GTAAGATTAAGATCACCTTCGCACTGGATGCGACCTTTGATAGTGTTCTTTCGAAGGCGT
GTTCAGAGTTTGAAGTTGATAAAGATGTTACATTGGATGAGCTGCTTGATGTTGTGCTTG
ACGCAGTTGAGAGTACGCTCAGCCCTTGTAAGGAGCATGATGTGATAGGCACAAAAGTTT
GTGCTTTACTTGATAGGTTGGCAGGAGATTATGTCTATCTTTTTGATGAGGGAGGCGATG
AAGTGATCGCCCCGAGGATGTATTGTTCCTTTTCTGCTCCTGATGATGAAGACTGCGTTG
CAGCGGATGTTGTAGATGCAGATGAAAACCAAGATGATGATGCTGAAGACTCAGCAGTCC
TTGTCGCTGATACCCAAGAAGAGGACGGCGTTGCCAAGGGGCAGGTTGAGGCGGATTCGG
AAATTTGCGTTGCGCATACTGGTAGTCAAGAAGAATTGGCTGAGCCTGATGCTGTCGGAT
CTCAAACTCCCATCGCCTCTGCTGAGGAAACCGAAGTCGGAGAGGCAAGCGACAGGGAAG
GGATTGCTGAGGCGAAGGCAACTGTGTGTGCTGATGCTGTAGATGCCTGCCCCGATCAAG
TGGAGGCATTTGAAATTGAAAAGGTTGAAGACTCTATCTTGGATGAGCTTCAAACTGAAC
TTAATGCGCCAGCGGACAAGACCTATGAGGATGTCTTGGCATTCGATGCCGTATGCTCAG
AGGCGTTGTCTGCATTCTATGCTGTGCCGAGTGATGAGACGCACTTTAAAGTGTGTGGAT
TCTATTCGCCTGCTATAGAGCGCACTAATTGTTGGCTGCGTTCTACTTTGATAGTAATGC
AGAGTCTACCTTTGGAATTTAAAGACTTGGAGATGCAAAAGCTCTGGTTGTCTTACAAGG
CCGGCTATGACCAATGCTTTGTGGACAAACTAGTTAAGAGCGTGCCCAAGTCTATTATCC
TTCCACAAGGTGGTTATGTGGCAGATTTTGCCTATTTCTTTCTAAGCCAGTGTAGCTTTA
AAGCTTATGCTAACTGGCGTTGTTTAGAGTGTGACATGGAGTTAAAGCTTCAAGGCTTGG
ACGCCATGTTTTTCTATGGGGACGTTGTGTCTCATATGTGCAAGTGTGGTAATAGCATGA
CCTTGTTGTCTGCAGATATACCCTACACTTTGCATTTTGGAGTGCGAGATGATAAGTTTT
GCGCTTTTTACACGCCAAGAAAGGTCTTTAGGGCTGCTTGTGCGGTAGATGTTAATGATT
GTCACTCTATGGCTGTAGTAGAGGGCAAGCAAATTGATGGTAAAGTGGTTACCAAATTTA
TTGGTGACAAATTTGATTTTATGGTGGGTTACGGGATGACATTTAGTATGTCTCCTTTTG
AACTCGCCCAGTTATATGGTTCATGTATAACACCAAATGTTTGTTTTGTTAAAGGAGATG
TTATAAAGGTTGTTCGCTTAGTTAATGCTGAAGTCATTGTTAACCCTGCTAATGGGCGTA
TGGCTCATGGTGCAGGTGTTGCAGGTGCTATAGCTGAAAAGGCGGGCAGTGCTTTTATTA
AAGAAACCTCCGATATGGTGAAGGCTCAGGGCGTTTGCCAGGTTGGTGAATGCTATGAAT
CTGCCGGTGGTAAGTTATGTAAAAAGGTGCTTAACATTGTAGGGCCAGATGCGCGAGGGC
ATGGCAAGCAATGCTATTCACTTTTAGAGCGTGCTTATCAGCATATTAATAAGTGTGACA
ATGTTGTCACTACTTTAATTTCGGCTGGTATATTTAGTGTGCCTACTGATGTCTCCCTAA
CTTACTTACTTGGTGTAGTGACAAAGAATGTCATTCTTGTCAGTAACAACCAGGATGATT
TTGATGTGATAGAGAAGTGTCAGGTGACCTCCGTTGCTGGTACCAAAGCGCTATCACTTC
AATTGGCCAAAAATTTGTGCCGTGATGTAAAGTTTGTGACGAATGCATGTAGTTCGCTTT
TTAGTGAATCTTGCTTTGTCTCAAGCTATGATGTGTTGCAGGAAGTTGAAGCGCTGCGAC
ATGATATACAATTGGATGATGATGCTCGTGTCTTTGTGCAGGCTAATATGGACTGTCTGC
CCACAGACTGGCGTCTCGTTAACAAATTTGATAGTGTTGATGGTGTTAGAACCATTAAGT
ATTTTGAATGCCCGGGCGGGATTTTTGTATCCAGCCAGGGCAAAAAGTTTGGTTATGTTC
AGAATGGTTCATTTAAGGAGGCGAGTGTTAGCCAAATAAGGGCTTTACTCGCTAATAAGG
TTGATGTCTTGTGTACTGTTGATGGTGTTAACTTCCGCTCCTGCTGCGTAGCAGAGGGTG
AAGTTTTTGGCAAGACATTAGGTTCAGTCTTTTGTGATGGCATAAATGTCACCAAAGTTA
GGTGTAGTGCCATTTACAAGGGTAAGGTTTTCTTTCAGTACAGTGATTTGTCCGAGGCAG
ATCTTGTGGCTGTTAAAGATGCCTTTGGTTTTGATGAACCACAACTGCTGAAGTACTACA
CTATGCTTGGCATGTGTAAGTGGTCAGTAGTTGTTTGTGGCAATTATTTTGCTTTCAAGC
AGTCAAATAATAATTGCTATATAAATGTGGCATGTTTAATGCTGCAACACTTGAGTTTAA
AGTTTCCTAAGTGGCAATGGCAAGAGGCTTGGAACGAGTTCCGCTCTGGTAAACCACTAA
GGTTTGTGTCCTTGGTATTAGCAAAGGGCAGCTTTAAATTTAATGAACCTTCTGATTCTA
TCGATTTTATGCGTGTGGTGCTACGTGAAGCAGATTTGAGTGGTGCCACGTGCAATTTGG
AATTTGTTTGTAAATGTGGTGTGAAGCAAGAGCAGCGCAAAGGTGTTGACGCTGTTATGC
ATTTTGGTACGTTGGATAAAGGTGATCTTGTCAGGGGTTATAATATCGCATGTACGTGCG
GTAGTAAACTTGTGCATTGCACCCAATTTAACGTACCATTTTTAATTTGCTCCAACACAC
CAGAGGGTAGGAAACTGCCCGACGATGTTGTTGCAGCTAATATTTTTACTGGTGGTAGTG
TGGGCCATTACACGCATGTGAAATGTAAACCCAAGTACCAGCTTTATGATGCTTGTAATG
TTAATAAGGTTTCGGAGGCTAAGGGTAATTTTACCGATTGCCTCTACCTTAAAAATTTAA
AGCAAACTTTTTCGTCTGTGCTGACGACTTTTTATTTAGATGATGTAAAGTGTGTGGAGT
ATAAGCCAGATTTATCGCAGTATTACTGTGAGTCTGGTAAATATTATACAAAACCCATTA
TTAAGGCCCAATTTAGAACATTTGAGAAGGTTGATGGTGTCTATACCAACTTTAAATTGG
TGGGACATAGTATTGCTGAAAAACTCAATGCTAAGCTGGGATTTGATTGTAATTCTCCCT
TTGTGGAGTATAAAATTACAGAGTGGCCAACAGCTACTGGAGATGTGGTGTTGGCTAGTG
ATGATTTGTATGTAAGTCGGTACTCAAGCGGGTGCATTACTTTTGGTAAACCGGTTGTCT
GGCTTGGCCATGAGGAAGCATCGCTGAAATCTCTCACATATTTTAATAGACCTAGTGTCG
TTTGTGAAAATAAATTTAATGTGTTGCCCGTTGATGTCAGTGAACCCACGGACAAGGGGC
CTGTGCCTGCTGCAGTCCTTGTTACCGGCGTCCCTGGAGCTGATGCGTCAGCTGGTGCCG
GTATTGCCAAGGAGCAAAAAGCCTGTGCTTCTGCTAGTGTGGAGGATCAGGTTGTTACGG
AGGTTCGTCAAGAGCCATCTGTTTCAGCTGCTGATGTCAAAGAGGTTAAATTGAATGGTG
TTAAAAAGCCTGTTAAGGTGGAAGGTAGTGTGGTTGTTAATGATCCCACTAGCGAAACCA
AAGTTGTTAAAAGTTTGTCTATTGTTGATGTCTATGATATGTTCCTGACAGGGTGTAAGT
ATGTGGTTTGGACTGCTAATGAGTTGTCTCGACTAGTAAATTCACCGACTGTTAGGGAGT
ATGTGAAGTGGGGTAAGGGAAAGATTGTAACACCCGCTAAGTTGTTGTTGTTAAGAGATG
AGAAGCAAGAGTTCGTAGCGCCAAAAGTAGTCAAGGCGAAAGCTATTGCCTGCTATTGTG
CTGTGAAGTGGTTTCTCCTCTATTGTTTTAGTTGGATAAAGTTTAATACTGATAATAAGG
TTATATACACCACAGAAGTAGCTTCAAAGCTTACTTTCAAGTTGTGCTGTTTGGCCTTTA
AGAATGCCTTACAGACGTTTAATTGGAGCGTTGTGTCTAGGGGCTTTTTCCTAGTTGCAA
CGGTCTTTTTATTATGGTTTAACTTTTTGTATGCTAATGTTATTTTGAGTGACTTCTATT
TGCCTAATATTGGGCCTCTCCCTACGTTTGTGGGACAGATAGTTGCGTGGTTTAAGACTA
CATTTGGTGTGTCAACCATCTGTGATTTCTACCAGGTGACGGATTTGGGCTATAGAAGTT
CGTTTTGTAATGGAAGTATGGTATGTGAACTATGCTTCTCAGGTTTTGATATGCTGGACA
ACTATGATGCTATAAATGTTGTTCAACACGTTGTAGATAGGCGTTTGTCCTTTGACTATA
TTAGCCTATTTAAATTAGTAGTTGAGCTTGTAATCGGCTACTCTCTTTATACTGTGTGCT
TCTACCCACTGTTTGTCCTTATTGGAATGCAGTTGTTGACCACATGGTTGCCTGAATTCT
TTATGCTGGAGACTATGCATTGGAGTGCTCGTTTGTTTGTGTTTGTTGCCAATATGCTTC
CAGCTTTTACGTTACTGCGATTTTACATCGTGGTGACAGCTATGTATAAGGTCTATTGTC
TTTGTAGACATGTTATGTATGGATGTAGTAAGCCTGGTTGCTTGTTTTGTTATAAGAGAA
ACCGTAGTGTCCGTGTTAAGTGTAGCACCGTTGTTGGTGGTTCACTACGCTATTACGATG
TAATGGCTAACGGCGGCACAGGTTTCTGTACAAAGCACCAGTGGAACTGTCTTAATTGCA
ATTCCTGGAAACCAGGCAATACATTCATAACTCATGAAGCAGCGGCGGACCTCTCTAAGG
AGTTGAAACGCCCTGTGAATCCAACAGATTCTGCTTATTACTCGGTCACAGAGGTTAAGC
AGGTTGGTTGTTCCATGCGTTTGTTCTACGAGAGAGATGGACAGCGTGTTTATGATGATG
TTAATGCTAGTTTGTTTGTGGACATGAATGGTCTGCTGCATTCTAAAGTTAAAGGTGTGC
CTGAAACGCATGTTGTGGTTGTTGAGAATGAAGCTGATAAAGCTGGTTTTCTCGGCGCCG
CAGTGTTTTATGCACAATCGCTCTACAGACCTATGTTGATGGTGGAAAAGAAATTAATAA
CTACCGCCAACACTGGTTTGTCTGTTAGTCGAACTATGTTTGACCTTTATGTAGATTCAT
TGCTGAACGTCCTCGACGTGGATCGCAAGAGTCTAACAAGTTTTGTAAATGCTGCGCACA
ACTCTCTAAAGGAGGGTGTTCAGCTTGAACAAGTTATGGATACCTTTATTGGCTGTGCCC
GACGTAAGTGTGCTATAGATTCTGATGTTGAAACCAAGTCTATTACCAAGTCCGTCATGT
CGGCAGTAAATGCTGGCGTTGATTTTACGGATGAGAGTTGTAATAACTTGGTGCCTACCT
ATGTTAAAAGTGACACTATCGTTGCAGCCGATTTGGGTGTTCTTATTCAGAATAATGCTA
AGCATGTACAGGCTAATGTTGCTAAAGCCGCTAATGTGGCTTGCATTTGGTCTGTGGATG
CTTTTAACCAGCTATCTGCTGACTTACAGCATAGGCTGCGAAAAGCATGTTCAAAAACTG
GCTTGAAGATTAAGCTTACTTATAATAAGCAGGAGGCAAATGTTCCTATTTTAACTACAC
CGTTCTCTCTTAAAGGGGGCGCTGTTTTTAGTAGAATGTTACAATGGTTGTTTGTTGCTA
ATTTGATTTGTTTCATTGTGTTGTGGGCCCTTATGCCAACATATGCAGTGCACAAATCGG
ATATGCAGTTGCCTTTATATGCCAGTTTTAAAGTTATAGATAATGGTGTGCTAAGGGATG
TGTCTGTTACTGACGCATGCTTCGCAAACAAATTTAATCAATTTGATCAATGGTATGAGT
CTACTTTTGGTCTTGCTTATTACCGCAACTCTAAGGCTTGTCCTGTTGTGGTTGCTGTAA
TAGATCAAGACATTGGCCATACCTTATTTAATGTTCCTACCACAGTTTTAAGATATGGAT
TTCATGTGTTGCATTTTATAACCCATGCATTTGCTACTGATAGCGTGCAGTGTTACACGC
CACATATGCAAATCCCCTATGATAATTTCTATGCTAGTGGTTGCGTGTTGTCATCCCTCT
GTACTATGCTTGCGCATGCAGATGGAACCCCGCATCCTTATTGTTATACAGGGGGTGTTA
TGCACAATGCCTCTCTGTATAGTTCTTTGGCTCCTCATGTCCGTTATAACCTGGCTAGTT
CAAATGGTTATATACGTTTTCCCGAAGTGGTTAGTGAAGGCATTGTGCGTGTTGTGCGCA
CTCGCTCTATGACCTACTGCAGGGTTGGTTTATGTGAGGAGGCCGAGGAGGGTATCTGCT
TTAATTTTAATCGTTCATGGGTATTGAACAACCCGTATTATAGGGCCATGCCTGGAACTT
TTTGTGGTAGGAATGCTTTTGATTTAATACATCAAGTTTTAGGAGGATTAGTGCGGCCTA
TTGATTTCTTTGCCTTAACGGCGAGTTCAGTGGCTGGTGCTATCCTTGCAATTATTGTCG
TTTTGGCTTTCTATTATTTAATAAAGCTTAAACGTGCCTTTGGTGACTACACTAGTGTTG
TGGTTATCAATGTAATTGTGTGGTGTATAAATTTTCTGATGCTTTTTGTGTTTCAGGTTT
ATCCCACATTGTCTTGTTTATATGCTTGTTTTTATTTCTACACAACGCTTTATTTCCCTT
CGGAGATAAGTGTTGTTATGCATTTGCAATGGCTTGTCATGTATGGTGCTATTATGCCCT
TGTGGTTTTGCATTATTTACGTGGCAGTCGTTGTTTCAAACCATGCATTGTGGTTGTTCT
CTTACTGCCGCAAAATTGGTACCGAGGTTCGTAGTGACGGCACATTTGAGGAAATGGCCC
TTACTACCTTTATGATTACTAAAGAATCTTATTGTAAGTTGAAAAATTCTGTTTCTGATG
TTGCTTTTAACAGGTACTTGAGTCTTTATAACAAGTATCGTTATTTTAGTGGCAAAATGG
ATACTGCCGCTTATAGAGAGGCTGCCTGTTCACAACTGGCAAAGGCAATGGAAACATTTA
ACCATAATAATGGTAATGATGTTCTCTATCAGCCTCCAACCGCCTCTGTTACTACATCAT
TTTTACAGTCTGGTATAGTGAAGATGGTGTCGCCCACCTCTAAAGTGGAGCCTTGTATTG
TTAGTGTTACTTATGGTAACATGACACTTAATGGGTTGTGGTTGGATGATAAAGTTTATT
GCCCAAGACATGTTATCTGTTCTTCAGCTGACATGACAGACCCTGATTATCCTAATTTGC
TTTGTAGAGTGACATCAAGTGATTTTTGTGTTATGTCTGGTCGTATGAGCCTTACTGTAA
TGTCTTATCAAATGCAGGGCTGCCAACTTGTTTTGACTGTTACACTGCAAAATCCTAACA
CGCCTAAGTATTCCTTCGGTGTTGTTAAGCCTGGTGAGACATTTACTGTACTGGCTGCAT
ACAATGGCAGACCTCAAGGAGCCTTCCATGTTACGCTTCGTAGTAGCCATACCATAAAGG
GCTCCTTTCTATGTGGATCCTGCGGTTCTGTAGGATATGTTTTAACTGGCGATAGTGTAC
GATTTGTTTATATGCATCAGCTAGAGTTGAGTACTGGTTGTCATACCGGTACTGACTTTA
GTGGGAACTTTTATGGTCCCTATAGAGATGCGCAAGTTGTACAATTGCCTGTTCAGGATT
ATACGCAGACTGTTAATGTTGTAGCTTGGCTTTATGCTGCTATTTTTAACAGATGCAACT
GGTTTGTGCAAAGTGATAGTTGTTCCCTGGAGGAGTTTAATGTTTGGGCTATGACCAATG
GTTTTAGCTCAATCAAAGCCGATCTTGTCTTGGATGCGCTTGCTTCTATGACAGGCGTTA
CAGTTGAACAGGTGTTGGCCGCTATTAAGAGGCTGCATTCTGGATTCCAGGGCAAACAAA
TTTTAGGTAGTTGTGTGCTTGAAGATGAGCTGACACCAAGTGATGTTTATCAACAACTAG
CTGGTGTCAAGCTACAGTCAAAGCGCACAAGAGTTATAAAAGGTACATGTTGCTGGATAT
TGGCTTCAACGTTTTTGTTCTGTAGCATTATCTCAGCATTTGTAAAATGGACTATGTTTA
TGTATGTTACTACCCATATGTTGGGAGTGACATTGTGTGCACTTTGTTTTGTAAGCTTTG
CTATGTTGTTGATCAAGCATAAGCATTTGTATTTAACTATGTATATTATGCCTGTGTTAT
GCACACTGTTTTACACCAACTATTTGGTTGTGTACAAACAGAGTTTTAGAGGTCTAGCTT
ATGCTTGGCTTTCACACTTTGTCCCTGCTGTAGATTATACATATATGGATGAAGTTTTAT
ATGGTGTTGTGTTGCTAGTAGCTATGGTGTTTGTTACCATGCGTAGCATAAACCACGACG
TCTTTTCTATTATGTTCTTGGTTGGTAGACTTGTCAGCCTGGTATCCATGTGGTATTTTG
GAGCCAATTTAGAGGAAGAGGTACTATTGTTCCTCACATCCCTATTTGGCACGTACACAT
GGACTACTATGTTGTCATTGGCTACCGCTAAGGTTATTGCTAAATGGTTGGCTGTGAATG
TCTTGTACTTCACAGACGTACCGCAAATTAAATTAGTTCTTTTGAGCTACTTGTGTATTG
GTTATGTGTGTTGTTGTTATTGGGGAATCTTGTCACTCCTTAATAGCATTTTTAGGATGC
CATTGGGCGTCTACAATTATAAAATCTCCGTTCAGGAGTTACGTTATATGAATGCTAATG
GCTTGCGCCCACCTAGAAATAGTTTTGAGGCCCTGATGCTTAATTTTAAGCTGTTGGGAA
TTGGTGGTGTGCCAGTCATTGAAGTATCTCAAATTCAATCAAGATTGACGGATGTTAAAT
GTGCTAATGTTGTGTTGCTTAATTGCCTCCAGCACTTGCATATTGCATCTAATTCTAAGT
TGTGGCAGTATTGTAGTACTTTGCACAATGAAATACTGGCTACATCTGATTTGAGCGTGG
CCTTCGATAAGTTGGCTCAGCTCTTAGTTGTTTTATTTGCTAATCCAGCAGCAGTGGATA
GCAAGTGCCTTGCAAGTATTGAAGAAGTGAGCGATGATTACGTTCGCGACAATACTGTCT
TGCAAGCCTTACAGAGTGAATTTGTTAATATGGCTAGCTTCGTTGAGTATGAACTTGCTA
AGAAGAATCTAGATGAGGCTAAGGCTAGCGGCTCTGCCAATCAACAGCAGATTAAGCAGC
TAGAGAAGGCGTGTAATATTGCTAAGTCAGCATATGAGCGCGACAGAGCTGTTGCTCGTA
AGCTGGAACGTATGGCTGATTTAGCTCTTACAAACATGTATAAAGAAGCTAGAATTAATG
ATAAGAAGAGTAAGGTAGTGTCTGCATTGCAAACCATGCTCTTTAGTATGGTGCGTAAGC
TAGATAACCAAGCTCTTAATTCTATTTTAGATAATGCAGTTAAGGGTTGTGTACCTTTGA
ATGCAATACCATCATTGACTTCGAACACTCTGACTATAATAGTGCCAGATAAGCAGGTTT
TTGATCAGGTTGTGGATAATGTGTATGTCACCTATGCTGGGAATGTATGGCATATACAGT
TTATTCAAGATGCTGATGGTGCTGTTAAACAATTGAATGAGATAGATGTTAATTCAACCT
GGCCTCTAGTCATTGCTGCAAATAGGCATAATGAAGTGTCTACTGTTGTTTTGCAGAACA
ATGAGTTGATGCCTCAGAAGTTGAGAACTCAGGTTGTCAATAGTGGCTCAGATATGAATT
GTAATACTCCTACCCAGTGTTACTATAATACTACTGGCACGGGTAAGATTGTGTATGCTA
TACTTAGTGACTGTGATGGTCTCAAGTACACTAAGATAGTAAAAGAAGATGGAAATTGTG
TTGTTTTGGAATTGGATCCTCCCTGTAAGTTTTCTGTTCAGGATGTGAAGGGCCTTAAAA
TTAAGTACCTTTACTTTGTGAAGGGGTGTAATACACTGGCTAGAGGCTGGGTTGTAGGCA
CCTTATCCTCGACAGTGAGATTGCAGGCGGGTACGGCAACTGAGTATGCCTCCAACTCTG
CAATACTGTCGCTGTGTGCGTTTTCTGTAGATCCTAAGAAAACGTACTTGGATTATATAA
AACAGGGTGGAGTTCCCGTTACTAATTGTGTTAAGATGTTATGTGACCATGCTGGCACTG
GTATGGCCATTACTATTAAGCCGGAGGCAACCACTAATCAGGATTCTTATGGTGGTGCTT
CCGTTTGTATATATTGCCGCTCGCGTGTTGAACATCCAGATGTTGATGGATTGTGCAAAT
TACGCGGCAAGTTTGTCCAAGTGCCCTTAGGCATAAAAGATCCTGTGTCATATGTGTTGA
CGCATGATGTTTGTCAGGTTTGTGGCTTTTGGCGAGATGGTAGCTGTTCCTGTGTAGGCA
CAGGCTCCCAGTTTCAGTCAAAAGACACGAACTTTTTAAACGGGTTCGGGGTACAAGTG
2 changes: 1 addition & 1 deletion data/reference.fa → data/sample_6.fa
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
>something
>sample 6
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
Expand Down
9 changes: 5 additions & 4 deletions stop/stop.py
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,7 @@
"""

import argparse
from collections import defaultdict

import Levenshtein
from Bio import SeqIO
Expand All @@ -17,13 +18,13 @@
def one_stop_mutations(codon):
"""
"""
positions = set()
positions = defaultdict(list)

for stop_codon in CodonTable.unambiguous_dna_by_id[1].stop_codons:
if Levenshtein.hamming(codon, stop_codon) == 1:
for i in range(3):
if codon[i] != stop_codon[i]:
positions.add(i)
positions[i].append(stop_codon[i])
return positions


Expand All @@ -36,7 +37,7 @@ def find_positions(sequence, offset):
stop_positions = one_stop_mutations(sequence[i:i + 3])

for position in stop_positions:
result.append(i + position + 1)
result.append((i + position + 1, stop_positions[position]))

return result

Expand All @@ -59,7 +60,7 @@ def main():
help='input file in FASTA format')
parser.add_argument('output_handle', type=argparse.FileType('w'),
help='output file')
parser.add_argument('-o', dest='offset', type=int, default=0,
parser.add_argument('-o', dest='offset', type=int, default=1,
help='offset in the reference sequence (int default=%(default)s)')

try:
Expand Down

0 comments on commit e346cdf

Please sign in to comment.