dna1.fasta:


Ergebnis nach Genescan für die DNA:

>genome_dna1|GENSCAN_predicted_CDS_1|1278_bp
atggggccgcggcggctgctgctggtggccgcctgcttcagtctgtgcggcccgctgttg
tctgcccgcacccgggcccgcaggccagaatcaaaagcaacaaatgccaccttagatccc
cggtcatttcttctcaggaaccccaatgataaatatgaaccattttgggaggatgaggag
aaaaatgaaagtgggttaactgaatacagattagtctccatcaataaaagcagtcctctt
caaaaacaacttcctgcattcatctcagaagatgcctccggatatttgaccagctcctgg
ctgacactctttgtcccatctgtgtacaccggagtgtttgtagtcagcctcccactaaac
atcatggccatcgttgtgttcatcctgaaaatgaaggtcaagaagccggcggtggtgtac
atgctgcacctggccacggcagatgtgctgtttgtgtctgtgctcccctttaagatcagc
tattacttttccggcagtgattggcagtttgggtctgaattgtgtcgcttcgtcactgca
gcattttactgtaacatgtacgcctctatcttgctcatgacagtcataagcattgaccgg
tttctggctgtggtgtatcccatgcagtccctctcctggcgtactctgggaagggcttcc
ttcacttgtctggccatctgggctttggccatcgcaggggtagtgcctctgctcctcaag
gagcaaaccatccaggtgcccgggctcaacatcactacctgtcatgatgtgctcaatgaa
accctgctcgaaggctactatgcctactacttctcagccttctctgctgtcttctttttt
gtgccgctgatcatttccacggtctgttatgtgtctatcattcgatgtcttagctcttcc
gcagttgccaaccgcagcaagaagtcccgggctttgttcctgtcagctgctgttttctgc
atcttcatcatttgcttcggacccacaaacgtcctcctgattgcgcattactcattcctt
tctcacacttccaccacagaggctgcctactttgcctacctcctctgtgtctgtgtcagc
agcataagctgctgcatcgaccccctaatttactattacgcttcctctgagtgccagagg
tacgtctacagtatcttatgctgcaaagaaagttccgatcccagcagttataacagcagt
gggcagttgatggcaagtaaaatggatacctgctctagtaacctgaataacagcatatac
aaaaagctgttaacttag

Ausgewählt wurde bei BLAT-Search der Eintrag mit dem besten Score und 100% Identität. Die DNA-Sequenz ist also vollständig vorhanden:

Auswahl


 



dna2.fasta:


Ein Ergebnis nach Genscan für die DNA: (Zufallswahl)

>hg16_dna|GENSCAN_predicted_peptide_4|250_aa
MPALQVSRPHLVVRLCYGPVLDIKEKLAHMSRRMMKGSERGQHKLSAICCVRGCSQTLLC
AGDSLGQESRQGTVGMAVSAPFTGPINELQLGRLKLLGAGIIWKLLHLYAWYLGWDDSKA
GLSWGCLPEHLRVDPSWSSGFLQHGSWLPKWEGSKRFSMKKLIAAQFGKPGDVWRSRETQ
KGWFASPKGSVAAIVDDERLSAEEMDERRRQNIAYEYLCHLEEAKRASLGLFPTRSPMMI
NAQQDSGISD

>hg16_dna|GENSCAN_predicted_CDS_4|753_bp
atgccggcactgcaggtctccaggccacatttagtagtgaggctctgctacggaccagtt
cttgacataaaagaaaagttggcacatatgtccaggaggatgatgaaaggctctgagcgg
gggcagcataagctttcagcaatctgttgtgtgcggggctgctcgcagacccttctctgt
gctggagattctttgggtcaggaatccagacagggcacagtgggaatggctgtctctgct
ccatttactggaccaattaacgagctccagctgggaagactgaaactgctgggggctgga
atcatctggaagcttctccacctatatgcctggtacctggggtgggatgactcgaaggct
ggactcagctggggctgtttaccagagcatctgcgagttgacccttcatggagctcaggc
ttcttgcagcatggcagctggcttcccaagtgggagggttccaagaggttttctatgaaa
aagcttattgctgcacaatttgggaagcctggggatgtgtggaggtccagagagactcag
aaaggctggtttgcatctcctaagggtagcgtggctgctattgtggacgatgaaaggctc
tctgcagaggagatggatgagaggaggcggcagaacattgcttatgaatatctgtgccac
ttagaggaagccaaaagagcttccttgggtcttttccccactcgcagcccaatgatgata
aatgcccagcaggacagtggcatatcagactga

Ausgewählt wurde nach BLAT wieder der Eintrag mit dem besten Score (749) und 100% Identität:

Auswahl



 




dna3.fasta:


Bei Genescan ergab die Suchsequenz 2 Vorhersagen, eine sehr lange und ein sehr kurze. Gewählt wurde die lange Sequenz:

>genomic_seq3|GENSCAN_predicted_peptide_1|1733_aa
MKKMETEETFEIDGSSVQLVSLSAITLETGNTSRKTKKPLGPNGYHFVKQVKEGGPAFEA
GLCTGDQIIKVNGESVIGKTYSQVISLIQNSDTTLELSVMPQYEDILQVAYSQDAYLKGN
EAYSGNARNIPEPPPICYPWLPSAPSAMAQPVEIAPPDSSLSKQQTSTPVLTQPGRAYRM
EIQVPPSPTDVAKSNTAVCVCNESVRTVIVPSEKVVDLLSNRNNHTGPSHRIEEVRYGVN
EQTSLKTVSRTTSPPLSIPTTHLIHQPAGSRSLEPSGILLKSGNYSGHSDGISSSRSQAV
EAPSVSVNHYLPNSHQHIDWKNYKTYKEYIDNRRLHIGCRTIQERLDSLRAASQSTMDYN
QVVPNRTTLQGRRRSTSHDRVPQSVQIRQRSVSQERLEDSVLMKYCPRSASQGALTSPSV
SFSNHRTRSWDYIEGQDETLENVNSGTPIPDSNGEKKQTYKWSGFTEQDDRRGIYERPRQ
QEIHKSFRGSNFTVAPSVVNSDNRRMSGRGVGSVSQFKKIPPDLKTLQSNRNFQTACGMS
LPRGISQDRSPLVKVRSNSLKAPSTHVTKPSFNQKSFVSIKDQRPVNHLHQNSLLNQQTW
SSENAGTSDLELPVSQRNQDLSLQEAEIEQSDTLDNKEAVILREKPPSGHQTPQPLRHQS
YILAVNDQETRHYLLAAHDARREVHIKRMEERKALSTSPPGDSLASVPFIDEPTSPSIDH
DIAHIPASAVISASTSQVPCIATVPPSLTTSVPLICRQLSHDHESVGPHSLNAQPNSKTE
RSKSYDEGLDDYREDVKLSFKHVSSLKGIKVADSQKSSEDSGSRKDSSSEAFSDAAKEGW
LHFRSLVTDNGNETKRKNVFRLTTSDCECLFQAEDRDDMLAWIKTIQESSNLNEEDTGVT
NRDLISRTIKEYNNLMSKAEQLPKTPRQSLSIRQTLPGAKSEPKTQSPHSPKEESERKLL
SKDDTSPPKDESTWRKGIPSIMRKTFERKPTATGTFGVRLDDCPPAHTNRKLPESLFTND
KYADFIEANRKEEPLDRLKTLKRLIHDLPEHHYETLKFLSAHLKTVAENSEKNKMEPGNL
AIVFGPTLVRTSEDNMTHMVTHMPDQYKIVETLIQHHDWFFTEEGAEEPLTTVQEESTVD
SQPVPNIDHLLTNIGRTGVSPGDVSDSATSDSTKSKGSWGSGKDQYSRELLVSSIFAAAS
RKRKKPKEKAQPSSSEDELDNVFFKKENVEQCHNDTKEESKKESETLGRKQKIIIAKENS
TRKDPSTTKDEKISLGKESTPSEEPSSPHNSEHNKSPTLSCRFAILKDSPRSLLAQKSSH
LEETGSDSGTLLSTSSQASLARFSMKKSTSPETKQRVFGQHYSTTSSAAYLTSLDSSRLS
PEVQSAAESKGDEADDERSELISKGRPVETDSESEFPVFPTALTSERLFRGKLQEVTKSS
RRNSEGSELSCTEGSLTSSLDSRRQLFSSHKLIECDTLSRKKSARFKSDSGSLGDAKNEK
EAPSLTKVFDVMKKGKSTGSLLTPTRGESEKQEPTWKTKTADRLKLRPRAPADDMFGVGN
HKVNAETAKRKSIRRRHTLGGHRDATEISVLNFWKVHEQSGERESELSAVNRLKPKCSAQ
DLSISDWLARERLRTSTSDLSRGEIGDPQTEKPSTREIATTDTPLSLHCPTGSSSSILAS
TNRPLLSIPPQSPDQINGESFQNVSKNASSAANAQPHKLSETPGNKAEFHPCL

>genomic_seq3|GENSCAN_predicted_CDS_1|5202_bp
atgaagaaaatggaaacagaggagacttttgagattgatggaagctctgtgcagctggtc
agtctctcagccattactttggaaacaggaaacacctcaaggaaaacaaagaaaccgctt
ggacccaatggataccattttgttaagcaagttaaagaaggaggacctgcttttgaagct
ggattatgtacaggtgaccaaattataaaagtcaatggagaaagtgttattggcaaaacc
tattcccaagtaatttctttaattcaaaacagtgatacaacattggaacttagtgttatg
ccacaatatgaagacattctccaagtggcatattctcaagatgcctacctgaaaggcaac
gaagcttatagcggcaatgcccgcaatatacctgaacctccaccaatctgctatccctgg
ctgccatctgccccatcagccatggcacagccagttgaaatagctcctcctgactcatca
ctgagcaaacagcaaaccagtacaccagtactgacacaacctggtagggcctatagaatg
gaaatacaagtgcctccatcaccaacagatgttgcaaaatcaaacacagcagtgtgtgtt
tgcaatgaaagtgtaaggactgtcattgtgccttctgagaaggttgtagatttgttatcc
aacagaaacaaccatacaggtccttcacatagaattgaagaagtgaggtatggcgtgaat
gagcagacctctttaaaaacagtgtcaagaaccacatcaccaccattatcaattcccacc
actcatctaattcatcagcccgcaggctccagatcattggaaccttctggaattttactt
aaatctggaaattacagtggacattctgatggaatctcaagcagcagatctcaagctgtg
gaggctccctctgtatctgttaatcactatttgccaaattcccatcagcacatagactgg
aaaaactataaaacttacaaagagtatattgataacagacgattgcacataggttgtcgg
acaatacaagaaagattagatagtttaagagcagcatctcaaagcacgatggattataac
caggtcgtccctaaccgcactactttgcagggacgacgtcgaagcacctctcatgatcga
gtgccccagtctgtccagatacggcaacgcagtgtgtcccaagaaagactggaagattct
gtgctaatgaagtattgtccaagaagtgcatctcaaggagcactgacgtctccatctgtt
agttttagtaatcatagaactcgttcatgggattatattgagggacaggatgaaacctta
gaaaatgtcaattctggaactccaatacctgattccaacggagagaaaaaacagacttac
aagtggagtgggtttactgaacaggatgatagacgaggtatttatgaaagacctaggcag
caagaaattcataaatcttttcgaggttccaattttactgtggctccaagtgttgttaat
tctgataacaggcgaatgagtggtagaggagtgggatctgtgtcgcagtttaaaaaaatt
ccaccagatctaaaaacactgcagtcaaacagaaattttcagactgcttgtggaatgtca
ctgcctcggggtatttcacaagacaggtcacctcttgtgaaagtccgaagtaattctctg
aaagctccttccacgcatgtcacaaaaccatcatttaaccagaaatcatttgtttctatc
aaagaccaaagaccagtaaatcacttgcatcagaacagtctgttgaatcagcagacatgg
tcgagtgaaaacgctggtacttcagatttagaactacctgtcagtcaaaggaatcaagat
ttaagtttacaagaggctgaaattgagcaatcagatactttagataataaagaagctgtc
atcctaagggaaaaacctccatctggacaccagacaccgcagcctttaaggcatcagtct
tacatcttggcagtaaatgaccaggagaccagacactacctgctggctgcccatgatgca
cgtcgagaggtccacataaaaagaatggaggaaagaaaagccttgagtaccagtccgcct
ggcgattctttggcttccgtcccatttatagatgaaccaactagccctagcattgatcat
gatattgcacatatccctgcttctgctgttatatcagcctctacctctcaggtcccctgc
atagcaacagttcctcctagcctcacaacttcagttccattaatttgccgtcagctctca
catgaccacgaatctgttggccctcatagcctgaatgctcagcccaactcaaagacagaa
agatcaaaatcatatgatgagggtctggatgattacagagaagatgtaaaattgtccttt
aagcatgtatctagtctgaagggaatcaaggtcgcagacagccaaaagtcatcagaagac
tctgggtccagaaaagattcttcctcagaggccttcagtgatgctgccaaggaagggtgg
ctccatttccgatcccttgtcaccgataacggcaatgagaccaagaggaaaaatgtgttt
cgactcaccacgtccgactgtgaatgcctgtttcaggctgaagacagagatgatatgtta
gcttggatcaagacgatccaggagagcagcaacctaaacgaagaggacactggagtcact
aacagggatctaattagtcgaacaataaaagaatacaacaatctgatgagcaaagcagaa
cagttgccaaaaacacctcgtcagagtctcagcatcaggcaaactttgcctggtgctaaa
tcagagccaaagactcaaagcccacactctccgaaggaagagtcagaaaggaaacttctc
agtaaagatgataccagtcccccaaaagacgaaagcacatggagaaaaggcattccaagt
atcatgagaaagacatttgagagaaagccaactgctacaggaactttcggcgtccgacta
gatgactgcccaccagctcatactaatcgaaaactccctgagtctctcttcacaaatgat
aaatatgctgattttattgaagccaatcgtaaagaggagcctctagatcgtctgaaaaca
ttaaaaagactaattcacgatttgcctgaacatcattatgaaacacttaagttcctttca
gctcatctgaagacagtggcagaaaattcagaaaaaaataagatggaaccaggaaaccta
gcaatagtgtttggtcccacccttgttcgaacatcagaagacaacatgacccatatggtc
acccacatgcctgaccagtacaagatcgtagaaacgctcatccagcaccatgactggttt
ttcacagaagaaggtgctgaagagcctcttacaacagtgcaggaggaaagcacagtagac
tcccagccagtgccaaacatagatcatttactcaccaacattggaaggacaggagtctcc
ccaggagatgtatcagattcagctactagtgactcaacaaaatctaagggttcttgggga
tctggaaaggatcagtatagcagggaactgctcgtgtcctccatctttgcagctgctagt
cgcaagaggaagaagccaaaagaaaaagcacagcctagcagctcagaagatgaactggac
aatgtattttttaagaaagaaaatgtggaacagtgtcacaatgatactaaagaggagtcc
aaaaaagaaagtgagacactgggcagaaaacagaagatcatcattgccaaagaaaatagc
actaggaaagaccccagcacgacaaaagatgaaaagatatcactaggaaaagagagcacg
ccttccgaagaaccctcatcaccacacaactcagaacacaacaagtcaccaactctcagc
tgtcgctttgccatcctgaaagacagccccaggtcacttctggcacagaagtcctcccac
cttgaagagacaggctctgactctggcactttgctcagcacgtcttcccaggcctccctg
gcaaggttttccatgaagaaatcaaccagtccagaaacgaaacagcgagtttttggccaa
cattattccaccacatcgtctgctgcatacttgactagcctggactccagtcgactgagc
cctgaggtgcaatccgcggcagagagcaagggggacgaggcagatgacgagagaagcgaa
ctcatcagcaaagggcggcctgtggaaaccgacagcgagagtgagtttcccgtgttcccc
acagccttgacttcagagaggcttttccgaggaaaactgcaagaagtgactaagagcagc
cggagaaattctgaaggaagtgaattaagttgcaccgagggaagtttaacatcaagttta
gatagccggagacagctcttcagttcccataaactcatcgaatgtgatactctttccagg
aaaaaatcagctagattcaagtcagatagtggaagtctaggagatgccaagaatgagaaa
gaagcaccttcattaactaaagtgtttgatgttatgaaaaaaggaaagtcaactgggagt
ttactgacacccaccagaggcgaatccgaaaaacaggaacccacatggaaaacgaaaaca
gcagatcggttaaaactgagacccagagcccctgcggatgacatgtttggagtagggaat
cacaaagtgaatgccgagactgctaaaaggaaaagcatccggcgcagacatacactagga
gggcacagagatgctactgaaatcagcgttttgaatttttggaaagtgcatgagcagagc
ggggagagagaatctgaactttcagctgtaaatcgattaaaaccaaaatgctcagcccag
gacctttccatctcagactggctggccagggaacgcctacgcaccagtacctctgacctt
agcagaggagaaatcggagatccccagacagagaagccaagcacacgggaaatagccacg
accgacacacctttgtctcttcattgccccacaggcagttcttccagcatcttggcttca
acaaacaggccccttctttccataccaccacagtcacctgaccaaataaatggagaaagc
ttccagaacgtgagcaaaaatgctagttctgcagcgaatgcccaacctcataaactatct
gaaaccccaggcaataaagcagagtttcatccctgtctttaa

Im Ergebnis in BLAT ergeben sich 2 gute Scores, bei näherer Betrachtung ist aber nur ein Bereich sinnvoll:


Der Eintrag mit dem etwas niedrigeren Score und nur 98% Identität ist sehr "zerstückelt" und die passenden Bereiche liegen sehr weit auseinander, daher könnte man annehmen, dass der 1. Eintrag der eher passende ist, da er 100% Übereinstimmung hat und die Bereiche nicht so weit getrennt sind. Aus der Übersicht geht jedoch hervor, dass er keine mRNA codiert.

Höchster Score


 

Zweithöchster Score