La bioinformática es una técnica computacional basada en el análisis de caracteres. Se utiliza para comparar cadenas de ADN. ARN y secuancias de aminoácidos. Los bancos de ADN proporcionan aplicaciones en linea para ayudarnos en identificación de cadenas que hayamos secuenciado o que necesitemos identificar.
En la sección Archivos de este grupo coloqué un pdf con la descripción del reporte generado por la aplicación BLAST Assembled Genomes.
https://www.facebook.com/download/1478773715767886/Bioinformatica_HowTo_NewBLAST.pdf
1) Copia la secuencia de tu equipo (con todo y número)
2) Entra a la base de datos del NCBI
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome
3) Pega tu secuencia en el recuadro blanco donde dice
Enter accession number(s), gi(s), or FASTA sequence(s):
4) Baja la pagina busca un recuadro azul en la esquina izquierda, dice
BLAST, dale click
5) Espera 5 segundos hasta que aperesca una ventana donde puedes ver
los nucleótidos que se alinearon de color rojo, si das click sobre cada
barra puedes ver el resultado o en la parte de abajo de la ventana se
encuentra escrito el resumen, donde en el primer sitio está el nombre
del microorganismo que mas de parece a tu bacteria.
6) ¿Que bacteria identificaste?
>1 GTCCCGCCTGCCCAGTGACAACTTAGTTCAACGGCCGCGGTATTTTGACCGTGCAAAGGTAGCGTAATCA
TTGTCTTTTAAATGAAGACCTGTATGAATGGCATAACGAGGGCTTAACTGTCTCCTTCCCCTGGTCAAT
GAAATTGATCTCCCCGTGCAGAAGCGGGGATGAAACCATAAGACGAGAAGACCCTATGGAGCTTTAGACA
CACAGGTGGACCATGTCAAATACCCCCAGCTAAGGGCCTGAACTAAATGGAACCTGCCTTGATGTCTTCG
GTTGGGGCGACCATGGGGAATACAAAACCCCCACGTGGAAAGGGAGCACACCCCTAAGTTACTTCTTCTC
CCGCAAGCCAGAGCAACAGCTCTAACAAGCAGAAATTCTGACCAAACTGATCCGGTAAAACCGATCAACG
AACCAAGTTACCCTAGGGATAACAGCGCAATCCCCTTTTAGAGCCCATATCGACAAGGGGGTTTACGACC
TCGATGTTGGATCAGGACATCCTAATGGTGCAGCCGCTATTAAGGGTTCGTTTGTTCAACGATTAAAGTC
CTACGTGAT
2>
TTGTCTTTTAAATAAAGACCAGTATGAATGGCAAGACGAAAGTTCAACTGTCTCCCTAAATTAATCAATG
AAATTGATCTTCCCGTGCAGAAGCGGGAATATAAATATAAGACGAGAAGACCCTATGGAGCTTTAAATAT
ATGGTCAATTGTATATTACATGAACCAAAAGGTAAAATATTAAATAAAACATAGTGATCAAAATTTTAGG
TTGGGGCGACCACGGAGAAAAACAAAACCTCCGAGATGAAAAAATATCTTAACTTATGAACTACAGTTCT
AAAAAATAAAATATTTAACATAATTGATCCAATATATTGATCAACGAACCAAGTTACCCTAGGGATAACA
GCGCAATCCTTTCCAAGAGTTCCTATCGACGAATGGGTTTACGACCTCGATGTTGGATCAGGACACCCCG
ATGGTGTAGCCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGT
>3
TAGCTTAAAGATTTATTTTAGGTAAATTCTGCCCAGCGTAAAATATTAGCGGCCGCAGTAAAATTGACTG
TGCTAAGGTAGCATAATCAATTGGCTTTTAATTGAAGTCTGGAATGAACGGATTAATGGGGACTTGCTGT
CTCTTAATAATTACTTTGAAATTATTTATTAAGTGAAAATACTTATAATTAGAAAAAAGACGAGAAGACC
CTTAGAATTTTTAATAAAACATAAATAAATGTTATTTTTTTGTTGGGGCGACATTGAAACAATAAAACTT
TCTTTATTTCATGACATTAAGGTTTGAAAGAGTAAATTACCTTAGGGATAACAGCATAATTAATAAATTA
GTTTGTGACCTTGTTGTTGGACTAGGAACTAGTTGACTAGCAGTCAAAATAGATTGTTCTGTTCGAACAG
AAATTCCTAC
>4
TTGTGACGCTTCGGCAGGCTTAACACATGCAAGTCCGAGGGGTATATGTCTTCGGATATAGAGACCGGCG
CACGGGTGCGTAACGCGTATGCCATCTACCTTTTACAGAGGGATAGCCCAGAGAAATTTGGATTAATACC
TCATAGCATAGCGACTCCGCATGAAGCAACTATTAAAGTCACAACGGTTAAAGATGAGCATGCGTCCCAT
TAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCTACGATGGGTAGGGGTCCTGAGAGGGAGATCCCCCAC
ACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGACAATGGGCGCAAG
CCTGATCCAGCCATGCCGCGTGCAGGATGACGGTCCTATGGATTGTAAACTGCTTTTGTACGAGAAGAAA
CACTCCTTCGTGAAGGAGCTTGACGGTATCGTAAGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCG
GTAATACGGAGGATCCAAGCGTTATCCGGAATCATTGGGTTTAAAGGGTCCGTAGGCGGTTTAGTAAGTC
AGTGGTGAAAGCCCATCGCTCAACGGTGGAACGGCCATTGATACTGCTAAACTTGAATTATTAGGAAGTA
ACTAGAATATGTAGTGTAGCGGTGAAATGCTTAGAGATTACATGGAATACCAATTGCGAAGGCAGGTTAC
>5
GCGCATGCTTAACACATGCAAGTCGAGCGGTAAGGCCTTTCGGGGTACACGAGCGGCGAACGGGTGAGTA
ACACGTGGGTGATCTGCCCTGCACTCTGGGATAAGCTTGGGAAACTGGGTCTAATACCGGATATGACCAC
AGCATGCATGTGTTGTGGTGGAAAGATTTATCGGTGCAGGATGGGCCCGCGGCCTATCAGCTTGTTGGTG
GGGTAATGGGCCTACCAAGGCGACGACGGGTAGCCGACCTGAGAGGGTGACCGGCCACACTGGGACTGAG
ACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCG
ACGCCGCGTGAGGGATGAAGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGACGAAGCGTGAGTGACGGT
ACCTGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTGTCC
GGAATTACTGGGCGTAAAGAGTTCGTAGGCGGTTTGTCGCGTCGTTTGTGAAAACCCGGGGGCTC
>6
GATAGAACGCTGGCGGGCAGGCCTAACACATGCAAGTCGAGCGGTAACAGGGGAAAGCTTGCTTTCTCGC
TGACGAGCGGCGGACGGGTGAGTAATGTATGGCGATCTGCCCGATAGAGGGGGATAACTACTGGAAACGG
TGGCTAATACCGCATAATCTCTCAGGAGCAAAGCAGGGGGAACTTCGGTCCTTGCGCTATCGGATGAACC
CATATGGGATTAGCTAGTAGGTGAGGTAATGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGAT
GATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAA
TGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTAGGGTTGTAAAGTACTTTCAGTC
GGGAGGAAGGCGTTGATGCTAATATCATCAACGATTGACGTTACCGACAGAAGAAGCACCGGCTAACTCC
GTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAAATCGGAATTAC
7>
TGTGACGCTGCGGCAGGCTTAACACATGCAAGTCGAGGGGTATATGTCTTCGGATATAGAGACCGGCGCA
CGGGTGCGTAACGCGTATGCAATCTACCTTTTACAGAGGGATAGCCCAGAGAAATTTGGATTAATACCTC
ATAGCATAGCGACTTCGCATGAAGCAACTATTAAAGTCACAACGGTAAAAGATGAGCATGCGTCCCATTA
GCTAGTTGGTAAGGTAACGGCTTACCAAGGCTACGATGGGTAGGGGTCCTGAGAGGGAGATCCCCCACAC
TGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGACAATGGGCGCAAGCC
TGATCCAGCCATGCCGCGTGCAGGATGACGGTCCTATGGATTGTAAACTGCTTTTGTACGAGAAGAAACA
CTCCAACGTGTTGGAAGCTTGCGGTTCGTAGAATAAGGTCGGGTAAATCTTGCATCAGCCCCGTATCGAA
GTCCAGCGTTTCCGATCATGGTTAAAGGGCCGAGCGTTATACTAGTGGGAACCTCTACGGGACGCCTTCC
GTAATGATTTTGAGACATTAGGACGGA
>8
TGGCTCAGAACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCACCTTCGGGTGAGCGGCGGA
CGGGTTAGTAACGCGTGGGAACATACCCTTTTCTACGGAATAGCCTCGGGAAACTGAGAGTAATACCGTA
TAAGCCCTTCGGGGGAAAGATTTATCGGGAAAGGATTGGCCCGCGTTAGATTAGATAGTTGGTGGGGTAA
TGGCCTACCAAGTCTACGATCTATAGCTGGTTTTAGAGGATGATCAGCAACACTGGGACTGAGACACGGC
CCAGACTCCTACGGGAGGCAGCAGTGGGGAATNTTAGACAATGGGCGCAAGCCTGATCTAGCCATGCCGC
GTGTGTGATGAAGGTCTTAGGATCGTAAAGCACTTTCGCCAGGGATGATAATGACAGTACCTGGTAAAGA
AACCCCGGCTAA
Respuesta 1. La identificación más probable para esta cadena de ADN
es: Platichthys stellatus mitochondrial gene for 16S rRNA, partial
sequence, haplotype: PS3-16S
https://www.facebook.com/photo.php?fbid=972051699525410&set=p.972051699525410&type=3
https://www.facebook.com/photo.php?fbid=972051859525394&set=p.972051859525394&type=3
Respuesta 2. La identificación más probable para esta cadena de ADN es:
Pseudohynobius flavomaculatus voucher XM3182 16S ribosomal RNA (16S)
gene, partial sequence; mitochondrial
https://www.facebook.com/photo.php?fbid=972056342858279&set=p.972056342858279&type=3
Respuesta 3. La identificación más probable para esta cadena de ADN es:
Galba truncatula isolate TcS10 16S ribosomal RNA (16S) gene, partial
sequence; mitochondrial
https://www.facebook.com/photo.php?fbid=972057462858167&set=p.972057462858167&type=3
Respuesta 4. La identificación más probable para esta cadena de ADN es:
Sporocytophaga sp. A61 A61 A61 partial 16S rRNA gene, isolate A61
https://www.facebook.com/photo.php?fbid=972058592858054&set=p.972058592858054&type=3
Respuesta 5. La identificación más probable para esta cadena de ADN es:
Rhodococcus sp. A83 A83 A83 A83 partial 16S rRNA gene, isolate A83
https://www.facebook.com/photo.php?fbid=972059226191324&set=p.972059226191324&type=3
Respuesta 6. La identificación más probable para esta cadena de ADN es:
Enterobacteriaceae bacterium A91 partial 16S rRNA gene, isolate A91
https://www.facebook.com/photo.php?fbid=972059906191256&set=p.972059906191256&type=3
Respuesta 7. La identificación más probable para esta cadena de ADN es:
Flavobacterium sp. A32 A32 A32 partial 16S rRNA gene, isolate A32
https://www.facebook.com/photo.php?fbid=972060566191190&set=p.972060566191190&type=3
Respuesta 8. La identificación más probable para esta cadena de ADN es:
Uncultured Sulfitobacter sp. clone 12S_148 16S ribosomal RNA gene,
partial sequence
https://www.facebook.com/photo.php?fbid=972061522857761&set=p.972061522857761&type=3
Es importante recordar que estos bancos de datos dan una lista de especies con más coincidencias. Por lo tanto, todas las secuencias que coinciden al 100% pueden ser la que estamos buscando. Como los genes para una misma proteína se repiten en diferentes especies de bacterias (organismos), será necesario tener la mejor identificación posible de nuestra bacteria para conocer la especie correspondiente.
Si nuestra secuenciación es un poco deficiente, por ejemplo, si tiene deleciones o repeticiones, el grado de coincidencia puede ser menor de 100%. Pero aún así tenemos posibilidades de confirmar la identificación que necesitamos.
En la secuencia 1, realicé el siguiente ejercicio: Seleccioné los 10 nucleótidos a partir del nucleótido 6, la copié en seguida del nucleótido 15 (repetición) y los copié nuevamente (repetición) después del nucleótido 599 (al final de la secuancia). El resultado fue el mismo, pero en la columna "Query cover" el porcentaje de coincidencia descendió de 100% a 98%.
Ahora, en la secuencia 1 quité 10 nucleótidos a partir del nucleótido 6
(deleción) y los copié al final, después del nucleótido 599
(repetición). Nuevamente el resultado fue el mismo, con un porcentaje
de coincidencia de 98% en la columna "Query cover".
TAREA PARA
Estudiantes de la Univercidad Politécnica Bicentenario de noveno semestre de la carrera de Agrotecnología.
https://www.facebook.com/ARGONAUTASirapuato/posts/869709303066735?fref=nf
Tema 1. Programación y electrónica.
Tema 2. Ciencia y tecnología.
Tema 3. Humanidades y comportamiento humano.
Tema 4. Cine y literatura.
nfjh