La epistemología en la práctica: Análisis de secuencias de ADN.

Tema 2. Ciencia y tecnología.

La bioinformática es una técnica computacional basada en el análisis de caracteres. Se utiliza para comparar cadenas de ADN. ARN y secuancias de aminoácidos. Los bancos de ADN proporcionan aplicaciones en linea para ayudarnos en identificación de cadenas que hayamos secuenciado o que necesitemos identificar.

En la sección Archivos de este grupo coloqué un pdf con la descripción del reporte generado por la aplicación BLAST Assembled Genomes.

https://www.facebook.com/download/1478773715767886/Bioinformatica_HowTo_NewBLAST.pdf

1) Copia la secuencia de tu equipo (con todo y número) 2) Entra a la base de datos del NCBI

http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=blasthome

3) Pega tu secuencia en el recuadro blanco donde dice Enter accession number(s), gi(s), or FASTA sequence(s):

4) Baja la pagina busca un recuadro azul en la esquina izquierda, dice BLAST, dale click

5) Espera 5 segundos hasta que aperesca una ventana donde puedes ver los nucleótidos que se alinearon de color rojo, si das click sobre cada barra puedes ver el resultado o en la parte de abajo de la ventana se encuentra escrito el resumen, donde en el primer sitio está el nombre del microorganismo que mas de parece a tu bacteria.

6) ¿Que bacteria identificaste?

>1 GTCCCGCCTGCCCAGTGACAACTTAGTTCAACGGCCGCGGTATTTTGACCGTGCAAAGGTAGCGTAATCA TTGTCTTTTAAATGAAGACCTGTATGAATGGCATAACGAGGGCTTAACTGTCTCCTTCCCCTGGTCAAT GAAATTGATCTCCCCGTGCAGAAGCGGGGATGAAACCATAAGACGAGAAGACCCTATGGAGCTTTAGACA CACAGGTGGACCATGTCAAATACCCCCAGCTAAGGGCCTGAACTAAATGGAACCTGCCTTGATGTCTTCG GTTGGGGCGACCATGGGGAATACAAAACCCCCACGTGGAAAGGGAGCACACCCCTAAGTTACTTCTTCTC CCGCAAGCCAGAGCAACAGCTCTAACAAGCAGAAATTCTGACCAAACTGATCCGGTAAAACCGATCAACG AACCAAGTTACCCTAGGGATAACAGCGCAATCCCCTTTTAGAGCCCATATCGACAAGGGGGTTTACGACC TCGATGTTGGATCAGGACATCCTAATGGTGCAGCCGCTATTAAGGGTTCGTTTGTTCAACGATTAAAGTC CTACGTGAT

2> TTGTCTTTTAAATAAAGACCAGTATGAATGGCAAGACGAAAGTTCAACTGTCTCCCTAAATTAATCAATG AAATTGATCTTCCCGTGCAGAAGCGGGAATATAAATATAAGACGAGAAGACCCTATGGAGCTTTAAATAT ATGGTCAATTGTATATTACATGAACCAAAAGGTAAAATATTAAATAAAACATAGTGATCAAAATTTTAGG TTGGGGCGACCACGGAGAAAAACAAAACCTCCGAGATGAAAAAATATCTTAACTTATGAACTACAGTTCT AAAAAATAAAATATTTAACATAATTGATCCAATATATTGATCAACGAACCAAGTTACCCTAGGGATAACA GCGCAATCCTTTCCAAGAGTTCCTATCGACGAATGGGTTTACGACCTCGATGTTGGATCAGGACACCCCG ATGGTGTAGCCGCTATTAAAGGTTCGTTTGTTCAACGATTAAAGT

>3 TAGCTTAAAGATTTATTTTAGGTAAATTCTGCCCAGCGTAAAATATTAGCGGCCGCAGTAAAATTGACTG TGCTAAGGTAGCATAATCAATTGGCTTTTAATTGAAGTCTGGAATGAACGGATTAATGGGGACTTGCTGT CTCTTAATAATTACTTTGAAATTATTTATTAAGTGAAAATACTTATAATTAGAAAAAAGACGAGAAGACC CTTAGAATTTTTAATAAAACATAAATAAATGTTATTTTTTTGTTGGGGCGACATTGAAACAATAAAACTT TCTTTATTTCATGACATTAAGGTTTGAAAGAGTAAATTACCTTAGGGATAACAGCATAATTAATAAATTA GTTTGTGACCTTGTTGTTGGACTAGGAACTAGTTGACTAGCAGTCAAAATAGATTGTTCTGTTCGAACAG AAATTCCTAC

>4 TTGTGACGCTTCGGCAGGCTTAACACATGCAAGTCCGAGGGGTATATGTCTTCGGATATAGAGACCGGCG CACGGGTGCGTAACGCGTATGCCATCTACCTTTTACAGAGGGATAGCCCAGAGAAATTTGGATTAATACC TCATAGCATAGCGACTCCGCATGAAGCAACTATTAAAGTCACAACGGTTAAAGATGAGCATGCGTCCCAT TAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCTACGATGGGTAGGGGTCCTGAGAGGGAGATCCCCCAC ACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGACAATGGGCGCAAG CCTGATCCAGCCATGCCGCGTGCAGGATGACGGTCCTATGGATTGTAAACTGCTTTTGTACGAGAAGAAA CACTCCTTCGTGAAGGAGCTTGACGGTATCGTAAGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCG GTAATACGGAGGATCCAAGCGTTATCCGGAATCATTGGGTTTAAAGGGTCCGTAGGCGGTTTAGTAAGTC AGTGGTGAAAGCCCATCGCTCAACGGTGGAACGGCCATTGATACTGCTAAACTTGAATTATTAGGAAGTA ACTAGAATATGTAGTGTAGCGGTGAAATGCTTAGAGATTACATGGAATACCAATTGCGAAGGCAGGTTAC

>5 GCGCATGCTTAACACATGCAAGTCGAGCGGTAAGGCCTTTCGGGGTACACGAGCGGCGAACGGGTGAGTA ACACGTGGGTGATCTGCCCTGCACTCTGGGATAAGCTTGGGAAACTGGGTCTAATACCGGATATGACCAC AGCATGCATGTGTTGTGGTGGAAAGATTTATCGGTGCAGGATGGGCCCGCGGCCTATCAGCTTGTTGGTG GGGTAATGGGCCTACCAAGGCGACGACGGGTAGCCGACCTGAGAGGGTGACCGGCCACACTGGGACTGAG ACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCG ACGCCGCGTGAGGGATGAAGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGACGAAGCGTGAGTGACGGT ACCTGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTGTCC GGAATTACTGGGCGTAAAGAGTTCGTAGGCGGTTTGTCGCGTCGTTTGTGAAAACCCGGGGGCTC

>6 GATAGAACGCTGGCGGGCAGGCCTAACACATGCAAGTCGAGCGGTAACAGGGGAAAGCTTGCTTTCTCGC TGACGAGCGGCGGACGGGTGAGTAATGTATGGCGATCTGCCCGATAGAGGGGGATAACTACTGGAAACGG TGGCTAATACCGCATAATCTCTCAGGAGCAAAGCAGGGGGAACTTCGGTCCTTGCGCTATCGGATGAACC CATATGGGATTAGCTAGTAGGTGAGGTAATGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGAT GATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAA TGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTAGGGTTGTAAAGTACTTTCAGTC GGGAGGAAGGCGTTGATGCTAATATCATCAACGATTGACGTTACCGACAGAAGAAGCACCGGCTAACTCC GTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAAATCGGAATTAC

7> TGTGACGCTGCGGCAGGCTTAACACATGCAAGTCGAGGGGTATATGTCTTCGGATATAGAGACCGGCGCA CGGGTGCGTAACGCGTATGCAATCTACCTTTTACAGAGGGATAGCCCAGAGAAATTTGGATTAATACCTC ATAGCATAGCGACTTCGCATGAAGCAACTATTAAAGTCACAACGGTAAAAGATGAGCATGCGTCCCATTA GCTAGTTGGTAAGGTAACGGCTTACCAAGGCTACGATGGGTAGGGGTCCTGAGAGGGAGATCCCCCACAC TGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGACAATGGGCGCAAGCC TGATCCAGCCATGCCGCGTGCAGGATGACGGTCCTATGGATTGTAAACTGCTTTTGTACGAGAAGAAACA CTCCAACGTGTTGGAAGCTTGCGGTTCGTAGAATAAGGTCGGGTAAATCTTGCATCAGCCCCGTATCGAA GTCCAGCGTTTCCGATCATGGTTAAAGGGCCGAGCGTTATACTAGTGGGAACCTCTACGGGACGCCTTCC GTAATGATTTTGAGACATTAGGACGGA

>8 TGGCTCAGAACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCACCTTCGGGTGAGCGGCGGA CGGGTTAGTAACGCGTGGGAACATACCCTTTTCTACGGAATAGCCTCGGGAAACTGAGAGTAATACCGTA TAAGCCCTTCGGGGGAAAGATTTATCGGGAAAGGATTGGCCCGCGTTAGATTAGATAGTTGGTGGGGTAA TGGCCTACCAAGTCTACGATCTATAGCTGGTTTTAGAGGATGATCAGCAACACTGGGACTGAGACACGGC CCAGACTCCTACGGGAGGCAGCAGTGGGGAATNTTAGACAATGGGCGCAAGCCTGATCTAGCCATGCCGC GTGTGTGATGAAGGTCTTAGGATCGTAAAGCACTTTCGCCAGGGATGATAATGACAGTACCTGGTAAAGA AACCCCGGCTAA

Respuesta 1. La identificación más probable para esta cadena de ADN es: Platichthys stellatus mitochondrial gene for 16S rRNA, partial sequence, haplotype: PS3-16S

https://www.facebook.com/photo.php?fbid=972051699525410&set=p.972051699525410&type=3

https://www.facebook.com/photo.php?fbid=972051859525394&set=p.972051859525394&type=3

Respuesta 2. La identificación más probable para esta cadena de ADN es: Pseudohynobius flavomaculatus voucher XM3182 16S ribosomal RNA (16S) gene, partial sequence; mitochondrial

https://www.facebook.com/photo.php?fbid=972056342858279&set=p.972056342858279&type=3

Respuesta 3. La identificación más probable para esta cadena de ADN es: Galba truncatula isolate TcS10 16S ribosomal RNA (16S) gene, partial sequence; mitochondrial

https://www.facebook.com/photo.php?fbid=972057462858167&set=p.972057462858167&type=3

Respuesta 4. La identificación más probable para esta cadena de ADN es: Sporocytophaga sp. A61 A61 A61 partial 16S rRNA gene, isolate A61

https://www.facebook.com/photo.php?fbid=972058592858054&set=p.972058592858054&type=3

Respuesta 5. La identificación más probable para esta cadena de ADN es: Rhodococcus sp. A83 A83 A83 A83 partial 16S rRNA gene, isolate A83

https://www.facebook.com/photo.php?fbid=972059226191324&set=p.972059226191324&type=3

Respuesta 6. La identificación más probable para esta cadena de ADN es: Enterobacteriaceae bacterium A91 partial 16S rRNA gene, isolate A91

https://www.facebook.com/photo.php?fbid=972059906191256&set=p.972059906191256&type=3

Respuesta 7. La identificación más probable para esta cadena de ADN es: Flavobacterium sp. A32 A32 A32 partial 16S rRNA gene, isolate A32

https://www.facebook.com/photo.php?fbid=972060566191190&set=p.972060566191190&type=3

Respuesta 8. La identificación más probable para esta cadena de ADN es: Uncultured Sulfitobacter sp. clone 12S_148 16S ribosomal RNA gene, partial sequence

https://www.facebook.com/photo.php?fbid=972061522857761&set=p.972061522857761&type=3

Es importante recordar que estos bancos de datos dan una lista de especies con más coincidencias. Por lo tanto, todas las secuencias que coinciden al 100% pueden ser la que estamos buscando. Como los genes para una misma proteína se repiten en diferentes especies de bacterias (organismos), será necesario tener la mejor identificación posible de nuestra bacteria para conocer la especie correspondiente.

Si nuestra secuenciación es un poco deficiente, por ejemplo, si tiene deleciones o repeticiones, el grado de coincidencia puede ser menor de 100%. Pero aún así tenemos posibilidades de confirmar la identificación que necesitamos.

En la secuencia 1, realicé el siguiente ejercicio: Seleccioné los 10 nucleótidos a partir del nucleótido 6, la copié en seguida del nucleótido 15 (repetición) y los copié nuevamente (repetición) después del nucleótido 599 (al final de la secuancia). El resultado fue el mismo, pero en la columna "Query cover" el porcentaje de coincidencia descendió de 100% a 98%.

Ahora, en la secuencia 1 quité 10 nucleótidos a partir del nucleótido 6 (deleción) y los copié al final, después del nucleótido 599 (repetición). Nuevamente el resultado fue el mismo, con un porcentaje de coincidencia de 98% en la columna "Query cover".

TAREA PARA Estudiantes de la Univercidad Politécnica Bicentenario de noveno semestre de la carrera de Agrotecnología.

https://www.facebook.com/ARGONAUTASirapuato/posts/869709303066735?fref=nf

Tema 1. Programación y electrónica.
Tema 2. Ciencia y tecnología.
Tema 3. Humanidades y comportamiento humano.
Tema 4. Cine y literatura.

nfjh

viernes, 29 de abril de 2016

Análisis de secuencias de ADN.

No hay comentarios:

Publicar un comentario