Seqanswers Leaderboard Ad

Collapse

Announcement

Collapse
No announcement yet.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Metagenomics analysis with CLOTU: problems with input data

    Hi to all,

    I'm doing a metagenomic approach of environmental DNA with an amplicon library constructed with the ITS1 of one genera of fungi, with a total of four different libraries (4 MID's). I'm trying to analyze the data with CLOTU but I obtain the next log file:

    Make-Cluster: -i [accepted.fas] -p b -s [n] -c 50 -m 97 -l y -a 8
    make-FAS_FILE-EACH-Cluser: y accepted.fas blastclust_out.txt y
    Make-Matrix: -f METADATA.txt -t TPA.txt -g y -o [matrix]

    Manage file step completed

    Illegal division by zero at /usit/titan/u1/globus/CLOTU/VER-1.1/filter.pl line 444, <DATA> line 444216.
    Cannot open file "accepted.fas".
    Cannot open accepted.fas to READ
    Cannot open file "blastclust_out.txt".


    Seqs per file: 200
    Couldn't open 'cluster_out.fas': No such file or directory at /usit/titan/u1/globus/CLOTU/VER-1.1/clotu.pl line 225.

    Who know what is the problem?

    Another question is related to methodology. My library is very closed to the genera that we are studying, and we think that we don't have more than 20 species per sample (library). What is the best methodology that we can use? Assembly with Mira or Newbler is a good option?

    Thanks in advance

    Santi Català
    Valencia (Spain)

  • #2
    I forgot that my amplicons (300 bp) were generated on a Junior GS pyrosequencer.

    Comment


    • #3
      hello!

      I'm having similar problems, how do you finally resolve them?

      By the way, what about the assembly for fungi?

      I'm from Madrid, so if you want we can speak in Spanish

      Comment


      • #4
        Hola Miguel Ángel,

        Mi principal problema era de que disponía de un PC arcaico por lo que me veía obligado a hacer uso de una plataforma de este tipo. Hace unos meses conseguí hacer uso de un equipo de un grupo de unos colegas de otra Universidad, con lo que el Pipeline nos lo hicimos nosotros. Tras extraer los datos con el sff_extract hicimos el clustering con el BlastClust, y con la ayuda de un script en Python exporté a Fasta el Listfile, para poder trabajar con las secuencias de cada OTU. Me vi con el problema de una cantidad de errores, aparte de homopolímeros, increible, probablemente debida al uso de una polimerasa convencional tras preparar la librería por Nested-PCR, con lo que en lugar de coger a random sequence de cada cluster, hice un alineamiento para exportar una consenso, que fue la que utilicé para blastear. Éste último paso no tendría sentido si tuviera un número excesivo de OTU's, pero con la alta especificidad de los cebadores me quité muchos organismos de enmedio.

        Probé un ensamblaje con el MIRA, pero creo que no tenía mucho sentido hacerlo de esta manera, a pesar de que a nivel de diversidad de especies obtuve similares resultados.

        Si te interesa la metodología te la puedo pasar vía e-mail más detallada.

        ¿Qué tal tus secuencias? ¿Qué bichos buscas?

        Saludos cordiales

        Comment


        • #5
          Muchas gracias por la info!

          Nosotros estamos realizando los análisis de secuencias de bacterias, hongos y algas, obtenidas desde un 454 Titanium de Roche.

          Por ahora las secuencias parece que están bastante bien, lo que nos está suponiendo algo más de problema es su cribado y, sobre todo, su asignación taxonómica.
          Hemos usado por ahora unos scripts de BioPython y el SOP de mothur de Schloss et al, pero a la hora de asignar cada secuencia a cada bicho nos hemos encontrado con problemas: para Hongos no hay una buena base de datos pre-alineada con la que comparar, para algas ídem y para bacterias, la que hay (SILVA) casi no tiene cianobacterias (y las que tiene las confunde con DNA de cloroplastos), que son las que más esperamos tener.

          Por ahora estamos haciendo unos pasos con mothur y queremos probar que tal la asignación con CLOTU, que es bastante sencillito una vez he conseguido enterarme de cómo tienen que ir los archivos iniciales.

          Muchas Gracias

          Saludos!

          Comment


          • #6
            Bueno, pues igual para la siguiente placa te pediré consejo para meter los datos en el Clotu :-). Aunque con la poca diversidad que tengo me apaño bastante bien haciéndolo a mano.

            Por mucha casualidad, tus muestras no serán del Machupichu?

            Saludos!

            Comment


            • #7
              Encantado de poder ayudarte.

              Mis muestras no son de Machu Pichu, pero... ¿por qué lo preguntas?

              Comment


              • #8
                Nada, era mucha casualidad jeje. Hace unos meses estuve hablando con un colega de Madrid y me comentó exactamente la misma metodología que has utilizado tú para la asignación taxonómica, y él andaba trabajando con esas muestras, con todo tipo de bichos como tú jeje.

                Comment

                Latest Articles

                Collapse

                • seqadmin
                  Latest Developments in Precision Medicine
                  by seqadmin



                  Technological advances have led to drastic improvements in the field of precision medicine, enabling more personalized approaches to treatment. This article explores four leading groups that are overcoming many of the challenges of genomic profiling and precision medicine through their innovative platforms and technologies.

                  Somatic Genomics
                  “We have such a tremendous amount of genetic diversity that exists within each of us, and not just between us as individuals,”...
                  05-24-2024, 01:16 PM
                • seqadmin
                  Recent Advances in Sequencing Analysis Tools
                  by seqadmin


                  The sequencing world is rapidly changing due to declining costs, enhanced accuracies, and the advent of newer, cutting-edge instruments. Equally important to these developments are improvements in sequencing analysis, a process that converts vast amounts of raw data into a comprehensible and meaningful form. This complex task requires expertise and the right analysis tools. In this article, we highlight the progress and innovation in sequencing analysis by reviewing several of the...
                  05-06-2024, 07:48 AM

                ad_right_rmr

                Collapse

                News

                Collapse

                Topics Statistics Last Post
                Started by seqadmin, Yesterday, 01:32 PM
                0 responses
                10 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 05-24-2024, 07:15 AM
                0 responses
                199 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 05-23-2024, 10:28 AM
                0 responses
                221 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 05-23-2024, 07:35 AM
                0 responses
                231 views
                0 likes
                Last Post seqadmin  
                Working...
                X