Unconfigured Ad

**Richard Finney** · 07-21-2012, 07:22 PM

Look at SRR390297

example.
-bash-3.00$ head -50000 SRR390297.fastq | awk '{if ((NR%4)==2) print $0}' | tail
GAGGTAGTAGGTTGTATGGTTATCGTATGCCGTCTT
TGAGGTAGTAGATTGTATAGTTTCGTATGCCGTCTT
AGAGGTAGTAGGTTGCATAGTTTCGTATGCCGACTT
CTGTGCGTGTGACAGCGGCTGAATTCGTATGCCGCC
TGAGGTAGTAGGTTGTATGGCTTCGTATGCCGTCTT
TGAGGTAGTAGTTTGTGCTGTTTCGTATGCCGTCTT
TGAGGTAGTAGGTTGTATGGTTTCGTATGCCGTCTT
AGCTACATCTGGCTACTGGGCCTCTTCGTATGCCGT
TGAGGTAGTAGGTTGTGTGGTTTCGTATGCCGTCTT
ACAGTAGTCTGCACATTGGTTATCGTATGCCGTCTT

There all "variations on a theme".

They have the same motif over and over -- most with TATGCCGTCTT at the end.

Anybody recognize this? Wet lab guys? Adapters?

Counts of most common transcripts :
185154 TGAGGTAGTAGTTTGTGCTGTTATCGTATGCCGTCT
250743 TAGCTTATCAGACTGATGTTGATCGTATGCCGTCTT
312964 TGAGGTAGTAGGTTGTGTGGTTTCGTATGCCGTCTT
388556 TAGCTTATCAGACTGATGTTGACTCGTATGCCGTCT
414442 ACAGTAGTCTGCACATTGGTTATCGTATGCCGTCTT
448175 TGAGATGAAGCACTGTAGCTCTTCGTATGCCGTCTT
546039 TGAGGTAGTAGGTTGTATAGTTTCGTATGCCGTCTT
652936 TGAGGTAGTAGTTTGTGCTGTTTCGTATGCCGTCTT
908341 TGAGGTAGTAGATTGTATAGTTTCGTATGCCGTCTT
1218229 TGAGGTAGTAGGTTGTATGGTTTCGTATGCCGTCTT

**HSV-1** · 07-21-2012, 09:30 PM

Hi, I have found that the last 8 base pairs in low quality but I didn't go to insight. Thanks for your pointing out.
Do you think trimming the last 8 bp pairs will help?
I have done blast and found that the first 20bp are MicroRNAs!

Thanks!

Originally posted by Richard Finney View Post

Look at SRR390297

example.
-bash-3.00$ head -50000 SRR390297.fastq | awk '{if ((NR%4)==2) print $0}' | tail
GAGGTAGTAGGTTGTATGGTTATCGTATGCCGTCTT
TGAGGTAGTAGATTGTATAGTTTCGTATGCCGTCTT
AGAGGTAGTAGGTTGCATAGTTTCGTATGCCGACTT
CTGTGCGTGTGACAGCGGCTGAATTCGTATGCCGCC
TGAGGTAGTAGGTTGTATGGCTTCGTATGCCGTCTT
TGAGGTAGTAGTTTGTGCTGTTTCGTATGCCGTCTT
TGAGGTAGTAGGTTGTATGGTTTCGTATGCCGTCTT
AGCTACATCTGGCTACTGGGCCTCTTCGTATGCCGT
TGAGGTAGTAGGTTGTGTGGTTTCGTATGCCGTCTT
ACAGTAGTCTGCACATTGGTTATCGTATGCCGTCTT

There all "variations on a theme".

They have the same motif over and over -- most with TATGCCGTCTT at the end.

Anybody recognize this? Wet lab guys? Adapters?

Counts of most common transcripts :
185154 TGAGGTAGTAGTTTGTGCTGTTATCGTATGCCGTCT
250743 TAGCTTATCAGACTGATGTTGATCGTATGCCGTCTT
312964 TGAGGTAGTAGGTTGTGTGGTTTCGTATGCCGTCTT
388556 TAGCTTATCAGACTGATGTTGACTCGTATGCCGTCT
414442 ACAGTAGTCTGCACATTGGTTATCGTATGCCGTCTT
448175 TGAGATGAAGCACTGTAGCTCTTCGTATGCCGTCTT
546039 TGAGGTAGTAGGTTGTATAGTTTCGTATGCCGTCTT
652936 TGAGGTAGTAGTTTGTGCTGTTTCGTATGCCGTCTT
908341 TGAGGTAGTAGATTGTATAGTTTCGTATGCCGTCTT
1218229 TGAGGTAGTAGGTTGTATGGTTTCGTATGCCGTCTT

Topics	Statistics	Last Post
Whole-Genome Sequencing Traces Faroe Islands Ancestry to a North Atlantic Founder Population by SEQadmin2 Started by SEQadmin2, Yesterday, 06:09 AM	0 responses 16 views 0 reactions	Last Post by SEQadmin2 Yesterday, 06:09 AM
Sequencing the Two-Toed Sloth Genome Reveals Jumping Genes Tied to Its Extreme Metabolism by SEQadmin2 Started by SEQadmin2, 06-09-2026, 11:58 AM	0 responses 36 views 0 reactions	Last Post by SEQadmin2 06-09-2026, 11:58 AM
A New Method Makes Hantavirus Genome Analysis Faster and More Accessible by SEQadmin2 Started by SEQadmin2, 06-05-2026, 10:09 AM	0 responses 42 views 0 reactions	Last Post by SEQadmin2 06-05-2026, 10:09 AM
A New Single-Cell Method Maps DNA-Protein Interactions by SEQadmin2 Started by SEQadmin2, 06-04-2026, 08:59 AM	0 responses 49 views 0 reactions	Last Post by SEQadmin2 06-04-2026, 08:59 AM

Unconfigured Ad

Please diagnose my RNA-seq data.

Comment

Comment

Latest Articles

ad_right_rmr

News