Seqanswers Leaderboard Ad

**dpryan** · 06-18-2013, 11:53 AM

None of your reads are mapped as pair-end (at least of the reads you used in your example). Why you're still not getting any counts when not specifying that you have paired-end reads I don't know. Can you post the exact command that you're using?

**alpesh** · 06-18-2013, 12:14 PM

Code:

python dexseq_count.py   zea_mays.AGPv2.62.gff sorted_samfile.sam exon_counts.txt

Here is the command I used, all the exons (for 30k genes) come up with a 0 number in the output if nothing is specified about paired-e

top of output file

Code:

AC147602.5_FG004:001    0
AC147602.5_FG004:002    0
AC147602.5_FG004:003    0
AC147602.5_FG004:004    0
AC147602.5_FG004:005    0
AC148152.3_FG001:001    0
AC148152.3_FG001:002    0
AC148152.3_FG001:003    0
AC148152.3_FG001:004    0
AC148152.3_FG002:001    0

**dpryan** · 06-18-2013, 12:49 PM

Well, I don't know about the AGPv2.62 version, but at least in the AGPv3.18 available from ensembl there are no chromosomes/contigs with names like chr1, chr2, etc. That could certainly result in 0 counts for everything (though probably some warnings too). Perhaps try opening the coordinate-sorted bam file in IGV or something similar and see if there's any obvious visual reason to get 0 counts.

**alpesh** · 06-18-2013, 01:43 PM

hi dpryan, i have to use AGPv2.62 annotation,,,the my gtf file has chr1,chr2 etc., when you say none of the reads are paired end, it is because of the column 2 flags being 16 (reverse strand), 0(forward strand) and 4(unmapped) ?

**alpesh** · 06-18-2013, 03:20 PM

let me give an example.

A couple of lines from my gtf file shows coordinates of a gene and its first exon

Code:

chr1	dexseq_prepare_annotation.py	aggregate_gene	300422454	300435350	.	+	.	gene_id "GRMZM2G077596"
chr1	dexseq_prepare_annotation.py	exonic_part	300422454	300422756	.	+	.	transcripts "GRMZM2G077596_T01"; exonic_part_number "001"; gene_id "GRMZM2G077596"

If i want to view all reads mapping to the first exon, i can use samtools

Code:

samtools view input.bam chr1:300422454-300422756

Any help will be greatly appreciated

this is the output for the previous command

Code:

GALZUI2_0001:2:103:1190:211#0/1	0	chr1	300422484	0	36M	*	0	0	CTTCTTTTGTTCTTTAATTTGGTTCGTACGTACAAG	HHHHFEHCCHCCHHHHHGHHG<BEGHCFHHHHHCHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:6:220:1972#0/1	0	chr1	300422515	0	36M	*	0	0	ACAAGACTTCTCGGATCACTCGTCTTCTTTGATTGC	HHHHHHHHHFHHHHHHHHHHHHHHHHGHHHHHHHHG	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:42:1567:1468#0/1	0	chr1	300422526	0	36M	*	0	0	CGGATCACTCGTCTTCTTTGATTGCATCATCGAGAC	HHHHHHHHHHIHHHHHHHHHHHHHHGHHHHHHHHEH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:120:1465:1034#0/1	0	chr1	300422541	0	36M	*	0	0	CTTTGATTGCATCATCGAGACCTGCATTTTCCCTTC	CDCCC;GDGG;GGGGGG7G<GGGGGGGGGGGGGGGG	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:11:502:602#0/1	0	chr1	300422554	0	36M	*	0	0	ATCGAGACCTGCATTTTCCCTTCCAAATTCGTCACT	HHHFHHHHHFHHFHHHHHHHHHDHHHEEHHCEHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:99:1503:859#0/1	16	chr1	300422569	0	36M	*	0	0	TTCCCTTCCAAATTCGTCACTCACTCTGGTTGGCCG	FHHGHCHDGHHHGHCHGHGHHHHHEHHHHHBGGGBG	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:118:626:857#0/1	16	chr1	300422569	0	36M	*	0	0	TTCCCTTCCAAATTCGTCACTCACTCTGGTTGGCCG	H?DDHH<GHHGHHHHD;HEHHDHHHGHHHHGHHDHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:59:1772:1903#0/1	0	chr1	300422580	0	36M	*	0	0	ATTCGTCACTCACTCTGGTTGGCCGCCTTCTGTCTT	FHHHHHHGHHHDHHHHHDHHHHHHEHHHHHHHGHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:75:95:1416#0/1	16	chr1	300422586	0	1S35M	*	0	0	ACACTCACTCTGGTTGGCCGCCTTATGTCTTCTGAT	##########B?288<10*7=?..'7?C3CBD?DHF	MD:Z:23X11	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:18:1001:1651#0/1	0	chr1	300422587	0	36M	*	0	0	ACTCACTCTGGTTGGCCGCCTTCTGTCTTCTGATCC	HHHHHHHGHHHHHGEHHFHHHHHHHHHHHHHHHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:54:199:1717#0/1	16	chr1	300422600	0	36M	*	0	0	GGCCGCCTTCTGTCTTCTGATCCAATCCGGTTGAAA	DHHFHIHHHHHHEHHHGHHDHHHFHHHHHDHHHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:27:889:358#0/1	16	chr1	300422647	0	1S35M	*	0	0	TCTTCCAGCAAGATCTGGCACATAAGGAGAATCGGC	GHHH=HHHHHHHHFH=HHFEHHHHHHHGHHHHHHHC	MD:Z:35	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:37:242:1709#0/1	16	chr1	300422679	0	36M	*	0	0	GGCAAGAACCATTCTGCAAATGAGGCCGGATACGCG	HFHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:78:1327:822#0/1	16	chr1	300422679	0	36M	*	0	0	GGCAAGAACCATTCTGCAAATGAGGCCGGATACGCG	HHHHHHHFHGHHHHFHHHGHHHHHHHHHHHHHHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:106:745:1364#0/1	16	chr1	300422680	0	1S35M	*	0	0	TGCAAGAACCATTCTGCAAATGAGGCCGGATACGCG	HHHHHHHEHHHHH8HHHHHHHBHHHHHEGHIHIGHH	MD:Z:35	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:112:510:330#0/1	16	chr1	300422712	0	36M	*	0	0	GCGGCTTGAATCGGCGGTGTTCCAGCTCACCCCGAC	HHHGHIGFHIHFHGHIHHHHGHEHHHGEHGHHHHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1
GALZUI2_0001:2:76:91:1422#0/1	0	chr1	300422734	0	23M357N13M	*	0	0	CAGCTCACCCCGACCCGCACCAGGTGTGATTTAGTT	HHHHHHHGIHHGHGHGHHHHHBHH=HHFEHHHEHHH	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1	YS:A:+
GALZUI2_0001:2:36:34:147#0/1	0	chr1	300422741	0	16M357N20M	*	0	0	CCCCGACCCGCACCAGGTGTGATTTAGTTGTGGTGG	HHHHHGHHHHHHHIHHHHHHHHIHHHHHHHHHHHHG	MD:Z:36	RG:Z:s_2_sequence.txt.gz	IH:i:1	NH:i:1	YS:A:+

But in the output from

Code:

python dexseq_count.py zea_mays.AGPv2.62_mod.gff sorted_sam.sam counts_exons.txt

and then searching for the gene gives

Code:

grep GRMZM2G077596 counts_exons.txt

GRMZM2G077596:001       0
GRMZM2G077596:002       0
GRMZM2G077596:003       0
GRMZM2G077596:004       0
GRMZM2G077596:005       0
GRMZM2G077596:006       0
GRMZM2G077596:007       0
GRMZM2G077596:008       0
GRMZM2G077596:009       0
GRMZM2G077596:010       0
GRMZM2G077596:011       0
GRMZM2G077596:012       0
GRMZM2G077596:013       0

**Simon Anders** · 06-18-2013, 10:32 PM

All the alignments in your SAM file excerpt have an alignment quality (5th column) of zero but, by default, dexseq-count.py only counts read with an alignment quality of at least 10. Try to find out why they are all zero, and if this is just a bogus output of your aligner, use the option '-a 0' to set the minimum quality to 0.

Topics	Statistics	Last Post
Study Reveals How Bacteria Defend Against Viral Attacks by seqadmin Started by seqadmin, 08-27-2024, 04:40 AM	0 responses 16 views 0 likes	Last Post by seqadmin 08-27-2024, 04:40 AM
New Single-Molecule Sequencing Platform Introduces Advanced Features for High-Throughput Genomics by seqadmin Started by seqadmin, 08-22-2024, 05:00 AM	0 responses 293 views 0 likes	Last Post by seqadmin 08-22-2024, 05:00 AM
New DNA Code Discovered Revealing Complex Gene Regulation Mechanisms by seqadmin Started by seqadmin, 08-21-2024, 10:49 AM	0 responses 135 views 0 likes	Last Post by seqadmin 08-21-2024, 10:49 AM
Epigenetic Clocks Derived from Retroelements Offer New Insights into Aging by seqadmin Started by seqadmin, 08-19-2024, 05:12 AM	0 responses 124 views 0 likes	Last Post by seqadmin 08-19-2024, 05:12 AM

Seqanswers Leaderboard Ad

Announcement

getting dexseq_count.py to work

Comment

Comment

Comment

Comment

Comment

Comment

Latest Articles

ad_right_rmr

News