UTR_Builder documentation.

Bio::EnsEMBL::Analysis::Tools::GeneBuildUtils::TranscriptUtils qw ( is_Transcript_sane all_exons_are_valid intron_lengths_all_less_than_maximum set_start_codon set_stop_codon clone_Transcript has_no_unwanted_evidence )

Bio::EnsEMBL::Analysis::Tools::GeneBuildUtils::TranslationUtils qw ( validate_Translation_coords compute_translation contains_internal_stops print_Translation )

Bio::EnsEMBL::Analysis::Tools::Utilities

Bio::EnsEMBL::Exon

Bio::EnsEMBL::Gene

Bio::EnsEMBL::KillList::DBSQL::DBAdaptor

Bio::EnsEMBL::KillList::KillList

Bio::EnsEMBL::Transcript

Bio::EnsEMBL::Translation

Bio::EnsEMBL::Utils::Exception qw ( throw warning verbose )

Bio::SeqIO

Inherit

Bio::EnsEMBL::Analysis::RunnableDB::BaseGeneBuild

Synopsis

my $utrbuilder_runnable = new Bio::EnsEMBL::Analysis::RunnableDB::UTR_Builder(
-db => $db,
-input_id => $input_id
);
$utrbuilder_runnable->fetch_input();
$utrbuilder_runnable->run();
$utrbuilder_runnable->output();
$utrbuilder_runnable->write_output(); #writes to DB

Description

This is the new version of the UTR-addition procedure.
It combines predictions made from proteins with cDNA alignments to add UTR regions to the
gene models. It can also inlcude ESTs and ditags. It uses code from Coalescer/Consensus to produce
score for the alternative models and chose the best option.
It also includes ("look-for-both") code to correct the phases of the transcripts unless they are "blessed"
and inculdes the option to check for predefined protein/cDNA pairing as a first step,
looking for NM/NPentries in a GeneBank file.
Config files to set-up are
Bio::EnsEMBL::Analysis::Config::GeneBuild::UTR_Builder
Bio::EnsEMBL::Analysis::Config::Databases
Bio::EnsEMBL::Analysis::Config::GeneBuild::TranscriptConsensus (just a copy of the example file)
Bio::EnsEMBL::Analysis::Config::GeneBuild::KillListFilter

Methods

BLESSED_DB	No description	Code
BLESSED_GENETYPES	No description	Code
BLESSED_UTR_GENETYPE	No description	Code
CDNA_DB	Description	Code
DITAG_DB	Description	Code
DITAG_TYPE_NAMES	No description	Code
DITAG_WINDOW	No description	Code
EST_DB	Description	Code
EST_GENETYPE	No description	Code
EXTEND_BIOTYPE_OF_UNCHANGED_GENES	No description	Code
EXTEND_ORIGINAL_BIOTYPE	No description	Code
FILTER_ESTS	No description	Code
INPUT_DB	Description	Code
INPUT_GENETYPES	No description	Code
KNOWNUTR_FILE	No description	Code
KNOWN_UTR_GENETYPE	No description	Code
LOOK_FOR_KNOWN	No description	Code
MAX_EXON_LENGTH	No description	Code
MAX_INTRON_LENGTH	No description	Code
OUTPUT_DB	Description	Code
PRUNE_GENES	No description	Code
UTR_GENETYPE	No description	Code
VERBOSE	No description	Code
_cdna_evidence	Description	Code
_cdna_slice	Description	Code
_compute_UTRlength	Description	Code
_filter_cdnas	Description	Code
_get_evidence_set	Description	Code
_known_pairs	Description	Code
_merge_genes	Description	Code
_overlapping_genes	Description	Code
_recalculate_translation	Description	Code
_transfer_evidence	Description	Code
add_3prime_exons	Description	Code
add_5prime_exons	Description	Code
blessed_genes	Description	Code
cDNA_GENETYPE	No description	Code
calculate_UTR_score	Description	Code
cdna_genes	Description	Code
check_for_predefined_pairing	Description	Code
cluster_CDS	Description	Code
combine_genes	Description	Code
combined_genes	Description	Code
convert_to_extended_genes	Description	Code
create_predefined_pairing	Description	Code
ditags	Description	Code
ests	Description	Code
expand_3prime_exon	Description	Code
fetch_input	Description	Code
filter_genes	Description	Code
find_cluster_joiners	Description	Code
forward_genewise_clusters	Description	Code
get_cdna_id_from_protein_id	Description	Code
gw_genes	Description	Code
kill_list	Description	Code
look_for_both	Description	Code
make_gene	Description	Code
match_protein_to_cdna	Description	Code
merged_unmerged_pairs	Description	Code
modified_unmodified_pairs	Description	Code
new	Description	Code
output	Description	Code
populate_kill_list	Description	Code
prune	Description	Code
prune_CDS	Description	Code
remap_genes	Description	Code
retrieve_unmerged_gene	Description	Code
reverse_genewise_clusters	Description	Code
run	Description	Code
run_matching	Description	Code
score_ditags	Description	Code
transcript_from_multi_exon_genewise	Description	Code
transcript_from_multi_exon_genewise_forward	Description	Code
transcript_from_multi_exon_genewise_reverse	Description	Code
transcript_from_single_exon_genewise	Description	Code
unmatched_genes	Description	Code
validate_gene	Description	Code
write_output	Description	Code

Methods description

CDNA_DB