Spaced Seed Design

There are many heuristics for spaced seed design. However, most of these methods are not good for designing large spaced seeds (around k=60 and w=20).

My undergraduate directed studies project examined if Shannon entropy can be used as an approximation for spaced seed quality for database searching, particularily when using BioBloom tools.

Scripts

make_seeds.py: Randomly generates spaced seeds of a given k and w
markov_process_seeds.py: Generate spaced seeds of varying entropy for a given k and w
determine_uniqueness.py: Determines the uniqueness of the set of words produced by a tsv of spaced seeds for a given genome.
select_multi_spaced_seeds.py: Generates a list of multiple spaced seeds, where each set has 5 spaced seeds, designed for use in BBT.

Manuscript

https://goo.gl/Qaed8m

Name		Name	Last commit message	Last commit date
Latest commit History 81 Commits
Data		Data
multi_seeds/e_coli		multi_seeds/e_coli
scripts		scripts
uniqueness		uniqueness
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Spaced Seed Design

Scripts

Manuscript

About

Releases

Packages

Languages

emreerhan/spaced-seeds

Folders and files

Latest commit

History

Repository files navigation

Spaced Seed Design

Scripts

Manuscript

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages