Was ist die Definition einer Region mit geringer Komplexität für das Target Enrichment?

Wir verwenden derzeit ein proprietäres Modell, um vorherzusagen, ob eine Sonde mithilfe der Illumina-Sequenzierung schwer zu erkennen ist oder nicht. Die Eingaben in dieses Modell umfassen den GC-Gehalt, die globale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere in einer Sondensequenz), die lokale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere innerhalb eines begrenzten Bereichs einer Sequenz) und das Vorhandensein von Homopolymeren.

Im Allgemeinen ist es schwierig, Sonden mit einem GC-Gehalt von > 85 %, Homopolymeren mit einer Länge von mehr als 20 nt oder Tandem Repeats von Di- oder Trinukleotiden mit einer Länge von mehr als 30 nt zu sequenzieren.

War dieser Artikel hilfreich?

Nein

Sie haben noch Fragen? Kontakt

Powered by Translations.com GlobalLink Web Software