Was ist die Definition einer Region mit geringer Komplexität für das Target Enrichment?
Wir verwenden derzeit ein proprietäres Modell, um vorherzusagen, ob eine Sonde mithilfe der Illumina-Sequenzierung schwer zu erkennen ist oder nicht. Die Eingaben in dieses Modell umfassen den GC-Gehalt, die globale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere in einer Sondensequenz), die lokale Komplexität (gemessen als Anzahl unterschiedlicher k-Mere innerhalb eines begrenzten Bereichs einer Sequenz) und das Vorhandensein von Homopolymeren.
Im Allgemeinen ist es schwierig, Sonden mit einem GC-Gehalt von > 85 %, Homopolymeren mit einer Länge von mehr als 20 nt oder Tandem Repeats von Di- oder Trinukleotiden mit einer Länge von mehr als 30 nt zu sequenzieren.
War dieser Artikel hilfreich?
Ja
Nein
Sie haben noch Fragen? Kontakt