ターゲットエンリッチメントに関して、複雑性の低い領域とはどのようなものでしょうか?

現在、独自のモデルを用いて、 Illumina のシーケンスでプローブの検出が難しいかどうかを予測しています。このモデルへの入力項目には、GC 含量、全体的な複雑性(プローブ配列に含まれる異なる kmer 数として測定)、ローカルな複雑性(配列の限られた領域内にある異なる kmer 数として測定)、そしてホモポリマーの有無が含まれます。

一般的に、GC 含量が 85% を超えるプローブ、20 塩基より長いホモポリマー、30 塩基より長いジヌクレオチドまたはトリヌクレオチドのタンデムリピートは、配列決定が困難です。

この記事はお役に立ちましたか?

いいえ

さらに詳しいご説明が必要な場合は、こちらからお問い合わせください

Powered by Translations.com GlobalLink Web Software