300 ~ 5,000 塩基対の Clonal Genes の配列のうち、スコアリングシステムで「Standard(標準)」と判定されたものは、すべて Express サービスの対象となります。
当社のスコアリングシステムで採用している機械学習モデルでは、複数の配列パラメータ(全体の GC 含量、最大ホモポリマー長、最大リピート長、配列長、リピート密度など)を解析し組み合わせます。このモデルは、当社の過去の製造データを用いてトレーニングしたもので、遺伝子や抗体製品の合成成功率をより正確に推定することが可能です。
複雑さの問題は、主に反復配列や極端な GC 含量によって生じます。配列の設計ガイドラインは、オンラインで入手可能です。下記もご参照ください。
- 20 bp 以上の繰り返し、または Tm ≧ 60 ℃ は避ける
- 全体の GC 含量が 25% ~ 65% の範囲内であること
- 一つの遺伝子内の GC 含量の極端なばらつきを避ける(例:50 bp の領域ごとに GC 含量を見た場合、その最高値と最低値の差が 52% 以下になるようにする)
- ホモポリマーを最小限に抑える
- 配列中に散在する小さな反復の数や長さも最小限に抑える
- HIS タグには、コドン CAC および CAT の組み合わせ、すなわち CACCAT を用いる
リピート配列を抑え、GC 含量を減らすことで、配列が受け入れられる可能性が高まります。例えば、ある遺伝子の全体の GC 含量が 66% であれば「Not Accepted(受け入れ不可)」となるかもしれませんが、65% 以下になれば「Complex(複雑)」な配列として受け入れられる可能性があります。さらに GC 含量を約 60% 以下に下げると、複雑さのスコアが「Standard(標準)」に改善され、その時点でその配列は Express サービスの対象となります。リピートをなくしたり、ホモポリマーストレッチを低減したり、GC 含量の極端なばらつきをなくしたりすることも同様の効果があります。そのような構造を回避または低減できる遺伝子であればあるほど、Express サービスの対象となる可能性が高くなります。
スコアリングアルゴリズムと配列設計に関するさらなる詳細につきましては、FAQ をご覧ください。