midashi


LCFとは、Longest Common Factor (最長共通要素)の略です。

siRNA s1 のLCF

オフターゲット候補遺伝子 A →||||||XXX|||| LCF=6
オフターゲット候補遺伝子 B →||||XX|X||||| LCF=5
オフターゲット候補遺伝子 C →||||X|X||X||| LCF=4
オフターゲット候補遺伝子 D →|X|X||||X|||| LCF=4
オフターゲット候補遺伝子 E →XXX|||||||||| LCF=10
オフターゲット候補遺伝子 F →|X||||X||||X| LCF=4

|は  マッチ
Xはミスマッチ

上図は、 siRNA s1と各オフターゲット候補遺伝子の アラインメントの様子を模式的に図示したものです。  siRNA s1の配列とオフターゲット候補遺伝子の配列が一致している場合は|、不一致の場合はXで表しています。 連続一致の数が多ければ多いほど、そのオフターゲット候補遺伝子に影響を与える可能性が大きくなります。 上図で全オフターゲット候補遺伝子群のLCFの最大値(もっとも悪い場合)は、補遺伝子EのLCF=10なので、siRNA s1 の LCFはLCF=10と表されます。 ミスマッチポテンシャルの場合と同じく、最も悪い場合の値を代表値にしていいます。 オフターゲット候補遺伝子 E は、全てのミスマッチが左端によっており、LCF=10、つまり10塩基連続一致しています。 3ミスマッチあればその遺伝子には影響は無い、というのは統計的(確率的に一般的という意味)な言及であって、 実際にこのような例があれば、候補遺伝子EとsiRNA s1はオフターゲットを起こす可能性が高いと予測されます。 つまり、LCFが小さい値であればあるほど、ミスマッチが適度に散在している状態を表しており、LCFが大きければ大きくなるほど、 ミスマッチが一部に集約している状態を表しています。 ここで注意すべきは、先ほどのミスマッチポテンシャルとの関係です。 ミスマッチポテンシャルは、中心付近にミスマッチがあればあるほど大きくなる値でした。 上図の候補遺伝子Eの場合、ミスマッチが末端付近に集約していることから、非常に低い値になると考えられるため、 LCFで見た場合と同じ遺伝子が代表値を出すことになり、同じ傾向を捉えることができています。
(「ミスマッチポテンシャルについての詳細」で用いた図と、LCFの図は対応しています。値の様子を検討してみてください。)