Klíčový rozdíl mezi contigem a lešením je v tom, že contig nemá mezery, zatímco lešení se skládá z kontigů a mezer.
Sekvenování genomu mnohobuněčných organismů je ve srovnání se sekvenováním jednobuněčných organismů velmi obtížné. Celogenomové brokovnicové sekvenování je snadná a rychlá technika sekvenování genomu pro mnohobuněčné genomy. Je to metoda, která paralelně sekvenuje mnoho překrývajících se fragmentů DNA. Při této metodě jsou malé fragmenty sestaveny do větších fragmentů a poté do větších kontigů pomocí počítače. Poté jsou kontigy sestaveny do lešení a nakonec do chromozomu. Contig je tedy kontinuální úsek nukleotidových sekvencí, zatímco skafold je část genomu sestávající z kontigů a mezer. Contig i scaffold jsou rekonstruované genomové sekvence.
Co je Contig?
Contig je genomická sekvence. Je to kontinuální úsek sekvencí složených z A, C, G a T bází. Vzniká spojením několika malých překrývajících se kousků DNA do delší sekvence. Jednoduše řečeno, contig je sestavení sady sekvenčních fragmentů. Vytváření kontigů zahrnuje identifikaci překrývajících se fragmentů sekvencí na základě místních metod porovnávání řetězců a zarovnání, které identifikují překrývající se konce sekvencí.
Kontigy nemají mezery. Je součástí lešení. Při vytváření lešení se kontigy spojují dohromady. Vyžaduje další informace o relativní poloze a orientaci kontigů v genomu. Mezery oddělují kontigy v lešení. V zásadě je sestavení contig důležitým krokem v sekvenování celogenomové brokovnice. Kontigy jsou nakonec sestaveny do kompletní genomové sekvence. Sestavení kontigů obvykle vyžaduje pochopení algoritmů při porovnávání řetězců a zarovnání sekvencí.
Co je lešení?
Scaffold je rekonstruovaná genomová sekvence z end-sekvenovaných klonů celogenomových brokovnic. Strukturálně se lešení skládá z kontigů a mezer. Proto se lešení vytváří řetězením kontigů dohromady a jejich oddělením mezerami. Vytvoření lešení potřebuje informace týkající se relativní polohy a orientace kontigů v genomu. Sestavení celogenomové brokovnice má za cíl reprezentovat každou genomovou sekvenci v jednom lešení. Ale není to docela možné. Jeden chromozom tedy může být reprezentován několika skafoldy. Někdy se mohou lešení překrývat. Některé lešení lze navíc během montáže odfiltrovat.
Obrázek 02: Přehled celé genomové brokovnice
Délka mezery na lešení neukazuje její skutečnou délku. Obecně jsou mezery libovolně nastaveny na určité pevné délky. Tyto mezery a nejistoty v jejich délkách tedy vytvářejí problémy v pochopení skutečných prostorových vztahů funkčních prvků v genomech a skutečného rozsahu chybějících informací. Někdy mezery představují chybějící genomické informace.
Jaké jsou podobnosti mezi Contigem a lešením?
- Contig a scaffold jsou genomové sekvence složené z nukleotidových sekvencí.
- Lešení se skládají z kontigů a mezer.
Jaký je rozdíl mezi Contigem a Scaffoldem?
Kontig je souvislá sekvence sestavená ze sady sekvenčních fragmentů. Naproti tomu skafold je část genomové sekvence rekonstruovaná zřetězením kontigů dohromady. Toto je klíčový rozdíl mezi contigem a lešením. Navíc kontigy nemají mezery, zatímco kontigy v lešení jsou odděleny mezerami.
Infografika níže uvádí další rozdíly mezi kontigem a lešením.
Shrnutí – Contig vs Scaffold
Contig i scaffold jsou rekonstruované nukleotidové sekvence v projektech sekvenování celého genomu. Contig je kontinuální úsek genomové sekvence obsahující A, C, G a T báze bez mezer. Scaffold je genomová sekvence sestávající z kontigů a mezer. Nejkratší komponenty sestavy jsou tedy kontigy, zatímco lešení jsou sestavy kontigů. Nakonec jsou skafoldy sestaveny do chromozomů v sekvenování celého genomu. Toto shrnuje rozdíl mezi contigem a lešením.