szekvenálás

  • elemeket
  • absztrakt
  • bevezetés
  • Tantárgyak és módszerek
  • Minta kiválasztása
  • DNS előállítása és összeállítása
  • Pontos szekvenálás
  • Az olvasás, a variánsok és a funkcionális annotációk szekvenciális feltérképezése
  • Az elhízás variánsainak szűrése és gazdagítása
  • A variánsok validálása a genotipizálás szerint
  • Az egyesület statisztikai elemzése
  • az eredmény
  • Ritka változatok felfedezése exoma szekvenálással
  • SNV validálás és asszociációs elemzés
  • vita
  • További információ
  • Word dokumentumok
  • További információ

elemeket

absztrakt

Az elhízás jelentősen hozzájárul a krónikus betegségek, például a 2-es típusú cukorbetegség globális terheihez.1 Bizonyítottak egy erős genetikai hatást az elhízásra. Az emberi elhízás általános formáiban részt vevő specifikus gének azonosítása azonban felülmúlhatatlannak bizonyult annak ellenére, hogy a különféle megközelítések, köztük a jelöltgén-vizsgálatok, a genomiális kapcsolódási vizsgálatok és a genomszövetségek (GWA) nagy erőfeszítéseket tettek. 2, 3 A mai napig a GWA-vizsgálatok körülbelül 50 genetikai lókuszt azonosítottak az elhízással. Ezek a lókuszok azonban együttesen a testtömeg-index (BMI) variációinak csak a 1-2% -át magyarázzák a vizsgálati populációkban. 4 A fő kérdés tehát az, hogy miként magyarázható a fennmaradó, úgynevezett "hiányzó" öröklés. 5 A GWA eredmények értelmezésével kapcsolatban két fő aggály merül fel. Először is, a megközelítés egy közös betegségen, egy közös variáns hipotézisen alapszik. A GWA vizsgálatokban használt kereskedelmi egy nukleotid polimorfizmus (SNP) mezőket úgy tervezték, hogy lefedjék a közös genetikai variánsokat (kisebb allélok (MAF) gyakorisága> 5% a populációkban). Emiatt nem lehetett közvetlenül értékelni a ritka variánsokat ilyen mezők használatával. Másodszor, a GWA adatok elemzéséhez olyan tökéletlen statisztikai modelleket használtak, amelyek nem veszik figyelembe a gén-gén és a gén-környezet kölcsönhatásokat. 6.

A közelmúltban kifejlesztett nagy áteresztőképességű szekvenálási technológia kiegészíti az SNP mezőket, és bemutatja a ritka betegségeket kiváltó variánsok kimutatásának képességét az összes ismert exon mély szekvenálásával. 7, 8, 9 Ez a technológiai forradalom az összetett betegségek felderítését ígéri, lehetővé téve az alacsony frekvenciájú, ritka és funkcionálisnak tűnő változatok keresését a genomban. A pontos szekvenálás akkor lehet a leghatékonyabb, ha olyan betegekre alkalmazzák, akiknél a gyakori betegségek szélsőségesebb formái, például kóros elhízás; egyrészt megnöveli annak valószínűségét, hogy a nagy penetrációjú ritka változatok esetében jelentős társulás jöjjön létre; másodszor, a fehérjét kódoló szekvencia genetikai variánsai nagyobb hatással lehetnek a fenotípusra, mint az intergenikus régiók variánsai.

Ebben a tanulmányban exom szekvenálást alkalmaztunk kisméretű elhízott felnőttekben dúsított alacsony frekvenciájú és ritka génvariánsok kimutatására, és megerősítettük azokat soha nem elhízott idősebb felnőttek ellen. Úgy ítéltük meg, hogy ily módon gazdagítanánk az esetek közötti elhízási géneket, és ezeket a géneket szűrnénk a kontrollokban. Itt bemutatjuk az elhízással társuló alacsony frekvenciájú variánst a szinaptofizin-szerű gén 2 kódoló régiójában (SYPL2).

Tantárgyak és módszerek

Minta kiválasztása

A genetikai vizsgálatok kohortjait az 1. táblázat ismerteti. Az alanyokat helyi reklámozással toborozták a súlyszabályozó gének tanulmányozására, vagy a morbid elhízás vagy a scoliosis tervezett látogatásával kapcsolatban orvosi vagy sebészeti egységeinkben. Többségüket leírták. 10, 11 Az elhízott személyek alcsoportjából 10% -ot választottunk ki a legmagasabb BMI-vel 100, extrém elhízással rendelkező egyének közül az exomszekvenálás során (69 nő, 31 férfi, 41 éves, 5 ± 11, 5 éves, BMI 52, 2 ± 3 (8 kg/m 2)., Valamennyi kiválasztott beteg morbid elhízása a BMI> 40 kg/m2 volt. Az idiopátiás scoliosis folyamatban lévő genetikai vizsgálatához már összegyűjtött alanyokat (76 nő, 24 férfi, 24,5 ± 12,8 év, BMI 21,9 ± 4,3 kg/m2) használtunk az exoma szekvenálás kontrolljaként. Az első genotípus-hitelesítéshez 494 kórosan elhízott, a legmagasabb BMI-vel rendelkező egyént választottunk ki a fent leírt nagy mintagyűjteményben, köztük 100 olyan személyt, akiket exomszekvenálásra használtak. 496 soha nem elhízott 40 évnél idősebb egyént és BMI 2-t használtunk kontrollként. A második megerősítésben a fennmaradó 1425 kórosan elhízott egyént és 782 soha nem elhízott kontrollt genotípizáltuk 40 év feletti életkorral és BMI 2-vel .

Asztal teljes méretben

A nem elhízott exóm szekvenálási kontrolloknak scoliosisuk volt. Egyébként a jelentés szerint az összes többi kontrollalja egészséges volt. A vizsgált kohorszokban a nők túlreprezentáltak voltak. Az elhízott nők elhízásuk miatt nagyobb eséllyel fordulnak orvoshoz. A gerincferdülés nőknél gyakoribb. A tárgyak európai eredetűek és Svédországban éltek. A tanulmányt a helyi etikai bizottságok jóváhagyták, és minden szervezet megalapozott beleegyezést adott a részvételhez.

DNS előállítása és összeállítása

Genom DNS-t állítottunk elő PBMC-kből a QiAmp DNS blood Maxi kit (Cat. No. 51194, Qiagen, Hilden, Németország) felhasználásával. A DNS tisztaságát és minőségét 1,8-as A260/280 arányban megerősítettük nanocseppen (Thermo Fisher Scientific Inc., Waltham, MA, USA) és agaróz gélelektroforézissel. A DNS-koncentrációt a Qubit (Life Technologies, Stockholm, Svédország) alkalmazásával mértük. Ezt követően minden DNS-mintából 0,8 μg-ot vettünk, és véletlenszerűen 10 csoportra osztottuk őket, amelyek mindegyike 10 mintát tartalmazott elhízott esetekből vagy kontrollokból. Az egyesített DNS-minták koncentrációit Qubit alkalmazásával mértük, és a mintákat agarózgélen elemeztük.

Pontos szekvenálás

Pontos szekvenálást végeztek a Science for Life Laboratory-ban (SciLifeLab), Stockholm, Svédország. Minden DNS-könyvtárat 3 μg összesített genomi DNS-ből készítettünk. A DNS-t Covaris S2 készülékkel 300 bp-ra vágtuk, és egy SureSelectXT Human All Exon 50 Mb készlet és egy Agilent NGS munkaállomás segítségével dúsítottuk a gyártó utasításainak megfelelően (automatizált SureSelectXT célgazdagítás Illumina párvégi multiplex szekvenáláshoz, A verzió, Agilent Technologies, Santa Clara, Kalifornia, USA).

A klaszterezést egy cBot fürtgeneráló rendszeren hajtottuk végre, HiSeq párosított fürtgeneráló készlet használatával, a gyártó utasításai szerint (Illumina, San Diego, Kalifornia, USA). A mintákat egy Illumina HiSeq 2000-n szekvenáltuk, amikor a páros olvasás 100 bp/olvasásig terjed (Illumina). Az összes sávot 1% phiX kontroll könyvtárral dúsítottuk, kivéve a 8. sávot, amelynek 2% phiX volt. A szekvenciális ciklusokat a gyártó utasításainak megfelelően hajtottuk végre. Az alapkonverziót az Illumina (Illumina) állambeli OLB v1.9 alkalmazásával hajtottuk végre.

Az olvasás, a variánsok és a funkcionális annotációk szekvenciális feltérképezése

A szekvenciaolvasásokat a jelenlegi emberi referencia szekvenciához (hg19 összeállítás, NCBI összeállítás 37) (//hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/) igazítottuk Burrows-Wheeler hangszínszabályzóval (BWA 0.6.1 verzió/bio -bwa.sourceforge.net/, Li és Durbin 12) egy leolvasott csonkítási paraméterrel - q 20. A szekvenciavariánsokat a samtools-0.1.18 többszörös felhalmozási funkcióval hívtuk meg (//samtools.sourceforge). nettó /), minimális térképezési minőséggel 20 és minimális leolvasási mélységgel 5 × a szűréshez. A variáns kifejlesztése előtt a PCR duplikátumokat szerszámok segítségével távolítottuk el. A szekvenciaváltozatok funkcionális megjegyzéséhez annovar-t (//www.openbioinformatics.org/annovar/, Wang és mtsai. 13) használtunk a nyilvános területeken lévő különböző adatbázisokból származó információk, például a génekre való hivatkozás integrálásához (//hgdownload.soe ). ucsc.edu/goldenPath/hg19/database/refGene.txt, 2013), dbSNP-k (SNP135, //hgdownload.soe.ucsc.edu/goldenPath/hg19/database/snp137.txt.gz) és egy 1000 genomot tartalmazó projekt (///www.1000genomes.org/).

Az elhízás variánsainak szűrése és gazdagítása

A következő szűrési kritériumokat használtuk az alacsony frekvenciájú és ritka egy nukleotid variánsok (SNV) kiválasztására az exom szekvenálási adatokból. Azokat az SNV-ket, amelyeket dúsan elhízott alanyok esetében gazdagítottak, validálásra benyújtottuk (1. ábra). Először 5 × mélységű és ≥20 térképi minőséggel (MQ) rendelkező variánsokat szűrtünk. Ezután látszólag funkcionális variánsokat kerestünk, azaz exonikus régiókból, illesztési helyekből vagy 5 'ellentétes régiókból származó variánsokat. A következő lépésben összehasonlítottuk a variáns előfordulását az elhízott és a kontroll csoport között. A következő szűrési lépésben csak a ≥ 2 elhízott pénztárba behívott, de hívás nélküli vagy egyszer ellenőrzési alapokba behívott változatokat használták; ezt a lépést alkalmazták a potenciálisan hamis pozitív változatok megelőzésére. Az utolsó szűrés az allélok gyakoriságán alapult. Alacsony frekvenciájú és ritka SNV-ket kerestünk, azaz olyan változatokat, amelyeket nem találtunk nyilvános adatbázisokban, vagy ismert SNP-ket, amelyek MAF-értéke ≤ 5% volt az általános populációban (az 1000 Genomes 2011 projekt közzétehető).

A munkafolyamatok áttekintése. Publikálatlan SNV: az SNP135-ben nem szereplő változatok.

Teljes méretű kép

A variánsok validálása a genotipizálás szerint

A variánsok validálása a fenti szűrési lépésekkel dúsított SNV-kre összpontosult, amelyek egy kezelhető genotipizáló panelbe illeszkedtek, és két lépésben történtek. Először az összes kiválasztott változatot 494 elhízott egyednél és 496 kontrollnál (1. táblázat és 1. ábra) genotipizáljuk az Illumina GoldenGate assay segítségével, az SNP/SEQ technológiai platformon, a svéd Uppsala Egyetemen (//www.molmed.medsci.uu). . se/SNP + SEQ + Technology + Platform (Genotyping), Fan és mtsai. (14). Másodszor, az elhízással nominálisan szignifikáns összefüggést mutató genotípusos variánsokat egy másik 1425 elhízott és 782 kontrollban genotipizálták. A genotipizálást lézeres deszorpciós/ionizációs tömegspektrometriával, repülési idővel végeztük mátrix felhasználásával (SEQUENOM, Agena Bioscience, San Diego, Kalifornia, USA) a svéd Karolinska Institutet Nukleáris Mutációs Laboratóriumában (MAF). 15 multiplexelt vizsgálatot terveztünk a MassARRAY Assay Design v4.0 szoftverrel (Agena Bioscience). Az allélspecifikus allélkiterjesztési protokollt az Agena Bioscience ajánlása szerint hajtottuk végre. Az 1. és 2. validációs kohorsz összes genetikai társulási eredményét benyújtották a GWAS Central-hoz.

Az egyesület statisztikai elemzése

Az alanyokat BMI-vel jellemeztük, és az értékeket elhízottak és a kontrollok külön-külön átlag ± SD-ként adtuk meg. A genetikai asszociáció elemzését és a valószínűségi arány számítását a PLINK segítségével végeztük (//pngu.mgh.harvard.edu/

purcell, Purcell és mtsai. 16). Az esetek és a kontrollok közötti genotípus-frekvenciák Hardy-Weinberg-egyensúlyát (HWE) minden egyes validációs ciklusra külön-külön ellenőriztük az asszociációs elemzés előtt. A kontrollok HWE névleges értékét, P 0,01, határértékként használtuk a változatok további elemzésből való kizárására. A BMI-t a PLINK-ben megvalósított standard lineáris regresszióval elemeztük. A nemet és az életkorot kovariátorként alkalmaztuk annak értékelésére, hogy milyen hatással vannak a variáns BMI-vel való összefüggésére.

az eredmény

Ritka változatok felfedezése exoma szekvenálással

Az extrém elhízással járó potenciális funkcionális alacsony frekvenciájú és ritka változatok azonosítása érdekében exoma szekvenálást végeztünk 100 DNS-en (10 csoport) súlyos kóros elhízással és 100 kontroll alanyon (10 csoport). Így minden csoportban 10 alany DNS-e volt. Az exoma szekvenálására szolgáló alanyok jellemzőit az 1. táblázat mutatja be. Az elhízott alanyok idősebbek voltak, mint a kontroll csoportok, míg a nemek közötti megoszlás a kohorszok között hasonló volt, a nők túlreprezentáltak voltak. Összesen> 100 millió olvasatot kaptunk minden csoporttól (S1 kiegészítő táblázat). Az alacsony minőségű képek kivágása és a PCR-duplikátumok eltávolítása után a képek 95% -át az aktuális emberi genom referenciához (hg19 összeállítás, NCBI 37 összeállítás) hozzárendeltük, kivéve egy kontrollcsoportot, amelynek kissé alacsonyabb a feltérképezési aránya. Az olvasmányok túlnyomó többségét egyedileg térképezték fel ugyanazon a kromoszómán mindkét párosított olvasáshoz. A páros olvasmányok között ritka volt a nézeteltérés. Az elhízott csoportokban a leolvasások nagyobb arányban (97%) párosultak, mint a kontroll csoportokban (80-95%) (S1 kiegészítő táblázat). A megcélzott régiók több mint 92% -át 5 leolvasás, a célrégiók> 80% -át pedig 30 leolvasás fedte le (S2 kiegészítő táblázat).

Asztal teljes méretben

SNV validálás és asszociációs elemzés

A genotipizálás esetleges technikai problémáinak elkerülése érdekében kizártuk az inszerciós vagy deléciós variánsokat az 1032 SNV-ből. Ezután leszűrtük az SNV-ket, amelyeken legalább két legmagasabb hozamú elhízott medence osztozik. Miután az IGV szoftver (//www.broadinstitute.org/igv/) segítségével manuálisan ellenőriztük a variánsokat hordozó leolvasások összehangolását a potenciális műtermékek kizárása érdekében, 144 SNV-t választottunk ki a genotipizáláshoz (142 dbSNP és 2 ismeretlen SNV). A szekvenálási mélységeket és a megosztott elhízási medencék számát 144 SNV mutatja be az S3 kiegészítő táblázatban. A legtöbb SNV-t két (83) vagy három (31) csoportban találták. Tíz SNV-nek nehézségei voltak a genotipizáláshoz szükséges primerek megtervezésében, és helyüket egyetlen szingulett SNV-k váltották fel.

Asztal teljes méretben

5 SNV elhízással vagy BMI-vel való összefüggésének jelentőségét az első és a végső elemzésben nem befolyásolta, amikor kizártunk 100 vizsgálati alanyot, akiket exomszekvenciában használtunk az elemzésekhez (S6 és S7 kiegészítő táblázat).

Az életkor vagy a nem minden zavaró hatásának további értékeléséhez ezeket a változókat kovarianciaként adtuk hozzá a regressziós modellekben, és külön teszteltük azok egyéni hatásait. Az rs62623713 szoros kapcsolatot tartott fenn a BMI-vel az életkor vagy a nem alapján történő kiigazítást követően (S8. kiegészítő táblázat). Az rs35923425 és a BMI közötti kapcsolat megszűnt az életkor beállítása után. Ezenkívül különféle vizsgálatokat is végeztünk számos genetikai változat elemzésének módosítására. Az rs62623713 és a BMI közötti összefüggés továbbra is szignifikáns volt a Bonferroni-módosított Pferaz 3,0 x 10-4 és a genom által kontrollált P genom-korrekció esetén 0,05. További S9 táblázat).

vita

Exoma szekvenálást, majd kiterjedt genotipizálást alkalmazva azonosítottuk az rs62623713 (E99G) alacsony frekvenciájú kódoló variánsát a SYPL2 gén 4. exonjában, amely következetesen társul a kóros elhízással. Az rs62623713 MAF értéke 2,9% a G allél számára az 1000 genomú általános populációkban. A változat túlsúlyos az elhízott alanyok között (MAF 8%). Az rs62623713 nem szerepelt a korábbi GWA-vizsgálatokban használt Illumina vagy Affymetrix genotípus mezőkben, és ezeknek a mezőknek egyetlen más változata sem volt szoros kapcsolatban az rs62623713-mal.

Tudomásunk szerint csak három jelentés van az elhízással kapcsolatos változatokról, amelyeket exoma szekvenálással detektáltak. 9., 17., 18. Albrechtsen és mtsai. 17 elemezte a metabolikus szindrómával rendelkező kohortot és számos metabolikus fenotípust vizsgált. Huang és munkatársai tanulmánya. 18 főként a 2-es típusú cukorbetegséget elemezte. Gill és mtsai. 9 a LEPR új változatait azonosította súlyos gyermekkori elhízásban exoma szekvenálással.

Vizsgálatunk alapjául szolgáló hipotézis az, hogy az elhízás súlyosabb formáit okozhatják a fenotípusra nagyobb hatást gyakorló alacsony frekvenciájú vagy ritka változatok. Kimutatták, hogy a kórosan elhízott esetek kis részét magas behatolású genetikai variánsok okozzák. A melanocortin 4 (MC4R) receptor gén változatai a gyermekkori elhízás több százalékát magyarázzák, a kognitívan elhízott, kognitív károsodásban szenvedő egyének több százaléka esetében a 19 és a 16 20-as kromoszómán található kópiák száma ismétlődik. Exoma szekvencia adatainkban az MC4R exonikus vagy anterior régióiban nem találtunk variánsokat, ami a vizsgált alanyok alacsony számának köszönhető. Eredményeink, vagyis egyetlen SNP kimutatása a SYPL2-ben, amely továbbra is jelentősen összefügg az elhízással a többszörös teszteléshez történő igazítás után, alátámasztják azt a nézetet, hogy az alacsony frekvenciájú és ritka változatok hozzájárulnak a kóros elhízáshoz. A jelenlegi vizsgálatnak azonban nincs ereje megbecsülni, hogy a ritka genetikai variánsok milyen mértékben okoznak kóros elhízást egy populációban.

Korábbi jelentésekben a SYPL2 súlyos depressziós rendellenességgel társult az európai populációban. 24 Az elhízás és a depresszió közötti kapcsolatot többször is megállapították. Egy metaanalízis szerint az elhízás növeli a depresszió kockázatát. Ezenkívül a depresszióról kiderült, hogy az elhízást jósolja. Egy másik tanulmány megállapította, hogy az elhízás és a depresszió összefüggése elsősorban a súlyos elhízásban szenvedőkre korlátozódott. 26.

A SYPL2 a szinaptofizin családba tartozik. A szinaptofizin szabályozza az aktivitásfüggő szinapszis képződést a tenyésztett hippokampusos idegsejtekben 27, és szükséges a tenyésztett hippokampusz idegsejtjeiben a szinaptikus hólyagok kinetikailag hatékony endocitózisához. 28 A táplálékfelvételt a hipotalamusz és más agyi központok, beleértve az agytörzset és a hippocampust is, összetett szabályozásnak vetik alá. Ezért feltételezhető, hogy a SYPL2 részt vesz az élelmiszer-bevitel központi szabályozásában, ami valószínűleg befolyásolja a központi jutalmazási rendszereket és az étel hedonikus hatásait.

Végül azonosítottunk egy alacsony frekvenciájú, az SYPL2 gén elhízással társuló kódoló variánsát exoma szekvenálásával 100 kórosan elhízott és 100 nem elhízott egyén közös DNS-ével, majd 3197 eset kontrollcsoportban genotípus validálással. Eredményeink bizonyítják az elhízáshoz társuló kódoló variáns létezését, bár ennek a genetikai variánsnak további funkcionális vizsgálata még szükséges.