nyílt

  • elemeket
  • absztrakt
  • Metaadatok összefoglalása
  • Háttér és összefoglalás
  • mód
  • Megalapozott beleegyezés megszerzése
  • OA kohorsz kiválasztása
  • Daganat és normál gyűjtés
  • Az egész exome szekvenálás
  • Könyvtári előkészítés
  • Exome elfog
  • szekvenálás
  • Az egész genom szekvenálása
  • Könyvtári előkészítés
  • szekvenálás
  • Olvassa el a feltérképezési és hívási variációkat
  • Kód rendelkezésre állása
  • Adatrekordok
  • Műszaki ellenőrzés
  • Megjegyzések a felhasználásra vonatkozóan
  • További részletek
  • Adatok idézése

elemeket

  • Rákgenomika
  • DNS szekvenálás
  • Genetikai kutatások
  • Orvosi genomika

absztrakt

A rákra vonatkozó genomi adatok megosztása az összesített vagy kezelt hozzáférési kezdeményezésekre korlátozódott a kutatásban résztvevők magánéletének védelme érdekében. Az adatokhoz való hozzáférés korlátozása azt állította, hogy az adatmegosztási erőfeszítésekben való részvétel mellett döntő személyek autonómiáját megszüntették, és csökkentették az adatok hasznosságát a kutatási és oktatási eszközökben. A CPRIT által finanszírozott Texas Cancer Research Biobank nyílt hozzáférésű (OA) kísérleti projektje során sok texasi rákos beteg hajlandó volt nyíltan megosztani a daganatok és a normális párok genomikai adatait. Első alkalommal összehasonlítható színvonalú emberek hét rákos esetének genetikai adatai szabadon hozzáférhetők, anélkül, hogy adatfelhasználási megállapodásokra vagy nagyobb korlátozásokra lenne szükség, azzal a különbséggel, hogy a végfelhasználók nem próbálhatják meg újból azonosítani a résztvevőket (//txcrb.org/open .html). ).

Metaadatok összefoglalása

Töltse le a metaadatfájlt

Gép által elérhető metaadatfájl, amely leírja az adatokat (ISA kártya formátum)

Háttér és összefoglalás

A résztvevők megadták az első hozzájárulását az OA adatmegosztásában való részvételhez. Azokat, akik hozzájárultak, tájékoztatták a kockázatokról és az előnyökről, majd megkérdezték, tesztelik-e a megértést, és megkérdezték, hogy szeretnének-e megosztani az OA-val. Ezután daganat- és normál vérmintákat nyertek azoktól, akik megértést mutattak és újra megerősítették, és minden exoma-szekvenciát alávetettek.

Teljes méretű kép

Az olyan erőfeszítések, mint a személyes genom projekt az Egyesült Államokban, Kanadában, az Egyesült Királyságban és Ausztriában, nyilvánosan megosztják az egészséges résztvevők genomikai és klinikai adatait 19. Tudomásunk szerint a TCRB OA adatkészlet az első olyan genomiális adatkiadás egyéni szinten, amely az emberi rákokat célozza meg. A hozzáférés akadályainak csökkentése növeli az adatokkal való visszaélések lehetőségét, de megfelelő tájékozott beleegyezéssel és a betegek titkosságának védelméhez szükséges megfelelő lépésekkel ez az adatkészlet megerősíti, hogy sok beteg elismeri, hogy a jövőbeli pozitív előnyök meghaladhatják ezeket a kockázatokat. Ez a beleegyezés, a nagy mennyiségű, könnyen hozzáférhető adat nyilvános hozzáférésével párosulva, döntő fontosságú az emberekben a rák különösen kihívást jelentő kihívásainak kezelésében.

mód

Megalapozott beleegyezés megszerzése

OA kohorsz kiválasztása

A megkérdezett 37 résztvevő (n = 7) körülbelül 20% -át választották ki, hogy felvegyék az OA-adatok megosztását a TCRB OA-adathalmazba. Az újra-azonosítás kockázatának további csökkentése érdekében az OA-résztvevők egyikének sem volt ritka etnikai vagy daganattípusa, amint azt a SEER statisztikák meghatározták (Programfelügyelet, Epidemiológia és Végeredmények). Az 1. ábra bemutatja ennek a folyamatnak az eljárását és az adatkészlet létrehozásának további lépéseit.

Daganat és normál gyűjtés

Vért gyűjtöttünk a PAXgene vér DNS csövekben résztvevőktől, és a DNS-t a PAXgene Blood DNS kit segítségével (PreAnalytiX, Qiagen, Valencia, CA) izoláltuk. A hasnyálmirigy daganatos szövetmintákat röviddel a reszekció után vettük, és proteázgátló oldatba (Roche Applied Science, Indianapolis, IN), RNAlaterbe (Qiagen) helyeztük, vagy gyorsan fagyasztottuk és -80 ° C-on tároltuk. ellenőrzés. A DNS-t 50-100 mg szövetfragmentumból izoláltuk a GentraPuregene kit (Qiagen) alkalmazásával. A DNS-minták minőségét elektroforézissel határoztuk meg, és azt jó minőségűnek (méret> 23 kb) határoztuk meg, a vér- vagy a tumormintákban látható bomlás nem történt.

A genomiális szekvenálási megközelítések "valós világ" mintákban történő megvalósításához a klinikai mintákban olyan variánsokat kell kimutatni, amelyek csökkent tumorsejtességgel rendelkeznek, például neoadjuváns vagy más előzetes kezelés miatt. Módszertanokat dolgoztunk ki a kiterjedt desmoplasztikus fával kapcsolatos problémák leküzdésére, amely a legtöbb hasnyálmirigy-daganatra jellemző, és ezek a stratégiák megkönnyítették az új molekuláris mechanizmusok felfedezését e betegség patofiziológiájában. Az egyes primer minták cellularitását kóros áttekintéssel, a KRAS 2 és 3 exonok mély szekvenálásával (átlagos mélység 1000 ×) becsültük amplikon és cellularitás becslések alapján a nukleotid polimorfizmuson (SNP) alapuló új qpure 20 algoritmus, klinikai és kóros annotációk segítségével. minden esetre az 1. táblázat sorolja fel.

Asztal teljes méretben

Az egész exome szekvenálás

Könyvtári előkészítés

Exome elfog

Az exoma rögzítéshez a négy könyvtárat egyesítették a rögzítés előtt (

300 ng/minta, 1, 2 ug/készlet) és hibridizáltuk oldatban a VCRome 2.1 Design 21 alkalmazásával, amelyet a NimbleGen szállított, a gyártó protokolljának megfelelően NimbleGen SeqCap EZ Exome Library SR Felhasználói kézikönyv. (2.2-es verzió) kisebb módosításokkal. Humán COT1 DNS-t és az Illumina adapterre specifikus teljes blokkoló oligonukleotidokat adtunk a hibridizációhoz, hogy blokkoljuk az ismétlődő genomi szekvenciákat és az adaptív szekvenciákat. Az amplifikáció utáni LM-PCR-t egy Phusion High-Fidelity PCR Master Mix alkalmazásával hajtottuk végre, 14 amplifikációs ciklussal. Az AMPure XP gyöngyök végső tisztítása után a befogási könyvtár mennyiségét és méretét egy Agilent Bioanalyzer 2100 DNS Chip 7500 alkalmazásával elemeztük. A rögzítés hatékonyságát qPCR-alapú minőségellenőrzéssel értékeltük négy standard NimbleGen belső kontrollon. Becslések szerint a befogási könyvtárak sikeres gazdagítása 6 és 9 ΔCt közötti értéket mutatott a nem dúsított mintákhoz képest.

szekvenálás

A könyvtári sablonokat szekvenáláshoz készítettük el az Illumina cBot fürtgeneráló rendszerével, TruSeq PE fürtgeneráló készlettel (katalógusszám: PE-401-3001). Röviden, ezeket a könyvtárakat nátrium-hidroxiddal denaturáltuk, és hibridizációs pufferben 6-9 pM-re hígítottuk a betöltési sűrűség elérése érdekében.

800 K klaszter/mm2. A szekvenciális futtatásokat páros módban hajtottuk végre az Illumina HiSeq 2000 platform segítségével, az egyes könyvtárak készletét a HiSeq 2000 áramlási cellák egyik sávjába töltöttük, és mindegyik sávhoz hozzáadtunk egy 2% -os phiX vezérlő könyvtárat a futás minőségének ellenőrzésére. A mintakönyvtárak ezt követően híd-amplifikáción mentek keresztül, hogy klonális klasztereket képezzenek, majd szekvenáló primerrel hibridizálták őket. TruSeq SBS kitek (kat. Sz. FC-401-3001) felhasználásával a szintézis szekvenálási reakciókat mindkét ciklusból 101 ciklussal meghosszabbítottuk, további 7 ciklust kivonva az indexhez. A szekvenciális ciklusok körülbelül 300-400 millió sikeres leolvasást eredményeztek az egyes áramlási cellák sávjaiban, ami mintánként 7-13 Gb-ot eredményezett. Kivételes szekvenálási hozamok esetén a minták az exonikus régiókban átlagosan 200x lefedettségi mélységet értek el.

Az egész genom szekvenálása

Könyvtári előkészítés

A legtöbb esetben nem állt rendelkezésre elegendő biospektíva a teljes genomi szekvenálás (WGS) elvégzéséhez. Ezekben az esetekben csak WEX adatok léteznek. Két esetben azonban lehetőség volt WGS elvégzésére. A könyvtári sablonokat szekvenáláshoz készítettük el az Illumina cBot fürtgeneráló rendszerével, TruSeq PE fürtgeneráló készlettel (katalógusszám: PE-401-3001). A 70 μl térfogatú DNS-t (0,5 μg) a Covaris S2 rendszer (Covaris, Inc. Woburn, MA) segítségével kb. 500-700 bázispár töredékekre vágtuk. Röviden, ezeket a könyvtárakat nátrium-hidroxiddal denaturáltuk, és hibridizációs pufferben 6-9 pM-re hígítottuk a betöltési sűrűség elérése érdekében.

800 K klaszter/mm2. A ligálás idején vonalkód-szekvenciákkal rendelkező Illumina multiplexelő PE adaptereket adtunk a mintához. A PCR által közvetített pre-capture ligációt (LM-PCR) 6-8 cikluson keresztül hajtottuk végre, a Kapa HiFi DNS polimerázt (Kapa Biosystems, Inc., Kat. KK2612) és az IMUX-P1.0 univerzális Amplification Readymix könyvtárat használva. alapozó pár. és az IMUX-P3.0. 4) 0,8X AMPure XP-t (Beckman, katalógusszám: A63882) alkalmaztunk a fragmentált DNS tisztítására, szemben az 1,8X-szel a WES könyvtárak előállításához.

szekvenálás

A tumor könyvtárakat négy sávba, a normál könyvtárakat pedig a HiSeq 2000 áramlási sejt két sávjába soroltuk, ami megközelítőleg 60-szoros és 30-szoros lefedettséget eredményezett. Mindegyik sávot 2% -os phiX kontroll könyvtárral dúsítottuk a futás minőségének ellenőrzésére. A mintakönyvtárak ezt követően híd-amplifikáción mentek keresztül, hogy klonális klasztereket képezzenek, majd szekvenáló primerrel hibridizálták őket. A szekvenálási futtatásokat páros módban, az Illumina HiSeq 2000 platform segítségével hajtottuk végre. TruSeq SBS készletek (katalógusszám: FC-401-3001) segítségével a szintézis szekvenálási reakciókat mindkét ciklusból 101 ciklussal meghosszabbítottuk, további 7 ciklust kivonva a index. A szekvenciális ciklusok körülbelül 300-400 millió sikeres leolvasást generáltak az egyes áramlási cellák útvonalain, biztosítva

11 Gb mintánként.

Olvassa el a feltérképezési és hívási variációkat

Kód rendelkezésre állása

A szekvenciaadatok előállításához, valamint a biospektívumok és a klinikai annotációk kezeléséhez használt összes szoftver szabadon elérhető. Konkrét szoftververziók és kódkapcsolatok találhatók fent.

Adatrekordok

A tumor (T) és a normál (N) minták FASTQ-leolvasásai és BAM-rekordjai minden esetben szabadon hozzáférhetők a felhasználás feltételeivel együtt, és szabadon elérhetők a Texas Cancer Research Biobank weboldalán, //txcrb.org/open.html (1. hivatkozási adat: TCRB nyílt hozzáférésű tároló TCRBOA1). Az ezekre az esetekre rendelkezésre álló klinikai annotációkat az 1. táblázat határozza meg. Az átkattintási megállapodástól eltekintve a felhasználási feltételek elismerése mellett az a követelmény, hogy hozzáférési fiókot kell létrehozni az audit céljából, és ezeket a feltételeket minden egyes adatmegosztás során fel kell tüntetni. nincs egyéb akadálya az adatokhoz való hozzáférésnek. ezen a portálon. A felhasználói fiókok 30 napig érvényesek és megújíthatók. Ezen adatok egy részét vagy egy részét kutatási és oktatási célokra lehet letölteni, megosztani és terjeszteni, felhasználási feltételeikkel összhangban.

Az adatok fenntartható elérhetőségének biztosítása érdekében ezeket az SRA-ban is tárolják. Létrehoztuk a Texas Cancer Research nyílt banki adatmegosztási esernyő projektjét (csatlakozás: PRJNA285925), amely két platform-specifikus projektet hozott létre - egy Texas Biological Open Access Data Sharing Data Sharing Project: Exome Project (Data Citation 2: NCBI Sequence Read Archive PRJNA284596), amely mind a hét esetet tartalmazza, és a Texas Cancer Research Biobank nyílt hozzáférésű adatmegosztás: Genom projekt (3. adatcím: NCBI Sequence Reading Archive PRJNA284598) elnevezésű alprojekt, amelyhez elegendő genetikai anyagot végeztek az egész genom szekvenálásához az exome szekvenálás után, és eseteket tartalmaz 6. és 7. ábra.

Az NCI és mások fontolóra veszik azokat a mechanizmusokat, amelyek számítási képességeket hoznak az adatokba, hogy elkerüljék a nagy fájlok hálózatokon történő továbbításának problémáját. Azok a végfelhasználók, akik nem rendelkeznek elegendő helyi számítási és/vagy tárolási képességgel, vagy akik számára az adatok letöltése nehézségekbe ütközhet, az adatrekordok harmadik példánya, felhasználásuk feltételei és a HGSC higanycsőrendszer elérhető a DNAnexus felhőben. A felhasználási feltételek és a kattintási adatok a //dnanexus.github.io/tcrb-data/ címen érhetők el.

Ezekből az esetekből további adatrekordok állíthatók elő, például teljes genomiális szekvenciák, amelyeket hozzá kell adni ezekhez az adattárakhoz.

Műszaki ellenőrzés

A TCRB egy biztonságos webalkalmazások által támogatott, Acquire 30 nevű adatbázist használ a minták és azok feljegyzéseinek nyomon követésére (a kód a //github.com/BCM-DLDCC/Acquire címen érhető el). Moduljain keresztül támogatja a biobank műveletek teljes életciklusát, a gyűjteményektől a minőségellenőrzési tesztekig. Az állami kutatók a mintakérési modult használhatják a rendelkezésre álló minták elektronikus keresésére és kérésére. Szerezzen nagyban megkönnyített TCRB-adományt az OGA TCGA-tól és az ICGC-n kívüli gyártóktól.

A kutatási koordinátorok újból megvizsgálták minden OA résztvevő orvosi nyilvántartását az Acquire programba bevitt adatokkal szemben, hogy megbizonyosodjanak a klinikai annotációk helyességéről. Az akvizíciós koordinátor klinikai és kóros annotációkat állított össze HGSC hozzáférési számokkal és minden más esetre vonatkozó egyéb adatokkal.

Annak ellenőrzésére, hogy a kapott BAM-fájlok nem sérültek-e, és más környezetben történő FASTQ-fájlokból történő újrafeldolgozására alkalmasak-e, a BCM-fájlokat a Mercury 31 HGSC DNAnexus pipeline felhőpéldányának felhasználásával dolgozták fel újra a módszerek részben leírt megfelelő algoritmusokkal. Mindannyian átestek ezen a szerkesztési ellenőrzésen.

Asztal teljes méretben

A variánsok a kódoló régióra korlátozódtak, így a WEX és WGS minták összehasonlíthatók. Az allél sűrűségét (a variánsok és a teljes érték arányát) minden mintához ábrázoljuk.

Teljes méretű kép

Asztal teljes méretben

Megjegyzések a felhasználásra vonatkozóan

Az adatkészlet bármely részének letöltésével vagy használatával a végfelhasználóknak el kell fogadniuk a következő felhasználási feltételeket:

Nem lehet megkísérelni azonosítani az ilyen adatokkal vagy azok származékaival képviselt konkrét személyeket.

Nem próbálják meg összehasonlítani és/vagy összekapcsolni ezt a nyilvános adatsort vagy származékokat részben vagy teljesen a magán egészségügyi információkkal.

Ezek az adatok részben vagy teljesen szabadon letölthetők, felhasználhatók elemzésekben és újracsomagolhatók adatbázisokba.

Ezen adatok bármely részének vagy az azokból származó bármely anyagnak a terjesztése magában foglalja a jelen értesítés másolatát.

Az adatok kizárólag oktatási és/vagy kutatási eszközökként használhatók.

Ez az adatkészlet nem közvetlen megszerzésre szolgál annak számára, aki megkapja, és előfordulhat, hogy nem értékesítik tovább.

A felhasználók felhasználhatják az adatokat tudományos publikációkban, ha az adatszolgáltatókat (Texas Cancer Research Biobank és Baylor College of Medicine Human Genome Sequencing Center) megfelelően elismerték.

A közös szótárak megvalósítása megkönnyíti a szemantikai interoperabilitást és az adatok újrafelhasználását. Az OA-esetek kommentárjai tartalmazzák az NIH faji, nemi és etnikai hovatartozásának ellenőrzött terminológiáját; patológiai diagnózis az Egészségügyi Világszervezet ICD-O-3-tól (Nemzetközi Betegségek Osztályozása-Onkológia 3. verzió); valamint a tumor stádiumának és fokozatának adatai az Union for International Cancer Control (UICC/AJCC) adataiból. A standard metaadatok használata megkönnyíti a szintaktikai interoperabilitást. A TCRB szabványos adatelemeket, fájlformátumokat és metaadatokat használt. Mivel az OA-adatok letölthetők és újra megoszthatók, feltéve, hogy a felhasználási feltételeket tartalmazzák és betartják, minden megjegyzés a BAM-fájl fejlécében is megjegyzésként szerepel a használati feltételekre való hivatkozással. Ezeket a metaadatokat azért vettük fel, hogy a klinikai és kóros adatokat ne lehessen különválasztani a szekvencia-adatoktól.

További részletek

Hogyan idézhetem ezt a cikket: Becnel, LB és mtsai. Nyílt hozzáférésű pilóta, aki szabadon megosztja a texasi résztvevők genomiális rákos adatait. Sci. 3. adat: 160010 doi: 10, 1038/sdata. 2016.10 (2016).

Adatok idézése

Becnel, I. TCRB TCRBOA1 nyílt hozzáférésű tárház (2015)

Becnel, I. NCBI olvasási szekvenciaarchívum PRJNA284596 (2015)

Becnel, I. NCBI olvasási szekvenciaarchívum PRJNA284598 (2015)