MAGE-TAB の例

IDF の例*

IDF の例

MAGE-TAB Version1.1  
Investigation TitleHomo sapiens TK6
Experimental Designgenetic_modification_designtime_series_design
Experimental Factor NameGenetic ModificationIncubation Time
Experimental Factor Typegenetic_modificationtimepoint
Experimental Factor Term Source REFMGED OntologyMGED Ontology
Experimental Factor Term Accession NumberMO_927MO_738
   
Person Last NameMishimaFuji
Person First NameHanakoTarou
Person Emailhanako@ddbj.nig.ac.jp
Person Phone+81-55-981-6853
Person AddressYata 1111, Mishima, Shizuoka, Japan
Person AffiliationNational Institute of Genetics, DNA Data Bank of Japan
Person Rolessubmitter;investigatorinvestigator
Person Roles Term Source REFMGED OntologyMGED Ontology
   
Quality Control Typebiological_replicate 
Quality Control Term Source REFMGED Ontology 
Replicate Typebiological_replicate 
Replicate Term Source REFMGED Ontology 
Date of Experiment2005-02-28 
Public Release Date2006-01-03 
   
PubMed ID21062814
Publication Author ListHanako Mishima and Tarou Fuji.
Publication Statussubmitted
Experiment DescriptionGene expression of TK6 cells transduced with an ... the Neomycin resistance gene (TK6neo). 
   
Protocol NameGROWTHPRTCL 10653GROWTHPRTCL 10654
Protocol Typegrownucleic_acid_extraction
Protocol DescriptionTK6 cells were grown in suspension cultures in RPMI 1640 medium supplemented with...Approximately 10^6 cells were lysed in RLT buffer (Qiagen). Total RNA was extracted...
Protocol Parametersmedia;timeExtracted Product;Amplification
Protocol Term Source REFMGED OntologyMGED Ontology
   
SDRF Filee-dord-69.sdrf.txt 
   
Term Source NameMGED OntologyNCI Thesaurus
Term Source Filehttp://mged.sourceforge.net/ontologies/MGEDontology.phphttp://nciterms.nci.nih.gov/NCIBrowser/Dictionary.do
Term Source Version1.3.0.1

IDF で利用可能なフィールド一覧

SDRF の概念的な例*

ここでは Investigation Design Graph (IDG) を表で表す方法を概念的な例を使って説明しています。 青字のカラムヘッドはグラフの Node カラム (Name カラム) を示しています。

例1: 最もシンプルなデザイン*

図1(a) のように極端に単純化されたケースでは,対応するテーブルも 図1(b) のようにシンプルなものになります。 P-DORD-10 で参照されるプロトコールは Source から最後の Hybridization を得るまでの全ての実験処理を含んでいます。

図1(c) は Source から Hybridization を得る過程で複数のプロトコール (Protocol REF) が用いられた、より粒度が細かい場合です。

(a) Investigation design graph
(a) Investigation design graph
(b) 単純で構造化されていない Sample-Hybridization 関係の記載
Source Name Protocol REF Hybridization Name Array Data File Derived Array Data Matrix File
Source 1 P-DORD-10 Hybridization 1 Data1.CEL Matrix.txt
Source 2 P-DORD-10 Hybridization 2 Data2.CEL Matrix.txt
Source 3 P-DORD-10 Hybridization 3 Data3.CEL Matrix.txt
Source 4 P-DORD-10 Hybridization 4 Data4.CEL Matrix.txt
(c) Protocol カラムの複数記載
Source Name Protocol REF Protocol REF Protocol REF Protocol REF Hybridization Name
Source 1 P-DORD-2 P-DORD-3 P-DORD-4 P-DORD-5 Hybridization 1
Source 2 P-DORD-2 P-DORD-3 P-DORD-4 P-DORD-5 Hybridization 2
Source 3 P-DORD-2 P-DORD-3 P-DORD-4 P-DORD-5 Hybridization 3
Source 4 P-DORD-2 P-DORD-3 P-DORD-4 P-DORD-5 Hybridization 4

例2: 全てのノードが記載されたシンプルなデザイン*

図2 は使われた実験材料をノードとして明示的に示している例です。 図2(b) は 図1(b) と同じような実験デザインをより詳細に記述したものです。 図を見やすくするため Protocol REF カラムを省略しています。

(a) Investigation design graph
(b) 全てのノードを記載
Source Name Protocol REF Sample Name Extract Name Labeled Extract Name Hybridization Name Array Data File Derived Array Data Matrix File
Source 1 P-DORD-10 Sample 1 Extract 1 LabeledExtract 1 Hybridization 1 Data1.CEL Matrix.txt
Source 2 P-DORD-10 Sample 2 Extract 2 LabeledExtract 2 Hybridization 2 Data2.CEL Matrix.txt
Source 3 P-DORD-10 Sample 3 Extract 3 LabeledExtract 3 Hybridization 3 Data3.CEL Matrix.txt
Source 4 P-DORD-10 Sample 4 Extract 4 LabeledExtract 4 Hybridization 4 Data4.CEL Matrix.txt

例3: Technical replicate を使用している場合*

Technical replicate は 図3 のようにグラフを分岐して表現します。 Biological replicate は 図1(a) もしくは 図2(a) のグラフに Replicate サンプル間の関係を注釈したカラムを追加して記載します。

(a) Investigation design graph
(b) SDRF の記載
Source Name Sample Name Extract Name Labeled Extract Name Hybridization Name Array Data File Derived Array Data Matrix File
Source 1 Sample 1 Extract 1 LabeledExtract 1 Hybridization 1 Data1.CEL Matrix.txt
Source 1 Sample 1 Extract 2 LabeledExtract 2 Hybridization 2 Data2.CEL Matrix.txt
Source 2 Sample 2 Extract 3 LabeledExtract 3 Hybridization 3 Data3.CEL Matrix.txt
Source 2 Sample 2 Extract 4 LabeledExtract 4 Hybridization 4 Data4.CEL Matrix.txt

例4: サンプルがプールされている場合*

図4 はサンプルがプールされている場合です。見やすさのため,以降の例ではデータファイルを参照しているカラム (Array Data File と Derived Array Data File) を省略しています。

(a) Investigation design graph
(b) SDRF の記載
Source Name Sample Name Extract Name Labeled Extract Name Hybridization Name
Source 1a Sample 1 Extract 1 LabeledExtract 1 Hybridization 1
Source 1b Sample 1 Extract 1 LabeledExtract 1 Hybridization 1
Source 2a Sample 2 Extract 2 LabeledExtract 2 Hybridization 2
Source 2b Sample 2 Extract 2 LabeledExtract 2 Hybridization 2
Source 3a Sample 3 Extract 3 LabeledExtract 3 Hybridization 3
Source 3b Sample 3 Extract 3 LabeledExtract 3 Hybridization 3

例5: デュアルチャンネルの場合*

(a) Investigation design graph
(b) SDRF の記載
Source Name Sample Name Extract Name Labeled Extract Name Label Hybridization Name
Source 1a Sample 1a Extract 1a LabeledExtract 1a Cy3 Cy3 Hybridization 1
Source 1b Sample 1b Extract 1b LabeledExtract 1b Cy5 Cy5 Hybridization 1
Source 2a Sample 2a Extract 2a LabeledExtract 2a Cy3 Cy3 Hybridization 2
Source 2b Sample 2b Extract 2b LabeledExtract 2b Cy5 Cy5 Hybridization 2
Source 3a Sample 3a Extract 3a LabeledExtract 3a Cy3 Cy3 Hybridization 3
Source 3b Sample 3b Extract 3b LabeledExtract 3b Cy5 Cy5 Hybridization 3

例6: 共通のリファレンス (Common reference) を使用した場合*

(a) Investigation design graph
(b) SDRF の記載
Source Name Sample Name Extract Name Labeled Extract Name Label Hybridization Name
Source 1 Sample 1 Extract 1 LabeledExtract 1 Cy3 Cy3 Hybridization 1
Source 2 Sample 2 Extract 2 LabeledExtract 2 Cy3 Cy3 Hybridization 2
Source 3 Sample 3 Extract 3 LabeledExtract 3 Cy3 Cy3 Hybridization 3
Source 4 Sample 4 Extract 4 LabeledExtract 4 Cy3 Cy3 Hybridization 4
Reference Reference Ref. Extract Reference LE Cy5 Cy5 Hybridization 1
Reference Reference Ref. Extract Reference LE Cy5 Cy5 Hybridization 2
Reference Reference Ref. Extract Reference LE Cy5 Cy5 Hybridization 3
Reference Reference Ref. Extract Reference LE Cy5 Cy5 Hybridization 4

例7: 時系列実験*

時系列実験を表した 図7(a) の流れるような形のグラフは 図7(b) のように Time を Factor Value に指定することでフラットな構造にすることができます。 Investigation design graph は 図7(c) のようなシンプルな表になります。

(a) Investigation design graph
(b) フラットに表現された時系列実験のデザイン
Source Name Protocol REF Sample Name Extract Name Labeled Extract Name Hybridization Name Factor Value [Incubation Time] Unit [Time Unit] Term Source REF
Source 1 P-DORD-12 Sample 1 Extract 1 LabeledExtract 1 Hybridization 1 0 hours MGED Ontology
Source 1 P-DORD-12 Sample 2 Extract 2 LabeledExtract 2 Hybridization 2 1 hours MGED Ontology
Source 1 P-DORD-12 Sample 3 Extract 3 LabeledExtract 3 Hybridization 3 2 hours MGED Ontology
Source 1 P-DORD-12 Sample 4 Extract 4 LabeledExtract 4 Hybridization 4 3 hours MGED Ontology
(c) 単純化された Investigation design graph

SDRF カラムの使用例*

使用例1: 異なる実験処理*

図8(a) のように複数のプロトコールを使い,異なった実験処理を表すことができます。

異なるパラメータ値を持った1つのプロトコールを使うこともできます。 この場合,パラメータは IDF ファイルのプロトコールにリンクします (図8(b))。 パラメータに Unit カラムで単位を付けることができます (図8(c))。 同じ値をもつ Factor Value カラムを別に作成し,研究対象のパラメータとして SDRF に含めることができます。

(a) 異なる化合物に異なるプロトコールを使っている化合物処理実験。二つのサンプルが dye swap に使われています。
Source Name Protocol REF Extract Name Labeled Extract Name Label Hybridization Name
ethanol-treated P-DORD-1 Eth. Ext Eth. LE Cy3 Cy3 Hyb 1
butanol-treated P-DORD-2 But. Ext But. LE Cy5 Cy5 Hyb 1
ethanol-treated P-DORD-1 Eth. Ext Eth. LE Cy3 Cy3 Hyb 2
butanol-treated P-DORD-2 But. Ext But. LE Cy5 Cy5 Hyb 2
(b) 図8(a) と同じ実験を,別々のプロトコールではなく複数のパラメータを使って記載した場合。
Source Name Protocol REF Parameter Value [Compound] Extract Name Labeled Extract Name Label Hybridization Name
ethanol-treated P-DORD-3 ethanol Eth. Ext Eth. LE Cy3 Cy3 Hyb 1
butanol-treated P-DORD-3 butanol But. Ext But. LE Cy5 Cy5 Hyb 1
ethanol-treated P-DORD-3 ethanol Eth. Ext Eth. LE Cy3 Cy3 Hyb 2
butanol-treated P-DORD-3 butanol But. Ext But. LE Cy5 Cy5 Hyb 2
(c) 単位を持ったパラメータの例
Source Name Protocol REF Parameter Value [Temperature] Unit [TemperatureUnit] Term Source REF Sample Name Extract Name Labeled Extract Name Label Hybridization Name Factor Value [Temperature] Unit [TemperatureUnit]
Source 1 P-DORD-5 22 degree_C MGED Ontology 22 deg 22 deg. Ext 22 deg. LE Cy3 Cy3 Hyb 1 22 degree_C
Source 1 P-DORD-5 37 degree_C MGED Ontology 37 deg 37 deg. Ext 37 deg. LE Cy5 Cy5 Hyb 1 37 degree_C
Source 1 P-DORD-5 22 degree_C MGED Ontology 22 deg 22 deg. Ext 22 deg. LE Cy3 Cy3 Hyb 2 22 degree_C
Source 1 P-DORD-5 37 degree_C MGED Ontology 37 deg 37 deg. Ext 37 deg. LE Cy5 Cy5 Hyb 2 37 degree_C

使用例2: 異なる実験処理の適用 (ChIP-chip)*

ある実験処理が全てのサンプルに対して適用されていない場合,タブで区切られた空白 (もしくは "->" 記号) で「処理されていない」ことを示すことができます。 以下にクロマチン免疫沈降をしたサンプルと,沈降前のサンプルから全ゲノム DNA を抽出したサンプルを比較している場合を示します。 以下の例で P-DORD-1,P-DORD-2 と P-DORD-3 はそれぞれゲノム DNA の抽出,免疫沈降とラベリングのプロトコールを参照しています。これらのプロトコールは IDF で定義します。

フィールドで示された異なる実験処理の適用
Source Name Protocol REF Extract Name Protocol REF Extract Name Protocol REF Labeled Extract Name Label Hybridization Name
yeast 1 P-DORD-1 extract 1 P-DORD-2 ip 1 P-DORD-3 ip 1 LE Cy3 Cy3 Hyb 1
yeast 1 P-DORD-1 extract 1 -> -> P-DORD-3 extract 1 LE Cy5 Cy5 Hyb 1
yeast 1 P-DORD-1 extract 2 P-DORD-2 ip 2 P-DORD-3 ip 2 LE Cy3 Cy3 Hyb 2
yeast 1 P-DORD-1 extract 2 -> -> P-DORD-3 extract 2 LE Cy5 Cy5 Hyb 2

使用例3: ハイブリダイゼーションとサンプルへのデータファイルの関連付け*

測定されたデータファイルと加工処理されたデータファイルを特定のハイブリダイゼーションに関連付けることができます。 いずれの場合においても,ADF ファイルを参照している "Array Design File",もしくは,公共データベース ArrayExpress/DOR のアレイデザイン ID を参照している "Array Design REF" カラムが必要です。 "Term Source REF" カラムでデータベース名を示すことができます。

次世代シークエンシングなどのアレイ以外の技術が使われている場合 "Hybridization Name" の替わりに "Assay Name" カラムを使います。"Assay Name" の直後に "Technology Type" カラムを作成し,使われた技術を記載できます。 以下のテーブルは次世代シークエンシングが使われた場合の例です。

図10: それぞれのハイブリダイゼーションに関連付けられたデータファイル
Source Name Hybridization Name Array Design REF Term Source REF Array Data File Derived Array Data File
Sample 1 Hybridization 1 A-DORD-1 ArrayExpress Data1.CEL Data1.CHP
Sample 2 Hybridization 2 A-DORD-1 ArrayExpress Data2.CEL Data2.CHP
Sample 3 Hybridization 3 A-DORD-1 ArrayExpress Data3.CEL Data3.CHP
Sample 4 Hybridization 4 A-DORD-1 ArrayExpress Data4.CEL Data4.CHP

使用例4: Technology type,次世代シークエンスデータ*

次世代シークエンシングなどのアレイ以外の技術が使われている場合 "Hybridization Name" の替わりに "Assay Name" カラムを使います。"Assay Name" の直後に "Technology Type" カラムを作成し,使われた技術を記載できます。 以下のテーブルは次世代シークエンシングが使われた場合の例です。

図11: 次世代シークエンシングの例
Source Name Assay Name Technology Type Term Source REF Protocol REF Array Data File Derived Array Data File
Source 1 Assay 1 high_throughput_sequencing EFO P-DORD-8 run1.fastq run1_norm.txt
Source 2 Assay 2 high_throughput_sequencing EFO P-DORD-8 run2.fastq run2_norm.txt
Source 3 Assay 3 high_throughput_sequencing EFO P-DORD-8 run3.fastq run3_norm.txt
Source 4 Assay 4 high_throughput_sequencing EFO P-DORD-8 run4.fastq run4_norm.txt

SDRF 実際の例*

実際の例1: ArrayExpress experiment E-TABM-21*

Investigation Design Graph の各ノードは適切な "Name" カラムで,エッジは "Protocol REF" カラムで表します。 サンプルのアノテーション情報を他のカラムタイプを使って記載する場合があります。 データファイル名は "Array Data File" と "Derived Array Data File" カラムに記入します。 これらのカラムは図12には示してありますが,以降の例では分かりやすさのために省略しています。 この例では Genotype が Experimental factor になっています。

E-TABM-21 を ArrayExpress でみる

図12: ArrayExpress experiment E-TABM-21 - シングルチャンネルデザイン
Source Name Characteristics [Organism] Term Source REF Characteristics [Genotype] Protocol REF Extract Name Protocol REF Labeled Extract Name Label Hybridization Name Array Data File Derived Array Data File Factor Value [Genotype]
CHIP_322_A Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_322_A P-TABM-43 CHIP_322_A biotin CHIP_322_A CHIP_322_A.CEL CHIP_322_A.CHP wild_type
CHIP_322_B Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_322_B P-TABM-43 CHIP_322_B biotin CHIP_322_B CHIP_322_B.CEL CHIP_322_B.CHP wild_type
CHIP_322_C Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_322_C P-TABM-43 CHIP_322_C biotin CHIP_322_C CHIP_322_C.CEL CHIP_322_C.CHP wild_type
CHIP_323_A Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_323_A P-TABM-43 CHIP_323_A biotin CHIP_323_A CHIP_323_A.CEL CHIP_323_A.CHP co
CHIP_323_B Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_323_B P-TABM-43 CHIP_323_B biotin CHIP_323_B CHIP_323_B.CEL CHIP_323_B.CHP co
CHIP_323_C Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_323_C P-TABM-43 CHIP_323_C biotin CHIP_323_C CHIP_323_C.CEL CHIP_323_C.CHP co
CHIP_324_A Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_324_A P-TABM-43 CHIP_324_A biotin CHIP_324_A CHIP_324_A.CEL CHIP_324_A.CHP ft
CHIP_324_B Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_324_B P-TABM-43 CHIP_324_B biotin CHIP_324_B CHIP_324_B.CEL CHIP_324_B.CHP ft
CHIP_324_C Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_324_C P-TABM-43 CHIP_324_C biotin CHIP_324_C CHIP_324_C.CEL CHIP_324_C.CHP ft
CHIP_326_A Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_326_A P-TABM-43 CHIP_326_A biotin CHIP_326_A CHIP_326_A.CEL CHIP_326_A.CHP wild_type
CHIP_326_B Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_326_B P-TABM-43 CHIP_326_B biotin CHIP_326_B CHIP_326_B.CEL CHIP_326_B.CHP wild_type
CHIP_326_C Arabidopsis thaliana NCBI_tax wild type P-TABM-21 CHIP_326_C P-TABM-43 CHIP_326_C biotin CHIP_326_C CHIP_326_C.CEL CHIP_326_C.CHP wild_type
CHIP_327_A Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_327_A P-TABM-43 CHIP_327_A biotin CHIP_327_A CHIP_327_A.CEL CHIP_327_A.CHP co
CHIP_327_B Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_327_B P-TABM-43 CHIP_327_B biotin CHIP_327_B CHIP_327_B.CEL CHIP_327_B.CHP co
CHIP_327_C Arabidopsis thaliana NCBI_tax co P-TABM-21 CHIP_327_C P-TABM-43 CHIP_327_C biotin CHIP_327_C CHIP_327_C.CEL CHIP_327_C.CHP co
CHIP_328_A Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_328_A P-TABM-43 CHIP_328_A biotin CHIP_328_A CHIP_328_A.CEL CHIP_328_A.CHP ft
CHIP_328_B Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_328_B P-TABM-43 CHIP_328_B biotin CHIP_328_B CHIP_328_B.CEL CHIP_328_B.CHP ft
CHIP_328_C Arabidopsis thaliana NCBI_tax ft P-TABM-21 CHIP_328_C P-TABM-43 CHIP_328_C biotin CHIP_328_C CHIP_328_C.CEL CHIP_328_C.CHP ft

実際の例2: ArrayExpress experiment E-MEXP-549*

Biological replicate は共通の Experimental factor を持つ異なった Source で表現します。 図13で Biological replicate (ARP1-0h,ARP2-0h と ARP3-0h) は共通の Factor Value ("Time") を持つ異なる Source として表されています。 一方,Technical replicate は実験の途中のステップで Investigation Design Graph を分岐して表現します (図3)。

E-MEXP-549 を ArrayExpress でみる

図13: ArrayExpress experiment E-MEXP-252 (省略形)。異なる行動をする働きバチの脳を比較したループデザイン。二組のループが記載されています。
Source Name Characteristics [CellLine] Characteristics [CellType] Term Source REF Characteristics [DiseaseState] Term Source REF Characteristics [Organism] Term Source REF Characteristics [StrainOrLine] Hybridization Name Array Design REF Factor Value [Time] Unit [TimeUnit] Term Source REF
ARP1-0h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-0h A-AFFY-33 0 hours MO
ARP2-0h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-0h A-AFFY-33 0 hours MO
ARP3-0h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-0h A-AFFY-33 0 hours MO
ARP1-2h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-2h A-AFFY-33 2 hours MO
ARP2-2h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-2h A-AFFY-33 2 hours MO
ARP3-2h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-2h A-AFFY-33 2 hours MO
ARP1-4h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-4h A-AFFY-33 4 hours MO
ARP2-4h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-4h A-AFFY-33 4 hours MO
ARP3-4h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-4h A-AFFY-33 4 hours MO
ARP1-6h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-6h A-AFFY-33 6 hours MO
ARP2-6h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-6h A-AFFY-33 6 hours MO
ARP3-6h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-6h A-AFFY-33 6 hours MO
ARP1-8h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-8h A-AFFY-33 8 hours MO
ARP2-8h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-8h A-AFFY-33 8 hours MO
ARP3-8h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-8h A-AFFY-33 8 hours MO
ARP1-10h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-10h A-AFFY-33 10 hours MO
ARP2-10h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-10h A-AFFY-33 10 hours MO
ARP3-10h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-10h A-AFFY-33 10 hours MO
ARP1-12h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP1-12h A-AFFY-33 12 hours MO
ARP2-12h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP2-12h A-AFFY-33 12 hours MO
ARP3-12h MOLT4 T cell CTO acute lymphoblastic leukemia NCI_meta Homo sapiens NCBI_tax CFARP011 H-ARP3-12h A-AFFY-33 12 hours MO

実際の例3: ArrayExpress experiment E-MTAB-533*

次世代シークエンサを使った実験では,アレイを使った場合の "Hybridization Name" の替わりに "Assay Name" を用います。 "Assay Name" の直後に "high_throughput_sequencing" を値として持つ "Technology Type" カラムを作成します。 LIBRARY_LAYOUT,LIBRARY_SOURCE,LIBRARY_STRATEGY と LIBRARY_SELECTION 情報を "Comment" カラムを使って記載します。

他にもプラットフォームに依存したいくつかの属性値が必要です。 この例では (IDF の "Protocol Hardware" で定義された) "Illumina Genome Analyzer II" プラットフォームが使われているので,"Comment[SEQUENCE_LENGTH]" が必須になります。

詳細はシークエンシングデータの場合に必要な項目をご覧ください。

E-MTAB-533 を ArrayExpress でみる

図14: ArrayExpress experiment E-MTAB-533 (省略形。二つのテーブルに分割して示しています)。 大量シークエンシングによる転写プロファイル解析
Source Name Characteristics
[Organism]
Protocol REF Extract Name Comment
[LIBRARY_LAYOUT]
Comment
[LIBRARY_SOURCE]
Comment
[LIBRARY_STRATEGY]
Comment
[LIBRARY_SELECTION]
K562_GM12878_cell_lines Homo sapiens P-MTAB-19064 CCL-243 & GM12878 SINGLE TRANSCRIPTOMIC AMPLICON RT-PCR
L3_L4_stages Caenorhabditis elegans P-MTAB-19065 N2 L2 #4 and N2 L4-3 SINGLE TRANSCRIPTOMIC AMPLICON RT-PCR
Comment
[LIBRARY_SELECTION]
Protocol REF Performer Assay Name Comment
[SEQUENCE_LENGTH]
Technology Type Protocol REF Array Data File Factor Value
[ORGANISM]
RT-PCR P-MTAB-19066 LGTF s_3_1_all 75 high_throughput_sequencing P-MTAB-19067 s_3_1_all.qseq.gz Homo sapiens
RT-PCR P-MTAB-19066 LGTF s_4_1_all 75 high_throughput_sequencing P-MTAB-19067 s_4_1_all.qseq.gz Caenorhabditis elegans

ADF の例*

図15はシンプルな場合で Reporter - Composite Element が1対多 (もしくは1対1) に対応しています。 全てのプローブがアレイに1回以上スポットされていることを示すため,Reporter と Composite Element が重複しています。

図15: Reporter - Composite Element が1対1に対応しているシンプルなデザイン
Block Column Block Row Column Row Reporter Name Reporter
Sequence
Reporter Group
[role]
Control Type Control Type Term
Source REF
Composite Element
Name
1 1 1 1 R1 ATGGTTGGTTACGTGT experimental PTEN
1 1 1 2 R2 CCGCGTTGCCCCGCC experimental PAX2
1 1 1 3 R3 CGTAGCTGATCGGATGA experimental WWOX
1 1 1 4 R4 GGTTGGCTGAGATCGT experimental MAPK8
1 1 2 1 R1 ATGGTTGGTTACGTGT experimental PTEN
1 1 2 2 R2 CCGCGTTGCCCCGCC experimental PAX2
1 1 2 3 R3 CGTAGCTGATCGGATGA experimental WWOX
1 1 2 4 R4 GGTTGGCTGAGATCGT experimental MAPK8

実際の MAGE-TAB ファイル*

以下は実際に ArrayExpress に登録されているマイクロアレイと次世代シークエンシングを用いた場合の MAGE-TAB ファイルの例です。

MAGE-TAB ファイルの実際の例
Accession Number IDF Text SDRF Text Experiment Summary Platform
E-TABM-18 idf text sdrf text Transcription profiling of 35 different Arabidopsis thaliana ecotypes Affymetrix
E-DORD-69 idf text sdrf text Translation profiling of Arabidopsis cell cultures, dual channel Agilent
E-TABM-985 idf text sdrf text Transcription profiling by array of mouse testis development, dye swap design Compugen
E-MEXP-2665 idf text sdrf text ChIP-chip by array of mouse cell lines and fresh tissues Multiple platforms
E-TABM-855 idf text sdrf text Genotyping of human lymphoblastoid cell lines from pairs of HapMap indiviudals Illumina GoldenGate SNP array
E-MTAB-371 idf text sdrf text ChIP-seq of human myofibroblasts Illumina Sequencing
E-GEOD-26444 idf text sdrf text Deep sequencing-based analysis of the anaerobic stimulon SOLiD sequencing
E-GEOD-24366 idf text sdrf text Global Changes following N-deprivation in Chlamydomonas 454 sequencing