アレイデザイン

概要*

このページは DOR にマイクロアレイデザイン (レイアウトとアノテーション) を登録する方法を説明しています。 ADF はマイクロアレイのデザインを表現したタブ区切りテキストファイルです。 マイクロアレイのレイアウトを記載するためには,ゲノム配列,合成配列,アレイ上にプリントされたプローブの物理的な位置,加えて,これらの間の対応関係に関する情報を記載する必要があります。 アレイデザインは他のハイブリダイゼーションや登録で共通して使うことができます。

アレイデザインを登録する必要があるかどうか下のフローチャートで判断してください。

DOR にアレイデザインを登録する必要があるかどうかを判断するためのフローチャート
DOR にアレイデザインを登録する必要があるかどうかを判断するためのフローチャート

アレイデザインが登録されているかどうかの確認*

アレイデザインが ArrayExpress/DOR に既に登録されていれば新たにデザインを登録する必要はありません。 Affymetrix,Agilent,Illumina や Nimblegen といった主な市販のアレイデザインは既に登録されています。

登録されているアレイデザインは次のサイトで検索してください: ArrayExpress platform designs query interface.

アレイデザインが ArrayExpress/DOR に既に登録されている場合,SDRF 中の "Array Design REF" カラムに該当するアクセッション番号を記入することで登録済みデザインを引用します。

新しい市販のアレイデザイン*

使った市販のアレイが ArrayExpress/DOR に登録されていない場合は,アレイデザインと製造元に関する情報を DOR にメールでお知らせください

Array Design Format (ADF) ファイルの作成*

ADF ファイルはどのようなスプレッドシートアプリケーションでも作成できますが,最終的にはタブ区切りテキストファイルとして保存してください。

ADF ファイルは以下の情報を含みます:

ヘッダーセクションにアレイデザインに関するトップレベルの情報を記載します。 IDF と同様,任意の "Comment[]" 行を使用し必要な情報を追加することができます。 アレイデザインを詳細に記述するため (MAGE-TAB 全体ではなく) ADF レベルの Term Source を ADF ヘッダーセクションに含めることができます。 IDF と同様,これらの Term Source にはアクセッション番号や語句が由来するデータベース名やオントロジー名を記入します。 IDF と同様,カラムを横に並べ,必要な数分の Term Source を定義することができます。 ADF ヘッダーセクションで使用可能な行のリストを下表にまとめました。 全てのタグは任意で1つの値しか持つことができません。 任意の順序でタグ (行) を並べることができますが,属性値 (Attribute) が記載された行はそれが属するタグの直下に配置します。

ADF ヘッダーセクション
Tag Value
Array Design Name Text
Version Text
Provider Text
Printing Protocol Text
Technology Type Ontology term
Technology Type Term Source REF Term Source Name
Technology Type Term Accession Number Term Accession Number
Surface Type Ontology term
Surface Type Term Source REF Term Source Name
Surface Type Term Accession Number Term Accession Number
Substrate Type Ontology term
Substrate Type Term Source REF Term Source Name
Substrate Type Term Accession Number Term Accession Number
Sequence Polymer Type Ontology term
Sequence Polymer Type Term Source REF Term Source Name
Sequence Polymer Type Term Accession Number Term Accession Number
Term Source Name Text tag as used in main ADF table
Term Source File URI
Term Source Version Text
Comment[]

スポットの場所: フィーチャという概念*

アレイ上の各スポットはフィーチャ (Feature) と呼ばれます。 フィーチャの場所は4つの座標 "Block Column","Block Row","Column","Row" で示されます。 これら4つのカラムは必須で,ADF の各行は1つのフィーチャに対応します。 スポットは1回しか現れることができないのでフィーチャは重複することができません。一方,レポーターはいくつかの異なる場所に存在し得ます。 生データファイル中の全てのフィーチャは,そこに何もスポットされていなくても ADF に含めます。

Block Column と Block Row 座標
ADF フィーチャの座標
Block Column Block Row Column Row
1 1 1 1
1 1 1 2
1 1 1 3

スポットの配列: レポーターという概念*

ゲノム上の配列実体を表した合成配列は1つ以上の場所に存在することができます。 これらのエレメントはレポーター (Reporter) と呼ばれます。 MIAME 基準を満たすためには,アレイに存在するプローブの塩基配列情報を提供する必要があります。 レポーターは ID と配列でユニークに特定されます。 レポーターの役割 (experimental か control か) や control の種類といった追加情報が必要です。

ADF にはデータマトリックスファイルや正規化されたデータファイルで使われているものと同じ Repoter Name を記載します。 アレイデザインファイルの Reporter Name はデータファイル中の測定値とアレイのアノテーションをリンクします。

オリゴアレイの一般的な ADF
Reporter Name Reporter Sequence Reporter Group[role] Control Type
R1 ATGGTTGGTTACGTGT Experimental
R2 CCGCGTTGCCCCGCC Experimental
R3 TCCCTTCCGTTGTCCT Control control_spike_calibration
PCR プローブアレイの一般的な ADF
Reporter Name Reporter Database Entry[flybase] Reporter Group[role] Control Type
R1 Fb2353 Experimental
R2 Fb2354 Experimental
R3 Fb2345 Control control_spike_calibration

アレイ上のプローブのデータベースエントリか実際の塩基配列を記入します。 アクセッション番号が由来するデータベース名を記述するため,ヘッダーの [] にデータベースコードを記入します。 使用可能なデータベース名一覧 ('Name' カラムのコード名を使います)。

よく使われるコードを以下に示します。

Database Entry でよく使われるデータベースコードのリスト
catma flybase nasc refseq trembl
ddbj image omim rgd unigene
ensembl locus plasmodb tair wormbase

"Control Type" カラムにコントロールの種類を記入します。 スポットがコントロールではない場合は,このカラムには何も記入しないでください。

記入可能な値:

  • control_biosequence - 例: スパイク
  • control_buffer - アレイにスポットされたバッファー
  • control_empty - アレイには何もスポットされていない
  • control_genomic_DNA - 例: salmon sperm DNA
  • control_label - landing lights
  • control_reporter_size - サイズ標準
  • control_spike_calibration - 濃度を変えたスパイク
  • control_unknown_type

測定対象のゲノム配列実体: Composite Element という概念*

プローブ (Reporter) の測定対象である生物学的配列について記載します。 シンプルなマイクロアレイデザインでは「スポットの位置,スポット配列」と「対象ゲノム配列」が1対1に対応します。 1ロケーション - 1プローブ - 1遺伝子もしくは1生物学的実体,と容易に解釈できます。 このような場合,1つの ADF で全てのレイヤーを記載することができます。

より複雑なアレイデザインでは,複数のスポットが対象ゲノム配列に対応します。 ADF は Reporter (プローブ配列)と Composite Element (生物学的配列) 間の関係が1対1,1対多の場合でもアレイデザインを記載することができます。

通常の Database Entry によるアノテーションに加え,各フィーチャ,レポーター,Composite Element に "Comment[<category>]" カラムで情報を追加することができます。

2つの Reporter が1つの Composite Element に対応している場合
Reporter Name Composite Element Name Composite Element Database Entry[tair] Comment[Chromosome]
R1 HSP18.2 AT5G59720.1 5
R2 HSP18.2 AT5G59720.1 5

ADF の使用例*

使用例 1: Technical replicate がなく,プローブとゲノム配列が直接1対1対応している場合

Technical replicate がなく,プローブとゲノム配列が直接1対1対応している場合の ADF

使用例 2: Technical replicate があり,プローブとゲノム配列が直接対応している場合

この場合 Composite Element の記載は必須ではないので ADF の Composite Element カラムを省略することができます。

Technical replicate があり,プローブとゲノム配列が直接対応している場合の ADF

使用例 3: Technical replicate がなく,複数プローブが1つのゲノム配列に対応している場合

この場合は Composite Element カラムが必要です。複数の Reporter が1つの Composite Element に対応しているケースのみをサポートしています。

Technical replicate がなく,複数プローブが1つのゲノム配列に対応している場合の ADF

ADF セクション*

ADF は2つのセクションから成ります:

  • トップレベルの情報を記載したヘッダーセクション (任意)
  • 主要部分のテーブル。使用可能なカラムヘッダーリスト。 このテーブルと上にあるヘッダーセクションは "[main]" ヘッダー (大文字小文字の区別なし) で区切られます。
ADF カラムヘッダーリスト
Object Associated attributes
(Feature) Block Column, Block Row, Column, Row, Comment[]
Block Column
Block Row
Column
Row
Reporter Name Reporter Database Entry[], Reporter Sequence, Reporter Group, Control Type, Comment[]
Reporter Database Entry[]
Reporter Sequence
Reporter Group[] Reporter Group Term Source REF
Reporter Group Term Source REF Reporter Group Term Accession Number
Reporter Group Term Accession Number
Control Type Control Type Term Source REF
Control Type Term Source REF Control Type Term Accession Number
Control Type Term Accession Number
Composite Element Name Composite Element Database Entry[], Comment[]
Composite Element Database Entry[] Comment[]
Comment[]

"Reporter Group[]" カラムを使うことでグループの種類を記載することができます。例えば "experimental" と "control" を値として持つ "role",Multi-species アレイにおける "species" などが挙げられます。グループの種類 ("role" や "species") はフリーテキストで [] に記入します。

ADF の例*

ADF の例

投稿前に ADF をチェックする方法*

ADF のフォーマットをチェックするツールが ArrayExpress から提供されています。 このツールは検出した全てのエラーを出力します - アレイデザインの登録を円滑にするため,ADF を投稿する前に可能な限りエラー箇所を修正してください:

ADF format checking tool (ArrayExpress)

ADF チェックリスト:
  • ファイルはタブ区切りテキストである (エクセルではない)
  • フィーチャの座標は Block Column,Block Row,Column,Row 形式である
  • 以下のカラムが含まれている:
    • Reporter Name
    • Reporter Sequence and/or Reporter Database Entry[]
    • Reporter Group[role]
    • Control Type
  • オリゴアレイの場合 Reporter Sequence が含まれている
  • 塩基配列が記載されていない場合,1つ以上の Reporter Database Entry[] カラムが含まれている