DDBJ BioSample Handbook

    BioSample

    BioSample について

    概要

    BioSample はデータベースに登録されている実験データを得るのに使われたサンプルに関する情報を管理するデータベースです。

    以下の図は BioSample がどのように他の DDBJ のデータベースとリンクしているかを示しています。 この例は,データと二つの BioSample,三つの BioProject,一つの Umbrella BioProject から構成されています。ユーザは BioProject または BioSample データベースを検索し,目的のレコードを取得,そこからのリンクをたどることによって DDBJDRA に登録されている関連する実験データを得ることができます。

    BioSample と他の DDBJ データベースとの連携
    BioSample と他の DDBJ データベースとの連携

    サンプル

    DDBJ のデータベースに登録されているサンプルが多様であること,また,サンプルの適切な記載方法が研究内容により異なることから BioSample の定義は柔軟なものになっています。 BioSample の典型的な例としては細胞株,組織の生検,生物個体や環境サンプルなどが挙げられます。

    Biological/Technical replicate は "replicate" というユーザ定義の属性を使い "biological replicate 1","biological replicate 2" のようにしてサンプルを区別します。FAQ: 塩基配列登録にはいくつのサンプルが必要ですか?

    BioSample はサンプルについての以下のような情報を含みます:

    • 生物種
    • 採取された生物試料,例: 器官,組織,セルタイプ
    • 表現型 - 疾患や個人の医学的な情報など

    ヒトに関する情報とそれへのアクセスは適用される全ての倫理的な要請を満たしている必要があります。 DDBJ BioSample データベースはアクセスを制限する仕組みを持っていないため,プライバシーに抵触する可能性のあるヒト由来サンプルを登録することはできません。

    リファレンスバイオサンプル

    BioSample に登録されたサンプルの一部は,多くの実験で共通に使用されるかもしれません。 ここではこのようなサンプルセットのことを "リファレンスバイオサンプル (reference biosample)" と呼びます。 リファレンスバイオサンプルの例としては,広く使われているセルラインやマウスの系統が挙げられます。

    BioSample では広く使われているサンプルが事前に BioSample にカタログ化されており,すぐに引用できるようになっています。 これは,登録者が新しい実験データを DDBJ/EBI/NCBI に登録する度に,汎用的なサンプルを毎回 BioSample に登録しなくても済むようにするためです。 現在,リファレンスバイオサンプルには ATCCCoriell が含まれています。

    サンプルの属性

    BioSample レコードを構成する主要部分は「サンプル属性」です。 属性にはセルタイプ,採取地や表現型などの情報を記載することができ,対象となるサンプルを定義します。 BioSample の属性は構造化された「属性名:値」 (name:value) の組として表現されます。例) tissue:liver

    BioSample は属性名にコントロールされた語句 ("辞書") を使うことをサポートしています。

    DDBJ BioSample に実装された最初の辞書は Genomics Standards Consortium によって作成されたゲノム,メタゲノム,ターゲットローカスの記載を標準化するために最低限必要な情報を定めた MIxS チェックリストです。

    MIxS チェックリストについては Nature Biotechnology 29, 415–420 (2011) | doi: 10.1038/nbt.1823 (PMID:21552244 ) を参照してください。

    MIxS チェックリスト
    MIxS チェックリスト

    生物名

    BioSample の organism に記載する生物名については「生物名について」をご覧ください。 以前は微生物などで完全長ゲノム配列を登録する場合,種の学名に加えて strain などの名称を organism に含めて記載していましたが,現在は学名のみの記載を原則としています。strain 名は BioSample の strain に記入します。

    関連するお知らせ: 生物の株情報を管理する方法が変更になります

    XML スキーマ

    BioSample XML schema

    メタデータ

    必須*
    条件によって必須*

    Submitter

    Submitter

    登録者情報。登録に関する連絡はここに記載された E-mail アドレス宛てに行われます。 必要な人数分作成します。 連絡先情報は DDBJ スタッフが登録者に連絡するために使われ,一般に公開されることはありません。 連絡先情報のかわりに研究者の所属する組織に関する情報が公開されます。

    First name*
    登録者の first name。
    Last name*
    登録者の last name。
    E-mail*
    E-mail アドレス。所属する組織ドメインのメールアドレスを指定してください。

    Organization

    Organization
    コンタクトパーソンが所属する組織。
    Submitting organization*
    組織のフルネーム。
    Submitting organization URL
    登録者が所属する組織の URL。

    Data Release

    "Hold" か "Release" のどちらかを選びます。公開予定日を指定することはできません。データ公開の仕組みについてはデータ公開をご覧ください。

    Release
    登録したサンプルは査定された後,公開されます。
    Hold
    この BioSample ID を引用している DDBJ,DRA,DTA レコードが公開されると同時に公開されます。この BioSample ID を引用している非公開の DDBJ レコードが公開されることはありません。

    General info

    External Links
    サンプルに直接関連するリソースの URL とそれに付けるラベル (表示名)。
    Link description
    サンプルに関連するウェブサイトの表示名。
    URL
    ウェブサイトの URL。

    Sample type

    Core Package

    Genome, metagenome or marker sequences (MIxS compliant)
    ゲノム,メタゲノムやマーカー配列の場合に使用します。ゲノム,メタゲノムやマーカー配列が由来するサンプルの記載方法を標準化するため Genome Standards Consortium (GSC) が策定した属性が使われます。MIxS が定めた必須属性があるかどうかで MIxS を満たしているかどうかが検証されます。MIxS についての詳細は GSC ウェブサイト をご覧ください。
    Other samples (e.g. transcriptome, epigenetics etc)
    transcriptome, epigenetics など,どのようなサンプルタイプにも使用することができます。一般的な属性と登録者が作成するカスタム属性で記述されます。

    MIxS

    (Meta)Genomic Sequences Sample (MIMS)
    Environmental/Metagenome Genomic Sequences

    環境サンプルの説明もご参照ください。

    Genomic Sequences Sample (MIGS)
    Cultured Bacterial/Archaeal Genomic Sequences
    Eukaryotic Genomic Sequences
    Viral Genomic Sequences

    特定宿主から確実に回収できる内部共生生物、多くの cyanobacteria のように容易に同定可能であるが培養ができない生物、純粋培養は不可能でも罹患植物から確実に回収できる phytoplasmas といった対象は環境サンプルとは扱いません。"Cultured Bacterial/Archaeal", "Eukaryotic", "Viral" のいずれかを選択します

    Marker Sequences Sample (MIMARKS)
    Specimen Marker Sequences
    Survey related Marker Sequences

    MIMARKS specimen: for marker gene (e.g., COI) sequences obtained from any material identifiable by means of specimens

    MIMARKS-specimen は培養した、あるいは同定可能な標本から得られた marker gene に対する contextual data に適用します。

    MIMARKS survey: for uncultured diversity marker gene (e.g., 16S rRNA, 18S rRNA, nif, amoA, rpo) surveys

    MIMARKS-survey は分離培養や生物種を同定せず、環境から直接得られた marker gene に対する contextual data に適用できます。

    Environmental package

    Environmental package (MIxS Sample)
    以下のパッケージから適切なものを選びます。パッケージ毎に必要とされる属性が追加されます。
    "Environmental/Metagenome Genomic Sequences" と "Survey related Marker Sequences" のときは No package を選択できません。
    No package
    air
    host-associated
    human-associated
    human-gut
    human-oral
    human-skin
    human-vaginal
    microbial mat/biofilm
    miscellaneous or artificial
    plant-associated
    sediment
    soil
    wastewater/sludge
    water

    Attributes

    Sample attributes
    属性のリスト モデルごとにカスタマイズされた BioSample ワークシートをダウンロードします。 ワークシートはタブ区切りテキストファイルでスプレッドシートプログラムやテキストエディタで開くことができます。
    Attributes
    サンプル属性のリスト。必須項目に加えて,いくつかの推奨項目があります。BioSample データをより役立つものにするため,手に入る全ての情報を登録してください。登録システムが,一般的に使われている属性を標準化された名称とともに提供します。登録を準備する際は,属性のリストを参照し,該当する項目を入力してください。リストにない情報を持っている場合は Custom Attribute を作成することができます。

    Publications

    PubMed ID
    Submission 中のサンプルに共通する文献の PubMed ID を入力してください。論文情報を追加するには?

    DOI

    DOI
    PubMed ID がない場合は DOI を入力してください。文献に関する以下の詳細情報を提供してください。
    Reference title*
    Journal title*
    Year*
    Volume*
    Issue*
    Pages from*
    Pages to*
    First name*
    MI
    ミドルイニシャル。
    Last name*
    Suffix
    This publication has multiple authors
    チェックすると入力した著者名に "et al" が付け足されます。

    Comments

    Private comments to DDBJ staff
    DDBJ スタッフへのコメント。コメントは内部的に使用されるだけで,公開されるレコードには含まれません。

    BioSample への登録

    ヒトを対象とした研究データの登録について
    研究対象者に由来するデータを DDBJ センターが運営するデータベースに登録する場合,研究対象者の尊厳及び人権は,適用されるべき法令,指針,ガイドライン,登録者が所属している機関の方針に従い,登録者の責任において保護されている必要があります。原則として,研究対象者を直接特定し得る情報はメタデータから取り除いてください。
    ヒトを対象とした研究データを登録する場合は「ヒトを対象とした研究データの登録について」を熟読してください。

    サンプルの登録

    新規サンプルの登録

    アカウント Handbook に従いアカウントを取得します。

    D-way ウェブサイトの上部にある "BioSample" メニューから BioSample 登録ページに移動します。 BioSample ページ内の [New submission] をクリックし,新規サンプル登録を作成します。

    BioSample の新規登録作成

    BioSample を新規登録する場合は左のタブから順番に内容を英語で入力していきます。二段目が BioSample になります。登録者などの情報は DRA Submission で入力した内容が引き写されます。

    各項目の説明はこちらを参照してください。

    BioSample の登録

    "SAMPLE TYPE" でサンプルの種類を選択します。ゲノム配列を取得したサンプルの場合,MIxS 基準を満たしたサンプル記述をする必要があります。

    Sample type についてはこちらを参照してください。

    Sample type の選択

    Sample type に応じた属性入力用テンプレートファイルをダウンロードします。

    必須・任意・ユーザが定義した一連の属性でサンプルを記述することが,登録作業の中心になります。

    サンプル属性テンプレートファイルのダウンロード

    属性値の記入

    ファイルはタブで区切られているので,エクセルなどの表計算ソフトで編集することができます。一行目には属性名が記載されています。* が必須属性です。

    二行目以降に1行1サンプルで入力していきます。BioProject アクセッション番号が発行されていないプロジェクトの場合,bioproject_id には PSUB 番号を入力します。

    値がない場合の記載方法

    INSDC ではサンプル属性値が存在しない場合の記載方法を標準化しています。 登録者は常に定められた形式で属性値を提供することが推奨されますが,値がない (missing/null value) ことを報告する際には,状況をより細かく表す用語を使用することが求められます。適切な場合は "lower level" の用語を使用し,そうでない場合には "top level" の用語を使用します。

    以下に "missing/null value" に対する用語と定義を記載しています。

    必須属性に対する値がない場合にだけ標準化された用語を使用します。推奨・任意属性に対する値がない場合は,値を空にするか,属性そのものを使用しないでください。

    INSDC missing value reporting terms

    INSDC term
    (top level)
    INSDC term
    (lower level)
    Definition
    not applicable information is inappropriate to report, can indicate that the standard itself fails to model or represent the information appropriately
    missing not collected information of an expected format was not given because it has not been collected
    not provided information of an expected format was not given, a value may be given at the later stage
    restricted access information exists but can not be released openly because of privacy concerns

    BioSample 属性の説明。独自の属性を追加したい場合は,右端に属性名と値を追加します。

    サンプル属性ファイルの記入例

    *sample_name *sample_title description *organism *taxonomy_id
    NBRC 100918 S.albus …… Streptacidiphilus albus 105425
    NBRC 100919 S.carbonis …… Streptacidiphilus carbonis 105422

    サンプル属性ファイルの実際の例

    BioSample accession Sample type Sample attributes
    SAMD00018424 MIGS.ba text
    表計算ソフトでのサンプル属性入力

    サンプル属性のタブ区切りテキストファイルでは1行に1サンプルの属性を入力します。行を複数作成することで,複数の sample をまとめて登録することができます。

    最後の "OVERVIEW" で内容を確認したうえで投稿します。"ATTRIBUTES" で属性ファイルをダウンロードすることができます。

    登録後は最新の属性ファイルをダウンロードすることができます。

    BioSample の投稿

    アクセッション番号

    ウェブから投稿されたデータに対して SSUB で始まる仮 ID が自動的に割り当てられます。正式なアクセッション番号が発行されるまでは,この仮 ID で登録を参照します。 DDBJ BioSample スタッフはデータを査定した後,完成したデータに対してプレフィックス "SAMD" のアクセッション番号を発行します。 D-way アカウントにログイン後,ウェブ上で登録したサンプルの進行状況やアクセッション番号を確認することができます。

    • SSUB で始まる仮 ID を論文中に引用しないでください。
    • EBI/NCBI に登録したサンプルを DDBJ に重複して登録しないでください。

    サンプルの公開

    以下の選択肢があります:

    • 査定が終わった後すぐに公開
    • BioSample アクセッション番号を引用しているデータと同時に公開

    公開予定日は設定することができません。

    登録した Sample データは一定期間非公開にすることができます。 DDBJ レコードが公開されると,引用されている BioSample データは自動的に公開されます。この BioSample アクセッション番号を引用している非公開の DDBJ レコードが公開されることはありませんが,引用されている BioProject は連動公開されます。

    FAQ: BioProject/BioSample/塩基配列データの連動公開の仕組みは?

    サンプルの更新

    登録が完了したデータを更新することができます。メッセージフォームよりご連絡ください。