マークアップって何ですか?

初稿: 2005-08-17

マークアップはデータに対する情報

主に XML (Extensible Markup Language) などで知られるマークアップ言語ですが、このマークアップとは一体何でしょうか。結論から述べてしまえば、マークアップとはデータに対する情報です。つまりマークアップ言語とはデータに対する情報を記述するための言語ということになります。データに対する情報とは、OS で例えるならファイルとその更新日付の関係のようなもので、ファイル (データ) に対する 更新日付 (情報) という関係になります。つまりデータ本体の付加的な情報を意味します。

文書にマークアップを埋め込むとは

マークアップは文書データに対し情報を記述するために使用されます。文書とはいっても文章の形をとっていなければならないわけではなく、テキスト形式のデータ全般を指します。そして文書データとは別の場所に記述されるのではなく、その中に直接埋め込まれます。ここでは XML においてのマークアップを実際に見てみます。HTML などでご存知の方も多いでしょうが、XML ではマークアップの一つとしてタグという表記方があります

内容については、<file date="2005-08-17">memo.txt</file> ファイルを参照してください。

上の例の場合、文書の中の「memo.txt」 というファイル名に対し 「<file>」というタグ (マークアップ) によって情報を埋め込んでいます。また「マークアップの一つとしてタグという表記方があります」と述べたのは、タグだけがマークアップではないということです。例えば XML 内では 「&」 という文字は直接記述することはできないので、「&amp;」 と代わりに記述します。

トム &amp; ジェリーは僕の親しい友人だ。

上記のような表記方を実体参照 (Entity Reference) と呼びますが、実体参照もマークアップの一つです。これは「&」の文字の代用の情報であるといえます。

トム &amp; ジェリーは僕の親しい友人だ。
<!–– コメント: トムは留学生、ジェリーはその友人 ––>

また上記のようなコメントはコンピューターには無視されますが、コメントもマークアップに含まれます。これはこのまま注釈の情報を埋め込んでいるということになります。これらの他にも CDATA セクション区切子、DTD、処理命令や XML 宣言などもマークアップに含まれます。これらのことからマークアップについてより具体的に言及するとすれば、マークアップとは文書データ本体以外の記述であるといえます。


目次へ戻る