Пережитки
Вот три термина, встречающиеся в литературе по XML, которые могут запутать новичка:
Attribute (атрибут)
Это описание элемента, являющееся частью открывающего тега.
Если воспользоваться предыдущим примером, то в <img src="picture.jpg" /> атрибутом будет src="picture. jpg". О том, когда применять содержимое элемента, а когда атрибуты, в мире XML ведутся споры. Самые лучшие указания именно по этой теме можно найти на http://www.oasis-open.org/cover/elementsAndAttrs.html.
СDАТА
Термин CDATA (Character Data, символьные данные) используется в двух смыслах. В первом он чаще всего относится ко всему в XML-документе, что не является разметкой (тегами и т. д.). А во втором подразумевает понятие разделов CDATA (sections). Объявление раздела CDATA указывает, что анализатор XML не должен рассматривать данный раздел, даже если он содержит текст, который может быть построен как разметка.
PCDATA
В аннотации Тима Брея к спецификации XML (упомянутой ранее) приводится следующее определение:
Строка PCDATA является сокращением от «Parsed Character Data». Это еще одно наследие SGML; «parsed» подразумевает, что процессор XML будет просматривать текст в поисках разметки, обозначаемой символами < и &.
Можно считать их данными, состоящими из CDATA и, вероятно, некоторой разметки. Большая часть XML-данных попадает под это определение.
В изучении XML имеются свои тонкости. Это маленькое руководство должно помочь вам приступить к работе.