در ابتدا لازم است با کلمات تشکيل دهنده XML يعنی Extensible ، Markup و Language آشنا شويم. Markup به معنی "نشانه گزاری" اطلاعات می باشد. قدمت استفاده از Markup به قبل از کامپيوتر بر می گردد . مثلا" در دنيای نشر از علائم خاصی در متن های ويرايش شده استفاده تا به پردازنده متن (انسان و يا ماشين) اعلام شود ، چه نوع عملياتی را در رابطه با اطلاعات می بايست انجام دهد. HTML يکی از زبان های کلاسيک نشانه گذاری است . مثلا" با افزودن تگ <Bold> به مرورگر اعلام می شود که به چه صورت می بايست اطلاعات نمايش داده شوند . زبان (Language)، در مفهوم کلی مجموعه ای از علائم معنی دار است که از طریق آن می توان در برقراری ارتباط و تبادل اطلاعات استفاده نمود. مانند: زبان فارسی ، زبان انگلیسی ، علائم مورس، زبان کامپیوتر و ... با کنار هم قرار دادن دو واژه اشاره شده ، به زبان نشانه گذاری می رسیم . زبان نشانه گذاری ، به مجموعه ای از کلمات معنی دار و با مفهوم که توسط عده ای (با آگاهی و انتخاب) استفاده می گردد ، اطلاق می گردد. HTML ، نمونه ای مناسب در اين زمينه است . تمام افرادی که از تگ های HTML استفاده می نمايند ، بدرستی نسبت به مفهوم و جايگاه هر يک از تگ ها آشنائی داشته و با آگاهی کامل آنها را برای بيان خواسته های خود استفاده می نمايند. مثلا" مشخص است که استفاده از تگ <H1> چه نوع پيامدهائی را بدنبال خواهد داشت . تگ فوق ، توسط مولفين صفحات وب آگاهانه انتخاب می گردد و مرورگرها نيز متناسب با تعاريف از قبل مشخص شده ، واکنش مناسب خود را در رابطه با نحوه نمايش انجام خواهند داد. يک زبان توسعه پذير (Extensible) ، زبانی است که دارای مکانيزم لازم برای افزودن کلمات بگونه ای است که توسط ساير استفاده کنندگان نيز قابل فهم باشد . در دنيای واقعی و در ارتباط با زبان های طبيعی ما هرگز شاهد چنين وضعيتی نخواهيم بود . ( افزودن يک واژه با معنی مورد نظر خود و استفاده از واژه با همان معنی توسط ساير استفاده کنندگان ) با توجه به تعاريف ارائه شده ، يک زبان نشانه گذاری توسعه پذير ، می بايست يک زبان نشانه گذاری با قابليت افزودن کلماتی بيشتر باشد . در عمل زبان نشانه گذاری توسعه پذير ، به سيستمی برای تعريف تمام زبان های نشانه گذاری با قابليت توسعه وضعيت موجود ، اطلاق می گردد . SGML, HTML و XML SGML (Standard Generalize Markup Language) سرچشمه XML بوده و در سال 1988 استاندارد شده است. HTML (HyperText Markup Language) زبانی است که در ابتدا با استفاده از SGML تعريف گرديد. HTML يک زبان نشانه گذاری است ، بنابراين انتظار داريم شامل مجموعه ای از تگ ها بمنظور کنترل قالب و رفتار اطلاعات در مستندات باشد . XML ، يک زبان نشانه گذاری مشابه HTML نمی باشد . XML ، زيرمجموعه ای از SGML است (مکانيزمی برای تعريف زبان های نشانه گذاری ) . XML همانند SGML يک زبان نشانه گذاری توسعه پذير بوده اما بر خلاف SGML برای استفاده بر روی وب بهينه شده است . مفاهيم اساسی لازم است که مجددا" به اين نکته مهم اشاره گردد که XML ، يک زبان نشانه گذاری نبوده و در مقابل مکانيزمی برای ايجاد زبان های نشانه گذاری اختصاصی است . XML ، شامل مجموعه ای از استانداردها ی متنوع با کاربردهای خاص است . XML ، يک زبان نشانه گذاری نبوده و در عين حال يک زبان برنامه نويسی هم نيست . از XML برای ارائه اطلاعات استفاده شده و بمنظور پردازش اطلاعات، می بايست برنامه هائی نوشته گردد . »» از XML در موارد زير می توان استفاده کرد :
از واژه XML اغلب برای بيان يک استاندارد بين المللی استفاده می گردد . در برخی حالات واژه فوق برای بيان تمام استانداردهای مرتبط با XML نيز استفاده می گردد . اکثر کاربران با استانداردهای XML سرو کار ندارند. استانداردهای موجود اغلب توسط افراديکه نرم افزار توليد و يا بر روی سندهای XML پردازشی را انجام می دهند ، استفاده می گردد . شناخت استانداردهای موجود در اين زمينه مهم بوده و لازم است با جايگاه هر يک آشنا شويم . يکی از روش هائی که می توان استانداردهای موجود را بدرستی سازماندهی و بخاطر سپرد ، توجه و تمرکز بر اهدافی است که آنها دنبال می نمايند. جدول زير استانداردهای موجود بهمراه اهداف و قابليت های هر يک را نشان می دهد.
تعريف زبان های XML با استفاده از XML ، می توان تگ های نشانه گذاری را تعريف که توسط مجموعه ای از مستندات که خصايص مشابهی را به اشتراک می گذارند ،استفاده گردد . مثلا" مجموعه ای از پيام های تجارت الکترونيکی. مورد فوق اصطلاحا" document type ناميده می گردد . ( مشابه يک کلاس در طراحی شی گراء ) . يک Document instance ، نوع خاصی از يک سند است . مثلا" يک ليست فروش خاص . در پروژه های XML ، در ابتدا Document types با توجه به اطلاعاتی که می بايست بر روی آنها عملياتی صورت پذيرد ، طراحی و در ادامه با ايجاد نرم افزارهای لازم ، اقدام به ايجاد و پردازش نمونه هائی از سند می گردد . XML مجموعه ای قدرتمند از بلاک های ساختمانی سطح پايين بمنظور طراحی Document types را ارائه می نمايد. نمونه سند زير، شامل مجموعه ای اطلاعات از يک بانک اطلاعاتی شخصی است.
خوش شکل (Well-Formed) و معتبر (Valid) با استفاده از XML ، می توان اقدام به ايجاد سندهای رسمی و غيررسمی نمود. در پروژه های کوچک و يا زمانيکه قصد نمونه سازی وجود داشته باشد ، می توان با سرعت اقدام به ايجاد سندهای "خوش شکل" نمود . در پروژه های بزرگ و يا پروژه هائی که شامل سيستم های متعددی می باشند، سندهای معتبر ايجاد می گردد. قوانين يک سند خوش شکل
واژه Schema ، به قوانينی اطلاق می گردد که به مجموعه ای از سندهای با ساختار مشابه ، نسبت داده می شود . واژه فوق مختص XML نبوده و در ساير موارد از واژه فوق نيز استفاده می گردد . در رابطه با XML قوانين موجود به موارد زير اشاره خواهند داشت :
DTD ، مکانيزمی برای تعريف پيش نويس ها بوده که در ابتدا بمنظور استفاده در SGML طراحی و در ادامه XML نيز از آن استفاده کرد . محوريت DTD بر سند استوار بوده و دارای امکانات و ويژگی های لازم نظير : نوع داده ها ، دامنه ها و ... نمی باشد. گرامر استفاده شده در DTD کاملا" اختصاصی بوده و ابزارهای اندکی بمنظور پردازش آنها وجود دارد . XML-Schema ، يک استاندارد جديد بوده که مختص XML طراحی شده است . گرامر استفاده شده مبتنی بر XML است . تکنولوژی فوق بدرستی محدوديت های DTD را برطرف نموده و اکثر ابزارهای توليد شده توسط عرضه کنندگان معتبر ، مجهز به تکنولوژی فوق می باشند. به افراديکه جديدا" به دنيای XML وارد شده اند ، توصيه می گردد که در صورت امکان گرامر DTD را فراموش و خود را با استاندارد XML-Schema وفق نمايند . چه زمان اعتبار لازم است ؟ سندهای "خوش شکل" ، بسرعت آماده شده و بسادگی استفاده می گردند. تاکنون نرم افزارهای متعددی نوشته شده که در آنها از سندهای " خوش شکل" ، استفاده شده است . با اين اوصاف ،چه زمان می بايست از يک پيش نويس (Schema) رسمی استفاده کرد ؟ در پاسخ به این سوال می توان گفت که " پيش نويس ها باعث ارائه صلاحيت لازم بمنظور پردازش های مبتنی بر داده ها می باشند . بدين ترتيب و در زمانيکه اطلاعات موجود در يک سند XML ، توسط يک پردازنده Schema ، پردازش می گردد، اطلاعاتی حذف و يا ناديده گرفته نخواهند شد. در اين راستا از پيش نويس های نوشته شده بمنظور : بررسی صحت محتويات، مقادير پيش فرض برای المان ها ، ارائه کمک در زمان ويرايش يک سند XML ، ترجمه از يک فرمت XML به فرمت ديگر ، استفاده می گردد . در اين راستا ، می توان کدهائی را نوشت که تمام عمليات فوق را انجام دهند ولی کدهای نوشته شده محدود به يک نوع سند خاص خواهند بود . اطلاعات موجود در پيش نويس اين امکان را فراهم می آورند ، که با نوشتن يک پردازنده پيش نويس از آن در سندهای متفاوت بدون نياز به برنامه نويسی مجدد استفاده کرد . سندهای شامل پيش نويس ، با يک فرمت استاندارد ايجاد و بسادگی امکان اشتراک آنها فراهم می گردد . Namespace مشکل تصادم اسامی را برطرف می نمايند در زمان عمليات بر روی سندها و برنامه های مبتنی بر XML ، بدفعات نياز به ترکيب دو سند مجزا و ايجاد سند جديد احساس خواهد شد. با انجام هدف فوق، با چالش های جدی در رابطه با تصادم (Conflict) اسامی برخورد خواهيم کرد : المان هائی که دارای تگ های يکسان ولی معانی متفاوت می باشند . مثلا" فرض نمائيد ، بخواهيم سندی که دارای يک تگ <title> ( تگ فوق به عنوان شغلی يک فرد اشاره دارد ) است را با سند ديگر که او هم دارای يک تگ <title> ( تگ فوق به عنوان يک فيلم اشاره دارد ) است را بايکديگر ترکيب نمائيم . زمانيکه تگ های فوق در سند های مجزا بوده و يا حتی در يک سند يکسان قرار داشته باشند با مشکلاتی مواجه نخواهيم شد ( در اين حالت قصد پردازش اتوماتيک بر روی المان های <title> را نداريم ) مشکل از زمانی شروع می گردد ، که کدهائی بمنظور پردازش اتوماتيک بر روی المان های <title> نوشته گردد . در چنين حالتی لازم است از نوع تگ آگاهی لازم را پيدا کرد . بمنظور حل مشکل فوق از XML Namespace استفاده می گردد . Namespace ،مکانيزمی است که بهمراه يک سند تعريف ، تا ارتباط مفهمومی مجموعه ای از عناصر با يکديگر را مشخص نمايد. بدين ترتيب برای هر المان محدوده و يا فضائی تعريف و بر همين اساس با آنها برخورد عملياتی خواهد شد. برای هر Namespace می توان يک شناسه تعريف و در ادامه با استفاده از شناسه تعريف شده بصورت پيشوند در کنار نام المان تکليف عملياتی المان را مشخص کرد. مثلا" می توان يک NameSpace بصورت زير تعريف کرد : Xmlns:Tehran=www.yourc ompany.com/test1 در ادامه می توان در سند مربوطه ، بصورت :<Tehran:Test1> به آن مراجعه کرد . بدين ترتيب شما و يا برنامه مورد نظر ، برای پردازش آگاهی لازم را پيدا خواهد کرد . ( تگ مورد نظر از Namespace تعريف شده مشتق می گردد ) خلاصه در اين نوشتار به سه استاندارد لازم بمنظور تعريف نوع سندهای XML اشاره گرديد : XML ، NameSpace و XML-Schema (و يا DTD). برای تعريف يک نوع سند XML ، عمليات زير می بايست دنبال گردد:
|


