۱۳۸۹ آبان ۸, شنبه

بررسی اپیدمی سرطان های شایع در استان تهران با استفاده از سیستم اطلاعاتی جغرافیائی

مقدمه
از آنجائیکه اینجانب اعلام امادگی نمودم تا به انجام خدمات GIS (Geographical Information System) (سیستم مدیریت اطلاعات) جغرافیائی بطور داوطلبانه برای انجمن حمایت از کودکان سرطانی بپردازم؛ مرکز تحقیقات سرطان کشور( انستیتو کانسر) به سرپرستی جناب آقای دکتر موسوی جراحی اعلام نیاز نمودند. به اين ترتيب نويسنده از پنج سال پيش تا كنون مشغول به همکاری داوطلبانه با این مرکز در خصوص بررسی اپیدمی سرطان های شایع در استان تهران با استفاده از سیستم اطلاعاتی جغرافیائی می باشم.
به طور کلی سامانهٔ اطلاعات مکانی یا سیستم اطلاعات جغرافیایی Information Systems Geographic یا GIS همانطور که از اسم آن بر می آید در وهله اول یک سیستم است که مجموعه اطلاعات هر نقطه و محدوده جغرافیایی را تدوین و تحلیل می نماید. اين سیستم، يك سيستم کامپیوتری برای مدیریت و تجزیه و تحلیل اطلاعات مکانی است که قابلیت جمع‌آوری، ذخیره، تجزیه و تحلیل و نمایش اطلاعات جغرافیایی (مکانی) را دارد.
هدف نهایی یک سیستم اطلاعات جغرافیایی، پشتیبانی جهت تصمیم‌گیری‌های پایه‌گذاری‌شده بر اساس داده‌های مکانی می‌باشد و عملکرد اساسی آن بدست آوردن اطلاعاتی است که از ترکیب لایه‌های متفاوت داده‌ها با روش‌های مختلف و با دیدگاه‌های گوناگون بدست می‌آیند.
در خصوص واژه ي همه‌گیرشناسی یا اِپیدمیولوژی (epidemiology)،‌منظور مطالعه ي نحوه انتشار بیماریها و عوامل بیمای‌زا یا هر عاملی که به سلامت مربوط باشد، است. این اصطلاح ابتدا به مفهوم «علم بررسی همه‌گیری بیماریهای عفونی» به کار برده شد، ولی امروزه با پیشرفت تمام علوم و از جمله علم پزشکی و کنترل بسیاری از همه‌گیری‌ها دامنه آن وسعت بیشتری پیدا کرده، به مفهوم «علم بررسی انتشار و علل بیماری‌ها» تلقی می‌گردد. از نظر لغوی کلمه Epi به معنی روی، کلمه Demos به معنی مردم و کلمه Logus به معنی بررسی و شناخت بوده، که معنی لغوی این اصطلاح عبارت است از «شناخت آنچه بر مردم می‌گذرد» و اگرچه وضعیت بهداشت و پزشکی جامعه مدنظر باشد، ولی با اقتصاد، جامعه‌شناسی، فرهنگ، مذهب و... ارتباط بسیار نزدیکی دارد، چراکه در پزشکی بالینی به مفهوم مطب‌داری آن بیشتر خود فرد و بیماری او مدنظر است اما در همه‌گیرشناسی، بیشتر توجه به گروه و جامعه است و همه‌گیرشناسی بالینی به هردو جنبه توجه دارد.
روش ذكر شده در اين تحقيق، بنا به گفته جناب آقای مهندس باستانی سرپرست آن زمان اداره ي کد گذاری در ایران، برای اولین بار مورد استفاده قرار گرفته و در سایر کشورها نیز علی رغم جستجو در اینترنت مورد مشابهی نداشته، زیرا اولا این سیستم کد دهی در کشورهای توسعه یافته به کار می رود و از آنجا که اکثر آنها قریب به 200 سال از صنعتی شدنشان می گذرد نقشه های شهر جغرافیائی و توصیفی را در همان سالها تهیه و استفاده نموده اند. همچنین به علت توسعه یافتگی مشکلاتی از این دست به خصوص اپیدمیک شدن يك بیماری خاص، در آنها رواج ندارد تا این نوع مطالعات و سایر موارد که در ادامه ذکر می گردد، برای آنها معضل محسوب شود تا تحقیقات مرتبط موضوعیت يابد. تنها یک مورد در دانشگاه آکسفورد به صورت پیشنهاد برای تحقیق در خصوص health gis بر اساس کد پستی در اینترنت منتشر گردیده. در آن مقاله به همین روش اشاره شده بود و توصیه گشته بود که میتوان از این روش برای مدیریت سلامت نیز استفاده نمود ولی نگارنده بیشتر از این وارد بحث نگردیده بود زیرا کلیت مقاله مربوط به بحث سلامت بود كه در آدرس زير قابل رؤيت است:
http://minority-health.pitt.edu/archive/00000417/01/Place,_Space,_and_Health-_GIS_and_Epidemiology.pdf
همچنین بعد از 1 ماه این مورد که شباهت بیشتری به این روش دارد در مجله international journal of health geographics مشاهده شد که مربوط به مکان یابی بیماران قلبی در شهر کلگری کانادا در سال 2003 بر اساس کد پستی برای پراکنش بیماری در شهر بوده پیدا شد که در آدرس اینترنتی زیر قابل مشاهده میباشد
http://www.ij-healthgeographics.com/content/3/1/5

مواد و روش ها
در ابتدا مهم ترین آیتم، متدولوژی طرح برای پوشش خواسته های انستیتو کانسر بر مبنای اطلاعات موجود بوده است. به طور کلی سیستم جمع اوری اطلاعات در مرکز تحقیقات سرطان کشور بر مبنای اطلاعات موجود در پرونده بیمار در بیمارستانها و مراکز درمانی بوده که بعدا توسط پرسنل مرکز یا دانشجویان جمع آوری و در فرمی مخصوص ضبط میگردد که یکی از بندهای آن آدرس فرد بیمار میباشد. همین امر دارای چند اشکال است: یکی دقیق اظهار نکردن آدرس توسط بیمار یا همراهان وی است. به طور کلی استاندارد آدرس پستی سه قسمتی است که شامل معبر آخر- معبر ماقبل آخر و محله میباشد که به علت نا آشنائی عمومی با این استاندارد کسی آن را رعایت نمیکند. اشکال بعدی احتمال ارائه آدرسی غیر از محل سکونت فرد بیمار است به خصوص برای بیماران شهرستانی و در نهایت عدم درخواست آدرس محل کار بیمار زیرا به طور متوسط هر فرد شاغل نصف روز یا کمتر در منزل به سر می برد و ممکن است وقوع سرطان به محل کار او مرتبط باشد نه محل زندگی. در اين رابطه در فرم موسسه سرطان هیچ آیتمی راجع به محل کار وجود نداشت. همگي این مشكلات و موارد به مرکزتحقيقات سرطان كشور اعلام گردید ولی به علت آن که آن مرکز قدرت اجرائی در این خصوص برای ابلاغ روش های جدید در اخذ اطلاعات از بیماران را به بیمارستان ها و مراکز درمانی نداشته و ندارد، همین اطلاعات موجود معتبر فرض گردید.
به همین منظور در 2 سال اول روش های امکان پذیر براي تهيه ي يک نقشه پراکنش بیماری از روي اين آدرس ها و مشخص نمودن جمعیت ساکن مورد تحقیق قرار گرفت. از جمله مراجعه به مرکز اطلاعات جغرافیائی شهر تهران و تشکیل جلسات متعدد با کارشناسان آن دفتر که با حمایت های ریاست آن مرکز جناب آقای مهندس معینی برگزار و از اطلاعات گرد آوری شده آن مرکز اطلاع حاصل گردید . با وجودي كه مهم ترین فاکتور برای کارشناس محترم (مركز تحقيقات سرطان) انستیتو کانسر، میزان افراد ساکن در هر محدوده بود، اطلاعات موجود در مرکز اطلاعات جغرافیائی شهر تهران هیچ کدام دسترسی به آمار نفوس و مسکن آنها را در کشور فراهم نمی نمود. لازم به ذکر است مطالعات گوناگون و متنوعی در حوزه اپیدمیولوژی توسط مرکز تحقیقات سرطان کشور و سایر مراکز انجام گرفته و می گیرد، ولی به همان علتی که در بالا ذکر گردید هیچ کدام توانائی تعیین درصد عارضه و بیماری را ندارند و به همین منظور در حوزه اپیدمیولوژی فاقد اعتبار بوده اند، گرچه زحمات زیادی برای تهیه آنها کشیده شده است که در بخش بعدی به همراه نقشه تفاوت آنها توضیح داده میشود
خصوصيات كد پستي
متولی اطلاعات مربوط به ساكنين در هر محدوده، مرکز آمار کشور است لذا به آنها مراجعه گرديد؛ متاسفانه آنها نقشه ای از پراکنش اطلاعات گرد آوری شده نداشتند. از این رو بعد از تحقیقات در خصوص کد پستی با توجه به کد گذاری پستی کل کشور؛ با اداره پست تماس گرفته شد و به دفتر مربوطه به نام اداره ي کد گذاری و جغرافیائی پست کشور راهنمائی شدیم؛ و پس از آن با درخواست تشکیل جلسه به دفتر یکی از اعضای هیئت مدیره ي وزارت پست و تلگراف و تلفن؛ جناب آقای مهندس حسین آبادی به همراه جناب آقای مهندس باستانی؛ هدایت شديم. نتيجه ي اين تلاش توضيح كامل خصوصیات کد پستی به همراه ارائه ي مستندات تهیه شده بود که به طور خلاصه به شرح زير است:
کل کشور به 8 مرکز پستی تقسیم گردیده است. عدد 2 به علت شباهت به 3 به کار گرفته نمی شود و همین طور عدد صفر به علت رسم الخط آن به صورت نقطه، در کدها بکار نمی رود. تمام ارقام کد پستی هر کدام یک مفهوم خاص را می رساند. به عنوان مثال تمام کد های شهر تهران با عدد 1 شروع می شود و استان خراسان با عدد 5 و حاشیه شهر تهران با عدد3، همانطور كه گفته شد شهر تهران به 8 منطقه تقسیم گردیده است شامل : مناطق پستی 11 تا 19 به جز 12. هرچه معابر از اصلی به فرعی می رود کدها ریز تر می شوند:
1- تمامی سطح کشور از 35 سال پیش توسط یک پیمانکار بلژیکی مورد کد گذاری قرار گرفته است.
2- تمام عوارض دست ساز بشر یک کد پستی ده رقمی دریافت می کنند حتی باجه های تلفن.
3- کدها دارای یک الگورتیم پیشرفته بوده و هر عدد معرف یک خصیصه می باشد.
4- سطح کشور را به حدود 11000 محدوده ي پستی که در اصطلاح فنی پست؛ گشت پستی می نامند، تقسیم نموده اند.
5- تا کنون در حدود 22 میلیون کد پستی ده رقمی صادر گردیده که 16 میلیون آن مسکونی بوده و حدود 2 میلیون واحد آن خالی از سکنه می باشد (آمار بر اساس اطلاعات تا سال 1385).
6- نحوه ي تقسیم این محدوده ها در داخل شهرها بر اساس تراکم جمعیت و مساحت بوده و در سایر نقاط بر اساس جاده های ارتباطی و عوارض طبیعی می باشد.
7- حدود محدوده ها در شهرها معابر و خیابان ها می باشد به نحوی که هیچ واحد مسکونی در داخل دو محدوده قرار نمی گیرد. این الگورتیم در مورد تمام محدوده های کشور صدق می کند
8- سطح مناطق 22 گانه ي شهر تهران با حدود 1900 محدوده پوشش داده شده است
9- 6 رقم اول کد پستی ده رقمی مربوط به اطلاعات جغرافیائی می باشد
10- کد پستی تحت هیچ شرایطی تغییر نکرده و نمی کند
11- هر رکورد اطلاعات کد پستی ده رقمی شامل 29 فیلد اطلاعاتی توصیفی می باشد از قبیل نوع کاربری (مسکونی – اداری- دولتی – اموزشی- تجاری ( به تفکیک 70 صنف) و شماره تلفن ثابت؛ نام مالک و ...
12- این اطلاعات به طور پیوسته در حال به روز رسانی می باشند بدین منوال که دو هزار نفر در سطح کشور و 200 نفر در سطح شهر تهران هر روز بصورت پیاده مسیر های برنامه ریزی شده ای را طی تغییرات کاربری ها و نوسازی بناها ثبت می نمایند این برنامه ریزی به نحوی است که هر ساله تمام مسیرها بازبینی می شود. این افراد هیچ ارتباطی با ساکنان منازل برقرار نمی نمایند بلکه خود شرایط موجود ملک را بررسی و ثبت می كنند.
با توجه به تفکیک اطلاعات کاربری مسکونی در هر محدوده، استفاده از کد پستی به عنوان بهترین روش برای مطالعات اپیدمیولوژی مورد تایید کارشناسان وزارت بهداشت و درمان و آموزش پزشکی قرار گرفت. زیرا با توجه به تعداد کد های پستی ده رقمی که کاربری مسکونی دارند، در هر محدوده ي شهری یا روستائی با توجه به ضریب خانوار که مرکز آمار ایران منتشر نموده، افراد ساکن در هر محدوده قابل محاسبه می باشد؛ برای مثال این عدد در شهر تهران برابر 1/4 می باشد.همچنین از این سیستم می توان معتبرترین تخمین های نفوس و مسکن را استنتاج نمود زیرا در نحوه ي آمار برداری اطلاعات بر خلاف مرکز آمار ایران واداره ثبت احوال هیچ سند و مدرکی دال بر اصالت شخص یا ملک طلب نمی گردد و فقط اصالت وجود ملک و هر نوع ساخته ي بشری ملاک عمل کار آنها می باشد.
با کمک جناب آقای مهندس باستانی اینجانب به مسئول انفورماتیک اداره ثبت احوال کشور سرکار خانم مهندس کاظمی معرفی شدم و ایشان نیز توضیحاتی در خصوص درج کد پستی در کارت ملی اظهار نمودند و مشخص گردید کدهای پستی از طریق خود اظهاری متقاضی درج می گردد و با بانک اطلاعاتی اداره کد گذاری صحت گذاری نمی شود. تا کنون تمهیدی در خصوص ثبت مجدد تغییر محل سکونت که منتج به تغییر کد پستی ده رقمی مندرج در کارت ملی می باشد اندیشیده نشده است.
در نهایت با توجه به اینکه نقشه های پستی اکثر نقاط کشور تا 5 رقم اول کد پستی تهیه شده، این نقشه ها به عنوان نقشه پایه در نظر گرفته شد لازم به ذکر است که میتوان بعدا نقشه ها را براساس کد 10 رقمی تهیه و استفاده نمود ولی از انجا که این میزان دقت موضوعیتی در این نوع مطالعات ندارد برای همین نقشه ها تا 5 رقم انتخاب گردید
به پیوست یک نمونه از نقشه های تهیه شده توسط اداره کد گذاری ارائه می گردد (شكل 1).
رقومی نمودن نقشه های شهر تهران
(اصطلاح جی ای اس کردن نقشه ها بدين معني كه نقشه فقط یک نقاشی نيست و اطلاعات هم به آن ضميمه شده است.)
در نهایت نويسنده، شروع به رقومی نمودن 18 شیت از نقشه های کاغذی دریافتی از اداره کد گذاری مربوط به شهر تهران نمود. در ادامه با کمکهای سرکار خانم مهندس توکلی به صورت داوطلبانه کار رقومی نمودن نقشه های شهر تهران در سال 1386 به پایان رسید.
روش کار به این صورت بود که در ابتدا نقشه های کاغذی دریافتی اسکن گردید و سپس در نرم افزار Autocad حدود محدوده ها و کد آنها رسم شد. در نهایت 18 شیت به هم دیگر متصل و به ابعاد واقعی با کمک عکس های ماهواره ای تبدیل و بر همین مبنا به مختصات اصلی منتقل گردید که در نهایت، دقت نقشه 70 متر خطا در 11 کیلومتر به صورت قطری بود که در حد قابل قبولی قرار داشت (شكل 3) و سپس تمام نقشه های هر مرکز پستی بصورت جداگانه پلات گردید و به مراکز مربوطه ارسال شد تا اقدام به تصحیح کدها و حدود نا مشخص نمایند. در نهایت نقشه ها با تایید آن اداره نهائی گردید. در شکل (شكل 2) نقشه ي نهائی درج گردیده است .
همچنین در سال 1387 با عنایت جناب آقای نصیری مدیریت اداره کد گذاری و جغرافیائی و همکاری جناب آقای مهندس جوادی تمام نقشه ها و کروکی هاي استان تهران به صورت کاغذی در اختیار انستیتو کانسر قرار گرفت که همین سیستم برای کل استان پیاده سازی گردد ولی از آنجا که اکثر نقشه ها به صورت کروکی بوده و عوارض جغرافیائی مشخصی روی آنها درج نگردیده بود و مقیاس بعضی از آنها یک به دوهزار بود که ابعاد خیلی بزرگی در حد نقشه های چند متری را شامل می شد، از این رو فقط به تعداد 8 شیت نقشه از محدوده های کرج و دماوند قابل استفاده بودند که نقشه های کرج در سال 1388 به اتمام رسید و نقشه های فیروزکوه و دماوند در سال 1389 (شكل 4).
برای سایر نقاط ایران، اگرچه از حوزه ي کاری انستیتو کانسر خارج بود، ولی نقشه ي مدونی تهیه نگردیده و فقط بعضی از استان ها به صورت مستقل اقدام به تهیه نقشه های با فرمت های دلخواه خود نموده اند از جمله نقشه های کاداستر قزوین در برنامه مخصوص نقشه برداری Micro Station و نقشه های Autocad شهر تبریز .نقشه ي روبرو نقشه ي جانمائی محدوده های پستی بر روی نقشه تهران می باشد که جهت تعیین میزان خطا تهیه گردید.
از مزایای منحصر به فرد این روش مي توان به موارد زير اشاره نمود:
1) انطباق کامل آن با سایر نقشه ها و اطلاعات موجود در سطح کشور به صورتي كه می توان تمام نقشه های جغرافیائی کشور را بر روی آن جانمائی نمود که در اصطلاح GIS آنرا Overlay می نامند. برای نمونه نقشه ي قوم شناسی ایران درج گردیده است. همین طور می توان نقشه ي نقاط نصب آنتن های تلفن همراه و خطوط انتقال برق محل استقرار پمپ بنزین ها و .... را بر روی این سیستم پیاده سازی نمود.
2) عدم تغییر کدها
3) درج تغییرات توصیفی در بانک اطلاعاتی اداره ي کد گذاری و جغرافیائی کشور
4) کد دهی به تمام آدرس ها؛ حتی آدرس های ناقص و اشتباه؛ که این خصیصه در اهداف انستیتو نقش مهمی بازی می کند زیرا هیچ رکورد اطلاعاتی به علت نقص آدرس حذف نمی گردد. همان طور که توضیح داده شد تمام آدرس های شهر تهران با عدد 1 شروع می شود پس تمام اطلاعات موجود در بانک اطلاعاتی انستیتو کانسر با عدد 1 شروع می شوند و هر چه آدرس گویا تر باشد می توان کدهای بیشتری به آن نسبت داد تا به 5 رقم برسد. به عنوان مثال هر چه در آدرس اسامی خیابان ها با الگوریتم پست هماهنگ تر باشد و توالی آنها رعایت شده باشد می توان به تعداد ارقام کد افزود، مثلا خیابان رودکی نامی در منطثه پستی 17 جای دارد پس رکورد ما در وهله ي اول کد 17 را به خود اختصاص می دهد؛ خیابان رودکی در تقاطع 7 محدوده ي پستی است که تمام آنها با 175 شروع می شوند پس رکورد ما عدد 175 هم به کد مربوطه اضافه می کند، حال معبر دیگری به نام خیابان اسفند در رکورد اطلاعاتی ما جای دارد که در مرز سه محدوده قرار دارد به نام های 17569و 17568 و 17567 که همگی با عدد 6 شروع می شوند پس رکورد ما عدد 6 هم به کد مربوطه اضافه مي نمايد و به 1756 تبدیل می گردد، در رکورد اطلاعاتی مربوطه کلمه ي دیگری درج نگردیده پس در همین حد 4 رقم بیشتر گویا نمی شود و در نهایت به هر کدام از این سه محدوده 17569و 17568و17567 یک سوم را نسبت می دهیم؛ اگر رکوردی اصلا آدرس نداشت از آنجا که همگی رکوردها متعلق به شهر تهران می باشد می توان کسر 1 به 1900 (تعداد کل محدوده های شهر تهران) را به هر محدوده نسبت داد تا از لحاظ آماری رکوردی از محاسبات حذف نگردد.
روش های متنوع گویا سازی اطلاعات موجود
بر همین مبنا روش های متنوع گویا سازی اطلاعات موجود که بالغ بر 700 هزار (شامل 500 هزار رکورد از متوفیان مدفون در بهشت زهرای تهران به علت ابتلاء به انواع سرطان و 200 هزار رکورد از بیماران تحت درمان ) رکورد اطلاعاتی است در نرم افزارهای مختلف از جمله Auto cad, Ilwis, Edrisi, arcview, arcGis مورد بررسی و امتحان قرار گرفت.
این روش ها شامل بازخوانی اطلاعات توسط اپراتور و گویا سازی چشمی و دستی آنها بر روی نقشه های پستی و جغرافیائی شهر تهران بر روی نرم افزارهای ذکر شده است. نرم افزار Autocad به علت آنکه امکان تعریف اطلاعات توصیفی را برای نقاط ندارد راه حل مناسبی به نظر نرسید، نرم افزار ArcGIS و Arcview که از مهم ترین نرم افزارهای سیستم اطلاعات رسانی جغرافیائی (GIS) می باشد توانائی تحلیل های گوناگون و متنوع را دارد ولی کار با آن در حد اپراتور نمی باشد از این رو بر روی دو نرم افزار Edrisi و Ilwis که هر دو نرم افزارهای مخصوص هیدرولوژی بوده و کار با آنها راحت تر است مورد نظر قرار گرفت. همچنین از اداره ي محترم جغرافیائی و کد گذاری پست کشور و با همکاری جناب آقای مهندس جوادی و شاه محمدی؛ یکی از نرم افزارهای داخلی آن اداره که به نام کد یابی پستی بود در اختیار گذاشته شد که با ورود سه قسمت آدرس (محله- معبر ماقبل آخر – معبر آخر) کد پستی 5 رقمی آدرس مربوطه را ارائه می کند. همچنین با داشتن فقط یک کلمه از آدرس، به خصوص معبر آخر، برنامه تمام کد های احتمالی با آدرس کامل را نمایش مي دهد که توسط اپراتور، کد آدرس نزدیک تر استخراج می گردد. در این مرحله سرکار خانم مهندس تبیانیان به صورت داوطلبانه برای حدود 2000 رکورد در طول 4 ماه اقدام به گویا سازی نمودند. ولی از آنجا که انستیتو کانسر یک مرکز دولتی است؛ اپراتوری برای این کار در دسترس نبود.
در انتها با توجه به حجم زیاد اطلاعات و عدم امکان کد دهی دستی توسط اپراتور اینجانب اقدام به برنامه نویسی جهت کد دهی به آدرسهاي موجود در محیط نرم افزاری foxpro نمود که نتایج خوبی برای 23000 رکورد انتخابی در پی داشت به نحوی که 52 درصد آدرس ها تا 5 رقم کد دریافت نمودند؛ 41 درصد تا 4 رقم و 6.3 درصد تا 3 رقم و 0.7 درصد هم کد دریافت ننموده اند.
الگوریتم برنامه
الگوریتم برنامه به این صورت تدوین گردید:
از آنجا که فیلد آدرس در رکوردهای بانک اطلاعاتی انستیتو کانسر به صورت رشته ای تدوین و تکمیل گردیده است امکان تفکیک آدرس ها وجود نداشت از این رو ملاک عمل، فایل اطلاعاتی برنامه ي کد یاب اداره ي کد گذاری قرار داده شد. اين برنامه در ابتدا یک رکورد از این فایل را مي خواند و تمام آدرسهای بانک اطلاعاتی بیماران سرطانی را برای این آدرس جستجو می نماید. از آنجا که در فایل اداره ي کد گذاری سه فیلد معبر آخر- معبر ماقبل آخر و محله به صورت جداگانه تدوین گردیده اند، برنامه در ابتدا سعی می کند هر سه فیلد را با بانک اطلاعات بیماران سرطانی مطابقت دهد تا کد 5 رقمی مربوطه را به آدرس آن بیمار نسبت دهد؛ در وهله ي بعدی اگر دو فیلد در یک رکورد اطلاعاتی بانک بیماران سرطانی مطابقت داشت؛ 5 رقم کد پستی را به آدرس آن بیمار نسبت می دهد. و در نهایت تمام رکوردهائی که کد دریافت نموده اند به صورت مجازی حذف می گردند تا از گردونه ي مقایسه خارج شوند. در این مرحله بانک اطلاعاتی اداره ي کد گذاری ملاک عمل بوده و رکورد به رکورد آن با بانک اطلاعات بیماران سرطانی مقایسه و تعیین تکلیف می گردد.
در این مرحله یک بانک اطلاعاتی حد واسط تولید و تدوین شده است. در ابتدا بر اساس محتوای فیلد معبر آخر بانک اطلاعاتی اداره ي کد گذاری، تمام آدرس های باقی مانده مقایسه می شوند و 4 رقم اول کد پستی پنج رقمی به آن نسبت داده مي شود و در بانک اطلاعاتی حد واسط ثبت می گردد. سپس بر مبانی محتوای فیلدهای معبر ماقبل آخر و محله نیز مقایسه صورت می گیرد و به ازاء هر مطابقت یک رکورد در بانک اطلاعاتی حد واسط به همراه 4 رقم اول کد پستی پنج رقمی ثبت و در نهایت تعداد کدهای 4 رقمی مطابقت داده شده، به تفکیک شمارش مي شود و بیشترین تعداد به عنوان گزینه ي نهائی انتخاب و در بانک اطلاعاتی بیماران سرطانی منظور می گردد. البته اگر تعداد یافت شده از عدد 10 کمتر بود فقط 3 رقم اول نسبت داده می شود. همچنین الگوریتم های دیگری نیز در این میان مورد استفاده قرار گرفت ولی این الگوریتم از بقیه منطقی تر به نظر می رسد ضمنا بيان این نکته ضروریست كه این نوع الگوریتم بر خلاف سایر بانک های اطلاعاتی به خصوص بانک های اطلاعاتی مالی، دارای خروجی قطعی (static out crop) نمی باشد و برنامه نزدیک ترین گزینه را جستجو می نماید که در اصطلاح به آن (Dynamic out crop) می گويند.
این برنامه برای مقایسه و آدرس دهی به اطلاعات نمونه به حدود 96 ساعت زمان احتیاج داشت که ناشی از آدرس های غیر استاندارد اظهار شده توسط بیمار یا همراهان وی بوده است. از آنجا که یکی از اهداف انستیتو کانسر برای این آدرس یابی امکان فراهم آوری این سیستم بصورت آن لاین بود، نوينسده با فراهم آوری یک Ip معتبر در اینترنت؛ برنامه را به نحوی برنامه ریزی نمود که هر فردی با داشتن کلمه ي عبور و کد شناسه به کامپیوتر مورد نظر وصل گردد و فایل آدرس های خود را که به فرمت متن، ذخیره کرده بر روی یک پوشه از پیش تعریف شده بار گذاری نمود. برنامه به صورت اتوماتیک شروع به کار کرده و در نهایت خروجی را نیز بر روی پوشه مشخصی قرار می دهد. ولی این زمان (96 ساعت) مطابق نیازهای آنها نبود به همين دليل جناب آقای مهندس محمدی از طرف انستیو کانسر ماموریت یافت این الگوریتم را در محیط های برنامه نویسی دیگری آماده نماید ولی متاسفانه به علت عدم آشنائی ایشان با سیستم های Dynamic out crop نتیجه ای در پی نداشت.
همچنین به کارشناس محترم انفورماتیک انستیتو کانسر جناب آقای مهندس گل ماهی توضیح داده شد فایلهائی که در اختیار اینجانب یا هر ارگان و سازمان دیگری می گذارید فاقد نام بیمار و اطلاعات شخصی فرد باشد زیرا از لحاظ امنیت اطلاعات کار درستی نمی باشد. به اين ترتيب فایل دریافتی از آن مرکز فقط شامل کد شناسائی در بانک اطلاعاتی و آدرس مندرج در فرم است.
با ابلاغ عمومی کد پستی، به نوعی مختصات جغرافیائی هر نقطه به افراد ساکن در آن ارائه گردیده است. اين رويكرد کاربردهای متنوع و بدیعی دارد که در ادامه ذکر می گردد.
علاوه بر اين بر مبنای کد پستی ده رقمی، اطلاعات متنوعی تولید میگردد که در ذیل تعدادی از آنها درج میشود:
- میزان مصرف آب – برق – گاز – تلفن که در هر دوره به صورت کاملا دقیق تهیه و به افراد ابلاغ میگردد این قبوض از انجاکه دارای بار مالی میباشند به طور خیلی دقیقی تهیه میگردند
- ثبت در اداره شماره گذاری نیروی انتظامی برای پلاک انواع خوردو که یک بانک اطلاعاتی ذیقمتی محسوب میگردد
- ثبت در اداره گذرنامه نیروی انتطامی
- اداره ثبت احوال
- حسابهای بانکی
این مجموعه اطلاعات که به طور مرتب تهیه و به روز میگردند، توانمندی فوق العاده ای به وجود می آورند که در بخش بعدی به اختصار توضیح داده خواهد شد.
نتايج
در نهایت، خروجی تحقیق یک سری نقشه و شکل بوده است که اين اولین خروجی ها براي نقشه های تهیه شده بر مبنای اطلاعات داده شده در اين قسمت درج می گردد.
در شکل شماره 5 همانطور که مشخص است، پراکندگی موارد بروز سرطان برای یک قسمت از بانک اطلاعاتی موجود مشخص گردیده. در این نقشه فقط تعداد کلی بیماری در هر محدوده، گویا گردیده است.
در شکل شماره 6 میزان پراکندگی سرطان با کمک نرم افزار Arc view ترکیب گردیده که توسط علامت فلش مکان هائی که تراکم بیشتری دارند مشخص گردیده این پراکندگی فقط بر اساس تعداد بیماری تدوین شده ولی در شکل شماره 7 این پراکندگی بر اساس درصد جمعیت ترکیب گردیده است و همانطور که ملاحظه می شود نقاط دیگری به عنوان کانون سرطان تعیین شده که که تفاوت نفاط با فلش های سیاه مشخص شده و در مرکز شهر نقطه کانونی دیده نمیشود .در بخش پیش اشاره گردید چرا سایر روشها ارزش اپیدمیولوژیک نداشته اند زیرا توانائی تعیین درصد در هر نقطه را ندارند اگر شکل شماره 6 میزان کار یک اپیدمیولوژیست قرار گیرد وی مجبور به تحقیق در رابطه با کانون های سرطان در شمال شهر و جنوب شهر توامان خواهد بود، ولی وفتی بر مبنای شکل 7 کار نماید این کانون ها در نقاط دیگری قرار گرفته و مطالعات را دچار اعتشاش نمی نماید .
همچنین همانطور که قبلا ذکر شد، میتوان لایه اطلاعات پراکنش تعداد خودرو را بر روی این نقشه درج نمود تا به عنوان یکی از مهمترین شاخص های دارائی هر خانواده به نتایجی در خصوص رابطه سطح در آمد و سرطان دست یافت، همچنین میزان مصارف آب- برق – گاز و تلفن را نیز بر روی این نقشه اضافه نمود و به استنتاجات جدیدی دست یافت، ضمنا سایر اطلاعاتی که با کد پستی در ارتباط هستند به طور مستقبم قابل درج بوده و سایر اطلاعات که مختصات جغرافیایی آنها مشخص باشد از طریق نرم افزار هم پوشانی انجام مي دهد.
اطلاعات فوق به صورت کلی از تمام انواع سرطان استنتاج گردیده است.
در شکل شماره 8 که توسط سازمان زمین شناسی کشور با کمک مرکز تحقیقات سرطان کشور قبل از آغاز هم کاری اینجانب تهیه گردیده است، ملاحظه می نمائید که نهایت تفکیک بیماری بر اساس شهرستان های کشور بوده و بعضی از شهرستانها نیز فاقد اطلاعات بوده اند، اگرچه میزان جمعیت در هر شهرستان به کمک مرکز آمار ایران قابل استحصال میباشد، ولی اولا مساحت بعضی از این شهرستانها به هزاران کیلومتر مربع میرسد که محل دقیق بروز بیماری را کاملا مخدوش مینماید و در ثانی فقط اطلاعات جمعیتی در حد شهرستان در اختیار بوده و سایر اطلاعات قابل تطبیق با این نقشه نمیباشند، زیرا در بانک اطلاعاتی آنها نامی از شهرستان برده نمیشود
در شکل شماره 9 یک عارضه سرطانی در سطح شهر تهران با زحمات بسیار زیاد و زمان طولانی رقومی گردیده، ولی همانطور که ملاحظه می نمائید به این نقاط هیچ ماخذ جمعیتی و خدماتی متصل نمیگردد و فقط به صورت منفرد میتواند تحلیل شود که اين، فاقد ارزش اپیدمیولوژیکی است.
بحث
نقشه ها نشان مي دهد كه تراكم اپيدمي سرطان، در مناطق بازار تهران است (قسمت قرمز). بعد از آن قسمت جنوب غربی
تهران دومين تراكم اپيدمي را دارد.
همانطور که از روی نقشه می توان فهمید، بیشترین میزان سرطان در تهران مربوط به محله بازار است. مي دانيم كه تعداد مناطق مسكوني در بازار بسيار کم است پس مي توان علت وجود آدرس هاي بسيار زياد مربوط به بازار در اطلاعات بیماران سرطاني را به محل کار آنها كه در اين مناطق است، نسبت داد. مهم ترین خصوصیت بازار و تجارت در ایران چه چيزي مي تواند باشد؟ استرس. كه مي تواند ناشي از فروش جنس باشد و يا از چک هائی که ارائه گرديده يا گرفته شده است و يا موارد ديگر. در هر صورت دلايل وجود ميزان بالاي سرطان در مناطق بازار نياز به تحقيقات بيشتر و جامع تري از سوي متخصصان سرطان و اپدميولوژي آن دارد و در اين تحقيق تنها به نشاان دادن نرخ بالاي سرطان در مراكز خاص پرداخته شده است.
بعد از بخش بازار،‌قسمت جنوب غربی تهران دومين تراكم اپيدمي را دارد. شايد به اين دليل كه بیشترين مراکز صنعتی تهران در غرب شهر واقع شده است و کارگرانش در همان دور و اطراف ساکن می شوند و به دليل فقر از تغذیه ي خوبی نيز برخوردار نيستند به همين دليل درصد ابتلاء به سرطان بالاتر مي رود.
برداشت دیگري كه مي توان از اين نقشه ها داشت و ارتباط چنداني به بحث سرطان ندارد این است که چون وضعيت اقتصادي در كل مطلوب و مورد رضايت نيست صنایع ما سود ده نیستند پس به کارگرانش هم نمی توانند به خوبي رسيدگي كنند. زير نقشه ها وجود سطوح بالاي اپيدمي سرطان را در مناطق مربوط به كسب و كار و صنعت و بازار نشان مي دهد. از آنجايي كه تیپ صنایع ایران تکنولوژیک نیست که کارگر متخصص بخواهد و هر کسی می تواند كار را انجام بدهد به همين دليل هم سطح دستمزدها بسيار پائین است. اين هم از نتايج مفيد ديگري است كه مي توان از یک نقشه پراکنش سرطان که با کاربری های مسکونی و غیر مسکونی تلفیق شده، به دست آورد.
الگوريتم تشريح شده در اين مقاله، به مرکز جهاد دانشگاهی دانشگاه علوم پزشکی ایران نيز ارائه شد و آنها برای بررسی اپیدمیک بیماری فیبرومیالوژی از آن استفاده نمودند که با تشکیل جلسه با اداره ي کد گذاری و جغرافیائی کشور و حضور کارشناسان هر دو مرکز قرار بر آن شد که واحد انفورماتیک اداره ي کد گذاری با توجه به تراکم کاربری مسکونی در هر محدوده، اقدام به استخراج 2500 شماره تلفن نمايد و با ذکر کد به جهاد دانشگاهی ارائه دهد. به عنوان مثال برای تعدادی از محدوده های پستی، 5 تلفن استخراج گرديد برای بعضی 1 تا 3 تلفن و برای مواردی هم به علت اکثریت کاربری های غیر مسکونی تلفنی استخراج نگردید. در نهایت تعدادی از پزشکان آن مرکز در مدت 8 ماه با تلفن كردن به این شماره ها، ضمن اطمینان از کاربری مسکونی تلفن مورد نظر اقدام به پایش مورد نظر خود نمودند و در فرم های مخصوصی اطلاعات نا همگون با اداره ي کد گذاری ثبت و ارائه و به ازاء آن تلفن های جدید اخذ و در نهایت با پایان یافتن پایش در حال بررسی های آماری و انتشار نتایج آن می باشند.
کد پستی در بسیاری از اسناد ثبتی و قبوض خدمات شهری درج مي گردد، لذا می توان از این روش و طرح در زمینه های متفاوت دیگری استفاده نمود كه نويسنده اين نحوه ي استفاده را با توجه به حصول نتايج مثبت در زمينه ي اطلاعات پراكنش سرطان در سطح شهر تهران قوياً توصيه مي نمايد. از جمله اين موارد پيشنهادي مي توان به موارد زير اشاره نمود:
1- در حوزه ي مدیریت بحران EOC GIS ، با توجه به تفکیک کاربری های مسکونی و غیر مسکونی می توان تخمین بسیار دقیقی از تلفات احتمالی ناشی از بلایای طبیعی در هر محدوده ي جغرافیائی ارائه داد. همچنین با توجه به تعداد کل اماکن و ساختمان های موچود در محدوده، حجم تقریبی آوار ناشی از این بلایا را از قبل در دست داشت و اقدام به مدیریت ماشین آلات مورد نیاز نمود. همچنین با توجه به درج کد پستی در بانک، کد ملی افراد واجد شرایط دریافت کمک های ثانویه ناشي از این بلایا قابل شناسائی است.
2- در حوزه ي آموزش و پرورش، با توجه به درج کد پستی در کارت های کد ملی، می توان ذهنیت دقیقی از تعداد و تنوع جنسیتی افراد تحت پوشش آموزش و پرورش و امکانات موجود در منطقه به دست آورد و نسبت به مدیریت آنها اقدام نمود.
3- در بحث توسعه پایدار، با توجه به درج این کد در قبوض خدمات زیربنائی شهری – آب – برق- تلفن – گاز و اسناد ثبتی خودرو و روادید ورود و خروج از کشور، می توان اقدام به تبیین توسعه یافتگی در هر محدوده نمود و میزان توزیع در آمد در مناطق مختلف را سنجید. همچنین در این مقوله با استفاده از اطلاعات موجود کارهای بسیار زیادی در باب جامعه شناسی و اقتصاد می توان انجام داد که درهمین رابطه در 2 سال پیش جلساتی با کارشناسان محترم دفتر توسعه ي سازمان ملل متحد UNDP جناب آقایان فرزین و حیدر ندیم بر گذار گردید و اين طرح مورد توجه آنها واقع شد، به خصوص بخش ارتباط این کد با پلاک ملی خودروها که در بحث اقتصاد خانواده رل مهمی بازی می کند. ولی از آنجا که تصمیم گیری در خصوص طرح های جدید در مرکز سازمان ملل متحد اخذ می گردد طرح به سرانجامی نرسید.
4- علاوه بر اين این طرح به دفتر ایدز سازمان ملل متحد UNAIDS ارائه گرديد و مورد توجه کارشناس محترم آن دفتر جناب آقای دکتر ستایشی و فیض زاده قرار گرفت ولی آن هم به علت بالا به سرانجامی نرسید، همینطور طرح به دفتر UNICEF و WHO ارائه گردیده است. که نتیجه در پی نداشت.
5- در بحث ترافیک، با توجه به تعداد خودروهای هر محدوده و تراکم مراکز اداری – آموزشی، تجاری (غیر مسکونی ) در هر محدوده، که نشان دهنده ي مبدا و مقصد سفرهای درون شهری است، ذهنیت دقیقی از میزان آمد و شد به محدوده های مختلف در ساعات مختلف شبانه روز به دست مي آيد كه اين به نوبه ي خود قابل بررسي و استفاده به منظور مديريت ترافيك و موارد مربوطه مي باشد.
6- در مقوله ي امنیتی، با درج محل وقوع بزه و محل سکونت قربانی و بزهکار، مي تواند به پهنه بندی وقوع انواع خشونت و پیش بینی های احتمال وقوع جرم و مدیریت گشت های انتظامی اقدام نمود. به عنوان مثال، مي توان با جمع آوری اطلاعات سالانه و تدقیق آن بر روی نقشه، ذهنیت کلی در مورد احتمال وقوع نوع بزه (کیف قاپی- سرقت مسلحانه – قتل و ...) در هر محدوده به دست مي آورد و اقدام به اعزام گشت های پیشگیری به محل های پر خطر نمود و یا از اعزام گشت ها به محل هائی که از لحاظ آماری در آن روز احتمال هیچ نوع بزهی وجود ندارد جلوگیری کرد که خود تاثیر زیادی در نحوه ي مدیریت انتظامی دارد. همچنین با ارائه ي یک مدل ریاضی که ترکیبی از پارامترهای مختلف از قبیل تعداد خودرو و معاملات آن در شهر یا شهرستان – معاملات بانکی و ... است مي توان يك ضریب همبستگی بین وقوع بزه با این پارامترها که از شاخص های مهم اقتصادی اجتماعی است، به دست آورد و بر همین اساس مدل را به روز نمود.
7- از دیگر مزایای این روش دریافت اطلاعات از اقشار مختلف جامعه به روش خود اظهاری توسط شبکه ي پیام کوتاه می باشد. زيرا شبکه ي ارتباطات کشور با 35 میلیون مشترک و پوشش 90 درصدی سطح کشور مزیت بسیاری نسبت به شبکه ي اینترنت با 15 میلیون مشترک و 60 درصد پوشش و ضریب نفوذ پائین دارد. ضمنا هزینه ي ایجاد هر ارتباط اینترنتی حدود 10 میلیون ریال است در حالیکه با 350 هزار ریال می توان به شبکه ي ارتباطات سیار متصل شد.
همانطور که ملاحظه میشود کاربرد این سیستم در بحث سلامت یکی از کاربردهای کاملا فرعی این روش است و مهمترین کاربرد آن، در بعد مدیریت کلان سیاسی کشور،‌است که میتواند اقدام به رصد فعالیت های حیاتی و کلیدی در کشور كند. به عنوان مثال، با رصد حجم معاملات ملکی و اتوموبیل - دریافت خدمات بهداشتی و داروئی- حجم مبادلات بانکی – حجم ورود و خروج از کشور و ....، مي تواند دید دقیقی از اتفاقات روزمره در کشور داشت و به طور کلی برای تمام حوزه های ذکر شده با استفاده ازمدل ریاضی استنتاجات بسیار بسیار متنوعی بدست آورد و ضرایب همبستگی گوناگونی را استنتاج نمود تا با تعقیب تغییرات یکی از این موارد (نقل و انتقال خودرو یا ....) که از موثرترین شاخص های اقتصادی است، میزان توزیع ثروت را سنجید و به تبع آن، سطح امنیت و بهداشت و آموزش را به دست آورد بدون اینکه این موارد را مستفیما مورد بررسی قرار داد.

منابع
سازمان زمین شناسی کشور مدیریت علوم زمین
دانشکده بهداشت دانشگاه شهید بهشتی
مرکز تحقیقات سرطان کشور
مجموعه مقالات کنفرانس اپیدمیولوژی – دانشگاه شاهرود- 1389
انجمن اپیدمیولوژیست های ایران
سازمان بهداشت جهانی
معاونت کد گذاری و جغرافیائی کشور
Universal postal union( اتحادیه پست جهانی)
دانشکده ژئوماتیک دانشگاه خواجه نصیر طوسی
Wikipedia سایت دانشنامه آزاد
Environmental Systems Research Institute(Esri): the GIS software leader