۱۳۸۹ آبان ۱۲, چهارشنبه

The Survey about the epidemy of rampant cancers in Tehran city by Geographical Information System

Introduction
As I acclaimed to be prepared to do voluntarily the GIS (Geographical information System) services (information management system) for Society of support children suffering from cancer. The center of cancer research, under the supervision of Dr Moosavi Jarahi, asked me to participate. So the author has been voluntarily cooperating with this center since 5 years ago in the issue of the survey of the epidemy of rampant cancers in Tehran province by geographical information system.
Generally (the location information system) or Geographical Information System (GIS) as it's shown by the title, is initially a system which edits and analyzes the entire information of a specific location of geographic zone.
This is a computerized system for managing and analyzing the geographic information. It has the capability to gather, save, analyze and show the geographic information. The final aim of geographic system is to protect the decisions which are made according to the geographic data and the basic function of this kind of systems is to obtain the information that are gained by the syntax of the different layers of data with different procedures and various viewpoints.
About the word, epidemiology: it is the method of studying the conditions and the elements of diseases prevalence or any other elements which refer to the health. This phrase has been used as "the science for survey of the epidemy of infectious diseases". But today with the progress of all kinds of sciences and controlling most of epidemic diseases, the meaning of this word extended to "the science for survey of elements and conditions of diseases prevalence". "Epi" literally means occur, "Demos" means people and "Logus" means survey and recognition. So this phrase literally means "recognition of what occurs to people" and though the medical and health state of the society is the main point, it has close connection to economy, sociology, culture, religion....Although the clinical medical care most for the person and his disease, epidemiology most focuses on groups and communities and clinical epidemiology care for both.
The method which is mentioned in this research, according to Mr. Bastani, the prior supervisor of Iran codifying office, has been used for the first time and in spite of search in internet, no equivalent was found for it. The reason could be firstly, this method of codifying is used in developed countries and because it's near 200 years since those countries has been industrialized the geographic and descriptive plans of different parts of their country have been prepared and utilized since that time.
Secondly, development prevents those societies from prevalence of the epidemic diseases so there is no reason for them to use this method or any kind of other methods which will be mentioned soon after. We found only one instance, which was suggested by Oxford university to search about health GIS, According to the zip code. That article mentioned the same method and advised to use it for health management. But there were no details or special sub theory in it.
http://minority-health.pitt.edu/archive/00000417/01/Place,_Space,_and_Health-_GIS_and_Epidemiology.pdf
After one month I found another instance in "international journal of health geographic" that was about heart failure patients in Calgary, Canada in 2003 according to zip codes to find the transmittal of diseases in the city.
http://www.ij-healthgeographics.com/content/3/1/5

Methods and Materials
At the first step, the most important item for The Cancer Institute was the methodology of covering all existent information. Generally, the information assembling system of The Center of Cancer was according to the information of the patient's files (self declaration) in hospitals and medical centers which then has been registered on the specific forms of patients by the personnel and students in The Center of Cancer. Patient's address is one of the most important items in this forms which had some disadvantages. First, the patient's addresses were not precise, because the standard postal address has three parts, last pass way, penultimate pass way and sector. So as most of the people do not know about this, they do not follow the standards.
Second, most of the patients did not give any other addresses like where they work or spend most of their times in, especially for the patients of other cities. As you know, the signs of cancer can be detected in the places where the patients may work in. All of these disadvantages were announced to The Center of Cancer research but because The Center had no administrative authority to ask hospitals to register the patients' precise information, the current data was expected to be valid.
Thus, during the first two years we researched to prepare a plan of scattering level of disease and the population of residents in different zones according to these addresses. In this way, we had several sessions with the experts of The Center of Geographic Information of Tehran. We were supported by the president of that center, Mr. Moini and could use their data. Although the most important item for The Center of Cancer was to access to the population of residents of each zone, there was no proper data in The Center of Geographic Information. It is necessary to say, too many studies and researches in epidemiology has been done by The Center of Cancer and other centers but because of the same reason that has already been mentioned, none of them is not valid, nonetheless I will explain some of these efforts in the next part.
Characteristics of Zip Code
The custodian of the information of residents of each zone is the center of statistics .So we referred to that center but unfortunately they had no plan of gathered information of transmittal. Then we got in touch with central post office because recently they have codified all zip codes in the country. They sent us to the Postal Geographic Codifying Center of The Country, and then we asked to have a meeting with members of the board of the ministry of post and telegraph and telephone. The session was held and Mr. Hossain Abadi and Mr. Bastani were attended. The result of the session was a proper explanation about the qualities of zip code and all its documents. Briefly here they are:
The city of Tehran was divided to 8 postal centers. Digit 2 is not used as it can be mistaken by digit 3 (in Farsi) and zero as it s alike dot (.) is not used in codes. All of the digits of zip code have specific concept. For instance all codes in the city of Tehran start with 1 and codes in Khorasan province start with 5 and the codes in countryside of Tehran start with 3. As mentioned, the city of Tehran divided to 8 regions. Postal zones 11 to 19 except 12. When we go from main ways to sideways the codes go shredder:
1- The country has been codified by a Belgian contractor since 35 years ago.
2- Each one of the manmade receives a 10 digits code, even phone boxes.
3- Each code has progressive algorithm and each digit has one specific meaning.
4- The whole country divided to 11000 postal zones or as a technical postal phrase, "postal patrols".
5- About 22 millions 10 digits codes have been registered for places that 1millions of them are residential and about 2 millions of them are nonresidential.
6- The method of dividing these zones in the cities based on the aggregation of population and space but out of the cities it depends on the roads and natural sites.
7- The limits of zones in the cities are pathways and streets so that none of the houses is located between two zones. This method is used for all of the zones in the country.
8- 22 regions of Tehran are covered by 1900 zones.
9- The first 6 digits of zip codes include geographic information.
10- Zip codes are never changed under any condition.
11- Each one of these 10 digits zip codes includes 29 fields of information like usage sort in 29 separated guilds (residential, administrative, commercial and governmental) telephone numbers and the name of owners....
12- This information are always updating, every day 2000 agents throughout the country and 200 agents in Tehran pass their appointed zones on their feet to check the usage changes and reconstructions of buildings. These agents have no contact to the residents and observe, analyze and register the changes by themselves.

Considering utilizing of zip codes has segregation of information in residential usage, the experts of the ministry of health and medical support this method (utilizing zip codes) as the best way to reach to their aims. Because these 10 digits zip codes have information about the residents of each zone, they can calculate the population of zones by these codes and the coefficient of family which was appointed for most of the cities or even villages by The Center of Statistics of The Country.
For example this number is 4/1 for Tehran. We can also estimate the most valid approximation of residents and houses by utilizing this system, because in this system unlike The Center of Statistics Of Iran and the office of registrations of Iran, no document is required to prove the originality of existence of states and manmade constructions. Instead, the originality of existence is the proof or document of being existed.
I, with the aid of Mr. Bastani, was introduced to the chief of the department of Informatics in the Office of registrations of Iran, Mrs. Kazemi and she explained that zip codes are registered on national identification cards but registration is according to applicant's self declarations and is not verified to the information of office of codifying. There is no scheme to register the changing accommodations yet which actually changes the zip codes in national certification cards.
As most of the postal plans of zones are drafted by the first 5 digits of zip codes, these plans are supposed to be the basic plans. The plans can be drafted more attentively according to all 10 digits but considering, that level of accuracy is not needed, only the first 5 digits are applied.
One of the plans that were drawn by the Office of Codifying is enclosed (fig 1).

Digitizing Plans of the city of Tehran
(The phrase "digitizing" of the plans convey this concept that plans are not just painting but contain information.)
Finally the author began to digitizing 18 sheets of the plans of Tehran which had been drafted by The Office of Codifying, and then Mrs. Tavakoli voluntarily finished the task in 1386. As our chosen procedures, first, the sheets of plans were scanned as computer files, then the limits of zones were drawn by AutoCAD software, after that, 18 sheets of plans were attached together and with the aid of satellite images were changed to the actual scales with accuracy of 70 meters false in 11 kilometers diametrically and it was expectable (Fig 3).
Then all plans of each postal center were plated and sent back to the center to rectify the codes and unknown limits. Finally with confirmation of The Office we reached to ultimate plans. You can see the final plan of the city of Tehran in this image (fig 2).
In 1387 with the kindness of Mr. Nasiri, the president of The Codifying Office and Mr. Javadi, all of the plans and traffic collision report were sent to the Center of Cancer to apply this system for whole province, but most of the plans were like traffic collision report thus contained no geographic signs and also some of them were too big in size so that only 8 sheets of plans of Karaj and Damavand were utilizable. The plans of Karaj were finalized in 1388 and the plans of Damavand in 1389 (fig 4).
For other zones of the country as it was not in the work coverage of The Center of cancer, no plan was prepared.
But some of provinces independently prepared plans with different methods, like plans of Ghazvin by Micro Station and plans of Tabriz by AutoCAD. This is the location of postal zones plans of Tehran which was drawn for correction.
These are some of the individual advantages of this method:
1- The complete conformity of the method with all the plans and information in the country enable us to assemble all geographic plans according to the method which in GIS is called "overlay". For instance we can dismount ethnology plans, cell phone antennas plans, electricity transportation lines and gas station locations with this method.

2- Stability of codes and no changing.
3- Registration of descriptive changes in the data bank of The Office of Codifying.
4- Codifying all addresses, even incorrect or incomplete addresses. This option plays an important role through the goals of the institute, because no address even incorrect or incomplete is eliminated. As it has been mentioned, all codes in Tehran begin with 1, so all the information in The Institute of Cancer begin with 1 and whatsoever the address is more clear and complete we can add more digits to the code until getting to digit 5. For instance, whatsoever the names of streets in the addresses are more attuned with the algorithm and whatsoever its sequence is more precise we can add more digits to the codes. As an example, Roodaki Street is situated in postal zone No 17, so the record has initially 17 as the code. This street is on the junction of 7 postal zones which all of them begin with 175, so we add 175 to the code either. As the other item of the record, we have another Street named Esfand, which is on the rand of 3 postal zones: 17569, 17568, 17567 and all of them begin with 6, so we add 6 to the record as well and as a result our code becomes 1756. There is no other explanation in the record so our code is narrowed just to 4 digits and in this way we attribute one third to each one of 17569, 17568 and 17567 zones. If there is no address in the record, as much as all the records belong to the city of Tehran, we attribute 1/1900 (the number of all zones in Tehran) to each zone so actually no record is eliminated.
Clarification of Information Methods
Various methods of clarification of existent information including 700 thousand informational records (500 thousand records of people who died due to different kinds of cancer, buried in Tehran Behesht Zahra ,and 200 thousand records of patients under medical) were analyzed and tested by different softwares like ArcGIS, Arcview, Edvisi, Ilwis and AutoCAD. These methods contain, rechecking the information by operators and clarification of information on the postal and geographical plans by mentioned soft -wares. As AutoCAD has no capability to define descriptive information for spots, is not a good choice. ArcGIS and Arcview which are the most important soft wares of geographic information systems have availability of various kind of information analyzing options but it is hard for an ordinary operator to work with, so we have chosen Ilwis and Edrisi which both are hydrologic soft wares and easy to work with.
We received permission to use one of the patent software of The Office of Geography and Postal Codifying and in this case Mr. Javadi and Shahmohammadi were so cooperative.
This software has three parts of the address as the input (sector, penultimate pass way, last pass way) and 5 digits code as its output. We can also give just one word of the address to this software and get all the probable addresses from it, and then the operator can chose the closest one.
Mrs. Tebyanian voluntarily clarified 2000 records during 4 months. Although The Center of Cancer is a governmental center, no operator was available.
At the end, considering the plenty of information and inability to codify them by operators, I wrote a program to codify the addresses by FoxPro which had a good result for 23000 chosen records. 52 percent of addresses received 5 digits codes, 41 percent received 4 digits, 6.3 percent received 3 digits and only 0.7 percent received no codes.
Program Algorithm
This is the algorithm of the program:
As the field of address in records of data bank of The Center of Cancer were edited and finalized, inseparable detachment of different parts of addresses were not possible, so the informational files of the codifying program of The Codifying Office were assumed to be the base of the operation. This program initially reads a record of this file then searches all the addresses of patients in the data bank to find the address .As the addresses in the files of The Office of Codifying were edited in three parts (sector, penultimate pass way, last pass way ) The program firstly verifies all three fields with data bank of cancer to attribute 5 digits codes to patient's address, and then if two fields in one record are verified with data bank , 5 digits of zip code is attributed to the patient's address and finally all records which have received codes are eliminated thus these records are moved out of the comparing circle. At this stage, data bank of The Office of Codifying is the base of the operation but each one of records are compared by the data bank of the center of cancer, after that final decision is made.
When we were going through this method, at this stage, one medium data bank has been produced and edited. Firstly, according to the field of "last pass way" from the information of data bank of the office of Codifying, all the remained addresses are checked and first 4 digits of 5 digits zip codes are attributed to them and are registered in the medium data bank. Then the addresses according to the field of "penultimate pass way" and sectors are checked and compared and for each accordance, one record is registered in medium data bank with first 4 digits of 5 digits zip codes and finally the verified 4 digits codes are separately counted and the biggest number of accordance is registered as the final code in the data bank of the center of cancer, but if the number of found accordance is less than 10, only 3 digits are attributed.
There are other algorithms which have been utilized but it seems that, this one is more logical and reasonable. This kind of algorithm unlike the other data banks, especially financial data banks, has no static out crop (certain output) and it searches for the closest items which is named Dynamic Out Crop.
This program requires hours to compare and give addresses to information so that the addresses which have been declared by patients were not standard. As one of the goals of the cancer institute was online services (finding addresses), the author prepared a valid IP and enabled the program to have online services so every one who has username and password can contact to the system and upload the address files which have been stored in a folder with text format. The program is automatically run and put the results in a specific folder. But the spent time (96 hours) were not satisfactory so Mr. Mohammadi was appointed by the institute to provide the algorithm by other software .But he was not dominate at Dynamic Out Crop systems so the task had no result.
Also informatics expert of The Cancer Institute Mr. Golmahiwas informed to give the information files to the author of these pages or any other organization with no name and personal information, because it is against the security of information policy, thus the received files of that center only contain certification codes and registered addresses in forms.
As the zip codes have been publicized, geographic coordinates of every sector were actually informed to the residents. This incident has new and various usages which will be mentioned afterwards.
Besides, 10 digits zip codes produce different kinds of information which some of them are:
- Water – electricity – telephone and gas bills can be separately provided and announced to the consumers. As these bills are financial documents, should be very precise.
- Registration in Vehicle Registration Office in police department is assumed as a valuable data bank.
- Registration in passport office of police department.
- Registration in registry office.
- Bank accounts.
This collection of information which is frequently provided and updated creates a terrific capability which will be explained briefly in next part.
Results
Finally, the result of this survey was a pack of figures and plans that you can see the initial plans based on given information in this part.
Figure 5 shows the transmittal items of the cancer for one part of data bank. This plan only clarifies the total numbers of infection in each zone.
In figure 6 the transmittal of cancer has been combined by Arcview software and the zones which have more aggregated are specified by arrow keys. This transmittal has been only edited by the number of disease but in figure 7, this transmittal has been combined according to the population percent and as you can see other spots have been appointed as the focus of cancer and the difference of spots is shown by black arrow keys and in the center of the city there is no focus point.
In the last part we explained why the other procedures have no epidemiologic value so that those procedures are not able to provide percent for each zone. If an epidemiologist decides to work with plan No 6 he is forced to search for cancer focuses in north and south parts of the city correspondingly, but if he works on plan No 7, these focuses are situated on other spots and the study does not go to disordering. Also, as it was mentioned before, it is possible to register the transmittal of automobiles on this plan and in this way we can use it as the index of possession of each family for comprehending the connection between level of income and cancer. We can add the consuming level of water, electricity – gas and telephone to this plan and obtain some new conclusions, meanwhile other information which has connection to zip codes can be directly registered and there is other information which has clear geographic coordinates and can be overlapped by the software.
The aforesaid information is generally concluded from all different type of cancers.
In figure 8 which had been provided by The Organization of Geology of Iran with the aid of The Center of Cancer before the author cooperated with them, you can see that the utmost accuracy of detachment of the disease is cities borders; nonetheless, some of the cities have no information. Although the population of each city can be obtained by The Center of Statistics, firstly the space of some of these cities (provinces) are more than thousands of square kilometers, in this case the accuracy of locations of disease is not proper, secondly, as the data bank does not focus on names of cities, the only data in this plan is population and no other information can be verified.
In figure 9, only one cancer infection has been digitized. This task took so much time and difficulty, but as you can see no reference of population and service has been referred to the spots and can only be analyzed individually and has no epidemiologic value.
Discussion
The plans show that the most aggregated zone of cancer epidemy is Bazar and south west is the second most aggregated zone (red part).
As the plans show, the most aggregated zone of cancer epidemy is Bazar. We know there are not too many residential regions in Bazar so the big number of addresses in this zone refers to where the cancer patients work in. What can be the most important characteristic of Bazar in Iran? "Stress" which is the result of the quality of jobs there. The reasons of this aggregation needs more research by the cancer experts and epidemiologists and this survey only focuses on the centers with high rate of cancers.
After Bazar, south west of Tehran has the most aggregation. As most of the big industrial centers of Tehran are situated on west side of the city and workers have been settled close to where they work so Poverty and bad nutrition can be the reason of high rate of cancer in this zone.
Another conclusion which can be made of these plans but has no clear connection to cancer issue is, as the economic condition is not desirable and satisfactory, the industries are not profitable, so can not give proper services to workers. Sub plans shows high rate of cancer epidemy in industrial and commercial zones. We do not have technological industry so no technician or expert worker is needed, thus the rate of salary is low. This is another useful function of the plans of cancer transmittal which has been combined to the residential and non residential usage.
The explained algorithm in this article has been submitted to Iran University of Medical Sciences Research Section and they used it to analyze the epidemic disease of Fibroma. The experts of The Office of Codifying and Geography and Iran University of Medical Sciences Research Section had a session and decided the informatics unit of The Office of Codifying chose 2500 telephone numbers from each zone according to aggregation of residential usage and render these numbers to Iran University of Medical Sciences Research Section . For example, from some postal zones 5 numbers has been chosen, from the others 1 to 3 telephone numbers and even there were zones which no number has been chosen from, because of the majority of nonresidential usage of those zones. Finally a number of doctors who work in the center make contact to these telephone numbers and checked the information with the residents and registered new information which had contradictions with The Office of Codifying on specific forms and have received new telephon numbers from the residents. Now they are analyzing the statistics and waiting for results.
Zip codes are obtainable from many registry documents and urban services bills so we can use it in different fields. The author strongly advises to use this procedure because it has positive results in the field of transmittal of cancer information. These are some of the suggestions:
1- Considering the compatibility of severance of residential and nonresidential usage, utilizing the method in the field of crisis management EOC GIS, enable us to reach the precise estimation of probable victims of natural plagues in each zone. Also considering the exact number of existent buildings, we have the approximate amount of collapse and have the ability to manage the required machineries. Also considering the registration of zip codes in the bank, the national codes of people who need second aids due to the plagues are available.
2- In the fields of education, considering the registration of zip codes on national certification cards, we can get to a clear image of the number and sex of the people who are under coverage of education system in each zone and then we can manage the cases.
3- In the field of permanent development, considering the registration of these codes in water – electricity – telephone – gas bills, registry documents of automobiles and visas, we can interpret the development and as a result, deliberate the income distribution level in each zone. We can also use this information in sociology and economy. During last two years, some sessions were arranged and two experts of UNDP (United Nation development) Mr. Farzin and Mr. Heydar Nadim as the attendees were attracted to this method especially the issue of connection of this code and the registry number of automobiles which plays an important role in the case of family economy but as the decisions about new drafts are practically made in the UN center, this proposal had no final result.
4- This method has been submitted to UNAIDS (United Nations AIDS) and the experts of that center found it interesting and useful but for the same reason, it has no result. We rendered the method to UNICEF and WHO as well, but still the result was nothing.
5- In the field of traffic, considering the number of automobiles in each zone and aggregation of administrative – educational – commercial (nonresidential) centers in zones which indicate the path of urban trips, we can have a precise image of traffic in different hours of day and night which can be analyzed and utilized for traffic management.
6- In the field of security, registration of crime locations and victims and criminals habitats can be useful for violence probability occurrence, featuring crime prediction and police patrol management. For instance, we can insert the annual information to the plans and obtain a general image of different kind of crimes probability (murder, street fights ,banditry ) occurrence in each zone, and in this way we can send more preventive patrols to risky zones and make the number of patrols in non risky zones less. And as a result it is a good criterion in police management. A mathematical model which is a combination of parameters like number of cars and selling and buying of automobiles in each city or town, bank transaction ... can be submitted and this model enable us to obtain a connection between coefficient of correlation of crime occurrence and these parameters which are among the most important economic and social indexes, then we can update the model, according to this procedure.
7- Another advantage of this method is obtaining information from different social classes with the procedure of self clarification by short message service, because the connection network of the country with 35 million subscribers covers 90 percent of the population of the country has too many advantages toward the internet which has 15 million subscribers and covers 60 percent, so has a low penetration coefficient. Meanwhile the expense of each internet connection is 1 million riyals while we can connect to mobile network only with 350 thousands riyals.
As you can see, health function of is one of the secondary usage of this method and the most important function is in the field of top level politic management of the country. For instance, observing the amount of car and estate trading – health and medical services – bank interactions – going in to and out from the country and etc, enable us to have clear image of current events all over the country and with a mathematical model we can made too many different conclusions. We can get to various coefficients of correlation as well to chase the changing of each one of these elements (most important economic criteria) to estimate the rate of distribution of wealth and level of security, health and education with no need of direct analysis of each one of these elements separately.
References
1- Geology Organization Of The Country, Earth Science Management
2- Shahid Beheshti University, Hygiene Department
3- Cancer Research Of Iran Institute Of
4- Collection of articles Of Epidemiology Conference – Shahrood University – 1389
5- Society Of Epidemiologists Of Iran
6- World Hygiene Organization
7- Accessory of Geography and Codifying Of The Country
8- Universal Postal Union
9- Khaje Nasir'o'din Toosi University, Geomatic Department
10- Wikipedia
11- Environmental Systems Research Institute(Esri): the GIS software leader

۱۳۸۹ آبان ۸, شنبه

بررسی اپیدمی سرطان های شایع در استان تهران با استفاده از سیستم اطلاعاتی جغرافیائی

مقدمه
از آنجائیکه اینجانب اعلام امادگی نمودم تا به انجام خدمات GIS (Geographical Information System) (سیستم مدیریت اطلاعات) جغرافیائی بطور داوطلبانه برای انجمن حمایت از کودکان سرطانی بپردازم؛ مرکز تحقیقات سرطان کشور( انستیتو کانسر) به سرپرستی جناب آقای دکتر موسوی جراحی اعلام نیاز نمودند. به اين ترتيب نويسنده از پنج سال پيش تا كنون مشغول به همکاری داوطلبانه با این مرکز در خصوص بررسی اپیدمی سرطان های شایع در استان تهران با استفاده از سیستم اطلاعاتی جغرافیائی می باشم.
به طور کلی سامانهٔ اطلاعات مکانی یا سیستم اطلاعات جغرافیایی Information Systems Geographic یا GIS همانطور که از اسم آن بر می آید در وهله اول یک سیستم است که مجموعه اطلاعات هر نقطه و محدوده جغرافیایی را تدوین و تحلیل می نماید. اين سیستم، يك سيستم کامپیوتری برای مدیریت و تجزیه و تحلیل اطلاعات مکانی است که قابلیت جمع‌آوری، ذخیره، تجزیه و تحلیل و نمایش اطلاعات جغرافیایی (مکانی) را دارد.
هدف نهایی یک سیستم اطلاعات جغرافیایی، پشتیبانی جهت تصمیم‌گیری‌های پایه‌گذاری‌شده بر اساس داده‌های مکانی می‌باشد و عملکرد اساسی آن بدست آوردن اطلاعاتی است که از ترکیب لایه‌های متفاوت داده‌ها با روش‌های مختلف و با دیدگاه‌های گوناگون بدست می‌آیند.
در خصوص واژه ي همه‌گیرشناسی یا اِپیدمیولوژی (epidemiology)،‌منظور مطالعه ي نحوه انتشار بیماریها و عوامل بیمای‌زا یا هر عاملی که به سلامت مربوط باشد، است. این اصطلاح ابتدا به مفهوم «علم بررسی همه‌گیری بیماریهای عفونی» به کار برده شد، ولی امروزه با پیشرفت تمام علوم و از جمله علم پزشکی و کنترل بسیاری از همه‌گیری‌ها دامنه آن وسعت بیشتری پیدا کرده، به مفهوم «علم بررسی انتشار و علل بیماری‌ها» تلقی می‌گردد. از نظر لغوی کلمه Epi به معنی روی، کلمه Demos به معنی مردم و کلمه Logus به معنی بررسی و شناخت بوده، که معنی لغوی این اصطلاح عبارت است از «شناخت آنچه بر مردم می‌گذرد» و اگرچه وضعیت بهداشت و پزشکی جامعه مدنظر باشد، ولی با اقتصاد، جامعه‌شناسی، فرهنگ، مذهب و... ارتباط بسیار نزدیکی دارد، چراکه در پزشکی بالینی به مفهوم مطب‌داری آن بیشتر خود فرد و بیماری او مدنظر است اما در همه‌گیرشناسی، بیشتر توجه به گروه و جامعه است و همه‌گیرشناسی بالینی به هردو جنبه توجه دارد.
روش ذكر شده در اين تحقيق، بنا به گفته جناب آقای مهندس باستانی سرپرست آن زمان اداره ي کد گذاری در ایران، برای اولین بار مورد استفاده قرار گرفته و در سایر کشورها نیز علی رغم جستجو در اینترنت مورد مشابهی نداشته، زیرا اولا این سیستم کد دهی در کشورهای توسعه یافته به کار می رود و از آنجا که اکثر آنها قریب به 200 سال از صنعتی شدنشان می گذرد نقشه های شهر جغرافیائی و توصیفی را در همان سالها تهیه و استفاده نموده اند. همچنین به علت توسعه یافتگی مشکلاتی از این دست به خصوص اپیدمیک شدن يك بیماری خاص، در آنها رواج ندارد تا این نوع مطالعات و سایر موارد که در ادامه ذکر می گردد، برای آنها معضل محسوب شود تا تحقیقات مرتبط موضوعیت يابد. تنها یک مورد در دانشگاه آکسفورد به صورت پیشنهاد برای تحقیق در خصوص health gis بر اساس کد پستی در اینترنت منتشر گردیده. در آن مقاله به همین روش اشاره شده بود و توصیه گشته بود که میتوان از این روش برای مدیریت سلامت نیز استفاده نمود ولی نگارنده بیشتر از این وارد بحث نگردیده بود زیرا کلیت مقاله مربوط به بحث سلامت بود كه در آدرس زير قابل رؤيت است:
http://minority-health.pitt.edu/archive/00000417/01/Place,_Space,_and_Health-_GIS_and_Epidemiology.pdf
همچنین بعد از 1 ماه این مورد که شباهت بیشتری به این روش دارد در مجله international journal of health geographics مشاهده شد که مربوط به مکان یابی بیماران قلبی در شهر کلگری کانادا در سال 2003 بر اساس کد پستی برای پراکنش بیماری در شهر بوده پیدا شد که در آدرس اینترنتی زیر قابل مشاهده میباشد
http://www.ij-healthgeographics.com/content/3/1/5

مواد و روش ها
در ابتدا مهم ترین آیتم، متدولوژی طرح برای پوشش خواسته های انستیتو کانسر بر مبنای اطلاعات موجود بوده است. به طور کلی سیستم جمع اوری اطلاعات در مرکز تحقیقات سرطان کشور بر مبنای اطلاعات موجود در پرونده بیمار در بیمارستانها و مراکز درمانی بوده که بعدا توسط پرسنل مرکز یا دانشجویان جمع آوری و در فرمی مخصوص ضبط میگردد که یکی از بندهای آن آدرس فرد بیمار میباشد. همین امر دارای چند اشکال است: یکی دقیق اظهار نکردن آدرس توسط بیمار یا همراهان وی است. به طور کلی استاندارد آدرس پستی سه قسمتی است که شامل معبر آخر- معبر ماقبل آخر و محله میباشد که به علت نا آشنائی عمومی با این استاندارد کسی آن را رعایت نمیکند. اشکال بعدی احتمال ارائه آدرسی غیر از محل سکونت فرد بیمار است به خصوص برای بیماران شهرستانی و در نهایت عدم درخواست آدرس محل کار بیمار زیرا به طور متوسط هر فرد شاغل نصف روز یا کمتر در منزل به سر می برد و ممکن است وقوع سرطان به محل کار او مرتبط باشد نه محل زندگی. در اين رابطه در فرم موسسه سرطان هیچ آیتمی راجع به محل کار وجود نداشت. همگي این مشكلات و موارد به مرکزتحقيقات سرطان كشور اعلام گردید ولی به علت آن که آن مرکز قدرت اجرائی در این خصوص برای ابلاغ روش های جدید در اخذ اطلاعات از بیماران را به بیمارستان ها و مراکز درمانی نداشته و ندارد، همین اطلاعات موجود معتبر فرض گردید.
به همین منظور در 2 سال اول روش های امکان پذیر براي تهيه ي يک نقشه پراکنش بیماری از روي اين آدرس ها و مشخص نمودن جمعیت ساکن مورد تحقیق قرار گرفت. از جمله مراجعه به مرکز اطلاعات جغرافیائی شهر تهران و تشکیل جلسات متعدد با کارشناسان آن دفتر که با حمایت های ریاست آن مرکز جناب آقای مهندس معینی برگزار و از اطلاعات گرد آوری شده آن مرکز اطلاع حاصل گردید . با وجودي كه مهم ترین فاکتور برای کارشناس محترم (مركز تحقيقات سرطان) انستیتو کانسر، میزان افراد ساکن در هر محدوده بود، اطلاعات موجود در مرکز اطلاعات جغرافیائی شهر تهران هیچ کدام دسترسی به آمار نفوس و مسکن آنها را در کشور فراهم نمی نمود. لازم به ذکر است مطالعات گوناگون و متنوعی در حوزه اپیدمیولوژی توسط مرکز تحقیقات سرطان کشور و سایر مراکز انجام گرفته و می گیرد، ولی به همان علتی که در بالا ذکر گردید هیچ کدام توانائی تعیین درصد عارضه و بیماری را ندارند و به همین منظور در حوزه اپیدمیولوژی فاقد اعتبار بوده اند، گرچه زحمات زیادی برای تهیه آنها کشیده شده است که در بخش بعدی به همراه نقشه تفاوت آنها توضیح داده میشود
خصوصيات كد پستي
متولی اطلاعات مربوط به ساكنين در هر محدوده، مرکز آمار کشور است لذا به آنها مراجعه گرديد؛ متاسفانه آنها نقشه ای از پراکنش اطلاعات گرد آوری شده نداشتند. از این رو بعد از تحقیقات در خصوص کد پستی با توجه به کد گذاری پستی کل کشور؛ با اداره پست تماس گرفته شد و به دفتر مربوطه به نام اداره ي کد گذاری و جغرافیائی پست کشور راهنمائی شدیم؛ و پس از آن با درخواست تشکیل جلسه به دفتر یکی از اعضای هیئت مدیره ي وزارت پست و تلگراف و تلفن؛ جناب آقای مهندس حسین آبادی به همراه جناب آقای مهندس باستانی؛ هدایت شديم. نتيجه ي اين تلاش توضيح كامل خصوصیات کد پستی به همراه ارائه ي مستندات تهیه شده بود که به طور خلاصه به شرح زير است:
کل کشور به 8 مرکز پستی تقسیم گردیده است. عدد 2 به علت شباهت به 3 به کار گرفته نمی شود و همین طور عدد صفر به علت رسم الخط آن به صورت نقطه، در کدها بکار نمی رود. تمام ارقام کد پستی هر کدام یک مفهوم خاص را می رساند. به عنوان مثال تمام کد های شهر تهران با عدد 1 شروع می شود و استان خراسان با عدد 5 و حاشیه شهر تهران با عدد3، همانطور كه گفته شد شهر تهران به 8 منطقه تقسیم گردیده است شامل : مناطق پستی 11 تا 19 به جز 12. هرچه معابر از اصلی به فرعی می رود کدها ریز تر می شوند:
1- تمامی سطح کشور از 35 سال پیش توسط یک پیمانکار بلژیکی مورد کد گذاری قرار گرفته است.
2- تمام عوارض دست ساز بشر یک کد پستی ده رقمی دریافت می کنند حتی باجه های تلفن.
3- کدها دارای یک الگورتیم پیشرفته بوده و هر عدد معرف یک خصیصه می باشد.
4- سطح کشور را به حدود 11000 محدوده ي پستی که در اصطلاح فنی پست؛ گشت پستی می نامند، تقسیم نموده اند.
5- تا کنون در حدود 22 میلیون کد پستی ده رقمی صادر گردیده که 16 میلیون آن مسکونی بوده و حدود 2 میلیون واحد آن خالی از سکنه می باشد (آمار بر اساس اطلاعات تا سال 1385).
6- نحوه ي تقسیم این محدوده ها در داخل شهرها بر اساس تراکم جمعیت و مساحت بوده و در سایر نقاط بر اساس جاده های ارتباطی و عوارض طبیعی می باشد.
7- حدود محدوده ها در شهرها معابر و خیابان ها می باشد به نحوی که هیچ واحد مسکونی در داخل دو محدوده قرار نمی گیرد. این الگورتیم در مورد تمام محدوده های کشور صدق می کند
8- سطح مناطق 22 گانه ي شهر تهران با حدود 1900 محدوده پوشش داده شده است
9- 6 رقم اول کد پستی ده رقمی مربوط به اطلاعات جغرافیائی می باشد
10- کد پستی تحت هیچ شرایطی تغییر نکرده و نمی کند
11- هر رکورد اطلاعات کد پستی ده رقمی شامل 29 فیلد اطلاعاتی توصیفی می باشد از قبیل نوع کاربری (مسکونی – اداری- دولتی – اموزشی- تجاری ( به تفکیک 70 صنف) و شماره تلفن ثابت؛ نام مالک و ...
12- این اطلاعات به طور پیوسته در حال به روز رسانی می باشند بدین منوال که دو هزار نفر در سطح کشور و 200 نفر در سطح شهر تهران هر روز بصورت پیاده مسیر های برنامه ریزی شده ای را طی تغییرات کاربری ها و نوسازی بناها ثبت می نمایند این برنامه ریزی به نحوی است که هر ساله تمام مسیرها بازبینی می شود. این افراد هیچ ارتباطی با ساکنان منازل برقرار نمی نمایند بلکه خود شرایط موجود ملک را بررسی و ثبت می كنند.
با توجه به تفکیک اطلاعات کاربری مسکونی در هر محدوده، استفاده از کد پستی به عنوان بهترین روش برای مطالعات اپیدمیولوژی مورد تایید کارشناسان وزارت بهداشت و درمان و آموزش پزشکی قرار گرفت. زیرا با توجه به تعداد کد های پستی ده رقمی که کاربری مسکونی دارند، در هر محدوده ي شهری یا روستائی با توجه به ضریب خانوار که مرکز آمار ایران منتشر نموده، افراد ساکن در هر محدوده قابل محاسبه می باشد؛ برای مثال این عدد در شهر تهران برابر 1/4 می باشد.همچنین از این سیستم می توان معتبرترین تخمین های نفوس و مسکن را استنتاج نمود زیرا در نحوه ي آمار برداری اطلاعات بر خلاف مرکز آمار ایران واداره ثبت احوال هیچ سند و مدرکی دال بر اصالت شخص یا ملک طلب نمی گردد و فقط اصالت وجود ملک و هر نوع ساخته ي بشری ملاک عمل کار آنها می باشد.
با کمک جناب آقای مهندس باستانی اینجانب به مسئول انفورماتیک اداره ثبت احوال کشور سرکار خانم مهندس کاظمی معرفی شدم و ایشان نیز توضیحاتی در خصوص درج کد پستی در کارت ملی اظهار نمودند و مشخص گردید کدهای پستی از طریق خود اظهاری متقاضی درج می گردد و با بانک اطلاعاتی اداره کد گذاری صحت گذاری نمی شود. تا کنون تمهیدی در خصوص ثبت مجدد تغییر محل سکونت که منتج به تغییر کد پستی ده رقمی مندرج در کارت ملی می باشد اندیشیده نشده است.
در نهایت با توجه به اینکه نقشه های پستی اکثر نقاط کشور تا 5 رقم اول کد پستی تهیه شده، این نقشه ها به عنوان نقشه پایه در نظر گرفته شد لازم به ذکر است که میتوان بعدا نقشه ها را براساس کد 10 رقمی تهیه و استفاده نمود ولی از انجا که این میزان دقت موضوعیتی در این نوع مطالعات ندارد برای همین نقشه ها تا 5 رقم انتخاب گردید
به پیوست یک نمونه از نقشه های تهیه شده توسط اداره کد گذاری ارائه می گردد (شكل 1).
رقومی نمودن نقشه های شهر تهران
(اصطلاح جی ای اس کردن نقشه ها بدين معني كه نقشه فقط یک نقاشی نيست و اطلاعات هم به آن ضميمه شده است.)
در نهایت نويسنده، شروع به رقومی نمودن 18 شیت از نقشه های کاغذی دریافتی از اداره کد گذاری مربوط به شهر تهران نمود. در ادامه با کمکهای سرکار خانم مهندس توکلی به صورت داوطلبانه کار رقومی نمودن نقشه های شهر تهران در سال 1386 به پایان رسید.
روش کار به این صورت بود که در ابتدا نقشه های کاغذی دریافتی اسکن گردید و سپس در نرم افزار Autocad حدود محدوده ها و کد آنها رسم شد. در نهایت 18 شیت به هم دیگر متصل و به ابعاد واقعی با کمک عکس های ماهواره ای تبدیل و بر همین مبنا به مختصات اصلی منتقل گردید که در نهایت، دقت نقشه 70 متر خطا در 11 کیلومتر به صورت قطری بود که در حد قابل قبولی قرار داشت (شكل 3) و سپس تمام نقشه های هر مرکز پستی بصورت جداگانه پلات گردید و به مراکز مربوطه ارسال شد تا اقدام به تصحیح کدها و حدود نا مشخص نمایند. در نهایت نقشه ها با تایید آن اداره نهائی گردید. در شکل (شكل 2) نقشه ي نهائی درج گردیده است .
همچنین در سال 1387 با عنایت جناب آقای نصیری مدیریت اداره کد گذاری و جغرافیائی و همکاری جناب آقای مهندس جوادی تمام نقشه ها و کروکی هاي استان تهران به صورت کاغذی در اختیار انستیتو کانسر قرار گرفت که همین سیستم برای کل استان پیاده سازی گردد ولی از آنجا که اکثر نقشه ها به صورت کروکی بوده و عوارض جغرافیائی مشخصی روی آنها درج نگردیده بود و مقیاس بعضی از آنها یک به دوهزار بود که ابعاد خیلی بزرگی در حد نقشه های چند متری را شامل می شد، از این رو فقط به تعداد 8 شیت نقشه از محدوده های کرج و دماوند قابل استفاده بودند که نقشه های کرج در سال 1388 به اتمام رسید و نقشه های فیروزکوه و دماوند در سال 1389 (شكل 4).
برای سایر نقاط ایران، اگرچه از حوزه ي کاری انستیتو کانسر خارج بود، ولی نقشه ي مدونی تهیه نگردیده و فقط بعضی از استان ها به صورت مستقل اقدام به تهیه نقشه های با فرمت های دلخواه خود نموده اند از جمله نقشه های کاداستر قزوین در برنامه مخصوص نقشه برداری Micro Station و نقشه های Autocad شهر تبریز .نقشه ي روبرو نقشه ي جانمائی محدوده های پستی بر روی نقشه تهران می باشد که جهت تعیین میزان خطا تهیه گردید.
از مزایای منحصر به فرد این روش مي توان به موارد زير اشاره نمود:
1) انطباق کامل آن با سایر نقشه ها و اطلاعات موجود در سطح کشور به صورتي كه می توان تمام نقشه های جغرافیائی کشور را بر روی آن جانمائی نمود که در اصطلاح GIS آنرا Overlay می نامند. برای نمونه نقشه ي قوم شناسی ایران درج گردیده است. همین طور می توان نقشه ي نقاط نصب آنتن های تلفن همراه و خطوط انتقال برق محل استقرار پمپ بنزین ها و .... را بر روی این سیستم پیاده سازی نمود.
2) عدم تغییر کدها
3) درج تغییرات توصیفی در بانک اطلاعاتی اداره ي کد گذاری و جغرافیائی کشور
4) کد دهی به تمام آدرس ها؛ حتی آدرس های ناقص و اشتباه؛ که این خصیصه در اهداف انستیتو نقش مهمی بازی می کند زیرا هیچ رکورد اطلاعاتی به علت نقص آدرس حذف نمی گردد. همان طور که توضیح داده شد تمام آدرس های شهر تهران با عدد 1 شروع می شود پس تمام اطلاعات موجود در بانک اطلاعاتی انستیتو کانسر با عدد 1 شروع می شوند و هر چه آدرس گویا تر باشد می توان کدهای بیشتری به آن نسبت داد تا به 5 رقم برسد. به عنوان مثال هر چه در آدرس اسامی خیابان ها با الگوریتم پست هماهنگ تر باشد و توالی آنها رعایت شده باشد می توان به تعداد ارقام کد افزود، مثلا خیابان رودکی نامی در منطثه پستی 17 جای دارد پس رکورد ما در وهله ي اول کد 17 را به خود اختصاص می دهد؛ خیابان رودکی در تقاطع 7 محدوده ي پستی است که تمام آنها با 175 شروع می شوند پس رکورد ما عدد 175 هم به کد مربوطه اضافه می کند، حال معبر دیگری به نام خیابان اسفند در رکورد اطلاعاتی ما جای دارد که در مرز سه محدوده قرار دارد به نام های 17569و 17568 و 17567 که همگی با عدد 6 شروع می شوند پس رکورد ما عدد 6 هم به کد مربوطه اضافه مي نمايد و به 1756 تبدیل می گردد، در رکورد اطلاعاتی مربوطه کلمه ي دیگری درج نگردیده پس در همین حد 4 رقم بیشتر گویا نمی شود و در نهایت به هر کدام از این سه محدوده 17569و 17568و17567 یک سوم را نسبت می دهیم؛ اگر رکوردی اصلا آدرس نداشت از آنجا که همگی رکوردها متعلق به شهر تهران می باشد می توان کسر 1 به 1900 (تعداد کل محدوده های شهر تهران) را به هر محدوده نسبت داد تا از لحاظ آماری رکوردی از محاسبات حذف نگردد.
روش های متنوع گویا سازی اطلاعات موجود
بر همین مبنا روش های متنوع گویا سازی اطلاعات موجود که بالغ بر 700 هزار (شامل 500 هزار رکورد از متوفیان مدفون در بهشت زهرای تهران به علت ابتلاء به انواع سرطان و 200 هزار رکورد از بیماران تحت درمان ) رکورد اطلاعاتی است در نرم افزارهای مختلف از جمله Auto cad, Ilwis, Edrisi, arcview, arcGis مورد بررسی و امتحان قرار گرفت.
این روش ها شامل بازخوانی اطلاعات توسط اپراتور و گویا سازی چشمی و دستی آنها بر روی نقشه های پستی و جغرافیائی شهر تهران بر روی نرم افزارهای ذکر شده است. نرم افزار Autocad به علت آنکه امکان تعریف اطلاعات توصیفی را برای نقاط ندارد راه حل مناسبی به نظر نرسید، نرم افزار ArcGIS و Arcview که از مهم ترین نرم افزارهای سیستم اطلاعات رسانی جغرافیائی (GIS) می باشد توانائی تحلیل های گوناگون و متنوع را دارد ولی کار با آن در حد اپراتور نمی باشد از این رو بر روی دو نرم افزار Edrisi و Ilwis که هر دو نرم افزارهای مخصوص هیدرولوژی بوده و کار با آنها راحت تر است مورد نظر قرار گرفت. همچنین از اداره ي محترم جغرافیائی و کد گذاری پست کشور و با همکاری جناب آقای مهندس جوادی و شاه محمدی؛ یکی از نرم افزارهای داخلی آن اداره که به نام کد یابی پستی بود در اختیار گذاشته شد که با ورود سه قسمت آدرس (محله- معبر ماقبل آخر – معبر آخر) کد پستی 5 رقمی آدرس مربوطه را ارائه می کند. همچنین با داشتن فقط یک کلمه از آدرس، به خصوص معبر آخر، برنامه تمام کد های احتمالی با آدرس کامل را نمایش مي دهد که توسط اپراتور، کد آدرس نزدیک تر استخراج می گردد. در این مرحله سرکار خانم مهندس تبیانیان به صورت داوطلبانه برای حدود 2000 رکورد در طول 4 ماه اقدام به گویا سازی نمودند. ولی از آنجا که انستیتو کانسر یک مرکز دولتی است؛ اپراتوری برای این کار در دسترس نبود.
در انتها با توجه به حجم زیاد اطلاعات و عدم امکان کد دهی دستی توسط اپراتور اینجانب اقدام به برنامه نویسی جهت کد دهی به آدرسهاي موجود در محیط نرم افزاری foxpro نمود که نتایج خوبی برای 23000 رکورد انتخابی در پی داشت به نحوی که 52 درصد آدرس ها تا 5 رقم کد دریافت نمودند؛ 41 درصد تا 4 رقم و 6.3 درصد تا 3 رقم و 0.7 درصد هم کد دریافت ننموده اند.
الگوریتم برنامه
الگوریتم برنامه به این صورت تدوین گردید:
از آنجا که فیلد آدرس در رکوردهای بانک اطلاعاتی انستیتو کانسر به صورت رشته ای تدوین و تکمیل گردیده است امکان تفکیک آدرس ها وجود نداشت از این رو ملاک عمل، فایل اطلاعاتی برنامه ي کد یاب اداره ي کد گذاری قرار داده شد. اين برنامه در ابتدا یک رکورد از این فایل را مي خواند و تمام آدرسهای بانک اطلاعاتی بیماران سرطانی را برای این آدرس جستجو می نماید. از آنجا که در فایل اداره ي کد گذاری سه فیلد معبر آخر- معبر ماقبل آخر و محله به صورت جداگانه تدوین گردیده اند، برنامه در ابتدا سعی می کند هر سه فیلد را با بانک اطلاعات بیماران سرطانی مطابقت دهد تا کد 5 رقمی مربوطه را به آدرس آن بیمار نسبت دهد؛ در وهله ي بعدی اگر دو فیلد در یک رکورد اطلاعاتی بانک بیماران سرطانی مطابقت داشت؛ 5 رقم کد پستی را به آدرس آن بیمار نسبت می دهد. و در نهایت تمام رکوردهائی که کد دریافت نموده اند به صورت مجازی حذف می گردند تا از گردونه ي مقایسه خارج شوند. در این مرحله بانک اطلاعاتی اداره ي کد گذاری ملاک عمل بوده و رکورد به رکورد آن با بانک اطلاعات بیماران سرطانی مقایسه و تعیین تکلیف می گردد.
در این مرحله یک بانک اطلاعاتی حد واسط تولید و تدوین شده است. در ابتدا بر اساس محتوای فیلد معبر آخر بانک اطلاعاتی اداره ي کد گذاری، تمام آدرس های باقی مانده مقایسه می شوند و 4 رقم اول کد پستی پنج رقمی به آن نسبت داده مي شود و در بانک اطلاعاتی حد واسط ثبت می گردد. سپس بر مبانی محتوای فیلدهای معبر ماقبل آخر و محله نیز مقایسه صورت می گیرد و به ازاء هر مطابقت یک رکورد در بانک اطلاعاتی حد واسط به همراه 4 رقم اول کد پستی پنج رقمی ثبت و در نهایت تعداد کدهای 4 رقمی مطابقت داده شده، به تفکیک شمارش مي شود و بیشترین تعداد به عنوان گزینه ي نهائی انتخاب و در بانک اطلاعاتی بیماران سرطانی منظور می گردد. البته اگر تعداد یافت شده از عدد 10 کمتر بود فقط 3 رقم اول نسبت داده می شود. همچنین الگوریتم های دیگری نیز در این میان مورد استفاده قرار گرفت ولی این الگوریتم از بقیه منطقی تر به نظر می رسد ضمنا بيان این نکته ضروریست كه این نوع الگوریتم بر خلاف سایر بانک های اطلاعاتی به خصوص بانک های اطلاعاتی مالی، دارای خروجی قطعی (static out crop) نمی باشد و برنامه نزدیک ترین گزینه را جستجو می نماید که در اصطلاح به آن (Dynamic out crop) می گويند.
این برنامه برای مقایسه و آدرس دهی به اطلاعات نمونه به حدود 96 ساعت زمان احتیاج داشت که ناشی از آدرس های غیر استاندارد اظهار شده توسط بیمار یا همراهان وی بوده است. از آنجا که یکی از اهداف انستیتو کانسر برای این آدرس یابی امکان فراهم آوری این سیستم بصورت آن لاین بود، نوينسده با فراهم آوری یک Ip معتبر در اینترنت؛ برنامه را به نحوی برنامه ریزی نمود که هر فردی با داشتن کلمه ي عبور و کد شناسه به کامپیوتر مورد نظر وصل گردد و فایل آدرس های خود را که به فرمت متن، ذخیره کرده بر روی یک پوشه از پیش تعریف شده بار گذاری نمود. برنامه به صورت اتوماتیک شروع به کار کرده و در نهایت خروجی را نیز بر روی پوشه مشخصی قرار می دهد. ولی این زمان (96 ساعت) مطابق نیازهای آنها نبود به همين دليل جناب آقای مهندس محمدی از طرف انستیو کانسر ماموریت یافت این الگوریتم را در محیط های برنامه نویسی دیگری آماده نماید ولی متاسفانه به علت عدم آشنائی ایشان با سیستم های Dynamic out crop نتیجه ای در پی نداشت.
همچنین به کارشناس محترم انفورماتیک انستیتو کانسر جناب آقای مهندس گل ماهی توضیح داده شد فایلهائی که در اختیار اینجانب یا هر ارگان و سازمان دیگری می گذارید فاقد نام بیمار و اطلاعات شخصی فرد باشد زیرا از لحاظ امنیت اطلاعات کار درستی نمی باشد. به اين ترتيب فایل دریافتی از آن مرکز فقط شامل کد شناسائی در بانک اطلاعاتی و آدرس مندرج در فرم است.
با ابلاغ عمومی کد پستی، به نوعی مختصات جغرافیائی هر نقطه به افراد ساکن در آن ارائه گردیده است. اين رويكرد کاربردهای متنوع و بدیعی دارد که در ادامه ذکر می گردد.
علاوه بر اين بر مبنای کد پستی ده رقمی، اطلاعات متنوعی تولید میگردد که در ذیل تعدادی از آنها درج میشود:
- میزان مصرف آب – برق – گاز – تلفن که در هر دوره به صورت کاملا دقیق تهیه و به افراد ابلاغ میگردد این قبوض از انجاکه دارای بار مالی میباشند به طور خیلی دقیقی تهیه میگردند
- ثبت در اداره شماره گذاری نیروی انتظامی برای پلاک انواع خوردو که یک بانک اطلاعاتی ذیقمتی محسوب میگردد
- ثبت در اداره گذرنامه نیروی انتطامی
- اداره ثبت احوال
- حسابهای بانکی
این مجموعه اطلاعات که به طور مرتب تهیه و به روز میگردند، توانمندی فوق العاده ای به وجود می آورند که در بخش بعدی به اختصار توضیح داده خواهد شد.
نتايج
در نهایت، خروجی تحقیق یک سری نقشه و شکل بوده است که اين اولین خروجی ها براي نقشه های تهیه شده بر مبنای اطلاعات داده شده در اين قسمت درج می گردد.
در شکل شماره 5 همانطور که مشخص است، پراکندگی موارد بروز سرطان برای یک قسمت از بانک اطلاعاتی موجود مشخص گردیده. در این نقشه فقط تعداد کلی بیماری در هر محدوده، گویا گردیده است.
در شکل شماره 6 میزان پراکندگی سرطان با کمک نرم افزار Arc view ترکیب گردیده که توسط علامت فلش مکان هائی که تراکم بیشتری دارند مشخص گردیده این پراکندگی فقط بر اساس تعداد بیماری تدوین شده ولی در شکل شماره 7 این پراکندگی بر اساس درصد جمعیت ترکیب گردیده است و همانطور که ملاحظه می شود نقاط دیگری به عنوان کانون سرطان تعیین شده که که تفاوت نفاط با فلش های سیاه مشخص شده و در مرکز شهر نقطه کانونی دیده نمیشود .در بخش پیش اشاره گردید چرا سایر روشها ارزش اپیدمیولوژیک نداشته اند زیرا توانائی تعیین درصد در هر نقطه را ندارند اگر شکل شماره 6 میزان کار یک اپیدمیولوژیست قرار گیرد وی مجبور به تحقیق در رابطه با کانون های سرطان در شمال شهر و جنوب شهر توامان خواهد بود، ولی وفتی بر مبنای شکل 7 کار نماید این کانون ها در نقاط دیگری قرار گرفته و مطالعات را دچار اعتشاش نمی نماید .
همچنین همانطور که قبلا ذکر شد، میتوان لایه اطلاعات پراکنش تعداد خودرو را بر روی این نقشه درج نمود تا به عنوان یکی از مهمترین شاخص های دارائی هر خانواده به نتایجی در خصوص رابطه سطح در آمد و سرطان دست یافت، همچنین میزان مصارف آب- برق – گاز و تلفن را نیز بر روی این نقشه اضافه نمود و به استنتاجات جدیدی دست یافت، ضمنا سایر اطلاعاتی که با کد پستی در ارتباط هستند به طور مستقبم قابل درج بوده و سایر اطلاعات که مختصات جغرافیایی آنها مشخص باشد از طریق نرم افزار هم پوشانی انجام مي دهد.
اطلاعات فوق به صورت کلی از تمام انواع سرطان استنتاج گردیده است.
در شکل شماره 8 که توسط سازمان زمین شناسی کشور با کمک مرکز تحقیقات سرطان کشور قبل از آغاز هم کاری اینجانب تهیه گردیده است، ملاحظه می نمائید که نهایت تفکیک بیماری بر اساس شهرستان های کشور بوده و بعضی از شهرستانها نیز فاقد اطلاعات بوده اند، اگرچه میزان جمعیت در هر شهرستان به کمک مرکز آمار ایران قابل استحصال میباشد، ولی اولا مساحت بعضی از این شهرستانها به هزاران کیلومتر مربع میرسد که محل دقیق بروز بیماری را کاملا مخدوش مینماید و در ثانی فقط اطلاعات جمعیتی در حد شهرستان در اختیار بوده و سایر اطلاعات قابل تطبیق با این نقشه نمیباشند، زیرا در بانک اطلاعاتی آنها نامی از شهرستان برده نمیشود
در شکل شماره 9 یک عارضه سرطانی در سطح شهر تهران با زحمات بسیار زیاد و زمان طولانی رقومی گردیده، ولی همانطور که ملاحظه می نمائید به این نقاط هیچ ماخذ جمعیتی و خدماتی متصل نمیگردد و فقط به صورت منفرد میتواند تحلیل شود که اين، فاقد ارزش اپیدمیولوژیکی است.
بحث
نقشه ها نشان مي دهد كه تراكم اپيدمي سرطان، در مناطق بازار تهران است (قسمت قرمز). بعد از آن قسمت جنوب غربی
تهران دومين تراكم اپيدمي را دارد.
همانطور که از روی نقشه می توان فهمید، بیشترین میزان سرطان در تهران مربوط به محله بازار است. مي دانيم كه تعداد مناطق مسكوني در بازار بسيار کم است پس مي توان علت وجود آدرس هاي بسيار زياد مربوط به بازار در اطلاعات بیماران سرطاني را به محل کار آنها كه در اين مناطق است، نسبت داد. مهم ترین خصوصیت بازار و تجارت در ایران چه چيزي مي تواند باشد؟ استرس. كه مي تواند ناشي از فروش جنس باشد و يا از چک هائی که ارائه گرديده يا گرفته شده است و يا موارد ديگر. در هر صورت دلايل وجود ميزان بالاي سرطان در مناطق بازار نياز به تحقيقات بيشتر و جامع تري از سوي متخصصان سرطان و اپدميولوژي آن دارد و در اين تحقيق تنها به نشاان دادن نرخ بالاي سرطان در مراكز خاص پرداخته شده است.
بعد از بخش بازار،‌قسمت جنوب غربی تهران دومين تراكم اپيدمي را دارد. شايد به اين دليل كه بیشترين مراکز صنعتی تهران در غرب شهر واقع شده است و کارگرانش در همان دور و اطراف ساکن می شوند و به دليل فقر از تغذیه ي خوبی نيز برخوردار نيستند به همين دليل درصد ابتلاء به سرطان بالاتر مي رود.
برداشت دیگري كه مي توان از اين نقشه ها داشت و ارتباط چنداني به بحث سرطان ندارد این است که چون وضعيت اقتصادي در كل مطلوب و مورد رضايت نيست صنایع ما سود ده نیستند پس به کارگرانش هم نمی توانند به خوبي رسيدگي كنند. زير نقشه ها وجود سطوح بالاي اپيدمي سرطان را در مناطق مربوط به كسب و كار و صنعت و بازار نشان مي دهد. از آنجايي كه تیپ صنایع ایران تکنولوژیک نیست که کارگر متخصص بخواهد و هر کسی می تواند كار را انجام بدهد به همين دليل هم سطح دستمزدها بسيار پائین است. اين هم از نتايج مفيد ديگري است كه مي توان از یک نقشه پراکنش سرطان که با کاربری های مسکونی و غیر مسکونی تلفیق شده، به دست آورد.
الگوريتم تشريح شده در اين مقاله، به مرکز جهاد دانشگاهی دانشگاه علوم پزشکی ایران نيز ارائه شد و آنها برای بررسی اپیدمیک بیماری فیبرومیالوژی از آن استفاده نمودند که با تشکیل جلسه با اداره ي کد گذاری و جغرافیائی کشور و حضور کارشناسان هر دو مرکز قرار بر آن شد که واحد انفورماتیک اداره ي کد گذاری با توجه به تراکم کاربری مسکونی در هر محدوده، اقدام به استخراج 2500 شماره تلفن نمايد و با ذکر کد به جهاد دانشگاهی ارائه دهد. به عنوان مثال برای تعدادی از محدوده های پستی، 5 تلفن استخراج گرديد برای بعضی 1 تا 3 تلفن و برای مواردی هم به علت اکثریت کاربری های غیر مسکونی تلفنی استخراج نگردید. در نهایت تعدادی از پزشکان آن مرکز در مدت 8 ماه با تلفن كردن به این شماره ها، ضمن اطمینان از کاربری مسکونی تلفن مورد نظر اقدام به پایش مورد نظر خود نمودند و در فرم های مخصوصی اطلاعات نا همگون با اداره ي کد گذاری ثبت و ارائه و به ازاء آن تلفن های جدید اخذ و در نهایت با پایان یافتن پایش در حال بررسی های آماری و انتشار نتایج آن می باشند.
کد پستی در بسیاری از اسناد ثبتی و قبوض خدمات شهری درج مي گردد، لذا می توان از این روش و طرح در زمینه های متفاوت دیگری استفاده نمود كه نويسنده اين نحوه ي استفاده را با توجه به حصول نتايج مثبت در زمينه ي اطلاعات پراكنش سرطان در سطح شهر تهران قوياً توصيه مي نمايد. از جمله اين موارد پيشنهادي مي توان به موارد زير اشاره نمود:
1- در حوزه ي مدیریت بحران EOC GIS ، با توجه به تفکیک کاربری های مسکونی و غیر مسکونی می توان تخمین بسیار دقیقی از تلفات احتمالی ناشی از بلایای طبیعی در هر محدوده ي جغرافیائی ارائه داد. همچنین با توجه به تعداد کل اماکن و ساختمان های موچود در محدوده، حجم تقریبی آوار ناشی از این بلایا را از قبل در دست داشت و اقدام به مدیریت ماشین آلات مورد نیاز نمود. همچنین با توجه به درج کد پستی در بانک، کد ملی افراد واجد شرایط دریافت کمک های ثانویه ناشي از این بلایا قابل شناسائی است.
2- در حوزه ي آموزش و پرورش، با توجه به درج کد پستی در کارت های کد ملی، می توان ذهنیت دقیقی از تعداد و تنوع جنسیتی افراد تحت پوشش آموزش و پرورش و امکانات موجود در منطقه به دست آورد و نسبت به مدیریت آنها اقدام نمود.
3- در بحث توسعه پایدار، با توجه به درج این کد در قبوض خدمات زیربنائی شهری – آب – برق- تلفن – گاز و اسناد ثبتی خودرو و روادید ورود و خروج از کشور، می توان اقدام به تبیین توسعه یافتگی در هر محدوده نمود و میزان توزیع در آمد در مناطق مختلف را سنجید. همچنین در این مقوله با استفاده از اطلاعات موجود کارهای بسیار زیادی در باب جامعه شناسی و اقتصاد می توان انجام داد که درهمین رابطه در 2 سال پیش جلساتی با کارشناسان محترم دفتر توسعه ي سازمان ملل متحد UNDP جناب آقایان فرزین و حیدر ندیم بر گذار گردید و اين طرح مورد توجه آنها واقع شد، به خصوص بخش ارتباط این کد با پلاک ملی خودروها که در بحث اقتصاد خانواده رل مهمی بازی می کند. ولی از آنجا که تصمیم گیری در خصوص طرح های جدید در مرکز سازمان ملل متحد اخذ می گردد طرح به سرانجامی نرسید.
4- علاوه بر اين این طرح به دفتر ایدز سازمان ملل متحد UNAIDS ارائه گرديد و مورد توجه کارشناس محترم آن دفتر جناب آقای دکتر ستایشی و فیض زاده قرار گرفت ولی آن هم به علت بالا به سرانجامی نرسید، همینطور طرح به دفتر UNICEF و WHO ارائه گردیده است. که نتیجه در پی نداشت.
5- در بحث ترافیک، با توجه به تعداد خودروهای هر محدوده و تراکم مراکز اداری – آموزشی، تجاری (غیر مسکونی ) در هر محدوده، که نشان دهنده ي مبدا و مقصد سفرهای درون شهری است، ذهنیت دقیقی از میزان آمد و شد به محدوده های مختلف در ساعات مختلف شبانه روز به دست مي آيد كه اين به نوبه ي خود قابل بررسي و استفاده به منظور مديريت ترافيك و موارد مربوطه مي باشد.
6- در مقوله ي امنیتی، با درج محل وقوع بزه و محل سکونت قربانی و بزهکار، مي تواند به پهنه بندی وقوع انواع خشونت و پیش بینی های احتمال وقوع جرم و مدیریت گشت های انتظامی اقدام نمود. به عنوان مثال، مي توان با جمع آوری اطلاعات سالانه و تدقیق آن بر روی نقشه، ذهنیت کلی در مورد احتمال وقوع نوع بزه (کیف قاپی- سرقت مسلحانه – قتل و ...) در هر محدوده به دست مي آورد و اقدام به اعزام گشت های پیشگیری به محل های پر خطر نمود و یا از اعزام گشت ها به محل هائی که از لحاظ آماری در آن روز احتمال هیچ نوع بزهی وجود ندارد جلوگیری کرد که خود تاثیر زیادی در نحوه ي مدیریت انتظامی دارد. همچنین با ارائه ي یک مدل ریاضی که ترکیبی از پارامترهای مختلف از قبیل تعداد خودرو و معاملات آن در شهر یا شهرستان – معاملات بانکی و ... است مي توان يك ضریب همبستگی بین وقوع بزه با این پارامترها که از شاخص های مهم اقتصادی اجتماعی است، به دست آورد و بر همین اساس مدل را به روز نمود.
7- از دیگر مزایای این روش دریافت اطلاعات از اقشار مختلف جامعه به روش خود اظهاری توسط شبکه ي پیام کوتاه می باشد. زيرا شبکه ي ارتباطات کشور با 35 میلیون مشترک و پوشش 90 درصدی سطح کشور مزیت بسیاری نسبت به شبکه ي اینترنت با 15 میلیون مشترک و 60 درصد پوشش و ضریب نفوذ پائین دارد. ضمنا هزینه ي ایجاد هر ارتباط اینترنتی حدود 10 میلیون ریال است در حالیکه با 350 هزار ریال می توان به شبکه ي ارتباطات سیار متصل شد.
همانطور که ملاحظه میشود کاربرد این سیستم در بحث سلامت یکی از کاربردهای کاملا فرعی این روش است و مهمترین کاربرد آن، در بعد مدیریت کلان سیاسی کشور،‌است که میتواند اقدام به رصد فعالیت های حیاتی و کلیدی در کشور كند. به عنوان مثال، با رصد حجم معاملات ملکی و اتوموبیل - دریافت خدمات بهداشتی و داروئی- حجم مبادلات بانکی – حجم ورود و خروج از کشور و ....، مي تواند دید دقیقی از اتفاقات روزمره در کشور داشت و به طور کلی برای تمام حوزه های ذکر شده با استفاده ازمدل ریاضی استنتاجات بسیار بسیار متنوعی بدست آورد و ضرایب همبستگی گوناگونی را استنتاج نمود تا با تعقیب تغییرات یکی از این موارد (نقل و انتقال خودرو یا ....) که از موثرترین شاخص های اقتصادی است، میزان توزیع ثروت را سنجید و به تبع آن، سطح امنیت و بهداشت و آموزش را به دست آورد بدون اینکه این موارد را مستفیما مورد بررسی قرار داد.

منابع
سازمان زمین شناسی کشور مدیریت علوم زمین
دانشکده بهداشت دانشگاه شهید بهشتی
مرکز تحقیقات سرطان کشور
مجموعه مقالات کنفرانس اپیدمیولوژی – دانشگاه شاهرود- 1389
انجمن اپیدمیولوژیست های ایران
سازمان بهداشت جهانی
معاونت کد گذاری و جغرافیائی کشور
Universal postal union( اتحادیه پست جهانی)
دانشکده ژئوماتیک دانشگاه خواجه نصیر طوسی
Wikipedia سایت دانشنامه آزاد
Environmental Systems Research Institute(Esri): the GIS software leader

۱۳۸۸ بهمن ۲۲, پنجشنبه

GIS & Postal code

Postal Code system in Iran and advantages of its related database

Each building in Iran has a 10 digit code (Including each man-made structure such as public phone cabins). According to this code, records of 29 different information fields have been created in Iran Geographical and Postal Code Organization including mailing address , building occupancy category (such as residential, commercial, educational, etc.), permanent phone number, owner’s name, dates of updates, etc. Generally the first 6 digits are related to geographical location and the rest are recording information. As a result this system thoroughly complies with geographical specifications and hence we will be able to extract various information such as ecological, mineral and natural resources. At the time being this method of research has been established based on 5 digit code, because plans and postal code maps have been prepared up to this number. Therefore the following information in the field of health studies can be concluded from its database information

Based on the number of building units in each area and their number of residents we can conclude the residency coefficient of each city or region, which by itself is the most important epidemiological parameter regarding percentage of residents in each area. In addition to that, this database is able to distinguish between residential and non-residential areas and it will result to a precise statistical conclusion about people work address without having their mailing address and just by knowing their job category.

After 5 years of research, this method has been recognized as the most effective method of epidemiological studies for the past 2 years. Nonetheless this method has various effective applications in other fields of studies as well. You can view the first GIS map of cancer infection distribution in the city of Tehran in the following post.

In the field of crisis management by knowing the location of crisis we will be able to obtain a reasonable estimate of damages and injuries. For example, Non-residential buildings such as educational buildings normally have high occupancy during working hours and increasing the life of building will prevent injuries and casualties, or in the field of military, high crime areas can be tracked down and we are able to anticipate which areas have higher or lower risk of crime and therefore more number of security patrols will be deployed to those areas with higher crime statistics. In this way we can create optimum management based on in-hand facilities. Also by categorizing events to natural, social or economical parameters we can develop models to predict criminal events.

In the field of sustainable development by combining all acquirable information based on postal code, specifically on health, economy and military issues, a mathematical and scientific model can be created in order to better understanding of development traits and to apply it on macro management system of country.

All other databases, in which postal code is used, are mentioned in the following:

One database is birth registration database in National Organization for Civil registration, by which, sexuality and age of people in each region can be added to statistical results.

The second database is car registration database, which can be one of the most important parameters to predict households’ economical status.

Other database to be mentioned is bills of urban and infrastructure services, which based on their monthly information, an updated mathematical model of region ecological information can be provided.