چکیده:
یکی از مسائلی که سازمانهای تولیدکننده آمار رسمی در انتشار برخی دادهها با آن مواجههاند، محرمانگی دادههای فردی است. این مسئله باعث شده که ریز دادههای مورد نیاز به راحتی در اختیار عموم قرار نگیرند. یکی از راههای حل این مسئله شبیهسازی جمعیت به روش همگذاشتی است که در این مقاله کاربرد آن بررسی میشود. دادههای مورد استفاده، دادههای طرح نیروی کار مرکز آمار ایران فصل تابستان 1397 میباشد. در این مطالعه، ابتدا ریز دادههای جمعیت نیروی کار در سطح ملی به تفکیک استانها تولید میشود و سپس با استفاده از براورد کارایی نسبی مجانبی، دقت برآوردهای حاصل از نمونه گرفته شده از جمعیت واقعی و جمعیت شبیهسازی شده با هم مقایسه میشوند. نتایج این تحقیق نشان میدهد که ضمن تولید ریز دادههای جمعیت نیروی کار در سطح ملی به تفکیک استانها، دقت برآوردهای حاصل از ریزدادههای جمعیت شبیهسازی شده پیشنهادی، بیشتر از برآوردهای حاصل از نمونه گرفته شده از جمعیت واقعی است. همچنین در این مقاله نشان داده میشود که از جمعیت شبیهسازی شده در برآورد پارامترهای نواحی کوچک و جوامعی که حجم نمونه کافی نیست نیز می توان استفاده کرد.
One of the issues that statistical organizations face in disseminating micro data is confidentiality, which has made the data not easily available to the public.One way to solve this problem is Synthetic simulation. In this article we proposed a simulated method, which is called synthetic, generates data with high similarity to the original population while maintaining confidentiality. Thus, estimated parameters are more accurate. The labor force survey (LFS) is one of the important surveys of statistical center of Iran, which provides valuable information about Iran’s LFS situation, specially unemployment rate.In this article, an attempt is made to investigate the application of the synthetic method for simulation target population, using results of the Iran’s LFS, summer 2018, for whole 31 country provinces. Moreover, due to compare the accuracy of Horowitz-Thompson estimates from the simulated population and real population, we have used the asymptotic relative efficiency estimate, which shows that estimation from the synthetic population is more efficient than the estimation obtained from sample of original population. This paper also shows that the proposed method can be used to estimate the parameters of small areas and where the sample size is not sufficient