چکیده:
در پژوهش حاضر، با تحلیل آماری ویژگی های واجی موجود در ٥٤٣٩١ واژة فارسی ، کوشیده ایم تا جنبه هایی از سازوکار نظام آوایی زبان فارسی را با زبان آمار بیان کنیم . جنبه های واجی - آماری موجود در واژگان (ذهنی ) فارسی زبان ها، که در این تحقیق به آن پرداخته ایم ، مواردی مانند الگوی تکیة واژه در زبان فارسی ، هجا و تعداد هجا در واژة فارسی ، واجآرایی واژه های فارسی ، بسامد طبقات طبیعی واجی در کل دادهها، بسامد طبقات طبیعی واجی در درون هجا، واجآرایی خوشه های همخوانی ، هجای بی نشان و بهینه در زبان، فراوانی واجها در زبان فارسی و مسائل مشابه را دربرمی گیرد. در انتخاب واژهها، ابتدا یک پیکرة متنی ده میلیون کلمه ای مورد تجزیة ساختواژی قرار گرفت و در ادامه با حذف صورتکلمه ها و نیز کلمات خارجی فهرست واژهها به دست آمد و سپس این فهرست با فرهنگ معاصر فارسی امروز مقابله شد و مدخل های جدید با بسامد ١ به فهرست واژگان اضافه شد و سپس کل واژهها از نظر اطلاعات واجی فوق مورد تجزیه و تحلیل قرار گرفت . نتایج این تحقیق واجی -آماری از یک سو موید اصول و مفاهیم واجشناختی مانند طبقة طبیعی واجی ، فرایندهای واجی ، ساختمان سلسله مراتبی هجا و غیره است و از طرف دیگر بسامد واج ها و زنجیرههای واجی را بازگو می کند، که در نتیجة آن پیوستار بی نشانی و نشانداری در نظام آوایی زبان مشخص می شود.
This study is an attempt to demonstrate some aspects of Persian phonology through statistical analysis of the phonological features in 54391 Persian lexemes. The phonostatistical aspects in (mental) lexicon of Persian speakers investigated in this study include stress pattern of lexemes in Persian، syllable and the number of syllables in Persian lexemes، phonotactics of Persian lexemes، frequency of phonological natural classes in general، frequency of phonological natural classes in syllable، phonotactics of consonant clusters، optimal syllable in the language، frequency of Persian phonemes and the like. The results of this phonostatistical research validate the phonological principles and concepts such as phonological natural classes، phonological processes، hierarchical structure of syllables and the like. They also demonstrate the frequency of segments and segmental strings which defines the spectrum of unmarkedness in Persian phonological system
خلاصه ماشینی:
"علم الهدی (٢٠٠٠) )، نظام آوایی زبان فارسی معاصر را از حیث واجآرایی و با هدف بررسی میزان رعایت اصل توالی رسایی ، به شیوة آماری ، مورد مطالعه قرار داده و نشان می دهد که (همان : ٥-١٧٢) در فارسی نو گرایش به نقض محدودیت رسایی در وام واژهها، به ویژه در واژه های برگرفته از عربی ، بیش از چنان گرایشی در فارسی سره است (به نقل از احمدی و بی جن خان، ١٣٨٩: ١٤).
تعداد نسبی واژههای یکهجایی با ساخت cv و نیز حذف همخوان از خوشة دوهمخوانی و تبدیل cvcc به cvc و هجاسازی مجدد با درج واکه و به دنبال آن تبدیل cvc به cv مثلا در /rgarka/ به صورت [regarka]، همه حکایت از این موضوع دارد که هجای cv هجای مطلوب در زبان فارسی است و در فرایندهای واجی ، هجاهای دیگر به آن تبدیل و یا نزدیک می شوند.
تحلیل آماری اطلاعات مختلف واجی ، مانند تحلیل واژه های فارسی از حیث تعداد هجا، زنجیره های واجی در ساختمان هجا و آرایش هجا در درون واژه های فارسی ، بسامد طبقات طبیعی واجی در زبان فارسی فارغ از ساختمان هجا، طبقات واجی در ساختمان هجا، آرایش های واجی در خوشة دوهمخوانی ، هجای بی نشان و بهینه در زبان و فراوانی واج های زبان فارسی در واژگان زبان، اطلاعات بسیار مهمی را درخصوص سازوکار نظام آوایی زبان در اختیار پژوهشگران در عرصه های مختلف قرار می دهد، تا به فراخور تخصص و موضوع تحقیق بتوانند از آمار و ارقام ارائه شده در این پژوهش استفاده کنند."