خلاصه ماشینی:
"» از آنجا که«اطلاعات تفسیری»میتوانند انواع مختلفی داشته باشند،پس انواع مختلف نشانهگذاری نیز وجود دارد(لیچ،1993:278-275): 1-نگارشی13 2-آوایی/واجی 3-زبر زنجیری 4-نحوی(تقطیع)14 5-معنایی 6-کارکرد شناختی/کلامی 7-دستوری(برچسبدهی دستوری)15 2-1 نشانهگذاری نگارشی نوع اول نشانهگذاری که لیچ معرفی میکند یعنی نشانهگذاری نگارشی در واقع همان رمزگذاری متن است که هلمس-هیگین و دیگران به آن اشاره کردهاند(ن.
3-برچسبدهی دستوری توزیعی44و کاربرد آن در پیکرۀ فارسی برچسبدهی توزیعی روشی است نوین که شوتس(1995)برای اولین بار روی زبان انگلیسی به کار برده است و به گفتۀ خود وی این روش باید در مورد زبانهای دیگر بویژه آنهایی که از ساختواژه پیچیدهتری نسبت به انگلیسی برخوردار هستند به کار رفته و کارآیی آن بیشتر بررسی گردد.
به این معنی که ابتدا تعدادی دلخواه از واژههای پربسامد پیکره به شکل دستی برچسبدهی میشوند،و سپس اگر واژهای بود که توسط برنامه برای برچسبدهی انتخاب شده ولی برچسبی برای آن وجو نداشت مشابه روش اول طبقهبندی میشود،با این تفاوت که در روش اول همسایۀ واژهها به شکل گونهواژه50ذخیره میشدند،اما در روش دوم همسایهها به شکل تعمیم یافته(یعنی مقولۀ دستوری آنها)ذخیره میشود.
[N] و [CONJ] زندگی [N] نو [PUNC],[ADJ] دارد [VDECJijb و [CONJ] پادزهر[؟؟؟] شکل 2 نمونهای از متن برچسب داده شده پیکرۀ زبان فارسی پینوشتها (1)- Corpus Linguistics (2)- Picchi (3)- Holmes-Higgin (4)- Garside (5)- coding (6)- description (7)- representation (8)- corpus management program (9)- annotation (10)- Geoffrey Leech (11)- Lancaster (12)- representation (13)- orthographic (14)- parsing (15)- grammatical tagging (16)- markup language (17)- Joan M."