چکیده:
پیکره مجموعهای محدود از شواهد زبانی است که برای انجام پژوهشهای زبانشناختی (ازجمله فرهنگنگاری، آموزش زبان، پردازش زبان طبیعی، بررسیهای جامعهشناختی و غیره) به کار میرود. طراحی و ایجاد چنین پیکرههایی بسیار زمانبر و اغلب اوقات پرهزینه است. از سوی دیگر این نوع پیکرهها معمولا دارای محدودیت در شواهد زبانی و نیز محدودیت زمانیاند؛ به این معنا که گستره و حجم شواهد پیکرهها معمولا کم و محدود است و همچنین اینگونه نیست که همواره اطلاعاتی بهروز دربارة کاربرد دادههای زبانی یا تغییرات آن در دسترس پژوهشگر قرار بدهند. اینترنت پیکرهای از دادههای زبانی است که چنین مشکلاتی برای آن قابل تصور نیست. این پیکره بهعنوان منبعی متنمحور دارای ارزش زبانی بسیار زیادی است؛ زیرا از یک سو، از هر پیکرة زبانی دیگر بزرگتر است و دایما بهروزتر و گستردهتر میشود و اغلب اوقات کمهزینه است و از سویی دیگر، سبکها و حوزههای زبانی مختلف را شامل میشود. مشکلی که در استفاده از این پیکره وجود دارد این است که هنگامی که برای نمونه، واژهای در موتورهای جستجوگر اینترنتی وارد میشود، برخی اوقات اطلاعات موردنظر پژوهشگر نمایش داده نمیشود؛ بلکه توضیحاتی دربارة ماهیت واژة جستجوشده و تعریف آن ظاهر میشود. از سوی دیگر اطلاعات طبقهبندی خاصی ندارند و از هر حوزه و سبکی نمایش داده میشوند. در این مقاله برآنیم تا با ارائة راهحلهایی، ازجمله جستجو در بافت زبانی، روش آسانتر و سودمندتری برای کاربرد اینترنت بهعنوان پیکرة زبانی پیشنهاد کنیم. گرچه اغلب پژوهشگران در صحت دادههای زبانی اینترنتی و کاربرد آن در پژوهشهای زبانی شک دارند، اما خواهیم دید که درنتیجة کاربرد این راهحلها میتوان از مزایای بسیار اینترنت بهعنوان پیکرهای برای پژوهشهای زبانی سود برد.
خلاصه ماشینی:
"از سوی دیگر با بررسی دقیق متنهایی که در اینترنت منتشر میشود، میتوان ملاحظه کرد که کاربردهای زبانی از هر گونه و سبکی در این بین آنها دیده میشود؛ فقط کافیست با تکنیکها و روشهای صحیح جستجو اطلاعات مورد نظر خود را گردآوری کنیم.
با در نظر گرفتن ویژگی نمایانگربودگی پیکرههای زبانی که درواقع امکان تعمیم قواعد زبانی را به گروههای بزرگتر از پیکره جمعآوری شده میدهد، باید گفت که اینترنت به دلیل اینکه حجم بالایی از متنها را از در بر دارد و بار دیگر به این دلیل که کاربردهای مختلف زبانی را داراست، به پژوهشگر امکان جستجوی دادههای کافی را میدهد تا بتواند براساس آنها نتیجهگیری کند.
آنچه در این بخش میتوان نتیجه گرفت این است که اینترنت میتواند پیکرة عظیمی از دادههای زبانی باشد و در پژوهشهای مربوط به زبان و کاربردهای آن بهطور گسترده مورد استفاده قرار بگیرد.
از سوی دیگر هنگام جستجوی ترکیبات زبانی، موتورهای جستجوگر سندهای بسیاری را که در آن هرکدام از اجزای ترکیب در جاهای مختلفی از متن ظاهر شدهاند را نیز ارائه میدهند و پژوهشگر مجبور است از بین این سندها، اسنادی را که دقیقا ترکیب مورد نظر را دارا هستند انتخاب و استفاده کند.
استفاده از موتورهای جستجوگر برای جستجو در اینترنت یک روش اینست که آدرس سایت یا وبلاگی را در بخش مربوط به آن تایپ کنیم و از این طریق به صفحة مورد نظر دسترسی پیدا کنیم و درنهایت جستجوی زبانی خود را در آن انجام دهیم.
Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press."