Abstract:
در این مقاله، روشی جدید برای استخراج ویژگی از سیگنال صوت و تشخیص گوینده صدا ارائه شده است که کاربرد وسیعی در علوم جاسوسی و پدافند غیرعامل دارد (بدین صورت که با تشخیص گوینده یک صدای ضبط شده می توان اولا مانع تقلید صدای افراد خاص مانند فرماندهان شد و ثانیا می توان در استراق سمع مکانی که چندین نفر در حال گفتگوی مهمی هستند، گوینده هر صدا را تشخیص داد). در واقع روش ارائه شده، بهبودیافته روش MFCC می باشد. از آن جایی که با توجه به آزمایشات، بیشتر اطلاعات صوت در فرکانس های پایین آن ذخیره می شود و فرکانس های بالای آن اطلاعات تفکیک کننده زیادی ندارد، محققان معمولا ویژگی های صوت را از فرکانس های پایین سیگنال صوت استخراج می کنند. در روش ارائه شده در این مقاله، فیلتر فرکانسی Mel که در روش MFCC استفاده می شود، تغییر و بهبود داده شده و در انتها نتایج روش ارائه شده (MMFCC) با روش MFCC مقایسه شده و بهبود آن اثبات شده است. نتایج حاصله برای 20 گوینده متفاوت موید این است که برای روش بهبودیافته خطی درصد تشخیص گوینده حدود 5/4٪ و برای روش بهبودیافته نهائی حدود 9٪ ارتقاء یافته است.
Machine summary:
"فصلنامه علمی – ترویجی پدافند غیرعامل سال چهارم، شماره 4 ،زمستان 1392، (پیاپی 16): صص 13-18 بهبود روش MFCC برای تشخیص گوینده در عملیات جاسوسی ابوالفضل چمن مطلق<FootNote No="48" Text="- استادیار و عضو هیئت علمی دانشگاه جامع امام حسین(ع)"/>، عباس نجفیپور<FootNote No="49" Text="- دانشآموخته کارشناسی ارشد دانشکده برق دانشگاه علم و صنعت ایران - نویسنده مسئول"/> تاریخ دریافت: 12/09/92 تاریخ پذیرش: 16/10/92 چکیده در این مقاله، روشی جدید برای استخراج ویژگی از سیگنال صوت و تشخیص گوینده صدا ارائه شده است که کاربرد وسیعی در علوم جاسوسی و پدافند غیرعامل دارد (بدین صورت که با تشخیص گوینده یک صدای ضبطشده میتوان اولا مانع تقلید صدای افراد خاص مانند فرماندهان شد و ثانیا میتوان در استراق سمع مکانی که چندین نفر در حال گفتگوی مهمی هستند، گوینده هر صدا را تشخیص داد).
روش دیگری که بر پایه استخراج ویژگی به تشخیص گوینده میپردازد، روش MFCC<FootNote No="54" Text="- MEL- Frequency Cepstrum Coefficients"/> است که در آن اندازه تبدیل فوریه سیگنال صوت در فیلتر Mel ضرب میشود [1].
تشخیص گوینده معمولا در چهار مرحله انجام میشود که عبارتاند از [4و5]: پنجرهبندی سیگنال صوت پیشپردازش تحلیل اصلی مدلسازی و تطبیق در این مقاله، پس از پنجرهبندی و پیشپردازش سیگنال صوت، از روش MFCC بهعنوان تحلیل اصلی استفاده شده است و پیشنهادی نیز برای بهبود این روش داده میشود."