چکیده:
فناوری نهان نگاری دیجیتال به عنوان یکی از بهترین راه حل ها جهت حل مسیله کپی غیرمجاز، شناسایی محتوا و احراز هویت رسانه های دیجیتال ارایه شده است. نهان نگاری دیجیتال می تواند در حوزه تصویر، متن، صوت ویدیو به کار گرفته شود. نهان نگاری صوت، توجه بسیاری از محققین را به خود جلب کرده است چرا که سامانه شنوایی انسان بسیار حساس تر از سامانه بینایی می باشد. بنابراین، درج داده ها در سیگنال های صوتی به شیوه ای شفاف، بسیار سخت تر از سایر گونه های نهان نگاری است. سامانه نهان نگاری صوت کارآمد می بایست قادر باشد سه معیار شفافیت، مقاوم پذیری و ظرفیت جادهی را بهبود بخشد. بهبود هم زمان این سه معیار به عنوان مساله ای چالش برانگیز در حوزه نهان نگاری است چرا که افزایش ظرفیت جادهی باعث افزایش اعوجاج سیگنال شده و این امر موجب کاهش شفافیت و مقاوم پذیری می گردد. در این مقاله رویکردی جدید به منظور نهان نگاری صوت پیشنهاد می گردد که قادر است سه معیار مقاوم پذیری، شفافیت و ظرفیت را به نحو مناسبی بهبود بخشد. به منظور بهبود مقاوم پذیری سیگنال نهان نگاره شده در برابر حملات پردازش سیگنال از هم افزایی سه تبدیل کارآمد در حوزه پردازش سیگنال به نام های تبدیل گراف محور (GBT)، تبدیل کسینوسی گسسته و تبدیل موجک گسسته (DWT) استفاده شده است. علاوه بر این، به منظور حفظ شفافیت سیگنال نهان نگاری شده، داده های نهان نگاره در ماتریس بالا مثلثی حاصل از تجزیه LU ضرایب تقریب تبدیل موجک گسسته، بر اساس دنباله فیبونانچی درج می شوند. رویه کار بدین صورت است که بر اساس مقدار بیت نهان نگاره، مقادیر غیر صفر ماتریس بالا مثلثی با نزدیک ترین اعداد زوج و یا فرد در دنباله فیبوناچی جایگزین می شوند. عملیات استخراج نهان نگاره به صورت کاملا کور انجام می شود. نتایج حاصل از ارزیابی روش پیشنهادی بر روی فایل های صوتی با سبک های Blue، Electronic، Classic و Jazz نشان می دهند که روش ارایه شده علیرغم مقاوم پذیری مناسب در برابر حملات مختلف پردازش سیگنال، به طور متوسط دارای نرخ سیگنال به نویز ۱۳/۴۵ دسی بل و نرخ جادهی ۷۵/۶۲۵ بیت بر ثانیه است.
Digital watermarking technology is presented as one of the best solutions for solving unauthorized copying, content
identification and authentication of digital media. Digital watermarking can be applied in the fields of image, text,
audio, and video contents. Audio watermarking has recently attracted the attention of researchers because the human
auditory system is much more sensitive than his vision system. Therefore, insertion of the data into audio signals in a
transparent way is much more difficult than other watermarking species. An efficient audio watermarking system
should be able to improve reconciliation of the three measures of transparency, strength and capacitance. Improving
the compromise between these three measures is a challenging problem, due to the fact that increasing the capacity of
the input signal, causes distortions in the signal which in turn causes a reduction in transparency and robustness. In
this paper, a new method is proposed for watermarking of audio signals that is able to improve the three criteria of
transparency, robustness and capacity in an appropriate manner. In order to improve the resilience of the hidden
signal against signal processing attacks, the synergy of three efficient transforms in the field of signal processing
namely, the graph-centric conversion (GBT), the discrete cosine transform (DCT) and the discrete wavelet transform
(DWT), has been used. In addition, in order to maintain the transparency of the watermarked signal, the watermarked
data in the high triangle matrix resulting from the LU decomposition of the approximation coefficients of the discrete
wavelet are entered in an order which is based on the Fibonacci sequence. The procedure is based on the value of the
watermarked bit, the non-zero values of the upper triangular matrix are replaced by the nearest even or odd numbers
in the Fibonacci sequence. The latent extraction operation is completely blind. The results of the evaluation of the
proposed method on audio files with Blue, Electronic, Classic and Jazz styles show that the proposed method, despite
good resistance to various signal processing attacks, has an average signal rate of 45.13 dB and a placement rate of
625.75 bits per second.