پدیدهای است که با آن از خواب برمیخیزیم و یا در حال گوش کردن موسیقی با آن به خواب میرویم. اکنون صدا و اصوات ضبط شده در همهجا یافت میشوند در گوشیهای همراه ما در اتومبیلها و تقریبا در هر مکانی که میروید احتمالاً منبعی در اطراف شما در حال صداسازی است! حال میخواهیم درباره این عامل مهم زندگی روزمرهی ما بیشتر بدانیم!
زمانی که بهتازگی انقلاب صنعتی در فرانسه در حال پا گرفتن بود مردی به نام لئون اسکوت مارتین ویل در حال کار بر روی دستگاهی با نام آوانگار بود. این دستگاه که هدفش چیزی جز ضبط کردن اصوات محیط اطرافش نبود چندین و چند بار شکست خورد تا در آخر در سال 1860 پس از میلاد مسیح اولین ضبطصوت تاریخ شروع به کار کرد و شروع به ضبط صدا کرد.
اولین آوایی که توسط اولین ضبطصوت جهان به داده تبدیل شد و ذخیره گردید صدایی گنگ و نامفهوم بود اما بطن ماجرا چیز دیگری است. مهم این است که ویل توانسته بود یک صدا را هر قدر هم نامفهوم ضبط کند. اما مرد پر آوازه سدهی اخیر جا در پای مارتین ویل گذاشت و دستگاه آوانگار خود را در سال 1877 پس از میلاد ابداع کرد. او کسی نبود جز توماس ادیسون. آوانگاری که توسط ادیسون تهیهشده بود میتوانست صداهایی با کیفیتتر به نسبت آوانگار مارتین ویل به ثبت برساند و اینچنین بود که اغلب مردم فکر میکنند که اولین ضبطصوت توسط ادیسون ساخته شد!
صدا چیست؟
"صدا در تعریف فیزیکی به نوعی از انرژی نسبت داده شده که از تحرک و برخورد ذرات به وجود می آید”. این نوع از انرژی میتواند در محیط هایی که "ماده” وجود داردانتقال پیدا کند. حال این ماده میتواند جامد باشد یا گاز فرقی نمیکند. برای مثال در خلا هیچ صدایی رد و بدل نمیشود. به عبارتی دیگر چون در خلاء ما هیچ نوع از ماده(جامد، مایع، گاز) را نداریم پس هیچ ذره ای هم موجود نیست که بتوانیم با ارتعاشات زنجیر وار آنها صدا را انتقال دهیم.
حال کمی از تعریفات پیچیده علمی بگذریم و به زبانی ساده تر صدا را تعریف کنیم.
صدا در واقع ارتعاشاتی است که از ذره ای به ذره ی دیگر منتقل میشود. برای مثال شما وقتی دستانتان را به هم میکوبید ارتعاشی در دستهایتان ایجاد میکنید و چون دست شما در تماس مستقیم با یکی از شکل های ماده(در اینجا هوا) قرار دارد پس این انرژی و ارتعاش تولید شده در دست شما به هوا انتقال پیدا کرده و ذره های هوا یکی پس از دیگری این ارتعاشات را به صورت کاتوره ای و بی نظم در همه جا پخش میکنند تا جایی که دیگر انرژیای برای مرتعش کردن ذره بعدی وجود نداشته باشد;در این صورت صدا قطع میشود.
حال که صدا تولید و پخش شد اگر ما در محدوده ای که صدا هنوز وجود دارد باشیم صدا به گوش ما میرسد و به وسیله گوش خارجی(شامل لاله گوش و مجرای گوش) به داخل گوش رانده میشود. حال این اصوات که هنوز هم انرژی دارند به پرده ای به نام صماخ برخورد کرده و آن را وادار به ارتعاش میکنند. در اینجا چند استخوان کوچک وجود دارد که این ارتعاشات را تقویت کرده و به وسیله عصب شنوایی به مغز فرستاده شده تا ما بتوانیم مفهومی از صدا را در ذهن خود درک کنیم!
سیگنال الکترونیکی چیست؟
سیگنال های الکترونیکی از پایه ترین مفاهیم کامپیوتر هستند که در اکثر هر کار و عملی در کامپیوتر باید از آنها استفاده کنیم.
"سیگنال های الکترونیکی مقادیری متغیر و از توابع زمان هستند که بر اساس مبدا و مقصد اطلاعاتی را حمل میکنند”. تغییرات سیگنال ها تابعی مستقیم از اختلاف پتاسیل بر حسب ولتاژ است. یعنی هر چه قدر که ولتاژ مدار تغییر میکند جای گیری تابع سیگنال ها نیز تغیر میکند. این سیگنال ها بر اساس پیوسته و گسسته بودن به دو دسته آنالوگ و دیجیتال تقسیم میشوند.
سیگنال آنالوگ چیست؟
"سیگنال آنالوگ نوعی ازتوابع سینوسی است که از توابع زمان و ولتاژ حساب میشود که در مولفه زمان پیوسته از سیگنال های الکترونیکی یا به عبارتی دیگر موجی است و دامنه آن پیوسته است”. پس یک سیگنال آنالوگ در بازه ای معین میتواند بی شمار حالت را در خود جای دهد. کمی بالاتر ذکر کردیم که تغییرات سیگنال ها تابعی مستقیم از ولتاژ ورودی است. سیگنال های آنالوگ هم زیر شاخه ای از سیگنال های الکترونیکی هستند پس با تغییر ولتاژ (چه کم شدن و چه زیاد شدن) سیگنال های آنالوگ نیز در جهت تغییر، تغییر پیدا میکند.
برای مثال شما یک سوت دارید وقتی در آن میدمید(اختلاف پتانسیل بر حسب ولت) بر حسب مقدار هوایی که در آن وارد میکنید صدای سوت هم افزایش پیدا میکند. اگر شما بتوانید این سوت را به دستگاهی متصل کنید که بتواند مقدارهای بسیار کم از هوا را در سوت بدمد و یک دستگاه اندازه گیر دقیق صدا داشته باشید دقیقا میتوانید متوجه شوید که هر چقدر هم مقدار هوای وارد شده به سوت تغییر کند(مثلا یک پیکو سانتی متر مکعب) صدایی که اندازه گیر ثبت میکند متفاوت است. یا به عبارتی دیگر چون سیگنال آنالوگ ممتد است پس میتوان بی نهایت اطلاعات را در آن ذخیره و یا اجرا کرد و این سیگنال میتواند به طور پیوسته تغییر کند.
حال سوالی که پیش می آید چرا یک سیگنال آنالوگ بی شمارحالت دارد؟
با اینکه پاسخ این سوال را در پاراگراف بالا دادیم اما از نظر ریاضی بار دیگر پاسخ میدهیم; فرض کنید شما یک بازه عددی (4,5) دارید، بین این دو عدد بی نهایت عدد وجود دارد و اگر از کرهی زمین تا انتهای ماه هم اعداد پشت سر هم بگذاریم و در آخِرِ آن یک ممیز قرار دهید باز هم میتوانید به سمت راست این ممیز عدد اضافه کنید تا آن عدد کوچکتر شود. پس ما بی نهایت عدد پیوسته در میان 4 و 5 داریم.
سیگنال دیجیتال چیست؟
"سیگنال های دیجیتال سیگنال هایی هستند که در مولفه زمان پیوسته هستند اما دامنه آنها پیوسته نیست و به طَبَعِ این موضوع دامنهی آنها نیز پیوسته نیست”. چندی بالاتر در بسط سیگنال های الکترونیکی گفتیم که سیگنال ها از اعداد باینری تبعیت میکنند یعنی داده های سیگنال یا صفر منطقی است یا یک و خارج از این دو حالت نیست. باید بگوییم که اکثر کامپیوتر ها برای خود دامنه اطلاعاتی تعیین میکنند یک قسمت از دامنه ولتاژ بالا نام میگیرد و قسمتی دیگر ولتاژ پایین. بنا به تعریفاتی که از قبل برای سیستم کد نویسی شده است بازه ی پایینی نمودار را کد 0 تلقی میکند و بازهی بالایی را 1.
حال ما صوت را چگونه به اعداد باینری تبدیل میکنیم؟
بیاید از ابتدای ضبط صدا شروع کنیم. برای مثال میکروفونی داریم و در نزدیکی آن منبعی در حال تولید ارتعاشات و سیگنال های آنالوگ است و برای پردازش این صدا یک کامپیوتر دارای کارت صدا داریم. این ارتعاشاتی که در هوا به وجود آمده پیوسته به میکروفون برخورد میکند و میکروفون این ضربات ممتد هوا را به سیگنال الکتریکی مبدل میکند. چون این سیگنال الکتریکی هنوز هم پیوسته در حال تغییر است پس در ماهیت آنالوگ بودن هنوز تفاوتی وجود ندارد.
اما وقتی میکروفون این سیگنال رابه کامپیوتر انتقال میدهد بدلیل آنکه این داده ها باید در جایی ذخیره شوند این داده ها باید به اعداد باینری تبدیل شوند. پس این سیگنال ورودی توسط کارت صدا چندین هزار بار اسکن و اندازه گیری میشود و آن را به شکل دودویی یا دسیمال تبدیل میکنند.
اکون سیگنال الکتریکی به اعداد باینری تبدیل شده و این اعداد در حافظه ها ذخیره میشود و در مواقعی که می خواهید آن صدا را گوش دهید دقیقا عکس این عمل اتاق میافتد و کارت صدا اعداد باینری را به سیگنال الکتریکی آنالوگ تبدیل میکند.
چرا ما باید سیگنال های آنالوگ را به سیگنال های دیجیتال تبدیل کنیم؟
جواب این سوال در طبعت این دو سیگنال نهفته است. سیگنال های دیجیتال در یک بازه زمانی بی نهایت ولتاژداشته باشند. ما برای اینکه بتوانیم این سیگنال های آنالوگ را ذخیره کنیم باید کاری کنیم که در یک واحد زمانی یک ولتاژمعین داشته باشیم تا بتوانیم آن را ذخیره کنیم.
در شکل بالا در ردیف اول یک سیگنال الکترونیکی آنالوگ را میبینیم. در شکل دوم همان سیگنال را میبینیم که سیستم سعی به نمونه برداری از آن را دارد. نمونه برداری عملی است که به وسیله آن سیستم میتواند سیگنال آنالوگ را بر حسب برنامه هایی که برایش از پیش تبیین شده به اعداد دسیمال و داده تبدیل کند.
در شکل بالا مولفه ای به نام دامنه را میبینیم که این مولفه رابطه مستقیم با کیفیت صدای دیجیتال دارد. یعنی هر چقدر تعداد دامنه در نمونه برداری زیادتر باشد صدای ضبط شدهی دیجیتالی شباهت بیشتری به نمونه آنالوگ خواهد داشت و یا به عبارتی دیگر هر چه «تعداد نمونه ها» و تقسیمات دامنه بیشتر باشد شکل سیگنال به دست آمده به سیگنال آنالوگ شبیه تر است.
DAC چیست؟
در سطر بالا ذکر کردیم که کارت صدا در رایانه های رومیزی وظیفه تبدیل سیگنال آنالوگ به دیجیتال را دارد اما در گوشی های هوشمند کنونی قسمتی از سیستم بر چیپ را بخشی به نام Digital To Analog Convertor (یا به سر واژه DAC) تشکیل داده است که میتوان آن را به زیر مجموعه های پردازنده سیگنال دیجیتالی (DSP) تعمیم داد. این مبدل دیجیتال به آنالوگ اعداد باینری که قبلا توسط میکروفون و یا دیگر ورودی ها ذخیره شده را به سیگنال آنالوگ بدل میکند و آن را به بلندگوی گوشی یا به دیگر خروجی ها (مانند HDMI و جک 3.5mm) میفرستند.
همانطور که گفتیم DAC زیر مجموعه ای از سیستم بر چیپ است. به خاطر توان کم این مبدل برخی از شرکت ها مانند HTC دست به طراحی مبدل دیجیتالی مستقل زده اند و متأسفانه در برخی متون دیده میشود که برای تلفن هایی با مبدل مستقل گفته میشود که این گوشی همراه از مبدل دیجیتالی بهره میبرد که کاملا غلط است! زیرا هر گوشی که تولید میشود DAC دارد اما برخی از آنها بصورت مستقل هم از آنها بهره میبرند.
Bit Rate یا نرخ بیت چیست؟
"به تعداد بیت هایی که در یک واحد زمانی پردازش میشوند نرخ بیت میگویند”. این نرخ چون واحدی بسیار کوچک است معمولا با ضرایبی مثبت از واحد های SI همراه میشوند تا نگارش و درک آن راحت تر باشد. هر چه تعداد بیت در یک فایل( چه صوتی و چه ویدیویی) بیشتر باشد بدین معناست که آن فایل جزئیات بیشتری را در خود دارد یا به عبارتی دیگر وقتی تعداد بیت یک فایل بالا رود مکان هایی که برای پردازش اطلاعات در هر ثانیه بکارمیرود بیشتر میشود پس ما آنچه را بعنوان کیفیت یاد میکنیم رابطه مستقیم با نرخ بیت دارد. همچنین هرچقدر مقدار نرخ بیت در واحد زمان بیشتر باشد سیگنال دیجیتال ذخیره شده شباهت بیشتری به نمونهی آنالوگ دارد.
سه فرمت رایج ذخیره صدا و به خصوص موسیقی ها:
MP3:
این فرمت که از رایج ترین فرمت برای ذخیره و به اشتراک گذاری انواع صدا ها است از فشرده ساز صوتی لایه ی سوم بهره میپرد و با ترکیب با فرمت مشهور MPEG از پر استفاده ترین فرمت ها حتی در فروشگاه هایی مثل آیتونز است. این فرمت چون از فشرده سازی لایه سوم صوتی استفاده میکند برخی از صدا هایی که در محدوده شنوایی انسان قرار ندارد و یا اصلا مورد مهمی نیست را حذف میکند تا حجم به کمترین حد ممکن برسد.
WAV:
زمانی که ماکروسافت غول برنامه ساز دنیا بود و همینطور شرکت IBM یکه تاز دنیای سخت افزار بود این دو شرکت با همکاری باهم در ویندوز خاطره سازِ 95 صداهایی را به سیستم اضافه کردند که بیشتر در مواقعی مانند بالا آمدن ویندوز و هشدار های ویندوز استفاده میشد. این صداهای سیستم با فرمت .wav مشخص میشدند و اکثر برنامه های سوم شخص ویندوز به آن دسترسی دارند و اغلب شکلی هشدار گونه دارند.
(FLAC(Free losseless Audio Codec :
از این کدک مخصوص بیشتر به شکل فرما یاد میکنند. این فرمت صوتی که از یک نوع فشرده سازی مخصوص با نام Lossless یا الگوریتم فشرده سازی بی اتلاف داده بهره میبرد. اده هایی که توسط این نوع کدک اینکد میشوند معمولا حجمی تا نصف فایل اولیه را دارا هستند اما در کیفیتشان هیچ تغییری اعمال نشده است.