با ظهور موسیقی دیجیتال، روشها و نرمافزارهای بیشماری برای شنیدن آن ارائه شدند. از آن زمان تا به امروز، فرمتهای متعددی نیز برای فایلهای صوتی دیجیتال معرفی شدهاند که هر کدام مزایا و معایب خود را دارند. انتخاب بین دایره عظیم فرمتها برای بسیاری از ما دشوار است و ممکن است بارها در زمان تهیه و یا تولید موسیقی، در مورد انتخاب فرمت فایل دچار تردید شده باشیم.
در این مقاله به بررسی ویژگیها، مزایا و معایب فرمتهای رایج فایلهای صوتی میپردازیم.
نکات تعیینکننده کیفیت صدا در یک فرمت صوتی
کدکهای صوتی برنامههایی هستند که داده دیجیتال را برای انتقال به منبع صوتی فشردهسازی کرده و پس از انتقال، آن را از حالت فشرده خارج میکنند. سرعت پردازش این کدکها با واحد هزار بیت بر ثانیه سنجیده میشود که به اختصار با حروف kbps نشان داده شده و با نام بیتریت (bitrate) شناخته میشود. مقدار این واحد حتی در یک فرمت ثابت نیز متغیر است. معمولاً یک فایل با بیتریت پایینتر، از حجم کمتری نیز برخوردار است؛ اما این به معنای از دست رفتن داده در پروسه انتقال آن نیز هست که منجر به افت کیفیت نهایی فایل میشود.
دو متغیر تعیینکننده دیگر در کیفیت یک فایل صوتی عبارتند از عمق بیت (bit depth) و نرخ نمونهبرداری (sample rate). نرخ نمونهبرداری، بیانگر بسامد یا تعداد اندازهگیری دامنه نوسان سیگنال صوتی از منبع صوت در یک ثانیه است که با واحد هرتز نشان داده میشود. در اکثر فرمتهای صوتی، مقدار این دامنه نوسان در قالب یک عدد دودویی در فایل ذخیره میشود و با افزایش دقت نمونهبرداری، بر ارقام این عدد افزوده میشود.
برای مثال، در یک فایل با نرخ نمونهبرداری ۴۴٫۱ کیلوهرتز و عمق بیت ۱۶ بیت، در هر ثانیه ۴۴۱۰۰ بار از سیگنال آنالوگ نمونهبرداری میشود و دقت اندازهگیری هر یک از این نمونهها، ۱۶ بیت است. این امر بدان معناست که نتایج این نمونهبرداری، در قالب اعداد صفر و یکی ۱۶ رقمی ذخیره میشوند.
مقدار این عددها تا حد زیادی گویای کیفیت نهایی فایل هستند و هر چه این دو عدد بالاتر باشند، کیفیت فایل نیز معمولاً بالاتر است.
فرمتهای Lossy
عنوان این دسته از فرمتها از کلمه Loss که در زبان انگلیسی به معنای از دست رفتن است، برگرفته شده است؛ زیرا در این فرمتها، داده پس از فشردهسازی، دیگر به حالت قبلی خود بازنگشته و در نتیجه، بخشی از آن در هنگام فشردهسازی و انتقال از بین میرود. حجم فایل فرمتهای Lossy از انواع دیگر فرمتها کمتر است؛ اما این به دلیل از دست رفتن بخشی از داده در پروسه انتقال آنهاست که نهایتاً باعث میشود از کیفیتی پایینتر نسبت به دیگر فرمتها برخوردار باشند. به همین دلیل، افراد فعال در حوزه صوت، برای بهاشتراکگذاری نمونههای صوتی با همکاران خود، اغلب از فرمتهای لاسلس و بدون فشردهسازی استفاده میکنند.
MP3
MP3 (مخفف MPEG Audio Layer III) را میتوان محبوبترین فرمت صوتی Lossy دانست. این فرمت در اکثر دستگاههای دیجیتال امروزی قابل پخش است و حجم فایلهای آن نیز معمولاً کسری از حجم فایل فرمتهای لاسلس (lossless) است. MP3 برای استفاده روزمره و شنیدن موسیقی بهصورت غیرتخصصی ایدهآل است؛ زیرا داده ازدسترفته در این فرمت معمولاً در لوازم صوتی عادی قابل شنیدن نیست.
مشکل اصلی فرمت MP3، عمق بیت محدود آن است. بیشترین عمق بیت قابل دستیابی در فایلهای دارای این فرمت، ۱۶ بیت است. این محدودیت در پروسه تولید موسیقی نقصی بزرگ محسوب میشود؛ زیرا طبق تجربه و توصیه اکثر مهندسین و آهنگسازان باتجربه، فایل صوتی مورد استفاده در یک پروژه صوتی باید از عمق بیت حداقل ۲۴ بیت برخوردار باشد.
AAC
فرمت AAC یا Advanced Audio Coding، فایلهایی با حجم بسیار کم داشته و فرمتی ایدهآل برای استریمینگ محتوای صوتی محسوب میشود. حجم فایلهای AAC حدوداً یک مگابایت به ازای هر دقیقه محتوای صوتی است و کیفیت صدای آنها نیز از MP3 بالاتر است و همین عوامل، AAC را به فرمت مورد استفاده سرویسهای استریمینگ محبوب مانند Apple Music و یوتیوب تبدیل کرده است.
Ogg Vorbis
این فرمت مجانی و اُپن سورس، فرمت مورد استفاده توسط اسپاتیفای، یکی از محبوبترین سرویسهای استریمینگ دنیاست.
Ogg Vorbis نیز به دلیل حجم کم، فرمتی ایدهآل برای استفاده در استریمینگ است؛ اما پروسه فشردهسازی خاص آن موجب از دست رفتن بخش قابل توجهی از داده صوتی میشود. با این حال، بسیاری از افراد Ogg را به MP3 ترجیح میدهند و ادعا میکنند که در حجمی یکسان، کیفیت صدای بهتری از MP3 ارائه میکند.
فرمتهای Lossless
فرمتهای Lossless، همانگونه که از نامشان پیداست، از پروسه انتقال و فشردهسازی خاصی برخوردارند که در آن، فایل پس از فشردهسازی و انتقال، مجدداً به حالت اولیه بازمیگردد و هیچ بخشی از دادههای آن از دست نمیرود. این امر باعث میشود که کیفیت صدای این دسته از فرمتها، بالاتر از فرمتهای Lossy باشد. بسیاری از آدیوفایلها و بعضاً تولیدکنندگان محتوای صوتی، فرمتهای لاسلس را گزینهای ایدهآل برای شنیدن و بهاشتراکگذاری موسیقی میدانند.
همانگونه که انتظار میرود، حجم فایل این فرمتها بسیار بالاتر از فایل فرمتهای لاسی است. همچنین بیتریت در این فرمتها بسته به حجم و محتوای فایل تغییر میکند و آنچنان بیانگر کیفیت صدای فایل نیست.
FLAC
این فرمت صوتی در حال حاضر محبوبترین فرمت صوتی میان آدیوفایلهاست و بهسرعت در حال فراگیری است.
FLAC در کنار ذخیرهسازی داده صوتی با کیفیتی بسیار خوب، فرمتی اُپن سورس و مجانی است که میتوان بهآسانی از آن استفاده کرد.
ALAC
فرمت ALAC نیز از بسیاری از مزایای FLAC برخوردار است؛ اما فرمت انحصاری شرکت اپل است و امکان استفاده از آن تنها در دستگاههای ساختهشده توسط این شرکت وجود دارد.
APE
فرمت صوتی Monkey Audio که با پسوند فایل .ape شناخته میشود، یک فرمت لاسلس دیگر است که مانند FLAC، از کیفیت صوتی بالایی برخوردار است. این فرمت حجم فایل کمتری از دیگر فرمتهای لاسلس دارد؛ اما نیاز به توان بالایی از سوی CPU برای پخش دارد و به همین دلیل تنها در PC و برخی از پخشکنندههای دیگر قابل پخش است.
فرمتهای بدون فشردهسازی
در فرمتهای بدون فشردهسازی (uncompressed)، داده صوتی بهصورت مستقیم انتقال داده شده و هیچگونه فشردهسازی روی آن صورت نمیگیرد. این فرمتها دارای بالاترین کیفیت هستند؛ اما حجم آنها نیز بسیار بالاست.
WAV
فرمت WAV، یکی از رایجترین و پرکاربردترین فرمتها از زمان ظهور صوت دیجیتال است. در این فرمت، داده اصلی بهطور کامل و دستنخورده در فایل حفظ میشود و این امر فرمت WAV را به گزینه ایدهآل برای تولیدکنندگان محتوای صوتی تبدیل میکند. آهنگسازان و مهندسین صوتی بر این باورند که فرمت WAV از بالاترین داینامیک رنج و کیفیت و بیشترین عمق صوتی به نسبت فرمتهای رایج برخوردار است. فایلهای این فرمت میتوانند در بازهای وسیع از نرخهای نمونهبرداری، از ۴۴٫۱ تا ۷۶۸ کیلوهرتز و عمق بیت ۱۶ تا ۳۲ بیت ضبط شده باشند.
اگر یک تولیدکننده محتوای صوتی هستید و قصد همکاری با موزیسینهای دیگر از راه دور را دارید، WAV بهترین فرمت برای بهاشتراکگذاری فایلهای شماست. این فرمت در اکسپورتهای پیاپی دچار افت کیفیت نمیشود و همچنین مشخصات زمانی (timecode) خود را نیز حفظ میکند. این ویژگی، ایجاد هماهنگی بسیار دقیق بین صدا و تصویر را ممکن میکند و WAV را به فرمتی مناسب برای استفاده بهعنوان صوت فایلهای تصویری تبدیل میکند.
AIFF
فرمت AIFF که توسط اپل توسعه داده شده است نیز یک فرمت بدون فشردهسازی داده، با حجم فایل و کیفیت صدای بالاست. کامپیوترهای مبتنی بر سیستم عامل ویندوز و مک و برخی دیگر از دستگاههای دیجیتال توانایی پخش این فرمت را دارند؛ اما برخلاف WAV، فرمت AIFF توانایی ذخیرهسازی timecode یا مشخصات زمانی برای هماهنگی با فایلهای تصویری را ندارد و به همین دلیل، امکان استفاده آن بهعنوان صوت فایلهای ویدیویی وجود ندارد.
DSD
فرمت صوتی DSD (مخفف Direct Stream Digital) برای اولین بار در دیسکهای نوری Super Audio CD استفاده شد. این فرمت از بالاترین حجم فایل در میان فرمتهای رایج برخوردار است و از روشی متفاوت موسوم به Pulse-Density Modulation برای نمونهبرداری از منبع صوتی استفاده میکند. نرخ نمونهبرداری در این فرمت بالاتر از سایر فرمتهاست و در کمترین حالت، تا ۶۴ برابر نرخ نمونهبرداری یک سیدی صوتی بالاتر است. همچنین عمق بیت فایلهای DSD به دلیل روش نمونهبرداری متفاوت آن، یک بیت است.
این فرمت در میان آدیوفایلهای سختگیر از محبوبیت ویژهای برخوردار است و برای پخش آن باید لوازم صوتی مناسبی را در اختیار داشته باشید. در مورد کیفیت پخش فرمت DSD در مقایسه با WAV نظرات متناقض بسیاری وجود دارد. برخی اعتقاد دارند که با استفاده از فرمت DSD، بازده DAC در تبدیل سیگنال در بالاترین حالت خود قرار دارد و در نتیجه، کیفیت پخش آن نیز به نسبت فرمت WAV بالاتر است. از سوی دیگر، برخی افراد نیز معتقدند در صورتی که ضبط و مسترینگ موسیقی مورد نظر بهخوبی انجام شده باشد، تفاوتی بین کیفیت پخش در این دو فرمت وجود نخواهد داشت.
جمعبندی
در نهایت، انتخاب بین فرمتهای صوتی ذکرشده به اولویتها و کاربرد شما بستگی خواهد داشت؛ اما در کل اگر به پادکست گوش میدهید یا شنوندهای عادی هستید که با پخشکنندههایی مانند موبایل به موسیقی گوش میدهد، فرمتهای Lossy مانند MP3 بهخوبی جوابگوی نیاز شما خواهند بود. از سوی دیگر، اگر بهصورت جدی و به وسیله یک سیستم صوتی یا موزیک پلیر حرفهای به موسیقی گوش میدهید، برای تجربه حداکثر کیفیت صدا باید موسیقی را در فرمتهای لاسلس یا بدون فشردهسازی تهیه کنید. در صورتی که تولیدکننده محتوای صوتی یا آهنگساز هستید نیز قویاً پیشنهاد میکنیم که از فرمت WAV برای ذخیرهسازی و انتقال فایلهای صوتی خود استفاده کنید.