نگاهی به فرمت‌های صوتی رایج

نوشته شده توسط امیر تولی می 26, 2022

با ظهور موسیقی دیجیتال، روش‌ها و نرم‌افزارهای بی‌شماری برای شنیدن آن ارائه شدند. از آن زمان تا به امروز، فرمت‌های متعددی نیز برای فایل‌های صوتی دیجیتال معرفی شده‌اند که هر کدام مزایا و معایب خود را دارند. انتخاب بین دایره عظیم فرمت‌ها برای بسیاری از ما دشوار است و ممکن است بارها در زمان تهیه و یا تولید موسیقی، در مورد انتخاب فرمت فایل دچار تردید شده باشیم.

در این مقاله به بررسی ویژگی‌ها، مزایا و معایب فرمت‌های رایج فایل‌های صوتی می‌پردازیم.

نکات تعیین‌کننده کیفیت صدا در یک فرمت صوتی

کدک‌های صوتی برنامه‌هایی هستند که داده دیجیتال را برای انتقال به منبع صوتی فشرده‌سازی کرده و پس از انتقال، آن را از حالت فشرده خارج می‌کنند. سرعت پردازش این کدک‌ها با واحد هزار بیت بر ثانیه سنجیده می‌شود که به اختصار با حروف kbps نشان داده شده و با نام بیت‌ریت (bitrate) شناخته می‌شود. مقدار این واحد حتی در یک فرمت ثابت نیز متغیر است. معمولاً یک فایل‌ با بیت‌ریت پایین‌تر، از حجم کمتری نیز برخوردار است؛ اما این به معنای از دست رفتن داده در پروسه انتقال آن نیز هست که منجر به افت کیفیت نهایی فایل می‌شود.

دو متغیر تعیین‌کننده دیگر در کیفیت یک فایل صوتی عبارتند از عمق بیت (bit depth) و نرخ نمونه‌برداری (sample rate). نرخ نمونه‌برداری، بیانگر بسامد یا تعداد اندازه‌گیری دامنه نوسان سیگنال صوتی از منبع صوت در یک ثانیه است که با واحد هرتز نشان داده می‌شود. در اکثر فرمت‌های صوتی، مقدار این دامنه نوسان در قالب یک عدد دودویی در فایل ذخیره می‌شود و با افزایش دقت نمونه‌برداری، بر ارقام این عدد افزوده می‌شود.

برای مثال، در یک فایل با نرخ نمونه‌برداری ۴۴٫۱ کیلوهرتز و عمق بیت ۱۶ بیت، در هر ثانیه ۴۴۱۰۰ بار از سیگنال آنالوگ نمونه‌برداری می‌شود و دقت اندازه‌گیری هر یک از این نمونه‌ها، ۱۶ بیت است. این امر بدان معناست که نتایج این نمونه‌برداری، در قالب اعداد صفر و یکی ۱۶ رقمی ذخیره می‌شوند.

مقدار این عددها تا حد زیادی گویای کیفیت نهایی فایل هستند و هر چه این دو عدد بالاتر باشند، کیفیت فایل نیز معمولاً بالاتر است.

فرمت‌های Lossy

عنوان این دسته از فرمت‌ها از کلمه Loss که در زبان انگلیسی به معنای از دست رفتن است، برگرفته شده است؛ زیرا در این فرمت‌ها، داده پس از فشرده‌سازی، دیگر به حالت قبلی خود بازنگشته و در نتیجه، بخشی از آن در هنگام فشرده‌سازی و انتقال از بین می‌رود. حجم فایل فرمت‌های Lossy از انواع دیگر فرمت‌ها کمتر است؛ اما این به دلیل از دست رفتن بخشی از داده در پروسه انتقال آنهاست که نهایتاً باعث می‌شود از کیفیتی پایین‌تر نسبت به دیگر فرمت‌ها برخوردار باشند. به همین دلیل، افراد فعال در حوزه صوت، برای به‌اشتراک‌گذاری نمونه‌های صوتی با همکاران خود، اغلب از فرمت‌های لاسلس و بدون فشرده‌سازی استفاده می‌کنند.

MP3

MP3 (مخفف MPEG Audio Layer III) را می‌توان محبوب‌ترین فرمت صوتی Lossy دانست. این فرمت در اکثر دستگاه‌های دیجیتال امروزی قابل پخش است و حجم فایل‌های آن نیز معمولاً کسری از حجم فایل فرمت‌های لاسلس (lossless) است. MP3 برای استفاده روزمره و شنیدن موسیقی به‌صورت غیرتخصصی ایده‌آل است؛ زیرا داده ازدست‌رفته در این فرمت معمولاً در لوازم صوتی عادی قابل شنیدن نیست.

مشکل اصلی فرمت MP3، عمق بیت محدود آن است. بیشترین عمق بیت قابل دستیابی در فایل‌های دارای این فرمت، ۱۶ بیت است. این محدودیت در پروسه تولید موسیقی نقصی بزرگ محسوب می‌شود؛ زیرا طبق تجربه و توصیه اکثر مهندسین و آهنگسازان باتجربه، فایل صوتی مورد استفاده در یک پروژه صوتی باید از عمق بیت حداقل ۲۴ بیت برخوردار باشد.

AAC

فرمت AAC یا Advanced Audio Coding، فایل‌هایی با حجم بسیار کم داشته و فرمتی ایده‌آل برای استریمینگ محتوای صوتی محسوب می‌شود. حجم فایل‌های AAC حدوداً یک مگابایت به ازای هر دقیقه محتوای صوتی است و کیفیت صدای آنها نیز از MP3 بالاتر است و همین عوامل، AAC را به فرمت مورد استفاده سرویس‌های استریمینگ محبوب مانند Apple Music و یوتیوب تبدیل کرده است.

Ogg Vorbis

این فرمت مجانی و اُپن سورس، فرمت مورد استفاده توسط اسپاتیفای، یکی از محبوب‌ترین سرویس‌های استریمینگ دنیاست.

Ogg Vorbis نیز به دلیل حجم کم، فرمتی ایده‌آل برای استفاده در استریمینگ است؛ اما پروسه فشرده‌سازی خاص آن موجب از دست رفتن بخش قابل توجهی از داده صوتی می‌شود. با این حال، بسیاری از افراد Ogg را به MP3 ترجیح می‌دهند و ادعا می‌کنند که در حجمی یکسان، کیفیت صدای بهتری از MP3 ارائه می‌کند.

فرمت‌های Lossless

فرمت‌های Lossless، همانگونه که از نامشان پیداست، از پروسه انتقال و فشرده‌سازی خاصی برخوردارند که در آن، فایل پس از فشرده‌سازی و انتقال، مجدداً به حالت اولیه بازمی‌گردد و هیچ بخشی از داده‌های آن از دست نمی‌رود. این امر باعث می‌شود که کیفیت صدای این دسته از فرمت‌ها، بالاتر از فرمت‌های Lossy باشد. بسیاری از آدیوفایل‌ها و بعضاً تولیدکنندگان محتوای صوتی، فرمت‌های لاسلس را گزینه‌ای ایده‌آل برای شنیدن و به‌اشتراک‌گذاری موسیقی می‌دانند.

همانگونه که انتظار می‌رود، حجم فایل این فرمت‌ها بسیار بالاتر از فایل فرمت‌های لاسی است. همچنین بیت‌ریت در این فرمت‌ها بسته به حجم و محتوای فایل تغییر می‌کند و آنچنان بیانگر کیفیت صدای فایل نیست.

FLAC

این فرمت صوتی در حال حاضر محبوب‌ترین فرمت صوتی میان آدیوفایل‌هاست و به‌سرعت در حال فراگیری است.

FLAC در کنار ذخیره‌سازی داده صوتی با کیفیتی بسیار خوب، فرمتی اُپن سورس و مجانی است که می‌توان به‌آسانی از آن استفاده کرد.

ALAC

فرمت ALAC نیز از بسیاری از مزایای FLAC برخوردار است؛ اما فرمت انحصاری شرکت اپل است و امکان استفاده از آن تنها در دستگاه‌های ساخته‌شده توسط این شرکت وجود دارد.

APE

فرمت صوتی Monkey Audio که با پسوند فایل .ape شناخته می‌شود، یک فرمت لاسلس دیگر است که مانند FLAC، از کیفیت صوتی بالایی برخوردار است. این فرمت حجم فایل کمتری از دیگر فرمت‌های لاسلس دارد؛ اما نیاز به توان بالایی از سوی CPU برای پخش دارد و به همین دلیل تنها در PC و برخی از پخش‌کننده‌های دیگر قابل پخش است.

فرمت‌های بدون فشرده‌سازی

در فرمت‌های بدون فشرده‌سازی (uncompressed)، داده صوتی به‌صورت مستقیم انتقال داده شده و هیچ‌گونه فشرده‌سازی روی آن صورت نمی‌گیرد. این فرمت‌ها دارای بالاترین کیفیت هستند؛ اما حجم آنها نیز بسیار بالاست.

WAV

فرمت WAV، یکی از رایج‌ترین و پرکاربردترین فرمت‌ها از زمان ظهور صوت دیجیتال است. در این فرمت، داده اصلی به‌طور کامل و دست‌نخورده در فایل حفظ می‌شود و این امر فرمت WAV را به گزینه ایده‌آل برای تولیدکنندگان محتوای صوتی تبدیل می‌کند. آهنگسازان و مهندسین صوتی بر این باورند که فرمت WAV از بالاترین داینامیک رنج و کیفیت و بیشترین عمق صوتی به نسبت فرمت‌های رایج برخوردار است. فایل‌های این فرمت می‌توانند در بازه‌ای وسیع از نرخ‌های نمونه‌برداری، از ۴۴٫۱ تا ۷۶۸ کیلوهرتز و عمق بیت ۱۶ تا ۳۲ بیت ضبط شده باشند.

اگر یک تولید‌کننده محتوای صوتی هستید و قصد همکاری با موزیسین‌های دیگر از راه دور را دارید، WAV بهترین فرمت برای به‌اشتراک‌گذاری فایل‌های شماست. این فرمت در اکسپورت‌های پیاپی دچار افت کیفیت نمی‌شود و همچنین مشخصات زمانی (timecode) خود را نیز حفظ می‌کند. این ویژگی، ایجاد هماهنگی بسیار دقیق بین صدا و تصویر را ممکن می‌کند و WAV را به فرمتی مناسب برای استفاده به‌عنوان صوت فایل‌های تصویری تبدیل می‌کند.

AIFF

فرمت AIFF که توسط اپل توسعه داده شده است نیز یک فرمت بدون فشرده‌سازی داده، با حجم فایل و کیفیت صدای بالاست. کامپیوترهای مبتنی بر سیستم عامل ویندوز و مک و برخی دیگر از دستگاه‌های دیجیتال توانایی پخش این فرمت را دارند؛ اما برخلاف WAV، فرمت AIFF توانایی ذخیره‌سازی timecode یا مشخصات زمانی برای هماهنگی با فایل‌های تصویری را ندارد و به همین دلیل، امکان استفاده آن به‌عنوان صوت فایل‌های ویدیویی وجود ندارد.

DSD

فرمت صوتی DSD (مخفف Direct Stream Digital) برای اولین بار در دیسک‌های نوری Super Audio CD استفاده شد. این فرمت از بالاترین حجم فایل در میان فرمت‌های رایج برخوردار است و از روشی متفاوت موسوم به Pulse-Density Modulation برای نمونه‌برداری از منبع صوتی استفاده می‌کند. نرخ نمونه‌برداری در این فرمت بالاتر از سایر فرمت‌هاست و در کمترین حالت، تا ۶۴ برابر نرخ نمونه‌برداری یک سی‌دی صوتی بالاتر است. همچنین عمق بیت فایل‌های DSD به دلیل روش نمونه‌برداری متفاوت آن، یک بیت است.

این فرمت در میان آدیوفایل‌های سختگیر از محبوبیت ویژه‌ای برخوردار است و برای پخش آن باید لوازم صوتی مناسبی را در اختیار داشته باشید. در مورد کیفیت پخش فرمت DSD در مقایسه با WAV نظرات متناقض بسیاری وجود دارد. برخی اعتقاد دارند که با استفاده از فرمت DSD، بازده DAC در تبدیل سیگنال در بالاترین حالت خود قرار دارد و در نتیجه، کیفیت پخش آن نیز به نسبت فرمت WAV بالاتر است. از سوی دیگر، برخی افراد نیز معتقدند در صورتی که ضبط و مسترینگ موسیقی مورد نظر به‌خوبی انجام شده باشد، تفاوتی بین کیفیت پخش در این دو فرمت وجود نخواهد داشت.

جمع‌بندی

در نهایت، انتخاب بین فرمت‌های صوتی ذکرشده به اولویت‌ها و کاربرد شما بستگی خواهد داشت؛ اما در کل اگر به پادکست گوش می‌دهید یا شنونده‌ای عادی هستید که با پخش‌کننده‌هایی مانند موبایل به موسیقی گوش می‌دهد، فرمت‌های Lossy مانند MP3 به‌خوبی جوابگوی نیاز شما خواهند بود. از سوی دیگر، اگر به‌صورت جدی و به وسیله یک سیستم صوتی یا موزیک پلیر حرفه‌ای به موسیقی گوش می‌دهید، برای تجربه حداکثر کیفیت صدا باید موسیقی را در فرمت‌های لاسلس یا بدون فشرده‌سازی تهیه کنید. در صورتی که تولیدکننده محتوای صوتی یا آهنگساز هستید نیز قویاً پیشنهاد می‌کنیم که از فرمت WAV برای ذخیره‌سازی و انتقال فایل‌های صوتی خود استفاده کنید.

DAC دک