فایل‌های موسیقی انواع مختلفی دارند. فرمت MP3 پرکاربردترین فرمت و برای کاربری معمولی بهترین گزینه است اما فرمت‌هایی مثل AAC و FLAC و همین‌طور WMA و OGG نیز پشتیبانی خوب و کاربرد فراوانی دارند.

در این مقاله می‌خواهیم با انواع فایل‌های صوتی که شامل موسیقی، آهنگ، Voice یا صدای انسان و غیره می‌شوند، آشنا شویم و ویژگی‌های هر یک را به صورت مختصر بررسی کنیم.

قبل از هر چیز توجه کنید که پسوند فایل‌ها و آنچه درون فایل به عنوان اطلاعات فشرده، ذخیره شده است، دو مقوله‌ی متفاوت است. لذا هر فایلی که پسوند آن MP3‌ باشد، از نظر ساختار مثل همه‌ی فایل‌های MP3 دیگر نیست و همین مسأله در مورد MP4 و غیره مصداق دارد. حتی برخی از فایل‌های MP4، شامل استریم ویدیو و استریم صدا هستند در حالی که برخی دیگر فقط استریم صدا یا استریم ویدیو دارند.

برخی فایل‌های موسیقی با پسوندی مثل wma، ممکن است حاوی صدای با فشرده‌سازی بدون افت کیفیت باشند و در عین حال ممکن است حاوی صدایی با فشرده‌سازی توأم با افت کیفیت باشند.

فرمت‌های غیرفشرده و فشرده فشرده با افت کیفیت و بدون افت کیفیت

انواع فایل‌های موسیقی از نظر پسوند و کدک استفاده شده برای فشرده‌سازی اطلاعات، متفاوت هستند. در واقع فشرده کردن داده‌های مربوط به صدا و موسیقی توسط اینکدرهای بسیار متنوعی انجام می‌شود و حاصل کار در بسته‌ای با پسوند خاص قرار می‌گیرد.

در حالت کلی دو نوع الگوریتم فشرده‌سازی صدا، عکس، ویدیو و غیره وجود دارد:

  • فشرده‌سازی توأم با افت کیفیت که Lossy گفته می‌شود، هر چند ممکن است افت کیفیت بسیار کم باشد.
  • فشرده‌سازی بدون افت کیفیت یا Lossless

و نوع سوم نیز حالت بدون فشرده‌سازی است:

  • بدون فشرده‌سازی

و توضیحات بیشتر در مورد این سه حالت:

در مورد صدا نیز برخی فرمت‌ها بدون افت هستند و برای کاربردهایی مثل صدابرداری، میکس، ساخت موسیقی و غیره کاربرد دارند و برخی دیگر مثل MP3، توأم با افت کیفیت و به مراتب کم‌حجم‌تر هستند که برای کاربردهای معمولی، بهینه هستند.

فرمت‌های بدون افت کیفیت، ممکن است امواج صوتی که به سیگنال دیجیتال تبدیل شده را مستقیماً و بدون هیچ نوع فشرده‌سازی خاصی، ذخیره کنند و در نتیجه حجم فایل صوتی بسیار زیاد خواهد بود. به عنوان مثال فایل موسیقی استریو یا دوکاناله از نوع ۲۴ بیتی با فرکانس نمونه‌برداری ۹۶ کیلوهرتز، به ازای هر دقیقه، حجمی معادل ۳۴ مگابایت خواهد داشت. برخی دیگر با فشرده‌سازی بدون افت کیفیت، داده‌ها را ذخیره می‌کنند و حجم به مراتب کمتر است اما نه در حد فایل‌های MP3.

PCM فرمتی بدون فشرده‌سازی

فرمت PCM که مخفف Pulse-Code Modulation است، حاصل تبدیل سیگنال آنالوگ به دیجیتال است. در واقع صدا پس از دریافت توسط میکروفون، به سیگنالی آنالوگ تبدیل می‌شود و در ادامه با تبدیل به سیگنال دیجیتال، به صورت فایل ذخیره می‌شود. منظور از مدولاسیون پالس این است که نمونه‌برداری از سیگنال آنالوگ در بازه‌های زمانی مشخصی انجام می‌شود.

این نوع فرمت دیجیتال صدا مثل اغلب فرمت‌های دیگر، دارای نرخ نمونه‌برداری یا Sample Rate است که هر چه بیشتر باشد، به این معنی است که تعداد نمونه‌های بیشتر از سیگنال آنالوگ برداشته شده است و لذا کیفیت صدا به حالت اصلی نزدیک‌تر است. مسأله‌ی دیگر Bit Depth یا تعداد بیت‌هایی است که برای ذخیره کردن هر نمونه به صورت دیجیتال استفاده می‌شود. بیت دپث یا عمق بیت و دقیق‌تر بگوییم، رزولوشن صدا، هر چه بالاتر باشد، به معنی کیفیت بیشتر است.

فرمت PCM هیچ نوع فشرده‌سازی ندارد و لذا فایل‌هایی با این فرمت، بسیار حجیم هستند. فرمتی به اسم LPCM که زیرمجموعه‌ی PCM‌ محسوب می‌شود، حاوی نمونه‌هایی است که در بازه‌های زمانی خطی برداشته شده‌اند. معمولاً دو واژه‌ی PCM و LPCM به جای هم به کار می‌روند چرا که اغلب فایل‌های PCM با نمونه‌برداری خطی تهیه شده‌اند.

فرمت WAV مایکروسافت و IBM

فرمت WAV یا به صورت کامل‌تر، Waveform Audio File، فرمتی است که در سال ۱۹۹۱ توسط IBM و مایکروسافت معرفی شد. فایل‌های WAV برخلاف باور بسیاری از کاربران، بدون فشرده‌سازی نیستند بلکه فرمت WAV ممکن است حاوی داده‌های فشرده باشد که البته کمتر با چنین نوعی از WAV‌ روبرو می‌شویم.

در اغلب فایل‌های WAV، صدای فشرده‌نشده با فرمت PCM ذخیره شده است. لذا می‌توان گفت که WAV معمولاً فرمتی حجیم و بدون فشرده‌سازی است.

خوشبختانه فرمت قدیمی و محبوب WAV در ویندوز و سایر سیستم عامل‌ها مثل macOS به خوبی باز می‌شود.

فرمت AIFF اپل

این فرمت که به صورت کامل Audio Interchange File Format گفته می‌شود، توسط اپل برای مک‌ها و در سال ۱۹۸۸ معرفی شده است. در این نوع فایل هم ممکن است صدای فشرده یا صدای فشرده‌نشده موجود باشد. به عنوان مثال فرمت AIFF-C که از اقسام AIFF و حاوی صدای فشرده‌شده است، در نرم‌افزارهایی مثل GarageBand و Logic Audio استفاده می‌شود. پسوند این نوع فایل‌ها مثل AIFF است در حالی که محتویات آن ساختار متفاوتی دارد.

در اغلب فایل‌های AIFF از فرمت PCM استفاده شده و در واقع فایل‌هایی حجیم با صدای بدون فشرده‌سازی هستند.

MP3 فرمتی فشرده با افت کیفیت

فرمت MP3 که مخفف MPEG-1 Audio Layer 3 است، در سال ۱۹۹۳ معرفی شد و به سرعت استفاده از آن گسترش پیدا کرد. این فرمت فشرده به قدری پرکاربرد است که می‌توان گفت کمتر اپ و نرم‌افزاری آن را به درستی پخش نمی‌کند. به علاوه از دیرباز وسایلی به اسم MP3 Player برای باز کردن چنین فایل‌هایی روانه‌ی بازار شدند. البته MP3 Playerها در گذر زمان پیشرفته‌تر شده‌اند و اکنون فرمت‌های متنوعی را به خوبی پخش می‌کنند.

هدف اصلی از توسعه‌ی فرمت MP3 این بوده که صداهایی که توسط انسان نمی‌شنود یا به سختی می‌شنود، حذف شود و علاوه بر این کیفیت صداهایی که شنیدن آن دشوار است، کمتر شود. در این صورت حجم نهایی فایل موسیقی کاهش زیادی پیدا می‌کند و در عین حال کیفیت صدا به شکل محسوس و قابل توجهی کمتر از صدای اصلی نیست.

توجه کنید که فرمت MP3 مخصوص صدا است و فرمت MP4 نسل بعدی این فرمت نیست!

AAC فرمتی فشرده با افت کیفیت

فرمت AAC که مخفف Advanced Audio Coding است، در سال ۱۹۹۷ به عنوان جایگزین MP3 معرفی شد. این فرمت با وجود محبوبیت زیاد، مثل MP3 سریعاً رشد نکرد.

الگوریتم فشرده‌سازی در فایل‌های AAC به مراتب پیشرفته‌تر از MP3 است. لذا معمولاً زمانی که دو فایل صوتی MP3 و AAC با بیت‌ریت یکسان را مقایسه می‌کنیم، فایل AAC کیفیت بالاتری دارد.

فرمت AAC برای فشرده‌سازی صدا در ویدیوهای یوتیوب و بسیاری از سایت‌های استریم ویدیو کاربرد دارد و علاوه بر این به خوبی در اندروید، iOS، مک‌او‌اس و حتی وسایلی مثل کنسول‌های بازی پشتیبانی می‌شود.

OGG یا Vorbis فرمتی فشرده با افت کیفیت

فرمت OGG که نام دیگر آن، Vorbis است، فرمتی برای فشرده‌سازی فایل‌های موسیقی است. این فایل‌ها پسوند ogg دارند و انواعی از فرمت‌های فشرده درونشان ذخیره می‌شود.

فرمت Vorbis در سال ۲۰۰۰ معرفی شد و به ۲ دلیل اصلی، محبوبیت آن افزایش یافت: این فرمت رایگان و متن باز است و لذا هزینه‌ای برای کاربران ندارد و از طرف دیگر فشرده‌سازی با کیفیت بالاتری نسبت به اغلب فرمت‌های دیگر انجام می‌شود. با وجود محبوبیت MP3 و AAC، فرمت OGG که محصولی متن باز و عالی است، حتی در حال حاضر هم کاربرد عام ندارد.

WMA فرمتی فشرده با افت کیفیت

فرمت WMA که مخفف Windows Media Audio است، در سال ۱۹۹۹ معرفی شد و پس از آن با معرفی نسخه‌های بعدی، بهینه‌سازی شد. فایل‌های wma در ویندوز به خوبی پشتیبانی می‌شوند اما مثل MP3 در همه‌ی سیستم عامل‌ها پشتیبانی عالی ندارند.

WMA از نظر روش فشرده‌سازی، شبیه به AAC و OGG است و کیفیت فایل‌ها با بیت‌ریت یکسان، معمولاً بهتر از MP3 است.

FLAC و فشرده‌سازی بدون افت کیفیت

فرمت Free Lossless Audio Codec  یا به اختصار FLAC فرمتی است برای فشرده‌سازی فایل‌های موسیقی که کیفیت آن مثل موسیقی اصلی است و هیچ افت کیفیت رخ نمی‌دهد. فرمت FLAC مثل MP3 بسیار کم‌حجم نیست و در واقع حداکثر ۶۰ درصد حجم فایل موسیقی را کاهش می‌دهد. پشتیبانی از این فرمت رایگان و متن باز خوب است و در اندروید، iOS و سایر سیستم عامل‌ها، نرم‌افزارهای مولتی‌مدیاپلیر محبوبی برای باز کردن آن وجود دارد.

در برخی پلتفرم‌های نرم‌افزاری مثل سیستم عامل macOS اپل، بهتر است این فرمت به فرمت‌های دیگری تبدیل شود.

ALAC فرمت بدون افت کیفیت اپل

اپل فرمت ALAC که مخفف Apple Lossless Audio Codec است را در سال ۲۰۰۴ معرفی کرد. این فرمت اختصاصی در سال ۲۰۱۱ سرانجام رایگان و متن باز شد. ALAC فرمت محبوبی است اما کمتر از FLAC فایل‌ها را فشرده می‌کند و علاوه بر این نرم‌افزارهای کمتری از این نوع فرمت صدا پشتیبانی می‌کنند. البته در iOS و iTunes اپل، این فرمت پشتیبانی می‌شود در حالی که FLAC به صورت پیش‌فرض پشتیبانی نمی‌شود.

WMA و صدای بدون افت کیفیت

فرمت WMA که قبلاً معرفی کردیم، فرمتی با فشرده‌سازی توأم با افت کیفیت است اما نوع دیگری از آن که پسوند مشابه دارد، حاوی صدایی است که بدون افت کیفیت فشرده شده است. این فرمت خاص از نظر میزان فشرده‌سازی، ضعیف‌تر از ALAC اپل و FLAC عمل می‌کند اما خوشبختانه در ویندوز و مک‌او‌اس به صورت پیش‌فرض پشتیبانی می‌شود.