در چه قالبی بهتر است موسیقی گوش دهید. سه نهنگ تلف شده
در چه قالبی بهتر است موسیقی گوش دهید. سه نهنگ تلف شده
Anonim

درک فرمت های صوتی دیجیتال اصلا آسان نیست. نتیجه گیری بدون ابهام حتی دشوارتر است. اگر به جدول مقایسه ای فرمت های صوتی در ویکی پدیا نگاه کنید، چشمان شما با ستون هایی از اعداد بی صدا موج می زند. بیایید سعی کنیم بفهمیم که چه چیزی پشت این ماجرا نهفته است.

در چه قالبی بهتر است موسیقی گوش دهید. سه نهنگ تلف شده
در چه قالبی بهتر است موسیقی گوش دهید. سه نهنگ تلف شده

بیایید فوراً رزرو کنیم که مقاله فقط در مورد ویژگی های کلی صحبت می کند و شامل برخی جزئیات نمی شود. در آینده، Lifehacker تحقیقات بی طرفانه خود را انجام خواهد داد. و امروز ما سعی خواهیم کرد که تجربه شناخته شده قبلی را به یک روش تعمیم دهیم.

یک آنالوگ و یک شکل وجود دارد.

آنالوگ خوب است، اما کوتاه مدت و ناخوشایند است. بنابراین، رسانه های آنالوگ، با وجود فروش بالای وینیل، بازگشتی ندارند.

صوتی دیجیتال می تواند سه نوع اصلی باشد:

  • در قالبی که از فشرده سازی استفاده نمی کند.
  • در قالبی که از فشرده سازی بدون تلفات استفاده می کند.
  • در قالبی که از فشرده سازی با اتلاف استفاده می کند.

در نگاه اول، فرمت های بدون ضرر امیدوارکننده تر هستند. همیشه اینطور نیست، زیرا در یکی از مطالب زیر با جزئیات بیشتر بحث خواهیم کرد. فرمت‌های غیرفشرده هیچ معنایی جز ذخیره ضبط اصلی مورد نیاز برای ایجاد محتوای صوتی ندارند. بازیابی آنها راحت تر است. ذخیره و گوش دادن به ضبط های خانگی اضافی است.

از بسیاری از پارامترهای صوتی دیجیتال، کاربر قبل از هر چیز باید به فرکانس نمونه برداری (دقت دیجیتالی کردن سیگنال آنالوگ در زمان)، عمق بیت (دقت دیجیتالی شدن در دامنه - بلندی)، نرخ بیت (میزان اطلاعات موجود در فایل در ثانیه).

امروز در مورد ضرر صحبت خواهیم کرد.

برای صدای فشرده، مفهوم مدل روان آکوستیک بسیار مهم است - ایده های دانشمندان و مهندسان در مورد نحوه درک یک فرد از صدا. گوش تمام طیف امواج صوتی را که به آن می رسد را درک می کند. با این حال، مغز سیگنال ها را پردازش می کند.

مقدار مرجع محدوده قابل شنیدن انسان از 16 هرتز تا 20 کیلوهرتز است، اما او قادر به شنیدن و آگاهی از همه صداهای دریافتی به طور همزمان نیست.

شنوایی گسسته و حساسیت شنوایی آن غیر خطی است.

مدل های روان آکوستیک مدرن به طور دقیق شنوایی انسان را ارزیابی می کنند و دائما در حال بهبود هستند. در واقع، علیرغم اطمینان دوستداران موسیقی، موسیقی دانان و علاقه مندان به صدا، برای یک گوش معمولی آموزش ندیده، ظاهر اولیه MP3 با حداکثر کیفیت به شدت محسوس شده است. استثناهایی وجود دارد، آنها نمی توانند وجود داشته باشند. اما همیشه با گوش دادن کور به راحتی قابل مشاهده نیستند.

قالب ها با استفاده از مدل های فشرده سازی روان آکوستیک

تعداد زیادی از این فرمت ها برای فشرده سازی صدا با اتلاف وجود دارد. رایج ترین آنها امروزه موارد زیر است.

OGG (Vorbis)

به طور کلی، یک فایل با پسوند *.ogg یک "کانتینر" است: می تواند حاوی چندین صدای ضبط شده با برچسب ها و ویژگی های خاص خود باشد. اغلب، فایل‌های ذخیره شده در آن با کدک Ogg Vorbis فشرده می‌شوند، اگرچه می‌توان از سایر فایل‌ها از جمله MP3 یا FLAC استفاده کرد.

مزایای اصلی آن شامل طیف گسترده ای از پارامترهای ممکن در هنگام رمزگذاری است: نرخ نمونه برداری صدا می تواند به 192 کیلوهرتز برسد، عمق بیت 32 بیت است. به‌طور پیش‌فرض، OGG از نرخ بیت متغیر استفاده می‌کند (اگرچه این نرخ در نمایش مشخصات نشان داده نمی‌شود)، که می‌تواند تا 1000 کیلوبیت بر ثانیه برسد.

MP3

برخلاف OGG رایگان، MP3 توسط انجمن Fraunhofer، انجمنی از موسسات آلمانی برای تحقیقات کاربردی، که برای آکوستیک مدرن بسیار مهم است، توسعه داده شد. به هر حال، در میان علاقه مندان به صدا، این یک دفتر بسیار محترم است، با این حال، آنها دوست ندارند آن را بپذیرند. اما تحولات آنها به دقت رصد می شود.

برخلاف OGG، می تواند هم متغیر (VBR) و هم نرخ بیت ثابت (CBR) داشته باشد. به هر حال، به لطف MP3 بود که کشف شد که هر ضبطی را نمی توان با کیفیت بالا با نرخ بیت متغیر رمزگذاری کرد (به دلایل بالا مراجعه کنید، الگوریتم های رمزگذاری و نتایج آنها در این مورد ممکن است هنگام رمزگذاری یک منبع متفاوت باشد.).

MP3 به دلیل قدمت بالای خود محدودیت های قابل توجهی دارد: عمق بیت می تواند 16-24 بیت باشد، فرکانس نمونه برداری فقط در مقادیر گسسته بیان می شود (8، 11، 025، 12، 16، 22، 05، 24، 32). ، 44، 1، 48)، نرخ بیت محدود به 320 کیلوبیت بر ثانیه است. علاوه بر این، در نسخه معمولی MP3، تعداد کانال ها به دو کانال محدود شده است.

AAC

همون چنگک فقط تو پروفیل. همچنین توسط انجمن Fraunhofer توسعه یافته است. بعدها و از یک مدل روان آکوستیک متفاوت، مدرن تر استفاده می کند. اطلاعات در دسترس عموم به ما امکان می دهد نتیجه گیری کنیم: بله، آنها توانستند خلق خود را بهبود بخشند.

حتی با ابتدایی ترین اعداد، AAC قالب انعطاف پذیرتری است. عمق بیت فایل های به دست آمده با کمک این توسعه از 16 تا 24 متغیر است، فرکانس نمونه برداری، در صورت تمایل، همچنین اجازه می دهد تصویر صدا را از دست ندهید و در محدوده 8-192 کیلوهرتز قرار دارد. جریان داده به طور کلی به فرمت های بدون اتلاف (تا 512 کیلوبیت در ثانیه) نزدیک می شود، در حالی که حداکثر تعداد کانال های فایل AAC به 48 می رسد.

کدام فرمت قطعا بهترین است

با توجه به اینکه AAC MP3 پس از ده ها سال دوباره طراحی شده است، پس انتخاب به نفع آن است. در صورت تمایل، مقایسه MP3 و OGG منطقی است. بیایید نگاهی بیندازیم به تصاویر ساخته شده توسط آندری آسپیدوف محترم از سایت ixbt.com:

1
1

روی نمودارها - AudioCD خوب، OGG با نرخ بیت متغیر 350 کیلوبیت در ثانیه فشرده شده و MP3 با استفاده از Lame. هر چه نمودار پایین تر باشد، صدا به اصل نزدیک تر است. عکس بسیار جالبی به نظر می رسد. علیرغم این واقعیت که MP3 به وضوح فرکانس های بالا را کاهش می دهد، برخلاف OGG، که در آن می توانید انسداد زیر 2 کیلوهرتز را مشاهده کنید.

2
2

توزیع فرکانس-زمان صدا از چیزهای کمتر جالبی صحبت می کند. با نرخ بیت ثابت 320 کیلوبیت بر ثانیه، MP3 تقریباً مشابه ضبط اصلی است. به نظر می رسد اکنون همه چیز سر جای خود قرار گرفته است. اما … در واقع، همه چیز حتی بیشتر گیج کننده است.

چرا وقتی که بدون ضرر در دسترس است، اصلاً از Lossy استفاده کنید

حس مشترک.

واقعیت این است که بیشتر ضبط‌های آنالوگ حاوی مقدار اطلاعاتی نیستند که باید در قالب‌های با کیفیت بالا ذخیره شوند. فراموش نکنید که نرخ نمونه برداری بومی برای CD 44.1 کیلوهرتز است، کوانتیزاسیون تنها 16 بیت است.

نمودارهای قبلی وفاداری بالای انتقال MP3 را به خوبی نشان می دهند. اما برای یک نوار کاست صوتی، نوار مغناطیسی (مگر اینکه، البته، این یک نوار اصلی باشد)، ویژگی های CD Audio دست نیافتنی است. و برای تجهیزات استودیو انبوه، توانایی ضبط صدای آنالوگ مربوط به AudioCD نسبتاً اخیرا ظاهر شده است. دیجیتالی کردن ضبط کنسرت در FLAC (و حتی بیشتر از آن در WAV) یک ضبط کنسرت یا یک دیسک مربوط به دوران پیش از دیجیتال، به ویژه آنهایی که از رسانه های مغناطیسی ساخته شده اند، هیچ فایده ای ندارد. آنها حاوی آن طیف ها و مقدار اطلاعاتی نیستند که می توانند توسط ظروف بدون فشرده سازی ذخیره شوند.

آنچه امروز تغییر کرده است

یک مهندس صدای کمیاب یک ضبط اصلی دیجیتال (که سپس در رسانه فیزیکی تکثیر می شود)، با استفاده از فناوری های مدرن به طور کامل انجام می دهد. بنابراین، احتمال اینکه یک آهنگ 24 بیتی در واقع فقط 16 بیتی باشد بسیار زیاد است.

امروزه پیدا کردن ضبط با کیفیت بالا آنالوگ بر روی تجهیزات باکیفیت حتی دشوارتر است - البته فقط برای طرفداران این صدا. به عنوان مثال، جک وایت، رهبر سابق گروه راه راه سفید است. در عین حال، برخی از ضبط‌های او به انواع لو-فای اشاره می‌کنند و جستجوی ویژگی‌های صدای ظالمانه آهنگ در آنجا به نوعی لذت برای خوش‌خوراک‌ها تبدیل می‌شود.

اگر منبع ایده آلی را تصور کنید، تنها گوش آموزش دیده یا گوش دادن به تجهیزات صوتی با کیفیت بالا به شما امکان می دهد یک فایل فشرده را پیدا کنید. و در حال حاضر بر اساس این (و فراموش نکردن ادراک)، ارزش نتیجه گیری زیر را دارد:

AAC برای تجهیزات با قیمت متوسط لازم و کافی است، در صورت عدم وجود آن (و در صورت عدم وجود منابعی که می توانند در AAC کدگذاری شوند) - MP3 با نرخ بیت ثابت 320 کیلوبیت در ثانیه، ایجاد شده با استفاده از کدک Lame 3.93 (کلیدهای توصیه شده برای رمزگشایی: -cbr -b320 -q0 -k -ms).

استثناها، ضبط‌هایی هستند که در ابتدا با کیفیت بالا ضبط شده‌اند، مثلاً روی DVD-Audio، SACD، یا ضبط‌هایی که در ابتدا در DSD (یا فرمت مشابه) با نرخ بیت بالا جمع‌آوری شده‌اند.

اگرچه بی ضرر دارای برخی ویژگی ها است. و دفعه بعد در مورد آنها خواهیم گفت.

توصیه شده: