آشنایی با صدای Lossless، صدای با وضوح بالا و صدای فراگیر

25 خرداد 1400 ساعت 09:00

اپل اخیراً قابلیت صدای بدون افت کیفیت (Lossless) را برای سرویس استریم موزیک خود معرفی کرد. این شرکت همچنین قابلیت‌های صدای رزولوشن بالا و صدای سوراند توسط رمزگذاری دالبی اتموس را به این سرویس اضافه خواهد کرد.

اپل حالا به لیست سرویس‌هایی مانند تیدال، آمازون موزیک، دیزر و کوباز اضافه شد که از قابلیت صدای بدون افت کیفیت پشتیبانی می‌کنند. اسپاتیفای نیز چند ماه زودتر از اپل سرویس اسپاتیفای های‌فای خود را معرفی کرد که قابلیت صدای بدون افت کیفیت را در اختیار مشترکین خود قرار می‌دهد. اپل قصد دارد تا با عرضه‌ی ویژگی صدای بدون افت کیفیت، تبدیل به بزرگ‌ترین سرویس استریم موزیکی شود که از این ویژگی پشتیبانی می‌کند. حالا میلیون‌‌ها نفر خواهند توانست تا بدون پرداخت هیچ‌گونه هزینه‌ی اضافی از این ویژگی بهره‌مند شوند.

سوال اصلی این است که ویژگی صدای بدون افت کیفیت، صدای رزولوشن بالا و دالبی اتموس چیست؟ در این مقاله به معرفی این فناوری‌ها و ارائه‌ی توضیحاتی در خصوص آن‌ها خواهیم پرداخت.

نکات ابتدایی

صدایی که ما می‌شونیم، صدای آنالوگ است. در گذشته، رسانه‌هایی که این صدا را در اختیار ما قرار می‌دادند نیز آنالوگ بود. نوار کاست‌ها و صفحه وینیل (یا صفحه گرامافون) نیز نمونه‌ای از این صداست. نوار کاست‌ها تا چند سال قبل نیز مورد استفاده قرار می‌گرفت و صفحه‌ وینیل نیز کماکان در بین طرفداران از محبوبیت بالایی برخوردار است.

با این وجود، ضبط صدا به‌صورت آنالوگ محدودیت زیادی را بر روی کیفیت اطلاعات ضبط‌‍‌شده قرار می‌دهد. به همین دلیل این فناوری به تدریج در دنیای دیجیتال منسوخ شد و صدای دیجیتال جایگزین آن شد.

سیگنال آنالوگ همانند یک موج سینوسی متوالی است. برای نمایش این سیگنال در محیط دیجیتال از تکنیکی به نام مدولاسیون کد پالس (PCM) استفاده می‌شود. امروزه بیشتر صداهای دیجیتال از این تکنیک بهره می‌برند. مدولاسیون کد پالس و یا تکنیک جدیدتر مدولاسیون کد پالس خطی (LPCM) با نمونه‌برداری دقیق از زمان و دامنه‌ی موج سینوسی ذکرشده عمل می‌کنند. کیفیت تبدیل صدای آنالوگ به دیجیتال به تعداد دفعات نمونه‌برداری (نرخ نمونه‌برداری) و تعداد واحدهای دیجیتال موجود برای نمایش هر نمونه (عمق بیت) بستگی دارد. از نظر تئوری هرچه این واحدهای دیجیتال بالاتر باشند، سیگنال دیجیتال به‌وجودآمده به صدای آنالوگ اصلی نزدیک‌تر خواهد بود.

از آن جایی که نمونه‌برداری در نقاطی مشخص بر روی یک سیگنال متوالی صورت می‌گیرد، برای پرکردن فواصل بین نقطه‌ها از فرآیندی به نام Quantization استفاده می‌شود. این فرآیند باعث ایجاد نویز در صدا می‌شود و میزان نویز صدا در سیگنال تبدیل‌شده با عمق بیت رابطه‌ی معکوس دارد. از این رو افزایش عمق بیت سیگنال دیجیتال باعث کاهش نویز و در نتیجه افزایش دامنه‌ی پویا می‌شود.

البته بسیاری از صداهای دیجیتال امروزی از نویز پس‌زمینه‌ی کمی برخوردارند. دلیل این امر استفاده از تکنیکی به نام Dithering بوده که الگوی نویز طبیعی ناشی از فرآیند Quantization را با الگوی نویز دلخواه ما جایگزین می‌کند. این تکنیک به ما اجازه می‌دهد تا نویز دلخواه خود را در قسمت مورد نظر خود بر روی طیف فرکانس داشته باشیم. با این تکنیک ما می‌توانیم نویز Quantization را با نویزی جزئی‌تر و یک‌دست‌تر جایگزین کنیم که کمتر قابل شنیدن باشد و در فرکانسی قرار بگیرد که گوش ما نسبت به آن حساسیت کمتری دارد.

گوش انسان به امواج صوتی بین ۲۰ هرتز و ۲۰٫۰۰۰ هرتز حساس است. با این حال بسیاری از افراد به دامنه صوتی کمتری حساس هستند. این نکته در مورد دامنه صوتی نزدیک به ۲۰٫۰۰۰ هرتز بیشتر صدق می‌کند. همچنین با افزایش عمر انسان، دامنه شنوایی او کاهش پیدا کرده و صداهای کمتری از فرکانس بالا را می‌شنود.

برای اطمینان از این‌که صدای ضبط‌‌شده حداقل فرکانس ۲۰٫۰۰۰ هرتز را پوشش دهد، نرخ نمونه‌برداری باید دست‌ کم دوبرابر این مقدار باشد و این مورد از قاعده‌ی نایکوئیست-شنون (Nyquist-Shannon) پیروی می‌کند. از این رو برای دسترسی به فرکانس ۲۰٫۰۰۰ هرتز به نرخ نمونه‌برداری ۴۰٫۰۰۰ هرتز نیاز خواهیم داشت. امروزه فرمت استاندارد صدای دیجیتال Audio CD نام دارد که از ۱۶ بیت اطلاعات با نرخ نمونه‌برداری ۴۴٫۱۰۰ هرتز و مدولاسیون کد پالس خطی استفاده می‌کند. با وجود عمر ۴۰ ساله‌ی خود، این فرمت کماکان استاندارد اصلی در صدای دیجیتال بوده و به عنوان مقیاسی برای ارزشیابی فرمت‌های دیگر مورد استفاده قرار می‌گیرد.

با این حال، استریم و یا دانلود فایل‌های Audio CD به دلیل حجم بالای آن‌ها چندان آسان نیست. این مشکل به ویژه در گذشته که سرعت اینترنت پایین‌تر بود، بیشتر به چشم می‌خورد. مدتی بعد ابداعی به نام صدای فشرده صورت گرفت که محبوبیت بالایی را به دست آورد. فشرده‌سازی امری عادی در دنیای کامپیوتر برای کاهش حجم فایل‌هاست. برای مثال تبدیل چندین فایل به یک فایل زیپ، حجم آن‌ها را کاهش می‌دهد. با این وجود، فشرده‌سازی فایل‌ها در بیشتر مواقع تاثیری منفی بر کیفیت فایل‌ها خواهد داشت.

به‌طور کلی، فشرده‌سازی صدا تفاوت زیادی با فشرده‌سازی دیگر نوع فایل‌ها دارد. فایل‌های صوتی دارای بخش‌هایی هستند که شنیدن آن توسط گوش انسان تقریباً غیرممکن است. از این رو، حذف این قسمت از فایل تاثیری بر کیفیت نهایی آن نخواهد داشت و در نتیجه فشرده‌سازی آن، آسیب مهمی به فایل نمی‌رساند.

در گذشته برای فشرده‌سازی فایل‌‌های صوتی از تکنیک MP3 استفاده می‌شد اما با گذشت زمان روش‌های جدیدی برای این کار ابداع شد که اطلاعات بیشتری را در فضایی کمتر ذخیره می‌کرد. امروزه فایل‌های صوتی Lossy در تمام سرویس‌های استریم موزیک و ویدیو، پادکست‌ها و حتی کتاب‌های صوتی یافت می‌شود. این نوع فایل‌ها به قدری رایج شده که بسیاری از افراد نمی‌دانند که فایل صوتی آن‌ها فشرده شده است. این نوع فایل‌های صوتی ما را به بحث بعدی مقاله می‌رساند.

مطالب مرتبط:

صدای Lossless چیست؟

در ابتدا باید به این نکته اشاره کرد که صدای بدون افت کیفیت (Lossless) به معنای صدای فشرده‌نشده نیست. بسیاری از افراد این دو صدا را با یکدیگر اشتباه گرفته و از آن‌ها به جای یکدیگر استفاده می‌کنند. همان‌طور که قبلاً گفته شد، شما می‌توانید یک فایل را با حذف برخی از قسمت‌های آن فشرده‌سازی کرده و حجم آن را تا حد زیادی کاهش دهید. شما همچنین می‌توانید فایل را به گونه‌ای فشرده‌سازی کنید که اطلاعات آن دست نخورده باقی بماند اما در این روش حجم فایل کاهش پیدا نمی‌کند. این مورد دوم فشرده‌سازی بدون افت کیفیت نام دارد.

صدای بدون افت کیفیت صدایی است که با تکنیک‌های مختلف فشرده‌سازی شده و تمام اطلاعات فایل اصلی درون آن قرار دارد. نتیجه این فرآیند، صدایی است که حجم بیشتری نسبت به صدای Lossy داشته اما استریم و یا دانلود آن آسان‌تر از فایل اصلی است. در حالی که تکنیک فشرده‌سازی Lossy در سالیان اخیر پیشرفت زیادی داشته و بسیاری از افراد تفاوت این نوع فایل با فایل Lossless را حس نمی‌کنند اما این نوع فایل‌ها کماکان حذفیات زیادی دارند. از این رو افرادی که می‌خواهند کیفیت فایل اصلی را با حجم کمتری در اختیار داشته باشند، امکان استفاده از فایل بدون افت کیفیت را دارند.

دلیل اصلی ابداع فشرده‌سازی Lossy، ساده‌کردن پخش فایل‌ها در اینترنت بوده است اما با افزایش پهنای باند، پیشرفت دستگاه‌های کامپیوتری و افزایش حافظه‌ی آن‌ها، استفاده از فایل‌های دست‌نخورده‌ی اصلی به امری آسان تبدیل شده است. استریم موزیک نیز مشکل کمبود فضا را حل کرده و بیشتر افراد از سرویس‌های استریم موزیک برای پخش موزیک مورد علاقه‌ی خود استفاده می‌کنند.

در واقع فایل Lossless همان فایل صوتی اصلی بوده که باید سال‌ها پیش با فرمت Audio CD منتشر می‌شد در حالی که صدای Lossless لزوماً کیفیت Audio CD را نداشته اما بسیاری از شرکت‌ها این نوع فایل‌ها را تحت عنوان “CD-Quality” منتشر می‌کنند. با این حال، بسیاری از افراد به دنبال کیفیت بالاتر بوده و از صدای با وضوح بالا استفاده می‌کنند.

صدای با وضوح بالا

صدای با وضوح بالا با صدای Lossless یکسان نیست. صدای با وضوح بالا می‌تواند با فرمت Lossy و یا Lossless عرضه شود. صدای Lossless نیز می‌تواند با وضوح بالا و یا با وضوح پایین منتشر شود. اپل فایل‌های صوتی با وضوح بالای خود را با کدک ALAC و CD Quality ارائه کرده و آمازون نیز از رویکرد مشابهی استفاده می‌کند. در طرف دیگر، سرویس تیدال فایل‌های CD Quality خود را با کدک FLAC و فایل‌های با وضوح بالا را با کدک MQA منتشر کرده است. کدک‌های ALAC و FLAC از نوع Lossless بوده و MQA از نوع Lossy است.

به زبان ساده، فایل‌ صوتی با وضوح بالا از عمق بیت و نرخ نمونه‌برداری بیشتری برخوردار است. دامنه پویای این نوع فایل‌ها معمولاً ۲۴ بیت بوده و نرخ نمونه‌برداری آن‌ها ۸۸٫۲۰۰ هرتز می‌باشد هرچند که این این نرخ گاهی اوقات تا ۱۹۲٫۰۰۰ هرتز و یا ۳۸۴٫۰۰۰ هرتز نیز بالا می‌رود. شرکت سونی نیز صدای با وضوح بالای خود را تحت عنوان Hi-Res ارائه داده است.

بسیاری از افراد بر این باورند که صدای با وضوح بالا کاربرد زیادی نداشته چرا که صدای Audio CD با نرخ نمونه‌برداری ۴۴٫۱۰۰ هرتز و دامنه پویای ۱۶ بیت به قدری کامل است که جای پیشرفت زیادی را باقی نگذاشته است. برای ارزیابی صدای با وضوح بالا ابتدا به بررسی برخی از ویژگی‌های آن می‌پردازیم.

صدای با وضوح بالا از عمق بیت بیشتری بهره می‌برد. زمانی که در تبدیل فایل آنالوگ به دیجیتال عمق بیت را کاهش دهیم، نویز صدا در زمان تبدیل آن از دیجیتال به آنالوگ در فرآیند Quantization افزایش پیدا می‌کند. در واقع با افزایش عمق بیت، میزان نویز صدا کاهش پیدا کرده و در نتیجه دامنه پویا افزایش پیدا خواهد کرد. با این حال حتی صدای ۱۶ بیت نیز دامنه پویای ۹۶ دسی‌بل را ارائه می‌دهد که به شدت به حداکثر محدوده‌ی شنوایی انسان نزدیک است (۱۲۰ دسی‌بل). این در حالی است که صدای ۲۴ بیت نیز دامنه‌ی پویای ۱۴۴ دسی‌بل را به همراه دارد که غیرقابل شنیدن است.

نکته بعدی این است که نویز صدا حتی در فایل‌های ۱۶ بیتی به‌گونه‌ای قابل کاهش و تنظیم بوده که گوش انسان قادر به شنیدن آن نباشد. شما می‌توانید دامنه پویای سیگنال ۱۶ بیتی را با تنظیم نویز آن به بیش از ۱۲۰ دسی‌بل برسانید. از این رو صدای ۱۶ بیتی مناسب گوش انسان می‌باشد.

صدای با وضوح بالا از نرخ نمونه‌برداری بالا نیز پشتیبانی می‌کند. این نوع صدا نرخ نمونه‌برداری ۱۹۶٫۰۰۰ هرتز را ارائه می‌دهد که برای شنیدن آن به محدوده‌ی شنوایی ۹۶٫۰۰۰ هرتز نیاز است. این در حالی است که محدوده‌ی شنوایی انسان در بهترین حالت خود ۲۰٫۰۰۰ هرتز است. همچنین تولید صدایی با چنین فرکانس بالا، فشار زیادی را بر دستگاه‌های تولیدکننده وارد می‌کند.

نرخ نمونه‌برداری بالا و عمق بیت بالا مزیت‌های متعددی دارند اما این مزیت‌ها بیشتر در تولید موزیک به کار می‌آیند. کارکردن با این نوع صدا همانند کارکردن با تصویر RAW است. تولیدکنندگان موزیک می‌توانند نویز کمتری را در تولید این نوع فایل‌های صوتی ایجاد کرده و در نهایت این فایل موزیک را به‌صورت ۱۶ بیتی و با نرخ نمونه‌برداری ۴۴٫۱۰۰ هرتز تولید کنید.

صدای با وضوح بالا در ابتدا نتوانست جایگاه خاصی را در بین کاربران کسب کند چرا که شرکت‌های بسیاری از جمله سرویس‌های استریم موزیک و شرکت‌های تولیدکننده‌ی سخت‌افزار این قابلیت را با هزینه‌‌ای بالا در اختیار کاربران قرار می‌دادند. بسیاری از تبدیل‌کنندگان آنالوگ به دیجیتال (DAC) تنها از صدای ۱۶ بیت و ۴۸٫۰۰۰ هرتز پشتیبانی می‌کنند. به همین دلیل است که اپل از کاربران درخواست کرده تا برای پخش فایل‌های با وضوح بالا در سرویس اپل موزیک از DAC اکسترنال استفاده کنند.

با این وجود، صدای با وضوح بالا در سالیان اخیر پیشرفت چشمگیری داشته است. امروزه حتی گوشی‌های هوشمند اقتصادی نیز قابلیت پخش صدای ۲۴ بیت و ۱۹۶٫۰۰۰ هرتز را دارند. در حال حاضر برخی از بهترین تبدیل‌کنندگان آنالوگ به دیجیتال با قیمتی حدود ۱۰۰ دلار به فروش می‌رسند. تنها مشکل موجود، نبود محتوای با وضوح بالای کافی می‌باشد.

صدای فراگیر

دالبی به داشتن چندین کدک صدای سوراند مختلف مشهور بوده و یکی از بزرگ‌ترین نام‌ها در دنیای سینما است. با این حال، بیشتر فرمت‌های صدای سوراند از کانال‌های مشخصی مانند ۵٫۱ و یا ۷٫۱ پشتیبانی می‌کنند. از این رو صدا باید در کانال‌های مورد نظر قرار بگیرند تا تجربه‌ی مورد نظر کارگردان برای شنوندگان ارائه شود.

دالبی اتموس به جای صدای وابسته به کانال از صدای وابسته به شی استفاده می‌کند. در این روش، مهندس صدا تنها باید صدا را در محیطی سه‌بعدی در اطراف شنونده قرار دهد و سپس سیستم به‌صورت خودکار صدا را از بهترین بلندگو پخش می‌کند. این ویژگی همچنین باعث می‌شود تا تنها با افزایش تعداد بلندگوها به تعداد کانال‌های بی‌نهایتی دسترسی پیدا کنیم. این ویژگی در صدای وابسته به کانال وجود ندارد.

دالبی اتموس همچنین عنصر ارتفاع را نیز به صدا اضافه کرده است. با استفاده از این ویژگی می‌توان بلندگو را در بالای سر شنونده قرار داد و صدا را به گونه‌ای تنظیم کرد که انگار از بالا شنیده می‌شود. فناوری دالبی اتموس در صنعت موسیقی نیز مورد استفاده قرار می‌گیرد.

حالا شرکت اپل از دالبی اتموس در فناوری صدای فراگیر (Spatial Audio) خود استفاده می‌کند. صدای فراگیر در محتواهای ویدیویی ایرپادز پرو و ایرپادز مکس قابل استفاده بود. این فناوری با استفاده از اطلاعات فایل صوتی، محیطی سه‌بعدی را در اطراف شما ایجاد می‌کند. این فناوری همچنین از ژیروسکوپ و شتاب‌سنج دستگاه‌هایی مانند ایرپاد برای ردیابی مکان سر کاربر استفاده کرده و صدا را با توجه به جایگاه سر پخش می‌کند.

این فناوری در تمام نسخه‌های ایرپاد و دستگاه‌های بیتس با پردازنده W1/H1 و همچنین تمام آیفون‌ها، آی‌پدها و مک‌های مجهز به بلندگوی استریو قابل استفاده خواهد بود. با این وجود، این فناوری در عمل چندان موفق نبوده و بیشتر کاربران به جای آن از صدای استریوی استاندارد استفاده می‌کنند.

صدای بلوتوث

تا اینجای کار تنها در مورد صدا در دنیای هدست‌های باسیم صحبت کردیم اما امروزه بسیاری از افراد از ایربادهای بلوتوثی مانند ایرپاد و یا هدست بلوتوثی سونی WH-1000XM4 و بلندگوهای بلوتوثی استفاده می‌کنند.

صدای بلوتوث علاوه بر پیچیدگی‌های خود از یک مشکل بزرگ رنج می‌برد. تمام صداهای ارسال‌شده برای بلوتوث به‌صورت فشرده می‌باشند. این مشکل برای تمام کدک‌ها از جمله SBC ،AAC ،aptX ،LDAC و LHDC صدق می‌کند. در حال حاضر بلوتوث پهنای باند مورد نیاز برای انتقال صدای Lossless را نداشته و این مشکل تا به امروز حل نشده است.

کیفیت صدای بلوتوث بسته به کدک استفاده‌شده برای انتقال بلوتوث متفاوت بوده و حتی در صورتی که بیت ریت کدک بلوتوث از فایل صوتی بیشتر باشد، نتیجه‌ی بهتری را دریافت خواهید کرد. با این وجود، کیفیت صدای بلوتوث در بهترین حالت از صدای Lossy بهتر بوده و هرگز به کیفیت صدای Lossless نمی‌رسد.

جمع‌ بندی

مباحث زیادی در این مقاله مورد بررسی گرفت اما در نهایت دنیای موسیقی فراتر از امواج و بیت‌ها بوده و هدف از گوش‌کردن به موسیقی لذت‌بردن از آن است. با این وجود، یادگیری و بررسی مباحث مرتبط با صدا و موسیقی برای بسیاری از افراد لذتی مشابه گوش‌کردن به موسیقی دارد.

اگر شما جزو این دسته از افراد هستید، مطالعه‌ی این مقاله می‌تواند تا حدودی شما را با برخی مفاهیم مربوط به صدا آشنا کند. با این حال اگر علاقه‌ای به مباحث پیچیده و گاهاً سردرگم‌کننده‌ی صدا ندارید، می‌توانید همانند گذشته به موسیقی مورد علاقه‌ی خود گوش کرده و از آن لذت ببرید چرا که این نکته مهم‌ترین بخش موسیقی است.

منبع: GSMArena