اپل اخیراً قابلیت صدای بدون افت کیفیت (Lossless) را برای سرویس استریم موزیک خود معرفی کرد. این شرکت همچنین قابلیتهای صدای رزولوشن بالا و صدای سوراند توسط رمزگذاری دالبی اتموس را به این سرویس اضافه خواهد کرد.
اپل حالا به لیست سرویسهایی مانند تیدال، آمازون موزیک، دیزر و کوباز اضافه شد که از قابلیت صدای بدون افت کیفیت پشتیبانی میکنند. اسپاتیفای نیز چند ماه زودتر از اپل سرویس اسپاتیفای هایفای خود را معرفی کرد که قابلیت صدای بدون افت کیفیت را در اختیار مشترکین خود قرار میدهد. اپل قصد دارد تا با عرضهی ویژگی صدای بدون افت کیفیت، تبدیل به بزرگترین سرویس استریم موزیکی شود که از این ویژگی پشتیبانی میکند. حالا میلیونها نفر خواهند توانست تا بدون پرداخت هیچگونه هزینهی اضافی از این ویژگی بهرهمند شوند.
سوال اصلی این است که ویژگی صدای بدون افت کیفیت، صدای رزولوشن بالا و دالبی اتموس چیست؟ در این مقاله به معرفی این فناوریها و ارائهی توضیحاتی در خصوص آنها خواهیم پرداخت.
نکات ابتدایی
صدایی که ما میشونیم، صدای آنالوگ است. در گذشته، رسانههایی که این صدا را در اختیار ما قرار میدادند نیز آنالوگ بود. نوار کاستها و صفحه وینیل (یا صفحه گرامافون) نیز نمونهای از این صداست. نوار کاستها تا چند سال قبل نیز مورد استفاده قرار میگرفت و صفحه وینیل نیز کماکان در بین طرفداران از محبوبیت بالایی برخوردار است.
با این وجود، ضبط صدا بهصورت آنالوگ محدودیت زیادی را بر روی کیفیت اطلاعات ضبطشده قرار میدهد. به همین دلیل این فناوری به تدریج در دنیای دیجیتال منسوخ شد و صدای دیجیتال جایگزین آن شد.
سیگنال آنالوگ همانند یک موج سینوسی متوالی است. برای نمایش این سیگنال در محیط دیجیتال از تکنیکی به نام مدولاسیون کد پالس (PCM) استفاده میشود. امروزه بیشتر صداهای دیجیتال از این تکنیک بهره میبرند. مدولاسیون کد پالس و یا تکنیک جدیدتر مدولاسیون کد پالس خطی (LPCM) با نمونهبرداری دقیق از زمان و دامنهی موج سینوسی ذکرشده عمل میکنند. کیفیت تبدیل صدای آنالوگ به دیجیتال به تعداد دفعات نمونهبرداری (نرخ نمونهبرداری) و تعداد واحدهای دیجیتال موجود برای نمایش هر نمونه (عمق بیت) بستگی دارد. از نظر تئوری هرچه این واحدهای دیجیتال بالاتر باشند، سیگنال دیجیتال بهوجودآمده به صدای آنالوگ اصلی نزدیکتر خواهد بود.
از آن جایی که نمونهبرداری در نقاطی مشخص بر روی یک سیگنال متوالی صورت میگیرد، برای پرکردن فواصل بین نقطهها از فرآیندی به نام Quantization استفاده میشود. این فرآیند باعث ایجاد نویز در صدا میشود و میزان نویز صدا در سیگنال تبدیلشده با عمق بیت رابطهی معکوس دارد. از این رو افزایش عمق بیت سیگنال دیجیتال باعث کاهش نویز و در نتیجه افزایش دامنهی پویا میشود.
البته بسیاری از صداهای دیجیتال امروزی از نویز پسزمینهی کمی برخوردارند. دلیل این امر استفاده از تکنیکی به نام Dithering بوده که الگوی نویز طبیعی ناشی از فرآیند Quantization را با الگوی نویز دلخواه ما جایگزین میکند. این تکنیک به ما اجازه میدهد تا نویز دلخواه خود را در قسمت مورد نظر خود بر روی طیف فرکانس داشته باشیم. با این تکنیک ما میتوانیم نویز Quantization را با نویزی جزئیتر و یکدستتر جایگزین کنیم که کمتر قابل شنیدن باشد و در فرکانسی قرار بگیرد که گوش ما نسبت به آن حساسیت کمتری دارد.
گوش انسان به امواج صوتی بین ۲۰ هرتز و ۲۰٫۰۰۰ هرتز حساس است. با این حال بسیاری از افراد به دامنه صوتی کمتری حساس هستند. این نکته در مورد دامنه صوتی نزدیک به ۲۰٫۰۰۰ هرتز بیشتر صدق میکند. همچنین با افزایش عمر انسان، دامنه شنوایی او کاهش پیدا کرده و صداهای کمتری از فرکانس بالا را میشنود.
برای اطمینان از اینکه صدای ضبطشده حداقل فرکانس ۲۰٫۰۰۰ هرتز را پوشش دهد، نرخ نمونهبرداری باید دست کم دوبرابر این مقدار باشد و این مورد از قاعدهی نایکوئیست-شنون (Nyquist-Shannon) پیروی میکند. از این رو برای دسترسی به فرکانس ۲۰٫۰۰۰ هرتز به نرخ نمونهبرداری ۴۰٫۰۰۰ هرتز نیاز خواهیم داشت. امروزه فرمت استاندارد صدای دیجیتال Audio CD نام دارد که از ۱۶ بیت اطلاعات با نرخ نمونهبرداری ۴۴٫۱۰۰ هرتز و مدولاسیون کد پالس خطی استفاده میکند. با وجود عمر ۴۰ سالهی خود، این فرمت کماکان استاندارد اصلی در صدای دیجیتال بوده و به عنوان مقیاسی برای ارزشیابی فرمتهای دیگر مورد استفاده قرار میگیرد.
با این حال، استریم و یا دانلود فایلهای Audio CD به دلیل حجم بالای آنها چندان آسان نیست. این مشکل به ویژه در گذشته که سرعت اینترنت پایینتر بود، بیشتر به چشم میخورد. مدتی بعد ابداعی به نام صدای فشرده صورت گرفت که محبوبیت بالایی را به دست آورد. فشردهسازی امری عادی در دنیای کامپیوتر برای کاهش حجم فایلهاست. برای مثال تبدیل چندین فایل به یک فایل زیپ، حجم آنها را کاهش میدهد. با این وجود، فشردهسازی فایلها در بیشتر مواقع تاثیری منفی بر کیفیت فایلها خواهد داشت.
بهطور کلی، فشردهسازی صدا تفاوت زیادی با فشردهسازی دیگر نوع فایلها دارد. فایلهای صوتی دارای بخشهایی هستند که شنیدن آن توسط گوش انسان تقریباً غیرممکن است. از این رو، حذف این قسمت از فایل تاثیری بر کیفیت نهایی آن نخواهد داشت و در نتیجه فشردهسازی آن، آسیب مهمی به فایل نمیرساند.
در گذشته برای فشردهسازی فایلهای صوتی از تکنیک MP3 استفاده میشد اما با گذشت زمان روشهای جدیدی برای این کار ابداع شد که اطلاعات بیشتری را در فضایی کمتر ذخیره میکرد. امروزه فایلهای صوتی Lossy در تمام سرویسهای استریم موزیک و ویدیو، پادکستها و حتی کتابهای صوتی یافت میشود. این نوع فایلها به قدری رایج شده که بسیاری از افراد نمیدانند که فایل صوتی آنها فشرده شده است. این نوع فایلهای صوتی ما را به بحث بعدی مقاله میرساند.
مطالب مرتبط:
صدای Lossless چیست؟
در ابتدا باید به این نکته اشاره کرد که صدای بدون افت کیفیت (Lossless) به معنای صدای فشردهنشده نیست. بسیاری از افراد این دو صدا را با یکدیگر اشتباه گرفته و از آنها به جای یکدیگر استفاده میکنند. همانطور که قبلاً گفته شد، شما میتوانید یک فایل را با حذف برخی از قسمتهای آن فشردهسازی کرده و حجم آن را تا حد زیادی کاهش دهید. شما همچنین میتوانید فایل را به گونهای فشردهسازی کنید که اطلاعات آن دست نخورده باقی بماند اما در این روش حجم فایل کاهش پیدا نمیکند. این مورد دوم فشردهسازی بدون افت کیفیت نام دارد.
صدای بدون افت کیفیت صدایی است که با تکنیکهای مختلف فشردهسازی شده و تمام اطلاعات فایل اصلی درون آن قرار دارد. نتیجه این فرآیند، صدایی است که حجم بیشتری نسبت به صدای Lossy داشته اما استریم و یا دانلود آن آسانتر از فایل اصلی است. در حالی که تکنیک فشردهسازی Lossy در سالیان اخیر پیشرفت زیادی داشته و بسیاری از افراد تفاوت این نوع فایل با فایل Lossless را حس نمیکنند اما این نوع فایلها کماکان حذفیات زیادی دارند. از این رو افرادی که میخواهند کیفیت فایل اصلی را با حجم کمتری در اختیار داشته باشند، امکان استفاده از فایل بدون افت کیفیت را دارند.
دلیل اصلی ابداع فشردهسازی Lossy، سادهکردن پخش فایلها در اینترنت بوده است اما با افزایش پهنای باند، پیشرفت دستگاههای کامپیوتری و افزایش حافظهی آنها، استفاده از فایلهای دستنخوردهی اصلی به امری آسان تبدیل شده است. استریم موزیک نیز مشکل کمبود فضا را حل کرده و بیشتر افراد از سرویسهای استریم موزیک برای پخش موزیک مورد علاقهی خود استفاده میکنند.
در واقع فایل Lossless همان فایل صوتی اصلی بوده که باید سالها پیش با فرمت Audio CD منتشر میشد در حالی که صدای Lossless لزوماً کیفیت Audio CD را نداشته اما بسیاری از شرکتها این نوع فایلها را تحت عنوان “CD-Quality” منتشر میکنند. با این حال، بسیاری از افراد به دنبال کیفیت بالاتر بوده و از صدای با وضوح بالا استفاده میکنند.
صدای با وضوح بالا
صدای با وضوح بالا با صدای Lossless یکسان نیست. صدای با وضوح بالا میتواند با فرمت Lossy و یا Lossless عرضه شود. صدای Lossless نیز میتواند با وضوح بالا و یا با وضوح پایین منتشر شود. اپل فایلهای صوتی با وضوح بالای خود را با کدک ALAC و CD Quality ارائه کرده و آمازون نیز از رویکرد مشابهی استفاده میکند. در طرف دیگر، سرویس تیدال فایلهای CD Quality خود را با کدک FLAC و فایلهای با وضوح بالا را با کدک MQA منتشر کرده است. کدکهای ALAC و FLAC از نوع Lossless بوده و MQA از نوع Lossy است.
به زبان ساده، فایل صوتی با وضوح بالا از عمق بیت و نرخ نمونهبرداری بیشتری برخوردار است. دامنه پویای این نوع فایلها معمولاً ۲۴ بیت بوده و نرخ نمونهبرداری آنها ۸۸٫۲۰۰ هرتز میباشد هرچند که این این نرخ گاهی اوقات تا ۱۹۲٫۰۰۰ هرتز و یا ۳۸۴٫۰۰۰ هرتز نیز بالا میرود. شرکت سونی نیز صدای با وضوح بالای خود را تحت عنوان Hi-Res ارائه داده است.
بسیاری از افراد بر این باورند که صدای با وضوح بالا کاربرد زیادی نداشته چرا که صدای Audio CD با نرخ نمونهبرداری ۴۴٫۱۰۰ هرتز و دامنه پویای ۱۶ بیت به قدری کامل است که جای پیشرفت زیادی را باقی نگذاشته است. برای ارزیابی صدای با وضوح بالا ابتدا به بررسی برخی از ویژگیهای آن میپردازیم.
صدای با وضوح بالا از عمق بیت بیشتری بهره میبرد. زمانی که در تبدیل فایل آنالوگ به دیجیتال عمق بیت را کاهش دهیم، نویز صدا در زمان تبدیل آن از دیجیتال به آنالوگ در فرآیند Quantization افزایش پیدا میکند. در واقع با افزایش عمق بیت، میزان نویز صدا کاهش پیدا کرده و در نتیجه دامنه پویا افزایش پیدا خواهد کرد. با این حال حتی صدای ۱۶ بیت نیز دامنه پویای ۹۶ دسیبل را ارائه میدهد که به شدت به حداکثر محدودهی شنوایی انسان نزدیک است (۱۲۰ دسیبل). این در حالی است که صدای ۲۴ بیت نیز دامنهی پویای ۱۴۴ دسیبل را به همراه دارد که غیرقابل شنیدن است.
نکته بعدی این است که نویز صدا حتی در فایلهای ۱۶ بیتی بهگونهای قابل کاهش و تنظیم بوده که گوش انسان قادر به شنیدن آن نباشد. شما میتوانید دامنه پویای سیگنال ۱۶ بیتی را با تنظیم نویز آن به بیش از ۱۲۰ دسیبل برسانید. از این رو صدای ۱۶ بیتی مناسب گوش انسان میباشد.
صدای با وضوح بالا از نرخ نمونهبرداری بالا نیز پشتیبانی میکند. این نوع صدا نرخ نمونهبرداری ۱۹۶٫۰۰۰ هرتز را ارائه میدهد که برای شنیدن آن به محدودهی شنوایی ۹۶٫۰۰۰ هرتز نیاز است. این در حالی است که محدودهی شنوایی انسان در بهترین حالت خود ۲۰٫۰۰۰ هرتز است. همچنین تولید صدایی با چنین فرکانس بالا، فشار زیادی را بر دستگاههای تولیدکننده وارد میکند.
نرخ نمونهبرداری بالا و عمق بیت بالا مزیتهای متعددی دارند اما این مزیتها بیشتر در تولید موزیک به کار میآیند. کارکردن با این نوع صدا همانند کارکردن با تصویر RAW است. تولیدکنندگان موزیک میتوانند نویز کمتری را در تولید این نوع فایلهای صوتی ایجاد کرده و در نهایت این فایل موزیک را بهصورت ۱۶ بیتی و با نرخ نمونهبرداری ۴۴٫۱۰۰ هرتز تولید کنید.
صدای با وضوح بالا در ابتدا نتوانست جایگاه خاصی را در بین کاربران کسب کند چرا که شرکتهای بسیاری از جمله سرویسهای استریم موزیک و شرکتهای تولیدکنندهی سختافزار این قابلیت را با هزینهای بالا در اختیار کاربران قرار میدادند. بسیاری از تبدیلکنندگان آنالوگ به دیجیتال (DAC) تنها از صدای ۱۶ بیت و ۴۸٫۰۰۰ هرتز پشتیبانی میکنند. به همین دلیل است که اپل از کاربران درخواست کرده تا برای پخش فایلهای با وضوح بالا در سرویس اپل موزیک از DAC اکسترنال استفاده کنند.
با این وجود، صدای با وضوح بالا در سالیان اخیر پیشرفت چشمگیری داشته است. امروزه حتی گوشیهای هوشمند اقتصادی نیز قابلیت پخش صدای ۲۴ بیت و ۱۹۶٫۰۰۰ هرتز را دارند. در حال حاضر برخی از بهترین تبدیلکنندگان آنالوگ به دیجیتال با قیمتی حدود ۱۰۰ دلار به فروش میرسند. تنها مشکل موجود، نبود محتوای با وضوح بالای کافی میباشد.
صدای فراگیر
دالبی به داشتن چندین کدک صدای سوراند مختلف مشهور بوده و یکی از بزرگترین نامها در دنیای سینما است. با این حال، بیشتر فرمتهای صدای سوراند از کانالهای مشخصی مانند ۵٫۱ و یا ۷٫۱ پشتیبانی میکنند. از این رو صدا باید در کانالهای مورد نظر قرار بگیرند تا تجربهی مورد نظر کارگردان برای شنوندگان ارائه شود.
دالبی اتموس به جای صدای وابسته به کانال از صدای وابسته به شی استفاده میکند. در این روش، مهندس صدا تنها باید صدا را در محیطی سهبعدی در اطراف شنونده قرار دهد و سپس سیستم بهصورت خودکار صدا را از بهترین بلندگو پخش میکند. این ویژگی همچنین باعث میشود تا تنها با افزایش تعداد بلندگوها به تعداد کانالهای بینهایتی دسترسی پیدا کنیم. این ویژگی در صدای وابسته به کانال وجود ندارد.
دالبی اتموس همچنین عنصر ارتفاع را نیز به صدا اضافه کرده است. با استفاده از این ویژگی میتوان بلندگو را در بالای سر شنونده قرار داد و صدا را به گونهای تنظیم کرد که انگار از بالا شنیده میشود. فناوری دالبی اتموس در صنعت موسیقی نیز مورد استفاده قرار میگیرد.
حالا شرکت اپل از دالبی اتموس در فناوری صدای فراگیر (Spatial Audio) خود استفاده میکند. صدای فراگیر در محتواهای ویدیویی ایرپادز پرو و ایرپادز مکس قابل استفاده بود. این فناوری با استفاده از اطلاعات فایل صوتی، محیطی سهبعدی را در اطراف شما ایجاد میکند. این فناوری همچنین از ژیروسکوپ و شتابسنج دستگاههایی مانند ایرپاد برای ردیابی مکان سر کاربر استفاده کرده و صدا را با توجه به جایگاه سر پخش میکند.
این فناوری در تمام نسخههای ایرپاد و دستگاههای بیتس با پردازنده W1/H1 و همچنین تمام آیفونها، آیپدها و مکهای مجهز به بلندگوی استریو قابل استفاده خواهد بود. با این وجود، این فناوری در عمل چندان موفق نبوده و بیشتر کاربران به جای آن از صدای استریوی استاندارد استفاده میکنند.
صدای بلوتوث
تا اینجای کار تنها در مورد صدا در دنیای هدستهای باسیم صحبت کردیم اما امروزه بسیاری از افراد از ایربادهای بلوتوثی مانند ایرپاد و یا هدست بلوتوثی سونی WH-1000XM4 و بلندگوهای بلوتوثی استفاده میکنند.
صدای بلوتوث علاوه بر پیچیدگیهای خود از یک مشکل بزرگ رنج میبرد. تمام صداهای ارسالشده برای بلوتوث بهصورت فشرده میباشند. این مشکل برای تمام کدکها از جمله SBC ،AAC ،aptX ،LDAC و LHDC صدق میکند. در حال حاضر بلوتوث پهنای باند مورد نیاز برای انتقال صدای Lossless را نداشته و این مشکل تا به امروز حل نشده است.
کیفیت صدای بلوتوث بسته به کدک استفادهشده برای انتقال بلوتوث متفاوت بوده و حتی در صورتی که بیت ریت کدک بلوتوث از فایل صوتی بیشتر باشد، نتیجهی بهتری را دریافت خواهید کرد. با این وجود، کیفیت صدای بلوتوث در بهترین حالت از صدای Lossy بهتر بوده و هرگز به کیفیت صدای Lossless نمیرسد.
جمع بندی
مباحث زیادی در این مقاله مورد بررسی گرفت اما در نهایت دنیای موسیقی فراتر از امواج و بیتها بوده و هدف از گوشکردن به موسیقی لذتبردن از آن است. با این وجود، یادگیری و بررسی مباحث مرتبط با صدا و موسیقی برای بسیاری از افراد لذتی مشابه گوشکردن به موسیقی دارد.
اگر شما جزو این دسته از افراد هستید، مطالعهی این مقاله میتواند تا حدودی شما را با برخی مفاهیم مربوط به صدا آشنا کند. با این حال اگر علاقهای به مباحث پیچیده و گاهاً سردرگمکنندهی صدا ندارید، میتوانید همانند گذشته به موسیقی مورد علاقهی خود گوش کرده و از آن لذت ببرید چرا که این نکته مهمترین بخش موسیقی است.
منبع: GSMArena
نظرات