Opus აუდიო კოდეკი YouTube-ზე

ამ სტატიაში გვსურს ავხსნათ, თუ რა არის Opus Audio Codec და როგორ იყენებს მას YouTube.

რა არის Opus-ის აუდიო კოდეკი?

Opus არის აუდიო კოდეკი, რომელიც შემუშავებულია ციფრული აუდიო მონაცემების ეფექტური შეკუმშვისთვის. ის სტანდარტად მიღებულ იქნა ინტერნეტ ინჟინერიის სამუშაო ჯგუფის (IETF) მიერ 2012 წელს და მას მხარს უჭერს მრავალი აპლიკაცია და პლატფორმა, როგორიცაა WebRTC, Skype, WhatsApp, Discord, Mozilla Firefox და Google Chrome. Opus კოდეკი მოიცავს აუდიო სიხშირეების ფართო დიაპაზონს, მათ შორის მეტყველებას და მუსიკას, და გთავაზობთ მაღალი ხარისხის აუდიოს დაბალი ბიტური სიჩქარით. ის იყენებს წრფივი და არაწრფივი პროგნოზირებადი ფილტრების და ცვლადი სიგნალების კომბინაციას. შერჩევის მაჩვენებელიეფექტური შეკუმშვის უზრუნველსაყოფად. ეს საშუალებას იძლევა მაღალი ხარისხის აუდიო მონაცემების გადაცემა 6-დან 510 კბიტ/წმ-მდე დაბალი ბიტური სიჩქარით. Opus კოდეკის კიდევ ერთი უპირატესობა მისი ადაპტირებაა სხვადასხვა ქსელის პირობებთან. ის მხარს უჭერს ცვლად ბიტურ სიჩქარეს და შეუძლია კოდირების სიჩქარისა და ხარისხის რეალურ დროში რეგულირება არსებული ქსელის გამტარობის მიხედვით. ეს უზრუნველყოფს, რომ აუდიოს ხარისხი სტაბილური დარჩეს გადაცემის დროს, შეფერხებებისა და დაგვიანებების გარეშე.

როგორ იყენებს YouTube Opus Audio კოდეკს?

YouTube მხარს უჭერს Opus კოდეკს აუდიო გადაცემისთვის თავის ვიდეოებსა და პირდაპირ ეთერში. 2013 წლიდან YouTube იყენებს Opus კოდეკს, როგორც ნაგულისხმევ კოდეკს თავისი ვებ მედია ფლეერებისთვის და ასევე დანერგა ის თავისი მობილური აპლიკაციებისა და სტრიმინგის მოწყობილობებისთვის, როგორიცაა Chromecast და Google Home. YouTube იყენებს Opus კოდეკს რამდენიმე გზით. მაგალითად, YouTube იყენებს Opus კოდეკს ვიდეო კონტენტიდან აუდიო მონაცემების ამოსაღებად და მათ ცალკეულ აუდიო ნაკადებში შესანახად. YouTube ასევე იყენებს Opus კოდეკს პირდაპირი აუდიო გადაცემისთვის პირდაპირი ეთერის დროს. YouTube მხარს უჭერს Opus კოდეკს სხვადასხვა ბიტრეიტით, მათ შორის 128 კბ/წმ, 160 კბ/წმ და 192 კბ/წმ. YouTube ავტომატურად არეგულირებს Opus კოდეკის ბიტრეიტს ხელმისაწვდომი ქსელის გამტარუნარიანობისა და მომხმარებლის მოწყობილობის შესაძლებლობების მიხედვით, რათა უზრუნველყოს ოპტიმალური აუდიო ხარისხი და შეუფერხებელი დაკვრა. საერთო ჯამში, Opus კოდეკმა ხელი შეუწყო YouTube ვიდეოების აუდიო ხარისხის გაუმჯობესებას და დაკვრის ოპტიმიზაციას სხვადასხვა მოწყობილობებზე და სხვადასხვა ქსელის პირობებში.

გსურთ თქვენი სიმღერის საუკეთესო, დამახინჯების გარეშე დაკვრა ყველა პლატფორმაზე?

რომელ ბიტრეიტებს იყენებს Opus Audio Codec?

Opus აუდიო კოდეკს შეუძლია აუდიო კოდირებისთვის სხვადასხვა ბიტრეიტის გამოყენება. კოდეკი შექმნილია მაღალი აუდიო ხარისხის დაბალი ბიტრეიტით მიწოდებისთვის, მაგრამ ასევე მხარს უჭერს უფრო მაღალ ბიტრეიტებს კიდევ უფრო უკეთესი აუდიო ხარისხისთვის. Opus კოდეკის ტიპიური ბიტრეიტი 6 კბ/წმ-დან 510 კბ/წმ-მდეა. თუმცა, კოდეკს შეუძლია 768 კბ/წმ-მდე ბიტრეიტის მხარდაჭერა, თუ საჭიროა კიდევ უფრო მაღალი აუდიო ხარისხი. Opus კოდეკი იყენებს ცვლად ბიტრეიტს (VBR), რაც საშუალებას აძლევს მას რეალურ დროში შეცვალოს ბიტრეიტი აუდიო კონტენტის მოთხოვნებთან შესაბამისობაში. ეს ნიშნავს, რომ კოდეკი ავტომატურად ირჩევს უფრო მაღალ ბიტრეიტებს უფრო რთული აუდიო კონტენტისთვის და უფრო დაბალ ბიტრეიტებს უფრო მარტივი აუდიო კონტენტისთვის, რათა მიღწეული იქნას ოპტიმალური აუდიო ხარისხი და შეკუმშვა. პრაქტიკაში, ეს ნიშნავს, რომ Opus კოდეკი შესაფერისია აუდიო აპლიკაციების ფართო სპექტრისთვის, დაბალი ბიტრეიტით ხმოვანი მაუწყებლობიდან დაწყებული, მაღალი ბიტრეიტით მუსიკის სტრიმინგით დამთავრებული. თავად YouTube აპლიკაცია ხშირად იყენებს... მნიშვნელოვნად დაბალი ბიტრეიტი ვიდრე სმარტფონის ბრაუზერის ვერსია.

შეიძლება თუ არა Opus Audio კოდეკის გამოყენებისას დისტორსია წარმოიშვას?

დიახ, Opus კოდეკის გამოყენებისას შეიძლება წარმოიშვას დისტორსია. დისტორსია შეიძლება წარმოიშვას, თუ კოდეკი გამოიყენება ძალიან დაბალ ბიტრეიტზე ან თუ აუდიო მასალა ძალიან რთულია არჩეული ბიტრეიტისთვის. ამ შემთხვევებში, კოდეკი ვერ ინახავს საკმარის ინფორმაციას აუდიო მასალის შესახებ, რამაც შეიძლება გამოიწვიოს აუდიოს ხარისხის დაქვეითება და დისტორსია. დისტორსიის გამომწვევი კიდევ ერთი ფაქტორია კოდეკის იმპლემენტაციის წესი. თუ კოდეკი არ არის სწორად იმპლემენტირებული ან შეუთავსებელია გამოყენებულ პროგრამულ ან აპარატურულ უზრუნველყოფასთან, ასევე შეიძლება წარმოიშვას დისტორსია. თუმცა, მნიშვნელოვანია აღინიშნოს, რომ Opus კოდეკი ზოგადად ოპტიმიზირებულია მაღალი აუდიო ხარისხისთვის დაბალ ბიტრეიტზე. თუ კოდეკი გამოიყენება საკმარისი ბიტრეიტით და აუდიო მასალა არ არის ძალიან რთული, აუდიოს ხარისხი კარგი უნდა იყოს და დისტორსიის თავიდან აცილება შესაძლებელია.

როგორ ავიცილო თავიდან კოდეკის მიერ გამოწვეული დამახინჯება?

დამახინჯებების თავიდან ასაცილებლად, სტრიმინგის სერვისების სპეციფიკაციები როგორც წესი, თქვენი სიმღერა ისე უნდა დაასრულოთ, რომ კარგად ჟღერდეს და თუ ინტეგრირებული ხმამაღალი ხმა -14-ზე მაღალია, ლუფსი დატოვეთ 2 დბ ნამდვილი პიკური სიმაღლის სივრცე ნიმუშებს შორის პიკებით გამოწვეული დამახინჯებები თავის არიდება.

გსურთ იცოდეთ, იმუშავებს თუ არა თქვენი სიმღერა ყველა პლატფორმაზე? ჩვენი პროფესიონალური მიქს ანალიზი გეტყვით ამას.

Opus Codec-ს ხელოვნური ინტელექტის განახლება აქვს

ლიცენზიის გარეშე აუდიო კოდეკის Opus-ის ახალ ვერსიაში 1.5 ან 1.5.1 ხელოვნური ინტელექტი განახლდა. მანქანური სწავლება (ML) კოდირების გასაუმჯობესებლადაა განკუთვნილი, რათა მონაცემთა ნაკადი არსებულ დეკოდერებთან თავსებადი დარჩეს. დეკოდერი ასევე იღებს ხელოვნურ ინტელექტს ხმის გასაუმჯობესებლად.

 

ხელოვნური ინტელექტი უკეთესი ხმის ხარისხისთვის

ტექნიკა, სახელწოდებით „ნეირონული ვოკოდერი“, შექმნილია მეტყველების განსაკუთრებით ეფექტურად შეკუმშვისთვის. LPCNet ვოკოდერთან შედარებით, როგორც ამბობენ, ის ლეპტოპებზე ან სმარტფონებზე პროცესორის დატვირთვის მხოლოდ დაახლოებით ერთ პროცენტს მოითხოვს. დეველოპერები ალგორითმს Framewise AutoRegressive Generative Adversarial Network (FARGAN) უწოდებენ. ისინი მოგვიანებით გეგმავენ მასზე ნაშრომის გამოქვეყნებას.

ისინი ოპტიმიზაციას უკეთებენ სიგნალის დამუშავებას ხაზოვანი ადაპტური კოდირების გამაძლიერებლის (LACE) და არაწრფივი ვარიანტის (NoLACE) გამოყენებით. LACE იქცევა კლასიკური პოსტფილტრის მსგავსად, რომელშიც ღრმა ნეირონული ქსელი (DNN) მომენტალურად არეგულირებს კოეფიციენტებს ყველა არსებული მონაცემის გამოყენებით, თუმცა თავად აუდიო სიგნალი არ გადის DNN-ში. შედეგად მიიღება მცირე DNN ძალიან დაბალი სირთულით, რომელიც ასევე მუშაობს ძველ ტელეფონებზე. NoLACE ვარიანტი მოითხოვს მეტ გამოთვლით სიმძლავრეს, მაგრამ ასევე მნიშვნელოვნად უფრო მძლავრია არაწრფივი სიგნალის დამუშავების გამო. ორივე მნიშვნელოვნად აუმჯობესებს ხმის ხარისხს.

 

Opus კოდეკი: Bitstream სტანდარტებთან თავსებადი რჩება

სრულიად ახალი, ML-ზე დაფუძნებული კოდეკის პროგრამირების ნაცვლად, Opus სრულად თავსებადია. ეს უზრუნველყოფს, რომ Opus-ი განაგრძობს მუშაობას ძველ და ნელ მოწყობილობებზე, ამავდროულად გთავაზობთ მარტივ განახლების გზას. მიუხედავად იმისა, რომ ღრმა სწავლება ხშირად ასოცირდება ძლიერ GPU ამაჩქარებლებთან, Opus-ის პროექტმა ყველაფერი ოპტიმიზაცია გაუკეთა პროცესორების უმეტესობაზე, მათ შორის სმარტფონის CPU-ებზე.

მომხმარებელთა უმეტესობამ არ უნდა შეამჩნიოს გაზრდილი დატვირთვა, თუმცა მიკროპროცესორების ან ხუთ წელზე უფროსი ასაკის სმარტფონების მომხმარებლებმა შეიძლება შეამჩნიონ. ამიტომ, ახალი ფუნქციები ნაგულისხმევად მაინც გამორთულია და უნდა ჩაირთოს კომპილაციისა და გაშვების დროს, მაგალითად, ბრძანების ხაზის პარამეტრების მეშვეობით.

 

პაკეტების დაკარგვის გაუმჯობესება

პაკეტების დაკარგვა იწვევს აუდიო ფრაგმენტების დაკარგვას. კოდეკები, როგორც წესი, ცდილობენ ამის თავიდან აცილებას პაკეტების დაკარგვის დაფარვის (PLC) გზით. ეს, როგორც წესი, დეკოდერის მხარეს ინტერპოლაციის ტიპია, სადაც „დამაჯერებელი აუდიო“ ჩასმულია დაკარგვის წერტილებში. მანქანური სწავლება განსაკუთრებით სასარგებლო შეიძლება იყოს აქ - Opus-ის დეველოპერები ამ პრობლემას ღრმა ნეირონული ქსელით (DNN) აგვარებენ, რომელიც კოდეკის ბინარულ ფაილს დაახლოებით 1 მბ-ით ზრდის და, პაკეტის სერიოზული დაკარგვის შემთხვევაში, ლეპტოპის CPU ბირთვზე დატვირთვის ერთი პროცენტით ზრდას იწვევს.

სურათის ავტორი: კრის ჯონსი

კრის ჯონსი

აღმასრულებელი დირექტორი – მიქსინგისა და მასტერინგის ინჟინერი. Peak-Studios-ის დამფუძნებელი (2006) და გერმანიაში პროფესიონალური აუდიო მიქსინგისა და მასტერინგის ერთ-ერთი პირველი ონლაინ სერვისის მიმწოდებელი.