Daugelis žmonių jau yra naudoję programėles, galinčias atpažinti dainas vos išklausius kelias sekundes garso įrašo. Tiesiog atidarykite programėlę, priglauskite telefoną prie garso šaltinio ir netrukus ekrane pasirodys dainos pavadinimas ir atlikėjas. Ši technologija atrodo beveik magiška, tačiau iš tikrųjų ji apima sudėtingą garso analizės ir duomenų palyginimo metodų rinkinį.
Šios programos naudoja specializuotus algoritmus, kurie analizuoja unikalias kiekvienos dainos savybes. Palyginusi šias savybes su didelėmis muzikos duomenų bazėmis, sistema gali greitai nustatyti, kuris takelis grojamas.
Garso įrašymas per mikrofoną
Procesas prasideda, kai programėlė įjungia telefono mikrofoną.
Įrenginys įrašo kelias sekundes aplinkoje grojamo garso. Nebūtina įrašyti visos dainos; kelių sekundžių sistemai paprastai pakanka identifikavimui.
Tada šie garso duomenys siunčiami apdorojimui.
Garso konvertavimas į skaitmeninius duomenis
Užfiksavusi garsą, programa konvertuoja garsą į skaitmeninius duomenis.
Garso bangos transformuojamos į skaitmeninius signalus, kuriuos galima analizuoti algoritmais. Šis procesas leidžia sistemai labai tiksliai ištirti garso detales.
Šis žingsnis yra labai svarbus, kad programinė įranga galėtų interpretuoti garsą.
Garso charakteristikų analizė
Toliau sistema analizuoja unikalias muzikos savybes.
Nagrinėjami tokie elementai kaip dažnis, intensyvumas ir ritminiai modeliai. Kiekvienas muzikos kūrinys turi tam tikrą šių elementų derinį.
Šios savybės sudaro savotišką garsinį parašą.
Sukurti muzikos “pirštų atspaudą”
Remiantis nustatytomis charakteristikomis, algoritmas sukuria vadinamąjį garso pirštų atspaudą.
Šis skaitmeninis pirštų atspaudas yra kompaktiškas ryškiausių muzikos dalių atvaizdavimas. Jame nėra viso garso, o tik šablonai, leidžiantys identifikuoti takelį.
Šis metodas leidžia daug greičiau atlikti palyginimą.
Palyginimas su muzikos duomenų baze
Sukūrus piršto atspaudą, jis lyginamas su didele duomenų baze.
Šiose duomenų bazėse yra milijonų dainų skaitmeniniai pirštų atspaudai. Sistema ieško panašių modelių tarp užfiksuoto garso ir saugomų įrašų.
Kai randamas stiprus atitikmuo, muzika identifikuojama.
Greito atitikimo algoritmų naudojimas
Naudojami algoritmai yra sukurti atlikti itin greitus palyginimus.
Net ir turėdama milžiniškas duomenų bazes, sistema gali rasti atitikmenis vos per kelias sekundes.
Tai pasiekiama naudojant indeksavimo metodus ir optimizuotą paiešką.
Atsparumas aplinkos triukšmui
Vienas didžiausių iššūkių yra muzikos atpažinimas triukšmingoje aplinkoje.
Algoritmai yra apmokyti ignoruoti foninį triukšmą ir sutelkti dėmesį į būdingiausias muzikos dalis.
Tai leidžia sistemai veikti net ir judriose vietose.
Identifikavimas vos kelių sekundžių garso įrašu.
Garso pirštų atspaudų ėmimas yra itin efektyvus.
Net ir įrašymo metu sistema sugeba užfiksuoti pakankamai informacijos, kad būtų galima identifikuoti dainą.
Tai paaiškina, kodėl programėlės taip greitai atpažįsta dainas.
Apdorojimas nuotoliniuose serveriuose
Didžioji dalis apdorojimo vyksta debesies serveriuose.
Mobilusis telefonas siunčia piršto atspaudą į šiuos serverius, kurie jį palygina su muzikos duomenų baze.
Šis nuotolinis duomenų apdorojimas leidžia apdoroti didelius informacijos kiekius.
Nuolatinis duomenų bazės atnaujinimas
Šių programų naudojamos duomenų bazės yra reguliariai atnaujinamos.
Nuolat pridedamos naujos dainos, kad sistema galėtų atpažinti naujausius leidimus.
Šis nuolatinis atnaujinimas plečia atpažinimo galimybes.
Skirtingų dainos versijų atpažinimas.
Šiuolaikiniai algoritmai geba atpažinti skirtingas tos pačios dainos versijas.
Tai apima gyvus įrašus, remiksus arba nedidelius garso kokybės skirtumus.
Sistema analizuoja esminius muzikos modelius, kurie išlieka pastovūs.
Mokymasis naudojant dirbtinį intelektą
Dirbtinis intelektas taip pat prisideda prie tikslumo gerinimo.
Mašininio mokymosi modeliai padeda atpažinti sudėtingus garso įrašų modelius ir tobulinti palyginimo metodus.
Laikui bėgant, sistema tampa efektyvesnė.
Interneto ryšio greitis
Identifikavimo greitis taip pat priklauso nuo interneto ryšio.
Greitas ryšys leidžia siųsti duomenis į serverius ir beveik akimirksniu gauti atsakymą.
Tai prisideda prie tiesioginio atpažinimo jausmo.
Optimizavimas mobiliesiems įrenginiams
Programėlės sukurtos taip, kad gerai veiktų išmaniuosiuose telefonuose.
Dalis pradinio apdorojimo atliekama tiesiai įrenginyje, siekiant sumažinti į serverius siunčiamų duomenų kiekį.
Ši optimizacija pagreitina procesą.
Atpažinimas net ir su žemos kokybės garsu.
Net ir tada, kai muzika įrašoma žemesnės kokybės, sistema gali atpažinti svarbius modelius.
Algoritmai sutelkia dėmesį į konkrečius dažnius, kurie išlieka atpažįstami net ir esant iškraipymams.
Tai padidina sėkmės rodiklį.
Naudojimas skirtinguose kontekstuose
Ši technologija gali atpažinti dainas, grojamas radijuje, televizoriuose, baruose ar gyvų pasirodymų metu.
Kol užfiksuotame garse yra pakankamai originalios muzikos šablonų, sistema gali atlikti identifikavimą.
Dėl to ši funkcija yra itin universali.
Integracija su muzikos platformomis
Identifikavus dainą, daugelis programėlių siūlo papildomas parinktis.
Vartotojas gali klausytis viso kūrinio, įtraukti jį į savo biblioteką arba pasiekti informaciją apie atlikėją.
Ši integracija išplečia technologijos naudingumą.
Muzikinės identifikacijos evoliucija
Ankstyvosios muzikinės atpažinimo technologijos buvo daug ribotos.
Tobulėjant duomenų apdorojimui ir dirbtiniam intelektui, sistemos tapo daug greitesnės ir tikslesnės.
Šiandien milijonus dainų galima atpažinti vos per kelias sekundes.
Mokslas, slypintis už muzikinio atpažinimo.
Galimybė greitai atpažinti dainas yra garso analizės, efektyvių algoritmų ir didelių muzikos duomenų bazių derinio rezultatas. Paversdamos garsą unikaliu pirštų atspaudu ir palygindamos jį su milijonais saugomų įrašų, programėlės gali beveik akimirksniu rasti atitikmenis. Šis procesas kelias sekundes mobiliojo telefono užfiksuoto garso paverčia itin tikslia paieška, leidžiančia bet kam akimirksniu sužinoti dainos pavadinimą, net ir triukšmingoje aplinkoje.
