Mnogi ljudje že uporabljajo aplikacije, ki lahko prepoznajo pesmi že s poslušanjem nekaj sekund zvoka. Preprosto odprite aplikacijo, približajte telefon viru zvoka in v kratkem času se na zaslonu prikažeta naslov pesmi in izvajalec. Ta tehnologija se zdi skoraj čarobna, v resnici pa vključuje dovršen nabor tehnik zvočne analize in primerjave podatkov.
Te aplikacije uporabljajo specializirane algoritme, ki analizirajo edinstvene značilnosti, prisotne v vsaki pesmi. S primerjavo teh značilnosti z velikimi glasbenimi bazami podatkov lahko sistem hitro prepozna, katera skladba se predvaja.
Zajem zvoka prek mikrofona
Postopek se začne, ko aplikacija aktivira mikrofon telefona.
Naprava zajame nekaj sekund zvoka, ki se predvaja v okolju. Ni treba posneti celotne pesmi; nekaj sekund je običajno dovolj, da sistem izvede identifikacijo.
Ti zvočni podatki se nato pošljejo v obdelavo.
Pretvorba zvoka v digitalne podatke
Po zajemanju zvoka aplikacija pretvori zvok v digitalne podatke.
Zvočni valovi se pretvorijo v numerične signale, ki jih lahko analizirajo algoritmi. Ta postopek omogoča sistemu, da z veliko natančnostjo preuči zvočne podrobnosti.
Ta korak je ključnega pomena, da programska oprema lahko interpretira zvok.
Analiza zvočnih značilnosti
Nato sistem analizira edinstvene značilnosti glasbe.
Preučujejo se elementi, kot so frekvenca, intenzivnost in ritmični vzorci. Vsak glasbeni del ima posebno kombinacijo teh elementov.
Te značilnosti tvorijo nekakšen zvočni podpis.
Ustvarjanje "prstnega odtisa" glasbe
Na podlagi identificiranih značilnosti algoritem ustvari tako imenovani zvočni prstni odtis.
Ta digitalni prstni odtis je kompaktna predstavitev najbolj presenetljivih delov glasbe. Ne vsebuje celotnega zvoka, temveč vzorce, ki omogočajo prepoznavanje skladbe.
Ta metoda omogoča veliko hitrejšo primerjavo.
Primerjava z glasbeno zbirko podatkov
Ko je prstni odtis ustvarjen, se primerja z ogromno podatkovno zbirko.
Te baze podatkov vsebujejo digitalne prstne odtise milijonov pesmi. Sistem išče podobne vzorce med zajetim zvokom in shranjenimi zapisi.
Ko se najde močno ujemanje, se glasba prepozna.
Uporaba algoritmov za hitro ujemanje
Uporabljeni algoritmi so zasnovani za izjemno hitre primerjave.
Tudi z ogromnimi bazami podatkov lahko sistem najde ujemanja v samo nekaj sekundah.
To se doseže s tehnikami indeksiranja in optimiziranim iskanjem.
Odpornost na hrup iz okolice
Eden največjih izzivov je prepoznavanje glasbe v hrupnem okolju.
Algoritmi so usposobljeni tako, da ignorirajo hrup v ozadju in se osredotočajo na najbolj značilne dele glasbe.
To omogoča, da sistem deluje tudi v prometnih prostorih.
Identifikacija z le nekaj sekundami zvoka.
Zvočno prstno odčitavanje je izjemno učinkovito.
Že z le nekaj sekundami snemanja je sistem sposoben zajeti dovolj informacij za identifikacijo pesmi.
To pojasnjuje, zakaj aplikacije tako hitro prepoznajo pesmi.
Obdelava na oddaljenih strežnikih
Velik del obdelave poteka na strežnikih v oblaku.
Mobilni telefon pošlje prstni odtis tem strežnikom, ki ga nato primerjajo z glasbeno podatkovno zbirko.
Ta oddaljena obdelava omogoča obdelavo velikih količin informacij.
Stalno posodabljanje baze podatkov
Podatkovne baze, ki jih uporabljajo te aplikacije, se redno posodabljajo.
Sistem nenehno dodaja nove pesmi, da lahko prepozna nove izdaje.
To nenehno posodabljanje širi zmožnosti prepoznavanja.
Prepoznavanje različnih različic pesmi.
Sodobni algoritmi so sposobni prepoznati različne različice iste pesmi.
To vključuje posnetke v živo, remikse ali manjše razlike v kakovosti zvoka.
Sistem analizira temeljne vzorce v glasbi, ki ostajajo dosledni.
Učenje z umetno inteligenco
K izboljšanju natančnosti prispeva tudi umetna inteligenca.
Modeli strojnega učenja pomagajo prepoznati kompleksne vzorce v zvoku in izboljšati metode primerjave.
Sčasoma sistem postane učinkovitejši.
Hitrost internetne povezave
Hitrost identifikacije je odvisna tudi od internetne povezave.
Hitra povezava vam omogoča pošiljanje podatkov strežnikom in skoraj takojšen prejem odgovora.
To prispeva k občutku takojšnje prepoznavnosti.
Optimizacija za mobilne naprave
Aplikacije so zasnovane tako, da dobro delujejo na pametnih telefonih.
Nekaj začetne obdelave se izvede neposredno v napravi, da se zmanjša količina podatkov, poslanih strežnikom.
Ta optimizacija pospeši postopek.
Prepoznavanje tudi pri zvoku nizke kakovosti.
Tudi ko je glasba posneta v nižji kakovosti, lahko sistem prepozna pomembne vzorce.
Algoritmi se osredotočajo na specifične frekvence, ki ostanejo prepoznavne tudi pri popačenjih.
To poveča stopnjo uspeha.
Uporaba v različnih kontekstih
Ta tehnologija lahko prepozna pesmi, ki se predvajajo na radiu, televiziji, v barih ali med nastopi v živo.
Dokler zajeti zvok vsebuje dovolj vzorcev izvirne glasbe, lahko sistem izvede identifikacijo.
Zaradi tega je funkcija izjemno vsestranska.
Integracija z glasbenimi platformami
Po prepoznavanju pesmi številne aplikacije ponujajo dodatne možnosti.
Uporabnik lahko posluša celotno skladbo, jo doda v svojo knjižnico ali dostopa do informacij o izvajalcu.
Ta integracija širi uporabnost tehnologije.
Razvoj glasbene identifikacije
Zgodnje tehnologije glasbene identifikacije so bile veliko bolj omejene.
Z napredkom v obdelavi podatkov in umetni inteligenci so sistemi postali veliko hitrejši in natančnejši.
Danes je mogoče milijone pesmi prepoznati v samo nekaj sekundah.
Znanost, ki stoji za glasbenim prepoznavanjem.
Zmožnost hitrega prepoznavanja pesmi je rezultat kombinacije zvočne analize, učinkovitih algoritmov in velikih glasbenih podatkovnih baz. Z pretvorbo zvoka v edinstven prstni odtis in njegovo primerjavo z milijoni shranjenih zapisov lahko aplikacije skoraj v trenutku najdejo ujemanja. Ta postopek nekaj sekund zvoka, posnetega z mobilnim telefonom, pretvori v izjemno natančno iskanje, ki omogoča vsakomur, da v trenutku odkrije ime pesmi, tudi v hrupnem okolju.
