Maraming tao na ang gumamit ng mga app na kayang tukuyin ang mga kanta sa pamamagitan lamang ng pakikinig ng ilang segundo ng audio. Buksan lamang ang app, ilapit ang iyong telepono sa pinagmumulan ng tunog, at sa maikling panahon, lilitaw ang pamagat ng kanta at ang artist sa screen. Ang teknolohiyang ito ay tila halos mahiwaga, ngunit sa katotohanan, ito ay nagsasangkot ng isang sopistikadong hanay ng mga pamamaraan sa pagsusuri ng audio at paghahambing ng data.
Ang mga aplikasyong ito ay gumagamit ng mga espesyal na algorithm na nagsusuri ng mga natatanging katangian na naroroon sa bawat kanta. Sa pamamagitan ng paghahambing ng mga katangiang ito sa malalaking database ng musika, mabilis na matutukoy ng sistema kung aling track ang pinapatugtog.
Pagkuha ng audio gamit ang mikropono
Nagsisimula ang proseso kapag na-activate ng app ang mikropono ng telepono.
Kinukuha ng aparato ang ilang segundo ng audio na pinapatugtog sa kapaligiran. Hindi kinakailangang i-record ang buong kanta; ang ilang segundo ay karaniwang sapat para maisagawa ng sistema ang pagtukoy.
Ang datos na ito ng tunog ay ipinapadala para sa pagproseso.
Pag-convert ng tunog sa digital na datos
Pagkatapos makuha ang audio, kino-convert ng application ang tunog sa digital data.
Ang mga sound wave ay binabago sa mga numerical signal na maaaring suriin gamit ang mga algorithm. Ang prosesong ito ay nagbibigay-daan sa sistema na suriin ang mga detalye ng audio nang may mahusay na katumpakan.
Ang hakbang na ito ay mahalaga para ma-interpret ng software ang tunog.
Pagsusuri ng mga katangian ng audio
Susunod, sinusuri ng sistema ang mga natatanging katangian ng musika.
Sinusuri ang mga elemento tulad ng dalas, intensidad, at mga ritmikong padron. Ang bawat piraso ng musika ay nagtataglay ng isang partikular na kombinasyon ng mga elementong ito.
Ang mga katangiang ito ay bumubuo ng isang uri ng sonic signature.
Paglikha ng "fingerprint" ng musika
Batay sa mga natukoy na katangian, ang algorithm ay lumilikha ng tinatawag na audio fingerprint.
Ang digital fingerprint na ito ay isang maliit na representasyon ng mga pinakakapansin-pansing bahagi ng musika. Hindi nito naglalaman ng kumpletong audio, kundi mga pattern na nagbibigay-daan upang matukoy ang track.
Mas pinabibilis ng pamamaraang ito ang paghahambing.
Paghahambing sa isang database ng musika
Matapos malikha ang fingerprint, ito ay inihahambing sa isang malaking database.
Ang mga database na ito ay naglalaman ng mga digital fingerprint ng milyun-milyong kanta. Hinahanap ng sistema ang mga katulad na pattern sa pagitan ng nakuhang audio at ng mga nakaimbak na rekord.
Kapag natagpuan ang isang malakas na tugma, natutukoy ang musika.
Paggamit ng mga mabilis na algorithm ng pagtutugma
Ang mga algorithm na ginamit ay idinisenyo upang magsagawa ng napakabilis na paghahambing.
Kahit na may napakalaking database, makakahanap pa rin ang sistema ng mga tugma sa loob lamang ng ilang segundo.
Nakakamit ito sa pamamagitan ng mga pamamaraan ng pag-index at na-optimize na paghahanap.
Paglaban sa ingay sa paligid
Isa sa mga pinakamalaking hamon ay ang pagtukoy ng musika sa maingay na kapaligiran.
Ang mga algorithm ay sinanay upang balewalain ang ingay sa background at tumuon sa mga pinakakatangian na bahagi ng musika.
Dahil dito, ang sistema ay maaaring gumana kahit sa mga mataong lugar.
Pagkakakilanlan sa pamamagitan lamang ng ilang segundo ng audio.
Ang audio fingerprinting ay lubos na mabisa.
Kahit ilang segundo lang ang pagre-record, nakakakuha pa rin ang sistema ng sapat na impormasyon para matukoy ang kanta.
Ito ang dahilan kung bakit napakabilis na nakikilala ng mga app ang mga kanta.
Pagproseso sa mga remote server
Karamihan sa pagproseso ay nagaganap sa mga server sa cloud.
Ipinapadala ng cellphone ang fingerprint sa mga server na ito, na pagkatapos ay inihahambing ito sa database ng musika.
Ang remote processing na ito ay nagbibigay-daan para sa paghawak ng malalaking volume ng impormasyon.
Patuloy na pag-update ng database
Ang mga database na ginagamit ng mga application na ito ay regular na ina-update.
Patuloy na idinaragdag ang mga bagong kanta upang matiyak na matutukoy ng system ang mga kamakailang inilabas.
Ang patuloy na pag-update na ito ay nagpapalawak ng mga kakayahan sa pagkilala.
Pagtukoy sa iba't ibang bersyon ng isang kanta.
Nakikilala na ng mga modernong algorithm ang iba't ibang bersyon ng iisang kanta.
Kabilang dito ang mga live recording, remix, o bahagyang pagkakaiba-iba sa kalidad ng audio.
Sinusuri ng sistema ang mga pangunahing padron sa musika na nananatiling pare-pareho.
Pag-aaral gamit ang artipisyal na katalinuhan
Ang artipisyal na katalinuhan ay nakakatulong din sa pagpapabuti ng katumpakan.
Nakakatulong ang mga modelo ng machine learning na matukoy ang mga kumplikadong pattern sa audio at mapabuti ang mga pamamaraan ng paghahambing.
Sa paglipas ng panahon, ang sistema ay nagiging mas mahusay.
Bilis ng koneksyon sa internet
Ang bilis ng pagtukoy ay nakadepende rin sa koneksyon sa internet.
Ang mabilis na koneksyon ay nagbibigay-daan sa iyong magpadala ng data sa mga server at makatanggap ng tugon halos agad-agad.
Nakakatulong ito sa pakiramdam ng agarang pagkilala.
Pag-optimize para sa mga mobile device
Ang mga app ay idinisenyo upang gumana nang maayos sa mga smartphone.
Ang ilan sa mga paunang pagproseso ay direktang ginagawa sa device upang mabawasan ang dami ng data na ipinapadala sa mga server.
Pinapabilis ng pag-optimize na ito ang proseso.
Pagkilala kahit na may mababang kalidad ng audio.
Kahit na ang musika ay nakukuha sa mas mababang kalidad, matutukoy pa rin ng sistema ang mahahalagang pattern.
Ang mga algorithm ay nakatuon sa mga partikular na frequency na nananatiling makikilala kahit na may mga distortion.
Pinapataas nito ang rate ng tagumpay.
Gamitin sa iba't ibang konteksto
Kayang tukuyin ng teknolohiyang ito ang mga kantang pinapatugtog sa radyo, telebisyon, sa mga bar, o habang may mga live na pagtatanghal.
Hangga't ang nakuhang audio ay naglalaman ng sapat na mga pattern ng orihinal na musika, kayang isagawa ng sistema ang pagtukoy.
Dahil dito, ang tampok na ito ay lubos na maraming nalalaman.
Pagsasama sa mga platform ng musika
Pagkatapos matukoy ang kanta, maraming app ang nag-aalok ng mga karagdagang opsyon.
Maaaring pakinggan ng gumagamit ang buong track, idagdag ito sa kanilang library, o ma-access ang impormasyon tungkol sa artist.
Ang integrasyong ito ay nagpapalawak sa kapakinabangan ng teknolohiya.
Ebolusyon ng pagkakakilanlang pangmusika
Mas limitado ang mga sinaunang teknolohiya sa pagkilala sa musika.
Dahil sa mga pagsulong sa pagproseso ng datos at artificial intelligence, ang mga sistema ay naging mas mabilis at mas tumpak.
Sa kasalukuyan, milyun-milyong kanta ang maaaring mapakinggan sa loob lamang ng ilang segundo.
Ang agham sa likod ng pagkilala sa musika.
Ang kakayahang mabilis na matukoy ang mga kanta ay resulta ng kombinasyon ng pagsusuri ng audio, mahusay na mga algorithm, at malalaking database ng musika. Sa pamamagitan ng pagbabago ng tunog sa isang natatanging fingerprint at paghahambing nito sa milyun-milyong nakaimbak na mga rekord, halos agad na makakahanap ng mga tugma ang mga app. Binabago ng prosesong ito ang ilang segundo ng audio na nakuha ng isang mobile phone sa isang napakatumpak na paghahanap, na nagbibigay-daan sa sinuman na matuklasan ang pangalan ng isang kanta sa ilang sandali, kahit na sa maingay na kapaligiran.
