استخدم العديد من الأشخاص تطبيقات قادرة على تحديد الأغاني بمجرد الاستماع لبضع ثوانٍ من الصوت. ما عليك سوى فتح التطبيق، وتقريب هاتفك من مصدر الصوت، وسيظهر عنوان الأغنية واسم الفنان على الشاشة في غضون لحظات. تبدو هذه التقنية أشبه بالسحر، لكنها في الواقع تعتمد على مجموعة متطورة من تقنيات تحليل الصوت ومقارنة البيانات.
تستخدم هذه التطبيقات خوارزميات متخصصة لتحليل الخصائص الفريدة الموجودة في كل أغنية. وبمقارنة هذه الخصائص بقواعد بيانات موسيقية ضخمة، يستطيع النظام تحديد الأغنية التي يتم تشغيلها بسرعة.
تسجيل الصوت عبر الميكروفون
تبدأ العملية عندما يقوم التطبيق بتنشيط ميكروفون الهاتف.
يلتقط الجهاز بضع ثوانٍ من الصوت المُشغّل في البيئة المحيطة. ليس من الضروري تسجيل الأغنية كاملة؛ فبضع ثوانٍ تكفي عادةً ليقوم النظام بالتعرف عليها.
ثم يتم إرسال بيانات الصوت هذه للمعالجة.
تحويل الصوت إلى بيانات رقمية
بعد التقاط الصوت، يقوم التطبيق بتحويل الصوت إلى بيانات رقمية.
تُحوّل الموجات الصوتية إلى إشارات رقمية يمكن تحليلها بواسطة خوارزميات. تُمكّن هذه العملية النظام من فحص تفاصيل الصوت بدقة عالية.
تُعد هذه الخطوة ضرورية لكي يتمكن البرنامج من تفسير الصوت.
تحليل الخصائص الصوتية
بعد ذلك، يقوم النظام بتحليل الخصائص الفريدة للموسيقى.
يتم فحص عناصر مثل التردد والشدة والأنماط الإيقاعية. كل مقطوعة موسيقية تمتلك مزيجًا معينًا من هذه العناصر.
تشكل هذه الخصائص نوعاً من البصمة الصوتية.
إنشاء "بصمة" للموسيقى
استناداً إلى الخصائص المحددة، تقوم الخوارزمية بإنشاء ما يسمى بالبصمة الصوتية.
هذه البصمة الرقمية هي تمثيل موجز لأبرز أجزاء الموسيقى. وهي لا تحتوي على الصوت الكامل، بل على أنماط تسمح بتحديد المقطوعة الموسيقية.
هذه الطريقة تجعل المقارنة أسرع بكثير.
مقارنة مع قاعدة بيانات موسيقية
بعد إنشاء بصمة الإصبع، تتم مقارنتها بقاعدة بيانات ضخمة.
تحتوي قواعد البيانات هذه على بصمات رقمية لملايين الأغاني. يبحث النظام عن أنماط متشابهة بين الصوت المسجل والتسجيلات المخزنة.
عند العثور على تطابق قوي، يتم تحديد الموسيقى.
استخدام خوارزميات المطابقة السريعة
تم تصميم الخوارزميات المستخدمة لإجراء مقارنات سريعة للغاية.
حتى مع قواعد البيانات الضخمة، يمكن للنظام العثور على التطابقات في غضون ثوانٍ قليلة.
ويتحقق ذلك من خلال تقنيات الفهرسة والبحث المُحسَّن.
مقاومة الضوضاء المحيطة
يُعدّ تحديد الموسيقى في البيئات الصاخبة أحد أكبر التحديات.
يتم تدريب الخوارزميات على تجاهل الضوضاء الخلفية والتركيز على الأجزاء الأكثر تميزًا في الموسيقى.
وهذا يسمح للنظام بالعمل حتى في الأماكن المزدحمة.
التعرف على الهوية من خلال بضع ثوانٍ فقط من الصوت.
تُعدّ تقنية البصمة الصوتية فعّالة للغاية.
حتى مع بضع ثوانٍ فقط من التسجيل، يستطيع النظام التقاط معلومات كافية لتحديد الأغنية.
وهذا يفسر سبب قدرة التطبيقات على التعرف على الأغاني بهذه السرعة.
المعالجة على خوادم بعيدة
تتم معظم عمليات المعالجة على خوادم في السحابة.
يرسل الهاتف المحمول بصمة الإصبع إلى هذه الخوادم، والتي بدورها تقارنها بقاعدة بيانات الموسيقى.
تتيح هذه المعالجة عن بعد التعامل مع كميات كبيرة من المعلومات.
تحديث قاعدة البيانات باستمرار
يتم تحديث قواعد البيانات التي تستخدمها هذه التطبيقات بانتظام.
تُضاف الأغاني الجديدة باستمرار لضمان قدرة النظام على التعرف على الإصدارات الحديثة.
يؤدي هذا التحديث المستمر إلى توسيع قدرات التعرف.
تحديد النسخ المختلفة للأغنية.
تستطيع الخوارزميات الحديثة التعرف على نسخ مختلفة من الأغنية نفسها.
يشمل ذلك التسجيلات الحية، والريمكسات، أو الاختلافات الطفيفة في جودة الصوت.
يقوم النظام بتحليل الأنماط الأساسية في الموسيقى التي تظل ثابتة.
التعلم باستخدام الذكاء الاصطناعي
يساهم الذكاء الاصطناعي أيضاً في تحسين الدقة.
تساعد نماذج التعلم الآلي في تحديد الأنماط المعقدة في الصوت وتحسين أساليب المقارنة.
بمرور الوقت، يصبح النظام أكثر كفاءة.
سرعة الاتصال بالإنترنت
تعتمد سرعة التعرف أيضًا على سرعة الاتصال بالإنترنت.
يتيح لك الاتصال السريع إرسال البيانات إلى الخوادم وتلقي الرد على الفور تقريبًا.
وهذا يساهم في الشعور بالتعرف الفوري.
تحسين الأداء للأجهزة المحمولة
تم تصميم التطبيقات لتعمل بشكل جيد على الهواتف الذكية.
يتم إجراء بعض المعالجة الأولية مباشرة على الجهاز لتقليل كمية البيانات المرسلة إلى الخوادم.
يؤدي هذا التحسين إلى تسريع العملية.
التعرف عليها حتى مع جودة صوت منخفضة.
حتى عندما يتم تسجيل الموسيقى بجودة منخفضة، يمكن للنظام تحديد الأنماط المهمة.
تركز الخوارزميات على ترددات محددة تظل قابلة للتمييز حتى مع وجود تشوهات.
وهذا يزيد من نسبة النجاح.
الاستخدام في سياقات مختلفة
تستطيع هذه التقنية تحديد الأغاني التي يتم تشغيلها على أجهزة الراديو أو التلفزيون أو في الحانات أو أثناء العروض الحية.
طالما أن الصوت المسجل يحتوي على أنماط كافية من الموسيقى الأصلية، فإن النظام قادر على إجراء عملية التعرف.
وهذا يجعل هذه الميزة متعددة الاستخدامات للغاية.
التكامل مع منصات الموسيقى
بعد تحديد الأغنية، تقدم العديد من التطبيقات خيارات إضافية.
يمكن للمستخدم الاستماع إلى المقطع الموسيقي كاملاً، أو إضافته إلى مكتبته، أو الوصول إلى معلومات حول الفنان.
هذا التكامل يوسع نطاق فائدة التكنولوجيا.
تطور الهوية الموسيقية
كانت تقنيات التعرف الموسيقي المبكرة محدودة للغاية.
بفضل التقدم في معالجة البيانات والذكاء الاصطناعي، أصبحت الأنظمة أسرع وأكثر دقة.
اليوم، يمكن التعرف على ملايين الأغاني في غضون ثوانٍ معدودة.
العلم الكامن وراء التعرف الموسيقي.
تُعزى القدرة على التعرف السريع على الأغاني إلى مزيج من تحليل الصوت، والخوارزميات الفعّالة، وقواعد البيانات الموسيقية الضخمة. فمن خلال تحويل الصوت إلى بصمة فريدة ومقارنتها بملايين التسجيلات المخزنة، تستطيع التطبيقات العثور على التطابقات بشكل فوري تقريبًا. تُحوّل هذه العملية بضع ثوانٍ من الصوت الملتقط بواسطة الهاتف المحمول إلى بحث دقيق للغاية، مما يُمكّن أي شخص من اكتشاف اسم الأغنية في لحظات، حتى في البيئات الصاخبة.
